C
核心技術(shù)
Core technology
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò)(Feedforward Neural Networks),是深度學(xué)習(xí)(deep learning)的代表算法之一 ,由于卷積神經(jīng)網(wǎng)絡(luò)能夠進(jìn)行平移不變分類(shift-invariant classification)。
因此也被稱為“平移不變?nèi)斯ど窠?jīng)網(wǎng)絡(luò)(Shift-Invariant Artificial Neural Networks, SIANN),卷積神經(jīng)網(wǎng)絡(luò)包含卷積、激活函數(shù)、最大池化等操作。是一個(gè)專門針對(duì)圖像識(shí)別問(wèn)題設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò),可以進(jìn)行監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí),其隱含層內(nèi)的卷積核參數(shù)共享和層間連接的稀疏性使得卷積神經(jīng)網(wǎng)絡(luò)能夠以較小的計(jì)算量對(duì)格點(diǎn)化(grid-like topology)特征,例如像素和音頻進(jìn)行學(xué)習(xí)、有穩(wěn)定的效果且對(duì)數(shù)據(jù)沒(méi)有額外的特征工程(feature engineering)要求。它模仿人類識(shí)別圖像的多層過(guò)程(機(jī)器視覺(jué))、瞳孔攝入像素、大腦皮層某些細(xì)胞初步處理、發(fā)現(xiàn)形狀邊緣方向、抽象判定形狀(如圓形、方形)、進(jìn)一步抽象判定(如判斷樹葉遮擋)。
卷積神經(jīng)網(wǎng)絡(luò)分類模型利用卷積層提取圖片高層特征、池化層減少特征冗余、激活函數(shù)層增減非線性映射,最后通過(guò)全連接層和SoftMax層輸出一維向量判斷圖片所屬類別。 由于公司有多年的公安、交警等方面的視頻圖像質(zhì)量診斷產(chǎn)品的應(yīng)用,在此過(guò)程中積累了大量的圖像樣本,提供進(jìn)行算法訓(xùn)練,基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法能夠有效的提高算法準(zhǔn)確度。