• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一種基于SAE和BP網(wǎng)絡(luò)相結(jié)合的人臉識(shí)別模型

      2017-07-24 15:30:46李森林石元泉黃隆華
      懷化學(xué)院學(xué)報(bào) 2017年5期
      關(guān)鍵詞:編碼器人臉識(shí)別神經(jīng)網(wǎng)絡(luò)

      李森林,石元泉,黃隆華

      (懷化學(xué)院計(jì)算機(jī)技術(shù)與工程學(xué)院,湖南懷化418008)

      一種基于SAE和BP網(wǎng)絡(luò)相結(jié)合的人臉識(shí)別模型

      李森林,石元泉,黃隆華

      (懷化學(xué)院計(jì)算機(jī)技術(shù)與工程學(xué)院,湖南懷化418008)

      基于淺層BP網(wǎng)絡(luò)的模式識(shí)別在諸多領(lǐng)域有著廣泛的應(yīng)用,但對(duì)于稀疏高維度的數(shù)據(jù),在網(wǎng)絡(luò)模型訓(xùn)練時(shí)計(jì)算量大、參數(shù)繁多、訓(xùn)練慢、準(zhǔn)確率低.提出了一種基于稀疏自動(dòng)編碼器(Sparse auto-Encoder,SAE)和淺層BP網(wǎng)絡(luò)相結(jié)合的人臉識(shí)別模型.在深度SAE模型中,通過(guò)設(shè)置隱藏節(jié)點(diǎn)數(shù)少于輸入輸出節(jié)點(diǎn)數(shù)方法,自動(dòng)學(xué)習(xí)樣本的多種特征表示,來(lái)實(shí)現(xiàn)數(shù)據(jù)的降維和去稀疏性,將該方法產(chǎn)生的特征表示作為輸入新樣本數(shù)據(jù),用于BP網(wǎng)絡(luò)模型進(jìn)行圖像識(shí)別.通過(guò)人臉識(shí)別實(shí)驗(yàn)表明,第一通過(guò)SAE模型得到的特征表示進(jìn)行人臉識(shí)別是可行的;第二SAE模型獲得的多種表示分別進(jìn)行人臉識(shí)別,并非第j層表示比第i層表示(j>i)效果一定好;第三該方法比單純淺層BP網(wǎng)絡(luò)進(jìn)行人臉識(shí)別在效果上有一定程度的改善和提高.

      稀疏自動(dòng)編碼器;神經(jīng)網(wǎng)絡(luò);人臉識(shí)別;高維度數(shù)據(jù);維度約減

      1 引言

      淺層BP網(wǎng)絡(luò)在模式識(shí)別上的應(yīng)用,經(jīng)過(guò)該領(lǐng)域研究人員多年努力探索,取得了積極的成果.1957年,周紹康提出統(tǒng)計(jì)決策理論方法求解模式識(shí)別,促進(jìn)了模式識(shí)別研究工作的發(fā)展.80年代,荷甫菲爾德發(fā)表的兩篇重要論文,推動(dòng)了神經(jīng)網(wǎng)絡(luò)在模式識(shí)別的研究工作.因?yàn)槿斯ど窠?jīng)網(wǎng)絡(luò)方法具有較強(qiáng)的解決復(fù)雜非線性模式識(shí)別的能力,因此廣泛得到人們的重視[1].雖然人工神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)功能非常強(qiáng)大,可以通過(guò)反復(fù)學(xué)習(xí)的過(guò)程獲得對(duì)數(shù)據(jù)背后規(guī)則的隱性表達(dá),在模式識(shí)別上具有一定的優(yōu)勢(shì);但對(duì)于具有稀疏性、多維度數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),在模型訓(xùn)練時(shí)由于參數(shù)繁多,訓(xùn)練慢、準(zhǔn)確率差,實(shí)現(xiàn)也比較困難.自2006年,加拿大多倫多大學(xué)教授、機(jī)器學(xué)習(xí)領(lǐng)域的泰斗GeoffreyHinton和他的學(xué)生在《科學(xué)》上發(fā)表了一篇文章,開(kāi)啟了深度學(xué)習(xí)在學(xué)術(shù)界研究熱潮,作為深度模型之一的稀疏自動(dòng)編碼器利用人工神經(jīng)網(wǎng)絡(luò)的特點(diǎn),能夠自動(dòng)盡可能的學(xué)習(xí)復(fù)現(xiàn)數(shù)據(jù)的多種表示[1].稀疏自動(dòng)編碼器(Sparse auto-Encoder,SAE)模型是一種深度無(wú)監(jiān)督特征學(xué)習(xí)算法,能夠根據(jù)輸入等于輸出重構(gòu)輸入數(shù)據(jù)特征,在圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理(NLP)等方面表現(xiàn)出較好的優(yōu)勢(shì)[1-3],近幾年來(lái)受到學(xué)術(shù)界和工業(yè)界的高度重視.以多倫多大學(xué)Hinton教授和斯坦福大學(xué)AndrewNG副教授等人為代表的領(lǐng)軍人物,對(duì)多層神經(jīng)網(wǎng)絡(luò)方面的理論和應(yīng)用都進(jìn)行了艱苦探索,開(kāi)啟了對(duì)深度網(wǎng)絡(luò)重新認(rèn)識(shí)和重點(diǎn)研究.目前Google公司、微軟公司和百度公司等都成立了自己的深度網(wǎng)絡(luò)學(xué)習(xí)研究院,并獲得了巨大成功.近幾年來(lái),SAE在無(wú)監(jiān)督數(shù)據(jù)特征自動(dòng)提取上獲得了豐碩的成果.文獻(xiàn)[3]從手機(jī)和汽車(chē)領(lǐng)域產(chǎn)生的語(yǔ)料庫(kù),通過(guò)SAE模型自動(dòng)學(xué)習(xí)其詞向量,并完成語(yǔ)句識(shí)別.文獻(xiàn)[4]中Glorot等人在自動(dòng)編碼器算法的基礎(chǔ)上添加糾正激活函數(shù),實(shí)驗(yàn)表明效果顯著.文獻(xiàn)[5]在基于Auto Encoder的智能監(jiān)控指紋識(shí)別系統(tǒng)中通過(guò)自動(dòng)編碼器獲得網(wǎng)絡(luò)權(quán)值等參數(shù)用于指紋圖像識(shí)別文獻(xiàn).文獻(xiàn)[6]將自動(dòng)編碼器算法運(yùn)用到中文詞性標(biāo)注的文本分類(lèi)中,獲得了一定的效果.文獻(xiàn)[7]將堆疊SAE應(yīng)用于數(shù)字圖像處理,實(shí)現(xiàn)了數(shù)據(jù)特征降維,并提高了分類(lèi)精度.由此,通過(guò)深度SAE模型能較好地提取數(shù)據(jù)間連接的隱含特征,并利用這些特征來(lái)解決模式識(shí)別與數(shù)據(jù)挖掘問(wèn)題.為此我們提出了一種稀疏自動(dòng)編碼器和淺層BP網(wǎng)絡(luò)相結(jié)合的人臉識(shí)別模型.首先通過(guò)深度SAE模型自動(dòng)學(xué)習(xí)得到原始樣本降維后的多種表示.將該方法產(chǎn)生的特征表示作為輸入樣本,通過(guò)淺層BP神經(jīng)網(wǎng)絡(luò)進(jìn)行模型訓(xùn)練和驗(yàn)證.通過(guò)人臉識(shí)別實(shí)驗(yàn)表明,SAE和淺層BP網(wǎng)絡(luò)相結(jié)合的識(shí)別模型,效果上有一定提高.

      2 基本模型

      2.1 自動(dòng)編碼器模型

      自動(dòng)編碼器是使用了反向傳播梯度下降算法的人工神經(jīng)網(wǎng)絡(luò)模型,由兩個(gè)主要部分組成,即編碼器網(wǎng)絡(luò)和譯碼器網(wǎng)絡(luò).通過(guò)讓目標(biāo)值等于輸入值,訓(xùn)練調(diào)整網(wǎng)絡(luò)權(quán)重參數(shù)直至收斂.每一層的重新編碼就是輸入數(shù)據(jù)新的特征表示[2].編碼器網(wǎng)絡(luò)在訓(xùn)練和部署的時(shí)候被使用,而譯碼器網(wǎng)絡(luò)只是在訓(xùn)練的時(shí)候使用.

      一般步驟如下:

      (1)輸入的數(shù)據(jù)為無(wú)標(biāo)簽數(shù)據(jù),通過(guò)輸入到一個(gè)自編碼器進(jìn)行重新編碼,再通過(guò)解碼器完成對(duì)編碼表示的解碼.解碼后的數(shù)據(jù)信息和開(kāi)始時(shí)的輸入信號(hào)構(gòu)成誤差不符合設(shè)定的標(biāo)準(zhǔn)時(shí),通過(guò)隨機(jī)梯度下降算法調(diào)整優(yōu)化自編碼器模型的節(jié)點(diǎn)權(quán)重和偏置,直至達(dá)到重構(gòu)誤差最小,這樣獲得的編碼就是輸入數(shù)據(jù)信號(hào)的一個(gè)特征表示,如圖1所示.

      圖1 自動(dòng)編碼實(shí)現(xiàn)過(guò)程

      (2)通過(guò)自編碼器產(chǎn)生的特征表示再作為下一層輸入,按步驟(1)訓(xùn)練.得到第二層新的數(shù)據(jù)表示,SAE多層網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示.

      圖2 自編碼多層網(wǎng)絡(luò)

      2.2 BP神經(jīng)網(wǎng)絡(luò)

      BP(Back Propagation)是一種基于梯度下降的反饋算法,網(wǎng)絡(luò)模型通過(guò)逆向傳播誤差來(lái)調(diào)節(jié)各層權(quán)值和偏置,直至滿(mǎn)足條件為止.該網(wǎng)絡(luò)模型能學(xué)習(xí)和存貯輸入/輸出模式的非線性映射關(guān)系,是廣泛應(yīng)用于模式識(shí)別算法之一.淺層BP網(wǎng)絡(luò)模型結(jié)構(gòu)一般分輸入層(input layer)、隱含層(hidden layer)和輸出層(output layer)共三層,隱層和輸出層具有閾值,網(wǎng)絡(luò)各層節(jié)點(diǎn)間的連接具有權(quán)值.各層根據(jù)輸入、權(quán)重和激勵(lì)函數(shù)計(jì)算輸出,最后根據(jù)輸出值與期望值的誤差,據(jù)此進(jìn)行反向傳播訓(xùn)練模型,達(dá)到可以接受的范圍之內(nèi),調(diào)整權(quán)重的算法為一般梯度下降算法.BP神經(jīng)網(wǎng)絡(luò)隱藏層和輸出層節(jié)點(diǎn)的輸入依賴(lài)于前一層節(jié)點(diǎn)的輸出.

      因?yàn)锽P算法的非凸性,導(dǎo)致神經(jīng)網(wǎng)絡(luò)易陷入局部極小值、收斂速度慢缺點(diǎn),實(shí)驗(yàn)中引入了前人提出的逐步搜索法選擇初始權(quán)值,用附加動(dòng)量項(xiàng)和動(dòng)態(tài)變步長(zhǎng)方法修改權(quán)值.

      圖3 人臉識(shí)別系統(tǒng)

      3 算法流程

      3.1 總體思路

      稀疏自動(dòng)編碼器通過(guò)輸出約等于輸入的BP網(wǎng)絡(luò)模型,實(shí)現(xiàn)對(duì)高維空間中的稀疏向量轉(zhuǎn)換為低維空間的向量,并且保留了原始數(shù)據(jù)的本質(zhì)特征并實(shí)現(xiàn)了去噪和降維的效果,為BP網(wǎng)絡(luò)實(shí)現(xiàn)有監(jiān)督學(xué)習(xí)提供了保證[3].本文運(yùn)用單層和多層SAE方法對(duì)輸入數(shù)據(jù)進(jìn)行特征提取,將提取出的特征再輸入到BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和識(shí)別.人臉識(shí)別系統(tǒng)框架如圖3所示.

      系統(tǒng)人臉識(shí)別的具體步驟為:

      (1)預(yù)處理[4]:預(yù)處理過(guò)程一般包括二值化、噪聲點(diǎn)去除、數(shù)字特征分離、圖像平滑、歸一化處理和細(xì)化等過(guò)程.在該識(shí)別系統(tǒng)的設(shè)計(jì)中,預(yù)處理由二值化(binarization)、歸一化(normalization)和平滑(smooth)3大過(guò)程組成.首先對(duì)人臉圖像進(jìn)行二值化處理,并進(jìn)行數(shù)據(jù)歸一化,以消除各數(shù)字在位置和大小上的差異,從而提高圖像識(shí)別的準(zhǔn)確率.得到歸一化后的人臉圖像矩陣.

      (2)自編碼器自動(dòng)學(xué)習(xí)特征:特征提取方法的選擇是影響識(shí)別率的一個(gè)十分重要的因素.必須指出的是,對(duì)于不同的識(shí)別問(wèn)題和不同的樣本數(shù)據(jù),使用不同的特征提取方法的適應(yīng)性差別很大.在一定意義上,特征提取和特征選擇的主要目的都是要達(dá)到特征降維.特征提取就是要通過(guò)某種變換的方法重新組合原始高維特征,獲得一組較為低維的新特征,而特征選擇是根據(jù)某種評(píng)價(jià)準(zhǔn)則或根據(jù)專(zhuān)家的經(jīng)驗(yàn)知識(shí)來(lái)挑選出那些對(duì)分類(lèi)最具影響力的特征,并生成新的較易處理的特征.由于人臉圖像數(shù)據(jù)特征維度較高,數(shù)據(jù)量較大,人工提取特征比較困難,本文利用單層Sparse Auto-Encoder方法自動(dòng)學(xué)習(xí)每張人臉圖像的新特征,并實(shí)現(xiàn)降維.由于隱藏層單元數(shù)沒(méi)有一個(gè)固定的確定算法,我們根據(jù)經(jīng)驗(yàn)和一般原則進(jìn)行了不同數(shù)值的嘗試.

      (3)BP神經(jīng)網(wǎng)絡(luò)分類(lèi)與檢測(cè):通過(guò)自編碼器學(xué)習(xí)的新特征輸入到BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,直到神經(jīng)網(wǎng)絡(luò)收斂或滿(mǎn)足停止訓(xùn)練的條件;并利用原始數(shù)據(jù)進(jìn)行模型測(cè)試,由于原始數(shù)據(jù)和降維后的特征數(shù)據(jù)維度不同,需要對(duì)原始數(shù)據(jù)歸一化后進(jìn)行維度約減,本文中采用了相對(duì)簡(jiǎn)單的方法,即在SAE特征提取過(guò)程中,對(duì)連接權(quán)重值約等于零的原始特征數(shù)據(jù)項(xiàng)進(jìn)行刪除,保留權(quán)重值較大相對(duì)重要的特征項(xiàng).

      (4)利用人臉識(shí)別模型進(jìn)行人臉識(shí)別檢測(cè).

      3.2 自編碼原理

      本文通過(guò)自動(dòng)編碼器對(duì)輸入數(shù)據(jù)的自動(dòng)學(xué)習(xí),采用經(jīng)典隨機(jī)梯度下降算法進(jìn)行訓(xùn)練,為了便于對(duì)比,設(shè)置了單層、多層的自編碼神經(jīng)網(wǎng)絡(luò),圖4是一個(gè)單層自編碼神經(jīng)網(wǎng)絡(luò)的示例圖[5],學(xué)習(xí)結(jié)構(gòu)有三層:輸入層單元數(shù)等于輸出層單元數(shù),隱藏層單元數(shù)較少,迫使自編碼神經(jīng)網(wǎng)絡(luò)去學(xué)習(xí)輸入數(shù)據(jù)的新表示,進(jìn)行降維和去稀疏性.需要在自編碼神經(jīng)網(wǎng)絡(luò)加入稀疏性限制,因?yàn)檩斎氲臄?shù)據(jù)中隱含著一些特定的關(guān)聯(lián)結(jié)構(gòu),通過(guò)學(xué)習(xí)就可以獲得輸入數(shù)據(jù)中的這些相關(guān)性.給隱藏層神經(jīng)元加入稀疏性限制的規(guī)則[6-7]是:神經(jīng)元的輸出接近于1被激活,輸出接近于0被抑制.隱藏層神經(jīng)元j的訓(xùn)練集上平均活躍度公式為

      圖4 單層自動(dòng)編碼器

      在多層桟式自編碼器網(wǎng)絡(luò)中,需要把前一層自編碼器的輸出作為其后一層自編碼器的輸入,進(jìn)而依次訓(xùn)練網(wǎng)絡(luò)的每一層,來(lái)訓(xùn)練整個(gè)深度SAE網(wǎng)絡(luò).訓(xùn)練思路為:首先訓(xùn)練一個(gè)只含一個(gè)隱藏層的網(wǎng)絡(luò),參數(shù)固定后,開(kāi)始訓(xùn)練有兩個(gè)隱藏層的網(wǎng)絡(luò),在含有兩個(gè)隱藏層的網(wǎng)絡(luò)訓(xùn)練完成固定參數(shù),在增加一層,依次類(lèi)推.最終得到深度網(wǎng)絡(luò)的所有權(quán)重參數(shù)和含有不同隱藏層的數(shù)據(jù)特征表示.用W(k,1),W(k,2),b(k,1),b(k,2)表示第k個(gè)自編碼器對(duì)應(yīng)的W(1),W(2),b(1),b(2)參數(shù),對(duì)棧式自編碼網(wǎng)絡(luò)從前向后的每一層自編碼器的編碼過(guò)程為:a(l)=f(z(l)),z(l+1)= W(l,1)a(l)+b(l,1),其中a(l)表示第l層的輸出;從后向前的每一層自編碼器的解碼過(guò)程為:a(n+l)=f(z(n+l)),z(n+l+1)= W(n-l,2)a(n+l)+b(n-l,2),其中,a(n)向量是最深層隱藏單元的激活值,也是對(duì)輸入值的更高階的表示.通過(guò)將a(n)作為BP網(wǎng)絡(luò)分類(lèi)器的輸入特征,用于人臉圖像識(shí)別.

      3.3 BP網(wǎng)絡(luò)訓(xùn)練和驗(yàn)證

      公式中增加動(dòng)態(tài)可調(diào)整的b為垂直位移,當(dāng)判斷出網(wǎng)絡(luò)進(jìn)入平坦區(qū)時(shí),按10%調(diào)高b參數(shù)(初始值為0.1),使其避免因獲得0輸出而使相應(yīng)的連接權(quán)獲得訓(xùn)練機(jī)會(huì);公式中ω為水平位移,它使得作用函數(shù)沿水平方向左右移動(dòng),當(dāng)f(x)接近1時(shí),減少ω,當(dāng)f(x)接近0時(shí),增加ω,能提高神經(jīng)元的自適應(yīng)能力,同時(shí)也加快了算法的收斂速度,盡快脫離平坦區(qū).公式中系數(shù)λ決定著Sigmoid型函數(shù)的幅度,通過(guò)調(diào)整參數(shù)可以大大改變誤差曲面變化率,避開(kāi)局部極小.

      由于采用圖像的初始數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)驗(yàn)證,這些數(shù)據(jù)的維度與自動(dòng)編碼器提取的特征數(shù)據(jù)維度不一樣,必須調(diào)整數(shù)據(jù)維度才能驗(yàn)證網(wǎng)絡(luò).考慮到網(wǎng)絡(luò)的泛化性能,對(duì)原始數(shù)據(jù)歸一化后進(jìn)行維度約減,一對(duì)在SAE特征提取過(guò)程中,對(duì)連接權(quán)重值約等于零的原始特征數(shù)據(jù)項(xiàng)進(jìn)行刪除,保留權(quán)重值較大相對(duì)重要的特征項(xiàng);二對(duì)近似0的原始特征數(shù)據(jù)項(xiàng)刪除;三隨機(jī)挑選一定比例的原始特征數(shù)據(jù)項(xiàng)進(jìn)行刪除.

      4 實(shí)驗(yàn)分析

      4.1 實(shí)驗(yàn)過(guò)程

      實(shí)驗(yàn)使用了耶魯大學(xué)的人臉數(shù)據(jù)庫(kù)(http://cvc.yale. edu/projects/yalefaces/yalefaces.html),數(shù)據(jù)庫(kù)有200幅不同的圖像,是一個(gè)112×92像素、256級(jí)的灰度圖像[10-12],但在不同時(shí)間、光照略有變化、不同表情和臉部細(xì)節(jié)下獲得的,尺度差異在10%左右,人臉姿態(tài)也有相當(dāng)程度的變化.如圖5所示每文件夾有10幅圖像.對(duì)其進(jìn)行SAE降維;采用BP神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練樣本集進(jìn)行訓(xùn)練測(cè)試.實(shí)驗(yàn)采用Bp網(wǎng)絡(luò)、PCA+BP和SAE+BP三中模型對(duì)上述圖像進(jìn)行了人臉識(shí)別,并實(shí)驗(yàn)了不同隱藏層神經(jīng)元數(shù)量,取得的一些實(shí)驗(yàn)數(shù)據(jù).在SAE+BP模式識(shí)別實(shí)驗(yàn)中,對(duì)每幅圖像(1×10304行向量)采用了單層、雙層和多層隱藏層SAE模型將數(shù)據(jù)向量維度壓縮到1× 1000,1×500,1×200,1×100,1×50.由于將數(shù)據(jù)向量維度壓縮到1×1000和1×50,存在數(shù)據(jù)維度過(guò)大和過(guò)小,導(dǎo)致數(shù)據(jù)特征冗余和損失,不利于人臉識(shí)別.故后面實(shí)驗(yàn)數(shù)據(jù)是主要基于1×200和1×100維度下獲得的.由于特征表示數(shù)據(jù)量較多,下面只給出了含有單層、雙層的SAE模型下,相對(duì)應(yīng)部分?jǐn)?shù)據(jù)特征表示,如表1所示.

      圖5 人臉圖像文件夾

      表1 部分人臉數(shù)據(jù)經(jīng)過(guò)SAE壓縮后特征對(duì)比

      實(shí)驗(yàn)過(guò)程中對(duì)數(shù)據(jù)進(jìn)行了單層SAE和多層SAE模型進(jìn)行了訓(xùn)練和驗(yàn)證,由于超過(guò)四層的桟式自動(dòng)編碼器模型參數(shù)多,訓(xùn)練難度大,本文僅在含有一到四層隱藏層的模型下,進(jìn)行了人臉識(shí)別訓(xùn)練也驗(yàn)證,誤差和準(zhǔn)確率如表2所示.通過(guò)比較可以看出單層SAE+BP識(shí)別率比其它幾種模型稍好,在實(shí)驗(yàn)過(guò)程中發(fā)現(xiàn),基于PCA+BP模型的人臉識(shí)別,通過(guò)PCA降維損失了部分特征數(shù)據(jù),從而造成識(shí)別率稍低.在多層SAE+BP模型中,由于隨著隱層數(shù)量的增加,網(wǎng)絡(luò)參數(shù)指數(shù)增加,網(wǎng)絡(luò)收斂難度較大,易陷入極小值,導(dǎo)致SAE模型獲得的多種表示分別進(jìn)行人臉識(shí)別,并非第j層表示比第i層表示(j>i)效果一定好.

      4.2 實(shí)驗(yàn)結(jié)論

      人臉圖像經(jīng)過(guò)灰度化后可以增強(qiáng)人臉圖像的特征,提高人臉的識(shí)別率;基于SAE維度約減后可以實(shí)現(xiàn)有效的降維,本實(shí)驗(yàn)中人臉圖像的樣本的特征向量為10304維,降維后為100維,可以降低運(yùn)算量,提高人臉識(shí)別的速率;基于桟式的多層SAE網(wǎng)絡(luò)提取人臉特征用于分類(lèi)效果有所下降.

      表2 不同模型測(cè)試數(shù)據(jù)對(duì)比

      5 結(jié)束語(yǔ)

      人臉識(shí)別模型很多,不同的模型參數(shù)調(diào)整非常復(fù)雜,沒(méi)有一個(gè)固定的算法,只能不斷的選擇不同的參數(shù)進(jìn)行嘗試.在不斷測(cè)試過(guò)程中,發(fā)現(xiàn)固定的學(xué)習(xí)速率下,稀疏自動(dòng)編碼器網(wǎng)絡(luò)的隱層數(shù)和節(jié)點(diǎn)數(shù)的選擇等在某些情況下都會(huì)影響識(shí)別率和網(wǎng)絡(luò)訓(xùn)練速度[12].對(duì)于不同情況必須結(jié)合數(shù)據(jù)多次嘗試找出相對(duì)好的識(shí)別方案.設(shè)計(jì)過(guò)程中,不論參數(shù)如何調(diào)整,都難以大幅度提高識(shí)別率.以后需要從改進(jìn)算法或引入深度學(xué)習(xí)方法進(jìn)一步提高識(shí)別率,而不是只是方法創(chuàng)新.本文只是提出了一種基于SAE和BP相結(jié)合的人臉識(shí)別模型,并進(jìn)行了實(shí)驗(yàn),該模型能否很好的應(yīng)用于NLP、語(yǔ)音識(shí)別以及其它領(lǐng)域有待深入研究.

      [1]DAHL G E,YU D,DENG L,et al.Context-dependent Pretrained deep neural networks for large-vocabulary speech recognition[J].Audio,Speech,and Language Processing,IEEE Transactions on,2012,20(1):30-42.

      [2]劉勘,袁蘊(yùn)英.基于自動(dòng)編碼器的短文本特征提取及聚類(lèi)研究[J].北京大學(xué)學(xué)報(bào)(自然科學(xué)版),2015(2):282-288.

      [3]賀宇,潘達(dá).付國(guó)宏.基于自動(dòng)編碼特征的漢語(yǔ)解釋性意見(jiàn)句識(shí)別[J].北京大學(xué)學(xué)報(bào)(自然科學(xué)版),2015(2):234-240.

      [4]ZEN H,SENIOR A,SCHUSTER M.Statistical parametric speech synthesis using deep neural networks[C]//Acoustics,Speech and SignalProcessing(ICASSP),2013IEEEInternational Conference on.Piscataway,NJ:IEEE,,2013:7962-7966.

      [5]司馬江龍,鄧長(zhǎng)壽.基于BP神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別系統(tǒng)[J].江蘇:九江學(xué)院學(xué)報(bào)(自然科學(xué)版),2011(3):26-28.

      [6]秦勝君,盧志平.稀疏自動(dòng)編碼器在文本分類(lèi)中的應(yīng)用研究[J].科技技術(shù)與工程,2013,31(13):9422-9425.

      [7]林少飛,盛惠興,李慶武.基于堆疊稀疏自動(dòng)編碼器的手寫(xiě)數(shù)字分類(lèi)[J].微機(jī)處理,2015,36(1):47-53.

      [8]李志清,傅秀芬.基于PCA的3種改進(jìn)BP算法性能研究[J].計(jì)算機(jī)工程,2011,37(21):108-110.

      [9]李森林,鄧小武.基于二參數(shù)的BP神經(jīng)網(wǎng)絡(luò)算法改進(jìn)與應(yīng)用[J].河北科技大學(xué)學(xué)報(bào),2010,31(5):120-123.

      [10]BAHDANAU D,CHO K,BENGIO Y.Neural machine translation by jointly learning to align and translate[J].CoRR,2014:abs/1409.0473.

      [11]李康順,李凱,張文生.一種基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的PCA人臉識(shí)別算法[J].計(jì)算機(jī)應(yīng)用與軟件,2014,31(1):158-161.

      [12]KRIZHEVSKY A,SUTSKEVER I,HINTON GE.Image net classificationwithdeepconvolutionalneural.etworks[C] //Advances in Neural Information Processing Systems.Red Hook,NY:Curran Associates,2012:1097-1105.

      A Face Recognition Model Based on SAE and BP Network

      LI Sen-lin,SHI Yuan-quan,HUANG Long-hua
      (School of Computer Technology and Engineering,Huaihua University,Huaihua,Hunan 418008)

      Pattern recognition based on shallow neural network has a key role in many fields.For sparse highdimensional datum,it has slower training rate and lower accuracy.So,the author proposes a model with sparse autoencoder connecting shallow BP network,In depth SAE model,Multi-features are automatically learned through setting the hidden nodes,being less than the input and output nodes.So data-dimensionality becomes little.New features are inputted into shallow neural network model to train and test.Face recognition experiments show that it is feasible to complete face recognition through SAE model and multi-layer represents mustn't be better than single-layer represents for face recognition and new model has a better result to some extent than only BP neural network.

      sparse auto-encoder;neural network;face recognition;high dimension data;dimension reduction

      TP3

      A

      1671-9743(2017)05-0078-05

      2016-11-17

      李森林,1973年生,男,河北邯鄲人,講師,研究方向:機(jī)器學(xué)習(xí)等.

      猜你喜歡
      編碼器人臉識(shí)別神經(jīng)網(wǎng)絡(luò)
      人臉識(shí)別 等
      揭開(kāi)人臉識(shí)別的神秘面紗
      神經(jīng)網(wǎng)絡(luò)抑制無(wú)線通信干擾探究
      電子制作(2019年19期)2019-11-23 08:42:00
      基于FPGA的同步機(jī)軸角編碼器
      基于PRBS檢測(cè)的8B/IOB編碼器設(shè)計(jì)
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
      JESD204B接口協(xié)議中的8B10B編碼器設(shè)計(jì)
      電子器件(2015年5期)2015-12-29 08:42:24
      復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
      基于類(lèi)獨(dú)立核稀疏表示的魯棒人臉識(shí)別
      基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
      察雅县| 五原县| 衢州市| 陆良县| 绵竹市| 运城市| 遵义市| 太湖县| 仁寿县| 曲沃县| 永城市| 石河子市| 鄂温| 萝北县| 团风县| 额济纳旗| 郓城县| 石嘴山市| 白河县| 沿河| 凌海市| 渑池县| 昂仁县| 麻阳| 道孚县| 府谷县| 台中市| 垣曲县| 永善县| 雷波县| 宝兴县| 石门县| 克拉玛依市| 夏津县| 雅江县| 佳木斯市| 怀宁县| 米林县| 东方市| 潼南县| 习水县|