• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于Prewitt算子的卷積神經(jīng)網(wǎng)絡(luò)人臉識(shí)別方法

      2019-12-06 08:48蔣曉高瑋瑋楊亦樂馬曉峰
      軟件 2019年10期
      關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò)人臉識(shí)別

      蔣曉 高瑋瑋 楊亦樂 馬曉峰

      摘? 要: 為了提高人臉識(shí)別算法的識(shí)別性能,提出了基于Prewitt算子的卷積神經(jīng)網(wǎng)絡(luò)人臉識(shí)別方法。首先通過直方圖均衡化和Prewitt算子對(duì)人臉圖像進(jìn)行預(yù)處理;然后將其輸入卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并采用指數(shù)衰減法來設(shè)置學(xué)習(xí)率加快收斂速度,使用L2正則化和Dropout來防止過擬合。該方法在ORL人臉數(shù)據(jù)庫上的識(shí)別時(shí)間為0.2 s,識(shí)別率達(dá)到了98.1%。實(shí)驗(yàn)結(jié)果表明,利用Prewitt算子和改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)能縮短識(shí)別時(shí)間,并且能提高識(shí)別率,具有一定優(yōu)越性。

      關(guān)鍵詞: 人臉識(shí)別;卷積神經(jīng)網(wǎng)絡(luò);Prewitt算子

      中圖分類號(hào): TP391.41? ? 文獻(xiàn)標(biāo)識(shí)碼: A? ? DOI:10.3969/j.issn.1003-6970.2019.10.004

      本文著錄格式:蔣曉,高瑋瑋,楊亦樂,等. 基于Prewitt算子的卷積神經(jīng)網(wǎng)絡(luò)人臉識(shí)別方法[J]. 軟件,2019,40(10):1619

      Convolutional Neural Network Face Recognition Algorithm Based on Prewitt Operator

      JIANG Xiao, GAO Wei-wei*, YANG Yi-le, MA Xiao-feng

      (College of mechanical and automotive engineering, Shanghai University of Engineering Science, Shanghai 201620, China)

      【Abstract】: In order to improve the recognition performance of face recognition algorithm, a convolutional neural network face recognition method based on Prewitt operator is proposed. Firstly, the face image is preprocessed by histogram equalization and Prewitt operator. Then input it into the convolutional neural network for training, and use exponential decay method to set the learning rate to accelerate the convergence rate, and use L2 regularization and Dropout to prevent overfitting. The recognition time of this method on ORL face database is 0.2 s, and the recognition rate reaches 98.1%. The experimental results show that Prewitt operator and improved convolutional neural network can shorten the recognition time and improve the recognition rate.

      【Key words】: Face recognition; Convolutional neural network; Prewitt operator

      0? 引言

      近年來人臉識(shí)別因其識(shí)別便捷、識(shí)別對(duì)象不易偽裝[1]等優(yōu)點(diǎn),已被廣泛的應(yīng)用于人機(jī)交互、門禁安全系統(tǒng)等領(lǐng)域。隨著技術(shù)的不斷發(fā)展,人們對(duì)人臉識(shí)別的準(zhǔn)確率也有了更高的要求。

      傳統(tǒng)的人臉識(shí)別算法例如DENG W提出的基于改進(jìn)的主成分分析法(PCA)[2]用來描述人臉的內(nèi)在結(jié)構(gòu);BELHUMEUR[3]提出的基于線性判別分析法(LDA)的人臉識(shí)別算法對(duì)人臉數(shù)據(jù)進(jìn)行整體降維,映射到低維空間的方法。這些傳統(tǒng)的人臉識(shí)別方法容易受到光照、表情、角度等因素的影響,且需要人工提取特征、過程繁瑣、識(shí)別率較低、有一定局限性。

      近年來,卷積神經(jīng)網(wǎng)絡(luò)在圖像處理領(lǐng)域的表現(xiàn)逐年變強(qiáng)[4],隨著HINTON[5]等掀起的深度學(xué)習(xí)的熱潮,進(jìn)一步推動(dòng)卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展。隨后GoogleNet,VGG[6]等卷積神經(jīng)網(wǎng)絡(luò)將網(wǎng)絡(luò)層數(shù)進(jìn)一步加深,使得識(shí)別率不斷提高。雖然這些深度卷積神經(jīng)網(wǎng)絡(luò)能將人臉識(shí)別率不斷提高,但是隨著層數(shù)的加深,訓(xùn)練難度和運(yùn)算量也大大增加。

      為了解決傳統(tǒng)人臉識(shí)別算法識(shí)別率低、特征提取不便、深層次網(wǎng)絡(luò)計(jì)算量龐大等問題,提出了一種基于Prewitt算子的改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)的新方法。該方法采用直方圖均衡化和Prewitt算子使得人臉特征得到簡(jiǎn)化,將圖像壓縮后使得運(yùn)算量減少。在卷積神經(jīng)網(wǎng)絡(luò)中采用指數(shù)衰減法設(shè)置學(xué)習(xí)率,激活函數(shù)使用Relu,用L2正則化和Dropout防止過擬合。

      1? 實(shí)驗(yàn)環(huán)境及數(shù)據(jù)

      本實(shí)驗(yàn)硬件配置為Intel Core i5-4200H CPU,2.80 GHz,運(yùn)行內(nèi)存為4 G,顯卡為NVIDIA GEFORCE GTX 950M,系統(tǒng)Windows 10,編程語言為python 3.7,深度學(xué)習(xí)框架為tensorflow 1.4。

      采用ORL人臉庫作為實(shí)驗(yàn)訓(xùn)練和測(cè)試的數(shù)據(jù)集。ORL人臉庫包含40位不同性別膚色的人,每人10張照片,表情和細(xì)節(jié)均有變化,旋轉(zhuǎn)尺度可達(dá)20°,照片的背景均為黑色,大小為112×92,部分人臉圖像如圖1所示。

      2? 方法

      該方法首先使用直方圖均衡化和Prewitt算子提取人臉的邊緣特征;然后將提取的特征圖輸入LeNet[7]卷積神經(jīng)網(wǎng)絡(luò)模型,并且在訓(xùn)練時(shí)采用指數(shù)衰減法、正則化等算法來優(yōu)化神經(jīng)網(wǎng)絡(luò),提高識(shí)別率,最后再采用回歸進(jìn)行分類[8]。算法流程如圖2所示。

      2.1? 圖像預(yù)處理

      2.1.1? 人臉樣本增強(qiáng)

      直方圖均衡化的基本思想是把樣本圖像的直方圖轉(zhuǎn)變?yōu)楦泳鶆虻男问?,擴(kuò)大像素灰度值的動(dòng)態(tài)范圍[9],提高圖像對(duì)比度,改善灰度值,使得樣本的特征更加清晰[10]。

      對(duì)數(shù)據(jù)集中的樣本(如圖3)采用直方圖均衡化之后得到的圖像如圖4。

      由圖3和圖4對(duì)比可以看出,經(jīng)過直方圖均衡化之后,人臉樣本的特征更加突出,有利于接下來邊緣特征的提取。

      2.1.2? Prewitt算子

      Prewitt算子是一種一階微分算子,常用來檢測(cè)圖像邊緣。該算法利用單個(gè)像素點(diǎn)與周圍各點(diǎn)在邊緣處的灰度差極值來檢測(cè)邊緣[11],在實(shí)際應(yīng)用中通常使用水平(如圖5)和垂直(如圖6)兩個(gè)方向模板與圖像領(lǐng)域進(jìn)行卷積來獲取對(duì)應(yīng)方向梯度,但若僅使用垂直和水平兩個(gè)方向模板,所提取的邊緣特征信息并不完善,所以通過增加45°(如圖7)和135°(如圖8)兩個(gè)方向模板,使得人臉特征更加完整。

      Prewitt算子能夠有效的抑制噪聲,同時(shí)也不會(huì)得到偽邊緣,經(jīng)過處理過后的圖像特征更加明顯。

      2.2? 卷積神經(jīng)網(wǎng)絡(luò)

      卷積神經(jīng)網(wǎng)絡(luò)是一種非全連接多層的前饋型網(wǎng)絡(luò),因其具有較好的容錯(cuò)能力,并行處理能力和自學(xué)習(xí)能力所以被廣泛的應(yīng)用于圖像處理領(lǐng)域。卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型如圖9所示由輸入層I1、卷積層(C2,C4)、池化層(P3,P5)、全連接層(F6)和輸出層(O7)組成。

      2.2.1? 激活函數(shù)Relu

      傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)在使用激活函數(shù)時(shí)一般會(huì)選擇sigmoid函數(shù)或者tanh函數(shù),但sigmoid函數(shù)在訓(xùn)練網(wǎng)絡(luò)時(shí)會(huì)出現(xiàn)梯度消失的現(xiàn)象[12],并且收斂速度緩慢。從圖10中可以看出tanh函數(shù)的輸出隨著輸入的不斷增大而逐漸趨于飽和,所以選用Relu函數(shù),表達(dá)式如下:

      (1)

      該函數(shù)具有單邊抑制、相對(duì)寬闊的興奮邊界以及稀疏激活性[13]等優(yōu)點(diǎn),解決了飽和問題[14],使得網(wǎng)絡(luò)的泛化能力更強(qiáng)。

      2.2.2? 指數(shù)衰減法

      在訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí)參數(shù)更新的幅度取決于學(xué)習(xí)率的大小。若學(xué)習(xí)率設(shè)置過大,則參數(shù)每次更新時(shí)幅度會(huì)太大,即參數(shù)在極優(yōu)解兩側(cè)波動(dòng)而無法到達(dá);若學(xué)習(xí)率設(shè)置過小,則會(huì)降低收斂速度,故采用指數(shù)衰減法來動(dòng)態(tài)地設(shè)置學(xué)習(xí)率,公式如下:

      (2)

      式(2)中為當(dāng)前使用的學(xué)習(xí)率;為最初設(shè)定的學(xué)習(xí)率;為衰減系數(shù)。采用該方法后,先通過使用較大的學(xué)習(xí)率使得網(wǎng)絡(luò)能夠快速得到較優(yōu)解,隨著迭代次數(shù)的增加,學(xué)習(xí)率逐漸減?。ㄈ鐖D11所示),使得模型在后期趨于穩(wěn)定。

      2.2.3? L2正則化

      模型在已知的訓(xùn)練數(shù)據(jù)上能夠很好的擬合每個(gè)數(shù)據(jù)甚至是噪聲,而忽略了數(shù)據(jù)的整體趨勢(shì),這種情況稱為過擬合。為了防止出現(xiàn)這種情況,采用L2正則化和Dropout技術(shù)來保證訓(xùn)練后的模型具有較強(qiáng)的泛化能力。

      L2正則化就是在損失函數(shù)中加入刻畫模型復(fù)雜程度的指標(biāo),即在進(jìn)行優(yōu)化時(shí)不是直接優(yōu)化損失函數(shù)而是優(yōu)化。其中表示的是該模型的復(fù)雜程度,表示模型復(fù)雜損失在所有損失中占的比例。這里的表示的是一個(gè)神經(jīng)網(wǎng)絡(luò)中的權(quán)重,計(jì)算公式如下:

      (3)

      由于卷積神經(jīng)網(wǎng)絡(luò)的全連接層容易出現(xiàn)過擬合的問題,所以在全連接層采用Dropout技術(shù)將神經(jīng)元隨機(jī)失活來防止過擬合。

      3? 實(shí)驗(yàn)結(jié)果與分析

      本實(shí)驗(yàn)設(shè)計(jì)的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)如表1所示。

      在訓(xùn)練時(shí)使用持續(xù)衰減的動(dòng)態(tài)學(xué)習(xí)率,由于迭代次數(shù)較多,所以衰減系數(shù)一般設(shè)置為接近1的值,故設(shè)置為0.99,Dropout值設(shè)為0.5。由圖12可知,優(yōu)化后的網(wǎng)絡(luò)在訓(xùn)練時(shí)錯(cuò)誤率下降的速度明顯大于優(yōu)化前。

      為了驗(yàn)證該算法的有效性,選取了PCA和獨(dú)立成分分析法(ICA)[15]這兩種傳統(tǒng)的人臉識(shí)別算法和BP[16]、CNN[17]兩種可以自動(dòng)學(xué)習(xí)圖像特征的算法進(jìn)行對(duì)比。由于傳統(tǒng)算法需要人工提取特征并且易受姿態(tài)、遮擋物等影響,所以采用Prewitt算子及卷積神經(jīng)網(wǎng)絡(luò)算法之后在識(shí)別率上有大幅度提升,相比于PCA提高了11.6%,同時(shí)識(shí)別時(shí)間也縮短3.6 s;相比較ICA識(shí)別率提高了4.4%。

      BP神經(jīng)網(wǎng)絡(luò)由于參與運(yùn)算的參數(shù)較多且易陷入局部最優(yōu)解,相比較之下本算法在識(shí)別時(shí)間上提高了5 s,識(shí)別率也提高了17.2%。相比較傳統(tǒng)的CNN,由于本算法在圖像預(yù)處理階段使用了直方圖均衡化和Prewitt算子,使得圖像的特征更加清晰簡(jiǎn)潔的同時(shí)也減少了參數(shù),所以在識(shí)別時(shí)間上提高了1 s,同時(shí)識(shí)別率提高了3.7%。

      4? 結(jié)論

      人臉圖像的特征提取是提高人臉識(shí)別性能的關(guān)鍵之一。Prewitt算子能夠有效的抑制噪聲,同時(shí)也不會(huì)得到偽邊緣,通過對(duì)人臉圖片進(jìn)行預(yù)處理后特征得到簡(jiǎn)化與加強(qiáng),使得在之后的神經(jīng)網(wǎng)絡(luò)中能夠提取更有區(qū)分度的信息。根據(jù)在ORL人臉庫上的實(shí)驗(yàn)結(jié)果表明,該算法能夠有效加快收斂速度和提高識(shí)別率,具有一定優(yōu)越性。

      參考文獻(xiàn)

      [1]趙文可, 孫玉國(guó), 彈性RBF神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別中的應(yīng)用研究[J]. 軟件, 2018, 39(5): 203-206.

      [2]DENG W, HU J, LU J, et al, [J]. IEEE Transaction on Pattern Analysis & Machine Intelligence, 2014, 36(6): 1275-1284.

      [3]BELHUMEUR P N, HESPANHA J P, KRIEGMAN D J. Pattern Analysis and Machine Intelligence[J]. IEEE Transactions on, 1997, Vol.1(7), pp. 711-720.

      [4]宋婷婷, 徐世許, 基于全采樣和L1范數(shù)降采樣的卷積神經(jīng)網(wǎng)絡(luò)圖像分類方法[J]. 軟件, 2018, 39(2): 75-80.

      [5]HITON G E, SALAKHUTDINOV R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313(5786): 504-507.

      [6]YANG Z L, YUE J. et al. Vegetable Image Retrieval with Fine-tuning VGG Model and Image Hash[C]. IFAC Papers OnLine, 2018, 51(17). pp. 280-285.

      [7]LECUN Y, BOTTOU L, BENGIO P, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2323.

      [8]劉騰飛, 于雙元, 張洪濤, 等. 基于循環(huán)和卷積神經(jīng)網(wǎng)絡(luò)的文本分類研究[J]. 軟件, 2018, 39(1): 64-69.

      [9]黃登斌, 胡偉文. 一種基于初級(jí)理論的直方圖均衡化方法[J]. 兵工自動(dòng)化, 2010(9): 45-47.

      [10]安大海, 蔣硯軍, 基于BP神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別系統(tǒng)[J]. 軟件, 2015, 36(12): 76-79.

      [11]劉天時(shí), 魏雨等, 自適應(yīng)閾值的Prewitt地質(zhì)圖像邊緣檢測(cè)算法[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2016, 37(5): 1062-1065.

      [12]HOCHREITER S, BENGIO Y, FRASCONI P, et al. Gradient flow in recurrent nets:the diffuctly of learning long-term dependencies[M]. Piscataway: IEEE Press, 2001: 1-15.

      [13]張曉明, 伊鴻峰, 基于卷積神經(jīng)網(wǎng)絡(luò)和語義信息的場(chǎng)景分類[J]. 軟件, 2018, 39(1): 29-34.

      [14]張國(guó)云, 向燦群, 羅百通, 等. 一種改進(jìn)的人臉識(shí)別CNN結(jié)構(gòu)研究[J]. 計(jì)算機(jī)工程與應(yīng)用, 2017, 53(17): 180-185.

      [15]YANG M H. Kernel Eigenfaces vs. Kernel Fisherfaces: Face recognition using kernel methods[J]. Nips, 2002(2): 1457-1464.

      [16]李康順, 李凱, 張文生. 一種基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的PCA人臉識(shí)別算法[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2014(1): 158-161.

      [17]陳耀丹, 王連明. 基于卷積神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別方法[J]. 東北師大學(xué)報(bào): 自然科學(xué)版, 2006(2): 70-76.

      猜你喜歡
      卷積神經(jīng)網(wǎng)絡(luò)人臉識(shí)別
      人臉識(shí)別 等
      揭開人臉識(shí)別的神秘面紗
      基于(2D)2PCA-LBP 的人臉識(shí)別方法的研究
      人臉識(shí)別在高校安全防范中的應(yīng)用
      基于卷積神經(jīng)網(wǎng)絡(luò)溫室智能大棚監(jiān)控系統(tǒng)的研究
      基于深度卷積神經(jīng)網(wǎng)絡(luò)的物體識(shí)別算法
      基于類獨(dú)立核稀疏表示的魯棒人臉識(shí)別
      基于K-L變換和平均近鄰法的人臉識(shí)別
      班戈县| 刚察县| 东莞市| 孟津县| 华阴市| 晋州市| 荥经县| 平陆县| 宜兴市| 古交市| 政和县| 云安县| 永济市| 广汉市| 贵州省| 万盛区| 安庆市| 阿拉善盟| 白山市| 石柱| 竹溪县| 麦盖提县| 久治县| 延吉市| 兴隆县| 且末县| 洱源县| 安龙县| 甘南县| 呈贡县| 黑河市| 内乡县| 德阳市| 郧西县| 日照市| 汝城县| 贡嘎县| 方城县| 潮安县| 依兰县| 朝阳区|