• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于PCA和非線性SVC的小數(shù)據(jù)人臉識(shí)別

      2019-12-24 07:27:02張持健張燕習(xí)
      無線電通信技術(shù) 2019年1期
      關(guān)鍵詞:人臉識(shí)別人臉特征提取

      張持健,劉 雪,張 賀,張燕習(xí)

      (安徽師范大學(xué) 物理與電子信息學(xué)院,安徽 蕪湖 241000 )

      0 引言

      人臉識(shí)別是基于人的五官信息提取面部特征,用以進(jìn)行身份辨識(shí)的智能識(shí)別技術(shù)。1965年,Chan和Bledsoe設(shè)計(jì)了第一個(gè)人臉識(shí)別系統(tǒng),所采用的主要方法是基于人臉幾何結(jié)構(gòu)特征辨別法,從而進(jìn)行對(duì)人體的身份識(shí)別。該方法提取并分析面部剪影曲線的結(jié)構(gòu)特征; 1991年美國MIT的Turk和Pentland提出著名的特征人臉識(shí)別方法,使用特征臉與歸一化的協(xié)相關(guān)量作為人臉識(shí)別的性能測試基準(zhǔn)算法,從而進(jìn)一步提高了人臉識(shí)別的準(zhǔn)確度。而人臉識(shí)別的應(yīng)用發(fā)展則是由美國 “911事件”推動(dòng),2006年FRV國際測試走進(jìn)人們的視線,2008年北京奧運(yùn)會(huì)在安保方面應(yīng)用了大規(guī)模的人臉識(shí)別技術(shù)[1]。

      因此,人臉識(shí)別不僅是當(dāng)今科學(xué)家們研究的熱點(diǎn),也是應(yīng)用領(lǐng)域經(jīng)久不衰的重要研究課題。但是,隨著科學(xué)技術(shù)的發(fā)展,在數(shù)據(jù)集越來越紛亂的當(dāng)下,人臉識(shí)別也逐漸由單一式研究發(fā)展為多項(xiàng)式研究,從而衍生出大數(shù)據(jù)集的人臉識(shí)別系統(tǒng)和小數(shù)據(jù)集的人臉識(shí)別算法2個(gè)分支方向。在小數(shù)據(jù)集的基礎(chǔ)上,存在一些經(jīng)典的人臉識(shí)別研究方法。

      文獻(xiàn)[2]提出基于PCA特征提取和距離哈希K近鄰分類的人臉表情識(shí)別,這種方法主要利用了PCA對(duì)高維數(shù)據(jù)的特征提取,驗(yàn)證了PCA主成分分析在多維數(shù)據(jù)中的應(yīng)用效果十分優(yōu)秀。但PCA算法和K近鄰算法的結(jié)合在小數(shù)據(jù)集上的應(yīng)用效果較為良好,而在多個(gè)特征多人表情識(shí)別中則效果不盡人意。文獻(xiàn)[3]提出PCA算法和SVM支持向量機(jī)算法的人臉識(shí)別,在ORL數(shù)據(jù)庫中識(shí)別效果良好。但因?yàn)樽髡邩?gòu)建多類SVM算法時(shí),選取的核函數(shù)不同識(shí)別率也隨之改變,因此需要進(jìn)行多次試驗(yàn)以求得最優(yōu)核函數(shù)以及其他相關(guān)參數(shù),耗費(fèi)了大量的實(shí)驗(yàn)時(shí)間。

      本文提出一種基于PCA主成分特征提取和數(shù)據(jù)降維,聯(lián)合可自主選取最優(yōu)參數(shù)的SVC非線性支持向量機(jī)的組合學(xué)習(xí)器,用于精準(zhǔn)分類并節(jié)省人工選取參數(shù)時(shí)間成本的人臉識(shí)別應(yīng)用。實(shí)驗(yàn)結(jié)果表明,本文提出的組合學(xué)習(xí)器在經(jīng)典的ORL和WILD數(shù)據(jù)庫中不僅識(shí)別精度高,和同類方法相比該學(xué)習(xí)器識(shí)別時(shí)間成本更低。

      1 基于PCA的表情識(shí)別

      1.1 數(shù)據(jù)降維和特征提取

      在圖像數(shù)據(jù)的原始高維空間中,包含著的冗余信息和噪聲信息,會(huì)在一些實(shí)際應(yīng)用中(例如圖像識(shí)別或圖像處理等過程中)造成一定的誤差干擾,不僅增加了計(jì)算的復(fù)雜度,而且降低了識(shí)別效果的準(zhǔn)確率。研究者期望通過對(duì)這樣的高維數(shù)據(jù)使用降維技術(shù),進(jìn)行空間變換處理,以減少冗余信息造成的誤差,從而提高識(shí)別的準(zhǔn)確度。主成分分析 (PCA)是多類變量降維處理與分析研究問題中最早出現(xiàn)的基礎(chǔ)理論之一,它起源于通信與系統(tǒng)理論中的 K-L散度[1]。PCA通過一種線性變換將高維樣本數(shù)據(jù)投影到低維空間中生成對(duì)應(yīng)低維樣本數(shù)據(jù),并發(fā)現(xiàn)一組比原始的像素基向量更能有效表示輸入數(shù)據(jù)的基函數(shù)[4]。因此,只需要保留一部分特征,PCA就能揭示某些復(fù)雜數(shù)據(jù)集中的潛在隱含信息。即描述對(duì)象的最顯著的特征[1]。人的面部具有多種顯著的人臉特征,在PCA的基礎(chǔ)上可以形成部分特征提取的PCA人臉識(shí)別[4]。

      1.2 基于PCA的數(shù)據(jù)降維和特征提取

      本次實(shí)驗(yàn)中,通過使用PCA的最近重構(gòu)性來進(jìn)行圖像數(shù)據(jù)的降維處理。

      (1)

      (2)

      (3)

      PCA算法流程為:

      通過交叉驗(yàn)證法選取最佳低維空間維數(shù)為d;

      ② 過程: 對(duì)所有樣本進(jìn)行中心化操作:

      (4)

      至此,就是主成分分析的優(yōu)化目標(biāo),即通過對(duì)樣本數(shù)據(jù)進(jìn)行協(xié)方差矩陣的特征值分解,從而得到經(jīng)原數(shù)據(jù)集下降維的新數(shù)據(jù)集,并且把這個(gè)已經(jīng)降維的新數(shù)據(jù)集用于接下來的非線性支持向量機(jī)svc算法中,作為數(shù)據(jù)輸入。

      在使用ORL數(shù)據(jù)庫進(jìn)行實(shí)驗(yàn)時(shí),輸入的樣本數(shù)據(jù)大小為m*n,m,n分別為圖片數(shù)據(jù)的長和寬。令d為輸入的維數(shù),一般情況下d=m*n。d'則為通過PCA處理后的數(shù)據(jù)維數(shù),通常使用交叉驗(yàn)證得到最優(yōu)的降維后維數(shù)。輸入的訓(xùn)練集樣本為:x=[x1,x2,...,xN],共N個(gè)樣本。

      2 SVC非線性支持向量機(jī)及其優(yōu)化

      支持向量機(jī)簡單來說,它是一種二分類模型。SVM在小數(shù)據(jù)集上比較容易抓取數(shù)據(jù)和特征之間的非線性關(guān)系,因此SVM在一般情況下可以解決部分非線性問題,并且避免神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)選擇和陷入局部最優(yōu)缺陷。但是由于SVM對(duì)于有殘缺的樣本數(shù)據(jù)和一些非線性問題并沒有通用的解決方案。研究者發(fā)現(xiàn)采用核函數(shù)后,支持向量機(jī)可以用于正規(guī)的非線性分類。本文采用的支持向量機(jī)SVC就是python中的非線性分類支持向量機(jī)。當(dāng)訓(xùn)練數(shù)據(jù)不可分時(shí),通過使用核函數(shù)學(xué)到一個(gè)非線性支持向量機(jī)[4]。

      2.1 SVC非線性支持向量機(jī)

      因此2類樣本的幾何間隔最大化從而等價(jià)于2類樣本間隔最小化:

      (5)

      在此引入拉格朗日乘子αi:

      (6)

      得到目標(biāo)函數(shù)對(duì)偶形式:

      (7)

      分類決策函數(shù)為:

      (8)

      在SVM支持向量機(jī)的基礎(chǔ)上,給定核函數(shù),利用求解線性分類問題的方法求解非線性分類問題的支持向量機(jī)。非線性分類SVC可以支持多分類應(yīng)用,并且有多個(gè)核函數(shù)提供選擇。如線性核函數(shù)Linear、多項(xiàng)式核函數(shù)poly、RBF高斯核徑向基函數(shù)以及sigmoid核函數(shù)。

      本文算法中,使用的是RBF的高斯徑向基核函數(shù)(Gaussian Radial Basis Kernel Function):

      (9)

      (10)

      式中,C為懲罰項(xiàng)系數(shù),ε為松弛變量。

      引入拉格朗日乘子后的對(duì)偶問題目標(biāo)函數(shù)為:

      (11)

      分類決策函數(shù)變?yōu)椋?/p>

      (12)

      2.2 網(wǎng)格搜索算法優(yōu)化SVC

      SVC的主流算法是O(n)2,因此,當(dāng)出現(xiàn)大數(shù)據(jù)集時(shí),SVC明顯計(jì)算量爆增。在本次實(shí)驗(yàn)中使用SVC中的高斯徑向基核函數(shù)來進(jìn)行分類實(shí)驗(yàn)。高斯核徑向基函數(shù)中的參數(shù)γ和C懲罰項(xiàng)無法通過概率方法進(jìn)行計(jì)算,只能通過窮舉實(shí)驗(yàn)求出。這樣就更增加了實(shí)驗(yàn)中的時(shí)間成本和計(jì)算量。因此,本文提出改進(jìn)型的SVC算法,即結(jié)合網(wǎng)格搜索法實(shí)現(xiàn)算法自動(dòng)尋優(yōu)的SVC算法。

      2.2.1 網(wǎng)格搜索法原理

      網(wǎng)格搜索法是自動(dòng)化調(diào)整參數(shù)值中的常見技術(shù)之一。自動(dòng)化調(diào)參進(jìn)行參數(shù)優(yōu)化省去了人工調(diào)參的繁瑣和經(jīng)驗(yàn)不足。因此,在PCA和SVC算法中加入網(wǎng)格搜索技術(shù),使得組合的學(xué)習(xí)器通過調(diào)節(jié)每一個(gè)參數(shù)來跟蹤評(píng)分結(jié)果,在運(yùn)行過程中自動(dòng)進(jìn)行交叉驗(yàn)證,最終使得學(xué)習(xí)器的效果性能為最佳[5]。

      網(wǎng)格搜索法,將待搜索參數(shù)gamma(γ)和C在一定的空間范圍內(nèi)劃分成網(wǎng)格,先使用大的步長對(duì)網(wǎng)格中的參數(shù)進(jìn)行大范圍內(nèi)的粗略搜索,在確定一個(gè)最優(yōu)參數(shù)區(qū)間后,使用小步長再進(jìn)行精細(xì)搜索[6]。使用網(wǎng)格搜索算法不但保證了搜索參數(shù)過程中的準(zhǔn)確度,也節(jié)省了搜索時(shí)間。

      SVC算法流程如下:

      ① 輸入

      C≥αi≥0,i=1,2,...,N,

      (13)

      ② 計(jì)算

      (14)

      (15)

      ③ 構(gòu)造分類決策函數(shù)

      (16)

      ④ 加入網(wǎng)格搜索算法,求得高斯核函數(shù)最佳參數(shù)gamma和C。

      3 實(shí)驗(yàn)結(jié)果與分析

      3.1 仿真環(huán)境

      實(shí)驗(yàn)利用python編程實(shí)現(xiàn),使用Olivetti實(shí)驗(yàn)室的ORL人臉庫和從外部網(wǎng)站Labeled Faces in the Wild獲取的人臉識(shí)別數(shù)據(jù)庫。

      ORL人臉庫數(shù)據(jù)集中一共有400幅人臉圖像(其中總共包含40個(gè)人,每個(gè)人各有10幅人臉圖,每幅圖像大小為112 * 92,每幅圖像的維數(shù)等于10 304)。

      ORL數(shù)據(jù)集中的面部表情和細(xì)節(jié)有不同程度的改變,因此導(dǎo)致數(shù)據(jù)集中同一個(gè)人的人臉姿態(tài)也有不同程度的變化。對(duì)于某些個(gè)體,圖像在不同時(shí)間拍攝并且改變照明和面部細(xì)節(jié),所有的圖像均采用黑色均勻背景,個(gè)體處于直立的正面位置。

      Labeled Faces in the Wild集是帶標(biāo)記的人臉圖像,里面包含了數(shù)千張公開的人臉照片。每個(gè)圖像包含(62*47),接近3 000像素。

      本次實(shí)驗(yàn)環(huán)境為Windows 10 系統(tǒng),處理器為i5。編輯學(xué)習(xí)器使用的語言為python 3.7版本,搭建的識(shí)別系統(tǒng)運(yùn)行平臺(tái)為PyCharm。

      3.2 算法過程

      ① PCA特征提取

      首先,將ORL人臉庫中400張圖像標(biāo)注劃分為2類數(shù)據(jù):訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集。讀進(jìn)訓(xùn)練數(shù)據(jù)集中隨機(jī)的300張人臉圖像,使用PCA對(duì)其進(jìn)行特征提取和降維的預(yù)處理。實(shí)驗(yàn)將PCA主成分的數(shù)據(jù)確定為150維,經(jīng)過PCA處理,訓(xùn)練集中每個(gè)人的臉樣本特征向量由102 304維降維150維。

      圖1為原圖和pca提取特征后的圖片。

      圖1 原始圖像與PCA特征提取后的圖像對(duì)比

      ② 構(gòu)建高斯徑向基核函數(shù)的非線性支持向量機(jī)

      在多類SVC訓(xùn)練階段,每一對(duì)分類直接定義一個(gè)二類非線性支持向量機(jī),一共有N*(N-1)/2個(gè)類別的非線性支持向量機(jī)組成一個(gè)多分類的非線性支持向量機(jī)。同時(shí),指定每個(gè)類別的權(quán)重是它出現(xiàn)的頻數(shù)的倒數(shù)。在分類階段,通過投票確定其類別。

      ③ 網(wǎng)格搜索

      通過網(wǎng)格搜索和交叉驗(yàn)證確定SVC最佳參數(shù)Gamma=0.005,C=10,對(duì)ORL測試集中的10個(gè)人的100幅圖片進(jìn)行分類,識(shí)別率為:Train_score:1.0,Test_Score:0.96。

      在Wild數(shù)據(jù)集上做分類,識(shí)別率為:Train_Score:1.0,Test_Score:0.85。其中,訓(xùn)練分?jǐn)?shù)為1.0,說明該分類器已達(dá)到在訓(xùn)練數(shù)據(jù)上百分百的分類準(zhǔn)確率;測試分?jǐn)?shù)為0.96,說明該分類器在用于驗(yàn)證系統(tǒng)模型數(shù)據(jù)集上的準(zhǔn)確率為96%。

      ④ 本文所用的學(xué)習(xí)器和其他研究者所用的方法在WILD數(shù)據(jù)集上準(zhǔn)確率和時(shí)間成本對(duì)比如表1所示。

      表1 人臉識(shí)別方法效果比對(duì)

      由表1可知,本文提出的PCA&SVC算法識(shí)別分類器與其他學(xué)者提出的PCA&SVM算法相比,對(duì)數(shù)據(jù)集的分類準(zhǔn)確率有所提高,且節(jié)省了人工選取參數(shù)的時(shí)間成本;與另外一種常用的PCA&KNN分類器相比,雖然訓(xùn)練分類器所用時(shí)間稍顯過久,但準(zhǔn)確率有了質(zhì)的飛躍,而單獨(dú)的非線性支持向量機(jī)做人臉識(shí)別則準(zhǔn)確率更為低下。

      3.3 實(shí)驗(yàn)總結(jié)

      本次實(shí)驗(yàn)提出基于PCA和SVC算法相結(jié)合的人臉識(shí)別算法,在應(yīng)用小數(shù)據(jù)集的人臉識(shí)別上效果比單獨(dú)的SVC分類器要好,在應(yīng)用數(shù)據(jù)量大的數(shù)據(jù)集上效果略差。但總體來說,運(yùn)算速度和精度都比單獨(dú)的SVC分類器要有所提升。相比文獻(xiàn)[2]提出的PCA和K近鄰的學(xué)習(xí)器組合來說,本文提出的組合學(xué)習(xí)器效果更優(yōu),而相對(duì)于文獻(xiàn)[1]提出的PCA和SVM的識(shí)別算法,本文節(jié)省了大量的時(shí)間成本。

      4 結(jié)束語

      隨著科學(xué)技術(shù)的進(jìn)步和智能化的發(fā)展,人臉識(shí)別的應(yīng)用將愈來愈廣泛,而對(duì)人臉識(shí)別的精度也將成為一個(gè)研究熱點(diǎn)。本文針對(duì)其他方法的參數(shù)尋優(yōu)時(shí)間過程提出了改進(jìn)型SVC算法,經(jīng)試驗(yàn)證明有良好的效果,而且準(zhǔn)確度也得以保持。存在的不足是本文提出的算法準(zhǔn)確度仍有可提升的空間,對(duì)本算法進(jìn)行研究和改進(jìn)將是接下來的實(shí)驗(yàn)?zāi)繕?biāo)。

      猜你喜歡
      人臉識(shí)別人臉特征提取
      人臉識(shí)別 等
      有特點(diǎn)的人臉
      揭開人臉識(shí)別的神秘面紗
      基于Daubechies(dbN)的飛行器音頻特征提取
      電子制作(2018年19期)2018-11-14 02:37:08
      三國漫——人臉解鎖
      Bagging RCSP腦電特征提取算法
      基于類獨(dú)立核稀疏表示的魯棒人臉識(shí)別
      馬面部與人臉相似度驚人
      基于MED和循環(huán)域解調(diào)的多故障特征提取
      長得象人臉的十種動(dòng)物
      奇聞怪事(2014年5期)2014-05-13 21:43:01
      乐山市| 荥阳市| 陇西县| 平乡县| 清流县| 绍兴市| 湖南省| 瑞金市| 柘城县| 潞西市| 临沧市| 改则县| 阜康市| 新绛县| 吕梁市| 迁安市| 白河县| 色达县| 黄石市| 嘉善县| 隆尧县| 潼关县| 华蓥市| 邵阳县| 七台河市| 繁昌县| 墨江| 武宣县| 关岭| 陇川县| 泊头市| 连州市| 建瓯市| 门头沟区| 永福县| 时尚| 偃师市| 甘肃省| 安达市| 珠海市| 灵山县|