汪家琦 郭源
摘 ? 要:深度學(xué)習(xí)是目前人工智能領(lǐng)域中的新興分支之一,利用這一技術(shù)可以讓人臉識別技術(shù)的準(zhǔn)確性得到提高,進(jìn)一步提高信息安全保障。基于此,本文針對基于深度學(xué)習(xí)的人臉識別技術(shù)進(jìn)行分析,在簡單了解基礎(chǔ)模型和訓(xùn)練集的基礎(chǔ)上,從人臉預(yù)處理和特征融合入手,最終建立形成基于深度多模型融合的人臉識別。
關(guān)鍵詞:深度學(xué)習(xí) ?人臉識別 ?準(zhǔn)確性 ?人臉特征
中圖分類號:TP391 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼:A ? ? ? ? ? ? ? ? ? ? ? ?文章編號:1674-098X(2020)01(a)-0149-02
生物識別技術(shù)主要是利用人體固有特征進(jìn)行身份鑒定,包括:指紋、虹膜、人臉等,作為識別技術(shù)的一種,人臉識別技術(shù)具有唯一性、不可復(fù)制性等特點(diǎn),同時也是與生俱來的、無法復(fù)制的?,F(xiàn)如今,人臉識別技術(shù)在多個領(lǐng)域中已經(jīng)取代了傳統(tǒng)識別技術(shù),但在實(shí)際應(yīng)用中,穩(wěn)定性和誤認(rèn)率還需要得到進(jìn)一步完善。
1 ?基礎(chǔ)模型和訓(xùn)練集
基于深度學(xué)習(xí)的人臉識別技術(shù)有很多種,隨著研究的深度,識別效果也在逐漸提升,但這些方式其本身的網(wǎng)絡(luò)結(jié)構(gòu)、訓(xùn)練集各不相同,因此在實(shí)際應(yīng)用上各具優(yōu)缺。因此,創(chuàng)建一個具有一定差異的基礎(chǔ)模型對后續(xù)工作的開展非常重要,訓(xùn)練集對網(wǎng)絡(luò)訓(xùn)練的效果的影響也是不能忽視的。
1.1 基礎(chǔ)模型
近幾年來,深度學(xué)習(xí)的人臉識別方式有很多,但完全公開的源碼并不多,通過對目前已經(jīng)公開源碼的三個人臉識別模型進(jìn)行分析。其中,VGGFace這一源碼,精確度可以達(dá)到98.98%,其主要用于特征投影和模型識別,但其實(shí)際應(yīng)用中,不同網(wǎng)絡(luò)中的卷積層較多,因此,網(wǎng)絡(luò)訓(xùn)練規(guī)模相對較大,足有548M。由上可知,VGGFace對硬件支撐的要求較高,因此無法在移動設(shè)備上運(yùn)行,且模型訓(xùn)練和特征提取都非常耗時,而Caffe-face這一源碼整體量級較輕,網(wǎng)絡(luò)層數(shù)不深,模型參數(shù)較少,且可以在移動設(shè)備、嵌入式設(shè)備中應(yīng)用,精確度達(dá)97.77%和98.13%。除了上述內(nèi)容之外,Lightened CNN也是公開源碼的模型之一,這一模型的精確度可以達(dá)到99.28%,學(xué)習(xí)效率較高,采用70W張人臉訓(xùn)練圖像,僅迭代了28000次,就達(dá)到了99.28%的精確度。
1.2 人臉數(shù)據(jù)集
基于深度學(xué)習(xí)的人臉識別技術(shù)本身就需要得到大量的數(shù)據(jù)支持,雖然這些數(shù)據(jù)可以從網(wǎng)絡(luò)上進(jìn)行獲取,如圖1中展示的就是網(wǎng)絡(luò)上可以獲取的人臉數(shù)據(jù),從圖中可以看出所獲取到的信息大都雜亂五章,需要進(jìn)行人工標(biāo)準(zhǔn)。因此在開發(fā)基于深度學(xué)習(xí)的人臉識別技術(shù)的過程中,需要對人臉數(shù)據(jù)進(jìn)行建立,通過對近幾年里公開源碼的人臉數(shù)據(jù)集進(jìn)行分析,最終選擇了CASIA-WebFace數(shù)據(jù)集和UMDfaces數(shù)據(jù)集,從而為后續(xù)的深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練奠定基礎(chǔ),確保網(wǎng)絡(luò)訓(xùn)練穩(wěn)定開展,繼而提高識別準(zhǔn)確性。
2 ?人臉預(yù)處理和特征融合
2.1 人臉預(yù)處理
在確定了就出模型和訓(xùn)練集后,還要對人臉預(yù)處理和特征融合進(jìn)行分析,在不受限的情況下,人臉圖像中含有大量和人臉信息無關(guān)的元素,包括:背景、光照等,這些元素會對識別過程產(chǎn)生影響,降低識別準(zhǔn)確性,延長識別時間,通過人臉預(yù)處理后,就可以有效提高后續(xù)模型的精確度。如圖2所示,基于深度學(xué)習(xí)的人臉識別技術(shù)可以通過網(wǎng)絡(luò)自動學(xué)習(xí)人臉面部特征,繼而提高人臉檢測效率,結(jié)余時間成本,相比較傳統(tǒng)檢測方法而言,其具有較大的優(yōu)勢。MTCNN人臉檢測算法在實(shí)際應(yīng)用中可以提高人臉圖像預(yù)處理效率,而仿射變化可以讓人臉歸一化質(zhì)量得到進(jìn)一步提高。最后,配合ASIA-WebFace數(shù)據(jù)集和UMDfaces數(shù)據(jù)集,可以將各種不同的人臉統(tǒng)一處理成為規(guī)范化的人臉圖像,以此突出圖像中的人臉信息。
2.2 特征融合
特征提取、特征融合是人臉識別方法的第二環(huán)節(jié),在通過基礎(chǔ)模型提取出圖像后,利用MTCNN人臉檢測算法和仿射變化完成圖像的預(yù)處理,在此基礎(chǔ)上,就可以對提取出相應(yīng)的基礎(chǔ)特征,作為后續(xù)深度神經(jīng)網(wǎng)絡(luò)輸入的最終圖像。在實(shí)際發(fā)展過程中,卷積神經(jīng)網(wǎng)絡(luò)是一種分層結(jié)構(gòu),可以對不同基礎(chǔ)模型進(jìn)行特征提取,而且如果降維得當(dāng),還可以得到更好的組合特征?;诙嘟嵌鹊娜四楶CA算法,可以對高維基礎(chǔ)特征進(jìn)行降維,以此進(jìn)行進(jìn)一步的判定。在得到模型的基礎(chǔ)特征后,可以發(fā)現(xiàn)特征的維度各不相同,直接融合會導(dǎo)致不同基礎(chǔ)模型的權(quán)重存在較大差別,因此,需要進(jìn)行降維,從而有效避免這一問題,分析降維后的基礎(chǔ)模型在LFW上精度的變化,進(jìn)一步測試組合特征[1]。
3 ?基于深度多模型融合的人臉識別技術(shù)
3.1 模型訓(xùn)練
在完成基礎(chǔ)模型、訓(xùn)練集、人臉預(yù)處理和特征融合的基礎(chǔ)上,就可以正式進(jìn)入特征訓(xùn)練,這也是人臉識別方法技術(shù)中的最后環(huán)節(jié),也是最為重要的環(huán)節(jié),通過構(gòu)建深度多模型融合的深度神經(jīng)網(wǎng)絡(luò),可以有效訓(xùn)練組合特征。這種神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)圖包括一個輸入層和三個全連接層,其中輸入層的組合特征為:featureA、featureB,其大小分別是:768維和2048維。由于輸入層的維度不同,網(wǎng)絡(luò)后續(xù)層的具體參數(shù)也會出現(xiàn)一定的區(qū)別,其中三個全連接層,分別為指的是特征融合訓(xùn)練、人臉特征以及分類層和神經(jīng)元個數(shù)。所有的網(wǎng)絡(luò)訓(xùn)練和測試都采用Caffe框架實(shí)現(xiàn),同時利用文本方式采用模型定義、參數(shù)設(shè)定、訓(xùn)練方法。使用單塊GPU訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),參考CASIA-WebFace數(shù)據(jù)集和UMDfaces數(shù)據(jù)集作為兩個訓(xùn)練集,參數(shù)設(shè)置上參考Lightened CNN中參數(shù)設(shè)置方法,采用隨機(jī)梯度下降法,來完成測試。
3.2 測試數(shù)據(jù)集和評價指標(biāo)
為了保證基于深度多模型融合的人臉識別技術(shù)的準(zhǔn)確性,采用了兩個人臉最全測試集進(jìn)行檢測,而評價指標(biāo)則采用了ROC這一評價標(biāo)準(zhǔn)。通過具體的實(shí)驗(yàn)結(jié)果來看,相比較其他人臉識別方法而言,本文設(shè)計(jì)出的這種深度多模型融合的深度神經(jīng)網(wǎng)絡(luò),在訓(xùn)練集較小的情況下,準(zhǔn)確率分別為:99.1%和93.23%。因此應(yīng)該適當(dāng)提高0.57%和0.52%,由此可知,這種識別技術(shù)的整體效果較優(yōu)。在此基礎(chǔ)上之上,通過對測試數(shù)據(jù)的進(jìn)一步分析,也能夠看出基于深度多模型融合的深度神經(jīng)網(wǎng)絡(luò)在不同人臉最全測試集中各具優(yōu)勢,且獲得了良好的效果,將兩個基礎(chǔ)模型中的優(yōu)點(diǎn)進(jìn)行結(jié)合,對模型進(jìn)行進(jìn)一步的改進(jìn),可以更好的發(fā)揮出模型功能,提高基礎(chǔ)特征在組合特征中的權(quán)重。雖然本文設(shè)計(jì)的方式取得了較高的精確度,但在實(shí)際應(yīng)用過程中,還需要對這一方法技術(shù)進(jìn)行進(jìn)一步完善,以此不斷提高識別準(zhǔn)確度,縮短時間成本,確保信息安全性[3]。
4 ?結(jié)語
綜上所述,人臉識別技術(shù)是目前信息安全技術(shù)中較為常見的一種,在不同深度學(xué)習(xí)模型下,具有不同的功能。通過本文對人臉預(yù)處理和特征融合進(jìn)行分析,得到了基于深度多模型融合的人臉識別技術(shù),它不僅具有較強(qiáng)的表達(dá)能力,運(yùn)算時間大幅度縮短,精度也得到了最大程度的提高,切實(shí)保證信息安全。
參考文獻(xiàn)
[1] 齊忠文.基于深度學(xué)習(xí)的人臉識別技術(shù)研究[J].新媒體研究,2018,4(14):30-31.
[2] 楊涵.基于深度學(xué)習(xí)的人臉識別算法研究[J].電子設(shè)計(jì)工程,2019,27(19):155-159.
[3] 鐘海波.基于深度學(xué)習(xí)的人臉識別技術(shù)在智慧安防建設(shè)中的應(yīng)用[J].廣東公安科技,2018,26(1):38-41.