劉宣彤
摘?要:在“互聯(lián)網(wǎng)+”技術(shù)的發(fā)展推動下,人臉識別技術(shù)也逐漸趨于成熟,但是面部表情識別技術(shù)作為難點技術(shù),尚未被有效攻克,如果將面部表情識別技術(shù)與物聯(lián)網(wǎng)技術(shù)相結(jié)合,則會賦予計算機以人類的感情,有利于物聯(lián)網(wǎng)時代的開啟。本文通過對面部表情識別方法進行分析,希望對促進面部表情識別技術(shù)的發(fā)展有所幫助。
關(guān)鍵詞:深度學(xué)習(xí);面部表情;識別
面部表情是一種人類特有的情感表達方式,也是分析人類情感和行為的重要依據(jù),在“互聯(lián)網(wǎng)+技術(shù)”和人工智能技術(shù)發(fā)展的背景下,面部表情識別技術(shù)已經(jīng)成為人們重點關(guān)注的話題,并出現(xiàn)了多種識別方法。伴隨著芯片處理能力的不斷加強,研究人員已經(jīng)將目光轉(zhuǎn)向深度學(xué)習(xí),已經(jīng)取得了初步的成效。因此,對基于深度學(xué)習(xí)的面部表情識別進行研究,具有十分重要的意義。
一、深度學(xué)習(xí)
深度學(xué)習(xí)指的是在多層神經(jīng)網(wǎng)絡(luò)上,應(yīng)用不同種類的機器學(xué)習(xí)算法,對圖像、文本等問題進行解決的算法集合。[1]基于深度學(xué)習(xí),計算機可以對數(shù)據(jù)結(jié)構(gòu)進行發(fā)現(xiàn)和調(diào)整,并依據(jù)前一個圖層的表示,對每個圖層表示進行計算。深度學(xué)習(xí)最顯著的特點就是特征學(xué)習(xí),其目的在于獲取分層特征信息,以此來解決傳統(tǒng)特征提取方法存在的問題。深度學(xué)習(xí)就是所謂的深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練,伴隨著硬件處理能力的不斷提升,重新成為了相關(guān)領(lǐng)域重點關(guān)注的內(nèi)容。
二、基于深度學(xué)習(xí)的面部表情識別分析
(一)面部表情圖像預(yù)處理
預(yù)處理是面部表情識別的重要步驟,其主要目的在于排除干擾特征提取的各項因素,例如:環(huán)境、姿勢和背景等,在干擾排除后,讓人類面部表情直接與系統(tǒng)相對接,促使面部特征對應(yīng)的語義位置準確無誤。實現(xiàn)預(yù)處理的方法有以下幾種:一是人臉檢測;二是人臉對齊;三是數(shù)據(jù)增強;四是人臉歸一。
1.人臉檢測
人臉檢測主要是對人類的面部進行檢測,在檢測的同時,排除干擾因素和其他區(qū)域。傳統(tǒng)的人臉檢測方法主要由人工操作完成,工作人員會利用專業(yè)的設(shè)備完成這項工作,但是這種檢測方法,無法有效克服環(huán)境因素的干擾,檢測效果十分有限。而隱馬爾可夫人臉檢測器應(yīng)用效果卻十分顯著,取得了廣泛的應(yīng)用。在深度學(xué)習(xí)階段,又出現(xiàn)了一系列先進的人臉檢測器,不僅工作效率高,還能應(yīng)對各種干擾因素的影響。目前,級聯(lián)結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用,使人臉檢測性能得到顯著增強。
2.人臉對齊
為進一步強化人臉檢測的效果,人臉對齊技術(shù)應(yīng)運而生,人臉對齊好比在一個已經(jīng)設(shè)置好固定點位的系統(tǒng)中,對這些固定點進行搜索,繼而構(gòu)成人臉的形狀。人臉對齊首先會由一個大致的形狀開始,然后不斷對人臉形狀進行細化和估計。[2]在搜索點的過程中,需要使用以下兩種信息:一是人臉外觀;二是人臉形狀。形狀是指為搜索提供一個大致的范圍,目前使用最為廣泛的方法是IntraFacc軟件。
3.數(shù)據(jù)增強
深度學(xué)習(xí)雖然效果十分顯著,但對于數(shù)據(jù)的要求十分嚴格,只有確保數(shù)據(jù)量的充足有效,才能強化工作效果。但是現(xiàn)階段常用的FER數(shù)據(jù)集,卻無法完全滿足深度學(xué)習(xí)對數(shù)據(jù)的要求,繼而會導(dǎo)致過擬合現(xiàn)象的發(fā)生。因此,數(shù)據(jù)增強成為了保證面部表情識別有效性的重要步驟。目前,應(yīng)用效果顯著的數(shù)據(jù)增強方法有以下幾種:一是旋轉(zhuǎn)反射變換法;二是縮放變換法;三是尺度變換法;四是對比度變換法;五是顏色變化法。這些數(shù)據(jù)增強方法的應(yīng)用,促進了面部表情識別技術(shù)的發(fā)展。
4.人臉歸一化
由于燈光和頭部姿勢的變化,會對面部表情識別效果造成直接的影響,因此,應(yīng)用人臉歸一化方法,消除這些變化的對識別效果的影響十分關(guān)鍵。常用的人臉歸一化方法為兩種:一是灰度歸一化;二是幾何歸一化。增加圖像的亮度,凸顯圖像的細節(jié),消除外界環(huán)境因素對圖像的干擾,是灰度歸一化的主要功能。除了增加亮度功能之外,灰度歸一化還可以調(diào)整對比度。對比度調(diào)整方法包括直方圖均衡化、IS歸一化、DCT歸一化和高斯歸一化法等。在這些方法中,比較適用于深度學(xué)習(xí)面部表情識別的方法為直方圖均衡化,究其原因,主要是這種方法較為穩(wěn)定,契合于網(wǎng)絡(luò)模型。幾何歸一化的功能是生成面部視圖,但現(xiàn)階段,該方法的發(fā)展還不完善,尚存在一定的不足。
(二)基于序列特征的方法
基于序列特征的方法主要有兩種:一種是光流法;另一種是模型法。其中光流法是指幀在變化過程中會凸顯出來一些重要的特征信息,在明確圖像序列目標的構(gòu)造的基礎(chǔ)上,對目標的形變和圖像顏色在空間和時間上的變化情況進行把握,這種動態(tài)化序列特征提取,應(yīng)用范圍十分廣泛。而模型法是指利用模型對人的面部進行追蹤,并將通過追蹤獲取的模型和幀圖像信息作為依據(jù),對人的面部表情進行有效的識別。
(三)深度卷積神經(jīng)網(wǎng)絡(luò)
深度神經(jīng)網(wǎng)絡(luò)已經(jīng)被廣泛應(yīng)用于視覺對象識別任務(wù)之中,它能夠使神經(jīng)網(wǎng)絡(luò)的大數(shù)據(jù)處理能力得到顯著提升,其方法是在神經(jīng)網(wǎng)絡(luò)內(nèi)構(gòu)建一個與人類大腦相似的學(xué)習(xí)結(jié)構(gòu)。這個學(xué)習(xí)結(jié)構(gòu)可以對一些多級表示和抽象進行學(xué)習(xí),從而賦予計算法在聲音、文字和圖像中找到復(fù)雜模式的能力。研究人員在2012年發(fā)現(xiàn)將自動編碼器應(yīng)用于CNN之中,做逐層訓(xùn)練,可以對高層次的網(wǎng)絡(luò)進行訓(xùn)練,但經(jīng)過繼續(xù)研究,發(fā)現(xiàn)初始化策略的效果要優(yōu)于逐層訓(xùn)練,因而提出了批量歸一化方法,這一方法的使用,促進了深層網(wǎng)絡(luò)的發(fā)展,從而使深層學(xué)習(xí)面部表情識別成為了可能。
三、結(jié)論
綜上所述,面部表情識別具有非常高的實用價值和商業(yè)價值。如今,對于面部表情識別的研究正在不斷進行,在此期間,產(chǎn)生了多種方法和結(jié)構(gòu)。通過對這些方法進行分析,有利于加深我們對面部表情識別的理解。
參考文獻:
[1]陸嘉慧,張樹美,趙俊莉.基于深度學(xué)習(xí)的面部表情識別研究[J].計算機應(yīng)用研究,1-8[2019-03-07].
[2]夏晨.基于視頻序列的人臉表情識別方法研究[D].合肥工業(yè)大學(xué),2018.