李嘉良 范亦凡 展雯慧 黎箐箐 吉林大學(xué)軟件學(xué)院
人臉表情識(shí)別在嬰兒看護(hù)中的應(yīng)用
李嘉良 范亦凡 展雯慧 黎箐箐 吉林大學(xué)軟件學(xué)院
隨著機(jī)器學(xué)習(xí)相關(guān)技術(shù)的日漸成熟,人臉識(shí)別的準(zhǔn)確性及穩(wěn)定性得到可靠保證,被廣泛應(yīng)用到相關(guān)行業(yè)領(lǐng)域。本文主要分析人臉表情識(shí)別的技術(shù)流程以及普遍應(yīng)用到的OpenCV視覺(jué)庫(kù),并提出其在嬰兒看護(hù)中的應(yīng)用。
人臉識(shí)別 表情識(shí)別 應(yīng)用
在“互聯(lián)網(wǎng)+”概念風(fēng)靡全國(guó)的背景下,結(jié)合計(jì)算機(jī)領(lǐng)域的前沿技術(shù)解決生活中的實(shí)際問(wèn)題成為了創(chuàng)新的主流。而近年來(lái),隨著“二胎政策”的放開(kāi),我國(guó)新生兒數(shù)量明顯增加,母嬰市場(chǎng)的相關(guān)需求也隨之上漲。在人臉識(shí)別技術(shù)的準(zhǔn)確率能夠得到可靠保證的今天,利用該技術(shù)實(shí)現(xiàn)對(duì)嬰兒的實(shí)時(shí)監(jiān)控,當(dāng)嬰兒出現(xiàn)哭鬧等意外情況時(shí),能夠發(fā)出警報(bào)提醒不在旁邊的父母,便成為了一個(gè)值得嘗試的方案。
人臉表情識(shí)別是通過(guò)從給定的靜態(tài)圖像或動(dòng)態(tài)視頻序列中分離出特定的表情狀態(tài),從而判斷被識(shí)別對(duì)象心理狀態(tài)與當(dāng)前情緒的技術(shù)。人臉表情識(shí)別由人臉檢測(cè)、表情特征提取和表情特征分類(lèi)這幾類(lèi)關(guān)鍵技術(shù)組成。
2.1 人臉檢測(cè)
人臉圖像的獲取可以依靠取像設(shè)備,如筆記本、智能手機(jī)等自帶的攝像頭,或者是獨(dú)立的攝像設(shè)備等實(shí)時(shí)采集,經(jīng)過(guò)光照補(bǔ)償和幾何歸一化等進(jìn)行修正處理后,以靜態(tài)圖像或者動(dòng)態(tài)視頻序列的格式保存在圖像庫(kù)中。目前國(guó)內(nèi)外已經(jīng)有相當(dāng)豐富的專(zhuān)業(yè)人臉表情圖像庫(kù),但由于其背景較為單一,所以實(shí)際應(yīng)用的過(guò)程中難免會(huì)對(duì)訓(xùn)練模型產(chǎn)生影響,因此人臉檢測(cè)不斷發(fā)展,成為了一個(gè)獨(dú)立的研究方向。
2.2 表情特征提取
人臉表情的特征提取主要是通過(guò)數(shù)學(xué)方法,利用計(jì)算機(jī)技術(shù)對(duì)人臉表情的數(shù)字?jǐn)?shù)據(jù)進(jìn)行組織和處理,提取相應(yīng)特征,并進(jìn)行必要的降噪處理的方法。人臉表情的產(chǎn)生是一個(gè)相當(dāng)復(fù)雜的過(guò)程,拋開(kāi)心理因素,環(huán)境因素等,我們所要面對(duì)處理的就是面部的肌肉運(yùn)動(dòng)以及隨之改變的面部形體和紋理。表情特征提取算法可以根據(jù)表情發(fā)生時(shí)的狀態(tài)和處理對(duì)象,分為基于靜態(tài)圖像的特征提取方法和基于動(dòng)態(tài)圖像的特征提取方法兩類(lèi)。其中,靜態(tài)圖像反應(yīng)的是做出表情時(shí)單幅圖像的表情狀態(tài),而動(dòng)態(tài)視頻序列描述的是表情在多幅圖像之間的運(yùn)動(dòng)變化過(guò)程。基于靜態(tài)圖像的特征提取算法可以分為整體法和局部法,而基于動(dòng)態(tài)視頻序列的特征提取算法可分為光流法、模型法和幾何法等。
2.3 表情特征分類(lèi)
特征分類(lèi)的目的是判斷所提取出的表情特征對(duì)應(yīng)的表情類(lèi)別。在人臉表情識(shí)別技術(shù)中,表情分為基本表情和動(dòng)作單元兩部分?;颈砬橐话氵m用于所有的處理對(duì)象,而動(dòng)作單元主要適用于動(dòng)態(tài)視頻序列。根據(jù)特征分類(lèi)算法的時(shí)空特點(diǎn),特征分類(lèi)算法通常又可分為兩類(lèi):基于空間分析的方法和基于時(shí)空間結(jié)合的方法。其中,基于空間分析的方法主要包括近鄰法,基于專(zhuān)家規(guī)則的方法,神經(jīng)網(wǎng)絡(luò)算法、貝葉斯分類(lèi)算法、SVM算法等;而基于時(shí)空間結(jié)合的方法主要是隱馬爾可夫模型(Hidden Markov Model,HMM算法)。在上述方法中,貝葉斯分類(lèi)法,SVM算法,HMM算法是表情特征分類(lèi)中的主要算法。
OpenCV是一個(gè)基于BSD許可(開(kāi)源)發(fā)行的跨平臺(tái)計(jì)算機(jī)視覺(jué)庫(kù)。它輕量級(jí)且高效,同時(shí)提供了Python、MATLAB等語(yǔ)言的接口,實(shí)現(xiàn)了圖像處理和計(jì)算機(jī)視覺(jué)方面的很多通用算法。OpenCV使用C++語(yǔ)言編寫(xiě),它的主要接口也是C++語(yǔ)言,為數(shù)字圖像的處理、計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用提供了極大的方便。
OpenCV主體分為5個(gè)模塊:①CV模塊,主要包括圖像處理和視覺(jué)算法;②MLL模塊,主要包括統(tǒng)計(jì)分類(lèi)器;③HighGUI模塊,主要包括GUI、圖像和視頻輸入輸出;④CxCORE模塊,主要包括基本結(jié)構(gòu)和算法,XML支持、繪圖函數(shù);⑤CvAux模塊,主要包括一些馬上就要被淘汰的算法和函數(shù),同時(shí)還有一些新出現(xiàn)的算法和函數(shù)。
OpenCV的優(yōu)點(diǎn)主要體現(xiàn)在以下幾個(gè)方面:①跨平臺(tái),可移植性好。由于OpenCV是由中、高層的API構(gòu)成、所以其能夠很好的支持Windows、Linux、MacOSX等操作系統(tǒng);②運(yùn)行速度快。OpenCV通過(guò)使用優(yōu)化的C和C++代碼,大大提高了運(yùn)行速度;③源代碼公開(kāi);④獨(dú)立性好。OpenCV自帶多個(gè)函數(shù),不依賴(lài)于外部庫(kù),能夠獨(dú)立運(yùn)行,也能夠在運(yùn)行時(shí)使用其它的外部庫(kù)。
近年來(lái),我國(guó)實(shí)施“二胎政策”,使得年輕一代的父母生育二胎的比例增加,由于年輕一代父母雙方基本均有工作,這在無(wú)形中就加劇了他們的精力消耗。這一現(xiàn)狀不僅刺激了傳統(tǒng)的母嬰消費(fèi)品市場(chǎng)的需求,同時(shí)也使得諸如月嫂、保姆這一類(lèi)行業(yè)的需求明顯增加。利用人臉識(shí)別技術(shù),只需要一個(gè)便攜的取像設(shè)備,能夠?qū)崟r(shí)監(jiān)控嬰兒,在將嬰兒的各種表情錄入系統(tǒng)的表情識(shí)別庫(kù)后,通過(guò)識(shí)別出嬰兒表情的變化,使得當(dāng)父母不在嬰兒身邊,而嬰兒出現(xiàn)哭鬧等異常表情時(shí),及時(shí)的向父母發(fā)出警報(bào),從而降低嬰兒發(fā)生意外的概率,便有了較好的應(yīng)用前景。
隨著機(jī)器學(xué)習(xí)相關(guān)算法的不斷完善,人臉識(shí)別技術(shù)的準(zhǔn)確率和可靠性也得到了保證。在移動(dòng)互聯(lián)網(wǎng)新媒體盛行的今天,諸如各類(lèi)美顏相機(jī)等也都使用了人臉識(shí)別的相關(guān)技術(shù),這也充分體現(xiàn)了它在娛樂(lè)領(lǐng)域的應(yīng)用前景,相信隨著相關(guān)技術(shù)的不斷提高,其應(yīng)用前景會(huì)更加廣闊。
[1]蔣斌,賈克斌,楊國(guó)勝人臉表情識(shí)別的研究進(jìn)展[A]計(jì)算機(jī)科學(xué).2011.4:2,3
[2]秦曉文,溫志芳,喬維維基于OpenCV的圖像處理[A]電子測(cè)試.2011.7:2