蒙鑫+楊凡+崔羽
摘 要 伴隨網(wǎng)絡(luò)技術(shù)、多媒體技術(shù)以及信息數(shù)字化處理的高新技術(shù)的快速普及和發(fā)展,計(jì)算機(jī)所能處理的信息媒體范圍和處理速度都在不斷提高。圖像信息作為一種表現(xiàn)直觀、內(nèi)容豐富的媒體,在眾多的圖像編碼標(biāo)準(zhǔn)中,圖像處理在線識(shí)別標(biāo)準(zhǔn)和機(jī)器視覺在線識(shí)別標(biāo)準(zhǔn)在數(shù)字人眼識(shí)別領(lǐng)域得到了廣泛應(yīng)用。本文探討了這人眼識(shí)別算法,并指出這算法各自的優(yōu)勢(shì),通過設(shè)計(jì)實(shí)驗(yàn)對(duì)這算法進(jìn)行比較,為人眼識(shí)別領(lǐng)域的發(fā)展前景做出展望。
【關(guān)鍵詞】圖像 人眼識(shí)別 圖像處理 機(jī)器視覺
在數(shù)據(jù)大量流通的今天,在線識(shí)別所扮演的角色也日益重要。由于在線識(shí)別使數(shù)據(jù)量減少,進(jìn)而使數(shù)據(jù)傳輸時(shí)間降低,讓傳輸?shù)男矢鼮橹匾?。在傳輸帶寬有限,擴(kuò)充不易以及增加傳輸設(shè)備將提高成本的考慮下,在線識(shí)別提供了另外一種解決方法,為灰度人眼識(shí)別提供了參考。
1 國(guó)內(nèi)研究現(xiàn)狀
相對(duì)于其他特征,提取描述人眼美感的全局與局部幾何特征,幾何特征有其優(yōu)勢(shì),一是可以精確獨(dú)立。幾何特征是通過人眼特征點(diǎn)計(jì)算得到的,而人眼特征點(diǎn)則是描述人眼輪廓與五官形狀的重要的一系列點(diǎn)。二是魯棒性好。人眼特征點(diǎn)能在不同的光照情況下、臉被部分遮擋的情況下被檢測(cè)到。幾何特征可分為三種形式:特征點(diǎn)坐標(biāo)、特征點(diǎn)距離比例和特征點(diǎn)距離。
根據(jù)五官是否協(xié)調(diào)這個(gè)影響人眼眼睛水平的重要標(biāo)準(zhǔn),研究人員多從臉部比例幾何特征入手。臉部比例指的是臉部特征點(diǎn)距離之間的比例,其中最著名的是黃金分割法和三庭法;臉部特征點(diǎn)指的是臉部五官的位置坐標(biāo),如鼻尖,左眼中心、右眼中心、兩嘴角等。在基于幾何特征的人眼眼睛分析領(lǐng)域,不少研究者基于黃金比例、近古典規(guī)則及特征點(diǎn)距離等提出了影響人眼眼睛的多種不同的幾何特征。Tommer等人以特征點(diǎn)距離作為幾何特征;Hatice等人使用特征點(diǎn)距離與特征點(diǎn)距離比例作為幾何特征;Fu等人使用距離分量、比例分量和離散值分量作為影響人眼眼睛的幾何特征;Kendra等人使用特征矢量作為幾何特征;Eisenthal等人使用特征點(diǎn)距離、比例和五官的長(zhǎng)度與寬度作為幾何特征。Miriam等人使用歸一化的特征點(diǎn)坐標(biāo)作為人眼眼睛的幾何特征。
基于幾何特征的方法也存在不足的地方:對(duì)人眼圖像的研究不只是特征點(diǎn)距離比例與特征點(diǎn)距離的測(cè)量,還需做更細(xì)致的紋理研究,比如反映眼睛的皮膚的質(zhì)感、皮膚顏色的均勻過渡、肌肉的起伏,表情、臉部裝飾等。
2 對(duì)人眼識(shí)別的具體分類
從圖像處理的角度出發(fā),研究了圖像中的面部識(shí)別,人眼定位,人眼灰度狀態(tài)識(shí)別,基于已測(cè)人眼狀態(tài)進(jìn)行疲勞檢測(cè),對(duì)以下幾個(gè)方面進(jìn)行研究。
2.1 圖像中的面部識(shí)別
首先通過攝像頭獲取一幅帶人臉的圖像,對(duì)圖像進(jìn)行處理,利用中值濾波的方法對(duì)獲取的圖像去噪,在對(duì)濾波后的圖像灰度化,利用圖像網(wǎng)絡(luò)處理識(shí)別出人臉區(qū)域,圖像網(wǎng)絡(luò)處理識(shí)別人臉是一種常見的人臉識(shí)別方法是對(duì)人臉圖像中的一些像素值進(jìn)行分析得出圖像中人臉區(qū)域。
2.2 人眼灰度狀態(tài)識(shí)別
判斷一個(gè)人是否處于疲勞狀態(tài),計(jì)算檢測(cè)到的人眼的在橫向和縱向上的實(shí)際所占像素值,計(jì)算眼睛的縱橫比,這個(gè)比值對(duì)同一個(gè)人的睜眼或閉眼狀態(tài)來說是相對(duì)固定的。但不同的人在這個(gè)值上都有一個(gè)共同點(diǎn)即眼睛閉合時(shí)值偏小(小于0.3),由此做出的判斷適用于大多數(shù)的人。
2.3 疲勞的判斷
由于攝像頭獲取的圖像是一幀一幀獲取的,對(duì)獲取的圖像的所有幀進(jìn)行相同的處理之后,判斷眼睛的開閉狀態(tài)在所有的圖像之中所占的百分比,與在眼睛疲勞情況下眼睛開閉狀態(tài)的百分比進(jìn)行比較判斷是否處于疲勞狀態(tài)。
3 對(duì)灰度圖像的人眼識(shí)別
人眼的多姿態(tài)對(duì)人眼相似度計(jì)算具有一定的影響,兩張屬于同一個(gè)人的人眼圖像由于姿態(tài)的影響可能會(huì)被判斷為不同的人,因此本文采用人眼圖像對(duì)齊技術(shù)來提升人眼相似度計(jì)算性能。人眼圖像對(duì)齊采用的方法為先檢測(cè)人眼的特征點(diǎn),再根據(jù)人眼的特征點(diǎn)對(duì)圖像進(jìn)行仿射變化得到對(duì)齊后的人眼。人眼特征點(diǎn)檢測(cè)是人眼圖像處理領(lǐng)域中的一個(gè)重要研究方向,現(xiàn)有的人眼特征點(diǎn)檢測(cè)方法大致可以分為基于優(yōu)化的方法和基于回歸的方法。
基于優(yōu)化的方法主要有AAM和ASM方法,但是AAM和ASM只使用了人眼圖像的局部信息,并沒有考慮到人眼各個(gè)位置的相互關(guān)系,在人眼姿態(tài)與光照變化下效果不好。最近,人們提出了基于回歸的人眼對(duì)齊算法,利用條件隨機(jī)森林逐漸逼近人眼形狀的方法。本文采用的是基于集成回歸樹的人眼特征點(diǎn)檢測(cè)算法,檢測(cè)出的人眼進(jìn)行ERT人眼特征點(diǎn)檢測(cè)算法的結(jié)果圖,特征點(diǎn)一共包含83個(gè)坐標(biāo),坐標(biāo)位于臉頰、嘴巴、鼻子、眼睛、眉毛處。人眼關(guān)鍵點(diǎn)檢測(cè)需要事先檢測(cè)出人眼區(qū)域,人眼區(qū)域的檢測(cè)算法為Viola提出的算法。
4 結(jié)語
人眼的局部五官的特征會(huì)影響人眼相似性計(jì)算,本文使用了人眼圖像多區(qū)域特征提取技術(shù),提取多個(gè)人眼圖像區(qū)域的灰度圖像特征并串聯(lián)在一起,達(dá)到冗余的效果。人眼圖像區(qū)域分為局部區(qū)域與全局區(qū)域。所以,基于灰度圖像特征與人眼相似度檢索策略的眼睛分類性能,依賴于人眼相似度檢索數(shù)據(jù)庫中樣本的質(zhì)量,機(jī)器視覺在線圖像處理的在線識(shí)別級(jí)別為最大,調(diào)整機(jī)器視覺的參數(shù)使得人眼識(shí)別比例,得到技術(shù)的解在線識(shí)別圖像以及對(duì)應(yīng)的解在線識(shí)別性能參數(shù)。
參考文獻(xiàn)
[1]張兆禮等.現(xiàn)代圖像處理技術(shù)[M].北京:人民郵電出版樸,2001,12-132.
[2]鄭永果.圖像增強(qiáng)方法的研究與實(shí)現(xiàn)[D]. 碩士,山東科技大學(xué)計(jì)算機(jī)軟件與理論,2005.
[3]夏良正.數(shù)字圖象處理[M]南京:東南大學(xué)出版社,1999,05-124
[4]安曉東,陳靜.人眼識(shí)別方法綜述 [J].電腦開發(fā)與應(yīng)用,2006(12):132-137.
[5]吳達(dá)軍,李曄.幾種無損人眼識(shí)別方法的比較與研究[OL],2001.
[6]王升哲,馬義德.基于圖像處理和機(jī)器視覺的思考[OL].中國(guó)科技論文在線,2001-7.