孟 強 朱亞俐 薛 友 孫豐亮
(新疆大學,新疆 烏魯木齊 830002)
在科技日益發(fā)達的今天,萬事萬物都趨于智能化,在信息領(lǐng)域,對人臉的檢測和識別正在迅速的發(fā)展,因為人口的數(shù)量十分巨大,對于一些地方進行基本的信息匹配來利用人臉識別進行信息的對應就顯得尤為重要。不僅高效,還具備一定的準確、科學性。
人臉的特征有鼻梁、下巴、嘴唇和人臉的邊緣等,而在這些特征中人臉邊緣部分是其中一個重要的特征。為了準確的確定是人臉,減少信息的處理并且還能保留原圖的信息,需要把人臉邊緣信息作為提取目標。但是圖像的邊緣部分是亮度變化最明顯的部分,并且它是一個階躍函數(shù),也就是說,要從一個非常小的灰度值緩沖區(qū)到灰度值大的灰度值,所以,作為人臉檢測的重要環(huán)節(jié)之一的邊緣檢測的研究就具有重要的意義。
近年來數(shù)學的形態(tài)學方法在圖像分析中起到越來越重要的作用,他的基本思想是利用一定的形態(tài)學的結(jié)構(gòu)元素去度量、提取圖像對應的形狀,以達到對圖像分析和識別的效果。形態(tài)學運算是物體形態(tài)集合與元素時間的相互作用,它雖然對于邊緣不敏感,但是它在很大的程度上可以很好地抑制噪聲,探測到真正的邊緣。傳統(tǒng)的數(shù)學形態(tài)學只有一個基本的結(jié)構(gòu)元素,這樣只能得到一種類型的邊緣,而實際的圖像是多樣性的,由于結(jié)構(gòu)元素的選取對于邊緣檢測具有重要的意義,所以現(xiàn)在有基于傳統(tǒng)的數(shù)學形態(tài)學的一個結(jié)構(gòu)元素提升到兩個結(jié)構(gòu)元素,這樣改進的算法具有良好的抗噪性能,而且提取的邊緣比較光滑。
而邊緣檢測的算法研究的方向就比形態(tài)學要寬廣許多,因為就目前的研究可以知道,當前較為成熟的邊緣檢測算子包括:Roberts算子、canny算子、Sobel算子、Laplacian算子、Prewitt算子等,這些算子都有其優(yōu)缺點。比如Sobel算子:對灰度漸變和噪聲處理得比較好,但是對邊緣定位不是很準確;Canny算子不易受噪聲的影響,但是必須利用兩個不同的閾值將強邊緣和弱邊緣檢測出來,并且將其重疊起來才能體現(xiàn)弱邊緣;Laplacian算子能對任何方向的線條進行銳化,無方向性,但是它對于噪聲比較敏感?;趥鹘y(tǒng)的經(jīng)典算法,大多數(shù)算法都有所改進,例如Roberts算子:用3*3的領(lǐng)域代替2*2的領(lǐng)域來計算梯度的幅度值,利用圖像塊之間相似性的三維塊匹配的去噪聲模型。
本次課題是基于邊緣檢測和形態(tài)學的人臉檢測算法的研究,其中邊緣檢測是圖像處理和計算機視覺中的基本問題,邊緣檢測的目的就是識別數(shù)字圖像中亮度變化明顯的點。而圖像中往往就是這些顯著變化的點才是反應屬性的重要事件和變化,表現(xiàn)出來往往就是輪廓。在現(xiàn)實世界的圖像采集中,包括下面這四種情況:深度上的不連續(xù)、表面上的不連續(xù)、物質(zhì)屬性上的不連續(xù)、場景照明變化。
為了更好地適應不同場景下的人臉檢測,必須要選擇較好的邊緣檢測的算子,因為只有檢測效果較好的算子才能應對復雜背景下的人臉,進而能夠?qū)⑷巳四樀妮喞诒尘跋伦R別出來。在本次的課題中,我將就其中一種經(jīng)典算子進行深入地了解和學習。
因為此次的科研實踐要對具體的算法進行研究,所以目前只對于傳統(tǒng)的幾個經(jīng)典算子進行了了解,其中在幾個經(jīng)典的算子中,我對表現(xiàn)較強的Roberts算子進行了深入的剖析:Robert算子是一種一階微分算子,而且Robert算子是第一個邊緣檢測算子,由Lawrence Roberts在1963提出。Roberts算子是利用局部差分算子尋找邊緣的算子,它采用他采用對角線方向相鄰兩像素之差近似梯度幅值檢測邊緣。檢測垂直邊緣的效果好于斜向邊緣,定位精度高,對噪聲敏感,無法抑制噪聲的影響。針對它無法抑制噪聲,所以需要配合數(shù)學的形態(tài)學運算,將噪聲盡可能地濾除。
Prewitt算子是一種一階微分算子的邊緣檢測,利用像素點上下、左右鄰點的灰度差,在邊緣處達到極值檢測邊緣,去掉部分偽邊緣,對噪聲具有平滑作用。其原理是在圖像空間利用兩個方向模板與圖像進行鄰域卷積來完成的,這兩個方向模板一個檢測水平邊緣,一個檢測垂直邊緣。
Laplacian算子是n維歐幾里德空間中的一個二階微分算子,定義為梯度grad的散度div??墒褂眠\算模板來運算這定理定律。
函數(shù)的拉普拉斯算子也是該函數(shù)的黑塞矩陣的跡,可以證明,它具有各向同性,即與坐標軸方向無關(guān),坐標軸旋轉(zhuǎn)后梯度結(jié)果不變。如果鄰域系統(tǒng)是4鄰域,Laplacian算子的模板為:
結(jié)果如下:
本次的科實踐中,我的課題是:基于邊緣檢測和形態(tài)學的人臉檢測算法的研究,于是我對一些經(jīng)典的算法進行了學習和研究。
首先我在開頭先進行了我這個課題的研究背景及意義,介紹了邊緣檢測算法的研究現(xiàn)狀,并且對于Roberts算子、Prewitt算子、Sobel算子、Canny算子、Laplacian算子進行了優(yōu)缺點的比較,并且對于他們的邊緣檢測效果和對于噪聲的濾除效果有了一定的認識。
在第三章的地方我對這些經(jīng)典的算法進行了相關(guān)原理的認識,了解它們的算子的原理以及構(gòu)成,并且用Matlab內(nèi)部自帶的edge函數(shù)實現(xiàn)經(jīng)典的邊緣檢測,將其與獨立的算子的效果進行對比,通過人臉的檢測效果進行對比,經(jīng)過對比發(fā)現(xiàn):如果不考慮程序的復雜程度時,Canny算子的檢測效果最好。
經(jīng)過這一次的科研實踐的開展,讓我對圖像處理中使用的邊緣檢測和形態(tài)學的知識有了進一步的了解,尤其是進行初步的人臉檢測代碼的編寫時,遇到了很大的問題,雖然功能簡單,但是結(jié)果出來時,還是讓我有很大的自豪感,在接下來,我會繼續(xù)對人臉檢測進行研究。