• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一種基于LVQ神經(jīng)網(wǎng)絡(luò)模型的人臉檢測(cè)方法

      2021-07-14 01:30:22艷,祁
      液晶與顯示 2021年7期
      關(guān)鍵詞:膚色人臉神經(jīng)元

      王 艷,祁 萌

      (成都工業(yè)學(xué)院 電子工程學(xué)院,四川 成都 610031)

      1 引 言

      人臉檢測(cè)是指在一幅給定的圖像中,采用一定的方法找出所有人臉的位置、大小和姿態(tài)[1-2]。隨著電子商務(wù)和現(xiàn)代成像技術(shù)的快速發(fā)展,自動(dòng)人臉檢測(cè)技術(shù)已經(jīng)廣泛應(yīng)用到除人臉識(shí)別外的其他應(yīng)用領(lǐng)域,如面部表情分析、性別/年齡識(shí)別、圖像視頻搜索、人機(jī)交互系統(tǒng)、3D顯示等應(yīng)用領(lǐng)域。雖然人類可以非常容易地完成人臉檢測(cè)、面部表情識(shí)別等,但是基于人臉圖像分析的自動(dòng)人臉檢測(cè)技術(shù)卻是一項(xiàng)復(fù)雜且及具挑戰(zhàn)性的問題。自上世紀(jì)60年代人臉識(shí)別研究開始以來(lái),人臉檢測(cè)技術(shù)已發(fā)展了很長(zhǎng)一段時(shí)間,但是現(xiàn)有的檢測(cè)技術(shù)仍然面臨很多問題,具體原因在于:(1)成像環(huán)境復(fù)雜;(2)人臉表情、姿態(tài)的多變性;(3)人臉遮擋等。

      目前,國(guó)內(nèi)外針對(duì)人臉檢測(cè)的研究很多,常見的人臉檢測(cè)方法有特征分析法[3-7]、模板匹配法[8-10]、SVM模型[11]、AdaBoost算法[12]、深度學(xué)習(xí)[13]等?;谥R(shí)規(guī)則的特征分析法主要包括3種:人臉形狀輪廓、紋理以及膚色,其中膚色特征是人臉的顯著性特征之一,且實(shí)際應(yīng)用中采集圖像多為彩色圖像,因此基于膚色特征的人臉檢測(cè)應(yīng)用更為廣泛。

      機(jī)器學(xué)習(xí)作為一種特別適合涉及智慧問題的技術(shù),近年來(lái)被引入目標(biāo)檢測(cè)、圖像識(shí)別領(lǐng)域。神經(jīng)網(wǎng)絡(luò)作為機(jī)器學(xué)習(xí)的一個(gè)模型,已經(jīng)被廣泛地使用[14-19]。近年來(lái),隨著人工智能的快速發(fā)展,學(xué)習(xí)矢量量化(Learning Vector Quantization,LVQ)神經(jīng)網(wǎng)絡(luò)[20-23]逐漸受到廣大學(xué)者的青睞。LVQ神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單,只通過內(nèi)部單一的相互作用就可以完成十分復(fù)雜的分類處理,也很容易將設(shè)計(jì)域中的各種繁雜分散的設(shè)計(jì)條件收斂到結(jié)論上來(lái)。而且它不需要對(duì)輸入向量進(jìn)行歸一化、正交化處理,簡(jiǎn)單易行。因此,本文設(shè)計(jì)出一種膚色特征和LVQ神經(jīng)網(wǎng)絡(luò)相結(jié)合的人臉檢測(cè)算法。首先分析人臉膚色特征,設(shè)定可以定位膚色區(qū)域的閾值條件,然后以該約束條件作為收斂條件,構(gòu)建LVQ神經(jīng)網(wǎng)絡(luò)模型。然后選取100幅圖像作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,20幅圖像作為測(cè)試樣本。經(jīng)過訓(xùn)練,得到了有效的權(quán)值。利用訓(xùn)練后的神經(jīng)網(wǎng)將人臉從背景中分割出來(lái),定位出人臉部分,最后,對(duì)分割后的圖像進(jìn)行形態(tài)學(xué)處理。

      2 人臉膚色特征提取

      膚色特征是面部的基本特征,不依賴于人的面部表情、姿態(tài)等,且具有穩(wěn)定性,能夠區(qū)分于大多數(shù)背景物體的顏色,因此提取圖像的膚色特征作為人臉檢測(cè)的方法具有簡(jiǎn)單直觀的優(yōu)點(diǎn)。利用膚色信息進(jìn)行人臉檢測(cè)的方法是根據(jù)膚色在某個(gè)色彩空間的膚色分布來(lái)檢測(cè)人臉的,檢測(cè)的準(zhǔn)確率與顏色空間的選擇密切相關(guān)。圖1為膚色在不同顏色空間在的分布軌跡。從圖1可以看出,顏色空間不同,膚色的分布特性不同。

      圖1 膚色在不同顏色空間分布圖Fig.1 Distribution of skin color in different color spaces

      在選擇色彩空間時(shí),需要考慮膚色在某個(gè)色彩空間的聚類特性,且不受光照條件的影響?;谀w色的人臉檢測(cè)方法是通過確定每個(gè)顏色分量的閾值來(lái)分割出人臉部分的,所以在選擇顏色空間時(shí),需要考慮膚色在該空間的聚類特性。圖2為膚色在RGB、YCbCr以及HSV顏色空間中各顏色分量的分布情況。由圖2可知,RGB彩色空間中R、G、B分量關(guān)聯(lián)性太強(qiáng)且很難將膚色聚類,因而不適合用來(lái)作為人臉膚色特征。HSV顏色空間中,各顏色分類緊湊型不好。YCbCr空間模型的Cb、Cr分量相互獨(dú)立,膚色在該空間具有良好的聚類特性,且受亮度變化影響較少,因此本文選擇將Cb、Cr分量作為人臉膚色特征進(jìn)行人臉檢測(cè)。

      雖然YCbCr色彩空間具有良好的聚類特性,但膚色分布區(qū)間較大,會(huì)受到非膚色區(qū)域的干擾,且該色彩空間并非對(duì)所有彩色圖像都適合,因而考慮融合多種顏色空間,提取相應(yīng)的顏色分量作為人臉膚色特征。

      (a)膚色在RGB空間中的分布情況(a)Distribution of skin in RGB

      HSI色彩空間模型是從人的視覺系統(tǒng)出發(fā),直接使用顏色三要素色調(diào)、飽和度和亮度來(lái)描述顏色。亮度是指人眼感覺光的明暗程度。色調(diào)和飽和度統(tǒng)稱色度,用來(lái)表示顏色的類別和深淺程度。由于人眼對(duì)亮度的敏感程度遠(yuǎn)強(qiáng)于對(duì)顏色濃淡的敏感程度,HSI色彩空間更符合人的視覺特性。另外,HSI空間中亮度和色度具有可分離性,更適合于圖像處理和機(jī)器視覺中的算法處理。膚色在HSI空間中的顏色聚類情況如圖3所示。H分量和S分量相互分離,且明顯分布在特定區(qū)域內(nèi),具有良好的聚類特性。

      圖3 膚色在HSI空間的聚類特性Fig.3 Clustering characteristics of skin in HSI space

      綜上分析,選定Cb、Cr、H、S作為描述人臉信息的特征,將人臉區(qū)域從背景區(qū)域分離出來(lái)。

      3 基于LVQ神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)算法

      基于LVQ神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)算法如圖4所示,具體實(shí)現(xiàn)步驟為:

      圖4 基于LVQ神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)算法Fig.4 Face detection algorithm based on LVQ neural network

      (1)通過攝像系統(tǒng)采集人臉圖像;

      (2)將圖像轉(zhuǎn)換到Y(jié)CbCr及HSI顏色空間,提取Cb、Cr、H、S顏色分量;

      (3)以90≤Cb≤130,130≤Cr≤170,0.05

      (4)創(chuàng)建LVQ網(wǎng)絡(luò),將訓(xùn)練集數(shù)據(jù)送到網(wǎng)絡(luò)對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,直到迭代中止;

      (5)網(wǎng)絡(luò)訓(xùn)練收斂后,對(duì)測(cè)試集數(shù)據(jù)進(jìn)行預(yù)測(cè),即對(duì)測(cè)試集的數(shù)據(jù)進(jìn)行測(cè)試;

      (6)根據(jù)三庭五眼規(guī)則最終定位出人臉區(qū)域。

      3.1 LVQ神經(jīng)網(wǎng)絡(luò)模型

      LVQ神經(jīng)網(wǎng)絡(luò)是從Kohonen算法演變而來(lái)的一種輸入前向神經(jīng)網(wǎng)絡(luò),屬于有監(jiān)督學(xué)習(xí)方法。LVQ神經(jīng)網(wǎng)絡(luò)由輸入層、競(jìng)爭(zhēng)層和輸出層3層神經(jīng)元組成。輸入層與競(jìng)爭(zhēng)層采用全連接的方式,競(jìng)爭(zhēng)層與輸出層采用部分連接的方式,競(jìng)爭(zhēng)層神經(jīng)元個(gè)數(shù)總是大于輸出層神經(jīng)元個(gè)數(shù),每個(gè)競(jìng)爭(zhēng)層神經(jīng)元只與一個(gè)輸出層神經(jīng)元相連接。通過網(wǎng)絡(luò)訓(xùn)練,輸入層和競(jìng)爭(zhēng)層之間的權(quán)值會(huì)發(fā)生改變并逐漸聚類。競(jìng)爭(zhēng)層的神經(jīng)元通過競(jìng)爭(zhēng),勝者的神經(jīng)元被激活為1,而其他神經(jīng)元為0,與激活神經(jīng)元相連接的輸出層神經(jīng)元狀態(tài)也調(diào)整為1,而與未激活神經(jīng)元相連接的輸出神經(jīng)元狀態(tài)為0,從而給當(dāng)前樣本進(jìn)行分類。

      基于膚色信息特征的人臉檢測(cè)方法是基于圖像像素分類的一種檢測(cè)方法,根據(jù)膚色信息在各顏色空間中的聚類特性發(fā)現(xiàn),采用LVQ神經(jīng)網(wǎng)絡(luò)對(duì)像素進(jìn)行分類是非常適用的。根據(jù)前述分析,選用Cb、Cr、H、S用來(lái)描述人臉特征,作為L(zhǎng)VQ神經(jīng)網(wǎng)絡(luò)的輸入,輸出則分為2類,人臉像素和非人臉像素。

      3.2 LVQ神經(jīng)網(wǎng)絡(luò)訓(xùn)練

      圖5為用于人臉檢測(cè)的LVQ神經(jīng)網(wǎng)絡(luò)模型。LVQ神經(jīng)網(wǎng)絡(luò)通過自主學(xué)習(xí)來(lái)完成對(duì)輸入向量的分類,在完成模型構(gòu)建后,需要對(duì)模型進(jìn)行不斷訓(xùn)練。具體實(shí)現(xiàn)步驟如下:

      圖5 基于LVQ神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)模型Fig.5 Face detection model based on LVQ neural network

      (1)訓(xùn)練集/測(cè)試集產(chǎn)生

      選取100幅圖像作為訓(xùn)練圖像,20幅圖像作為測(cè)試圖像,分別構(gòu)造訓(xùn)練集和測(cè)試集。圖像大小為250×250像素,每張圖像按類存儲(chǔ)為1個(gè)62 500的行向量,這樣訓(xùn)練集有100×62 500個(gè)樣本,測(cè)試集有20×62 500個(gè)樣本。

      (2)創(chuàng)建LVQ網(wǎng)絡(luò)

      利用newlvq()函數(shù)創(chuàng)建LVQ神經(jīng)網(wǎng)絡(luò),輸入向量為Xi=[CbCrHS],i=1,2,3,…,400 000;競(jìng)爭(zhēng)層神經(jīng)元的個(gè)數(shù)設(shè)為20,學(xué)習(xí)速率為0.01。由于訓(xùn)練集是隨機(jī)產(chǎn)生的,所以參數(shù)PC值需要計(jì)算,計(jì)算方式為人臉像素占整個(gè)圖像像素的比例。

      (3)訓(xùn)練LVQ網(wǎng)絡(luò)

      (a)將輸入向量X=[CbCrHS]T送到輸入層,計(jì)算競(jìng)爭(zhēng)層神經(jīng)元與輸入向量的距離;

      (b)與輸入向量距離最小的神經(jīng)元為獲勝神經(jīng)元;

      (c)根據(jù)分類結(jié)果是否準(zhǔn)確,調(diào)整獲勝神經(jīng)元的權(quán)值;

      (d)訓(xùn)練次數(shù)達(dá)到設(shè)定值,返回步驟(a)進(jìn)行新的樣本訓(xùn)練,直到訓(xùn)練結(jié)束。

      4 實(shí)驗(yàn)與分析

      4.1 實(shí)驗(yàn)效果

      基于本文提出的算法,搭建實(shí)驗(yàn)平臺(tái)進(jìn)行性能測(cè)試。采用Intel Core i5,3 GHz CPU,3G內(nèi)存計(jì)算機(jī),配合Win7、Matlab作為實(shí)驗(yàn)平臺(tái)。圖像數(shù)據(jù)采用LFW人臉數(shù)據(jù)。LFW人臉數(shù)據(jù)集是目前做人臉檢測(cè)與識(shí)別常用的數(shù)據(jù)集,圖像均來(lái)自于真實(shí)場(chǎng)景,共有5 749人的13 233張人臉圖像,圖像大小為250×250。

      實(shí)驗(yàn)過程為:隨機(jī)從圖像數(shù)據(jù)集中選取100幅圖片作為訓(xùn)練樣本,20幅圖像作為測(cè)試樣本。將圖像轉(zhuǎn)換到Y(jié)CbCr和HSI顏色空間,提取圖像的Cb、Cr、H、S顏色分量,分別構(gòu)造100×4大小的訓(xùn)練數(shù)據(jù)集和20×4的測(cè)試數(shù)據(jù)集,用作LVQ神經(jīng)網(wǎng)絡(luò)的輸入,輸出為0和1,分別表示非人臉像素和人臉像素。LVQ神經(jīng)網(wǎng)絡(luò)模型迭代次數(shù)為150次,誤差為0.001。

      訓(xùn)練完成后得到了有效的權(quán)值,利用訓(xùn)練后的LVQ網(wǎng)絡(luò)對(duì)人臉進(jìn)行檢測(cè),實(shí)驗(yàn)結(jié)果如圖6所示。圖6(a)為待進(jìn)行人臉檢測(cè)的原始圖像,經(jīng)過LVQ神經(jīng)網(wǎng)絡(luò)模型分類后,可以有效地將膚色區(qū)域和非膚色區(qū)域區(qū)分開,如圖6(b)所示。由于分類方法采用的是基于膚色信息進(jìn)行分類,經(jīng)過LVQ網(wǎng)絡(luò)模型分類后的圖像仍然存在非人臉區(qū)域,因此需要運(yùn)用輔助方法進(jìn)行精確人臉定位。觀察圖6(b)人臉區(qū)域發(fā)現(xiàn),人眼部分非常明顯地區(qū)分于其他部位,因此可以考慮用三庭五眼法精確定位出人臉區(qū)域,得到如圖6(c)的實(shí)驗(yàn)效果。

      圖6 LVQ模型人臉檢測(cè)結(jié)果Fig.6 Results of face detect based on LVQ

      4.2 對(duì)比實(shí)驗(yàn)

      為進(jìn)一步驗(yàn)證本文算法的適用性,選取了LFW、丹麥藝術(shù)大學(xué)人臉庫(kù)(AFW)和加州理工大學(xué)人臉庫(kù)(Faces)數(shù)據(jù)集進(jìn)行性能測(cè)試,并將本方法與文獻(xiàn)[6]和文獻(xiàn)[7]分別在上述3個(gè)數(shù)據(jù)集上進(jìn)行了測(cè)試,測(cè)試結(jié)果如表1所示。

      從表1可以看出,本文算法在LFW、AFW和Faces3個(gè)數(shù)據(jù)集的正檢率分別為76.82%,84.42%,100%,誤檢率分別為17.34%,12.34%,0,漏檢率分別為21.55%,15.63%,0。實(shí)驗(yàn)結(jié)果表明,本文算法在Faces數(shù)據(jù)集上的正檢率最高,誤檢率和漏檢率最低,檢測(cè)效果均優(yōu)于AFW數(shù)據(jù)集和LFW數(shù)據(jù)集。這是因?yàn)椋篎aces數(shù)據(jù)集中的人臉圖像全部為單人臉圖像;AFW數(shù)據(jù)集既有單人圖像,又有多人圖像,且圖像背景較為簡(jiǎn)單;LFW數(shù)據(jù)集則是一個(gè)無(wú)約束的數(shù)據(jù)集,人臉數(shù)多且存在多人重疊、遮擋、受光照環(huán)境、人臉朝向及拍攝距離等復(fù)雜背景的影響。本文算法在檢測(cè)人臉時(shí),主要依據(jù)的是顏色特征和三庭五眼法將人臉區(qū)域識(shí)別出來(lái),若被檢測(cè)圖片中存在人臉遮擋、小尺度人臉的情況,由于利用膚色特征分割出來(lái)的人臉區(qū)域難以滿足三庭五眼的比例,則會(huì)導(dǎo)致檢測(cè)結(jié)果與實(shí)際情況出現(xiàn)偏差。

      表1 性能對(duì)比測(cè)試結(jié)果Tab.1 Comparison result ofperformance test (%)

      與文獻(xiàn)[6]和文獻(xiàn)[7]中相比,本文算法在三個(gè)數(shù)據(jù)集上的測(cè)試效果均表現(xiàn)出了較好的優(yōu)越性,正檢率提高了至少7%,漏檢率降低了10%以上,誤檢率降低了近2倍。在Face測(cè)試集上的效果尤其好,正檢率達(dá)到了100%,誤檢率和漏檢率為0。實(shí)驗(yàn)結(jié)果表明:本文提出的基于LVQ神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)模型具有一定的優(yōu)越性。

      考慮到紋理以及邊緣均是可以作為將人臉區(qū)分于背景區(qū)域的特征,本文分別提取了紋理特征、邊緣特征以及紋理特征、邊緣特征相結(jié)合,作為L(zhǎng)VQ神經(jīng)網(wǎng)絡(luò)的輸入,用于人臉檢測(cè)的性能測(cè)試,實(shí)驗(yàn)結(jié)果如表2所示。從表2可以看出,相較于膚色特征而言,利用紋理特征以及邊緣特征進(jìn)行人臉檢測(cè)在性能上并沒有實(shí)質(zhì)意義上的提高。人臉的表情具有復(fù)雜多變的特點(diǎn),同一個(gè)人會(huì)有不同的表情變化,從而引起面部輪廓特征和紋理特征發(fā)生變化,很難用統(tǒng)一的標(biāo)準(zhǔn)來(lái)精確進(jìn)行人臉分割。而膚色特征不依賴于人的面部表情、姿態(tài)等,具有穩(wěn)定性和良好的聚類性,便于神經(jīng)網(wǎng)絡(luò)訓(xùn)練和分類。綜上所述,本文所提出的采用膚色作為特征,利用LVQ神經(jīng)網(wǎng)絡(luò)對(duì)人臉進(jìn)行檢測(cè)的方法具有良好的魯棒性。

      表2 多特征對(duì)比測(cè)試結(jié)果Tab.2 Comparison test result of multi-feature (%)

      5 結(jié) 論

      人臉檢測(cè)技術(shù)作為人與計(jì)算機(jī)、機(jī)器人等各種交互系統(tǒng)的前置技術(shù),廣泛應(yīng)用于圖像搜索、智能監(jiān)控、公安偵查等各個(gè)領(lǐng)域中。基于人臉膚色特征的穩(wěn)定性和可靠性,利用LVQ神經(jīng)網(wǎng)絡(luò)模型穩(wěn)定的分類識(shí)別能力,本文構(gòu)造了一種結(jié)合膚色特征的LVQ神經(jīng)網(wǎng)絡(luò)模型用于人臉檢測(cè)。經(jīng)過實(shí)驗(yàn)測(cè)試表明,本文的方法能夠在一定程度上提高人臉檢測(cè)的性能,與其他算法在相同數(shù)據(jù)集上進(jìn)行了對(duì)比測(cè)試,顯示了良好的優(yōu)越性。

      但是人臉檢測(cè)是一項(xiàng)復(fù)雜的系統(tǒng)工程,本文算法沒有考慮重疊人臉、多尺度人臉以及遮擋人臉等復(fù)雜應(yīng)用場(chǎng)景,因而存在漏檢率和誤檢測(cè)率較高的問題。尋找具有特征不變性和尺度不變性的多特征融合的人臉檢測(cè)方法以提高檢測(cè)的實(shí)時(shí)性和準(zhǔn)確性是下一步的研究方向。

      猜你喜歡
      膚色人臉神經(jīng)元
      《從光子到神經(jīng)元》書評(píng)
      自然雜志(2021年6期)2021-12-23 08:24:46
      有特點(diǎn)的人臉
      Conversation in a house
      人的膚色為什么不同
      三國(guó)漫——人臉解鎖
      躍動(dòng)的神經(jīng)元——波蘭Brain Embassy聯(lián)合辦公
      基于二次型單神經(jīng)元PID的MPPT控制
      毫米波導(dǎo)引頭預(yù)定回路改進(jìn)單神經(jīng)元控制
      馬面部與人臉相似度驚人
      長(zhǎng)得象人臉的十種動(dòng)物
      奇聞怪事(2014年5期)2014-05-13 21:43:01
      湖口县| 五大连池市| 临颍县| 淅川县| 永康市| 五大连池市| 普安县| 鄂伦春自治旗| 南城县| 和硕县| 新和县| 锡林郭勒盟| 噶尔县| 文水县| 上虞市| 建始县| 沂水县| 山东省| 昭通市| 图木舒克市| 玉山县| 靖州| 永安市| 尖扎县| 资源县| 阳春市| 民勤县| 和田市| 泾阳县| 阿图什市| 岐山县| 吴川市| 苍山县| 彰化县| 遵义市| 会昌县| 师宗县| 青州市| 阳山县| 开封市| 保定市|