摘 要:公共安全已成為人們最為關(guān)注的社會(huì)問(wèn)題之一,現(xiàn)在的公共場(chǎng)所都設(shè)立了很多監(jiān)控?cái)z像頭,視頻監(jiān)控在公共安全中起到了重要的作用。行人再識(shí)別技術(shù)是實(shí)現(xiàn)智能監(jiān)控的關(guān)鍵步驟。本文采用核典型相關(guān)分析(KCCA)算法,使用Visual Studio開(kāi)發(fā)平臺(tái)設(shè)計(jì)并實(shí)現(xiàn)了基于KCCA的行人再識(shí)別系統(tǒng)。
關(guān)鍵詞:核典型相關(guān)分析;行人再識(shí)別;系統(tǒng)實(shí)現(xiàn)
引言
隨著人們對(duì)社會(huì)安全的日益關(guān)注以及科學(xué)技術(shù)的快速發(fā)展,在城市商城、學(xué)校、醫(yī)院、汽車(chē)站等公共場(chǎng)所攝像機(jī)數(shù)量不斷擴(kuò)張,大量出現(xiàn)的監(jiān)控?cái)z像頭給人們的生活帶來(lái)了極大的便利。雖然視頻監(jiān)控?cái)z像頭的數(shù)量龐大,但是各個(gè)監(jiān)控?cái)z像頭之間缺乏互聯(lián),而且大部分?jǐn)z像頭都是設(shè)立在非重疊的區(qū)域。如果僅僅是依靠人工來(lái)完成數(shù)據(jù)分析,將耗費(fèi)巨大的人力物力資源,數(shù)據(jù)分析的結(jié)果還不一定正確。因此,一個(gè)能夠從不同的,非重疊的攝像頭中捕獲到的行人圖片的大數(shù)據(jù)集中進(jìn)行查找并分析的系統(tǒng)對(duì)于一個(gè)監(jiān)控?cái)z像頭網(wǎng)絡(luò)來(lái)說(shuō)會(huì)是非常有用的工具。行人再識(shí)別是指借助于計(jì)算機(jī)視覺(jué)方法,通過(guò)視覺(jué)對(duì)比的方式將視場(chǎng)不重疊的多個(gè)攝像機(jī)所拍攝到的屬于同一個(gè)行人的圖像或者視頻片段關(guān)聯(lián)起來(lái)的技術(shù)。本文的目的就是設(shè)計(jì)一個(gè)行人再識(shí)別監(jiān)控系統(tǒng),來(lái)克服單調(diào)的手動(dòng)篩選行人圖片的困難,實(shí)現(xiàn)智能監(jiān)控。
1 基于KCCA的行人再識(shí)別
基于KCCA的行人再識(shí)別方法由三個(gè)步驟組成。首先提取圖像特征描述子,然后使用核函數(shù)將特征描述子映射到高維空間,最后在高維空間進(jìn)行CCA運(yùn)算并計(jì)算余弦距離,再把余弦距離排序?qū)崿F(xiàn)行人再識(shí)別。
1.1 特征描述子的提取
給出一張目標(biāo)的圖片,將圖片修改為標(biāo)準(zhǔn)尺寸,即64×128像素。然后將圖片在豎直方向上均分為水平條紋,每一條條紋高度為16像素,即將圖片均分成了8條水平條紋。從每條條紋中提取HS直方圖、RGB直方圖、Lab直方圖、HOG直方圖和LBP直方圖描述子[1]。每個(gè)顏色直方圖連接起來(lái)形成了描述子的第一部分。在這個(gè)描述子之后,先添加HOG描述子,將梯度方向量化為4個(gè)小區(qū)間,然后再將LBP描述子添加到后面,得到最終需要的描述子。
1.2 核表示法
使用卡方核函數(shù)將提取的描述子映射到高維特征空間,具體實(shí)現(xiàn)表示為公式(1-1),
其中C為所有測(cè)試實(shí)例的卡方距離的中值。
1.3 使用KCCA算法識(shí)別行人
在測(cè)試時(shí),將probe實(shí)例映射成α向量,將gallery實(shí)例映射成β向量,可表示為等式(1-2)和等式(1-3),
然后計(jì)算gallery和probe的映射描述子之間的余弦距離,并且執(zhí)行一個(gè)最簡(jiǎn)單的最近鄰分類(lèi),如公式(1-4)所示,
其中i代表確認(rèn)的第i個(gè)gallery實(shí)例。
然后將所得到的距離向量進(jìn)行排序,選出距離小的前10個(gè)作為識(shí)別結(jié)果。
2 系統(tǒng)設(shè)計(jì)與測(cè)試
2.1 實(shí)驗(yàn)數(shù)據(jù)集
VIPeR數(shù)據(jù)集[2]由632對(duì)戶(hù)外捕獲的行人圖像組成,這632對(duì)圖像是在不同的光照條件下,分別由兩個(gè)不同并且非重疊的攝像機(jī)A和攝像機(jī)B在不同的角度下拍攝的。我們將632對(duì)圖像隨機(jī)分成兩組,每組包含316對(duì)圖像,一組用來(lái)作為訓(xùn)練集,而另一組用來(lái)作為測(cè)試集。從probe圖像集中選擇一張單獨(dú)的圖像,在所有的gallery圖像集中選擇并匹配probe圖像。
2.2 行人再識(shí)別測(cè)試系統(tǒng)
本文設(shè)計(jì)的行人再識(shí)別系統(tǒng)是在Visual Studio 2010 + MATLAB 2012b ( 32 bit ) + OPENCV 3.0的環(huán)境下實(shí)現(xiàn)的,系統(tǒng)是在Visual Studio 2010 中設(shè)計(jì)的,利用MFC來(lái)搭界面,將MATLAB與C++進(jìn)行混合編程實(shí)現(xiàn)對(duì)數(shù)據(jù)運(yùn)算的處理,OPENCV 3.0主要用于對(duì)圖片的處理。
該系統(tǒng)主要實(shí)現(xiàn)的功能是在VIPeR數(shù)據(jù)集中,當(dāng)從攝像機(jī)A中的圖像集中選擇一張圖像作為probe圖像時(shí),能夠從攝像機(jī)B中的圖像集中匹配出識(shí)別率前十的圖像作為gallery圖像。
運(yùn)行程序時(shí),“匹配系統(tǒng)”按鈕為灰色,只有當(dāng)點(diǎn)擊了KCCA運(yùn)算按鈕,并且KCCA運(yùn)算完成之后才能進(jìn)行后續(xù)的操作,運(yùn)算的具體過(guò)程將顯示在右邊提示框中,同時(shí)會(huì)顯示運(yùn)算進(jìn)行的時(shí)間。
圖像匹配系統(tǒng)界面,首先需要通過(guò)點(diǎn)擊“列出Probe圖片集”和“列出Gallery圖片集”按鈕將VIPeR數(shù)據(jù)集中的Probe圖像集和Gallery圖像集,也就是攝像機(jī)A和攝像機(jī)B中的圖像,列在圖像框中,然后使用鼠標(biāo)在Probe圖像集中單擊某張圖像,表示選擇這張圖像作為Probe圖像,然后點(diǎn)擊“圖像匹配”按鈕,系統(tǒng)將會(huì)匹配出識(shí)別率前十的圖像并顯示在Gallery圖像列表中。對(duì)于絕大多數(shù)的Probe圖像,都能在識(shí)別率前十的Gallery圖像中找到與之正確匹配的圖像。
3 結(jié)語(yǔ)
行人再識(shí)別是當(dāng)前計(jì)算機(jī)視覺(jué)領(lǐng)域的研究熱點(diǎn),本文利用KCCA算法來(lái)實(shí)現(xiàn)行人的再識(shí)別,使用Visual Studio開(kāi)發(fā)平臺(tái)實(shí)現(xiàn)了基于KCCA的行人再識(shí)別系統(tǒng)。結(jié)果表明系統(tǒng)能夠?qū)崿F(xiàn)行人再識(shí)別,并且識(shí)別率較高。
參考文獻(xiàn):
[1] G. Lisanti, I. Masi, A. D. Bagdanov, and A. Del Bimbo, “Person Re-identification by Iterative Re-weighted Sparse Ranking”[J], IEEE Transactions on Pattern Analysis and Machine Intelligence 2014.
[2] VIPeR: Viewpoint Invariant Pedestrian Recognition | Computer Vision Lab. ?https://vision.soe.ucsc.edu/node/178.
作者簡(jiǎn)介:
耿家國(guó)(1965.4—), 男,漢族,大專(zhuān),工程師。