摘 要 行人重識(shí)別是指利用計(jì)算機(jī)視覺技術(shù)判斷圖像或者視頻序列中是否存在特定行人的技術(shù)。隨著生成對(duì)抗網(wǎng)絡(luò)的發(fā)展,行人重識(shí)別技術(shù)也得到了突破。本文根據(jù)生成對(duì)抗網(wǎng)絡(luò)對(duì)數(shù)據(jù)集擴(kuò)充的角度,對(duì)現(xiàn)有行人重識(shí)別文獻(xiàn)進(jìn)行詳細(xì)的總結(jié)和分析。
關(guān)鍵詞 行人重識(shí)別;深度學(xué)習(xí);生成對(duì)抗網(wǎng)絡(luò);計(jì)算機(jī)視覺
行人重新識(shí)別是指給定目標(biāo)行人圖像,從其他的攝像機(jī)捕獲的圖像中重新識(shí)別目標(biāo)行人的過程。行人重識(shí)別可以彌補(bǔ)當(dāng)前固定攝像機(jī)的視覺限制,可以與行人檢測(cè)、姿態(tài)估計(jì)方向相互配合,用于視頻監(jiān)控、智能安全等領(lǐng)域。
生成對(duì)抗網(wǎng)絡(luò)[1]在近幾年得到了蓬勃的發(fā)展,其中一個(gè)重要應(yīng)用就是圖片生成。深度學(xué)習(xí)方法需要依賴大量訓(xùn)練數(shù)據(jù),目前行人重識(shí)別的數(shù)據(jù)集總體來說規(guī)模還是比較小。為此生成對(duì)抗網(wǎng)絡(luò)在重識(shí)別系統(tǒng)[2]中得到廣泛應(yīng)用,接下來將從擴(kuò)大標(biāo)簽圖片方面總結(jié)行人重識(shí)別的發(fā)展趨勢(shì)。
1DG-net網(wǎng)絡(luò)行人重識(shí)別算法
基于生成對(duì)抗網(wǎng)絡(luò)的行人重識(shí)別系統(tǒng)中,絕大部分將數(shù)據(jù)生成模塊與重識(shí)別模塊相分開。先依靠生成對(duì)抗網(wǎng)絡(luò)擴(kuò)充數(shù)據(jù)集,然后依靠重識(shí)別系統(tǒng)返回目標(biāo)行人的圖片。DG-net網(wǎng)絡(luò)將數(shù)據(jù)生成和重識(shí)別統(tǒng)一到同一個(gè)框架中,實(shí)現(xiàn)端到端的行人重識(shí)別。生成模型會(huì)將行人編碼成外觀代碼和結(jié)構(gòu)代碼,通過交換外觀代碼和結(jié)構(gòu)代碼,生成高質(zhì)量交叉ID的混合圖像。通過將外觀代碼在線反饋判別器模型,來改進(jìn)判別器,實(shí)現(xiàn)數(shù)據(jù)生成與重識(shí)別間相互關(guān)聯(lián)。與傳統(tǒng)方法相比,DG-net網(wǎng)絡(luò)可控性強(qiáng),完全利用訓(xùn)練數(shù)據(jù)集信息,不需要增加任何額外的數(shù)據(jù)。DG-net網(wǎng)絡(luò)實(shí)驗(yàn)結(jié)果如圖1所示。
圖1? DG-Net實(shí)驗(yàn)效果圖
2基于漸進(jìn)姿態(tài)遷移網(wǎng)絡(luò)行人重識(shí)別
為了盡可能模擬自然狀態(tài)下,行人姿態(tài)的多樣性,可以依賴生成對(duì)抗網(wǎng)絡(luò)實(shí)現(xiàn)姿態(tài)遷移。采用生成對(duì)抗生成方法的漸進(jìn)式姿態(tài)遷移方法,通過一系列中間姿態(tài),將目標(biāo)姿態(tài)遷移到原始圖像上去。
根據(jù)輸入的兩張圖片分別提取出當(dāng)前姿態(tài)和目標(biāo)姿態(tài)。在網(wǎng)絡(luò)中含有多個(gè)姿勢(shì)注意模塊,引導(dǎo)網(wǎng)絡(luò)將圖片中人物的不同的部分按照目標(biāo)姿態(tài)進(jìn)行漸進(jìn)式像素塊遷移。通過不斷生成與目標(biāo)姿勢(shì)日趨相近的圖片,使生成圖片逐步向目標(biāo)姿態(tài)靠近。通過使用這種新穎的方法增廣樣本數(shù)據(jù),使生成圖片的質(zhì)量得到很大提高。
3基于風(fēng)格遷移的行人重識(shí)別
現(xiàn)有的行人重識(shí)別數(shù)據(jù)集都是在監(jiān)控視頻片段的基礎(chǔ)上,通過剪裁得到目標(biāo)行人的圖片。在實(shí)際生活的測(cè)試中,攝像機(jī)處于戶外環(huán)境,行人重識(shí)別會(huì)受到不同攝像頭拍攝的圖片風(fēng)格變化的影響。因?yàn)閳D片風(fēng)格差異,造成同ID行人在不同攝像頭下的特征出現(xiàn)差異。
為了淡化不同相機(jī)間的風(fēng)格差異,CamStyle提出依靠生成對(duì)抗網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)增強(qiáng)的方法來消除相機(jī)樣式的差異。不同攝像機(jī)的風(fēng)格被視為不同的領(lǐng)域,利用CycleGAN產(chǎn)生新的數(shù)據(jù)樣本:將已經(jīng)標(biāo)記過的訓(xùn)練圖片風(fēng)格遷移至每個(gè)攝像機(jī),與原始訓(xùn)練樣本混合在一起擴(kuò)充訓(xùn)練集。通過這種方式,訓(xùn)練集是原始訓(xùn)練圖像和風(fēng)格轉(zhuǎn)換圖像的組合。進(jìn)行風(fēng)格遷移圖片可以直接沿用原有圖片的標(biāo)簽。
該訓(xùn)練集兼顧不同攝像機(jī)所處風(fēng)格,很大程度上減弱了自然環(huán)境對(duì)于重識(shí)別系統(tǒng)的影響,為行人重識(shí)別走向?qū)嶋H應(yīng)用邁出了重要的一步。
4未來展望
依據(jù)近年來行人重識(shí)別的發(fā)展方向分析,在未來的一段時(shí)間內(nèi)行人重識(shí)別問題研究很大程度仍會(huì)集中關(guān)注于行人特征,因此依靠生成對(duì)抗網(wǎng)絡(luò)是目前解決重識(shí)別有效方法之一。為了將行人重識(shí)別系統(tǒng)更好的應(yīng)用于實(shí)踐,行人檢測(cè)與行人重識(shí)別結(jié)合是必要的。單單憑借行人重識(shí)別模型無法獲取標(biāo)準(zhǔn)的數(shù)據(jù)圖片,引入行人檢測(cè)模型具有很大的現(xiàn)實(shí)意義與研究價(jià)值。
5結(jié)束語
隨著深度學(xué)習(xí)的不斷發(fā)展,行人重識(shí)別的性能日趨完善,但行人重識(shí)別模型主要依靠現(xiàn)有的標(biāo)準(zhǔn)數(shù)據(jù)集進(jìn)行訓(xùn)練測(cè)試,泛化能力仍有不足。在面對(duì)實(shí)際生活場景中,數(shù)據(jù)圖片的復(fù)雜性遠(yuǎn)非標(biāo)準(zhǔn)數(shù)據(jù)集可比。生成對(duì)抗網(wǎng)絡(luò)雖能擴(kuò)充行人數(shù)據(jù)的信息量,也不能完全克服這些挑戰(zhàn)。為此在日后的研究中,應(yīng)更加針對(duì)考慮到現(xiàn)實(shí)環(huán)境下行人的多態(tài)性。
參考文獻(xiàn)
[1] 徐一峰. 生成對(duì)抗網(wǎng)絡(luò)理論模型和應(yīng)用綜述[J]. 金華職業(yè)技術(shù)學(xué)院學(xué)報(bào),2017,17(3):81-88.
[2] 戴臣超,王洪元,倪彤光,等. 基于深度卷積生成對(duì)抗網(wǎng)絡(luò)和拓展近鄰重排序的行人重識(shí)別[J]. 計(jì)算機(jī)研究與發(fā)展,2019,56(8):1632-1641.
作者簡介
田宇,男,遼寧省盤錦市興隆臺(tái)區(qū)人;現(xiàn)就讀學(xué)校:沈陽理工大學(xué),在讀研究生,研究方向:復(fù)雜系統(tǒng)綜合自動(dòng)化技術(shù)。