改進(jìn)ＹＯＬＯｖ５和ＤｅｅｐＳＯＲＴ的多目標(biāo)跟蹤算法

2023-07-21 11:16:53黃振桂

計算機應(yīng)用文摘·觸控 2023年14期

摘要針對多目標(biāo)因相互交錯或被遮擋以及檢測目標(biāo)外觀外貌和背景顏色相近等現(xiàn)象導(dǎo)致目標(biāo)跟蹤的漏檢錯檢ID 分配紊亂等問題提出了一種改進(jìn)YOLOv5 DeepSORT和跟蹤算法為加強網(wǎng)絡(luò)對全局上下文特征的提取能力文章提出優(yōu)化DeepSORT 的特征提取網(wǎng)絡(luò)模型并通過去掉1 層卷積層增加4 層殘差層以及采用自適應(yīng)平均池化層和增加網(wǎng)絡(luò)的深度與寬度對行人提取更加深層次的語義信息最后通過實驗驗證了DeepSORT 目標(biāo)跟蹤算法的優(yōu)越性其能夠準(zhǔn)確地對目標(biāo)進(jìn)行跟蹤具有一定的理論探索意義和實用價值

關(guān)鍵詞多目標(biāo)跟蹤行人識別

中圖法分類號文獻(xiàn)標(biāo)識碼A

１引言

隨著計算機視覺技術(shù)［１］的高速發(fā)展，目標(biāo)檢測與跟蹤技術(shù)［２］已經(jīng)應(yīng)用到各個領(lǐng)域中，如自動駕駛、智慧交通以及公共安全監(jiān)管等。目標(biāo)跟蹤算法可以分為２大類，分別為單目標(biāo)跟蹤［３］和多目標(biāo)跟蹤［４］。單目標(biāo)跟蹤算法是在每張圖片中只跟蹤一個目標(biāo)，而多目標(biāo)跟蹤算法則是連續(xù)跟蹤視頻或者圖像幀中的多個目標(biāo)，多目標(biāo)跟蹤更多的是解決相似度計算和數(shù)據(jù)關(guān)聯(lián)的問題。２０１６年，Ｒｅｄｍｏｎ［５］提出了一種Ｏｎｅ?Ｓｔａｇｅ方法，即ＹＯＬＯ算法，其雖犧牲了檢測準(zhǔn)度和定位精度，但是檢測速度大幅提高，從而達(dá)到實時的目標(biāo)檢測要求。ＳＯＲＴ算法［６］（ＳｉｍｐｌｅＯｎｌｉｎｅａｎｄＲｅａｌｔｉｍｅＴｒａｃｋｉｎｇ）是一個非常簡單實用的多目標(biāo)跟蹤算法。在ＳＯＲＴ算法中，僅僅通過ＩＯＵ來進(jìn)行匹配，雖然速度極快，但是存在大量身份ＩＤ互換的現(xiàn)象。ＤｅｅｐＳＯＲＴ算法［７］在ＳＯＲＴ算法的基礎(chǔ)上引入了級聯(lián)匹配和匈牙利算法將目標(biāo)軌跡的預(yù)測框與檢測框進(jìn)行了數(shù)據(jù)關(guān)聯(lián)匹配。通過這個擴展，模型能夠更好地應(yīng)對目標(biāo)被長時間遮擋的情況，將ＩＤｓｗｉｔｃｈ指標(biāo)降低了４５％。但在實際場景中，面對行人目標(biāo)姿態(tài)變化、光照強度低、背景環(huán)境復(fù)雜，以及目標(biāo)間的軌跡交錯和遮擋等問題，仍然存在目標(biāo)漏檢、丟失跟蹤以及ＩＤ易互換的現(xiàn)象。針對上述問題，本文提出改進(jìn)ＹＯＬＯｖ５和ＤｅｅｐＳＯＲＴ算法。

２ＹＯＬＯｖ５算法

Ｕｌｔｒａｌｙｔｉｃｓ等提出的ＹＯＬＯｖ５模型的性能和檢測準(zhǔn)確度與ＹＯＬＯｖ４不相上下，相較于ＹＯＬＯｖ４，ＹＯＬＯｖ５的網(wǎng)絡(luò)結(jié)構(gòu)更加簡單，參數(shù)量也更少，其圖像自適應(yīng)縮放策略和錨框自適應(yīng)策略使ＹＯＬＯｖ５無論是訓(xùn)練、預(yù)測還是推理速度都明顯優(yōu)于ＹＯＬＯｖ４。整個ＹＯＬＯｖ５網(wǎng)絡(luò)結(jié)構(gòu)分成４部分，即Ｉｎｐｕｔ，Ｂａｃｋｂｏｎｅ，Ｎｅｃｋ，Ｈｅａｄ。

（１）Ｉｎｐｕｔ輸入端。ＹＯＬＯｖ５繼承了ＹＯＬＯｖ４所使用的Ｍｏｓａｉｃ數(shù)據(jù)增強方式，豐富了檢測數(shù)據(jù)集，同時采用自定義不同長寬錨框的自適應(yīng)錨框機制，從而實現(xiàn)了既能增加數(shù)據(jù)集的復(fù)雜度，又能減少ＧＰＵ的內(nèi)存使用的目標(biāo)。

（２）Ｂａｃｋｂｏｎｅ主干網(wǎng)絡(luò)。ＹＯＬＯｖ５ｓ的Ｂａｃｋｂｏｎｅ網(wǎng)絡(luò)是１個由ＣＳＰＤａｒｋｎｅｔ５３構(gòu)成的卷積神經(jīng)網(wǎng)絡(luò)，它包含５３個卷積層，并使用了ＣＳＰ（Ｃｒｏｓｓ?ＳｔａｇｅＰａｒｔｉａｌＮｅｔｗｏｒｋｓ）模塊來加快訓(xùn)練和提高準(zhǔn)確性。

（３）Ｎｅｃｋ頸部網(wǎng)絡(luò)。在ＹＯＬＯｖ４的Ｎｅｃｋ結(jié)構(gòu)中，采用的都是普通的卷積操作，ＹＯＬＯｖ５的Ｎｅｃｋ網(wǎng)絡(luò)使用了“ ＦＰＮ＋ＰＡＮ” 結(jié)構(gòu)，且ＹＯＬＯｖ５借鑒了ＣＳＰｎｅｔ的設(shè)計思想，將ＹＯＬＯｖ４使用的ＣＢＬ模塊更換為ＣＳＰ２結(jié)構(gòu)，從而保留更多特征信息，加強了網(wǎng)絡(luò)特征融合能力。

（４）Ｈｅａｄ輸出端。Ｈｅａｄ輸出端是ＹｏＬＯｖ５模型中最后一層卷積層，它的作用是將融合后的多尺度特征圖進(jìn)行分類和回歸預(yù)測，得到目標(biāo)的位置、類別和置信度等信息。

３ＤｅｅｐＳＯＲＴ算法改進(jìn)

ＤｅｅｐＳＯＲＴ算法是在整個ＳＯＲＴ算法的基礎(chǔ)上進(jìn)行改進(jìn)，其借鑒行人重識別領(lǐng)域的ＲｅＩＤ網(wǎng)絡(luò)結(jié)構(gòu)，利用特征提取網(wǎng)絡(luò)與目標(biāo)檢測框中的特征，當(dāng)目標(biāo)因遮擋又重新出現(xiàn)后，可以利用特征提取網(wǎng)絡(luò)的前后特征對比，重新跟蹤目標(biāo)，從而避免出現(xiàn)ＩＤ互換現(xiàn)象。但在實測過程中發(fā)現(xiàn)，ＤｅｅｐＳＯＲＴ原始特征網(wǎng)絡(luò)在行人重疊時容易出現(xiàn)ＩＤ互相切換的現(xiàn)象，以及造成目標(biāo)跟丟的情況。為解決此問題，重構(gòu)ＤｅｅｐＳＯＲＴ外觀特征提取網(wǎng)絡(luò)模型，在不改變訓(xùn)練速度的基礎(chǔ)上，進(jìn)一步提升ＤｅｅｐＳＯＲＴ外觀特征提取能力。改進(jìn)外觀特征提取網(wǎng)絡(luò)表如表１所列。

４實驗及結(jié)果分析

４．１改進(jìn)特征提取網(wǎng)絡(luò)訓(xùn)練

本文使用Ｍａｒｋｅｔ?１５０１數(shù)據(jù)集對改進(jìn)的行人重識別網(wǎng)絡(luò)進(jìn)行訓(xùn)練，將訓(xùn)練好的模型導(dǎo)出后用于后續(xù)的實驗，通過記錄每一次迭代的行人外觀模型訓(xùn)練結(jié)果的損失函數(shù)值及誤差值來驗證外觀模型的訓(xùn)練效果。特征提取網(wǎng)絡(luò)訓(xùn)練結(jié)果圖如圖１所示。

從圖１的Ｌｏｓｓ以及Ｔｏｐ１?Ｅｒｒｏｒ曲線變化可知前Ｅｐｏｃｈ２０，模型的損失值和Ｔｏｐ１?Ｅｒｒｏｒ下降較為迅速，在Ｅｐｏｃｈ２０之后，Ｌｏｓｓ值和Ｔｏｐ１?Ｅｒｒｏｒ錯誤率曲線逐漸平緩，當(dāng)模型迭代４０次時，訓(xùn)練集的Ｌｏｓｓ值和Ｔｏｐ１?Ｅｒｒｏｒ錯誤率趨近于２％，驗證集的Ｌｏｓｓ值和Ｔｏｐ１?Ｅｒｒｏｒ錯誤率分別趨近５２％和１５％。在Ｅｐｏｃｈ６０時模型收斂，此時該模型能夠較好地提取更深層次的人體外觀特征信息。

４．２多目標(biāo)跟蹤算法效果對比

目標(biāo)跟蹤算法選擇在ＭＯＴ１６數(shù)據(jù)集上進(jìn)行測試，選擇ＭＯＴＣｈａｌｌｅｎｇｅ指標(biāo)作為評分標(biāo)準(zhǔn)，與其他幾種經(jīng)典跟蹤算法進(jìn)行對比實驗，并給出了相應(yīng)的實驗結(jié)果。目標(biāo)跟蹤算法實驗對比如表２所列。

４．３目標(biāo)跟蹤算法實驗示例分析

選擇ＭＯＴ１６?０２和ＭＯＴ１６?０４視頻對改進(jìn)模型進(jìn)行測試。ＭＯＴ?１６?０２視頻圖、ＭＯＴ?１６?０４視頻圖如圖２、圖３所示。

從圖３可以看出，該場景行人密集，光線陰暗，背景復(fù)雜，在ＭＯＴ?１６?０２視頻經(jīng)過人群短暫交錯后，在第４０３幀和第４６９幀中各行人的ＩＤ信息仍保持不變；在ＭＯＴ?１６?０４視頻中Ｉｄ為１的目標(biāo)男子在視頻從左往右走動時，經(jīng)過燈光的遮擋重新出現(xiàn)，檢測到其ＩＤ始終沒有發(fā)生改變，并且在Ｉｄ為７３的行人經(jīng)過人群密集處后，檢測到其ＩＤ依舊為７３。這表明該算法在光線較暗的情況下依舊能夠有效地跟蹤到行人目標(biāo)，并保持他們的ＩＤ值不變，不易發(fā)生ＩＤ互換現(xiàn)象。

５結(jié)束語

本文在ＹＯＬＯｖ５和ＤｅｅｐＳＯＲＴ算法的基礎(chǔ)上進(jìn)行改進(jìn)，提出結(jié)合ＧＡＭ注意力機制，加強網(wǎng)絡(luò)對上下文的特征的提取能力，同時優(yōu)化ＤｅｅｐＳＯＲＴ的外觀特征提取網(wǎng)絡(luò)，將１２８維提升至１０２４維和采用不同殘差神經(jīng)層加強對目標(biāo)外觀的提取。在保證精度的前提下，大幅減少行人因重疊導(dǎo)致身份互換現(xiàn)象，最終優(yōu)化后的模型在ＭＯＴＡ上提高了０．７２９％，ＭＯＴＰ提高了１．５４１％，ＩＤＳＷ下降了１３０，足以證明該模型可以快速有效地實現(xiàn)行人識別與跟蹤，完成在復(fù)雜場景下的跟蹤任務(wù)。

參考文獻(xiàn)：

［１］方佳樂．計算機視覺技術(shù)在人工智能領(lǐng)域的應(yīng)用研究［Ｊ］．中國高新科技，２０２１（２０）：４０?４１．

［２］王曉燕，韓笑，王雪婷．圖像處理領(lǐng)域運動目標(biāo)跟蹤技術(shù)綜述［Ｊ］．科學(xué)技術(shù)創(chuàng)新，２０１８（２５）：９７?９８．

［３］ＬＵＸ，ＬＩＦ，ＴＡＮＧＪ，ｅｔａｌ．ＡｎｅｗｐｅｒｆｏｒｍａｎｃｅｉｎｄｅｘｆｏｒｍｅａｓｕｒｉｎｇｔｈｅｅｆｆｅｃｔｏｆｓｉｎｇｌｅｔａｒｇｅｔＴｒａｃｋｉｎｇｗｉｔｈＫａｌｍａｎｐａｒｔｉｃｌｅｆｉｌｔｅｒ［Ｊ］．ＩｎｔｅｒｎａｔｉｏｎａｌＪｏｕｒｎａｌｏｆＭｏｄｅｒｎＰｈｙｓｉｃｓＣ，２０２２，３３（９）：１１?２０．

［４］ＲＥＤＭＯＮＪ，ＦＡＲＨＡＤＩＡ．ＹＯＬＯ９０００：Ｂｅｔｔｅｒ，Ｆａｓｔｅｒ，Ｓｔｒｏｎｇｅｒ［Ｊ］．ＣｏＲＲ，２０１６：２４２?２４８．

［５］馬琳琳，馬建新，韓佳芳，等．基于ＹＯＬＯｖ５ｓ目標(biāo)檢測算法的研究［Ｊ］．電腦知識與技術(shù)，２０２１，１７（２３）：１００?１０３．

［６］ＢＥＷＬＥＹＡ，ＺＯＮＧＹＵＡＮＧ，ＲＡＭＯＳＦ，ｅｔａｌ．ＳｉｍｐｌｅｏｎｌｉｎｅａｎｄｒｅａｌｔｉｍｅＴｒａｃｋｉｎｇ［Ｃ］／／ＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＩｍａｇｅＰｒｏｃｅｓｓｉｎｇ，２０１６：３４６４?３４６８．

［７］ＷＯＪＫＥＮ，ＢＥＷＬＥＹＡ，ＰＡＵＬＵＳＤ．ＳｉｍｐｌｅＯｎｌｉｎｅａｎｄＲｅａｌｔｉｍｅＴｒａｃｋｉｎｇｗｉｔｈａＤｅｅｐＡｓｓｏｃｉａｔｉｏｎＭｅｔｒｉｃ［Ｊ］．ＩＥＥＥ，２０１７，２１（２）：３６４５?３６４９．

作者簡介：

黃振桂（１９９８—），碩士，研究方向：目標(biāo)檢測與跟蹤。

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

改進(jìn)ＹＯＬＯｖ５ 和ＤｅｅｐＳＯＲＴ 的多目標(biāo)跟蹤算法

改進(jìn)ＹＯＬＯｖ５和ＤｅｅｐＳＯＲＴ的多目標(biāo)跟蹤算法