張遠 楊大林 車相豪 汪詩揚 何子恒
摘??要:人體關(guān)鍵點檢測是在行為識別、動作捕捉等領(lǐng)域有著重要作用?;谝曈X的方法會受光線環(huán)境影響,還可能會在室內(nèi)環(huán)境中引發(fā)隱私問題,可穿戴設(shè)備的方法則不適用于非合作目標(biāo)?;诖?,提出了一種基于4D毫米波雷達點云的人體關(guān)鍵點檢測方法,分析了使用毫米波點云進行關(guān)鍵點檢測存在的問題。為了解決這些問題,提出了毫米波人體關(guān)鍵點檢測(Millimeter?Wave?Human?Pose?Detection,mmWPose)系統(tǒng),為了便于提取點云特征,設(shè)計了一種二維化方法用于處理點云數(shù)據(jù),可以顯著減少模型在特征提取階段的參數(shù)量。為了進行數(shù)據(jù)標(biāo)注,運用跨模態(tài)監(jiān)督來訓(xùn)練目標(biāo)模型,為了增強目標(biāo)模型的泛化能力,設(shè)計了一個域適應(yīng)模塊協(xié)助目標(biāo)模型分辨點云數(shù)據(jù)中屬于環(huán)境的特征。實驗證明,研究提出的mmWPose系統(tǒng)能夠解決毫米波點云存在的問題,實現(xiàn)高精度的人體關(guān)鍵點檢測。
關(guān)鍵詞:毫米波雷達?人體關(guān)鍵點檢測?域適應(yīng)?跨模態(tài)學(xué)習(xí)?深度學(xué)習(xí)
中圖分類號:TN957.52
Human?Key?Point?Detection?Based?on?the?Deep?Learning?Method?and?the?4D?Millimeter-Wave?Radar?Point?Cloud
ZHANG?Yuan*??YANG?Dalin??CHE?Xianghao??WANG?Shiyang??HE?Ziheng
School?of?Information,?North?China?University?of?Technology,?Beijing,?100144?China
Abstract:?Human?key?point?detection?plays?an?important?role?in?fields?such?as?behavior?recognition?and?motion?capture.?Vision-based?methods?are?subject?to?the?light?environment?and?may?also?cause?privacy?issues?in?the?indoor?environment,?and?the?methods?based?on?wearable?devices?are?not?suitable?for?non-cooperative?targets.?Based?on?this,?this?article?proposes?a?method?of?human?key?point?detection?based?on?the?4D?millimeter-wave?radar?point?cloud,?and?analyzes?the?problems?of?using?the?millimeter-wave?point?cloud?for?key?point?detection.?In?order?to?address?these?issues,?this?study?proposes?a?Millimeter-Wave?Human?Pose?Detection?(mmWPose)?system,?and?in?order?to?facilitate?the?extraction?of?point?cloud?features,?it?designs?a?two-dimensional?method?for?processing?point?cloud?data,?which?can?significantly?reduce?the?number?of?parameters?in?the?model?in?the?feature?extraction?stage.?In?order?to?make?data?annotation,?it?uses?cross-modal?supervision?to?train?the?target?model,?and?in?order?to?enhance?the?generalization?ability?of?the?target?model,?it?designs?a?domain?adaptation?module?to?assist?the?target?model?in?distinguishing?the?features?belonging?to?the?environment?in?point?cloud?data.?Experiments?have?shown?that?the?mmWPose?system?proposed?in?this?study?can?solve?the?problems?of?millimeter-wave?point?clouds?and?achieve?high-precision?human?key?point?detection.
Key?Words:?Millimeter-wave?radar;?Human?key?point?detection;?Domain?adaptation;?Cross-modal?learning;?Deep?learning
人體姿態(tài)檢測技術(shù)在行為識別、跌倒檢測等實際應(yīng)用中發(fā)揮著至關(guān)重要的作用[1]?;谝曈X的人體關(guān)鍵點識別方法通過提取圖像中的人體相關(guān)特征來生成人體關(guān)鍵點信息,在私密場景下可能會觸及個人隱私問題。幸運的是,依靠電磁波媒介的探測技術(shù)或許能有所作為[2]。為了提取毫米波點云的特征,Sengupta?A等人[3]提出的mm-Pose,該算法使用將毫米波點云映射在XY,XZ兩個平面上,但會導(dǎo)致參數(shù)量冗余的問題。由于毫米波點云的稀疏性,人工進行標(biāo)注困難。由于毫米波雷達會受到環(huán)境的干擾,點云中可能存在環(huán)境噪聲,導(dǎo)致訓(xùn)練的模型泛化性差?[4]。
針對以上問題,提出了毫米波人體關(guān)鍵點檢測(mmWPose)系統(tǒng)。為了解決點云稀疏而導(dǎo)致的標(biāo)注困難問題,采用了跨模態(tài)學(xué)習(xí)方法。為了提取點云特征,設(shè)計了一種點云二維化方法,有效地減少了特征提取模塊的參數(shù)量。為了增強模型的泛化性,設(shè)計了一個域適應(yīng)模塊用于抑制模型對環(huán)境特征的提取,使模型在不同環(huán)境中具有適應(yīng)能力。
1技術(shù)原理
1.1??毫米波雷達數(shù)據(jù)采集
毫米波雷達可以通過發(fā)射天線發(fā)射頻率為30~300?GHz的毫米波,其通過發(fā)射天線Tx發(fā)射調(diào)頻連續(xù)波信號,接收天線Rx接收物體反射的信號來獲取數(shù)據(jù)。發(fā)射信號和接收信號在接收器處混合形成中頻(IF)信號,具體公式如下。
式(1)中:為發(fā)射信號的瞬時頻率;為接收信號的瞬時頻率;為發(fā)射信號的初始相位;為接收信號的初始相位。
通過獲取中頻信號,可以得到發(fā)射信號和接收信號之間的頻率差fIF,如式(2)所示。物體和雷達的距離由式(3)計算得出,d為物體到天線的距離,τ為啁啾信號的持續(xù)時間,B為啁啾信號的帶寬,c為光速。
通過使用2根接收天線接收相同的反射信號,可以得到兩個初始相位不同的信號,?如式(4)所示,其中λ為調(diào)頻連續(xù)波的初始波長;為兩個接收天線的接收信號之間的相位差;l為2根接收天線之間的距離;θ為到達角。
如圖1所示,通過測量物體到天線的距離和角度,可以得到被測物體的三維空間坐標(biāo),具體公式如下。
式(5)、式(6)、式(7)中:?x、y、z為檢測物體在三維空間中的坐標(biāo);為仰角;為方位角。
2?實驗方法
2.1點云數(shù)據(jù)標(biāo)準(zhǔn)化
為了對毫米波點云進行特征提取,我們將毫米波雷達采集的點云數(shù)據(jù)映射為圖像。具體公式如下。
式(8)中:u為圖像像素的橫坐標(biāo);v為縱坐標(biāo);K為相機的內(nèi)參。
本文使用基于視覺的人體關(guān)鍵點檢測算法OpenPose[5]作為例子講述。該算法通過特征提取模塊提取特征F來預(yù)測部分親和場和部分預(yù)測關(guān)鍵點熱圖。每個部分都由若干個階段相同的結(jié)構(gòu)順序堆疊而成,結(jié)構(gòu)如圖2的關(guān)鍵點檢測模塊,用式(9)、式(10)表示?[6]。
式(9)、式(10)中:?t為在階段t的部分親和場預(yù)測函數(shù);為在階段t的關(guān)鍵點熱圖預(yù)測函數(shù);L為部分親和場;S為關(guān)鍵點熱圖
2.2跨模態(tài)學(xué)習(xí)
在模型訓(xùn)練階段,把包含知識的基于視覺的人體關(guān)鍵點檢測模型稱為源模型,把需要獲取的模型稱為目標(biāo)模型。如圖3所示,使用源模型對彩色圖像上的關(guān)鍵點進行預(yù)測,將預(yù)測結(jié)果作為目標(biāo)模型上相應(yīng)二維圖像的標(biāo)簽。損失函數(shù)公式如下。
式(11)中:fop為跨模態(tài)學(xué)習(xí)的各階段的損失相加的總體損失
2.3域適應(yīng)模塊
域適應(yīng)部分由3個卷積層、4個全連接層和一個Softmax層組成,具體公式如下。
式(12)中:J為輸出向量的長度;D為輸出向量;D*為真實向量;i為向量的第i個元素。
為了抑制特征提取模塊提取屬于環(huán)境的特征,將fa作為全局損失函數(shù)的負因子對抗模型[7]訓(xùn)練,具體公式如下。
式(13)中:μ用于調(diào)節(jié)域自適應(yīng)部分對整個模型參數(shù)的影響。
3??實驗與分析
使用SKY32B750毫米波雷達作為點云數(shù)據(jù)采集設(shè)備,使用??低晹z像機作為視覺圖像采集設(shè)備。如圖4所示,左側(cè)是雷達數(shù)據(jù)采集板,右側(cè)是攝像頭。使用筆記本電腦驅(qū)動雷達板和攝像頭進行數(shù)據(jù)采集,讓人在采集區(qū)域內(nèi)隨機移動,并隨機做出各種姿勢,如舉手、抬腿、行走等。
如圖5所示,mmWPose目標(biāo)模型能夠較準(zhǔn)確地預(yù)測人體關(guān)鍵點。本文將mm-Pose的二維化方式與我們的方式進行對比,如表1所示,在參數(shù)量只有其一半的情況下,本文的方法實現(xiàn)了相當(dāng)?shù)臋z測性能。為了展示域適應(yīng)模塊的性能,本文將其與未添加域適應(yīng)模塊的模型進行比較,如圖6所示,mmWPose*表示添加域適應(yīng)模塊的目標(biāo)模型性能,由此可以看出,加入域適應(yīng)模塊后,模型對各個關(guān)節(jié)的預(yù)測精度都有所提高。
4??結(jié)論
為了解決現(xiàn)有的毫米波點云人體關(guān)鍵點檢測存在的問題,本文提出一種二維化點云的方法,使點云特征提取能夠使用基于視覺的特征提取方法。使用跨模態(tài)學(xué)習(xí)的方式訓(xùn)練目標(biāo)模型,實現(xiàn)了較高的人類關(guān)鍵點預(yù)測精度。本研究模型中加入了域適應(yīng)模塊用于抑制環(huán)境特征,提高了模型的魯棒性,能夠進一步增強現(xiàn)有的毫米波點云人體關(guān)鍵點檢測方案的性能。
參考文獻