摘 要:伴隨著信息技術(shù)的快速發(fā)展,人體行為識別技術(shù)逐漸被引入到各領(lǐng)域中,如安防監(jiān)控、運(yùn)動分析、醫(yī)學(xué)輔助診斷和智能人機(jī)交互等,而技術(shù)實(shí)現(xiàn)的關(guān)鍵在于借助相關(guān)的特征融合方法。文章對人體行為識別的相關(guān)技術(shù)以及興趣點(diǎn)提取方法、尺度混合特征模型與MKL方法的應(yīng)用進(jìn)行分析,以期對人體行為識別技術(shù)的發(fā)展起到推動作用。
關(guān)鍵詞:人體行為識別;特征融合;興趣點(diǎn)提取;多核學(xué)習(xí)
人體行為識別是近年來學(xué)術(shù)界研究的焦點(diǎn),因此有大量相關(guān)的識別方法和表達(dá)方法不斷涌現(xiàn)出來,如行為表達(dá)方法中常見的局部時(shí)空特征,或于概率潛在語義分析模型中引入幾何信息等。值得注意的是,假若在高層語義環(huán)境下進(jìn)行人體行為分析,僅通過底層信息的獲取很難保證辨別力,這就要求將融合特征作為分析方案,通過高層特征信息的提取達(dá)到識別目標(biāo)。因此,本文對人體行為識別中特征融合方法的應(yīng)用分析,具有十分重要的意義。
1 人體行為識別相關(guān)技術(shù)分析
1.1 人體行為特征提取
關(guān)于人體行為特征提取,其目的在于服務(wù)于行為識別模型構(gòu)建,由于不同模型構(gòu)建在特征提取方式上有一定差異,所以需做好行為特征提取分析。常見的行為特征提取模型主要可細(xì)化為:(1)全局特征模型。該模型在檢測對象上以整個(gè)運(yùn)動人體為主,又包括不同階段,如人體結(jié)構(gòu)模型、外觀模型與運(yùn)動特征模型。其中在人體結(jié)構(gòu)模型上,強(qiáng)調(diào)檢測與跟蹤人體關(guān)鍵部位,通過參數(shù)化描述各部位姿態(tài);而外觀模型,要求在光流法或多幀差分法應(yīng)用下對人體行為區(qū)域檢測,可獲得更多行為信息;運(yùn)動特征模型,其可解決前兩種方法應(yīng)用下的計(jì)算復(fù)雜度高、過多依賴圖像處理等問題,更注重借助運(yùn)動時(shí)空興趣點(diǎn)分析。(2)局部特征模型。該模型下提取的人體行為識別,要求檢測與識別運(yùn)動人體變化顯著的部位,包括腿、腳、膝蓋等,常見的方式為興趣點(diǎn)提取,獲取的行為識別效果較為理想。
1.2 人體行為特征融合
在人體行為特征融合方面,提取中既可從時(shí)域、空域上著手,同時(shí)也能在多傳感器應(yīng)用下進(jìn)行不同特征的獲取。具體表現(xiàn)為:(1)時(shí)域視角下的人體行為特征。其注重對人體相關(guān)的顏色、紋理、外形與輪廓特征提取,如輪廓方法、剪影方法等。(2)空域視角下的人體行為特征。該方法需對人體歷史信息、行為深度提取,可通過對運(yùn)動興趣點(diǎn)周圍信息分析,實(shí)現(xiàn)人體細(xì)節(jié)特征信息獲取目標(biāo)。(3)人體行為多特征融合。這種方式需結(jié)合多種特征,如多底層特征融合、多渠道提取特征融合等,可將單一特征分析人體行為中的不足進(jìn)行彌補(bǔ)[1]。
1.3 人體行為特征識別
在人體行為信息提取中,需借助上述特征提取與特征融合方式,但在進(jìn)行行為所屬類別判斷中則需通過人體行為識別與分類實(shí)現(xiàn)。常見的識別方式主要以模板匹配、詞袋模型統(tǒng)計(jì)分類和狀態(tài)空間分類等方法為主。如模板匹配方法,亦可被稱之為直接分類方法,可借助近鄰分類器完成行為模式分類;而對于詞袋模型,側(cè)重于通過概率潛在語義分析模型,完成統(tǒng)計(jì)分類;另外,在狀態(tài)空間分類方法上,需對各靜態(tài)姿勢定義為狀態(tài),在切換狀態(tài)中形成概率關(guān)系,最終得到的聯(lián)合概率可作為分類的根據(jù)[2]。
2 人體行為識別中興趣點(diǎn)提取方法的運(yùn)用
2.1 興趣點(diǎn)提取
興趣點(diǎn)識別方法應(yīng)用下,主要利用興趣點(diǎn)局部特征,如肢體部位便可作為某一興趣點(diǎn),而不同行為動作在興趣點(diǎn)上有一定差異,可利用這些差異完成人體行為識別過程。具體進(jìn)行興趣點(diǎn)提取中,本文主要結(jié)合相應(yīng)的時(shí)空興趣點(diǎn)檢測方法,具體表現(xiàn)在:(1)Harris 3D檢測器。由Laptev提出,應(yīng)用原理表現(xiàn)為在Harris算子應(yīng)用下,借助自相關(guān)函數(shù),使圖像某一像素點(diǎn)自相關(guān)矩陣被給出,這樣所得出的特征值便可用于函數(shù)一階曲率推測,若函數(shù)中X,Y方向都有較高的曲率值,說明該特征值為興趣點(diǎn)。(2)Dollar檢測器。作為時(shí)空興趣點(diǎn)檢測方法,可彌補(bǔ)Harris 3D檢測方法應(yīng)用下的可靠興趣點(diǎn)數(shù)量不足情況,操作流程體現(xiàn)為時(shí)間域上Gabor濾波器的構(gòu)建、響應(yīng)函數(shù)的構(gòu)造、結(jié)合響應(yīng)值進(jìn)行時(shí)空興趣點(diǎn)的篩選。(3)Bregonzio檢測器。由于Dollar檢測器應(yīng)用中有背景噪聲、人體遮擋等影響,所獲取的結(jié)果易出現(xiàn)偽興趣點(diǎn),此時(shí)便引入Bregonzio檢測器,操作中能夠進(jìn)行噪聲處理,得到可靠的興趣點(diǎn)[3]。
2.2 特征描述
在興趣點(diǎn)行為識別方法中,對于人體行為特征描述,可從3方面表現(xiàn)出來:(1)以外觀形狀特征進(jìn)行描述。該方法在既往研究資料中多有體現(xiàn),強(qiáng)調(diào)對人體的外觀表現(xiàn)進(jìn)行描述,原理在于以人的身體軀干比例進(jìn)行行為分析,如跑步行為、揮手行為,兩種行為所展示的長寬比例關(guān)系有明顯差異,利用該差異可達(dá)到特征描述目標(biāo);(2)運(yùn)動特征描述。這種方式主要借助運(yùn)動信息進(jìn)行特征描述,如運(yùn)動速率、運(yùn)動軌跡等;(3)多特征融合描述。該描述方法在原理上表現(xiàn)為利用不同特征相互補(bǔ)充,如將人體外觀姿態(tài)、人體運(yùn)動方向、人體運(yùn)動軌跡等融合,這樣可對特征間的不足進(jìn)行彌補(bǔ)。
2.3 行為識別
在興趣點(diǎn)行為識別中,采用的人體行為識別分類方法,通常體現(xiàn)為直接分類與詞袋模型兩種方法。以直接分類識別方法為例,一般借助K-最近鄰分類器(K-Nearest Neighbor,KNN)實(shí)現(xiàn),或引入其他相關(guān)向量機(jī)(Relevance Vector Machine,RVM)、支持向量機(jī)(Support Vector Machine,SVM)。而詞袋模型,最初應(yīng)用中體現(xiàn)在文本分類上,將人體行為視頻作為文本,這樣整個(gè)文本所展示的行為便可被識別,識別效果明顯。
3 人體行為識別中尺度混合特征模型的運(yùn)用
盡管興趣點(diǎn)識別方法應(yīng)用下可獲取顯著的識別效果,但需注意這些方法應(yīng)用中所采用的詞袋模型等,強(qiáng)調(diào)對局部時(shí)空描述符的辨別力依賴,其余如興趣點(diǎn)分布情況被忽略,這樣一旦其中有潛在價(jià)值的興趣點(diǎn)被遺忘,便會影響平滑運(yùn)動信息的捕捉。對此,可考慮引入尺度混合特征融合應(yīng)用下進(jìn)行人體行為識別。
3.1 尺度混合特征融合
該方法應(yīng)用中,所考慮的因素以運(yùn)動周期、運(yùn)動延時(shí)為主,特征描述中除對單幀興趣點(diǎn)觀察外,也結(jié)合多幀興趣點(diǎn),這樣可使動作延時(shí)、運(yùn)動周期辨識度更加清晰,其中的幀便可稱之為尺度。對于尺度混合特征融合,其實(shí)現(xiàn)的流程表現(xiàn)為:輸入數(shù)據(jù);全局外觀比例、多尺度興趣點(diǎn)以及相鄰幀速度獲??;特征融合;直接分類;分類結(jié)果輸出。
3.2 尺度混合特征提取
尺度混合特征融合提取中,需配以相應(yīng)的提取算法,以SV-PDI尺度混合特征提取算法為例,具體步驟為:(1)將Bregonzio時(shí)空興趣點(diǎn)檢測器引入,計(jì)算每幀圖像;(2)以人體行為區(qū)域、興趣點(diǎn)位置作為依據(jù),進(jìn)行人體最小外接矩形、興趣點(diǎn)最小外接矩形的計(jì)算;(3)在尺度大小選定后,對各尺度下興趣點(diǎn)外接矩形相關(guān)特征,如密度、速度與形狀進(jìn)行計(jì)算;(4)做V-PDI值、多尺度下特征值計(jì)算,得出尺度特征結(jié)果,最后將所有結(jié)果合并并更新,完成提取過程。
4 人體行為識別中MKL方法的運(yùn)用
除興趣點(diǎn)、尺度混合特征方法為,人體行為識別中也可引入多核學(xué)習(xí)(Multiple Kernel Learning ,MKL)方法,其應(yīng)用下旨在支持向量機(jī)分類中函數(shù)最優(yōu)組合選擇問題得以解決。從該方法應(yīng)用原理看,主要表現(xiàn)為在不同核函數(shù)應(yīng)用下確定權(quán)重,在此基礎(chǔ)上做組合分類,考慮到核函數(shù)線性組合下,操作中有信息丟失可能,所以應(yīng)以多核線性組合方式為主。對于MKL算法,在流程上表現(xiàn)為輸入數(shù)據(jù)、特征空間與核空間數(shù)據(jù)獲取、合成核空間中的加權(quán)求和核、SVM分類器分類以及分類結(jié)果輸出。
5 結(jié)語
人體行為識別技術(shù)在當(dāng)前許多生活領(lǐng)域中應(yīng)用都極為廣泛,但其實(shí)現(xiàn)卻需依托于特征融合。本文在明確人體行為識別相關(guān)技術(shù)的基礎(chǔ)上,提出基于興趣點(diǎn)、尺度混合特征以及MKL等方法,可被應(yīng)用于人體行為識別中,對人體行為識別技術(shù)的發(fā)展起到推動作用。
作者簡介:趙雄偉(1991— ),男,河北石家莊,碩士;研究方向:模式識別與人工智能方向。
[參考文獻(xiàn)]
[1]方達(dá).人體行為特征融合與行為識別研究[D].南京:南京師范大學(xué),2016.
[2]吳冬梅,謝金壯,王靜.基于多特征融合的人體行為識別[J].計(jì)算機(jī)應(yīng)用與軟件,2015(11):171-175.
[3]邵延華,郭永彩,高潮.基于特征融合的人體行為識別[J].光電子·激光,2014(9):1818-1823.
Abstract: With the rapid development of information technology, human behavior recognition technology has been gradually introduced into various fields, such as security monitoring, motion analysis, medical assistant diagnosis and intelligent human-computer interaction, and the key to technology realization is to use the corresponding feature fusion method. This paper analyzed the related technology of human behavior recognition and the method of interest point extraction, scale mixed feature model and application of MKL, with a view to promot the development of human behavior recognition technology.
Key words: human behavior recognition; feature fusion; interest point extraction; multiple kernel learning