摘 要 人體行為的異常檢測一直是計(jì)算機(jī)領(lǐng)域的熱點(diǎn)問題,近些年,相關(guān)研究基于人體姿態(tài)及異常已經(jīng)解決了很多實(shí)際問題,但是由于人體行為異常檢測是依賴人體姿態(tài)研究所展開的,而傳統(tǒng)方法產(chǎn)生的姿態(tài)數(shù)據(jù)可靠性相對較低,為了進(jìn)一步提高行為異常檢測的準(zhǔn)確性,文中將引入深度學(xué)習(xí)算法,并做了無監(jiān)督學(xué)習(xí)進(jìn)行行為異常檢測的相關(guān)研究。
關(guān)鍵詞 無監(jiān)督學(xué)習(xí);行為異常檢測;相關(guān)研究
本文主要通過深度學(xué)習(xí)技術(shù),獲得人體姿態(tài)中各關(guān)節(jié)點(diǎn)信息,采取一定的方式存取數(shù)據(jù)后,通過無監(jiān)督學(xué)習(xí)對數(shù)據(jù)進(jìn)行特征提取及聚類分析,從而達(dá)到人體行為異常檢測的目的。
行為的異常檢測主要分為三個(gè)部分,即包括通過深度學(xué)習(xí)技術(shù)獲取置信度較高的人體關(guān)節(jié)點(diǎn)數(shù)據(jù),將數(shù)據(jù)進(jìn)行處理并通過EM算法提取人體特征,對特征做整理并進(jìn)行無監(jiān)督的聚類算法。在異常行為的檢測中,產(chǎn)生的姿態(tài)數(shù)據(jù)及人為定義的特征均無標(biāo)簽,因此無監(jiān)督學(xué)習(xí)可以從數(shù)據(jù)本身出發(fā),發(fā)掘深藏在數(shù)據(jù)中的規(guī)律,通過設(shè)定一定閾值分析行為特征,達(dá)到良好的聚類效果。
1AlphaPose人體姿態(tài)估計(jì)算法
AlphaPose是一種置信度較高的人體姿態(tài)估計(jì)算法,它的目標(biāo)就是通過分析圖片或視頻,獲取出現(xiàn)在其中人物的姿態(tài)信息即關(guān)節(jié)點(diǎn)坐標(biāo),直觀展示如圖1所示。
圖1? 人體姿態(tài)估計(jì)樣圖
通過網(wǎng)絡(luò)模型預(yù)測,生成json格式文件,其中包含身體既定關(guān)節(jié)點(diǎn)x與y軸的坐標(biāo)信息、幀數(shù)、置信度、id等字段。
2利用EM算法迭代求得特征
由于網(wǎng)絡(luò)模型的輸出包含多個(gè)信息,但相對雜亂,因此根據(jù)數(shù)據(jù)本身的特點(diǎn),建立了符合一定要求的隊(duì)列結(jié)構(gòu),隊(duì)列有著先進(jìn)先出的特點(diǎn),恰好符合我們對視頻流的要求。同時(shí)根據(jù)數(shù)據(jù)建立面向?qū)ο蟮母拍睿瑢?shí)例化多個(gè)對象對應(yīng)不同姿態(tài),從而方便后續(xù)的研究。
由于視頻是由多幀組成,同一個(gè)人可能在每一幀中都出現(xiàn),也有可能會(huì)有新的人物進(jìn)入視頻,所以獲得的數(shù)據(jù)文件是較為混亂的且包含多種多樣的信息。
根據(jù)這個(gè)問題,本文對數(shù)據(jù)的表達(dá)形式做了新的處理?;谘芯繉ο鬄槿梭w的姿態(tài),因此建立了姿態(tài)類包含多種屬性。同時(shí),定義了人體的特征,通過人體特征的定義,即可在一定程度上代表該人物的肢體動(dòng)作幅度。
EM算法是一種迭代優(yōu)化策略,它由E步(期望步)M步(極大步)所構(gòu)成。對已定義的特征求得每幀的均值和方差,通過EM算法找到一個(gè)合適的高斯分布,也就是確定高斯分布的參數(shù)。將特征值組合求得相應(yīng)的分布參數(shù)后,研究對象動(dòng)作在每幀的分布參數(shù)即可作為新的特征。
3無監(jiān)督學(xué)習(xí)的聚類算法進(jìn)行異常檢測
通過上述方法,已經(jīng)可以找到合適的方法獲取人體姿態(tài)的相關(guān)信息和較為科學(xué)的特征表示方法,在上文中定義了人體的七個(gè)動(dòng)作特征,選取特征通過不斷的迭代,得到我們用于聚類的新特征。
通過聚類會(huì)選取初始質(zhì)心,設(shè)定一定的閾值,不斷重復(fù),直到質(zhì)心位置變化小于指定的閾值,達(dá)到最大迭代次數(shù)。同時(shí)選取一定時(shí)間段,定義少數(shù)人的動(dòng)作為行為異常,以到達(dá)識(shí)別異常行為的目的。
4結(jié)果展示
目前,通過已有視頻的分析處理以及上文介紹的方法,已經(jīng)可以對一些視頻中的行為異常人群做出檢測,通過在原視頻中畫框以標(biāo)注出來。檢測結(jié)果如圖2所示。
圖2? 行為異常檢測展示圖
5結(jié)束語
雖然目前已對一些視頻中的異常行為做出了檢測,但仍有很多不足,真正應(yīng)用還有一些難題。主要集中于以下幾點(diǎn):
(1)場景復(fù)雜帶來的遮擋問題。
(2)人與人之間的遮擋問題。
考慮到復(fù)雜視頻的多變性,還需要有針對性地對一些細(xì)節(jié)進(jìn)行改進(jìn),通過大量理論研究及大量實(shí)驗(yàn),對現(xiàn)有研究方法及模型進(jìn)行微調(diào),從而以到達(dá)預(yù)期的、具有真正實(shí)用價(jià)值的異常行為檢測模型。
參考文獻(xiàn)
[1] 郁映卓.基于人體運(yùn)動(dòng)特征的異常行為檢測和姿態(tài)識(shí)別[D].西安:西安電子科技大學(xué),2011.
[2] 邱藤.基于高斯混合模型的EM算法及其應(yīng)用研究[D].北京:科技大學(xué),2015.
作者簡介
李樂(1994-),男,甘肅蘭州人;學(xué)歷:碩士,現(xiàn)就職單位:沈陽理工大學(xué),研究方向:大數(shù)據(jù)處理與分析技術(shù)。