徐正
摘要:在智能技術(shù)的快速發(fā)展下,在人體行為識(shí)別中的應(yīng)用十分廣泛,為不斷提升智能終端識(shí)別的精準(zhǔn)度,可以對(duì)卷積神經(jīng)網(wǎng)絡(luò)分析進(jìn)行合理應(yīng)用,在深度學(xué)習(xí)下,對(duì)原始數(shù)據(jù)進(jìn)行高效的處理。在對(duì)數(shù)據(jù)進(jìn)行處理時(shí),是通過卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行分析的,識(shí)別的動(dòng)作包括走路、跑步等。本文的研究是建立在對(duì)比試驗(yàn)的基礎(chǔ)上的,通過對(duì)比對(duì)卷積神經(jīng)網(wǎng)絡(luò)識(shí)的別率進(jìn)行分析。深度學(xué)習(xí)是機(jī)器人領(lǐng)域中的重點(diǎn)研究?jī)?nèi)容,而卷積神經(jīng)網(wǎng)絡(luò)識(shí)是深度學(xué)習(xí)中的最佳代表,通過提升識(shí)別率,滿足相關(guān)產(chǎn)品或者行業(yè)的實(shí)際需求。
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);深度學(xué)習(xí);行為識(shí)別;人體行為
引言
由于現(xiàn)代人們?cè)谏钆c工作中的壓力較大,很多人都處于亞健康的狀態(tài),對(duì)健康的關(guān)注度較高,健康運(yùn)動(dòng)也成為當(dāng)下較為流行的方式。通過運(yùn)動(dòng)管理系統(tǒng),對(duì)人們每天的運(yùn)動(dòng)情況、身體健康狀況進(jìn)行監(jiān)測(cè),并督促人們完成健康運(yùn)動(dòng)項(xiàng)目。在對(duì)人體行為進(jìn)行識(shí)別時(shí),利用傳感器對(duì)相關(guān)的數(shù)據(jù)進(jìn)行采集,并對(duì)數(shù)據(jù)進(jìn)行分析,識(shí)別人們的行為。為不斷提升智能終端識(shí)別的精準(zhǔn)度,更好的為人們服務(wù),卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用十分重要。下面就對(duì)卷積神經(jīng)網(wǎng)絡(luò)分析下的人體行為識(shí)別深度學(xué)習(xí)分析進(jìn)行研究,希望能為相關(guān)的研究人員提供一些參考意見。
1 卷積神經(jīng)網(wǎng)絡(luò)概述
卷積神經(jīng)網(wǎng)絡(luò)屬于一種含卷積計(jì)算,具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),在深度學(xué)習(xí)中較為典型,為代表算法中的組成部分。表征學(xué)習(xí)是卷積神經(jīng)網(wǎng)絡(luò)的特征之一,對(duì)輸入的信息根據(jù)階層結(jié)構(gòu)進(jìn)行平移,不改變其分類。在二十世紀(jì)80年代人們開始對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行相關(guān)的研究,最早的卷積神經(jīng)網(wǎng)絡(luò)為L(zhǎng)eNet-5與時(shí)間延遲網(wǎng)絡(luò)。當(dāng)進(jìn)入新世紀(jì)之后,在現(xiàn)代科學(xué)技術(shù)的不斷進(jìn)步下,在深度學(xué)習(xí)理論的完善及優(yōu)化下,卷積神經(jīng)網(wǎng)絡(luò)得到很大發(fā)展,尤其是在計(jì)算機(jī)視覺等領(lǐng)域中,對(duì)卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用十分廣泛。卷積神經(jīng)網(wǎng)絡(luò)在我國(guó)的研究起步較晚,且缺乏相關(guān)的經(jīng)驗(yàn),但是我國(guó)依然加大對(duì)卷積神經(jīng)網(wǎng)絡(luò)的研究力度,不斷為我國(guó)科技進(jìn)步提供保障。
在分析卷積神經(jīng)網(wǎng)時(shí),不得不提深度學(xué)習(xí)。在機(jī)器人的學(xué)習(xí)理論中,深度學(xué)習(xí)理論是十分重要的組成部分,也是機(jī)器人高效發(fā)展的重要內(nèi)容。深度學(xué)習(xí)就是通過對(duì)人腦的高度模擬,形成的一種神經(jīng)網(wǎng)絡(luò),對(duì)數(shù)據(jù)的解釋,是建立在人腦的模仿機(jī)制上的。當(dāng)下的深度學(xué)習(xí)在聲音識(shí)別、圖片識(shí)別等領(lǐng)域中有著十分重要的應(yīng)用,并且也開始在人體行為識(shí)別中得到相關(guān)的應(yīng)用,且取得較為理想的效果。在智能手機(jī)領(lǐng)域,人體識(shí)別開始得到快速的應(yīng)用,并成為智能手機(jī)的重要功能。深度學(xué)習(xí)是機(jī)器人領(lǐng)域中的重要理論,在機(jī)器人的發(fā)展過程中發(fā)揮著不可替代的作用,尤其是在機(jī)器人人工智能的發(fā)展下,卷積神經(jīng)網(wǎng)絡(luò)更是通過對(duì)人腦的高度模仿,不斷提升其識(shí)別率,為機(jī)器人領(lǐng)域的發(fā)展提供幫助。
2 卷積神經(jīng)網(wǎng)絡(luò)分析下的人體行為識(shí)別深度學(xué)習(xí)模型
Matlab是實(shí)驗(yàn)進(jìn)行對(duì)環(huán)境,在該環(huán)境下,包括的主要內(nèi)容有數(shù)據(jù)采集系統(tǒng)過程、數(shù)據(jù)處理過程等。下面就進(jìn)行詳細(xì)的介紹:
2.1 數(shù)據(jù)采集系統(tǒng)
本文在研究時(shí)硬件平臺(tái)為ARM處理器的智能手機(jī),以Android系統(tǒng)為基礎(chǔ),從而搭建起數(shù)據(jù)采集器,行為是輕量級(jí)的,可以對(duì)信息進(jìn)行快速的采集。對(duì)15名用戶的行為數(shù)據(jù)進(jìn)行采集,年齡分別為20~30歲、30~40歲、40~50歲,人數(shù)分別為5人、8人及2人。這15人是智能手機(jī)用戶,所采集的信息為下樓、上樓、跑步、走路及靜止這5種。用戶的手機(jī)一般放置在正常的位置,比如在兜里、手里或者包里,對(duì)用戶的加速度信息采集10次,并且采集的時(shí)間將每次控制在10s,這時(shí)就要可以得到采集的相關(guān)數(shù)據(jù)。表1與表2對(duì)采集的相關(guān)數(shù)據(jù)進(jìn)行介紹:
2.2 數(shù)據(jù)處理
對(duì)采集到的數(shù)據(jù)進(jìn)行分析時(shí),首先要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,然后讀數(shù)據(jù)進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)處理,最后再進(jìn)行softmax分類。
第一,數(shù)據(jù)預(yù)處理
在實(shí)驗(yàn)時(shí)采用上述的數(shù)據(jù)進(jìn)行研究,將相關(guān)的數(shù)據(jù)輸入到卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行預(yù)處理。首先就要將數(shù)據(jù)處理為矩陣(120×30的矩陣a=(ax、ay、az))。在矩陣中,ax、ay、az分別代表手機(jī)坐標(biāo)系x方向上的加速度信息、手機(jī)坐標(biāo)y方向上的加速度信息及手機(jī)坐標(biāo)z方向上的加速度信息。在實(shí)驗(yàn)中,要對(duì)矩陣a的三個(gè)手機(jī)坐標(biāo)系進(jìn)行處理,變?yōu)?×360的行向量b,并將在az中的最后一項(xiàng)取出來,然后添加到行向量b中,這時(shí)就形成行向量c(1×361的),最后也要對(duì)行向量c進(jìn)行處理除了得到19×19的矩陣d[3]。
第二,數(shù)據(jù)的處理過程
當(dāng)經(jīng)過第一個(gè)階段的預(yù)處理,數(shù)據(jù)就可以進(jìn)入到卷積神經(jīng)網(wǎng)絡(luò)的卷積層中,然后數(shù)據(jù)在經(jīng)過卷積層后,就可以進(jìn)入到池化層,最大值與平均值方式是該層數(shù)據(jù)處理的重要手段,在局部小矩陣中的最大值作為映射層的輸出,這是最大值工作的方式,平均值在處理時(shí),是將平均值作為映射層的輸出。池化層的采用過程中進(jìn)行處理時(shí)本文是建立在平均值的方式上進(jìn)行的。在完成池化層的處理之后,便進(jìn)入到第三層的卷積過程,在這層中卷積的窗口達(dá)到了12個(gè),且第三層輸出的矩陣都是不相同的,為12個(gè)不同的8×8的矩陣。當(dāng)經(jīng)過這層的處理之后,就要經(jīng)過卷積神經(jīng)層的最后一層進(jìn)行池化過程。
第三,基于softmax的分類模型
經(jīng)過上面的數(shù)據(jù)處理,這時(shí)數(shù)據(jù)已經(jīng)成為了一個(gè)16×1×12對(duì)列矩陣,將列矩陣輸入到softmax分類器中,進(jìn)行分離,將需要分離的信息映射到對(duì)應(yīng)的標(biāo)簽上,這是softmax分類器的工作原理。在卷積神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)處理過程中,信息經(jīng)過后便會(huì)得到一個(gè)分類結(jié)果,然后通過與相對(duì)應(yīng)的標(biāo)簽進(jìn)行想比較,計(jì)算出誤差,然后經(jīng)過訓(xùn)練(訓(xùn)練次數(shù)為2000),并對(duì)卷積神經(jīng)網(wǎng)絡(luò)窗口中的權(quán)值誤差進(jìn)行縮小,并最后趨向于收斂,然后在網(wǎng)絡(luò)層中輸入測(cè)試集,并進(jìn)行分類。
3 結(jié)果討論
第一,樣本集測(cè)試。建模是在樣本的基礎(chǔ)上完成的,并將其中450份取出來進(jìn)行測(cè)試,通過實(shí)驗(yàn)發(fā)現(xiàn),卷積神經(jīng)網(wǎng)絡(luò)對(duì)人體行為識(shí)別的準(zhǔn)確率達(dá)到了92%。
第二,交叉實(shí)驗(yàn)。對(duì)整個(gè)樣本進(jìn)行隨機(jī)分類,分為3份,然后對(duì)其中的1份進(jìn)行測(cè)試,對(duì)2份進(jìn)行訓(xùn)練,也就是訓(xùn)練的樣本為300份,測(cè)試的樣本為150份,對(duì)5種行為中,隨機(jī)取30個(gè)在每個(gè)種類中。通過交叉實(shí)驗(yàn),可以更加接近分類的準(zhǔn)確度。通過實(shí)驗(yàn),5種行為的識(shí)別率計(jì)算出來。然后通過交叉實(shí)驗(yàn)的結(jié)果,進(jìn)行計(jì)算,得到靜止、行走、跑步、上樓及下樓的識(shí)別準(zhǔn)確率分別為100%、70%、
93.3%、90%及70%。卷積網(wǎng)絡(luò)神經(jīng)行為識(shí)別建模,測(cè)試集的準(zhǔn)確率與交叉實(shí)驗(yàn)證準(zhǔn)確率更高,分別達(dá)到92%與84.7,相比于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)或者M(jìn)VP,在本次實(shí)驗(yàn)中效果更好。
本文在分析中,對(duì)人體的5種常見行為為對(duì)象,并將手機(jī)放置在3重不同的位置,這時(shí)對(duì)用戶的加速度信息進(jìn)行采集,并將采集都的信息進(jìn)行整理,然后按照不同的方式進(jìn)行識(shí)別分類。卷積神經(jīng)網(wǎng)絡(luò)在本實(shí)驗(yàn)中識(shí)別率更高,相比于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)等機(jī)器人學(xué)習(xí)算法,更值得被推薦與應(yīng)用。但是在實(shí)驗(yàn)中也發(fā)現(xiàn),就走路、上樓及下樓的行為來看,識(shí)別率偏低,依然有待提升。在未來卷積神經(jīng)網(wǎng)絡(luò)在實(shí)際應(yīng)用中,需要注意的問題是需要不斷提升識(shí)別的準(zhǔn)確率,同時(shí)也要對(duì)網(wǎng)絡(luò)的泛化進(jìn)行發(fā)展。對(duì)網(wǎng)絡(luò)功能力進(jìn)行增強(qiáng)過程中,可以通過網(wǎng)絡(luò)結(jié)構(gòu)的改進(jìn)來完成,改進(jìn)的方式有很多,比如激活函數(shù)、卷積計(jì)算等,但是無(wú)論何種方式都需要在未來加大研究力度,不斷加強(qiáng)卷積神經(jīng)網(wǎng)絡(luò)的研究效果及應(yīng)用水平。
除了在智能手機(jī)中的應(yīng)用外,卷積神經(jīng)網(wǎng)絡(luò)還可以在視頻中得到應(yīng)用,所以也可以通過一款適用于視頻的網(wǎng)絡(luò)結(jié)構(gòu),加強(qiáng)在視頻中的應(yīng)用??臻g域是卷積神經(jīng)網(wǎng)絡(luò)作用的主要部分,要實(shí)現(xiàn)在視頻中的應(yīng)用,就要將其拓展到三維,也就是在空間中的二維,再加上時(shí)間維度,通過這樣的方式,實(shí)現(xiàn)三維卷積。在計(jì)算機(jī)視覺領(lǐng)域中,自動(dòng)識(shí)別時(shí)一項(xiàng)具有挑戰(zhàn)性的工作,當(dāng)然也是未來的發(fā)展方向之一。
4 結(jié)語(yǔ)
機(jī)器人算法在我國(guó)各行各業(yè)中的應(yīng)用十分廣泛,人體行為識(shí)別中也對(duì)機(jī)器人算法進(jìn)行了應(yīng)用,且取得了良好對(duì)應(yīng)用效果。在機(jī)器人算法中卷積神經(jīng)網(wǎng)絡(luò)是十分重要的組成部分,作為深度學(xué)習(xí)中的一員,可以通過對(duì)人腦的高度模仿,實(shí)現(xiàn)對(duì)人體行為的精準(zhǔn)識(shí)別。本文在分析時(shí)是通過對(duì)5種常見行為進(jìn)行采樣,并對(duì)三種的方式進(jìn)行進(jìn)行分析,得出的結(jié)論是卷積神經(jīng)網(wǎng)絡(luò)分析下的人體識(shí)別準(zhǔn)確率較高,可以滿足相關(guān)產(chǎn)品或者行業(yè)的需求。同時(shí)在現(xiàn)代科學(xué)技術(shù)不斷發(fā)展的背景下,在機(jī)器人學(xué)習(xí)領(lǐng)域深度學(xué)習(xí)也是潮流與方向,作為當(dāng)下深度學(xué)習(xí)的優(yōu)秀代表,卷積神經(jīng)網(wǎng)絡(luò)比傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)識(shí)別的準(zhǔn)確率更高。相信在未來深度識(shí)別技術(shù)一定會(huì)取得質(zhì)的飛躍,從而為機(jī)器人領(lǐng)域的發(fā)展提供技術(shù)支撐。
【參考文獻(xiàn)】
[1]蘇越.基于深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)圖像識(shí)別技術(shù)的研究分析探討[J].信息通信,2019(7): 7-8.
[2]張重遠(yuǎn),岳浩天,王博聞等.基于相似矩陣盲源分離與卷積神經(jīng)網(wǎng)絡(luò)的局部放電超聲信號(hào)深度學(xué)習(xí)模式識(shí)別方法[J].電網(wǎng)技術(shù),2019,43(6).
[3]陳國(guó)平,程秋菊,黃超意等.采用深度卷積神經(jīng)網(wǎng)絡(luò)方法的毫米波圖像目標(biāo)檢測(cè)[J].電訊技術(shù),2019,(10):1121-1126.
[4]程艷,葉子銘,王明文等.融合卷積神經(jīng)網(wǎng)絡(luò)與層次化注意力網(wǎng)絡(luò)的中文文本情感傾向性分析[J].中文信息學(xué)報(bào),2019,33(1).
[5]楊劍,劉寧,熊凌川等.基于卷積神經(jīng)網(wǎng)絡(luò)的阿爾茨海默病與行為異常型額顳葉癡呆的鑒別診斷模型研究[J].中華精神科雜志,2018,51(4):228-234.
[6]荊云建,胡曉依,宋志坤等.基于CNN-SVM的深度卷積神經(jīng)網(wǎng)絡(luò)軸承故障識(shí)別研究[J].振動(dòng)與沖擊,2019,38(18):173-178.