• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種基于改進(jìn)DTWIMP算法的手勢識別

      2017-12-02 17:06:19趙磊周亦敏
      軟件導(dǎo)刊 2017年11期
      關(guān)鍵詞:手勢識別

      趙磊+周亦敏

      摘要:手勢識別是一種多維空間應(yīng)用,而傳統(tǒng)DTW算法只能解決一維問題,對其進(jìn)行拓展,演化為不同維度運(yùn)用,得到一種全新基于改進(jìn)的新型算法DTWIMP,它能計(jì)算兩個N維時間序列之間的距離。以歐氏距離為元素組成矩陣,根據(jù)Bellman最優(yōu)化原理得到最優(yōu)規(guī)整路徑,結(jié)合預(yù)先錄入的手勢模版,實(shí)現(xiàn)動態(tài)手勢識別。

      關(guān)鍵詞關(guān)鍵詞:DTW;DTWIMP;歐氏距離;Bellman最優(yōu)化;手勢識別

      DOIDOI:10.11907/rjdk.171904

      中圖分類號:TP3-0

      文獻(xiàn)標(biāo)識碼:A文章編號文章編號:16727800(2017)011001204

      0引言

      計(jì)算機(jī)視覺技術(shù)飛速發(fā)展,人機(jī)交互技術(shù)(Human Computer Interaction,HCI)顯得愈發(fā)重要。人機(jī)交互最終目標(biāo)是人與計(jì)算機(jī)能以更直觀、自然的方式進(jìn)行交流,所謂自然交互方式是指將人與人交流的手段引入HCI。對此國內(nèi)外學(xué)者開展了大量研究,包括人臉與人體識別、面部表情、體態(tài)交互技術(shù)研究。手勢作為人機(jī)交互領(lǐng)域重要一環(huán),具有直觀性、自然性特點(diǎn),在交互式游戲、家電控制、手語識別、模擬訓(xùn)練及機(jī)器人控制領(lǐng)域得到了廣泛應(yīng)用。

      使用傳感器(深度攝像機(jī)或LeapMotion)捕獲手勢運(yùn)動軌跡[1]。對于靜態(tài)手勢只需關(guān)心空間中手的位置與形狀;對于動態(tài)手勢實(shí)質(zhì)上需識別手勢軌跡,重點(diǎn)在于如何準(zhǔn)確在手勢時間序列上檢測到手勢起始點(diǎn)與終止點(diǎn),規(guī)避手勢交互中回程問題。本文對一維DTW加以拓展與改進(jìn),通過實(shí)驗(yàn)驗(yàn)證其在動態(tài)手勢識別中的重要作用。

      1DTW算法分析與改進(jìn)

      動態(tài)時間規(guī)整(Dynamic Time Warping,DTW)算法是一種動態(tài)規(guī)劃技術(shù),對非線性時間歸一化后進(jìn)行模式匹配[2]。該算法是種彈性匹配算法,用以解決兩個時間序列在時間軸上長度不規(guī)整問題。

      DTW算法可實(shí)現(xiàn)對于不同長度時間序列相似性的判斷,傳統(tǒng)DTW算法都是針對一維特征輸入情況,由于手勢輸入特征是多維的,需要能夠計(jì)算2個N維時間序列之間距離的算法,為此本文提出基于改進(jìn)的DTWIMP算法,原理如下:

      假定有兩個不同時間序列X={x1,x2,…,xx}T與Y={y1,y2,…,yy}T,其中xi,yj是N維的向量,該時間序列長度分別為X與Y,構(gòu)造規(guī)整路徑Z={z1,z2,…,zz}T。因此規(guī)整路徑序列Z的長度定義如下:

      3實(shí)驗(yàn)分析驗(yàn)證

      3.1模板相似度分析

      獲取模板距離后,可根據(jù)相似度公式分別計(jì)算出當(dāng)前輸入序列與各手勢模板之間相似度(見圖6)。橫軸代表手勢模板類型,不同線型代表當(dāng)前輸入序列與模板相似度。以手勢O為例,定義輸入序列與模板序列之間相似度為Likehoods,可得輸入序列與手勢模板O之間相似度最大,Likehoodsmax=0.365,而該輸入序列與其他模板手勢相似度明顯低于該值,表明該輸入序列最可能的分類標(biāo)簽是手勢O。其余手勢相似度曲線可由類似分析得到結(jié)論。

      圖6測試序列與參考模板相似度

      3.2模型平均正確分類比率分析

      評估DTWIMP算法對應(yīng)不同訓(xùn)練樣本的分類性能,對于MCI系統(tǒng)而言極其重要,因?yàn)槿绻褂?組訓(xùn)練樣本與使用30組樣本能達(dá)到同樣分類性能,則數(shù)據(jù)采集及訓(xùn)練階段將會節(jié)省大量時間。

      ACCR(Average Correct Classification Ratio)代表平均分類正確率,為了驗(yàn)證每種手勢樣本訓(xùn)練數(shù)據(jù)集大小對DTWIMP算法分類性能影響(如3組樣本訓(xùn)練集得到分類器性能與20組樣本訓(xùn)練集得到分類器性能肯定不同)。設(shè)計(jì)如下實(shí)驗(yàn):選取10名參與者,對同一種手勢分別進(jìn)行η(3≤η≤20)次樣本數(shù)據(jù)實(shí)驗(yàn),因估計(jì)模板閾值至少需要3組訓(xùn)練樣本,所以最小取值3而非1。為避免選取實(shí)驗(yàn)樣本出現(xiàn)“極好”情況(隨機(jī)挑選訓(xùn)練數(shù)據(jù)得到最好模板),η的取值應(yīng)重復(fù)10次,分別記錄每一次ACCR值,盡量保證訓(xùn)練樣本質(zhì)量在同一水平,記錄ACCR平均值來驗(yàn)證算法性能(見圖7)。

      圖7分類正確率與樣本數(shù)量關(guān)系

      從上述數(shù)據(jù)可以看出,DTWIMP算法在訓(xùn)練集大小為3時,ACCR達(dá)到了74.55%正確率,在訓(xùn)練集大小為20時,達(dá)到了94.18%的正確率。ACCR總體趨勢是大小與訓(xùn)練集樣本數(shù)量呈正比趨勢,訓(xùn)練集大小達(dá)到12時,ACCR值超過90%(虛線);訓(xùn)練集大小超過12后,ACCR提升并不明顯。

      實(shí)驗(yàn)發(fā)現(xiàn),η的每次重復(fù)實(shí)驗(yàn)中,10名參與者標(biāo)準(zhǔn)偏差非常大,這表明DTWIMP分類性能很大程度取決于訓(xùn)練樣本質(zhì)量,例如某些參與者使用3組樣本數(shù)據(jù)得到了ACCR值大于90%的結(jié)果,而另一些參與者使用3組不同質(zhì)量樣本集卻得到了ACCR值小于70%的結(jié)果。說明樣本集質(zhì)量好壞對于分類算法結(jié)果具有重要影響。從圖7可以看出,實(shí)際手勢模板訓(xùn)練中,綜合算法魯棒性及節(jié)約時間考慮,每種手勢樣本集大小不少于12即可得到90%以上分類正確率。

      3.3算法改進(jìn)前后實(shí)時性對比

      DTWIMP算法對全局規(guī)整進(jìn)行邊界約束,減少模板匹配所需計(jì)算次數(shù),節(jié)省規(guī)整時間,提高了算法實(shí)時性[10]。以本文6種手勢樣本為例,分別重復(fù)進(jìn)行50次預(yù)測實(shí)驗(yàn),記錄算法改進(jìn)前后50次預(yù)測時間,圖8為改進(jìn)前后手勢O預(yù)測時間對比。

      圖8算法改進(jìn)前后手勢O預(yù)測時間對比

      通過計(jì)算,6種手勢算法改進(jìn)前平均耗時37.75ms,改進(jìn)后平均耗時25.75ms,驗(yàn)證了經(jīng)過路徑約束后,算法實(shí)時提高31.79%(見表1)。

      4結(jié)語

      DTWIMP算法為多元狀態(tài)空間動態(tài)手勢提供了強(qiáng)大分類能力,實(shí)驗(yàn)結(jié)果證明該算法對于預(yù)定義的幾種手勢(在數(shù)據(jù)預(yù)分割與有限訓(xùn)練數(shù)據(jù)集條件下)有著優(yōu)秀分類性能,同時該算法對于連續(xù)數(shù)據(jù)流中包含無關(guān)空手勢的情況也取得了合適的分類結(jié)果。endprint

      本文基于傳統(tǒng)動態(tài)時間規(guī)劃算法提出了多維狀態(tài)空間DTWIMP算法,對全局規(guī)劃路徑進(jìn)行限制,通過改進(jìn)后DTWIMP算法對手勢特征輸入進(jìn)行訓(xùn)練,輔以相應(yīng)濾波、預(yù)處理、后處理,并通過KFolds折交叉驗(yàn)證模型健壯性。實(shí)驗(yàn)結(jié)果證明,較之基于顏色空間、手型等識別方法,該方法對于復(fù)雜背景具有良好適應(yīng)性與魯棒性,識別速度與識別準(zhǔn)確率均有提高。另外,本文只研究了動態(tài)手勢,但很多場景下靜態(tài)手勢識別也非常重要,因此如何提取手型特征將是一個難點(diǎn)

      參考文獻(xiàn)參考文獻(xiàn):

      [1]余旭.基于Kinect傳感器的動態(tài)手勢識別[D].重慶:西南大學(xué),2014.

      [2]楊潔,康寧.動態(tài)時間規(guī)整DTW算法的研究[J].科技與創(chuàng)新,2016(4):1112.

      [3]WANG L, ZHANG Y, FENG J. On the euclidean distance of images[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence,2005,27(8):13341339.

      [4]徐波,于勁松,李行善.基于路徑約束的動態(tài)時間規(guī)整方法研究[J].系統(tǒng)工程與電子技術(shù),2004,26(1):103105.

      [5]吳宇瓊,楊巧梅.Bellman最優(yōu)模型的應(yīng)用[J].北方經(jīng)貿(mào),2007(8):142144.

      [6]HERNANDEZVELA A, BAUTISTA M A, PEREZSALA X, et al. BoVDW: bagofvisualanddepthwords for gesture recognition[C].International Conference on Pattern Recognition,2012:449452.

      [7]F CHANG, HC CHEN, HC LIU. Double kfolds in SVM[C]. Blumenau:Innovative Mobile and Internet Services in Ubiquitous Computing (IMIS),2015.

      [8]高岳林,徐成賢.邊界約束非凸二次規(guī)劃問題的分枝定界方法[J].運(yùn)籌學(xué)學(xué)報(bào),2001,5(4):8189.

      [9]曲智國,高穎慧,王平,等.基于空頻域聯(lián)合閾值分割的輪廓檢測方法[J].計(jì)算機(jī)科學(xué),2012,39(10):286289.

      [10]柯映林,賈明.帶邊界約束的B樣條曲面逼近[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2003,15(12):15491553.

      責(zé)任編輯(責(zé)任編輯:何麗)endprint

      猜你喜歡
      手勢識別
      基于手勢識別的工業(yè)機(jī)器人操作控制方法
      基于紅外的非接觸式手勢識別系統(tǒng)設(shè)計(jì)
      基于嵌入式的智能手表設(shè)計(jì)
      復(fù)雜背景下的手勢識別方法
      基于SIFT算法的手勢控制系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
      一種靜態(tài)手勢數(shù)字識別的實(shí)現(xiàn)及應(yīng)用
      基于Kinect的體感虛擬鼠標(biāo)研究與開發(fā)
      軟件(2016年2期)2016-04-08 02:14:26
      基于LeapMotion 的數(shù)字手勢識別
      基于手勢識別的人機(jī)交互技術(shù)研究
      一種基于Kinect的手勢識別系統(tǒng)
      甘南县| 延庆县| 庄浪县| 开鲁县| 汕头市| 白河县| 新泰市| 新昌县| 论坛| 铁岭市| 郑州市| 黑龙江省| 广东省| 淮安市| 厦门市| 通州市| 萍乡市| 内乡县| 荣成市| 新竹县| 五寨县| 武清区| 白朗县| 东阿县| 库尔勒市| 大关县| 惠东县| 聊城市| 正宁县| 阳谷县| 马尔康县| 桓台县| 成安县| 邵东县| 建湖县| 万宁市| 东港市| 定安县| 宣汉县| 无极县| 安国市|