• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于LSTM神經(jīng)網(wǎng)絡(luò)的仿人機(jī)器人循環(huán)步態(tài)的生成方法

      2020-12-21 09:55:06于建均左國玉阮曉鋼
      關(guān)鍵詞:仿人相空間步態(tài)

      于建均, 李 晨, 左國玉, 阮曉鋼, 王 洋

      (北京工業(yè)大學(xué)信息學(xué)部, 北京 100124)

      雙足機(jī)器人相較于輪式機(jī)器人具有良好的環(huán)境適應(yīng)性且因其具有類人的結(jié)構(gòu)可以代替人類在危險(xiǎn)、復(fù)雜的場景中工作. 因此雙足機(jī)器人被廣泛應(yīng)用在搶險(xiǎn)救災(zāi)、生活服務(wù)等場景下. 但因其雙足式結(jié)構(gòu)的不穩(wěn)定性在移動(dòng)時(shí)易產(chǎn)生晃動(dòng)甚至摔倒等問題,在雙足機(jī)器人研究領(lǐng)域中,循環(huán)步態(tài)規(guī)劃使機(jī)器人能完成長時(shí)間穩(wěn)態(tài)步行,因而成為該領(lǐng)域中主要的研究方向之一.

      人類在完成一系列步行動(dòng)作時(shí)的平衡性好且能長時(shí)間穩(wěn)定步行,其姿態(tài)、各個(gè)關(guān)節(jié)的角度、零力矩點(diǎn)(zero moment point,ZMP)等數(shù)據(jù)均被認(rèn)為最優(yōu). 因此,模仿人體步行動(dòng)作的方式被廣泛使用到仿人機(jī)器人的步態(tài)規(guī)劃中. 目前,人體步行的示教數(shù)據(jù)大多采用體感攝影機(jī)(如Kinect、Wil)的方式采集[1-3],但這種方式受到拍攝視野的限制,無法采集多個(gè)步態(tài)周期的人體示教數(shù)據(jù). 在機(jī)器人完成長時(shí)間的步行動(dòng)作時(shí)由多個(gè)單步態(tài)周期循環(huán)(或拼接)得到的關(guān)節(jié)角度序列會(huì)使機(jī)器人在運(yùn)動(dòng)過程中出現(xiàn)震動(dòng)或摔倒的情況. 因此,雙足機(jī)器人的循環(huán)步態(tài)規(guī)劃是機(jī)器人完成長時(shí)間穩(wěn)態(tài)步行任務(wù)的基礎(chǔ). 左國玉等[4]將仿袋鼠機(jī)器人簡化為倒立擺模型,并使用混合粒子群算法優(yōu)化線性二次型完成機(jī)器人的站立平衡控制,但其模型簡單,遷移至仿人機(jī)器人中不能保證機(jī)器人動(dòng)作的擬人性;Ibrahim等[5]通過對人體步行過程中單腳支撐(single support phase,SSP)和雙腳支撐(double support phase,DSP)2個(gè)關(guān)鍵過程的分析(通過Kinect采集示教數(shù)據(jù))以及反饋線性化的方式,使用多項(xiàng)式擬合關(guān)節(jié)角度軌跡函數(shù)的方式完成雙足機(jī)器人的步態(tài)循環(huán),但由于線性擬合在SSP和DSP過程中會(huì)出現(xiàn)擬合誤差大,導(dǎo)致機(jī)器人產(chǎn)生晃動(dòng)的問題;Kao-Shing 等[6]利用強(qiáng)化學(xué)習(xí)的方式學(xué)習(xí)Kinect體感采集器捕捉的人體步行動(dòng)作的關(guān)鍵幀,完成各個(gè)關(guān)節(jié)角度的規(guī)劃,使仿人機(jī)器人實(shí)現(xiàn)長時(shí)間穩(wěn)定步行,但是由于其采取的是無監(jiān)督的強(qiáng)化學(xué)習(xí)的方法,步行動(dòng)作的自然性和擬人性有所不足. 因此,需采取模仿精度更高的循環(huán)步態(tài)規(guī)劃方法使雙足機(jī)器人完成步行任務(wù). 由于人體在步行運(yùn)動(dòng)過程中的關(guān)節(jié)角度序列是時(shí)間序列,考慮通過采集多個(gè)單個(gè)人體步態(tài)周期的時(shí)間序列數(shù)據(jù)并對其進(jìn)行學(xué)習(xí),對時(shí)間序列進(jìn)行多個(gè)步態(tài)周期的準(zhǔn)確預(yù)測實(shí)現(xiàn)雙足機(jī)器人的步態(tài)循環(huán). 長短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)由Sepp等[7]提出,解決了傳統(tǒng)時(shí)間序列預(yù)測工具循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)的梯度消失和梯度爆炸問題,因此可以對RNN無法預(yù)測10個(gè)以上時(shí)間點(diǎn)的序列進(jìn)行準(zhǔn)確預(yù)測[8-9]. Wang等[10]利用2個(gè)LSTM神經(jīng)網(wǎng)絡(luò)分別完成對人體運(yùn)動(dòng)的識別和預(yù)測生成; Chellali等[11]利用LSTM神經(jīng)網(wǎng)絡(luò)對仿人機(jī)器人上肢各個(gè)關(guān)節(jié)的位置進(jìn)行預(yù)測,進(jìn)而對上肢動(dòng)作姿態(tài)預(yù)測,完成“拍手游戲”; Dickson等[12]使用LSTM神經(jīng)網(wǎng)絡(luò)對6個(gè)動(dòng)作進(jìn)行上肢10個(gè)關(guān)節(jié)角度的聯(lián)合學(xué)習(xí)和分類模仿.

      從目前的研究現(xiàn)狀可以看出,雖然體感攝影機(jī)Kinect受到視野限制出現(xiàn)采集示教數(shù)據(jù)不充足的問題,但其成本較低且Kinect-V2所采集的25個(gè)骨骼點(diǎn)信息,能充分滿足一般仿人機(jī)器人(如NAO機(jī)器人)的自由度控制要求,因此若可解決示教數(shù)據(jù)不足的問題,Kinect仍是一種能有效采集人體動(dòng)作示教數(shù)據(jù)的方式,依然可以在模仿學(xué)習(xí)的領(lǐng)域被研究和應(yīng)用.

      本文考慮通過LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測生成多個(gè)步態(tài)周期的仿人機(jī)器人步行關(guān)節(jié)角度序列,從而得到仿人機(jī)器人的循環(huán)步態(tài). 首先,通過Kinect體感采集器獲取多次人體步行動(dòng)作的時(shí)間序列數(shù)據(jù),并經(jīng)拼接和平滑處理過后,得到原始樣本集. 其次,由于初始樣本集為一維時(shí)間序列,但仿人機(jī)器人在步行時(shí)各個(gè)關(guān)節(jié)受多種因素影響,因此只通過目標(biāo)值對關(guān)節(jié)角度序列進(jìn)行長時(shí)間預(yù)測,序列的細(xì)節(jié)很難被學(xué)習(xí),且精確度不足. 通過C-C方法得到相空間重構(gòu)的時(shí)間延遲和嵌入維數(shù),進(jìn)行相空間重構(gòu),可得到一維關(guān)節(jié)角度序列的多維特征值,與目標(biāo)值一起構(gòu)成樣本集,可明顯提升關(guān)節(jié)角度預(yù)測的準(zhǔn)確性. 最后,使用此樣本集對基于LSTM神經(jīng)網(wǎng)絡(luò)的仿人機(jī)器人步行動(dòng)作關(guān)節(jié)序列預(yù)測模型進(jìn)行訓(xùn)練,使其預(yù)測生成多個(gè)步態(tài)周期的關(guān)節(jié)角度時(shí)間序列.

      1 基于相空間重構(gòu)的示教數(shù)據(jù)預(yù)處理

      Kinect-V2是一款成本較低的人機(jī)交互設(shè)備,所采集的人體步行動(dòng)作的示教信息可以很好地滿足仿人機(jī)器人的自由度控制要求(Kinect:25個(gè),仿人機(jī)器人:20~25個(gè)),但由于其視野有限,對于人體步行動(dòng)作(同一個(gè)示教者,步幅相同,步態(tài)周期相同)只能采集1.0~1.5個(gè)步態(tài)周期的示教數(shù)據(jù). 考慮采集多次人體步行示教數(shù)據(jù),經(jīng)過仿人機(jī)器人步態(tài)平衡模型映射,并使用拼接平滑的方式(直接循環(huán))進(jìn)行仿人機(jī)器人步態(tài)循環(huán),但由于這種方法存在2次采集過渡階段關(guān)節(jié)角度序列出現(xiàn)震蕩的問題,因此,需要對關(guān)節(jié)角度序列進(jìn)行預(yù)測生成來解決此問題. 考慮通過上述直接循環(huán)得到的關(guān)節(jié)角度序列作為初始樣本集,但直接使用它作為樣本集進(jìn)行預(yù)測,由于只有目標(biāo)值無其他特征值,預(yù)測精度不足以控制仿人機(jī)器人完成長時(shí)間穩(wěn)定步行動(dòng)作,因此,利用相空間重構(gòu)的方法獲取樣本的更多特征值,以提高預(yù)測模型的精度.

      1.1 多次人體示教數(shù)據(jù)采集

      使用Kinect 2.0在其視野范圍內(nèi)對人體的步行動(dòng)作進(jìn)行捕捉,得到人體全身25個(gè)骨骼點(diǎn)的軌跡,并記錄其三維坐標(biāo)(x,y,z). 由于Kinect是一款非專業(yè)的體感攝影機(jī),因此需要對其記錄的骨骼點(diǎn)軌跡進(jìn)行平滑處理. 通過空間向量法對人體骨骼點(diǎn)進(jìn)行計(jì)算得到示教步行動(dòng)作的各個(gè)關(guān)節(jié)角度的時(shí)間序列. 利用先前的研究成果[13]可以直接泛化得到使仿人機(jī)器人NAO穩(wěn)定步行的關(guān)節(jié)驅(qū)動(dòng)角度序列. 將得到的多次采集的示教數(shù)據(jù)進(jìn)行映射泛化,獲取機(jī)器人驅(qū)動(dòng)關(guān)節(jié)角度進(jìn)行拼接并平滑處理得到的關(guān)節(jié)角度,以在步行過程中對平衡性影響最大的髖關(guān)節(jié)俯仰角和踝關(guān)節(jié)滾動(dòng)角為例,見圖1、2.

      從圖2中可以看出,雖然直接拼接并進(jìn)行平滑處理的方法可以得到多個(gè)步態(tài)周期循環(huán)的關(guān)節(jié)角度序列,然而在拼接處(紅圈標(biāo)注)會(huì)出現(xiàn)明顯的震蕩. 由于采集2次示教數(shù)據(jù)時(shí),第1次采集的終止點(diǎn)非下一次的起始點(diǎn),因此使用這樣的關(guān)節(jié)角度序列驅(qū)動(dòng)仿人機(jī)器人完成步行動(dòng)作容易令機(jī)器人在拼接處出現(xiàn)晃動(dòng)甚至摔倒的現(xiàn)象. 因此要使仿人機(jī)器人完成長時(shí)間的穩(wěn)定步行,需對關(guān)節(jié)角度序列進(jìn)行預(yù)測并解決相鄰2次數(shù)據(jù)采集過渡處的波動(dòng)問題.

      1.2 基于相空間重構(gòu)的數(shù)據(jù)預(yù)處理

      關(guān)節(jié)角度序列本身受無奇異位姿、ZMP判據(jù)、運(yùn)動(dòng)協(xié)調(diào)關(guān)系和關(guān)節(jié)角度范圍等多種因素影響,采集到的仿人機(jī)器人步行關(guān)節(jié)角度時(shí)間序列是一維時(shí)間序列.

      x1={x1(1),x1(2),…,x1(500)}x2={x2(1),x2(2),…,x2(500)}

      (1)

      式中:x1為圖1中仿人機(jī)器人在行走時(shí)直接循環(huán)左腳踝關(guān)節(jié)滾動(dòng)角的時(shí)間序列;x2為圖2中的仿人機(jī)器人在行走時(shí)直接循環(huán)左腿髖關(guān)節(jié)時(shí)間序列(分別有500個(gè)時(shí)間步驟). 因此在對關(guān)節(jié)角度進(jìn)行預(yù)測之前,需要對該關(guān)節(jié)角度的一維時(shí)間序列進(jìn)行逆推即相空間重構(gòu)的預(yù)處理,從而得到關(guān)節(jié)角度序列的其他特征值,提高模型預(yù)測準(zhǔn)確性.

      根據(jù)相空間重構(gòu)理論[13]的嵌入定理可知,對一維時(shí)間序列(Kinect采集的仿人機(jī)器人步行動(dòng)作的關(guān)節(jié)角度數(shù)據(jù)即為一維時(shí)間序列)嵌入合適的維數(shù)m和時(shí)間延遲τ,重構(gòu)后的相空間與原系統(tǒng)具有相同的動(dòng)力學(xué)結(jié)構(gòu).

      由于m和τ具有較強(qiáng)的關(guān)聯(lián)性,二者的選擇不應(yīng)相互獨(dú)立,且m和τ的確定很大程度上影響了之后模型預(yù)測的準(zhǔn)確度,一般采用C-C方法[14]來同時(shí)計(jì)算合適的嵌入維數(shù)和時(shí)間延遲,首先定義關(guān)聯(lián)積分

      (2)

      式中:N為關(guān)節(jié)角度序列長度即500;M=N-(m-1)t是相空間重構(gòu)后相空間中的狀態(tài)點(diǎn)的個(gè)數(shù);t為子序列個(gè)數(shù);s為序列標(biāo)號.

      C-C方法的本質(zhì)[15]是計(jì)算嵌入維數(shù)m后與原序列的差值并求得最小值(最小化重構(gòu)后的多維序列的關(guān)聯(lián)性和原序列的關(guān)聯(lián)性的差異). 從而求得最佳的嵌入維數(shù)m和時(shí)間延遲τ,具體步驟為:

      將仿人機(jī)器人的步行動(dòng)作關(guān)節(jié)角度序列分為t個(gè)子序列,表達(dá)式為

      {x(1),x(1+t),…,x(1+(m-1)t)} {x(2),x(2+t),…,x(2+(m-1)t)} ? {x(t),x(2t),…,x(mt)}

      (3)

      定義目標(biāo)函數(shù)

      (4)

      定義差量

      ΔS(m,N,r,t)= max{S(m,N,r,t)}-min{S(m,N,r,t)}

      (5)

      該量度量了關(guān)于半徑r的最大偏差,它的最小值對應(yīng)了S的零點(diǎn)(由于實(shí)際的時(shí)間序列有限長,各個(gè)子序列非獨(dú)立同分布,因此實(shí)際求取到的S難以求得對所有半徑r的零點(diǎn)及它們所對應(yīng)的m和τ).

      (6)

      通過C-C方法,確定關(guān)節(jié)角度序列的m和τ后,可以完成仿人機(jī)器人步行動(dòng)作關(guān)節(jié)角度的1維時(shí)間序列進(jìn)行相空間重構(gòu),從而得到5維的時(shí)間序列,其中1維是關(guān)節(jié)角度的目標(biāo)值,剩余4維是重構(gòu)后的特征,踝關(guān)節(jié)重構(gòu)的相空間表達(dá)式為

      Y1(ti)=x(ti),x(ti+4),x(ti+8),…,x(ti+20),i=1,2,…

      (7)

      髖關(guān)節(jié)重構(gòu)后的相空間表達(dá)式為

      Y2(ti)=x(ti),x(ti+8),x(ti+16),…,x(ti+40),i=1,2,…

      (8)

      式中Y(ti)為m維相空間的第i個(gè)相點(diǎn).

      相空間重構(gòu)后的5維時(shí)間序列構(gòu)成最終樣本集,對時(shí)間預(yù)測模型進(jìn)行訓(xùn)練,由于特征增多可以明顯提升模型預(yù)測精度.

      2 仿人機(jī)器人步行動(dòng)作關(guān)節(jié)角度序列預(yù)測模型的建立

      獲取仿人機(jī)器人步行動(dòng)作的關(guān)節(jié)角度序列及其特征序列構(gòu)成的樣本集后,搭建結(jié)構(gòu)合理、精度較高且能預(yù)測多個(gè)時(shí)間步驟(長時(shí)間)的關(guān)節(jié)角度序列的模型成為使仿人機(jī)器人能夠完成長時(shí)間平穩(wěn)步行的主要問題,對關(guān)節(jié)角度序列的長時(shí)間準(zhǔn)確預(yù)測可以解決直接循環(huán)方法在2次采集過渡階段出現(xiàn)的不平滑而使機(jī)器人在動(dòng)作中出現(xiàn)晃動(dòng)和摔倒的問題.

      2.1 LSTM神經(jīng)網(wǎng)絡(luò)的基本原理

      LSTM神經(jīng)網(wǎng)絡(luò)解決了RNN梯度消失和梯度爆炸的問題,使該結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)能學(xué)習(xí)到時(shí)間序列的長期依賴,其神經(jīng)元結(jié)構(gòu)見圖5.

      其中,遺忘門的結(jié)構(gòu)表達(dá)式為

      ft=σ(Wf·([ht-1,xt]+bf))

      (9)

      (10)

      (11)

      式中:Wc為細(xì)胞狀態(tài)權(quán)值;bc為細(xì)胞狀態(tài)偏置;it為輸入門的輸出;ht為LSTM神經(jīng)元輸出.

      細(xì)胞狀態(tài)和遺忘門結(jié)構(gòu)的引進(jìn),解決了傳統(tǒng)RNN的梯度消失和爆炸問題. 這樣的前向結(jié)構(gòu)是LSTM 神經(jīng)網(wǎng)絡(luò)對多維時(shí)間序列的前后關(guān)系進(jìn)行學(xué)習(xí)的必要條件.

      由于仿人機(jī)器人步行動(dòng)作關(guān)節(jié)角度序列需要精準(zhǔn)控制,希望LSTM神經(jīng)網(wǎng)絡(luò)盡可能準(zhǔn)確地生成多個(gè)步態(tài)周期的關(guān)節(jié)角度時(shí)間序列(但不能過擬合導(dǎo)致學(xué)習(xí)到過渡階段的波動(dòng)). 而預(yù)測序列的準(zhǔn)確性則是由訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí)的誤差隨時(shí)間反向傳播機(jī)制決定.

      因此定義神經(jīng)網(wǎng)絡(luò)的目標(biāo)函數(shù)為誤差函數(shù)E,定義

      E=ht-yt

      (12)

      式中yt為樣本集中序列的真實(shí)值.

      (13)

      得到各個(gè)門結(jié)構(gòu)及細(xì)胞狀態(tài)各個(gè)時(shí)刻的偏差后,可以根據(jù)其定義,得到各個(gè)權(quán)重的偏差

      (14)

      通過上述誤差往回傳播的方法可以使LSTM在訓(xùn)練過程中通過自己預(yù)測的值與真實(shí)值之間的偏差去更新權(quán)值,使網(wǎng)絡(luò)可以精準(zhǔn)地學(xué)習(xí)時(shí)間序列并進(jìn)行預(yù)測.

      2.2 基于LSTM神經(jīng)網(wǎng)絡(luò)的仿人機(jī)器人步行動(dòng)作關(guān)節(jié)角度序列預(yù)測模型

      針對仿人機(jī)器人步行動(dòng)作關(guān)節(jié)角度序列的預(yù)測問題,LSTM神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)關(guān)節(jié)角度時(shí)間序列的各種特征,并根據(jù)這些特征對關(guān)節(jié)角度序列做出多個(gè)時(shí)間步驟的預(yù)測,從而實(shí)現(xiàn)仿人機(jī)器人步態(tài)循環(huán)的目的.

      LSTM神經(jīng)網(wǎng)絡(luò)是通過分析時(shí)間序列的前后關(guān)系的原理對序列進(jìn)行預(yù)測的. 因此對于類似股價(jià)這樣無周期性規(guī)律的時(shí)間序列預(yù)測效果并不理想. 從圖1、2中可以看出,仿人機(jī)器人在步行時(shí),關(guān)節(jié)角度曲線呈現(xiàn)明顯周期性. 因此,對于步行動(dòng)作的關(guān)節(jié)角度序列,經(jīng)過1個(gè)周期以上的樣本的訓(xùn)練,在預(yù)測時(shí)LSTM網(wǎng)絡(luò)可以準(zhǔn)確預(yù)測生成出多個(gè)步態(tài)周期的關(guān)節(jié)角度序列. 除周期性外,關(guān)節(jié)角度序列的前后關(guān)系明顯,在進(jìn)行預(yù)測時(shí)也能夠提升網(wǎng)絡(luò)的預(yù)測效果,且預(yù)測生成的序列利用神經(jīng)網(wǎng)絡(luò)的泛化能力,忽略了在2次測量過渡階段的抖動(dòng). 基于以上3點(diǎn),使用LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行關(guān)節(jié)角度序列的預(yù)測,可以保證仿人機(jī)器人在平地能進(jìn)行平穩(wěn)、長時(shí)間步行.

      由1.2節(jié)的內(nèi)容可知,仿人機(jī)器人關(guān)節(jié)角度的1維時(shí)間序列通過相空間重構(gòu)后得到5維的關(guān)節(jié)角度序列,即2.1節(jié)中時(shí)間序列的xt,并結(jié)合步行動(dòng)作的關(guān)節(jié)角度的目標(biāo)值即2.1節(jié)中樣本集的真實(shí)值yt,構(gòu)成LSTM神經(jīng)網(wǎng)絡(luò)的樣本集,并通過該樣本集訓(xùn)練仿人機(jī)器人步行動(dòng)作關(guān)節(jié)角度序列預(yù)測模型,使之能完成關(guān)節(jié)角度的預(yù)測任務(wù).

      分別以單層、雙層、三層的LSTM層數(shù)及每層不同的神經(jīng)元的網(wǎng)絡(luò)結(jié)構(gòu)預(yù)測仿人機(jī)器人步行動(dòng)作的關(guān)節(jié)角度序列,其實(shí)驗(yàn)結(jié)果如表1所示.

      表1 不同結(jié)構(gòu)的LSTM預(yù)測仿人機(jī)器人步行動(dòng)作關(guān)節(jié)角度誤差對比

      從表1中可以看出,使用LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測仿人機(jī)器人步行動(dòng)作關(guān)節(jié)角度序列時(shí),網(wǎng)絡(luò)層數(shù)為2時(shí)誤差最小,準(zhǔn)確度最高,且隨每層神經(jīng)元數(shù)量的增加,預(yù)測精度明顯提高. 但在實(shí)驗(yàn)中發(fā)現(xiàn),在每層神經(jīng)元數(shù)量增加到300及以上時(shí),會(huì)出現(xiàn)過擬合現(xiàn)象,見圖6. 因此,仿人機(jī)器人步行動(dòng)作關(guān)節(jié)角度序列預(yù)測模型選取的LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為:每層200個(gè)神經(jīng)元的兩層網(wǎng)絡(luò).

      在每層LSTM層后加入Dropout層有效起到了防止過擬合的作用. 誤差過大會(huì)導(dǎo)致各個(gè)關(guān)節(jié)角度之間不能協(xié)同動(dòng)作,導(dǎo)致機(jī)器人在步行時(shí)出現(xiàn)動(dòng)作不協(xié)調(diào)、晃動(dòng)摔倒的現(xiàn)象. 而過擬合則會(huì)將樣本集拼接處的特征也學(xué)習(xí)到,這樣生成的關(guān)節(jié)角度序列就失去了意義(與樣本集拼接的方式無差異).

      訓(xùn)練優(yōu)化算法為Adam算法,它結(jié)合了適應(yīng)梯度算法(為每一個(gè)參數(shù)保留一個(gè)學(xué)習(xí)率)和均方根傳播(將每一個(gè)參數(shù)的學(xué)習(xí)率進(jìn)行自適應(yīng))的特性,計(jì)算梯度的指數(shù)移動(dòng)指數(shù),既控制過擬合現(xiàn)象的發(fā)生又增加網(wǎng)絡(luò)預(yù)測序列的準(zhǔn)確性. 損失函數(shù)為MSE函數(shù)(均方誤差函數(shù))與權(quán)重衰減項(xiàng)的組合. MSE函數(shù)提高預(yù)測的準(zhǔn)確性,加入權(quán)重衰減項(xiàng)則是防止了過擬合現(xiàn)象的發(fā)生,其整體結(jié)構(gòu)如圖7所示.

      經(jīng)上述過程構(gòu)建出的仿人機(jī)器人步行動(dòng)作關(guān)節(jié)角度預(yù)測模型,經(jīng)過示教數(shù)據(jù)的訓(xùn)練,可準(zhǔn)確預(yù)測仿人機(jī)器人多個(gè)步態(tài)周期的步行動(dòng)作關(guān)節(jié)角度,驅(qū)動(dòng)仿人機(jī)器人完成長期穩(wěn)定的步行動(dòng)作,實(shí)現(xiàn)仿人機(jī)器人的步態(tài)循環(huán).

      3 實(shí)驗(yàn)和結(jié)果分析

      為了驗(yàn)證上述方法的有效性,設(shè)計(jì)實(shí)驗(yàn)步驟和環(huán)境如下:

      1)使用Kinect多次采集人體步行動(dòng)的示教數(shù)據(jù)并利用仿人機(jī)器人步態(tài)平衡模型泛化出仿人機(jī)器人的步行關(guān)節(jié)角度序列數(shù)據(jù),并將多次采集泛化得到的機(jī)器人關(guān)節(jié)角度序列進(jìn)行拼接和平滑處理,得到各個(gè)關(guān)節(jié)角度序列的原始樣本集.

      2)使用相空間重構(gòu)的方法對原始樣本集進(jìn)行進(jìn)一步預(yù)處理,從原始樣本集的1維機(jī)器人步行動(dòng)作的關(guān)節(jié)角度時(shí)間序列中提取更多特征值,構(gòu)成最終的樣本集.

      3)用樣本集中的5維時(shí)間序列(第1列為關(guān)節(jié)角度序列的目標(biāo)值,其余4列為相空間重構(gòu)后得到的特征值)對搭建好的LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行20個(gè)時(shí)期的訓(xùn)練,并在訓(xùn)練完成后,對之后的多個(gè)步態(tài)周期的關(guān)節(jié)角度序列進(jìn)行預(yù)測.

      4)將本文方法和不經(jīng)過相空間重構(gòu)的方法以及單層LSTM神經(jīng)網(wǎng)絡(luò)、三層神經(jīng)網(wǎng)絡(luò)(多層)的效果進(jìn)行對比,體現(xiàn)本文方法的優(yōu)越性.

      5)使用預(yù)測得到的各個(gè)關(guān)節(jié)角度的時(shí)間序列在WEBOTS仿真平臺中驅(qū)動(dòng)NAO仿人機(jī)器人完成長時(shí)間的穩(wěn)定步行,體現(xiàn)本文方法的有效性. 整體結(jié)構(gòu)流程圖如圖8所示.

      3.1 用于仿人機(jī)器人步行動(dòng)作關(guān)節(jié)角度序列預(yù)測的LSTM神經(jīng)網(wǎng)絡(luò)的訓(xùn)練與測試

      選擇仿人機(jī)器人在步行過程中對人體平衡最重要的髖關(guān)節(jié)俯仰角和踝關(guān)節(jié)滾動(dòng)角作為研究對象,由于人體(仿人機(jī)器人同樣)左右對稱因此以左腿髖關(guān)節(jié)俯仰角和左腳踝關(guān)節(jié)滾動(dòng)角為例. 采集10次的人體步行動(dòng)作的關(guān)節(jié)角度的時(shí)間序列,并通過仿人機(jī)器人步態(tài)平衡模型泛化得到仿人機(jī)器人步行動(dòng)作的關(guān)節(jié)角度數(shù)據(jù),經(jīng)拼接和平滑處理后2個(gè)關(guān)節(jié)角度各自有500個(gè)時(shí)間步驟的時(shí)間序列作為初始樣本集. 通過1.2節(jié)中所述的相空間重構(gòu)的方法獲取4維的特征值序列(加入關(guān)節(jié)角度目標(biāo)值序列后共5維),時(shí)間延遲τ為4,組成最終的樣本集. 前75%作為訓(xùn)練集,后25%作為測試集. 對LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,通過20個(gè)時(shí)期的訓(xùn)練,以其中1個(gè)關(guān)節(jié)角度(左腳踝關(guān)節(jié)滾動(dòng)角)為例,LSTM神經(jīng)網(wǎng)絡(luò)的均方誤差變化曲線如圖9所示.

      經(jīng)過訓(xùn)練后,利用樣本集中的25%的測試集對LSTM神經(jīng)網(wǎng)絡(luò)的效果進(jìn)行評估,為了驗(yàn)證本文方法的優(yōu)越性,使用本文搭建的LSTM神經(jīng)網(wǎng)絡(luò)對原始數(shù)據(jù)集(不經(jīng)過相空間重構(gòu))進(jìn)行預(yù)測,對比2種方法的效果,2種方法的預(yù)測效果如表2所示,沒有經(jīng)過相空間重構(gòu)的LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測曲線如圖10、11所示,經(jīng)相空間重構(gòu)后的關(guān)節(jié)角度曲線如圖12、13所示.

      表2 LSTM預(yù)測仿人機(jī)器人步行動(dòng)作關(guān)節(jié)角度誤差

      NAO機(jī)器人髖關(guān)節(jié)俯仰角變化范圍為-1.770~0.484,踝關(guān)節(jié)滾動(dòng)角變化范圍為-0.769~0.398. 從表2中可以看出,經(jīng)LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測得到多個(gè)步態(tài)周期的關(guān)節(jié)角度的時(shí)間序列,與沒有經(jīng)過相空間重構(gòu)相比,由于獲取了更多的特征值,均方誤差有了明顯下降,預(yù)測精度更高.

      從圖10~11可以看出對沒有經(jīng)過相空間重構(gòu)的關(guān)節(jié)角度序列,由于是1維時(shí)間序列,預(yù)測精度不足,對關(guān)節(jié)角度序列的一些細(xì)節(jié)不能很好地學(xué)習(xí),而經(jīng)過相空間重構(gòu)后,由于有了更多特征值,對關(guān)節(jié)角度序列的一些細(xì)節(jié)也能夠充分學(xué)習(xí). 使用LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測多個(gè)步態(tài)周期的關(guān)節(jié)角度序列,LSTM記憶關(guān)節(jié)角度序列的特性使直接循環(huán)關(guān)節(jié)角度序列所出現(xiàn)2次測量過渡時(shí)的起始點(diǎn)非終止點(diǎn)的問題得到解決(預(yù)測得到的時(shí)間序列不存在拼接處不平滑問題),關(guān)節(jié)角度序列在步態(tài)周期的過渡階段平滑連接,使仿人機(jī)器人在長時(shí)間的步行動(dòng)作中不會(huì)出現(xiàn)晃動(dòng)或摔倒的問題.

      與傳統(tǒng)的基于人體示教數(shù)據(jù)的仿人機(jī)器人步態(tài)規(guī)劃算法[16]相比,本文提出的基于LSTM神經(jīng)網(wǎng)絡(luò)的仿人機(jī)器人循環(huán)步態(tài)生成方法能有效增加機(jī)器人模仿人體步行動(dòng)作的周期數(shù),且不會(huì)出現(xiàn)直接循環(huán)單次采集的人體示教數(shù)據(jù)產(chǎn)生的拼接處不平滑的問題(如圖12、13所示). 從而保證機(jī)器人能夠完成長時(shí)間穩(wěn)定步行的任務(wù).

      3.2 WEBOTS平臺下的仿人機(jī)器人步行仿真

      為了驗(yàn)證本文方法的有效性,使用上述方法得到的各個(gè)關(guān)節(jié)角度的時(shí)間序列(主要為下肢的10個(gè)關(guān)節(jié)角度,左右腿各5個(gè)分別為:膝關(guān)節(jié)俯仰角,踝關(guān)節(jié)俯仰角和滾動(dòng)角,髖關(guān)節(jié)俯仰角和滾動(dòng)角)去驅(qū)動(dòng)WEBOTS仿真平臺中的NAO機(jī)器人使其進(jìn)行長時(shí)間的步行動(dòng)作,其零力矩點(diǎn)信息(判定機(jī)器人是否動(dòng)態(tài)穩(wěn)定的判據(jù))如圖14所示,其動(dòng)作姿態(tài)如圖15、16所示.

      從NAO機(jī)器人的姿態(tài)可以看出,NAO機(jī)器人在長時(shí)間的步行過程中,機(jī)器人姿態(tài)穩(wěn)定,不會(huì)出現(xiàn)晃動(dòng)或摔倒的情況,使用本文方法預(yù)測得到仿人機(jī)器人步行動(dòng)作的關(guān)節(jié)角度的時(shí)間序列能有效地驅(qū)動(dòng)NAO機(jī)器人進(jìn)行長時(shí)間穩(wěn)定步行動(dòng)作.

      4 結(jié)論

      1) 通過相空間重構(gòu)對多次采集的人體步行動(dòng)作關(guān)節(jié)角度序列(經(jīng)過仿人機(jī)器人步態(tài)平衡模型泛化得到仿人機(jī)器人的關(guān)節(jié)角度序列)處理,得到仿人機(jī)器人完成步行動(dòng)作時(shí)關(guān)節(jié)角度時(shí)間序列的更多特征值.

      2) 使用雙層LSTM神經(jīng)網(wǎng)絡(luò)(每層200個(gè)神經(jīng)元)進(jìn)行預(yù)測,可以得到多個(gè)步態(tài)周期的關(guān)節(jié)角度的時(shí)間序列,解決了由于Kinect攝影機(jī)視野限制導(dǎo)致的、仿人機(jī)器人不能模仿人體完成長時(shí)間穩(wěn)定步行動(dòng)作任務(wù)的問題.

      3) 通過對比經(jīng)過相空間重構(gòu)和不經(jīng)過相空間重構(gòu)的樣本集進(jìn)行預(yù)測的效果以及使用預(yù)測得到的機(jī)器人關(guān)節(jié)序列在WEBOTS平臺上驅(qū)動(dòng)NAO機(jī)器人,觀察其運(yùn)動(dòng)效果,驗(yàn)證本文方法的有效性和優(yōu)越性.

      4) 下一步的工作希望利用LSTM聯(lián)合多個(gè)序列聯(lián)合分類學(xué)習(xí)的功能[17],對多種步態(tài)示教動(dòng)作的各個(gè)關(guān)節(jié)角度信息進(jìn)行聯(lián)合學(xué)習(xí),進(jìn)行分類以及模仿完成各種步態(tài)的長時(shí)間穩(wěn)定步行以完善仿人機(jī)器人對人體步行動(dòng)作的學(xué)習(xí)任務(wù)[18-19].

      猜你喜歡
      仿人相空間步態(tài)
      小螞蟻與“三角步態(tài)”
      束團(tuán)相空間分布重建技術(shù)在西安200 MeV質(zhì)子應(yīng)用裝置的應(yīng)用
      基于面部和步態(tài)識別的兒童走失尋回系統(tǒng)
      電子制作(2018年18期)2018-11-14 01:48:04
      異構(gòu)遙操作仿人機(jī)械臂靈巧作業(yè)控制
      基于Kinect的學(xué)步期幼兒自然步態(tài)提取
      非對易空間中的三維諧振子Wigner函數(shù)
      探究仿人機(jī)器人設(shè)計(jì)及步行控制方法
      具有面部表情的仿人頭部機(jī)器人系統(tǒng)的研制
      基于相空間重構(gòu)的電磁繼電器電性能參數(shù)預(yù)測研究
      便宜假肢能模仿正常步態(tài)
      洪湖市| 昌图县| 凉山| 白朗县| 墨竹工卡县| 综艺| 和政县| 安庆市| 黄龙县| 郓城县| 江永县| 桦甸市| 睢宁县| 潍坊市| 新巴尔虎左旗| 隆子县| 光泽县| 茂名市| 邵武市| 涪陵区| 高陵县| 阳曲县| 香格里拉县| 浙江省| 祁连县| 当涂县| 南宁市| 洞头县| 南安市| 定兴县| 齐河县| 濮阳县| 垫江县| 勐海县| 房产| 台南县| 林甸县| 淳安县| 韶关市| 渭南市| 桑日县|