• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于LSTM的空間機器人系統(tǒng)慣性張量在軌辨識

      2021-11-30 14:38:16初未萌楊今朝鄔樹楠吳志剛
      航空學報 2021年11期
      關(guān)鍵詞:張量慣性連桿

      初未萌,楊今朝,鄔樹楠,吳志剛

      1.大連理工大學 航空航天學院,大連 116024

      2.大連理工大學 工業(yè)裝備結(jié)構(gòu)分析國家重點實驗室,大連 116024

      隨著在軌航天器的逐年增多,空間中充斥著大量因燃料耗盡或故障等原因造成失控的航天器[1-3]。這些失控的航天器一般為慣性參數(shù)未知的非合作目標,嚴重影響空間軌道上其他正常運行航天器的安全。針對這一問題,目前世界各國都在大力發(fā)展基于空間機器人的在軌服務(wù)技術(shù),以實現(xiàn)對失控航天器的抓捕與維修[1]??臻g機器人在抓捕目標的過程中需要改變其本身構(gòu)型,整體系統(tǒng)的慣性張量會隨時間產(chǎn)生較大變化,特別是目標被捕獲瞬間會造成系統(tǒng)慣性張量的突變。如果無法了解構(gòu)型改變以及目標抓捕對整體系統(tǒng)慣性張量的影響,當系統(tǒng)在抓捕過程中發(fā)生非預期改變時將不能實現(xiàn)有效的整體姿態(tài)控制。因此,對空間機器人整個抓捕過程的慣性張量進行在軌實時辨識是十分必要的。

      目前,涉及空間機器人慣性張量辨識方面的研究已經(jīng)取得了許多成果。Murotsu等[4]根據(jù)空間機器人機械臂關(guān)節(jié)運動所引起的整體位姿變化,分別運用基于動量守恒原理與基于Newton-Euler運動方程2種辨識方法對抓捕目標慣性參數(shù)進行辨識。王明等[5]基于機械臂的運動實現(xiàn)了對組合航天器慣性參數(shù)的辨識。侯振東等[6]提出了一種基于推力器激勵的組合航天器慣性參數(shù)辨識方法。張博等[7]采用自適應(yīng)反作用零空間控制方法,使得空間機器人可以在基體姿態(tài)擾動最小的情況下,辨識捕獲的大型非合作目標的慣性參數(shù)。Chu等[8]直接利用機械臂末端執(zhí)行器抓捕目標所反饋的接觸力信息辨識其慣性參數(shù)。Xu等[9]提出的方法首先需要對整個組合航天器的慣性參數(shù)進行辨識,然后利用辨識出的參數(shù)來推導組合航天器各子部分的慣性參數(shù)。以上方法對空間機器人慣性張量的辨識都達到了較高精度,但是這些方法主要解決的是目標已被捕獲且所辨識的參數(shù)是常量的情況,針對在整個抓捕過程中隨時間變化且會發(fā)生突變的系統(tǒng)慣性張量實時辨識問題的研究則較為少見。

      隨著人工智能技術(shù)的發(fā)展,人工神經(jīng)網(wǎng)絡(luò)(ANN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)等智能技術(shù)已經(jīng)廣泛用于眾多領(lǐng)域的研究[10-12]。其中RNN中的長短期記憶(Long-Short Term Memory, LSTM)網(wǎng)絡(luò)在處理復雜時間序列問題上具有較大優(yōu)勢。LSTM網(wǎng)絡(luò)可以有效捕獲復雜時序數(shù)據(jù)中的長期依賴信息,并進行建模,近年來在時變參數(shù)辨識、故障診斷等領(lǐng)域都獲得了成功的應(yīng)用[13-15]。

      根據(jù)以上分析,針對空間機器人在抓捕失控目標過程中復雜時變的系統(tǒng)慣性張量辨識問題,本文提出一種基于LSTM的系統(tǒng)慣性張量在軌智能辨識方法,并利用仿真數(shù)據(jù)對采用本文方法構(gòu)建的參數(shù)辨識網(wǎng)絡(luò)的有效性進行驗證。

      1 空間機器人建模

      對抓捕過程中的空間機器人進行建??梢苑譃?個階段:目標捕獲前和目標捕獲后。研究的目標捕獲前空間機器人模型如圖1所示,空間機器人是由一個航天器基體和一個具有2個連桿的機械臂組成,機械臂上的每個連桿假設(shè)只有一個轉(zhuǎn)動自由度。圖1中:ΣI為慣性坐標系;Σ0為航天器基體的體坐標系,原點設(shè)在基體質(zhì)心;Σi(i=1,2)為連桿i的體坐標系,原點位于連桿i前端旋轉(zhuǎn)關(guān)節(jié)轉(zhuǎn)軸處;r0、r1、r2分別為基體和2個連桿的質(zhì)心位置矢量;p1、p2分別為2個連桿體坐標系的位置矢量。

      在慣性坐標系ΣI下,上述矢量之間的幾何關(guān)系為

      (1)

      在目標捕獲前空間機器人的運動學方程為

      (2)

      式中:ai為連桿i體坐標系∑i原點到其質(zhì)心的位置矢量;b0為基體質(zhì)心到坐標系∑1原點的位置矢量,b1為連桿1質(zhì)心到坐標系∑2原點的位置矢量,b2為連桿2質(zhì)心到其末端的位置矢量;ω0為基體的角速度矢量;ωi為連桿i的角速度矢量;φi為連桿i的角度矢量;i=1,2。

      根據(jù)以上運動學方程,可以得到在空間機器人目標捕獲之前系統(tǒng)的動能為

      (3)

      (4)

      由于空間機器人和目標均為剛體,因此系統(tǒng)不存在彈性勢能,且重力勢能可忽略不計。由式(3)可得到目標捕獲前系統(tǒng)的拉格朗日函數(shù)L=Tbc,將其代入第二類拉格朗日方程:

      (5)

      即可得到目標捕獲前空間機器人的動力學方程:

      (6)

      在目標捕獲前,空間機器人相對于航天器基體的體坐標系Σ0的整體慣性張量為

      (7)

      (8)

      式中:R1、R2分別為體坐標系Σ1與Σ2相對于Σ0的姿態(tài)矩陣。

      在目標捕獲后,空間機器人示意圖如圖2所示。為便于分析,對捕獲過程進行簡化:假設(shè)空間機器人與目標不存在相對運動,目標與機械臂一經(jīng)接觸即被捕獲,并與連桿2固連在一起,整個捕獲過程較為平穩(wěn)。Σe為目標的體坐標系,原點位于機械臂末端中心處,re、pe分別為目標的質(zhì)心位置矢量和體坐標系位置矢量。re、pe在慣性坐標系下的幾何關(guān)系為

      圖2 目標捕獲后空間機器人示意圖

      (9)

      目標捕獲后空間機器人的運動學方程是在式(2) 基礎(chǔ)上加上目標的運動學方程,即

      (10)

      式中:ωe為目標的角速度矢量。

      相應(yīng)的空間機器人目標捕獲后的系統(tǒng)動能為

      (11)

      (12)

      (13)

      目標捕獲后的空間機器人相對于航天器基體的體坐標系Σ0的整體慣性張量為

      (14)

      (15)

      式中:Re為體坐標系Σe相對于Σ0的姿態(tài)矩陣。

      2 基于LSTM的參數(shù)辨識網(wǎng)絡(luò)

      2.1 訓練數(shù)據(jù)生成

      在構(gòu)建基于LSTM的參數(shù)辨識網(wǎng)絡(luò)之前需要獲得足量的數(shù)據(jù)對網(wǎng)絡(luò)進行訓練,本節(jié)對訓練數(shù)據(jù)生成過程進行詳細介紹。

      假設(shè)給定空間機器人初始狀態(tài)、受力情況、最終目標構(gòu)型及抓捕過程時長,對每個空間目標所執(zhí)行的抓捕策略可以描述為:在目標捕獲前驅(qū)動空間機器人機械臂從初始狀態(tài)逐漸伸展,直至完全展開捕獲目標,捕獲到目標后收回機械臂將目標拉至后續(xù)控制所需的目標構(gòu)型。

      Jt=[JxxJyyJzzJxyJxzJyz]t

      (16)

      為使訓練效果盡量不受Jt量級大小的影響,需對Jt中的每個元素分別進行歸一化處理:

      (17)

      2.2 參數(shù)辨識網(wǎng)絡(luò)構(gòu)建

      LSTM網(wǎng)絡(luò)如圖3所示,可以看到LSTM網(wǎng)絡(luò)是多個LSTM cell組成的,LSTM cell的數(shù)目與輸入序列長度相同,其輸出為網(wǎng)絡(luò)最后一個LSTM cell輸出hl。LSTM cell可以利用遺忘門、輸入門和輸出門3個門來控制沿數(shù)據(jù)序列的信息傳遞[13],其計算方法為

      圖3 LSTM網(wǎng)絡(luò)

      (18)

      式中:st為cell的輸入向量;ft、it、ot分別為cell內(nèi)的遺忘門值、輸入門值和輸出門值;ct、lt分別代表cell產(chǎn)生的候選記憶和新記憶;bf、bi、bo、bc分別為對應(yīng)的偏移向量;Wf、Wi、Wo、Wc分別為對應(yīng)的輸入權(quán)重矩陣;Uf、Ui、Uo、Uc分別為對應(yīng)的回歸權(quán)重矩陣;ht為cell內(nèi)隱含層的輸出向量,也是cell的輸出向量,其維度由隱含層的結(jié)點數(shù)確定;σ、tanh分別為sigmoid激活函數(shù)與雙曲正切激活函數(shù)。

      多層全連接網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示,它由1個輸入層、2個隱含層及1個輸出層組成。輸入層接收LSTM網(wǎng)絡(luò)的輸出量hl并將其導入至隱含層中進行計算。

      圖4 多層全連接網(wǎng)絡(luò)

      單層隱含層的計算方法為

      (19)

      式中:yi-1為第i-1隱含層的輸出量;Wi、bi分別為對應(yīng)的權(quán)重矩陣與偏移向量;xi為第i隱含層的輸入量;yi為當前隱含層的輸出量;f(·)表示非線性激活函數(shù),本文選取的激活函數(shù)是ReLU函數(shù)[18]。

      最后一個隱含層的輸出yl被輸入至一個線性回歸層(輸出層)中并輸出辨識結(jié)果:

      (20)

      式中:WO、bO分別為輸出層的權(quán)重矩陣與偏移向量;yt為t時刻網(wǎng)絡(luò)辨識的空間機器人整體慣性張量。

      2.3 模型訓練

      在參數(shù)辨識網(wǎng)絡(luò)構(gòu)建完成后需要對其進行訓練以實現(xiàn)既定的目標。訓練過程如圖5所示。

      圖5 訓練過程

      首先對網(wǎng)絡(luò)模型參數(shù)進行初始化,對于LSTM網(wǎng)絡(luò)參數(shù)采用的是正態(tài)分布隨機初始化方法,而對于全連接網(wǎng)絡(luò)參數(shù)采用的是MSRA(Microsoft Research Asia)初始化[19]。MSRA初始化主要應(yīng)用于激活函數(shù)為ReLU函數(shù)的網(wǎng)絡(luò)模型,該方法可以使模型各層的前向輸出方差保持一致,保證層間傳遞的信息受層數(shù)的影響較小,從而提高模型訓練的收斂速度。然后設(shè)定目標函數(shù),由于慣性張量辨識是一個回歸問題,因此目標函數(shù)被設(shè)為網(wǎng)絡(luò)辨識輸出與標簽之間的均方誤差(MSE):

      (21)

      式中:F(θ)為目標函數(shù);θ代表網(wǎng)絡(luò)模型中所有參數(shù);M為訓練集中的樣本總個數(shù)。設(shè)定好目標函數(shù)后,采用Adam優(yōu)化方法對網(wǎng)絡(luò)模型參數(shù)進行優(yōu)化,優(yōu)化目標為最小化F(θ)[20]。Adam優(yōu)化方法通過估計目標函數(shù)中參數(shù)梯度的一階矩和二階矩,實現(xiàn)了對學習率的自適應(yīng)調(diào)整,可以有效提升模型的訓練效率。最后在訓練過程中不斷優(yōu)化迭代直至F(θ)小于一定范圍或達到預定的迭代次數(shù)時,參數(shù)辨識模型完成訓練。

      3 數(shù)值仿真驗證

      所研究的空間機器人參數(shù)如表1所示。假設(shè)只在平面執(zhí)行空間機器人的整個抓捕過程,并采用PD(Proportion Differentiation)控制策略對空間機器人進行控制。目標捕獲前后對空間機器人的控制目標如下。

      目標捕獲前,對基體、連桿1和連桿2的控制目標分別為

      (22)

      (23)

      式中:tc為捕獲到目標的時刻。

      目標捕獲后,對基體、連桿1和連桿2的控制目標分別為

      (24)

      (25)

      式中:te為抓捕過程完成的時刻。本文設(shè)定的tc、te分別為50、100 s。

      表1 空間機器人參數(shù)和目標

      表2 生成訓練集所需參數(shù)

      在參數(shù)辨識網(wǎng)絡(luò)構(gòu)建方面,設(shè)LSTM網(wǎng)絡(luò)的隱含層結(jié)點數(shù)為40,全連接網(wǎng)絡(luò)的2個隱含層神經(jīng)元數(shù)也為40。訓練過程中設(shè)定優(yōu)化方法的學習率為0.001,批處理樣本量為20,對整個訓練集的訓練次數(shù)為50。為驗證所提方法的有效性,采用與生成訓練集相同的方法,隨機生成了30組與訓練集不同的數(shù)據(jù)組成測試集。

      模型在N=200的訓練集上進行訓練的MSE曲線如圖6所示。從圖中可以看出,隨著迭代次數(shù)的增加,根據(jù)目標函數(shù)計算的MSE曲線整體上呈下降趨勢。在2×105次迭代之前,MSE曲線收斂速度較快但存在較大振蕩,隨后曲線的收斂逐漸趨于平穩(wěn)并維持在較低水平。這說明所采用的訓練方法可以保證MSE曲線在訓練過程中快速且高精度地收斂。訓練完畢后,分析訓練集大小對網(wǎng)絡(luò)模型精度的影響如表3所示,當N=50時,即訓練集數(shù)據(jù)量較小的情況下,模型在訓練集與測試集上的性能表現(xiàn)存在較大的差異。當數(shù)據(jù)量達到一定水平后,這種差異明顯降低。而且隨著訓練集大小的增加,模型精度不斷得到提升,因此增加訓練集的大小可以有效地提高模型的精度,并減少模型過擬合的風險。不過訓練集過大會增加數(shù)據(jù)的獲取成本,且會降低模型訓練的收斂速度,因此需要對以上情況進行綜合分析來選取合適的訓練集大小[21]。

      圖6 訓練過程中的MSE曲線

      表3 訓練集大小的影響

      為驗證本文所提參數(shù)辨識網(wǎng)絡(luò)的辨識效果,選取了測試集中一組數(shù)據(jù)的辨識結(jié)果進行展示,這組數(shù)據(jù)對應(yīng)的目標參數(shù)如表4所示。圖7是抓捕該目標時對連桿施加的驅(qū)動力矩時程曲線。抓捕過程系統(tǒng)慣性張量在軌辨識結(jié)果如圖8所示。從圖8可以看到,采用一定目標參數(shù)范圍生成的訓練數(shù)據(jù)訓練的參數(shù)辨識網(wǎng)絡(luò)有效地實現(xiàn)了對非合作目標抓捕過程系統(tǒng)慣性張量的辨識,其所計算的辨識曲線與真實曲線基本重合。特別是對于Jyy、Jzz在50 s捕獲到目標時所產(chǎn)生的明顯突變,本文方法仍能精確辨識出突變的參數(shù)且僅產(chǎn)生了較小的誤差波動。不過當測量噪聲的量級較大時,本文方法的辨識精度也會有所降低。

      表4 目標參數(shù)

      表5給出了本文方法與基于RNN的參數(shù)辨識網(wǎng)絡(luò)在測試集上的辨識性能對比。性能對比采用平均相對辨識誤差(MIRE)作為標準,其公式為

      (26)

      如表5所示,本文方法對這4個參數(shù)的辨識精度明顯高于基于RNN的參數(shù)辨識網(wǎng)絡(luò),而且對主慣量Jxx、Jyy、Jzz的辨識尤為精確。雖然對Jyy、Jzz的辨識精度相對于Jzz有所降低,這主要是由于Jyy、Jzz慣性張量曲線的突變所造成的,但其平均相對誤差仍然維持在10-4數(shù)量級這樣較低的水平。在實時性方面,本文方法的單步辨識時間約為3×10-3s,是可以滿足在軌辨識任務(wù)的實時性要求。因此以上結(jié)果進一步顯示了本文所提出的基于LSTM的參數(shù)辨識網(wǎng)絡(luò)的有效性與可行性。

      表5 辨識性能對比

      為進一步明確參數(shù)范圍設(shè)定對模型辨識精度的影響,對使用3種不同參數(shù)范圍訓練的模型精度進行比較,每個模型都采用了與上述仿真相同的結(jié)構(gòu)與訓練策略。如表6所示,隨著目標長寬高范圍的增加,模型對測試集的MSE顯著增加。這其中一個原因是當長、寬、高3個參數(shù)范圍增加時,參數(shù)整體取值的可能組合將會呈指數(shù)級增加。即當3個參數(shù)范圍同時增加k倍時,參數(shù)取值的可能組合就會增加(1+k)3-1倍。根據(jù)表3所示,在[0.10, 0.20]范圍內(nèi)選取了200組不同的目標長寬高組合進行訓練即可獲得較高的辨識精度。但當范圍增大的情況下,當前的數(shù)據(jù)量就不能充分地表征該范圍內(nèi)的數(shù)據(jù)分布特性,因此需要更多組的參數(shù)用于訓練來提高辨識精度。另一方面,由于參數(shù)范圍的增加,其狀態(tài)-控制序列與參數(shù)之間的映射也變得更加復雜,因此需要根據(jù)任務(wù)目標調(diào)整網(wǎng)絡(luò)模型的節(jié)點數(shù),加強其非線性擬合能力,從而提升模型的辨識精度。

      表6 模型辨識精度在不同參數(shù)范圍下的比較

      4 結(jié) 論

      利用LSTM構(gòu)建參數(shù)辨識網(wǎng)絡(luò),實現(xiàn)了對空間機器人抓捕非合作目標過程中系統(tǒng)慣性張量的在軌辨識。

      1) 使用在預先設(shè)定的目標參數(shù)范圍內(nèi)隨機生成的訓練數(shù)據(jù)對參數(shù)辨識模型進行訓練,所訓練的模型能夠有效地執(zhí)行在同一范圍內(nèi)目標參數(shù)未知情況下的系統(tǒng)慣性張量辨識任務(wù)。

      2) 在測量噪聲存在的情況下,所構(gòu)建的參數(shù)辨識網(wǎng)絡(luò)能夠?qū)崟r且準確地辨識時變的系統(tǒng)慣性張量,即使在參數(shù)發(fā)生突變時辨識結(jié)果仍然十分精確。仿真結(jié)果顯示,本文方法辨識主慣量Jxx、Jyy、Jzz的平均相對誤差數(shù)量級為10-4,辨識慣性積Jxy的平均相對誤差數(shù)量級為10-3。

      猜你喜歡
      張量慣性連桿
      你真的了解慣性嗎
      沖破『慣性』 看慣性
      偶數(shù)階張量core逆的性質(zhì)和應(yīng)用
      某發(fā)動機連桿螺栓擰緊工藝開發(fā)
      四元數(shù)張量方程A*NX=B 的通解
      無處不在的慣性
      擴散張量成像MRI 在CO中毒后遲發(fā)腦病中的應(yīng)用
      普遍存在的慣性
      連桿的運動及有限元分析
      機械工程師(2015年9期)2015-02-26 08:38:12
      一種連桿、杠桿撬斷澆口的新型模具設(shè)計
      巴彦淖尔市| 广平县| 澄江县| 桐庐县| 大连市| 巩留县| 宿迁市| 安化县| 财经| 温宿县| 定日县| 兴义市| 宿迁市| 威海市| 玉门市| 洞头县| 平定县| 波密县| 巴林左旗| 乐清市| 北票市| 五峰| 吉木乃县| 岳普湖县| 五原县| 龙州县| 崇州市| 平果县| 金塔县| 民权县| 苍南县| 白银市| 新晃| 辰溪县| 敦化市| 喀喇沁旗| 兰考县| 溧阳市| 温泉县| 那曲县| 闸北区|