張廣勇,鄭新,石寶蘭,洪 蓓
(北京宇航系統(tǒng)工程研究所,北京100076)
機動飛行器通常需要完成大范圍機動飛行,飛行空域廣,狀態(tài)參數(shù)變化范圍大,通道間耦合嚴重,基于經典頻域設計的姿態(tài)控制方法難以滿足控制精度要求。
動態(tài)逆方法物理概念清晰、設計思想簡單,特別是對強耦合、參數(shù)大范圍變化的復雜非線性系統(tǒng)非常有效,在航空飛行器和機器人領域已經得到廣泛應用。在基于動態(tài)逆的控制方案中,一個十分有影響的流派是佐治亞理工大學的神經網絡動態(tài)逆方案,Calise教授團隊[1-4]在該方案的理論和應用研究方面做出了杰出的貢獻,該方案已經在戰(zhàn)術導彈、無尾無人機、無人直升機、傾轉式飛機中得到了成功應用。
在飛行器坐標系建立繞質心轉動方程,假設機動飛行器為剛體,運動方程組如下[5]
式中參數(shù)意義可參考文獻[5],I x、I y、I z分別為繞飛行器坐標系三軸的轉動慣量,ωTx1、ωTy1、ωTz1分別為飛行器坐標系的角速度三分量,α、β、ν分別為攻角、側滑角和傾側角,θT、σT分別為彈道傾角和彈道偏角。
氣動力矩M X、M Y、M Z為
其中,C MX、C MY、C MZ分別為三通道的力矩系數(shù),Lref是參考長度,S為參考面積,q為動壓。
本文使用的氣動數(shù)據以增量形式提供,氣動系數(shù)計算公式如下
可以看出,氣動力(矩)系數(shù)C A(Ma,α,β)是基本項(Ma,α,β)與各舵面增量(Ma,α,β)的總和,其中基本項為固定攻角和馬赫數(shù)下各舵面都在零位的氣動系數(shù)。各舵面增量計算方法如下
由運動方程組可知,系統(tǒng)狀態(tài)變量有α、β、ν、ωTx1、ωTy1、ωTz1共6個,而控制變量只有δφ、δψ、δγ3個,由于動態(tài)逆控制方法要求對象滿足控制量與狀態(tài)量個數(shù)相等的條件,因此需要利用奇異攝動理論對狀態(tài)變量進行時標分離[6]??紤]角度α、β、ν的變化相對于角速度ωTx1、ωTy1、ωTz1的變化要慢,將系統(tǒng)分為慢變子系統(tǒng)和快變子系統(tǒng)。
對于慢變量回路,將式(2)改寫為矩陣形式
其中
經分析,當側滑角β≠±90°時,矩陣G可逆??傻寐芈穭討B(tài)逆控制律
其中,、、為期望的制導指令的變化率,由參考模型得到。
對于快變量回路,將式(1)改寫為矩陣形式
其中
對于本文研究的問題,矩陣J是可逆的,可得快回路動態(tài)逆控制律
對于快變回路和慢變回路,均可表示為如下形式
其中,x∈R3×1,δ∈R3×1。其動態(tài)逆控制律表示為
其中,υ為偽控制量,代表系統(tǒng)狀態(tài)量期望的動態(tài)特性。
考慮到逆誤差的存在,偽控制量與狀態(tài)量之間有如下關系
其中,逆誤差Δ受指令信號、狀態(tài)變量與控制變量的影響,通常情況下非常復雜,難以計算。
本文采用的控制結構如圖1所示。偽控制量由參考模型輸出、PID控制器輸出和自適應補償項3部分構成
其中,υc=由參考模型得出,υk為PID控制器輸出,υad=υnn+υr為自適應補償項,包含神經網絡補償項和魯棒補償項兩部分。
圖1 神經網絡自適應控制結構框圖Fig.1 System block diagram of Neural Network adaptive control
將式(11)代入式(10)得
定義參考模型跟蹤誤差e rm=x rm-x,PID控制器只采用比例控制,輸出項為
自適應項υad表示為
其中,W、V為神經網絡權值矩陣。
定義矩陣Z
魯棒補償項υr為
其中,參數(shù)K r0、K r1>0。r=(eTrm PB)T為誤差動力特征向量,其中矩陣P為Lyapunov方程ATP+PA=-Q的正定解,矩陣Q為單位陣。
將各補償項帶入狀態(tài)方程,參考模型跟蹤誤差可以寫為
其中,A=-K p,B=I3×3。
通過合理選擇矩陣K p使矩陣A為Hurwitz矩陣,可以使系統(tǒng)漸進穩(wěn)定,在理想情況下,若自適應項能夠完全補償逆誤差,則系統(tǒng)跟蹤誤差以指數(shù)收斂于0。
參考模型如圖2所示。定義指令跟蹤誤差e c=x c-x和參考模型指令跟蹤誤差e crm=x c-x rm,參考模型可以表示為
其中
圖2 參考模型結構圖Fig.2 System block diagram of reference model
根據參考模型跟蹤誤差動態(tài)方程,可知神經網絡需補償?shù)哪嬲`差為
式(21)表明神經網絡的輸入量與x、δ、有關,根據控制系統(tǒng)結構圖,把控制信息代入逆誤差方程
可以確定神經網絡的輸入參數(shù)為
根據單隱層神經網絡全局近似定理[7-8]可知,若給定足夠的輸入信息和隱含層神經元數(shù)目,神經網絡能夠以任意精度逼近連續(xù)非線性函數(shù)。因此,對于連續(xù)的不確定非線性逆誤差函數(shù)Δ(x,δ)及任意給定的逆誤差補償誤差εn>0,存在有限個隱含層神經元數(shù)n2和權值矩陣V*,W*使得
其中,D表示一系列輸入樣本集,ˉε表示所有計算誤差范數(shù)的最大值。
為保證神經網絡的實時補償特性,Johnson等[7]采用在線更新神經網絡權值的方法,權值更新規(guī)則如下
其中,學習速率因子Γw>0,Γv>0,誤差調節(jié)因子λ>0,該規(guī)則可以使閉環(huán)系統(tǒng)內所有信號保持有界。
為驗證上述控制方法的有效性,設計了仿真算例,對控制器進行六自由度仿真,仿真結果如圖3、圖4所示。仿真的初始條件為高度H0=60km,速度V0=5000m/s,速度傾角為-18°,初始角速度均為0,升力系數(shù)偏差取15%。仿真結果表明,控制器能夠準確跟蹤角度指令,神經網絡能夠有效補償動態(tài)逆誤差,在標準狀態(tài)下最大跟蹤誤差不超過1°,升力系數(shù)偏差狀態(tài)下最大跟蹤誤差在2°左右,跟蹤精度較高。
圖3 標準狀態(tài)仿真結果曲線Fig.3 Simulation curves of standard state
圖4 升力系數(shù)偏差狀態(tài)仿真結果曲線Fig.4 Simulation curves of lift coefficient deviation state
本文研究了機動飛行器的姿態(tài)控制問題,針對動態(tài)逆方法存在較大逆誤差的問題,研究了基于神經網絡的自適應動態(tài)逆控制方法,利用神經網絡對非線性函數(shù)的逼近能力對逆誤差進行補償,實現(xiàn)了對參考模型輸出指令的跟蹤,跟蹤精度較高。