• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      高超聲速飛行器滑??刂茀?shù)整定方法設計*

      2022-03-20 02:16:14程志浩湯國建
      飛控與探測 2022年6期
      關鍵詞:控制參數(shù)模擬退火性能指標

      程志浩,王 鵬,湯國建

      (國防科技大學 空天科學學院空天工程系·長沙·100854)

      0 引 言

      高超聲速飛行器[1]一般是指飛行速度大于馬赫數(shù)5的飛行器,其大空域、寬速域的機動特性對控制器性能提出了很高的要求?;W兘Y構控制具有魯棒性強、響應快、物理實現(xiàn)簡單的特點[2],被廣泛應用于飛行控制系統(tǒng)的設計中。在實際的飛行任務中,一套固定的控制參數(shù)往往無法滿足整個飛行過程的需求。通常情況下,控制參數(shù)需要人工根據(jù)經(jīng)驗手動調(diào)試,過程十分繁瑣,調(diào)試得到的控制參數(shù)品質(zhì)不高,也只針對于當前工況。因此,研究一種控制參數(shù)整定方法,使得飛行器能夠根據(jù)變化的氣動環(huán)境快速在線修正控制參數(shù)是十分有意義的。

      近年來,遺傳算法、模擬退火算法、粒子群算法[3-7]等智能算法飛速發(fā)展,被廣泛用于解決控制參數(shù)整定問題。這類方法的整定效果尚可,但算力需求大,求解速度一般。強化學習是近年來的研究熱點,一些專家學者也將其應用于控制參數(shù)整定問題中。文獻[8]提出了一種基于Actor-Critic 結構的策略,以解決PID參數(shù)整定問題,但Actor網(wǎng)絡對應3個PID控制參數(shù),各自的梯度不好給出,最后解得的3個控制參數(shù)存在耦合。文獻[9]沿用了文獻[8]中的方法,針對單個控制參數(shù)的滑模控制器進行參數(shù)整定,取得了比較好的效果。文獻[10]采用強化學習思想,實現(xiàn)了飛行器俯仰姿態(tài)PID控制參數(shù)的自主調(diào)度,但存在超調(diào)量過大的問題。文獻[11]引入連續(xù)動作學習自動機(Continuous Action Reinforcement Learning Automata,CARLA)算法,對自抗擾控制參數(shù)整定進行了一定的探索,但由于待求解量過多,懲罰函數(shù)設計不甚合理,導致算法收斂速度慢??偟膩碚f,當前的控制參數(shù)整定方法研究已經(jīng)取得了一些成果,但主要面向PID控制參數(shù)的整定,對其他控制方法的控制參數(shù)整定涉及較少,且整定速度一般,不能很好地滿足高超聲速飛行器控制參數(shù)整定的快速性。為了解決這一問題,本文改進了基于強化學習思想的CARLA算法[12],將其應用于高超聲速飛行器滑模姿態(tài)控制器的控制參數(shù)整定問題中,并與遺傳算法和模擬退火算法進行對比,以體現(xiàn)該方法的優(yōu)勢。

      1 飛行器運動模型與滑??刂破髟O計

      本文采用文獻[13]中建立的高超聲速飛行器氣動模型為研究對象。為了簡化起見,忽略地球自轉(zhuǎn),采用如下的縱向飛行器運動模型

      (1)

      式中,D為阻力;L為升力;g為重力加速度;m為飛行器質(zhì)量;v為飛行器速度;h為飛行器高度;x為飛行距離;Re為地球半徑;ωz為飛行器俯仰角速度;Mz為控制力矩;Iz為飛行器Z軸轉(zhuǎn)動慣量;φ為俯仰角;α為攻角;θ為速度傾角。

      (2)

      其中

      eφ=φ-φc

      (3)

      對滑模函數(shù)求導可得

      (4)

      俯仰角的二階導數(shù)可表示為

      (5)

      選用指數(shù)趨近律[14]作為趨近方式,這樣滑模函數(shù)的一階導數(shù)可以改寫成

      (6)

      其中,εφ、kφ為滑??刂茀?shù),符號為正,可根據(jù)實際控制需要選取;sgn(·)為符號函數(shù),將式(6)代入式(5)中,得到基于指數(shù)趨近律的滑模控制律為

      (7)

      當系統(tǒng)狀態(tài)點穿越滑模面時,由于式(7)中符號函數(shù)的存在,會導致控制量發(fā)生較大幅度的抖動,這一現(xiàn)象會嚴重影響控制系統(tǒng)的控制性能。為了盡可能地減少抖振帶來的影響,采用連續(xù)化的方法,以飽和函數(shù)sat(s)代替符號函數(shù)

      (8)

      滑??刂坡勺?yōu)?/p>

      (9)

      (10)

      2 CARLA算法的改進

      控制參數(shù)整定可以歸結為一種優(yōu)化問題。學習自動機(Learning Automata,LA)是求解隨機優(yōu)化問題的有效工具,它通過與環(huán)境的互動實現(xiàn)對概率分布的學習。CARLA算法是LA的一種,采用一種非參數(shù)化的概率模型,選取有限區(qū)間作為動作集,通過一個對稱的、高斯型的鄰近函數(shù),將表現(xiàn)好的動作的獎賞傳播給其相鄰的動作[15]。由于CARLA算法本質(zhì)上是一種基于概率的更新的算法,不可避免地存在一定方差,且多數(shù)情況下找到的為次優(yōu)解并非最優(yōu)解。但控制參數(shù)整定問題區(qū)別于一般的優(yōu)化問題,有以下特點:1)控制參數(shù)不需要嚴格最優(yōu),滿足一定的指標能夠使控制器有較好的控制性能即可;2)控制參數(shù)的小范圍浮動對控制性能影響十分有限,對求解精度的要求可適當放寬;3)假設最優(yōu)控制參數(shù)為a,那么實際選取的控制參數(shù)在靠近a的過程中,系統(tǒng)對應的控制性能也會提高。這3個特點使得該算法十分適用于控制參數(shù)整定問題。

      引入CARLA算法的思想整定控制參數(shù),總體思路為:將控制器和控制對象組成的系統(tǒng)當成環(huán)境,系統(tǒng)在不同控制參數(shù)下的控制性能反映了這組參數(shù)的品質(zhì),對于品質(zhì)良好的控制參數(shù),增大其出現(xiàn)的概率,反之減少??刂茀?shù)的概率分布在區(qū)間內(nèi)不斷學習更新,最終會以高品質(zhì)的控制參數(shù)為中心收斂,概率密度最大值對應的控制參數(shù)即為性能優(yōu)越的控制參數(shù)。

      文獻[11]采用CARLA算法解決自抗擾控制參數(shù)的整定問題,取得了一定效果,但也存在以下幾個問題:1)沒有對整定區(qū)間進行合理的離散化處理,導致抽樣占用的計算資源過大;2)待尋優(yōu)的控制參數(shù)過多,導致僅有部分參數(shù)的概率收斂;3)回報函數(shù)設計存在不合理之處,導致收斂速度過慢。本文就這3個方面對CARLA算法進行了改進,并將其應用于滑模控制參數(shù)整定,算法的設計過程具體如下:

      對于滑模控制器第i個控制參數(shù)xi,給定一個相應的學習區(qū)間Xi

      Xi={xi|xi(min)

      (11)

      式中,xi(min)為該控制參數(shù)的最小取值;xi(max)為該控制參數(shù)的最大取值。初始情況下,每個控制參數(shù)服從區(qū)間上的均勻分布

      (12)

      在進行控制參數(shù)選取時,每個參數(shù)通過其在區(qū)間內(nèi)的概率分布進行抽樣選取??紤]到本文模型對控制量的精度需求并節(jié)約算力,在抽樣時需要對區(qū)間進行一定的離散化處理,具體的參數(shù)學習區(qū)間和離散程度設計如表1所示。

      表1 控制參數(shù)的求解區(qū)間及離散點數(shù)目

      (13)

      式中,ai為第i個控制參數(shù)的離散點數(shù)目,式(13)相當于對概率指標進行了歸一化處理,每次選取控制參數(shù)時,各控制參數(shù)根據(jù)自己的概率密度分布進行抽樣。將選取的控制參數(shù)組合應用到控制系統(tǒng)中可得到性能指標。

      定義控制性能評價指標如下

      J(k)=c1Ess+c2ts

      (14)

      式中,k為迭代次數(shù);Ess為穩(wěn)態(tài)誤差百分數(shù);ts為調(diào)節(jié)時間(這里選擇10%準則);c1、c2為權重因子,根據(jù)控制性能的側重性進行設計。在飛行器的姿態(tài)控制回路中,受飛行器結構和控制機構執(zhí)行能力的限制,飛行器角速度ω一般不超過30(°)/s,對本文的控制方法來說,ω受限時不會產(chǎn)生超調(diào),因此J(k)中不含超調(diào)量項。若要將本文提出的算法應用于其他的控制參數(shù)整定問題中,則可按需添加該項。雖然這些指標各自的量綱不同,但只要該組合能夠充分反映系統(tǒng)的控制性能就可以作為系統(tǒng)學習的目標函數(shù)。

      原始的CARLA算法中回報函數(shù)定義為

      (15)

      式中,J(min)為迭代過程中性能指標的最小值;J(avg)為平均值。式(15)的主要思想是,若本次迭代得到的性能指標小于以往的平均值,則給予獎勵。由于沒有懲罰的存在,獎勵給予的標準較低,導致算法求解效率不高,本文將回報函數(shù)改進為以下形式

      (16)

      得到每次迭代的回報后,每個控制參數(shù)的概率密度分布函數(shù)則進行相互獨立的更新

      (17)

      式中,H(xi,k)是以第k次迭代中選取的第i個控制參數(shù)值為中心的高斯分布,具體表達式為

      H(xi,k)=

      (18)

      式中,b1、b2為設計參數(shù),影響控制參數(shù)學習的速度和分辨能力。g(k)是為了保證每個控制參數(shù)在其學習區(qū)間內(nèi)的概率密度之和為1的歸一化因子,具體表達式為

      (19)

      將算法的總流程總結為圖1所示。

      圖1 控制參數(shù)整定算法流程圖Fig.1 The flow chart of the control parameter setting algorithm

      如圖1所示,每個控制參數(shù)的概率初始都服從學習區(qū)間上的均勻分布,隨著迭代的進行,各個控制參數(shù)的概率分布會以能提高系統(tǒng)控制性能的控制參數(shù)為中心增大,性能指標低的控制參數(shù)則會被不斷淘汰。迭代次數(shù)越多,找到最優(yōu)解的可能性就越大。式(17)給出的更新公式既能使概率密度朝著高品質(zhì)的控制參數(shù)方向進行更新,同時由于抽樣具有隨機性,算法也能在給定區(qū)間內(nèi)進行充分探索,避免陷入局部最優(yōu)的情況。算法的終止條件可設置為迭代達到一定次數(shù)或者性能指標滿足某個設定值。

      3 仿真校驗

      3.1 改進的CARLA算法整定效果仿真

      選取飛行高度25km,以4000m/s的速度水平飛行的環(huán)境進行繞質(zhì)心控制仿真,攻角α初始值為0°,并對攻角大小為5°的階躍指令進行響應,依照圖1的流程,取c1=2,c2=1,b1=0.01,b2=1.5運行算法,每次循環(huán)視為一次迭代,設定迭代次數(shù)100次后終止,仿真結果如圖2所示。

      (a) dφ的概率分布隨迭代次數(shù)的變化

      從圖2(a)~圖2(c)可以看出,隨著迭代次數(shù)的進行,3個控制參數(shù)的概率分布逐漸收斂到高性能的參數(shù)值附近;圖2(d)中,平均控制性能指標也逐漸減小,在迭代次數(shù)達到20次時下降開始放緩,經(jīng)過約100次迭代后,算法基本收斂。在迭代進行到84次時,出現(xiàn)性能指標最小值J(84)=0.819,此時控制參數(shù)組合為dφ=0.1,kφ=8.57,λφ=11.26,將這組控制參數(shù)組合代入系統(tǒng)進行攻角的階躍響應測試,結果如圖3所示。

      圖3 最優(yōu)控制參數(shù)仿真結果Fig.3 The simulation results of the best control parameters

      如圖3所示,飛行器大約在0.5s左右完成了對5°攻角階躍信號的指令響應,響應過程快速平穩(wěn),且具有極小的穩(wěn)態(tài)誤差。改進后的CARLA算法整定出的控制參數(shù)具有優(yōu)秀的控制性能。

      3.2 控制參數(shù)整定算法對比仿真

      采用式(14)定義的控制性能指標,尋優(yōu)的目標為最小化控制性能指標J,控制參數(shù)的求解區(qū)間與表1相同,分別調(diào)用模擬退火算法(初始溫度100℃)和遺傳算法(種群大小50,交叉概率0.75)進行求解,結果如圖4和圖5所示。

      圖4 模擬退火算法求解效果Fig.4 The effect of the simulated annealing algorithm

      圖5 遺傳算法求解效果Fig.5 The effect of the genetic algorithm

      將三種算法的求解效果進行對比,結果如表2所示。

      表2 三種算法求解效果對比

      如表2所示,三種算法在各自收斂時整定得到的控制參數(shù)值十分接近,其中改進的CARLA算法和遺傳算法整定得到的控制參數(shù)性能指標要略好于模擬退火算法,單從整定效果來看,三種方法差距很小,但改進后的CARLA算法所需迭代次數(shù)遠遠少于其余兩種算法,在求解速度上具有顯著優(yōu)勢。高超聲速飛行器由于其快速機動的特性,一套固定的控制參數(shù)無法滿足其工作需求,需要針對不同飛行環(huán)境快速批量獲取控制參數(shù),改進的CARLA算法則很好地滿足了這一需求。事實上,工業(yè)應用對控制參數(shù)精度的需求并不苛刻。該算法還可通過犧牲精度再度提升求解速度。以文中模型舉例,kφ在整定時是把[0,10]的范圍等距離散為100個點,控制參數(shù)求解精度為0.1。若將離散點減少為20個,求解精度變?yōu)?.5,那么算法的收斂速度將會顯著提升,整定出的控制參數(shù)對應的性能指標則損失很小。實際中可根據(jù)對精度和求解速度的具體需求選取離散點數(shù)目。

      4 結 論

      本文改進了CARLA算法,并將其應用于高超聲速飛行器滑模姿態(tài)控制器參數(shù)整定問題。仿真結果表明,該算法能夠在給定求解范圍的情況下,通過100次迭代整定出一組性能優(yōu)良的控制參數(shù),使飛行器快速穩(wěn)定地跟蹤攻角階躍指令。與模擬退火算法和遺傳算法的對比結果表明,在整定得到的控制參數(shù)性能相差不多的情況下,本文提出的算法在求解速度上有極大優(yōu)勢,契合高超聲速飛行器控制參數(shù)快速獲取的需求。此外,改進的CARLA算法還能通過減少離散點的方式再次提升求解速度。由于該算法不依賴于模型,理論上也適用于其他控制參數(shù)的整定問題,但待求解的控制參數(shù)不宜過多,一般在4個以內(nèi)時,算法的求解能力會較強??傮w來說,本文的工作對相關實際應用有一定參考價值。

      猜你喜歡
      控制參數(shù)模擬退火性能指標
      基于多次采樣的中壓大容量逆變電源建模及控制參數(shù)全局優(yōu)化
      瀝青膠結料基本高溫性能指標相關性研究
      石油瀝青(2021年1期)2021-04-13 01:31:08
      Birkhoff系統(tǒng)穩(wěn)定性的動力學控制1)
      力學學報(2020年4期)2020-08-11 02:32:12
      模擬退火遺傳算法在機械臂路徑規(guī)劃中的應用
      測控技術(2018年3期)2018-11-25 09:45:08
      基于PI與準PR調(diào)節(jié)的并網(wǎng)逆變器控制參數(shù)設計
      黑龍江電力(2017年1期)2017-05-17 04:25:08
      儲熱水箱分層性能指標的研究進展
      制冷技術(2016年4期)2016-08-21 12:40:30
      WebGIS關鍵性能指標測試技術研究
      基于模糊自適應模擬退火遺傳算法的配電網(wǎng)故障定位
      SOA結合模擬退火算法優(yōu)化電容器配置研究
      電源技術(2015年5期)2015-08-22 11:18:24
      基于遺傳-模擬退火算法的城市軌道交通快慢車停站方案
      房山区| 安康市| 盐山县| 南岸区| 新竹市| 上高县| 荆州市| 鄂温| 嘉禾县| 辉南县| 河间市| 乌苏市| 县级市| 沽源县| 丁青县| 秦安县| 衡山县| 凤山县| 闸北区| 普陀区| 靖州| 伽师县| 阿克| 昆山市| 犍为县| 安龙县| 托里县| 上虞市| 玉龙| 涟水县| 望奎县| 缙云县| 连云港市| 巴彦淖尔市| 儋州市| 晋城| 开平市| 滁州市| 稻城县| 武平县| 大石桥市|