徐西寶,白成超,陳宇燊,唐浩楠
(1. 哈爾濱工業(yè)大學(xué)航天學(xué)院,哈爾濱 150001; 2. 北京宇航系統(tǒng)工程研究所,北京 100076)
人類探索深空的腳步從未停止,通過七十多年的不懈努力和奮斗,航天技術(shù)得到了快速發(fā)展,正逐步揭開其神秘的面紗。從早期的人造衛(wèi)星到空間站建立,從月球探測到火星探測,再從小行星探測到土星/木星探測,無論是探測深度還是對(duì)象的尺度,其范圍都在逐步擴(kuò)大。另一角度來看,探測目標(biāo)也逐漸多元化,不再是簡單的到達(dá),拍攝,亦或是登陸,更多的是體現(xiàn)對(duì)科學(xué)本質(zhì)的探索,如地外水資源的發(fā)現(xiàn)和證明,地外大氣的演化以及地外生命的尋找等,甚至是建立地外基地,進(jìn)行原位資源開采及利用。這些都說明了開展深空探測研究,是人類認(rèn)識(shí)自我、認(rèn)識(shí)未知宇宙,同時(shí)又服務(wù)于自身的必要途徑。
目前針對(duì)地外天體探測任務(wù),主要還是集中在月球和火星,其中月球作為離地球最近的地外天體,從古至今都一直是大家關(guān)注的焦點(diǎn),隨著阿波羅計(jì)劃等多個(gè)探月任務(wù)的成功實(shí)施,人類歷史上實(shí)現(xiàn)了多個(gè)第一,第一次登上月球、第一次采樣返回、第一次看到月球背面、第一次發(fā)現(xiàn)月球有永久陰影區(qū)等[1-2]。而火星作為人類可能最宜移居的星球,也吸引了多個(gè)機(jī)構(gòu)的研究熱情,但受制于其距離地球較遠(yuǎn),探測難度較大,目前還只是有少數(shù)國家具備探測能力,且基本上所有著陸火星的巡視器均為美國研制,例如勇氣號(hào)、機(jī)遇好、好奇號(hào)等,同樣也實(shí)現(xiàn)了多個(gè)第一,第一次看見火星的地質(zhì)地貌、第一次了解火星大氣、第一次長途巡視、第一次探測到火震等[3-4]。隨著探測任務(wù)的推進(jìn),勢必對(duì)月球及火星有更深入的了解和發(fā)現(xiàn),到時(shí)候距離地外建設(shè)基地、構(gòu)建星際網(wǎng)絡(luò)的期望就會(huì)更近一步。
但在實(shí)現(xiàn)對(duì)月球及火星的精確、安全探測過程中,仍有很多的技術(shù)及工程難題需要攻克,作為一個(gè)大系統(tǒng)工程,涉及多個(gè)子系統(tǒng)、多個(gè)環(huán)節(jié)、多個(gè)學(xué)科的交叉,以及多個(gè)團(tuán)隊(duì)之間的協(xié)同,故難度大、約束多、可靠性要求高是需要直接面對(duì)的挑戰(zhàn)。這其中,作為對(duì)地外開展探測活動(dòng)至關(guān)重要的一環(huán),即軟著陸,其決定了整個(gè)探測任務(wù)的成敗,故開展精確魯棒的軟著陸制導(dǎo)技術(shù)研究是關(guān)鍵。
基于上述分析,本文將針對(duì)月球及火星探測任務(wù)及軟著陸制導(dǎo)技術(shù)的發(fā)展歷程進(jìn)行整理和總結(jié)。首先分別對(duì)過往的探測任務(wù)進(jìn)行回顧,分析在任務(wù)層面的變化;其次對(duì)軟著陸過程進(jìn)行定義,并對(duì)軟著陸制導(dǎo)技術(shù)體系進(jìn)行梳理;最后給出軟著陸制導(dǎo)技術(shù)的發(fā)展趨勢及關(guān)鍵問題。
針對(duì)月球探測,各國的基本探測路線大體是“探”、“登”、“駐”。“探”是通過飛越、環(huán)繞對(duì)月球的環(huán)境特征進(jìn)行初步探測,了解月面特征等信息,為后續(xù)探測做準(zhǔn)備;“登”是在“探”的基礎(chǔ)上進(jìn)行硬著陸和軟著陸實(shí)驗(yàn),實(shí)現(xiàn)月球登陸;“駐”是在月球建立基地,并基于月球資源進(jìn)行原位利用[5]。
通過對(duì)目前月球探測任務(wù)的梳理,如圖1所示,按時(shí)間可以將探測階段分為三期[6]:
1)第一階段1959~1976
第一階段主要參與者是美國和蘇聯(lián),為奪取競爭空間優(yōu)勢,二者均進(jìn)行了大量的月球探測,掀起了第一次月球探測高峰。期間共進(jìn)行了121次與月球相關(guān)的發(fā)射探測活動(dòng)。通過對(duì)月球的在軌探測和巡視探測,獲得了大量高價(jià)值科學(xué)數(shù)據(jù),如地質(zhì)地貌,成分分析等,把人類對(duì)月球、地球和太陽系的認(rèn)識(shí)提到了新的高度,并帶動(dòng)了一系列新技術(shù)的創(chuàng)新,航天技術(shù)的成果民用化極大的改進(jìn)了人們的生活,月球探測取得了劃時(shí)代的成就。
2)第二階段1976~1994
受冷戰(zhàn)緩和影響,美國和蘇聯(lián)對(duì)于探月熱情逐漸降低,所以該階段是月球探測的寧靜期。這一期間,蘇聯(lián)和美國主要是對(duì)第一階段的探測活動(dòng)進(jìn)行總結(jié),對(duì)部分探測任務(wù)失敗和效率低的原因進(jìn)行了分析,探索和提出了更好的探測思路和方案。這一階段也是對(duì)第一階段探測資料消化的階段,通過將相關(guān)技術(shù)推廣和民用化,將月球探測的成果轉(zhuǎn)化為豐厚的經(jīng)濟(jì)效益。除此之外,世界各國將新的研究點(diǎn)逐漸向空間往返運(yùn)輸能力建設(shè)以及復(fù)雜環(huán)境高魯棒性能的探測裝備研制轉(zhuǎn)變。
3)第三階段1994~至今
經(jīng)過第二階段的積累和總結(jié),隨著空間技術(shù)逐漸成熟,在空間應(yīng)用和空間科學(xué)任務(wù)及空間軍事活動(dòng)發(fā)展的需求的推動(dòng)下,開啟了新一輪的月球探測。與第一次探測高潮注重發(fā)展空間技術(shù)不同,地外資源與能源的勘察、采集及利用是其主要目標(biāo),因?yàn)橛袃r(jià)值的資源是發(fā)展的基礎(chǔ)支撐,不僅可以補(bǔ)充地球上日益減少的資源儲(chǔ)備,而且人類的探索必然逐步走向更深的宇宙空間,而月球上的這些資源可以為未來的深空探測提供保障。
相比于月球探測,由于距離地球更遠(yuǎn),大氣環(huán)境更復(fù)雜,火星探測難度更大,同時(shí)因其為距地球最近的行星,以及與地球相似的軌道,火星備受關(guān)注,也被認(rèn)為是最有可能、最有條件載人登陸的行星[7]?;仡櫷甑奶綔y歷程,人類對(duì)火星的探索從未停止,從冷戰(zhàn)開始,美國和蘇聯(lián)就開始了對(duì)火星的探索,希望通過對(duì)火星構(gòu)成、地貌和大氣等環(huán)境特征的探測,提高對(duì)火星的了解并尋找地外生命。但是由于技術(shù)上的不足以及任務(wù)的復(fù)雜性,大多數(shù)探測均宣告失敗。直到后續(xù)技術(shù)的積累,以美國為代表的探火任務(wù)取得了歷史性突破,例如“勇氣號(hào)”“機(jī)遇號(hào)”“好奇號(hào)”,以及即將開展的Mars2020和ExoMars等,正逐步向人類展示火星的真實(shí)一面,并逐一解答例如是否有水、是否有生命、是否適合人類居住等多個(gè)疑惑。通過對(duì)火星探測的發(fā)展歷程進(jìn)行分析,如圖2所示,可以得到如下啟示:
1)火星探測是未來行星探測的重點(diǎn):各國的行星探測任務(wù)的首選目標(biāo)都是火星,然后在其基礎(chǔ)上,再開展更遙遠(yuǎn)的深空探測計(jì)劃。同時(shí)各航天大國均制訂了長遠(yuǎn)而明確的火星探測任務(wù),未來20多年大多數(shù)火星探測窗口均有發(fā)射計(jì)劃,2022~2024公布的火星探測任務(wù)就有四次。
2)火星探測與月球探測技術(shù)互補(bǔ):從探測路線來看,火星和月球的探索過程都經(jīng)歷了飛越、環(huán)繞、著陸、采樣返回這四個(gè)階段,這符合技術(shù)發(fā)展由易到難循序漸進(jìn)的規(guī)律;從技術(shù)角度來看,火星和月球探測采用的大多數(shù)技術(shù)都是相通和類似的,技術(shù)發(fā)展的內(nèi)在規(guī)律也類似,因此火星和月球探測的技術(shù)之間可以相互轉(zhuǎn)化利用。
3)火星探測注重“技術(shù)和科學(xué)”雙輪驅(qū)動(dòng):基于科學(xué)目標(biāo)牽引,推動(dòng)技術(shù)革新;技術(shù)積累成熟,開展科學(xué)研究。即第一階段解決技術(shù)問題,即實(shí)現(xiàn)遠(yuǎn)距離和長時(shí)間的探索;第二階段開展科學(xué)研究,在第一階段的基礎(chǔ)上,開展更多有價(jià)值的科學(xué)探索。
由于月球沒有大氣,通常所說的月球軟著陸即為其動(dòng)力下降階段。當(dāng)探測器到達(dá)近月點(diǎn)后,著陸器發(fā)動(dòng)機(jī)點(diǎn)火制動(dòng),開始動(dòng)力下降。針對(duì)不同的月球軟著陸任務(wù),會(huì)設(shè)計(jì)不同的軟著陸動(dòng)力下降段以適應(yīng)任務(wù)的需求,一般的階段劃分為減速制動(dòng)段、接近段以及最終下降段。
減速制動(dòng)段持續(xù)過程從近月點(diǎn)(通常15 km高度)開始,到離月球表面1~2 km處,軟著陸燃料大部分在此段消耗,因?yàn)槠渲饕蝿?wù)是抵消初始軌道速度和重力加速度帶來的速度,故減速制動(dòng)段以燃料最優(yōu)為主要指標(biāo)。
接近段從月球表面1~2 km開始一直到著陸點(diǎn)上方約30 m高度處,此過程中將要消除干擾及偏差,對(duì)危險(xiǎn)障礙進(jìn)行精確識(shí)別,最后實(shí)現(xiàn)對(duì)安全著陸區(qū)的選址及定位。著陸器的接近段開始的時(shí)候需要調(diào)整著陸器的姿態(tài)以使傳感器保持足夠的視野,在下降過程中應(yīng)當(dāng)滿足相應(yīng)的姿態(tài)角約束和高度角約束以及終端狀態(tài)約束。同時(shí)在避障時(shí),著陸點(diǎn)重定位需考慮著陸器燃料消耗等約束,因此接近段以滿足約束條件為主要指標(biāo)。
最終下降段一般是垂直下降段,為了實(shí)現(xiàn)平穩(wěn)著陸,著陸器將以低速勻速緩慢下降,因此在最終下降段以控制穩(wěn)定性為主要指標(biāo)。
由于有大氣的影響,傳統(tǒng)火星著陸過程一般分為 3個(gè)階段:進(jìn)入段、下降段和最終著陸段[8]。
進(jìn)入段主要指探測器從接近段進(jìn)入火星大氣到降落傘打開的過程?;鹦侵懫髟谂c軌道器分離之后,將會(huì)調(diào)整到一個(gè)特定的姿軌狀態(tài)開始在大氣層外的自由巡航。當(dāng)其高度接近火星大氣層高度時(shí)(約125 km),開始大氣再入。在此過程中,需要不斷調(diào)整姿態(tài)以獲得合適的側(cè)傾角和攻角來調(diào)節(jié)側(cè)向力和升力,降低軌跡誤差,直到滿足降落傘展開條件。
下降段主要是指超音速傘降階段,即從著陸器降落傘打開到降落傘脫離結(jié)束。當(dāng)著陸器經(jīng)過大氣減速后,降落傘在拋掉整流罩之后開始展開,當(dāng)?shù)竭_(dá)距離火星表面約2~5 km時(shí)拋掉降落傘,開始最終著陸過程。
最終著陸段一般是指動(dòng)力下降段和著陸緩沖段(包含動(dòng)力反推緩沖)。動(dòng)力下降過程將主要完成安全著陸區(qū)定位,消除偏差,以及避障和重規(guī)劃。在下降到一定高度時(shí)(30~200 m),火星車被釋放,并通過一定的緩沖措施最終著陸。
在制導(dǎo)過程中,制導(dǎo)系統(tǒng)不斷確定飛行器與目標(biāo)或預(yù)定軌道之間的相對(duì)位置關(guān)系,并將制導(dǎo)信息發(fā)送給飛行器控制系統(tǒng)進(jìn)行飛行控制。目前對(duì)月球軟著陸制導(dǎo)方法[9]的研究可以歸納為五類:建立月球垂線法、重力轉(zhuǎn)彎制導(dǎo)法、標(biāo)稱軌跡制導(dǎo)方法、顯式制導(dǎo)方法和智能學(xué)習(xí)方法?;鹦擒浿憚?dòng)力下降段制導(dǎo)方法[10]大致可以分為三類:標(biāo)稱軌跡制導(dǎo)方法、顯式制導(dǎo)方法和智能學(xué)習(xí)方法。在實(shí)現(xiàn)軟著陸的任務(wù)中,制導(dǎo)控制算法需要滿足以下要求[11]:燃耗最優(yōu)或次優(yōu)性,魯棒性,自主性,實(shí)時(shí)性以及避障性能。
建立月球垂線法的基本原理是著陸器以大于0的相對(duì)速度進(jìn)入月球影響球,將以月球?yàn)榻裹c(diǎn)的做雙曲線運(yùn)動(dòng)。在到達(dá)制動(dòng)點(diǎn)之前,調(diào)整探測器的姿態(tài)和速度,使其與月面基本垂直,推力方向盡可能與速度方向重合反向并指向月心,滿足著陸初始條件后,保持垂直姿態(tài)實(shí)施軟著陸。這時(shí)的制導(dǎo)過程基本是一種開環(huán)的方式。
這種方法需要預(yù)先選定著陸點(diǎn),然后計(jì)算給出著陸方案,如果著陸過程中發(fā)生突發(fā)情況,比如發(fā)現(xiàn)預(yù)定區(qū)域存在障礙不適合降落,也無法重新規(guī)劃,探測任務(wù)就會(huì)失敗,因此這種方法在沒有高精度地圖的情況下應(yīng)用比較有限。此外這種方法對(duì)入軌精度和中途軌道修正精度要求較高,給制導(dǎo)控制系統(tǒng)的設(shè)計(jì)帶來困難,隨著深空探測任務(wù)越來越復(fù)雜,這種方法的應(yīng)用越來越局限。
重力轉(zhuǎn)彎制導(dǎo)方法的主要原理是控制發(fā)動(dòng)機(jī)的推力方向,使其與著陸器的速度方向重合反向,利用發(fā)動(dòng)機(jī)推力減速,在發(fā)動(dòng)機(jī)推力和月球引力的作用下,逐漸將探測器在月面水平方向的速度減到零,速度逐漸指向月心,實(shí)現(xiàn)月球的垂直軟著陸。這種方法采取半開環(huán)半閉環(huán)的方式,在主制動(dòng)段時(shí)主要目標(biāo)是降低著陸器速度,采取開環(huán)制導(dǎo)方式,當(dāng)著陸器與月面距離縮短到一定范圍時(shí),將敏感器的測量信息引入反饋控制器,進(jìn)行閉環(huán)制導(dǎo),盡可能提高著陸的精度性和平穩(wěn)性。
關(guān)于重力轉(zhuǎn)彎制導(dǎo)方法的研究主要存在于早期的無人月球著陸任務(wù)中:Citron等[12]同時(shí)對(duì)推力的大小和方向進(jìn)行調(diào)節(jié),對(duì)重力轉(zhuǎn)彎著陸過程進(jìn)行改進(jìn),實(shí)現(xiàn)定點(diǎn)軟著陸;Mcinnes等[13]設(shè)計(jì)了非線性反饋制導(dǎo)控制律;文獻(xiàn)[14]結(jié)合極大值原理,設(shè)計(jì)了重力轉(zhuǎn)彎開關(guān)制導(dǎo)律,能實(shí)現(xiàn)燃料最優(yōu)。
標(biāo)稱軌跡制導(dǎo)方法由開環(huán)離線軌跡規(guī)劃和閉環(huán)在線軌跡控制兩部分組成,著陸器在著陸前需要離線規(guī)劃一條優(yōu)化過的著陸飛行軌跡,著陸過程中按照該軌跡著陸,不斷測量著陸器的位置速度與規(guī)劃的軌跡之間的偏差,控制著陸器按規(guī)劃的方案飛行完成著陸。
4.3.1著陸軌跡優(yōu)化
著陸軌跡優(yōu)化問題的求解可以通過解析法和數(shù)值法兩種方法實(shí)現(xiàn)。解析法先建立關(guān)于系統(tǒng)狀態(tài)的狀態(tài)方程和最優(yōu)條件,然后利用經(jīng)典最優(yōu)控制論求解,得到最優(yōu)控制量及狀態(tài)量的表達(dá)式,通過這種方法可以獲得最優(yōu)解的解析形式,但當(dāng)系統(tǒng)復(fù)雜度高時(shí),呈現(xiàn)強(qiáng)非線性,該類方法對(duì)解的最優(yōu)性無法保障。而數(shù)值法則利用一定的插值逼近方法,將連續(xù)系統(tǒng)離散化,將其最優(yōu)控制問題轉(zhuǎn)化為有限維參數(shù)優(yōu)化問題,通過數(shù)值解法,得到一系列最優(yōu)軌跡的標(biāo)稱點(diǎn),從而得到最優(yōu)解的數(shù)值形式。相比于解析法,數(shù)值法更易于在強(qiáng)非線性環(huán)境下的應(yīng)用,也是目前研究的主流方向,分為軌跡優(yōu)化問題轉(zhuǎn)化和參數(shù)優(yōu)化問題求解兩個(gè)階段[15]。
數(shù)值法中軌跡優(yōu)化問題的轉(zhuǎn)化方法可以分為直接法和間接法[15]。直接法包括直接打靶法、配點(diǎn)法、微分包含法等,第一步采用參數(shù)化方法將連續(xù)空間最優(yōu)控制問題的求解轉(zhuǎn)化為非線性規(guī)劃問題,再利用數(shù)值方法求解轉(zhuǎn)化后的非線性規(guī)劃問題,由此獲得最優(yōu)軌跡。間接法包括各種偽譜方法,其基本思想是利用Pontryagin極大值原理,將最優(yōu)控制問題轉(zhuǎn)化為哈密頓邊值問題(HBVP)。
利用上述的轉(zhuǎn)化方法,軌跡優(yōu)化問題就轉(zhuǎn)化成了相應(yīng)的參數(shù)優(yōu)化問題,對(duì)參數(shù)優(yōu)化問題求解即可得到優(yōu)化軌跡。目前,對(duì)于參數(shù)優(yōu)化問題的求解算法主要分為精確算法、現(xiàn)代啟示算法以及混合算法三類。精確算法包括梯度下降法、內(nèi)點(diǎn)法、罰函數(shù)方法、動(dòng)態(tài)規(guī)劃法、QP以及SQP等;現(xiàn)代啟示算法包括GA、群智能算法、模擬退火算法及神經(jīng)網(wǎng)絡(luò)算法等;而混合優(yōu)化算法將以上精確算法和現(xiàn)代啟示算法中的幾種參數(shù)化算法相結(jié)合以取長補(bǔ)短。
4.3.2著陸軌跡跟蹤制導(dǎo)律
著陸軌跡跟蹤的目標(biāo)是對(duì)離線著陸軌跡優(yōu)化得到的軌跡進(jìn)行在線跟蹤,控制著陸器使其位置和速度與設(shè)定軌跡保持一致,實(shí)現(xiàn)近似最優(yōu)的軟著陸。實(shí)際著陸過程中位置和速度與設(shè)定軌跡一致性越好,實(shí)際軌跡的最優(yōu)性也更好,因此應(yīng)設(shè)計(jì)合適的跟蹤制導(dǎo)律,使著陸器盡快到達(dá)預(yù)定軌跡并沿軌跡運(yùn)動(dòng)至目標(biāo)點(diǎn)。
常用的標(biāo)稱跟蹤的制導(dǎo)控制律有:多項(xiàng)式制導(dǎo)律、線性反饋制導(dǎo)律、非線性反饋制導(dǎo)律、H∞控制反饋制導(dǎo)律、滑??刂品答佒茖?dǎo)律等。文獻(xiàn)[15]利用極大值原理給出了著陸軌跡最優(yōu)性推導(dǎo),同時(shí)基于人工神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)了閉環(huán)形式的制導(dǎo)律。Liaw等[16]利用滑模邊界層法,設(shè)計(jì)了能夠?qū)χ憳?biāo)稱軌跡進(jìn)行跟蹤三維制導(dǎo)律;Liu等[17]基于H∞控制方法設(shè)計(jì)了魯棒性和抗干擾性較好的H∞控制反饋制導(dǎo)律;Li等[18]基于反步法設(shè)計(jì)了自適應(yīng)跟蹤制導(dǎo)律,該跟蹤律能實(shí)現(xiàn)在線的故障診斷容錯(cuò)控制。
4.3.3其它變體
除上述方法外,當(dāng)實(shí)際軌跡和標(biāo)稱軌跡之間的偏差較小時(shí),標(biāo)稱軌跡制導(dǎo)可擴(kuò)展為攝動(dòng)制導(dǎo),攝動(dòng)制導(dǎo)通過線性化,在標(biāo)稱軌跡附近將軌道約束函數(shù)一階泰勒展開,然后利用線性化的結(jié)果求解控制量,線性化后的計(jì)算量大大減少且準(zhǔn)確性也未降低。此外,也有學(xué)者利用曲線插值技術(shù)來生成軌跡,如文獻(xiàn)[19]利用樣條插值方法綜合全弧段數(shù)據(jù)來數(shù)值逼近有效的落月軌跡。
顯式制導(dǎo)方法又稱預(yù)測/校正制導(dǎo)方法,其核心是利用控制泛函的顯函數(shù)形式進(jìn)行閉環(huán)制導(dǎo)解算。通常建立數(shù)學(xué)模型時(shí)需要對(duì)軟著陸模型進(jìn)行簡化,得到軟著陸最優(yōu)控制問題的解析表達(dá)式。常見的顯式制導(dǎo)律有迭代制導(dǎo)律、動(dòng)力顯式制導(dǎo)律和燃耗次優(yōu)制導(dǎo)律等。
迭代制導(dǎo)方式最早應(yīng)用于土星IB和土星V的飛行上[20]。迭代制導(dǎo)方案根據(jù)飛行器速度、位置、縱向加速度和重力加速度的狀態(tài)以及期望的截止條件計(jì)算轉(zhuǎn)向指令;使用飛行器更新后狀態(tài)在每個(gè)制導(dǎo)周期中更新制導(dǎo)命令。迭代制導(dǎo)方案是一種路徑自適應(yīng)制導(dǎo)方案,因?yàn)樗谒锌赡艿娘w行器擾動(dòng)類型和程度下保持其優(yōu)化性能,而不會(huì)損失精度。航天飛機(jī)的制導(dǎo)方案是動(dòng)力顯式制導(dǎo)方法的成功應(yīng)用的實(shí)例。Mchenry等[21]推導(dǎo)出了滿足大范圍機(jī)動(dòng)約束的顯式制導(dǎo)方程和由制導(dǎo)解產(chǎn)生姿態(tài)轉(zhuǎn)向誤差的轉(zhuǎn)向方程,以及導(dǎo)航方程和由冗余測量值確定故障儀表的方程;Guo等[22]基于平坦地形及定量重力加速度假設(shè),提出了一種基于Pontryagin極大值原理的相似的多項(xiàng)式制導(dǎo)律;Lu等[23]開發(fā)了一種單基線預(yù)測校正算法,該算法可應(yīng)用于不同推力的著陸器。
一般情況下,GNC系統(tǒng)從動(dòng)力下降段開始探測器根據(jù)傳器得到實(shí)時(shí)狀態(tài)和終端狀態(tài)進(jìn)行解算,具有完全的自主性。顯式制導(dǎo)具有對(duì)抗大干擾的能力,制導(dǎo)末端精度幾乎不受干擾影響,具有一定的魯棒性。但是為滿足實(shí)時(shí)性要求,對(duì)搭載的GNC計(jì)算機(jī)有較快的運(yùn)算速度和穩(wěn)定的性能。由于最優(yōu)控制問題數(shù)學(xué)建模時(shí)存在大量的假設(shè)和擾動(dòng)偏差,因此顯式制導(dǎo)律的燃料消耗是次優(yōu)的。
深度學(xué)習(xí)是一類新興的多層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法[24]。深度強(qiáng)化學(xué)習(xí)具備較強(qiáng)的高維感知能力和具有策略性的決策能力,是一種端到端的優(yōu)化學(xué)習(xí)方法,為解決類似航天器這樣的復(fù)雜非線性系統(tǒng)的軟著陸問題提供了思路。
近兩年,Carlos等[25]在假設(shè)狀態(tài)信息完備的情況下,對(duì)訓(xùn)練深度人工神經(jīng)網(wǎng)絡(luò)來表示精確著陸過程中的最優(yōu)控制過程進(jìn)行了詳細(xì)的研究,他們的系統(tǒng)能夠處理大量可能的初始狀態(tài),同時(shí)仍能產(chǎn)生最優(yōu)響應(yīng);Furfaro等[26]提出了一種基于深度學(xué)習(xí)的自主登月方法,這種方法可以用于狀態(tài)估計(jì)而不需要濾波器;此外,還提出了一種深度遞歸神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),從行星動(dòng)力下降階段的狀態(tài)序列預(yù)測最優(yōu)燃料推力并利用長、短期記憶網(wǎng)絡(luò)對(duì)增加的網(wǎng)絡(luò)信息進(jìn)行跟蹤,從而提高了輸出估計(jì)的精度[27]。Gaudet等[28]提出了一種基于深度強(qiáng)化學(xué)習(xí)的行星動(dòng)力下降制導(dǎo)方法,該方法采用了策略梯度法來生成精確且省油的軌跡。文獻(xiàn)[29]提出了一種基于經(jīng)典ZEM-ZEV的自適應(yīng)反饋制導(dǎo)算法,使用深度強(qiáng)化學(xué)習(xí)來克服其局限性。文獻(xiàn)[30]提出了一種基于遞歸策略和價(jià)值函數(shù)逼近器的增強(qiáng)元學(xué)習(xí)自適應(yīng)導(dǎo)引系統(tǒng),該系統(tǒng)集成了制導(dǎo)和導(dǎo)航功能。
相較于傳統(tǒng)方法而言,深度強(qiáng)化學(xué)習(xí)具有全局搜索最優(yōu)性。訓(xùn)練好的智能體運(yùn)行速度非??欤哂蟹浅:玫膶?shí)時(shí)性。此外,在GNC方面也有一定的優(yōu)越性,例如動(dòng)力學(xué)無縫銜接且無約束,不需要狀態(tài)反饋、控制約束易處理等。然而,并不是每一次訓(xùn)練都能夠讓智能體損失函數(shù)收斂,并且訓(xùn)練好的智能體在仿真測試過程中也有可能出現(xiàn)失誤,這在工程上是不被允許的。此外,如何能讓智能體在真實(shí)環(huán)境下表現(xiàn)得和仿真環(huán)境一樣好也是目前亟待解決的問題。
在軟著陸制導(dǎo)問題中,受發(fā)射能力及有效載荷質(zhì)量限制,攜帶的燃料是有限的,常以燃料最省為優(yōu)化指標(biāo)進(jìn)行求解。同時(shí)考慮到著陸器的動(dòng)力學(xué)模型和機(jī)動(dòng)能力邊界,需要在著陸軌跡優(yōu)化的過程中考慮多種必要的狀態(tài)約束和路徑約束,其中包括推力約束,姿態(tài)約束,起始狀態(tài)約束,終端狀態(tài)約束,以及在復(fù)雜的地形環(huán)境下著陸還需要考慮障礙約束。而包含大量約束的最優(yōu)控制問題一般存在嚴(yán)重的非線性和非凸形,求解起來十分困難且容易陷入局部最優(yōu),因此在建立最優(yōu)控制問題模型的階段均對(duì)原始任務(wù)進(jìn)行不同程度的線性化或凸化[31]。常用于軟著陸的約束優(yōu)化方法有:二階錐優(yōu)化、連續(xù)線性化等。
近年來,可變推力大小發(fā)動(dòng)機(jī)的工程研究取得了一定的突破,同時(shí)各大工程傾向于在最終著陸段引入自主避障技術(shù),因此障礙約束的處理方法和包含推力大小約束及障礙約束的制導(dǎo)方法對(duì)于提高探測器的避障能力至關(guān)重要。Acikmese等[32]提出了將非凸優(yōu)化問題進(jìn)行凸化轉(zhuǎn)化的思想,解決了以發(fā)動(dòng)機(jī)推力幅值的上下界作為約束條件的燃耗最優(yōu)問題。在此基礎(chǔ)上,Blackmore等[33]的研究已經(jīng)擴(kuò)展到尋找最小的著陸誤差軌跡的燃耗最優(yōu)問題;Harris等[34]提出了一種處理半連續(xù)控制約束的方法,用于尋找一類混合整數(shù)非凸問題的全局最優(yōu)解。Shen等[35]將靈敏度補(bǔ)償因子應(yīng)用于燃耗最優(yōu)著陸問題,得到了一種考慮不確定性和擾動(dòng)的最優(yōu)控制方法。Lu等[36]提出了一種優(yōu)化燃料和保證足夠的制導(dǎo)裕度增強(qiáng)型阿波羅動(dòng)力下降制導(dǎo)方法,該方法能適應(yīng)多種任務(wù)。Cui等[37]提出了凸軌跡可以通過一種新型的和解析的軌跡曲率制導(dǎo)方法來構(gòu)建;Bai等[38]提出了利用非凸函數(shù)對(duì)障礙物進(jìn)行合并,將這些非凸障礙約束轉(zhuǎn)化為凸障礙約束的線性化方法。
如圖3所示,從技術(shù)的發(fā)展變化可以總結(jié)出軟著陸制導(dǎo)技術(shù)的發(fā)展趨勢呈現(xiàn)三個(gè)階段,也說明了隨著通用技術(shù)體系的發(fā)展,如人工智能等,對(duì)制導(dǎo)方法的性能優(yōu)化與更新起到了關(guān)鍵作用。下面對(duì)每一個(gè)階段做簡要總結(jié):
1)人為智能:固定軌跡制導(dǎo)
早期深空著陸任務(wù)著陸區(qū)相對(duì)平坦,其制導(dǎo)方法相對(duì)簡單,計(jì)算量小,如月球垂線法和重力轉(zhuǎn)彎法都是提前生成軟著陸軌跡。該類方法最大特點(diǎn)是簡單實(shí)用,但所規(guī)劃的軌道不是能量最優(yōu)軌道,故常用于早期探測任務(wù),以及對(duì)著陸精度要求不高的探測任務(wù)。
2)機(jī)器智能:基于優(yōu)化制導(dǎo)
隨著最優(yōu)控制和優(yōu)化理論的發(fā)展以及搭載計(jì)算機(jī)性能的提升,軌跡優(yōu)化逐漸成為制導(dǎo)技術(shù)的熱門選擇。對(duì)于離線設(shè)計(jì)的軌跡一般而言是最優(yōu)的,但是這樣的方法靈活性較差,自主能力和避障能力都是有限的,不適用于環(huán)境復(fù)雜的著陸任務(wù)。顯式制導(dǎo)方法在線更新飛行的軌跡,有一定的自主性和較強(qiáng)的避障能力。
近年來,隨著路徑規(guī)劃技術(shù)的興起,RRT、PRM等基于采樣理論的算法得到了快速發(fā)展。該類方法能夠快速、有效地搜索高維空間,適用于復(fù)雜或動(dòng)態(tài)環(huán)境下多自由度智能體路徑規(guī)劃求解。將基于采樣的方法融入制導(dǎo)體系對(duì)提高探測器的實(shí)時(shí)性,進(jìn)一步降低算法計(jì)算量有著巨大的潛力。
3)人工智能:基于學(xué)習(xí)制導(dǎo)
基于優(yōu)化的設(shè)計(jì)思路,其設(shè)計(jì)較為復(fù)雜,計(jì)算量大,對(duì)著陸器動(dòng)力學(xué)及擾動(dòng)建模精度要求較高,目前在線求解還很少應(yīng)用。而強(qiáng)化學(xué)習(xí)技術(shù)的出現(xiàn),給出了一個(gè)全新的軟著陸制導(dǎo)技術(shù)研究方向,既可以利用基于模型的強(qiáng)化學(xué)習(xí)方法來完成參數(shù)訓(xùn)練,也可以僅基于數(shù)據(jù)實(shí)現(xiàn)著陸策略的學(xué)習(xí),這將大大提高算法的通用性及魯棒性。當(dāng)然目前基于學(xué)習(xí)的制導(dǎo)策略還存在其自身的問題,比如黑盒操作模式,不可解釋性等,這對(duì)于后續(xù)的任務(wù)應(yīng)用提出了很大的挑戰(zhàn)。但是隨著有穩(wěn)定性保障的深度強(qiáng)化學(xué)習(xí)研究的不斷深入,相信這會(huì)是未來的研究趨勢。
此外,制導(dǎo)方案的選擇很大程度上取決于著陸要求、任務(wù)目標(biāo)和規(guī)劃方案的不同。而一個(gè)任務(wù)往往是由若干個(gè)子任務(wù)組成,故可以根據(jù)子問題進(jìn)行具體分析,通過選擇不同的性能指標(biāo)及約束定義運(yùn)用到不同的子任務(wù)當(dāng)中,最終實(shí)現(xiàn)整體任務(wù)的成功實(shí)現(xiàn)。
通過對(duì)上述三個(gè)階段發(fā)展的本質(zhì)可以看出,智能化與制導(dǎo)技術(shù)的融合是未來的前沿,勢必會(huì)帶動(dòng)更多的研究熱情,逐漸向著具備通用性、可解釋性、以及自主學(xué)習(xí)能力的智能軟著陸技術(shù)發(fā)展。與此同時(shí),人類對(duì)于月球以及火星的探測目標(biāo)已發(fā)生了轉(zhuǎn)變,更多的任務(wù)將集中在復(fù)雜極區(qū)著陸,甚至是探索從未到達(dá)過的永久陰影區(qū),其任務(wù)難度之大,對(duì)精確軟著陸技術(shù)提出了更為嚴(yán)苛的要求。綜上分析,對(duì)于月球及火星軟著陸的發(fā)展,其趨勢總結(jié)如下:
1)算法輕量化,規(guī)劃實(shí)時(shí)化:從算法的復(fù)雜性發(fā)展過程可以看出,制導(dǎo)控制算法有著從簡單到復(fù)雜再到精煉的發(fā)展趨勢。早期深空探測任務(wù)受到星載計(jì)算機(jī)計(jì)算能力的限制,只能使用計(jì)算量小的制導(dǎo)算法盡量滿足著陸任務(wù)的需求,著陸過程甚至存在內(nèi)存溢出這樣的風(fēng)險(xiǎn)。隨著計(jì)算機(jī)技術(shù)的發(fā)展,復(fù)雜性更高、性能更加優(yōu)越的算法得以在實(shí)際工程中運(yùn)用。未來的著陸任務(wù)為了滿足實(shí)時(shí)規(guī)劃避障的需求,必然需要更加輕量化的制導(dǎo)控制算法。
2)方案多樣化,技術(shù)通用化:隨著探測任務(wù)的增加,以及探測目標(biāo)的復(fù)雜化,勢必會(huì)涉及到不同約束下的精確著陸問題。極區(qū)的復(fù)雜山地,黑暗的永久陰影區(qū)和常規(guī)的平坦區(qū)域都會(huì)對(duì)應(yīng)不同的制導(dǎo)方案。加之對(duì)月球及火星開展探測活動(dòng)的機(jī)構(gòu)越來越多,可以預(yù)見軟著陸制導(dǎo)控制方案將越來越多元化。方案多樣化為不同的著陸任務(wù)提供了豐富的選擇,同時(shí),多樣的方案能夠凸顯某些技術(shù)的共性,為技術(shù)的通用化打下了基礎(chǔ),使得技術(shù)和任務(wù)的關(guān)系從一對(duì)一逐漸向一對(duì)多和多對(duì)多發(fā)展。
3)平臺(tái)智能化,環(huán)境自適應(yīng):著陸器作為開展地外探測任務(wù)的主體,對(duì)整個(gè)任務(wù)是非常重要的一環(huán),精準(zhǔn)的著陸會(huì)給后續(xù)任務(wù)帶來能量、時(shí)間、安全等全方位的支撐。隨著技術(shù)的發(fā)展,以及器件、處理能力的提升,其自主化程度顯著提升,可以預(yù)見隨著人工智能技術(shù)與航天的深入融合,必然將引導(dǎo)著陸器向完全智能化發(fā)展。同時(shí)隨著智能化程度的變化,不僅會(huì)增加對(duì)著陸環(huán)境的檢測精度及效率,同時(shí)會(huì)提升在線的解算及決策能力,結(jié)合之前多樣化的制導(dǎo)方案,通過不斷的學(xué)習(xí),可以預(yù)見軟著陸能力逐漸向環(huán)境自適應(yīng)發(fā)展。
現(xiàn)有的軟著陸技術(shù)在精度、穩(wěn)定性、魯棒性等方面都存在不足,無法滿足未來密集、復(fù)雜探測任務(wù)新的能力要求。很難為后續(xù)月球/火星定點(diǎn)采樣返回,月面/火星表面大范圍巡視,地外基地建設(shè),以及原位資源利用等任務(wù)提供有效保障,故基于上述回顧及分析,下面從三個(gè)層面淺析面臨的挑戰(zhàn)。
1)技術(shù)層關(guān)鍵問題
技術(shù)急需迭代創(chuàng)新,智能學(xué)習(xí)有望突破。傳統(tǒng)的給定軌道及優(yōu)化思想實(shí)現(xiàn)的軟著陸制導(dǎo),很大程度上依賴于先驗(yàn)知識(shí),比如模型、約束、環(huán)境等,缺乏對(duì)不同任務(wù)設(shè)計(jì)的通用性,同時(shí)容易受建模偏差、不確定擾動(dòng)等因素影響,且相當(dāng)一部分基于優(yōu)化的方法難以在線使用。而隨著深度強(qiáng)化學(xué)習(xí)的興起,給智能化著陸制導(dǎo)提供了新的思路,可以從數(shù)據(jù)的角度去擺脫對(duì)模型的依賴,通過端到端的設(shè)計(jì)去簡化考慮擾動(dòng)帶來的影響,完全依靠神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)學(xué)習(xí),但因其黑盒的操作模式,存在著強(qiáng)不可解釋性,無法保證運(yùn)行的可靠和收斂;同時(shí),對(duì)于訓(xùn)練數(shù)據(jù)的獲取,以及如何實(shí)現(xiàn)在有限數(shù)據(jù)樣本或者差異數(shù)據(jù)樣本條件下的魯棒學(xué)習(xí)等等都是值得后續(xù)研究的關(guān)鍵。綜上,如何讓傳統(tǒng)制導(dǎo)方法高效化、輕量化、通用化,以及如何讓學(xué)習(xí)制導(dǎo)方法可解釋、可證明、可泛化是技術(shù)層亟待解決的難題。
2)系統(tǒng)層關(guān)鍵問題
系統(tǒng)急需綜合優(yōu)化,一體化設(shè)計(jì)勢在必行。軟著陸的成功與否,精度是否滿足要求,除了算法本身的性能,同時(shí)與導(dǎo)航、控制、結(jié)構(gòu)等多個(gè)環(huán)境存在耦合關(guān)聯(lián),準(zhǔn)確的導(dǎo)航信息獲取、可靠的控制指令執(zhí)行都是決定成敗的關(guān)鍵。目前系統(tǒng)之間多采取模塊化設(shè)計(jì),通過接口來實(shí)現(xiàn)互聯(lián),即使有提出一體化設(shè)計(jì)思路,但是在工程實(shí)踐方面還是很難完全保證,而對(duì)于之間的關(guān)聯(lián)還未有深入研究,什么類型的感知信息是最適合當(dāng)前任務(wù)制導(dǎo)解算的,生成何種形式的制導(dǎo)指令是控制系統(tǒng)最佳的輸入,可否通過給定任務(wù)實(shí)現(xiàn)從選型到技術(shù)實(shí)現(xiàn)的自適應(yīng)設(shè)計(jì),從系統(tǒng)本身更有研究的價(jià)值。綜上,如何實(shí)現(xiàn)軟/硬件靈活設(shè)計(jì)、感知/制導(dǎo)/控制/通信一體化融合設(shè)計(jì)是系統(tǒng)層需要考慮的難題。
3)任務(wù)層關(guān)鍵問題
任務(wù)趨于定制化,組件模塊化、流程標(biāo)準(zhǔn)化的泛化設(shè)計(jì)尤為重要。除了已經(jīng)開展的月球、火星軟著陸任務(wù),后續(xù)還將會(huì)拓展到其它地外天體,環(huán)境的差異(大氣、密度分布、光照、輻射等)、干擾源的不同都會(huì)提出新的挑戰(zhàn);同時(shí),面對(duì)未來大密度開展的月球開發(fā)任務(wù),比如復(fù)雜月背、極區(qū)、永久陰影區(qū)等未知區(qū)域的探測,對(duì)快速障礙檢測、自適應(yīng)自主避障等方面都有由嚴(yán)格的要求;再者,高昂的任務(wù)成本,難以接受不靈活的設(shè)計(jì)方案,更加看重方案的通用性。綜上,如何基于任務(wù)出發(fā),實(shí)現(xiàn)適應(yīng)多種環(huán)境、約束條件下的成本可控、通用化、標(biāo)準(zhǔn)化的軟著陸制導(dǎo)系統(tǒng)是任務(wù)層考慮的關(guān)鍵。
本文對(duì)月球及火星探測任務(wù)進(jìn)行了回顧,分別整理了到目前已經(jīng)開展或即將開展的任務(wù)序列表,并就其任務(wù)發(fā)展的趨勢及變化進(jìn)行了分析。同時(shí),針對(duì)探測過程中關(guān)鍵的軟著陸過程進(jìn)行了闡述,并總結(jié)整理了目前軟著陸制導(dǎo)技術(shù)的發(fā)展體系,最后著重分析了該技術(shù)的發(fā)展趨勢,以及制約其發(fā)展的關(guān)鍵問題。通過本文的梳理,意在為后續(xù)的探測發(fā)展以及學(xué)術(shù)研究提供可行的參考。