常海濤,黃攀峰,*,王明,孟中杰
1.西北工業(yè)大學(xué)航天飛行動(dòng)力學(xué)技術(shù)重點(diǎn)實(shí)驗(yàn)室,西安 710072 2.西北工業(yè)大學(xué) 智能機(jī)器人研究中心,西安 710072 3.北方自動(dòng)控制技術(shù)研究所,太原 030006
空間細(xì)胞機(jī)器人接管控制的分布式控制分配
常海濤1,2,黃攀峰1,2,*,王明3,孟中杰1,2
1.西北工業(yè)大學(xué)航天飛行動(dòng)力學(xué)技術(shù)重點(diǎn)實(shí)驗(yàn)室,西安 710072 2.西北工業(yè)大學(xué) 智能機(jī)器人研究中心,西安 710072 3.北方自動(dòng)控制技術(shù)研究所,太原 030006
采用接管控制技術(shù)延長航天器壽命為在軌服務(wù)提供了一種新思路,本文提出一種利用空間細(xì)胞機(jī)器人實(shí)施航天器接管控制的方案。針對(duì)空間細(xì)胞機(jī)器人實(shí)施接管控制的控制分配問題,建立了空間細(xì)胞機(jī)器人實(shí)施接管控制的動(dòng)力學(xué)模型。為實(shí)現(xiàn)分布式控制分配,提出了一種基于CBBA算法的接管控制分配算法,利用自由市場(chǎng)機(jī)制實(shí)現(xiàn)控制分配的分布和異步計(jì)算。綜合考慮了執(zhí)行能力匹配、剩余能量和執(zhí)行器輸出限制,定義了空間細(xì)胞機(jī)器人的收益函數(shù),空間細(xì)胞機(jī)器人通過自由拍賣和一致性協(xié)商完成控制任務(wù)的分配。通過蒙特卡羅分析,將本文算法與集中式分配算法零空間修正偽逆法相比較并進(jìn)行參數(shù)影響分析,本文算法在保證分配精度的情況下,具有能量均衡等能力。
細(xì)胞機(jī)器人;接管控制;控制分配;CBBA算法;零空間
空間技術(shù)發(fā)展日新月異,各種航天器得到了廣泛的應(yīng)用,近年來,GEO軌道衛(wèi)星年均發(fā)射量約25顆[1],但仍難滿足日益增長的需求。傳統(tǒng)航天器設(shè)計(jì)模式需要大量的測(cè)試,難以降低成本和縮短周期。另外目前航天器大多無可接受在軌服務(wù)設(shè)計(jì),針對(duì)各種不同在軌服務(wù)任務(wù)定制相應(yīng)空間機(jī)器人系統(tǒng),將帶來時(shí)間和成本的巨大消耗??臻g細(xì)胞機(jī)器人(Cellular Space Robot,CSR)是面向在軌服務(wù)新挑戰(zhàn)的一種新的空間系統(tǒng)構(gòu)建形式和操作手段。通過打破航天器系統(tǒng)架構(gòu)和設(shè)計(jì)模式,按照典型子系統(tǒng)將其拆分為多個(gè)標(biāo)準(zhǔn)化、物理獨(dú)立、功能獨(dú)立、采用標(biāo)準(zhǔn)接口連接的細(xì)胞機(jī)器人,如測(cè)量細(xì)胞、通信細(xì)胞、執(zhí)行器細(xì)胞、載荷細(xì)胞、操作細(xì)胞等,仿照生物多細(xì)胞組織將細(xì)胞機(jī)器人相互結(jié)合,形成滿足多種功能需求的空間細(xì)胞機(jī)器人群落,以適應(yīng)不同的在軌構(gòu)建和在軌服務(wù)任務(wù)需求。
空間細(xì)胞機(jī)器人的概念是從Tanaka等[2]所提出的細(xì)胞星(CellSat)概念發(fā)展而來的。Cell-Sat的理念是將衛(wèi)星按典型子系統(tǒng)拆分為多個(gè)標(biāo)準(zhǔn)化的細(xì)胞,利用機(jī)器人將不同類型的細(xì)胞裝配在一起形成集成航天器。Tanaka等[3]完成了CellSat樣機(jī)設(shè)計(jì)并進(jìn)行了精確裝配方法研究。類似的還有DARPA的鳳凰計(jì)劃(Phoenix Project)[4-5]和 DLR 的iBOSS (Intelligent Building Blocks for On-orbit-Satellite Servicing)[6-7],上述項(xiàng)目均需由額外的機(jī)器人完成裝配操作,因此每個(gè)細(xì)胞均需配備機(jī)械臂位姿測(cè)量的合作靶標(biāo)[8]。空間細(xì)胞機(jī)器人在上述項(xiàng)目基礎(chǔ)上,利用操作細(xì)胞的操作能力實(shí)現(xiàn)航天器系統(tǒng)的自主構(gòu)建和自重構(gòu);同時(shí)可以與待服務(wù)航天器等操作目標(biāo)連接組合,實(shí)現(xiàn)在軌服務(wù)。
利用空間細(xì)胞機(jī)器人實(shí)施接管控制是其典型在軌服務(wù)任務(wù)。接管控制[9]是通過服務(wù)航天器與目標(biāo)航天器結(jié)合,利用自身的執(zhí)行機(jī)構(gòu)來接管目標(biāo)的姿軌控制,實(shí)現(xiàn)控制系統(tǒng)失效航天器的壽命延長??臻g細(xì)胞機(jī)器人實(shí)施接管控制任務(wù)中,由于單個(gè)細(xì)胞機(jī)器人執(zhí)行能力有限,因此執(zhí)行器細(xì)胞需要冗余配置,才能使系統(tǒng)具備足夠的執(zhí)行能力,此時(shí)將期望控制量在冗余配置的執(zhí)行細(xì)胞間進(jìn)行分配,使執(zhí)行細(xì)胞的合成輸出盡可能與期望控制量匹配是本文的主要研究內(nèi)容。
常用的控制分配方法有偽逆法、直接分配法、數(shù)學(xué)規(guī)劃法等。由于偽逆法無法保證輸出在執(zhí)行器輸出可行域內(nèi),因此Bordignon和Durham[10-11]利用控制效率矩陣的零空間對(duì)偽逆解進(jìn)行修正,使其重新落入可行域內(nèi),張世杰等[12]等利用該思想解決了過驅(qū)衛(wèi)星的反作用飛輪控制分配,但該算法需要進(jìn)行多次矩陣偽逆求解;直接分配法是Durham[13-14]提出的一種幾何算法,幾何原理直觀,但求解可達(dá)集時(shí)計(jì)算量和計(jì)算復(fù)雜度較大;數(shù)學(xué)規(guī)劃法通過選取一定的優(yōu)化指標(biāo),將控制分配問題轉(zhuǎn)化為標(biāo)準(zhǔn)的線性規(guī)劃問題,Harkegard[15]將控制分配與執(zhí)行機(jī)構(gòu)的動(dòng)態(tài)響應(yīng)相結(jié)合,提出了動(dòng)態(tài)控制分配方法。以上三類控制分配算法為集中式算法,而實(shí)際空間細(xì)胞機(jī)器人相互之間通過通信線路互聯(lián)協(xié)作,具有分布式特點(diǎn),因此本文參考多機(jī)器人任務(wù)分配算法[16-17],實(shí)現(xiàn)細(xì)胞機(jī)器人的分布和異步控制分配。
本文以空間細(xì)胞機(jī)器人實(shí)施接管控制為任務(wù)背景,首先建立其動(dòng)力學(xué)模型,然后考慮空間細(xì)胞機(jī)器人的分布式特點(diǎn),研究其在接管控制中的控制分配問題。采用基于市場(chǎng)法和一致性算法,實(shí)現(xiàn)分布、異步計(jì)算,最后通過與一種零空間修正的集中式算法進(jìn)行了仿真對(duì)比,并對(duì)本文算法進(jìn)行了參數(shù)影響分析。
空間細(xì)胞機(jī)器人作為一種新的空間系統(tǒng)構(gòu)建形式和操作手段,其系統(tǒng)由多個(gè)標(biāo)準(zhǔn)化的細(xì)胞機(jī)器人,如測(cè)量細(xì)胞、通信細(xì)胞、執(zhí)行器細(xì)胞等,通過標(biāo)準(zhǔn)化機(jī)械、電、數(shù)據(jù)接口連接,形成不同功能的空間系統(tǒng)。圖1所示為空間細(xì)胞機(jī)器人典型應(yīng)用:圖1(a)為利用不同功能的細(xì)胞機(jī)器人裝配成為新的空間系統(tǒng),用于空間系統(tǒng)在軌裝配;圖1(b)為利用細(xì)胞機(jī)器人和天線等目標(biāo)結(jié)合,并利用執(zhí)行器細(xì)胞等實(shí)施接管控制,用于控制系統(tǒng)失效航天器壽命延長等在軌服務(wù)任務(wù)。本文研究圖1(b)所示接管控制的控制分配問題。
圖1 空間細(xì)胞機(jī)器人(CSRs)典型應(yīng)用Fig.1 Typical applications of cellular space robots(CSRs)
為建立空間細(xì)胞機(jī)器人接管控制的動(dòng)力學(xué)模型,將接管目標(biāo)及細(xì)胞機(jī)器人的組合體視為剛體B0,細(xì)胞機(jī)器人視為固連其上的質(zhì)點(diǎn),空間細(xì)胞機(jī)器人系統(tǒng)一般模型如圖2所示。
圖2 空間細(xì)胞機(jī)器人系統(tǒng)一般模型Fig.2 General model of CSR system
圖2中:cB為組合體質(zhì)心位置,cBxByBzB為組合體質(zhì)心坐標(biāo)系,oIxIyIzI為慣性坐標(biāo)系。在B0上不同位置安裝有不同類型的細(xì)胞機(jī)器人,根據(jù)細(xì)胞機(jī)器人的執(zhí)行器種類將其劃分為兩類:一類為外力型細(xì)胞機(jī)器人共n個(gè),裝備推力器等力執(zhí)行器,分別記為Rf1,Rf2,…,Rfn,安裝位置相對(duì)于質(zhì)心cB的位移矢量分別為a1,a2,…,an,力作用方向的單位矢量分別為k1,k2,…,kn,作用力大小分別為f1,f2,…,fn;另一類為力矩型細(xì)胞機(jī)器人共m個(gè),裝備反作用飛輪等力矩執(zhí)行器,分別記為Rt1,Rt2,…,Rtm,力矩作用方向單位矢量分別 為 d1,d2,…,dm,力 矩 大 小 分 別 為 τ1,τ2,…,τm。
外力型細(xì)胞機(jī)器人Rfi對(duì)系統(tǒng)的力Fi∈R3×1和力矩Ti∈R3×1分別為力矩型細(xì)胞機(jī)器人Rtj對(duì)系統(tǒng)的力Fj∈R3×1
和力矩Tj∈R3×1分別為
定義輸出向量F= [f1f2… fn]T∈Rn×1,T= [τ1τ2… τm]T∈Rm×1。則系統(tǒng)所受作用力Fe∈R3×1和作用力矩Te∈R3×1分別為
式中:Jf∈R6×n為推力控制效率矩陣,表示外力型細(xì)胞機(jī)器人力輸出到系統(tǒng)外力和外力矩的轉(zhuǎn)換關(guān)系;Jt∈R6×m為力矩控制效率矩陣,表示力矩型細(xì)胞機(jī)器人力矩輸出到系統(tǒng)外力和外力矩的轉(zhuǎn)換關(guān)系。由式(1)和式(2)可知
式中:M為組合體質(zhì)量;I∈R3×3為其轉(zhuǎn)動(dòng)慣量;v∈R3×1為質(zhì)心線速度;ω∈R3×1為角速度;ξe∈R6×1為外部干擾力和干擾力矩。
式(6)可以整理為
式中:
根據(jù)Newton-Euler法,系統(tǒng)動(dòng)力學(xué)方程為
其中:H (X)為系統(tǒng)慣性矩陣,描述系統(tǒng)的質(zhì)量和慣量特性;X= [x y z α β γ]T為系統(tǒng)位姿,其中x、y、z為三軸位置,α、β、γ為1-2-3歐拉角;c ()為非線性力項(xiàng),包括科氏力和離心力;E3為3階單位矩陣。
利用細(xì)胞機(jī)器人對(duì)目標(biāo)航天器實(shí)施接管控制,由于單個(gè)細(xì)胞機(jī)器人通常執(zhí)行能力有限,因此需要配置細(xì)胞機(jī)器人的數(shù)量要大于接管目標(biāo)航天器系統(tǒng)的自由度,系統(tǒng)為過驅(qū)動(dòng)控制系統(tǒng)。令系統(tǒng)控制量為W∈R6×1(力和力矩),執(zhí)行細(xì)胞機(jī)器人的輸出向量為u∈ R(m+n)×1,對(duì)應(yīng)關(guān)系如式(8)所示,其中m+n>6,系統(tǒng)控制效率矩陣為B∈R6×(m+n),與細(xì)胞機(jī)器人位置和方向相關(guān)。
當(dāng)細(xì)胞機(jī)器人與接管目標(biāo)結(jié)合后,由于細(xì)胞機(jī)器人安裝位置和方向的不同,將影響系統(tǒng)控制效率矩陣,因此需要控制分配算法將控制器的控制輸出分配到各個(gè)細(xì)胞機(jī)器人,實(shí)現(xiàn)由給定控制量W,得到各細(xì)胞機(jī)器人的輸出向量u。
由于空間細(xì)胞機(jī)器人的分布性,本文參考多機(jī)器人系統(tǒng)的任務(wù)分配方法實(shí)現(xiàn)控制分配,任務(wù)分配問題是多機(jī)器人系統(tǒng)協(xié)同控制基本問題[17],按照每個(gè)任務(wù)所需機(jī)器人數(shù)量可將任務(wù)分為單機(jī)器人任務(wù) (Single-robot,SR)和 多 機(jī) 器 人 任 務(wù)(Multi-robot Task,MR);按照每個(gè)機(jī)器人所能執(zhí)行任務(wù)數(shù)量可將機(jī)器人分為單任務(wù)機(jī)器人(Singletask,ST)和多任務(wù)機(jī)器人(Multi-task,MT)。
將給定W分割成多個(gè)任務(wù),可將細(xì)胞機(jī)器人控制分配問題化為SR-MT任務(wù)分配問題,此類分配可視為整數(shù)規(guī)劃:
式中:Nr為總細(xì)胞機(jī)器人數(shù),細(xì)胞機(jī)器人集合為I= {1,2,…,Nr};Nt為總?cè)蝿?wù)數(shù),任務(wù)集合為J= {1,2,…,Nt};Lt為每個(gè)細(xì)胞機(jī)器人所能承擔(dān)的任務(wù)上限;xi∈ {0,1 }Nt為任務(wù)分配標(biāo)記向量;xij為xi的第j個(gè)元素,表示任務(wù)j是否分配給細(xì)胞機(jī)器人i,是則xij=1,否則為xij=0;pi∈(J ∪ {0} )Nt為任務(wù)隊(duì)列向量,pi中元素的順序表示細(xì)胞機(jī)器人i所分配的任務(wù)的順序,0表示未分配;gij(pi)表示細(xì)胞機(jī)器人在任務(wù)隊(duì)列pi下,執(zhí)行任務(wù)j的收益,定義見3.3節(jié)。
針對(duì)SR-MT任務(wù)分配,MIT的Choi等[18]提出 了 CBBA(Consensus-Based Bundle Algorithm,CBBA)算法,該算法是基于一致性的組合拍賣算法,分為兩步:第一步為任務(wù)拍賣分配階段,機(jī)器人各自報(bào)價(jià),報(bào)價(jià)較高的機(jī)器人獲得任務(wù);第二步為一致性協(xié)商階段,通過與相鄰的機(jī)器人進(jìn)行通信,解除任務(wù)分配沖突,達(dá)到任務(wù)分配結(jié)果的協(xié)商一致。該算法可以實(shí)現(xiàn)異步、并行計(jì)算,并在無人機(jī)的編隊(duì)控制中得到了一定的應(yīng)用[19]。
在SR-MT任務(wù)分配中,完成一致性協(xié)商后機(jī)器人i按照pi表示的順序依次執(zhí)行所分配任務(wù),而控制分配完成一致性協(xié)商后,所有任務(wù)同時(shí)執(zhí)行,因此本文對(duì)CBBA算法進(jìn)行以下修正:①精簡本地維護(hù)向量,無需記錄通信時(shí)間,降低了本地存儲(chǔ)消耗;②精簡原CBBA中收益函數(shù)的時(shí)間衰減因子,使得pi中各項(xiàng)時(shí)間優(yōu)先度一致;③由于無通信時(shí)間記錄數(shù)據(jù),對(duì)應(yīng)調(diào)整了一致性協(xié)商階段的響應(yīng)規(guī)則,簡化判斷條件,減少了條件判斷計(jì)算量。
精簡后細(xì)胞機(jī)器人i本地維護(hù)以下4個(gè)向量:①分配標(biāo)記向量xi;②任務(wù)隊(duì)列向量pi;③報(bào)價(jià)記錄向量yi∈RNt,yi的第j個(gè)元素yij表示機(jī)器人i所記錄的任務(wù)j的最高報(bào)價(jià);④分配歸屬向量zi∈ (I ∪ {0} )Nr,zij為其第j個(gè)元素;若zij=k,表示細(xì)胞機(jī)器人i認(rèn)為任務(wù)j分配給細(xì)胞機(jī)器人k,對(duì)應(yīng)報(bào)價(jià)為yij;zij=0表示細(xì)胞機(jī)器人i認(rèn)為任務(wù)j未分配。
任務(wù)拍賣分配過程采用市場(chǎng)法,是目前任務(wù)分配問題中廣泛采用的分配策略。在本步中,每個(gè)細(xì)胞機(jī)器人根據(jù)自身所能承擔(dān)的任務(wù)數(shù)量,對(duì)未分配的任務(wù)進(jìn)行評(píng)價(jià),根據(jù)每個(gè)任務(wù)所能帶來的收益添加到自身的任務(wù)隊(duì)列中,并更新任務(wù)報(bào)價(jià),拍賣分配階段細(xì)胞機(jī)器人i的計(jì)算流程如圖3所示,圖中符號(hào)“⊕”表示隊(duì)列添加;gmax表示最大邊際收益;Ji為細(xì)胞機(jī)器人i獲得最大邊際收益時(shí)對(duì)應(yīng)的任務(wù);arg max(gmax)表示gmax到對(duì)應(yīng)任務(wù)Ji的映射。分配過程中,各細(xì)胞機(jī)器人僅需自身信息,所有的細(xì)胞機(jī)器人收益計(jì)算均可分布式、異步實(shí)現(xiàn)。
圖3 拍賣分配階段細(xì)胞機(jī)器人i的計(jì)算流程Fig.3 Auction process calculating flow of CSRi
為了實(shí)現(xiàn)所有細(xì)胞機(jī)器人對(duì)任務(wù)分配結(jié)果的協(xié)商一致性,解除任務(wù)分配的沖突和互鎖現(xiàn)象,細(xì)胞機(jī)器人之間需要進(jìn)行互相通信。設(shè)細(xì)胞機(jī)器人i接收到細(xì)胞機(jī)器人k關(guān)于任務(wù)j的報(bào)價(jià)ykj和分配結(jié)果zkj,在整個(gè)協(xié)商過程中,每個(gè)細(xì)胞機(jī)器人可能執(zhí)行更新、重置、忽略3種操作:①更新操作,yij=y(tǒng)kj,zij=zkj;②重置操作,yij=0,zij=0;③忽略操作,yij=y(tǒng)ij,zij=zij。
按照細(xì)胞機(jī)器人i和k所記錄的分配歸屬和對(duì)應(yīng)報(bào)價(jià)分為幾種情況,對(duì)應(yīng)的細(xì)胞機(jī)器人i接收細(xì)胞機(jī)器人k的響應(yīng)規(guī)則如表1所示。
另外,若對(duì)yij進(jìn)行了更新或重置操作,將影響到任務(wù)隊(duì)列向量pi中任務(wù)j之后添加的各任務(wù)的收益,因此需要將其重置。設(shè)pir表示pi中的第r個(gè)元素,任務(wù)j在細(xì)胞機(jī)器人任務(wù)隊(duì)列中排序?yàn)?,即pi^r(nóng)=j(luò)。則更新或重置操作,任務(wù)隊(duì)列中第項(xiàng)之后各項(xiàng)均需重置,即
表1 細(xì)胞機(jī)器人i接收細(xì)胞機(jī)器人k的響應(yīng)規(guī)則Table 1 Action rule for receiver CSRi based on communication with sender CSR k
3.3.1 能力匹配
在控制效率矩陣中,各列向量代表對(duì)應(yīng)細(xì)胞機(jī)器人單位輸出的控制力和力矩,類比文獻(xiàn)[20]定義其為細(xì)胞機(jī)器人的能力向量。
則細(xì)胞機(jī)器人i的能力向量ci為式(8)中控制效率矩陣B的第i列,設(shè)ci與完成任務(wù)j其所需的能力向量cj之間的能力匹配系數(shù)為
定義在算法拍賣分配階段的收益函數(shù),綜合考慮細(xì)胞機(jī)器人能力匹配、剩余能量和執(zhí)行器輸出限制3個(gè)因素,定義細(xì)胞機(jī)器人i執(zhí)行任務(wù)j的加權(quán)收益為
顯然,μij=cosθ,其中θ為ci、cj之間的夾角,定義收益gdij用于描述細(xì)胞機(jī)器人i對(duì)任務(wù)j的能力匹配程度為
式中:σd為與曲線陡峭程度相關(guān)的參數(shù)。
此時(shí),細(xì)胞機(jī)器人i輸出為uij,令uij在沿任務(wù)需求能力向量的投影為cj,則細(xì)胞機(jī)器人i執(zhí)行任務(wù)j對(duì)應(yīng)的輸出為
3.3.2 剩余能量
由于每個(gè)細(xì)胞機(jī)器人剩余能量不同,為實(shí)現(xiàn)能量均衡,這里引入與細(xì)胞機(jī)器人剩余能量相關(guān)的收益函數(shù)為
式中:εi為細(xì)胞機(jī)器人i的剩余能量比例,εi∈[0 1];σe為與曲線陡峭程度相關(guān)的參數(shù)。對(duì)于推力細(xì)胞機(jī)器人εi為其燃料剩余比例;對(duì)于力矩型細(xì)胞機(jī)器人,考慮反作用飛輪雙向輸出特性,根據(jù)輸出uij方向不同,可得
其中:Li為細(xì)胞機(jī)器人i的反作用飛輪角動(dòng)量;Lmax為反作用飛輪正向飽和角動(dòng)量;Lmin為負(fù)向飽和角動(dòng)量,通常Lmin=-Lmax。3.3.3 執(zhí)行器輸出限制
考慮執(zhí)行器輸出限制,定義其可行域?yàn)?/p>
則定義與執(zhí)行器輸出限制相關(guān)的收益為
式中:σb為與曲線陡峭程度相關(guān)的參數(shù);λij為細(xì)胞機(jī)器人i執(zhí)行任務(wù)j的輸出飽和指數(shù);其表達(dá)式為
作為對(duì)比,本文采用的集中式分配算法為零空間修正(Null-Space Intersections,NSI)[10-11],其基本思想是利用控制效率矩陣的零空間對(duì)初始偽逆解進(jìn)行修正,使得修正解重新落入可行域內(nèi)。
對(duì)于控制效率矩陣B,給定控制量W,有Bup=W ,其中up=B+W為偽逆解。效率矩陣B的零空間矩陣N ∈ R(m+n)×(m+n-6)滿足如下性質(zhì):BN=0
因此,可將偽逆解進(jìn)行修正為
式中:k∈ R(m+n-6)×1為修正因子。
顯然,對(duì)于任意k,式(16)成立:
至此,分配問題轉(zhuǎn)換為給定控制量up,滿足Bup=W ,且在upΩ的情況下,Ω為輸出可行域,尋找參數(shù)k,使得u=up+Nk∈Ω成立。將up和N 分塊,可得
式中:up1為輸出超限的偽逆解分量;up2為輸出未超限偽逆解分量;N1和N2分別為與up1和up2對(duì)應(yīng)的零空間矩陣行分量。
同樣對(duì)u進(jìn)行分塊,可得
則式(15)可化簡為
對(duì)up1各元素進(jìn)行判定,若超上限,則置u1對(duì)應(yīng)元素為輸出上限,反之則置為輸出下限,則
若經(jīng)過修正后u2不超限,則u1和u2組成可行解u;若修正后u2超限,則需要進(jìn)一步修正。但可能遇到以下兩種特殊情況:①超限分量修正后導(dǎo)致其他分量超限,多次迭代后形成循環(huán),無法形成可行解;②所有分量均超限。對(duì)于第①種情況,通常設(shè)定修正迭代次數(shù)避免多次修正,對(duì)于第②種情況,通常按照偽逆解各分量超出限制的多少進(jìn)行矩陣分塊,再進(jìn)行修正,或?qū)⑺谐薹至吭O(shè)為其對(duì)應(yīng)極限值。但以上兩種特殊情況都無法保證分配結(jié)果的精度。
在多智能體系統(tǒng)的研究中,通常用圖論方法表示信息拓?fù)洹1疚膶⒚總€(gè)細(xì)胞機(jī)器人看作圖的一個(gè)頂點(diǎn),細(xì)胞機(jī)器人之間通過通信總線互相通信,系統(tǒng)拓?fù)淇捎脽o向圖表示。A∈R(m+n)×(m+n)為圖的鄰接矩陣,設(shè)節(jié)點(diǎn)與自身無連通性,即aii=0,若節(jié)點(diǎn)j存在一條邊指向節(jié)點(diǎn)i,則aij=1。無向圖中,對(duì)于任意i、j有aij=aji。
本文以力矩型細(xì)胞機(jī)器人為例,構(gòu)型如下:①為保證控制完整性[21],設(shè)在目標(biāo)航天器上安裝18個(gè)力矩型細(xì)胞機(jī)器人,接管其姿態(tài)控制,其中x、y、z軸向各6個(gè);②各細(xì)胞機(jī)器人參數(shù)相同,參考Maryland Aerospace MAI-400微型反作用飛輪[22]:最大輸出力矩τmax=0.625×10-3N·m,飽和角動(dòng)量Lmax=11.8×10-3N·m·s;③細(xì)胞機(jī)器人通信鏈路拓?fù)錇殡S機(jī)生成的連通圖,如圖4所示。
圖4 細(xì)胞機(jī)器人通信鏈路拓?fù)銯ig.4 Communication topology of CSRs
為分析本文所述算法的控制分配精度和能量均衡等特性,采用蒙特卡羅法進(jìn)行仿真分析,仿真設(shè)置如下:①在 (-0.2Lmax,0.2Lmax)區(qū)間內(nèi),隨機(jī)初始化各細(xì)胞機(jī)器人的初始角動(dòng)量;②隨機(jī)生成三維期望力矩指令τcmd,各軸分量在 (- 3,3)N·m區(qū)間均勻分布;③分別設(shè)置收益函數(shù)參數(shù)αd=αe=αb=1,σd=0.001,σe=Lmax/3,σb=0.2;④仿真時(shí)間為10s,指令條數(shù)為21條。
分別采用CBBA法和零空間修正法進(jìn)行仿真,三軸輸出力矩Tx、Ty、Tz對(duì)比如圖5所示,兩種算法的輸出誤差分別記為eCBBA和eNSI,對(duì)比如圖6所示,可見兩種方法均可獲得較為精確的分配結(jié)果,保證控制的精度。其中,對(duì)應(yīng)的各細(xì)胞機(jī)器人輸出力矩分別為uCBBA和uNSI,如圖7所示,兩種控制算法均能保證細(xì)胞機(jī)器人的輸出力矩在限制范圍以內(nèi)。
圖5 CBBA和零空間修正偽逆法輸出對(duì)比Fig.5 Output comparison of CBBA and NSI
圖6 CBBA和零空間修正偽逆法輸出誤差對(duì)比Fig.6 Output error comparison of CBBA and NSI
各細(xì)胞機(jī)器人剩余能量分布情況可由其角動(dòng)量表示,角動(dòng)量趨于飽和則剩余能量較少。隨著各細(xì)胞機(jī)器人的輸出,對(duì)應(yīng)各細(xì)胞機(jī)器人角動(dòng)量分別為LCBBA和LNSI,如圖8所示,可以看出,采用本文算法,能夠在保證控制精度的基礎(chǔ)上使得各細(xì)胞機(jī)器人的能量趨于一致,圖9為各細(xì)胞機(jī)器人角動(dòng)量標(biāo)準(zhǔn)差σL,可見采用本文算法,各細(xì)胞機(jī)器人能量標(biāo)準(zhǔn)差明顯降低,可以有效實(shí)現(xiàn)能量均衡,防止個(gè)別細(xì)胞機(jī)器人的飛輪飽和而失去執(zhí)行能力。
圖7 各細(xì)胞機(jī)器人輸出力矩Fig.7 Torque output of CSRs
圖8 各細(xì)胞機(jī)器人角動(dòng)量Fig.8 Angular momentums of CSRs
圖9 各細(xì)胞機(jī)器人角動(dòng)量標(biāo)準(zhǔn)差Fig.9 Standard deviation of CSRs’angular momentums
為分析各參數(shù)對(duì)分配結(jié)果的影響,需要分析收益函數(shù)中的αd、αe、αb以及σd、σe、σb的影響。αd和σd對(duì)分配結(jié)果精度有著至關(guān)重要的作用,調(diào)整二者有可能導(dǎo)致分配精度無法保證,失去控制分配的意義,因此本文暫不分析。主要分析αe和σe對(duì)細(xì)胞機(jī)器人能量均衡的影響,以及αb和σb對(duì)細(xì)胞機(jī)器人輸出值得影響。
1)αe、σe對(duì)能量收斂的影響
令αd=αb=1,σd=0.001,σb=0.2,分別取αe=1,2,…,5,σe=Lmax,Lmax/3,Lmax/5,各細(xì)胞機(jī)器人仿真初始時(shí)刻能量及期望指令與上文保持一致,不同αe和σe下各細(xì)胞機(jī)器人角動(dòng)量標(biāo)準(zhǔn)差如圖10所示,可見相同σe下,αe較小時(shí),能量收斂速度較慢,αe增大收斂速度加快;不同σe下,σe越大,收斂速度對(duì)αe越敏感。
αe分別為1,2,3時(shí)各細(xì)胞機(jī)器人角動(dòng)量標(biāo)準(zhǔn)差如圖11所示??梢姡嗤羍下,角動(dòng)量標(biāo)準(zhǔn)差收斂速度隨σe增大明顯加快。
圖10 不同αe和σe下各細(xì)胞機(jī)器人角動(dòng)量標(biāo)準(zhǔn)差Fig.10 Standard deviation of CSRs’angular momentums with differentαeandσe
圖11 αe=1,2,3時(shí)各細(xì)胞機(jī)器人角動(dòng)量標(biāo)準(zhǔn)差Fig.11 Standard deviation of CSRs’angular momentumswithαe =1,2,3
2)αb、σb對(duì)輸出的影響
設(shè)αd=αe=1,σd=0.001,σe=Lmax/3,分別取αb=1,2,…,5,σb=0.1,0.2,0.3,其他參數(shù)設(shè)置與上文保持一致。得到不同參數(shù)設(shè)置下各細(xì)胞機(jī)器人輸出平方和qu如圖12所示。
圖12 各細(xì)胞機(jī)器人輸出平方和Fig.12 Quadratic sum of CSRs’output
可見,σb較小時(shí),所有細(xì)胞機(jī)器人輸出力矩平方和收斂速度受αb影響較小。
1)為實(shí)現(xiàn)分布式控制分配,提出一種基于CBBA的接管控制分配方法,利用自由市場(chǎng)機(jī)制實(shí)現(xiàn)控制分配的分布和異步計(jì)算。
2)綜合考慮了執(zhí)行能力匹配、剩余能量和執(zhí)行器輸出限制等因素,定義了空間細(xì)胞機(jī)器人的收益函數(shù)。
3)通過仿真分析,并與零空間修正偽逆法相比較,CBBA算法在保證分配精度的前提下,具有能量均衡的能力。
4)通過參數(shù)影響分析得出αe、σe對(duì)能量收斂和αb、σb對(duì)總輸出的影響,權(quán)值αe和αb分別影響能量收斂和總輸出的收斂速度,而σe和σb分別影響能量收斂和總輸出對(duì)權(quán)值的敏感性。
[1] BENEDICT B L.Rationale for need of in-orbit servicing capabilities for GEO spacecraft:AIAA-2013-5444[R].Reston:AIAA,2013.
[2] TANAKA H,YAMAMOTO N,YAIRI T,et al.Reconfigurable cellular satellites maintained by space robots[J].Journal of Robotics and Mechatronics,2006,18(3):356-364.
[3] TANAKA H,YAMAMOTO N,YAIRI T,et al.Precise assembly by autonomous space robot using skill acquisition learning[C]/Proceedings of The 8th International Symposium on Artificial Intelligence,Robotics and Automation in Space. Munich:European Space Agency,2005,609-616.
[4] JAEGER T,MIRCZAK W.Satlets-the building blocks of future satellites-and which mold do you use:AIAA-2013-5485[R].Reston:AIAA,2013.
[5] JOHNSON L K,HOLLMAN J,MCCLELLAN J,et al.Utilizing CubeSat architecture and innovative low-com-plexity devices to repurpose decommissioned apertures for RF communications: AIAA-2013-5487 [R]. Reston:AIAA,2013.
[6] WEISE J,BRIEB K,ADOMEIT A,et al.An intelligent building blocks concept for on-orbit-satellite servicing[C]/International Symposium on Artificial Intelligence,Robotics and Automation in Space.Turin:European Space A-gency,2012.
[7] GOELLER M,OBERLAENDER J,UHL K,et al.Modular robots for on-orbit satellite servicing[C]/Proceedings of the 2012IEEE International Conference on Robotics and Biomimetics.Piscataway,NJ:IEEE Press,2012:2018-2023.
[8] 溫卓漫,王延杰,初廣麗,等.空間站機(jī)械臂位姿測(cè)量中合作靶標(biāo)的快速識(shí)別[J].航空學(xué)報(bào),2015,36(4):1330-1338.WEN Z M,WANG Y J,CHU G L,et al.Fast recognition of cooperative target used for position and orientation measurement of space station’s robot arm[J].Acta Aeronautica et Astronautica Sinica,2015,36(4):1330-1338(in Chinese).
[9] 王明,黃攀峰,孟中杰,等.空間機(jī)器人抓捕目標(biāo)后姿態(tài)接管控制[J].航空學(xué)報(bào),2015,36(9):3165-3175.WANG M,HUANG P F,MENG Z J,et al.Attitude takeover control after capture of a target by a space robot[J].Acta Aeronautica et Astronautica Sinica,2015,36(9):3165-3175(in Chinese).
[10] BORDIGNON K A,DURHAM W C.Null-space augmented solutions to constrained control allocation problems:AIAA-1995-3209-CP[R].Reston:AIAA,1995.
[11] BORDIGNON K A.Constrained control allocation for systems with redundant control effectors[D].Virginia:Virginia Polytechnic Institute and State University,1996:101-117.
[12] 張世杰,趙亞飛,陳閩,等.過驅(qū)動(dòng)輪控衛(wèi)星的動(dòng)態(tài)控制分配方法[J].航空學(xué)報(bào),2011,32(7):1260-1268.ZHANG S J,ZHAO Y F,CHEN M,et al.Dynamic control allocation for overactuated satellite with redundant reaction wheels[J].Acta Aeronautica et Astronautica Sinica,2011,32(7):1260-1268(in Chinese).
[13] DURHAM W C.Constrained control allocation[J].Journal of Guidance,Control,and Dynamics,1993,16(4):717-725.
[14] DURHAM W C.Constrained control allocation:Threemoment problem[J].Journal of Guidance,Control,and Dynamics,1994,17(2):330-336.
[15] HARKEGARD O.Dynamic control allocation using constrained quadratic programming[J].Journal of Guidance,Control,and Dynamics,2004,27(6):1028-1034.
[16] KORSAH G A,STENTZ A,DIAS M B.A comprehensive taxonomy for multi-robot task allocation[J].The International Journal of Robotics Research,2013,32(12):1495-1512.
[17] GERKEY B P,MATARIC M J.A formal analysis and taxonomy of task allocation in multi-robot systems[J].The International Journal of Robotics Research,2004,23(9):939-954.
[18] CHOI H L,BRUNET L,HOW J P.Consensus-based decentralized auctions for robust task allocation[J].IEEE Transactions on Robotics,2009,25(4):912-926.
[19] REDDING J,UNDURTI A,CHOI H L,et al.An intelligent cooperative control architecture[C]/American Control Conference.Piscataway,NJ:IEEE Press,2010:57-62.
[20] 柳林,季秀才,鄭志強(qiáng).基于市場(chǎng)法及能力分類的多機(jī)器人任務(wù)分配方法[J].機(jī)器人,2006,28(3):337-343.LIU L,JI X C,ZHENG Z Q.Multi-robot task allocation based on market and capability classification[J].Robot,2006,28(3):337-343(in Chinese).
[21] 張兵,吳宏鑫.單向執(zhí)行器系統(tǒng)配置的完整性[J].自動(dòng)化學(xué)報(bào),2000,26(3):392-396.ZHANG B,WU H X.Complete configuration of unidirectional actuator system[J].Acta Automatica Sinica,2000,26(3):392-396(in Chinese).
[22] LEENA S,MATTHEW F,SAGAR B,et al.On the phoenix ADCS-M3Darchitecture:AIAA-2013-5535[R].Reston:AIAA,2013.
Distributed control allocation for cellular space robots in takeover control
CHANG Haitao1,2,HUANG Panfeng1,2,* ,WANG Ming3,MENG Zhongjie1,2
1.National Key Laboratory of Aerospace Flight Dynamics,Northwestern Polytechnical University,Xi’an 710072,China 2.Research Center for Intelligent Robotics,Northwestern Polytechnical University,Xi’an 710072,China 3.North Automatic Control Technology Institute,Taiyuan 030006,China
Spacecraft takeover control provides a new idea for on-orbit service to extend the lifetime of spacecraft.In this paper,cellular space robots(CSR)are implemented in spacecraft takeover control.On the foundation of the takeover control dynamic model for CSRs,a distributed control allocation algorithm based on consensus-based bundle algorithm (CBBA)is proposed.This market-based algorithm allows the distributed and asynchronous allocation for CSRs.The profit of the CSR depends on the capability matching with the task,energy level and output limits.The consensus allocation is achieved by auction procedure and consensus procedure.As a comparison,a centralized algorithm called null-space intersection is considered.Monte Carlo simulations indicate that the algorithm proposed in this paper can achieve energy consumption balance of the CSRs while allocating the control tasks.
cellular space robot;takeover control;control allocation;CBBA algorithm;null-space
2015-09-08;Revised:2015-09-25;Accepted:2015-10-12;Published online:2015-11-26 14:29
URL:www.cnki.net/kcms/detail/11.1929.V.20151126.1429.016.html
National Natural Science Foundation of China(11272256)
V448.2
A
1000-6893(2016)09-2864-10
10.7527/S1000-6893.2015.0270
2015-09-08;退修日期:2015-09-25;錄用日期:2015-10-12;網(wǎng)絡(luò)出版時(shí)間:2015-11-26 14:29
www.cnki.net/kcms/detail/11.1929.V.20151126.1429.016.html
國家自然科學(xué)基金 (11272256)
*通訊作者.Tel.:029-88460366 E-mail:pfhuang@nwpu.edu.cn
常海濤,黃攀峰,王明,等.空間細(xì)胞機(jī)器人接管控制的分布式控制分配[J].航空學(xué)報(bào),2016,37(9):28642-873.CHANG H T,HUANG P F,WANG M,et al.Distributed control allocation for cellular space robots in takeover control[J].Acta Aeronautica et Astronautica Sinica,2016,37(9):28642-873.
黃攀峰 男,博士,教授,博士生導(dǎo)師。主要研究方向:空間機(jī)器人學(xué)、在軌服務(wù)、空間遙操作、導(dǎo)航、制導(dǎo)與控制。
Tel.:029-88460366
E-mail:pfhuang@nwpu.edu.cn
*Corresponding author.Tel.:029-88460366 E-mail:pfhuang@nwpu.edu.cn