• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于SAGWO算法的UCAVs動態(tài)協(xié)同任務(wù)分配

      2018-09-04 01:58:42魏政磊趙輝黃漢橋王驍飛周瑞
      北京航空航天大學學報 2018年8期
      關(guān)鍵詞:灰狼編隊適應(yīng)度

      魏政磊, 趙輝, 黃漢橋, 王驍飛, 周瑞

      (1. 空軍工程大學 航空工程學院, 西安 710038; 2. 西北工業(yè)大學 無人機系統(tǒng)技術(shù)研究院, 西安 710072)

      隨著作戰(zhàn)環(huán)境的復雜化、作戰(zhàn)過程的動態(tài)化、作戰(zhàn)任務(wù)的多樣化,多無人作戰(zhàn)飛機(Unmanned Combat Aerial Vehicles, UCAVs)協(xié)同攻擊多目標將是一種未來的重要作戰(zhàn)模式。UCAVs協(xié)同任務(wù)分配是UCAV協(xié)同作戰(zhàn)的關(guān)鍵技術(shù)之一,其目的是在一定戰(zhàn)場環(huán)境和任務(wù)要求下,考慮執(zhí)行任務(wù)的約束條件和技術(shù)指標,將目標合理地分配給不同的UCAV,使得整個編隊作戰(zhàn)效能達到最大。

      目前,對UCAVs協(xié)同任務(wù)分配技術(shù)的研究已經(jīng)成為UCAV作戰(zhàn)研究中的熱點。針對任務(wù)分配問題,文獻[1]采用多種協(xié)商機制建立分布式UCAVs控制系統(tǒng);文獻[2]提出了基于多層樹的協(xié)同攻擊多目標模型;也可以采用智能優(yōu)化算法對UCAVs任務(wù)分配問題求解,比如螢火蟲優(yōu)化算法[3]、粒子群算法[4]等。在實際的UCAV協(xié)同任務(wù)執(zhí)行過程中,可能會出現(xiàn)任務(wù)獲取信息不完整,或者在任務(wù)執(zhí)行過程中存在戰(zhàn)場環(huán)境和任務(wù)需求以及任務(wù)信息的變化,導致現(xiàn)有的任務(wù)分配方案對實時環(huán)境的不適應(yīng)[5-6]。同時,相關(guān)文獻中的任務(wù)分配算法模型同時或部分存在以下問題,如:①未考慮目標之間的支援關(guān)系;②未考慮電子干擾下的任務(wù)分配;③動態(tài)的任務(wù)分配沒有用時間指標體現(xiàn)出來。

      針對動態(tài)任務(wù)分配的特點,同時考慮到以上存在的問題,本文采用了時間片下基于改進灰狼優(yōu)化(Grey Wolf Optimization, GWO)算法[7]的任務(wù)分配方法。通過對UCAV編隊信息和任務(wù)目標信息的分析,提出了基于時間片的多約束動態(tài)任務(wù)分配模型;針對動態(tài)任務(wù)分配數(shù)學模型,采用了自適應(yīng)灰狼優(yōu)化(Self-Adaptive GWO, SAGWO)算法進行求解;最后進行了仿真驗證。

      1 UCAVs動態(tài)任務(wù)分配模型

      假設(shè)攻擊目標的L枚導彈構(gòu)成集合K={k,k=1,2,…,L},則UCAV編隊的第k枚導彈與無人機Vi的第l枚導彈對應(yīng)的關(guān)系為

      (1)

      式中:i={1,2,…,M};l={1,2,…,Li}。

      1.1 UCAV優(yōu)勢概率

      UCAV對目標的優(yōu)勢概率與UCAV距離威脅因子、速度威脅因子和角度威脅因子有關(guān)。UCAV編隊中Vi對目標Tj的優(yōu)勢概率可以表示為

      PKij=c1Tij,DTij,θ+c2Tij,v

      (2)

      式中:c1和c2分別為無人機Vi相對任務(wù)目標Tj的距離-角度威脅和速度威脅的權(quán)重;Tij,D、Tij,θ和Tij,v分別為距離威脅概率、角度威脅概率和速度威脅概率[8]。

      距離威脅概率為

      (3)

      式中:dij為Vi相對于Tj的距離;rW為我方UCAV導彈的有效作用距離;RWmax為UCAV的最大跟蹤距離。

      角度威脅概率為

      Tij,θ=exp(-λ1(πθij/180)λ2)

      (4)

      式中:θij為UCAV速度方向與視線之間的夾角;λ1和λ2為正常數(shù)。

      速度威脅概率為

      (5)

      式中:vi和vTj分別為第i個UCAV和任務(wù)目標Tj的速度矢量。

      1.2 任務(wù)威脅分析

      戰(zhàn)場目標威脅信息分析對UCAV執(zhí)行任務(wù)成功率是非常重要的。對于目標威脅特性,將目標威脅分為探測類目標威脅和殺傷類武器威脅[9]。探測類目標威脅一般指雷達威脅,殺傷類武器威脅包括地空導彈和高炮,其威脅概率采用文獻[7]的模型。

      當UCAV在多目標威脅空間中執(zhí)行任務(wù)時,面臨的威脅程度增加。這種威脅程度增加的原因不僅僅是由于多個威脅源獨立探測和殺傷的疊加效果,而且是由于整個目標網(wǎng)絡(luò)化信息管理與共享。因此,提出了目標依賴矩陣來反映目標之間的關(guān)系[10]。

      定義1AN×N為目標內(nèi)部之間依賴矩陣。矩陣元素aij為第i個目標對第j個目標的依賴程度,也可以說第j個目標對第i目標的信息共享或者火力支援能力。

      對于多個目標的威脅,考慮到目標之間相互支援的情況,則目標對UCAV的威脅概率為

      PTij=[1-∏ (1-aik,DPD(k,j))]·

      [1-∏ (1-aim,GPG(m,j))]

      (6)

      式中:PTij為目標i對無人作戰(zhàn)飛機j的威脅概率;aik,D為任務(wù)目標中探測類武器對其他武器的依賴程度;aim,G為任務(wù)目標中攻擊類武器對其他武器的依賴程度;PD(k,j)為單個探測類武器的威脅概率;PG(m,j)為單個攻擊類武器的威脅概率(包括地空導彈威脅概率與高炮威脅概率)。

      對于攻擊類目標,考慮到信息資源相互共享與火力支援,同時其威脅過程是即發(fā)現(xiàn)就攻擊,探測概率為1,因此,只計算攻擊類目標對UCAV的威脅概率:

      PTij=1-∏ (1-aim,GPG(m,j))

      (7)

      1.3 任務(wù)時間分析

      UCAV完成任務(wù)的時間主要是根據(jù)任務(wù)類型、可執(zhí)行該任務(wù)的UCAV特性及載荷類型等先驗經(jīng)驗得到完成各項任務(wù)的統(tǒng)計時間。觀測某一時刻的分配情況、任務(wù)目標對UCAV的威脅、UCAV對任務(wù)目標的殺傷情況以及完成任務(wù)的效果需要引入時間片這個概念。

      定義2任務(wù)時間片[11]是指對事件變量集的某一次觀察。在協(xié)同攻擊多目標的任務(wù)分配問題中,時間片就是每隔一定的時間去觀測UCAV的任務(wù)情況。時間片的間隔越小,意味著系統(tǒng)觀測分配結(jié)果、目標威脅程度、UCAV的殺傷情況以及對各方兵力信息的統(tǒng)計分析頻率越高,那么決策越精細,其實時性提高;但是間隔小的時間片會引起信息量的增大,系統(tǒng)處理數(shù)據(jù)的時間增長,不利于戰(zhàn)場快速決策,因此,要選取一定任務(wù)時間片是分配決策的關(guān)鍵問題。

      定義3UCAV飛行矩陣Tfly是(M+N)×N矩陣,行包含UCAV和目標,列包含目標,tij表示節(jié)點i到節(jié)點j的時間消耗。Tfly取決于UCAV的速度和位置、任務(wù)目標的位置以及其機動性,Tfly可表示為

      對于Tfly元素tij的計算主要與在時間片結(jié)束時刻UCAV的速度和位置、任務(wù)目標的位置有關(guān),如下:

      (8)

      定義4任務(wù)累計完成時間ti[12]是指第i個UCAV在執(zhí)行任務(wù)集Si={Ti,1,Ti,2,…,Ti,j}的累計完成時間。ti可表示為

      ti=tiTi,1+tTi,1Ti,2+…+tTi,j-1Ti,j

      (9)

      式中:tiTi,1、tTi,1Ti,2和tTi,j-1Ti,j分別為第i個UCAV從所在位置節(jié)點到目標Ti,1節(jié)點的時間、Ti,1到Ti,2的時間和Ti,j-1到Ti,j的時間。

      1.4 協(xié)同任務(wù)分配評價指標

      UCAVs協(xié)同對地攻擊任務(wù)目標是以整個編隊的作戰(zhàn)效能作為最優(yōu)目標,而評價整個編隊的作戰(zhàn)效能指標有目標價值毀傷(Target Value Damage,TVD)、UCAV編隊損耗代價(UCAV attrition)和執(zhí)行任務(wù)預計消耗時間(Task Expending Time,TET)。

      1) 目標價值毀傷最大化

      無人機Vi完成任務(wù)Tj的目標毀傷收益值的大小體現(xiàn)了任務(wù)的重要程度和UCAV的執(zhí)行能力,也可以量化目標價值毀傷值。編隊對多目標的協(xié)同打擊中,產(chǎn)生總的價值毀傷為

      (10)

      式中:f1為編隊完成任務(wù)目標的價值毀傷;VTj表示摧毀目標Tj獲得的價值量,其由指揮人員預先設(shè)定,在作戰(zhàn)過程中隨著態(tài)勢的變化和作戰(zhàn)意圖的變化可以進行調(diào)整。

      2) UCAV編隊損耗代價最小化

      如果在UCAV編隊中無人機攜帶軟殺傷武器,那么無人機會因為欺騙和干擾設(shè)備而增大無人機的生存概率。假設(shè)第i架無人機Vi攜帶ni個欺騙和干擾設(shè)備,則該機的損耗代價為

      (11)

      式中:VVi為無人機Vi的價值量。

      在整個UCAV編隊攻擊過程中所遭受的損耗代價為

      (12)

      3) 任務(wù)時間消耗最短

      執(zhí)行任務(wù)的時間可以用UCAV與任務(wù)目標間的距離來衡量,距離目標越短,則執(zhí)行任務(wù)消耗的時間越短。任務(wù)消耗時間最短模型如下:

      (13)

      式中:f3為任務(wù)時間消耗指標。

      4) 總評價指標

      在多機協(xié)同過程中,設(shè)計總評價指標函數(shù)時,考慮到任務(wù)目標價值毀傷最大化、UCAV編隊損耗代價最小化以及任務(wù)時間消耗最短,因此,分配模型的總體評價指標函數(shù)為

      (14)

      式中:J(Π)為UCAV編隊協(xié)同攻擊多目標的總體評價指標函數(shù),Π為分配方案;ω1和ω2分別為衡量減少UCAV代價損耗和時間損耗的權(quán)重,其來源于決策者的偏好。協(xié)同攻擊多目標分配問題實質(zhì)就是尋找一個方案Π使評價指標函數(shù)最小,使問題轉(zhuǎn)化為尋優(yōu)問題。

      約束條件:

      2)X1j+X2j+…+XLj=1,不允許多個UCAV導彈攻擊同一個任務(wù)目標。

      3)ci≤Li,單架UCAV執(zhí)行任務(wù)數(shù)量ci不超過UCAV可攜帶最大導彈數(shù)量Li。

      4) 由于UCAV性能和掛架的限制,UCAV和其掛載的武器或者導彈之間存在約束,UCAV影響武器效能的發(fā)揮可以用UCAV-武器適應(yīng)度表進行描述,該適應(yīng)度表中的元素用[0,1]之間的數(shù)表示,數(shù)值的大小表示武器攻擊效能發(fā)揮程度,數(shù)值越小表明UCAV越不利于武器的發(fā)揮。

      2 自適應(yīng)灰狼優(yōu)化算法

      2.1 基本GWO算法及改進策略

      受灰狼的社會等級制度和獵食行為的啟發(fā),Seyedali等提出了GWO算法[14]。同其他啟發(fā)式優(yōu)化算法相比,GWO算法具有實現(xiàn)簡單、全局優(yōu)化能力強、收斂速度快等特點,一經(jīng)提出便受到了眾多學者的關(guān)注與研究[15-17]。

      在尋找最優(yōu)解過程中,根據(jù)灰狼獵食的3個重要步驟,即接近、包圍、攻擊獵物,GWO算法建立了一個數(shù)學模型:狼群中每一個個體都是一個潛在解,其中α狼的位置是最好的解,β和δ的位置分別為優(yōu)解和次優(yōu)解,其他的候選解是ω的位置。獵食過程如圖1所示,C1、C2和C3分別為α、β和δ狼的位置系數(shù);a1、a2、a3分別為α、β和δ狼的控制參數(shù);Dα、Dβ和Dδ分別為α、β和δ狼到ω狼的距離。在文獻[14]中,通過大量的仿真實驗表明,GWO在函數(shù)優(yōu)化問題時具有較快的收斂速度,但是控制參數(shù)a線性變化忽略了要解決的優(yōu)化問題多樣性,尤其在解決多峰值函數(shù)問題時容易陷入局部最優(yōu),很難達到全局最優(yōu)。

      針對以上缺點與不足,本文提出了自適應(yīng)調(diào)整策略,通過學習種群最優(yōu)位置信息去控制種群的搜索方向;另一方面,改進算法利用最優(yōu)個體與當前個體之間的位置矢量差,跳出局部最優(yōu)區(qū)域來保持種群多樣性。對于控制參數(shù)a(包括a1、a2和a3)來說,根據(jù)文獻[18-20]的分析,為了確保算法在多種條件下具有好的優(yōu)化結(jié)果,a采用二次曲線策略。

      1) 自適應(yīng)調(diào)整策略

      為了進一步提高算法的收斂速度,采用自適應(yīng)調(diào)整策略,將當前個體的適應(yīng)度值Ji與灰狼群的平均適應(yīng)度值Javg進行比較,如果Ji優(yōu)于Javg,繼續(xù)使用原策略更新灰狼位置;如果Ji次于Javg,利用式(15)變異灰狼位置[7]。

      X(g+1)=

      (15)

      式中:X(g+1)為第g代位置更新后的灰狼位置,即第g+1代灰狼位置,g為當前迭代次數(shù);X1、X2和X3分別為當前灰狼到α、β和δ灰狼的距離;aJ為1/Jα、1/Jβ與1/Jδ之和,Jα、Jβ和Jδ分別為α、β和δ的適應(yīng)度值。

      2) 跳出局部最優(yōu)策略

      針對原種群多樣性較差,該策略對更新后的位置進行重置,通過最優(yōu)個體與當前個體之間的位置矢量差隨機控制當前個體不在當前局部最優(yōu)解的區(qū)域內(nèi)[21]:

      (16)

      3) 控制參數(shù)非線性調(diào)整策略

      對于基本的GWO算法,選擇二次曲線來設(shè)計控制參數(shù)a的調(diào)整策略。利用二次曲線在區(qū)間[0,1]上非線性遞增,將GWO算法的迭代次數(shù)映射到[0,1]上,控制參數(shù)調(diào)整策略為

      a=amax-(amax-amin)(g/gmax)2

      (17)

      式中:amax和amin分別為控制參數(shù)的最大值和最小值,一般分別取2和0;gmax為最大迭代次數(shù)。

      2.2 SAGWO算法流程

      由于GWO存在收斂速度慢,容易陷入局部最優(yōu)的缺點,結(jié)合上面策略,提出了SAGWO算法。下面給出了SAGWO算法的流程:

      步驟1初始化灰狼種群,即隨機產(chǎn)生n個智能個體的位置;初始化a、距離系數(shù)A和位置系數(shù)C[14];初始化Xα、Xβ和Xδ的值。

      步驟2處理越界智能個體,計算每個智能體的適應(yīng)度值,計算灰狼群的平均適應(yīng)度值Javg。

      步驟3更新當前迭代期間的Xα、Xβ和Xδ。

      步驟4根據(jù)式(17),計算各個優(yōu)解的a、A和C。

      步驟5采用式(15)的策略更新當前智能個體的位置。

      步驟6通過式(16),使智能個體跳出局部最優(yōu)解的區(qū)域。

      步驟7輸出最優(yōu)解Xα和最優(yōu)值Jα。

      步驟8如果達到結(jié)束條件(最大迭代次數(shù)或連續(xù)5次結(jié)果相差小于一定的精度),則結(jié)束;否則轉(zhuǎn)到步驟2。

      2.3 SAGWO算法的收斂性分析

      條件1若f(Fal(x,ξ))≤f(x),且ξ∈S,則有f(Fal(x,ξ))≤f(ξ)。

      其中:xk+1=Fal(xk,ξ)為下一次迭代結(jié)果;S為解空間;f為優(yōu)化函數(shù);ξ為迭代過程中得到的解;v(B)為集合B的Lebesgue測度;uk(B)為算法Fal第k次迭代解在集合B上的概率測度。

      定理1SAGWO算法收斂于全局最優(yōu)。

      證明首先,SAGWO算法每次迭代都保存了灰狼群體的最優(yōu)位置,保證了目標函數(shù)的適應(yīng)度值的非增性,所以算法的收斂滿足條件1。

      其次,再需要證明SAGWO算法滿足條件2,便可根據(jù)文獻[23]的隨機優(yōu)化算法收斂定理,得到SAGWO算法收斂于全局最優(yōu)。根據(jù)文獻[14]的灰狼群體位置更新公式轉(zhuǎn)換,可得

      (18)

      式中:X1(g)為更新X(g)而產(chǎn)生與最優(yōu)解有關(guān)的中間變量;r1與r2為隨機變量。

      由式(18)對每一代左右累乘,可得

      (19)

      (20)

      根據(jù)式(19)與式(20),可得

      (21)

      因此必有

      (22)

      同理可得,優(yōu)解、次優(yōu)解、X2與X3收斂于最優(yōu)解Xα。由式(15)可知,當g→∞時,X(g+1)收斂于最優(yōu)解Xα。

      SAGWO算法的單個灰狼智能體搜素空間是有限的,則由n個灰狼組成的群體的狀態(tài)也是有限的。當前的群體狀態(tài)僅與上一時刻的群體狀態(tài)有關(guān),所以,狼群狀態(tài)具有Markov性。狼群的轉(zhuǎn)移狀態(tài)與時間g無關(guān),則狼群位置的狀態(tài)序列是齊次的。綜上述分析,狼群位置的狀態(tài)序列是有限齊次Markov鏈。

      設(shè)優(yōu)化問題的全局最優(yōu)解為Xα,定義狼群位置的最優(yōu)狀態(tài)集為

      H={q=(Xα1,Xα2,…,Xαn)}

      (23)

      對于狼群狀態(tài)序列{Xα(t);g≥0},最優(yōu)狀態(tài)集H是群體狀態(tài)空間S上的一個閉集。由式(22)和狼群狀態(tài)序列是有限齊次Markov鏈可知,S中不存在H之外的非閉空間,即群體狀態(tài)序列必將進入最優(yōu)狀態(tài)集H,連續(xù)無窮次搜索不到全局最優(yōu)解的可能性是0,則滿足2.3節(jié)條件2,故SAGWO算法收斂于全局最優(yōu)。

      證畢

      2.4 SAGWO算法的復雜度分析

      根據(jù)SAGWO算法的特點與執(zhí)行步驟,在這里討論算法每一步時間復雜度。在2.2節(jié)的步驟1中,對D維空間下的n個灰狼進行初始化,需要nD次運算;在步驟2中,計算狼群的適應(yīng)度值需要n次運算,一般的適應(yīng)度函數(shù)的復雜度為O(D),還要計算種群適應(yīng)度值平均值,需要n次運算;在步驟3中,通過比較得到3個優(yōu)解,最多需要3n-3次運算;在步驟4中,計算更新各個優(yōu)解的a、A和C需要3nD;在步驟5中,計算各個狼到Xα、Xβ和Xδ的距離需要3nD次運算,根據(jù)式(15)需要D+n,包括計算更新位置與比較;在步驟6中,跳出局部最優(yōu)策略需要nD;在步驟7和8中,輸出最優(yōu)解與判斷算法是否滿足終止條件,其復雜度均為常數(shù)。由于算法最多執(zhí)行g(shù)次,則SAGWO算法的時間復雜度為O(((3n+1)·D+n)g)≈O(3nDg)。

      3 UCAVs動態(tài)任務(wù)分配方法

      3.1 目標任務(wù)序列編碼

      在GWO算法中,每個智能個體就是一個備選解,多個智能個體通過種群搜索和其位置更新來尋優(yōu)。協(xié)同攻擊多目標的任務(wù)決策關(guān)鍵在于確定:哪架UCAV來執(zhí)行哪些任務(wù)和UCAV執(zhí)行任務(wù)的時序[23]。

      3.2 多目標動態(tài)任務(wù)分配流程

      UCAV在執(zhí)行任務(wù)過程中,所有的元素都可能隨著時間發(fā)生變化。設(shè)定動態(tài)的任務(wù)分配的適應(yīng)度函數(shù)為

      J(Π(t),t)=

      (24)

      其中:Xmissile-T(t)為UCAV攜帶的導彈對任務(wù)目標的分配方案;Xorder(t)為UCAV執(zhí)行任務(wù)的順序方案;t表示執(zhí)行任務(wù)中的時刻。

      具體基于SAGWO算法的UCAV協(xié)同攻擊多目標動態(tài)任務(wù)分配流程如下:

      步驟1定義任務(wù)時間片長度tslice。根據(jù)估算最小的任務(wù)飛行時間min(tij),將其劃分為nt個時間片,因此,可以計算得到

      (25)

      步驟2初始化UCAV與目標的信息。在分配開始之前,獲取初始UCAV的位置、數(shù)量、速度以及其武器信息,探測得到目標的位置、數(shù)量和機動性。計算目標的威脅概率和UCAV對目標的毀傷概率。

      步驟3初始化參數(shù)。設(shè)置GWO的基本參數(shù),控制參數(shù)最大值amax和最小值amin,GWO參數(shù)A、C,搜索方程的慣性權(quán)重ω,最大迭代次數(shù)gmax,搜索空間智能個體數(shù)為nagent。

      步驟4隨機生成一組實數(shù)然后基于編碼生成初始分配方案。

      步驟5當t=0時,根據(jù)2.2節(jié)的步驟2~步驟8,計算初始最優(yōu)分配方案。

      步驟6UCAV根據(jù)初始分配方案,對將要執(zhí)行的任務(wù)目標進行動態(tài)追蹤。

      步驟7在第一個時間片開始時,獲取UCAV失效信息與目標是否發(fā)生變化。

      步驟8在時間片內(nèi),根據(jù)變化的信息,隨機生成一組分配方案,重復步驟5,尋求信息變化后的最優(yōu)分配方案。

      步驟9在時間片末,根據(jù)步驟8的最優(yōu)方案,利用追蹤法更新UCAV的位置信息,并且輸出最優(yōu)分配結(jié)果。

      步驟10在下一個時間片或者在t+tslice時刻,重復步驟7~步驟9,直到t≥min(tij)或者開始執(zhí)行航路規(guī)劃層的時候,輸出最終結(jié)果。

      4 仿真實驗及分析

      4.1 任務(wù)想定

      為驗證算法的有效性,針對6架UCAV對8個具有威脅的敵方目標的任務(wù)分配進行仿真實驗,如圖3所示,x和y分別為橫向和縱向坐標。其中,UCAV編隊擁有6架無人機,每架無人機攜帶2枚空地導彈,其攻擊目標的任務(wù)是毀傷目標,相關(guān)屬性見表1和表2;敵方由雷達(Radar)、SAM(Surface-to-Air Missile)防空導彈和AAGun(Anti-Aircraft Gun)防空炮3種類型目標組成,每個目標最多只能被我方1個UCAV攻擊,其相關(guān)屬性見表3和表4。A型空對地導彈的性能參數(shù):有效作用距離rW-A=10 km、最大跟蹤距離RWmax-A=60 km;B型空對地導彈的性能參數(shù):rW-B=10 km、RWmax-B=80 km。表2表示UCAV與機載導彈之間約束。

      UCAV 位置/km導彈數(shù)量×型號軟殺傷武器數(shù)量速度/(m·s-1)價 值 量V1(35,0)2×A-AGM22380.8V2(40,6)2×B-AGM12380.9V3(48,10)2×A-AGM22380.95V4(54,9)2×B-AGM12380.95V5(62,6)2×A-AGM22380.85V6(67,0)2×B-AGM02380.8

      表2 UCAV的武器適應(yīng)度

      表3 目標信息設(shè)置

      表4 目標間依賴矩陣

      表3表示敵方目標的編號、類型、位置信息以及價值量,由文獻[7,9]可知,雷達目標性能參數(shù):雷達參數(shù)KR=1.0×1012m4,最大作用距離Rmax=100 km;防空導彈SAM性能參數(shù):殺傷區(qū)近界水平距離dsj=30 km,殺傷區(qū)遠界水平距離dsy=100 km;高炮AAGun性能參數(shù):有效火力半徑Rg=10 km,圓錐死界半徑rg=0.9 km。表4表示目標間相互支援能力。

      SAGWO算法和GWO算法種群數(shù)大小設(shè)置為30,迭代次數(shù)為100次,控制參數(shù)值的最大值amax、最小值amin分別取值為2和0。對于IPSO、ACA、GA、GWO算法,其算法參數(shù)設(shè)置與文獻[7]相同,便于比較參考。

      任務(wù)分配模型中的威脅優(yōu)勢權(quán)重c1和c2分別為0.6和0.4,總體評價指標函數(shù)中的衡量減少UCAV代價損耗和時間損耗的權(quán)重ω1和ω2分別為0.6和0.4。

      本文采用MATLAB 2014a進行仿真,運行環(huán)境為Inter(R)Core(TM)i5-3470處理器,操作系統(tǒng)為Windows7。

      4.2 靜態(tài)任務(wù)分配仿真

      為了驗證SAGWO算法的求解有效性,對該實驗運行30次,得到最優(yōu)分配方案、算法耗時和平均最優(yōu)函數(shù)值。根據(jù)優(yōu)勢概率模型,計算得到我方無人機編隊各個UCAV對敵方目標的優(yōu)勢概率,如表5所示;根據(jù)目標對UCAV的威脅模型,求出各目標對UCAV的威脅概率,如表6所示。

      仿真結(jié)果:SAGWO算法耗時為0.281 06 s,最優(yōu)函數(shù)值為0.733 8,最優(yōu)任務(wù)分配結(jié)果如表7所示,具體分配如圖4所示。

      由圖5可知,最優(yōu)適應(yīng)度值隨著迭代次數(shù)的增加,漸趨于穩(wěn)定,在第42代以后最優(yōu)適應(yīng)度值基本不再變化,其值為0.733 8;平均函數(shù)值也隨著迭代次數(shù)增加而趨于穩(wěn)定,雖然有微小波動,但是總體趨勢不再變化。由圖6可知,任務(wù)分配的各個指標值在最開始有波動,但是隨著迭代次數(shù)增加,各指標值區(qū)趨于穩(wěn)定,編隊損耗代價值隨著迭代增加而減小,目標價值毀傷值相對原來變化不大,任務(wù)時間消耗值比迭代初期減少,基本符合任務(wù)分配的目標毀傷最大化、編隊損耗最小化、任務(wù)時間消耗最小化的原則。綜合以上分析,SAGWO算法對任務(wù)分配問題是有效的。

      表5 UCAV對目標的優(yōu)勢概率Table 5 Advantage probability of UCAV to target

      表6 目標對UCAV的威脅概率

      表7 UCAVs最優(yōu)任務(wù)分配

      為了驗證改進算法的求解質(zhì)量與求解穩(wěn)定性,將SAGWO算法與IPSO、ACO、GA、GWO算法相比較[7],并且應(yīng)用于不同規(guī)模。從圖7可以分析出,在分配方案變化不大的基礎(chǔ)上,5種算法的最優(yōu)函數(shù)值隨著迭代次數(shù)的增加漸漸趨于穩(wěn)定,只是求解精度與求解速度不一樣,GWO、ACO和IPSO算法相對于其他2種算法過早的收斂,陷入局部最優(yōu);GA算法在58代時達到最優(yōu)解,但是收斂速度較慢,SAGWO算法在43代達到最優(yōu)解,相較于GA算法收斂速度較快。圖8是針對不同規(guī)模的任務(wù)分配問題,采用不同算法的優(yōu)化時間對比結(jié)果,從其可以看出,基于各個算法的任務(wù)分配優(yōu)化時間隨著任務(wù)分配規(guī)模增加而增加,其中GA、ACO、IPSO算法對問題規(guī)模增加更加敏感,優(yōu)化時間增加得更快,而SAGWO算法與GWO算法的優(yōu)化時間增加程度基本上一樣。通過以上基于不同算法的任務(wù)分配實驗,進一步驗證了SAGWO算法的求解穩(wěn)定性和有效性,也驗證了SAGWO算法的求解精度好于其他4種算法,而且優(yōu)化時間也好于GA、ACO、IPSO算法。

      4.3 動態(tài)任務(wù)分配仿真

      1) 基于目標移動的動態(tài)任務(wù)分配仿真

      為了驗證基于目標移動的動態(tài)任務(wù)分配有效性,對6架UCAV編隊攻擊8目標的動態(tài)任務(wù)分配實驗運行30次,得到一定時間片末的最優(yōu)分配方案、算法耗時和平均最優(yōu)函數(shù)值。首先通過UCAV飛行時間矩陣定義得到表8,根據(jù)時間片定義與分析,確定最小飛行時間min(tij)和時間片數(shù)nt分別為279.3和270,得到時間片長度為1 s(取整數(shù),方便計算),滿足大于每次任務(wù)分配優(yōu)化時間。其次設(shè)置機動目標參數(shù),如表9所示,合速度為x、y方向速度平方和的開方。在實驗中,取定前240個時間片進行仿真與分析,首先對整個過程的動態(tài)任務(wù)分配進行分析,選取240個時間片其中的4個時間片與0時刻進行對比分析,然后對240個時間片的函數(shù)值曲線進行分析,最后對第240個時間片優(yōu)化函數(shù)值曲線和指標值變化曲線進行分析。

      圖9和表10是針對基于目標移動的動態(tài)任務(wù)分配問題的任務(wù)分配圖和其中5個時間片的任務(wù)分配方案。從圖9可以看出,經(jīng)過240個時間片,UCAV根據(jù)自己的優(yōu)勢去攻擊相應(yīng)的目標,分配結(jié)果比較均勻。表10中的5個時間片任務(wù)分配方案隨著時間片的變化,其有一定的變動,這是因為目標位置發(fā)生變化,UCAV也發(fā)生變化,導致分配方案也發(fā)生變化。

      表8 UCAV飛行時間矩陣

      表9 機動目標速度

      表11是針對基于目標移動的動態(tài)任務(wù)分配問題選取其中5個時間片的優(yōu)化時間和適應(yīng)度值進行比較分析,圖10表示240個時間片的平均函數(shù)值與最優(yōu)函數(shù)值隨時間片變化的曲線。通過以上結(jié)果分析,隨著時間變化,基于移動目標的任務(wù)分配方法是有效的,而且任務(wù)分配方案也是變化的。圖11為第240個時間片的最優(yōu)適應(yīng)度值、平均值以及各評價指標值隨迭代次數(shù)增加的變化趨勢。通過圖11的結(jié)果分析,時間片內(nèi)基于SAGWO算法的任務(wù)分配是有效的,而且趨于穩(wěn)定,得到最優(yōu)值。

      2) 基于UCAV失效的動態(tài)任務(wù)分配仿真

      在第240個時間片,V4被擊傷,退出戰(zhàn)場,通過仿真實驗,得到表12、表13和圖12。表12中“0”表示無目標可執(zhí)行。從表13的仿真結(jié)果可以知道,隨著UCAV減少一架,優(yōu)化時間消耗也減少。從圖12中可以看出,隨著迭代次數(shù)的增加,最優(yōu)函數(shù)值和平均函數(shù)值趨于穩(wěn)定,任務(wù)分配的各個指標值也漸趨于穩(wěn)定,而且其值走向符合編隊損耗代價值最小化、任務(wù)時間消耗最小化和目標價值毀傷最小化的原則。

      時間/sV1V2V3V4V5V60T1T 3, T 2T 4T 5, T 8T 7T 660T 2T 1, T 3T 4T 5T 6, T 7T 8120T 3T 1, T 2T 4T 5T 6, T 7T 8180T 3, T 2T 1T 5T 4T 6T 8, T 7240T 3T 1, T 2T 5T 4T 6T 8, T 7

      表11 5個時間片的任務(wù)分配優(yōu)化時間消耗與適應(yīng)度值

      UCAVV1V2V3V4V5V6失效前失效后失效前失效后失效前失效后失效前失效后失效前失效后失效前失效后目 標T3T4, T3T1, T2T1, T2T5T5T40T6T6T8, T7T8, T7

      表13 一架UCAV失效前后的任務(wù)分配優(yōu)化結(jié)果對比

      3) 基于新增2個目標的動態(tài)任務(wù)分配仿真

      對新增2個目標的性能參數(shù)如表14和表15所示。在第240個時間片之后,發(fā)現(xiàn)2個新目標——T9和T10,通過仿真實驗,得到圖13、表16和表17。從表17可以看出,隨著在240時間片之后增加2目標,最優(yōu)函數(shù)值和種群平均函數(shù)值都增加,并且優(yōu)化時間消耗也增加。從圖13可知,任務(wù)分配的最優(yōu)函數(shù)值和平均函數(shù)值隨著迭代次數(shù)的增加趨于穩(wěn)定,任務(wù)分配的各個指標值隨迭代次數(shù)增加而漸趨于穩(wěn)定,而且其值走向符合任務(wù)分配各指標優(yōu)化原則,提高打擊敵方目標效費比。

      表14 新增目標的信息設(shè)置

      表15 新增目標依賴矩陣

      表16 增加目標前后的任務(wù)分配方案比較

      表17 增加目標前后的任務(wù)分配優(yōu)化結(jié)果對比

      5 結(jié) 論

      1) 針對UCAVs協(xié)同對地打擊多目標任務(wù)分配問題的實時性、高效性以及復雜性,對UCAV編隊信息以及對任務(wù)目標信息進行分析,設(shè)計了基于時間片的多約束動態(tài)任務(wù)分配模型。

      2) 傳統(tǒng)算法對動態(tài)任務(wù)分配問題求解速度慢、求解精度不高的缺點,提出了一種基于SAGWO算法的動態(tài)任務(wù)分配方法,同時證明了改進算法全局收斂,并分析了時間復雜度。

      3) 本文對所設(shè)計的基于SAGWO的任務(wù)分配從靜態(tài)與動態(tài)2種情況進行仿真驗證。仿真結(jié)果表明,SAGWO算法可快速精確地求解出動態(tài)任務(wù)分配,且分配結(jié)果符合作戰(zhàn)要求。由于篇幅有限,對于UCAVs武器分配尚且研究有限,需要進一步深入研究。

      猜你喜歡
      灰狼編隊適應(yīng)度
      2023年1月25日,美軍一次演習期間,空軍正在進行編隊飛行
      軍事文摘(2023年5期)2023-03-27 08:56:26
      改進的自適應(yīng)復制、交叉和突變遺傳算法
      計算機仿真(2022年8期)2022-09-28 09:53:02
      谷谷雞和小灰狼
      小太陽畫報(2019年1期)2019-06-11 10:29:48
      灰狼的大大噴嚏
      基于事件驅(qū)動的多飛行器編隊協(xié)同控制
      灰狼和老虎
      快樂語文(2016年15期)2016-11-07 09:46:31
      基于空調(diào)導風板成型工藝的Kriging模型適應(yīng)度研究
      中國塑料(2016年11期)2016-04-16 05:26:02
      基于預測控制的無人機編隊內(nèi)部避碰
      灰狼的幸福
      讀寫算(中)(2015年6期)2015-02-27 08:47:14
      多彈編隊飛行控制技術(shù)研究
      日土县| 杭锦后旗| 新兴县| 金山区| 巨鹿县| 广丰县| 新乡县| 江永县| 宝应县| 安康市| 达州市| 驻马店市| 安义县| 阜新市| 玛曲县| 东安县| 温宿县| 连平县| 焉耆| 盐源县| 平塘县| 台安县| 梁平县| 天台县| 息烽县| 陕西省| 彭泽县| 溧水县| 安达市| 定兴县| 西充县| 将乐县| 新绛县| 柞水县| 周口市| 洪湖市| 颍上县| 西安市| 屏边| 饶平县| 维西|