• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一種有限資源約束的博弈概率圖規(guī)劃模型

      2022-02-17 02:56:06劉兆鵬張金璐黃潤(rùn)宇
      指揮與控制學(xué)報(bào) 2022年4期
      關(guān)鍵詞:指揮員敵方概率

      劉兆鵬 羅 睿 張金璐 黃潤(rùn)宇

      1.軍事科學(xué)院戰(zhàn)爭(zhēng)研究院 北京 100091 2.軍事科學(xué)院軍隊(duì)政治工作研究院 北京 100091 3.軍事科學(xué)院研究生院 北京 100091

      聯(lián)合作戰(zhàn)任務(wù)規(guī)劃就是由本級(jí)指揮員帶領(lǐng)指揮機(jī)構(gòu)在有限資源約束條件下, 將上級(jí)賦予的任務(wù)目標(biāo)分解為本級(jí)可執(zhí)行的帶偏序約束的行動(dòng)方案的過(guò)程, 屬于聯(lián)合作戰(zhàn)籌劃的行動(dòng)方案開(kāi)發(fā)環(huán)節(jié)[1-2]. 運(yùn)用智能方法替代或者輔助指揮員進(jìn)行任務(wù)規(guī)劃是該領(lǐng)域的重要發(fā)展趨勢(shì), 相關(guān)研究可以歸納為兩類:一是基于符號(hào)邏輯的規(guī)劃方法, 1969年Newell 和Simon設(shè)計(jì)了行動(dòng)方案的通用問(wèn)題求解器[3](general problem solver, GPS), 1971年Fikes 和Nilsson 設(shè)計(jì)了基于命題邏輯描述方法的斯坦福研究所問(wèn)題求解(stanford research institute problem solver,STRIPS)規(guī)劃系統(tǒng)[4]. 二是啟發(fā)式規(guī)劃方法, 1998年Bonet 和Feffner提出了采用啟發(fā)式函數(shù)來(lái)指導(dǎo)狀態(tài)空間搜索的啟發(fā)式規(guī)劃方法[5]. 2019年歐嶠等在傳統(tǒng)武器指派問(wèn)題中運(yùn)用排隊(duì)論模型對(duì)空中目標(biāo)與防空反導(dǎo)系統(tǒng)之間的服務(wù)關(guān)系建模, 并通過(guò)離散差分進(jìn)化(discrete differential evolution, DDE)模型對(duì)武器指派問(wèn)題求解[6];李瑞陽(yáng)等運(yùn)用列生成算法對(duì)無(wú)人機(jī)運(yùn)輸問(wèn)題進(jìn)行求解[7];劉兆鵬等針對(duì)聯(lián)合作戰(zhàn)規(guī)劃中兵力調(diào)度的資源不確定性、時(shí)間不確定性構(gòu)建了遺傳模糊網(wǎng)絡(luò)模型[8];潘永強(qiáng)等運(yùn)用遺傳算法對(duì)多武器混合區(qū)域防空部署問(wèn)題進(jìn)行求解[9].

      分析基于符號(hào)邏輯的規(guī)劃方法求解效率較低,啟發(fā)式規(guī)劃方法較少考慮聯(lián)合作戰(zhàn)的體系對(duì)抗特征.Blum 和Furst 提出的圖規(guī)劃方法[10]雖然屬于基于符號(hào)邏輯的規(guī)劃方法, 但是具有較高求解效率, 且便于對(duì)聯(lián)合作戰(zhàn)體系中的支撐關(guān)系、對(duì)抗關(guān)系等要素建模. 本文在圖規(guī)劃研究進(jìn)展基礎(chǔ)上[11,15], 運(yùn)用博弈論模型對(duì)聯(lián)合作戰(zhàn)中的體系對(duì)抗特征建模, 并綜合考慮聯(lián)合作戰(zhàn)中的執(zhí)行效果不確定性和指揮員滿意度因素,設(shè)計(jì)了博弈概率圖規(guī)劃模型, 并針對(duì)聯(lián)合作戰(zhàn)方案驗(yàn)證難問(wèn)題, 設(shè)計(jì)了虛實(shí)結(jié)合的規(guī)劃框架.

      1 規(guī)劃框架設(shè)計(jì)

      1.1 聯(lián)合作戰(zhàn)任務(wù)規(guī)劃問(wèn)題定義及假設(shè)

      聯(lián)合作戰(zhàn)任務(wù)規(guī)劃的核心問(wèn)題是指揮員和指揮機(jī)構(gòu)將領(lǐng)受的上級(jí)任務(wù)分解為符合指揮員決策風(fēng)格的下級(jí)作戰(zhàn)單元可執(zhí)行的行動(dòng)方案, 與傳統(tǒng)智能規(guī)劃問(wèn)題的主要區(qū)別在于人機(jī)結(jié)合、敵我激烈對(duì)抗和對(duì)抗過(guò)程中的高度不確定性, 需要綜合考慮指揮員決策偏好、不確定性和對(duì)手策略干擾3 個(gè)因素. 本文以實(shí)驗(yàn)室環(huán)境為研究背景, 忽略指揮員與指揮機(jī)關(guān)、指揮機(jī)關(guān)各部門(mén)之間在方案擬制流程中的協(xié)調(diào)、配合等因素, 將聯(lián)合作戰(zhàn)任務(wù)規(guī)劃問(wèn)題抽象為如何將低分辨率上級(jí)任務(wù)解聚為由高分辨率本級(jí)任務(wù)組成的帶因果、協(xié)同等偏序關(guān)系的行動(dòng)方案, 并對(duì)聯(lián)合作戰(zhàn)任務(wù)規(guī)劃問(wèn)題空間作出如下假設(shè):

      1)行動(dòng)集合假設(shè):敵方行動(dòng)集合A 和我方行動(dòng)集合AO是有限已知的;

      2)不確定性假設(shè):任務(wù)規(guī)劃中面臨的不確定性因素主要包括態(tài)勢(shì)認(rèn)知不確定性和任務(wù)執(zhí)行效果不確定性, 在規(guī)劃過(guò)程中, 主要對(duì)任務(wù)執(zhí)行效果不確定性建模, 不考慮紅藍(lán)初始態(tài)勢(shì)不存在不確定性;

      3)資源有限假設(shè):只考慮裝備實(shí)體資源限制, 暫不考慮彈藥等消耗性資源的限制;

      4)穩(wěn)定策略假設(shè):不考慮時(shí)間因素給指揮員決策帶來(lái)的決策偏好和權(quán)重的變化;

      5)非線性毀傷假設(shè):敵方任務(wù)資源的實(shí)力值遵循二項(xiàng)分布rSO={0, 1}, 當(dāng)敵方資源實(shí)體狀態(tài)為1 時(shí),具備對(duì)我方執(zhí)行行動(dòng)實(shí)體威脅能力, 當(dāng)敵方資源實(shí)體狀態(tài)為0 時(shí), 不具備對(duì)我方執(zhí)行行動(dòng)實(shí)體威脅能力.

      基于上述假設(shè), 將聯(lián)合作戰(zhàn)任務(wù)規(guī)劃問(wèn)題空間形式化為:

      其中, ∑為有限狀態(tài)轉(zhuǎn)移系統(tǒng);S 表示∑系統(tǒng)的有限狀態(tài)空間;BS表示系統(tǒng)狀態(tài)S 的概率分布;Pγ表示行動(dòng)效果的概率分布, 上級(jí)任務(wù)分解中的規(guī)劃問(wèn)題P的形式化定義為:

      其中, S0表示上級(jí)任務(wù)分解的初始狀態(tài)空間;G'表示包含指揮員決策偏好的目標(biāo)狀態(tài)空間;gi表示目標(biāo)狀態(tài)空間的一個(gè)狀態(tài);ri表示實(shí)現(xiàn)該目標(biāo)狀態(tài)需要面臨的風(fēng)險(xiǎn);li表示指揮員對(duì)承擔(dān)風(fēng)險(xiǎn)ri實(shí)現(xiàn)目標(biāo)gi的滿意度.

      1.2 博弈概率圖規(guī)劃框架

      本文針對(duì)聯(lián)合作戰(zhàn)領(lǐng)域規(guī)劃成果無(wú)法在真實(shí)對(duì)抗環(huán)境中進(jìn)行驗(yàn)證的情況, 依托作戰(zhàn)仿真系統(tǒng), 構(gòu)建具有虛實(shí)結(jié)合特征的博弈概率圖規(guī)劃框架, 虛實(shí)結(jié)合是指在真實(shí)世界運(yùn)用博弈概率圖規(guī)劃算法將上級(jí)任務(wù)分解為行動(dòng)方案, 在作戰(zhàn)仿真系統(tǒng)虛擬世界構(gòu)建近真實(shí)對(duì)抗環(huán)境, 驗(yàn)證生成的行動(dòng)方案, 具體如圖1 所示.

      圖1 博弈概率圖規(guī)劃框架Fig.1 Planning framework of game probability graph

      其中, 知識(shí)庫(kù)用于存儲(chǔ)博弈概率圖規(guī)劃模型所依賴的規(guī)劃知識(shí)模型, 采用“節(jié)點(diǎn)-屬性-值”結(jié)構(gòu)概念內(nèi)涵, 采用“邊-屬性-值”結(jié)構(gòu)刻畫(huà)概念語(yǔ)義的外延和概念之間的關(guān)聯(lián)關(guān)系;利用資源、能力、任務(wù)之間的路徑來(lái)對(duì)規(guī)劃中的程序性知識(shí)建模. 規(guī)劃知識(shí)的形式化定義為:

      其中, KGB 表示知識(shí)庫(kù), Node 表示知識(shí)庫(kù)中的節(jié)點(diǎn);Verge 表示知識(shí)庫(kù)中的邊;Nrc表示知識(shí)庫(kù)中的資源概念節(jié)點(diǎn);Ncap表示知識(shí)庫(kù)中的能力概念節(jié)點(diǎn);Nact表示知識(shí)庫(kù)中的行動(dòng)概念節(jié)點(diǎn);Vkpo表示資源概念節(jié)點(diǎn)之間的上下位隸屬關(guān)系, 并由下位概念節(jié)點(diǎn)指向上位概念節(jié)點(diǎn), 比如裝備概念節(jié)點(diǎn)Equip 是武器平臺(tái)概念節(jié)點(diǎn)WPlatform 的上位概念;Vhc表示資源概念節(jié)點(diǎn)與能力概念節(jié)點(diǎn)之間的擁有能力關(guān)系, 由資源概念節(jié)點(diǎn)指向能力概念節(jié)點(diǎn), 比如轟炸機(jī)HZPlane 具有空地打擊能力KDAtkCap;Vsp表示資源概念節(jié)點(diǎn)之間的支撐關(guān)系, 由支撐資源概念節(jié)點(diǎn)指向被支撐資源概念節(jié)點(diǎn), 比如機(jī)場(chǎng)設(shè)施Airport 對(duì)轟炸機(jī)武器平臺(tái)HZPlane 具有支撐能力;Vprec表示行動(dòng)概念節(jié)點(diǎn)與能力概念節(jié)點(diǎn)之間的依賴關(guān)系, 由行動(dòng)概念節(jié)點(diǎn)指向能力概念節(jié)點(diǎn), 比如空地打擊行動(dòng)KDAct 依賴空地攻擊能力KDAtkCap;Veff表示行動(dòng)概念節(jié)點(diǎn)與資源概念節(jié)點(diǎn)之間的行動(dòng)效果關(guān)系, 空地打擊行動(dòng)KDAct可以對(duì)指揮所設(shè)施CP 的實(shí)力值dHState 屬性產(chǎn)生打擊效果;Vcoo表示行動(dòng)概念節(jié)點(diǎn)之間的協(xié)同關(guān)系, 協(xié)同包括主行動(dòng)和輔助行動(dòng), 由主行動(dòng)概念節(jié)點(diǎn)指向輔助行動(dòng)概念節(jié)點(diǎn), 空地打擊行動(dòng)KDAct 需要空中護(hù)航行動(dòng)KZHHAct 協(xié)同.

      目標(biāo)選擇和遺傳優(yōu)化兩部分相互關(guān)聯(lián), 流程包括兩個(gè)主要步驟:一是根據(jù)遺傳算法隨機(jī)生成的目標(biāo)選擇順序進(jìn)行逐步規(guī)劃擴(kuò)張, 實(shí)現(xiàn)從上級(jí)任務(wù)初始狀態(tài)到上級(jí)任務(wù)目標(biāo)狀態(tài)的轉(zhuǎn)變;二是根據(jù)上級(jí)任務(wù)面臨的總體威脅值采用遺傳算法進(jìn)行目標(biāo)選擇順序優(yōu)化. 具體如圖2 所示.

      圖2 目標(biāo)選擇和遺傳優(yōu)化流程Fig.2 Target selection and genetic optimization process

      目標(biāo)選擇模塊根據(jù)規(guī)劃知識(shí)將上級(jí)任務(wù)目標(biāo)分解為多個(gè)存在偏序關(guān)系的子目標(biāo), 在目標(biāo)選擇研究中強(qiáng)調(diào)基于效果和系統(tǒng)視角[16], 基于效果是指目標(biāo)選擇要基于指揮員的作戰(zhàn)意圖和預(yù)期作戰(zhàn)效果, 其中包含了指揮員的決策偏好;系統(tǒng)視角是指當(dāng)前作戰(zhàn)形態(tài)是體系對(duì)抗, 作戰(zhàn)體系是一個(gè)復(fù)雜性系統(tǒng), 具有魯棒性和脆弱性特征, 魯棒性是指作戰(zhàn)體系具有抗隨機(jī)打擊能力特征, 脆弱性是指作戰(zhàn)體系存在關(guān)鍵節(jié)點(diǎn), 當(dāng)關(guān)鍵節(jié)點(diǎn)受到攻擊時(shí), 會(huì)產(chǎn)生級(jí)聯(lián)失效和體系坍塌, 產(chǎn)生“1+1>2”的作戰(zhàn)效果. 遺傳優(yōu)化模塊是利用遺傳算法, 從系統(tǒng)視角搜索打擊敵方脆弱節(jié)點(diǎn)的行動(dòng)方案, 在遺傳算法中對(duì)指揮員決策偏好因素建模,將上級(jí)任務(wù)面臨的風(fēng)險(xiǎn)最小作為指揮員決策偏好和優(yōu)化目標(biāo), 其形式化定義為:

      其中, ri表示行動(dòng)方案中一個(gè)特定行動(dòng)面臨的風(fēng)險(xiǎn);n表示行動(dòng)方案中行動(dòng)的數(shù)量.

      序貫博弈規(guī)劃步設(shè)計(jì)是博弈概率圖規(guī)劃模型的核心,包括博弈策略、圖規(guī)劃步和行動(dòng)效果3 部分. 其中,有限策略集合為實(shí)驗(yàn)所選擇仿真系統(tǒng)的紅、藍(lán)雙方模型的控制指令集,紅方策略依據(jù)式(1)~式(10)選擇,藍(lán)方策略通過(guò)指揮員枚舉方式選擇.具體如圖3 所示.

      圖3 序貫博弈規(guī)劃步Fig.3 Sequential game planning step

      其中, 左側(cè)為圖規(guī)劃步中的博弈樹(shù)示意圖, 紅色圓圈表示紅方策略, 藍(lán)色圓圈表示藍(lán)方策略, 右側(cè)為圖規(guī)劃步的數(shù)學(xué)模型, 由兩類節(jié)點(diǎn)四類邊構(gòu)成, 節(jié)點(diǎn)包括資源節(jié)點(diǎn)和策略節(jié)點(diǎn), 資源節(jié)點(diǎn)由我方資源和敵方資源構(gòu)成, 其中, 我方資源形式化定義為:

      敵方資源形式化定義為:

      策略節(jié)點(diǎn)由我方策略和敵方策略構(gòu)成, 其中, 我方策略形式化定義為:

      敵方策略形式化定義為:

      邊由我方條件邊、敵方條件邊、威脅邊和執(zhí)行效果邊組成, 其中, 我方條件邊形式化定義為:

      敵方條件邊用于表示敵方資源對(duì)敵方行動(dòng)的支撐關(guān)系, 其形式化定義為:

      威脅邊用于表示敵我雙方行動(dòng)之間的威脅關(guān)系,其形式化定義為:

      執(zhí)行效果邊用于表示行動(dòng)對(duì)∑系統(tǒng)產(chǎn)生的狀態(tài)變化, 其形式化定義為:

      由于當(dāng)前作戰(zhàn)樣式是體系對(duì)抗, 在敵我作戰(zhàn)體系中, 資源之間存在大量支撐關(guān)系, 比如機(jī)場(chǎng)設(shè)施與飛機(jī)資源之間存在的支撐關(guān)系, 打擊作戰(zhàn)體系的關(guān)鍵節(jié)點(diǎn)資源, 會(huì)通過(guò)這種支撐關(guān)系產(chǎn)生體系坍塌. 故本文在傳統(tǒng)條件邊中增加資源之間的支撐關(guān)系描述, 比如圖3 中的e2、eo2. 通過(guò)敵方行動(dòng)與我方資源的效果邊、以及我方資源之間的支撐邊、我方資源與我方行動(dòng)之間的條件邊, 實(shí)現(xiàn)敵方指揮員策略對(duì)我方指揮員策略的影響.

      在圖規(guī)劃步規(guī)劃過(guò)程中, 針對(duì)傳統(tǒng)圖規(guī)劃模型存在的搜索空間大問(wèn)題, 采用目標(biāo)引導(dǎo)的剪枝策略,不考慮與上級(jí)任務(wù)目標(biāo)無(wú)關(guān)的可執(zhí)行行動(dòng), 增加可執(zhí)行資源總量約束和狀態(tài)偏序約束:

      其中, stepi表示當(dāng)前規(guī)劃步, stop 表示規(guī)劃步終止,resact表示規(guī)劃步內(nèi)單個(gè)行動(dòng)的資源需求量, restotal表示我方資源總量, 式(1)~式(19)表示當(dāng)前規(guī)劃步我方全部行動(dòng)的資源需求量超過(guò)我方資源總量時(shí), 終止當(dāng)前規(guī)劃步;acti、actj表示我方兩個(gè)行動(dòng), rm、rn表示資源的兩個(gè)狀態(tài), effi表示我方行動(dòng)acti的效果, effj表示我方行動(dòng)actj的效果, stepk表示行動(dòng)actj所在規(guī)劃步, 式(1)~式(20)表示如果行動(dòng)acti效果rm和行動(dòng)actj的效果rn存在偏序關(guān)系, 則行動(dòng)acti和行動(dòng)actj不能出現(xiàn)在同一個(gè)規(guī)劃步.

      行動(dòng)效果部分借鑒概率圖規(guī)劃方法, 采用概率分布P 來(lái)描述行動(dòng)的成功與否, 并將行動(dòng)的終止判斷形式化為:

      其中, n 為行動(dòng)次數(shù);x 為判斷該行動(dòng)執(zhí)行成功的閾值概率.

      2 博弈概率圖規(guī)劃模型設(shè)計(jì)

      2.1 模型參數(shù)

      博弈概率圖規(guī)劃模型中的參數(shù)包括:

      10)steph:規(guī)劃器當(dāng)前規(guī)劃步h, 規(guī)劃步一般由初始實(shí)體狀態(tài)列、行動(dòng)列、效果實(shí)體狀態(tài)列和連接各列的邊組成, 如圖3 所示, 初始實(shí)體狀態(tài)列和效果實(shí)體狀態(tài)列由敵我雙方資源實(shí)體組成, 行動(dòng)列由敵我雙方在當(dāng)前規(guī)劃步的全部策略組成, 邊由我方條件邊、敵方條件邊, 效果邊組成.

      2.2 博弈概率圖規(guī)劃模型

      博弈概率圖規(guī)劃模型的形式化定義為:

      其中, 式(16)為目標(biāo)函數(shù), 表示以上級(jí)任務(wù)面臨的威脅最小為優(yōu)化目標(biāo);式(17)為資源約束, 表示當(dāng)前規(guī)劃步steph中全部行動(dòng)實(shí)體所用資源數(shù)量不能超過(guò)資源總量, 在傳統(tǒng)圖規(guī)劃方法中, 多采用行動(dòng)互斥方法終止當(dāng)前規(guī)劃步, 博弈概率圖規(guī)劃模型采用資源總量約束的方法終止當(dāng)前規(guī)劃步, 這是與傳統(tǒng)圖規(guī)劃模型不同的一個(gè)特征;式(18)為威脅能力約束, 當(dāng)敵方資源狀態(tài)下降到毀傷要求時(shí), 則不具備威脅能力;式(19)為威脅條件約束, 其中, rdj表示敵方資源實(shí)體rj的威脅覆蓋范圍,表示敵方資源實(shí)體rj與我方執(zhí)行行動(dòng)k 的資源實(shí)體ri的行動(dòng)航跡之間的最短距離, 當(dāng)敵方資源與我方行動(dòng)航跡的距離超出其作用范圍時(shí), 則該資源不具備威脅條件.

      3 實(shí)驗(yàn)驗(yàn)證

      3.1 實(shí)驗(yàn)數(shù)據(jù)環(huán)境設(shè)計(jì)

      本次實(shí)驗(yàn)依托Neo4j 開(kāi)源圖數(shù)據(jù)庫(kù)開(kāi)展數(shù)據(jù)準(zhǔn)備, 設(shè)計(jì)了“知識(shí)-信息”兩層結(jié)構(gòu), 在知識(shí)層, 人工構(gòu)建的知識(shí)模型如圖4 所示.

      在信息層構(gòu)建紅藍(lán)對(duì)抗想定數(shù)據(jù), 其中, 紅方上級(jí)任務(wù)包括聯(lián)合火力打擊等4 個(gè), 任務(wù)間存在條件、因果邏輯關(guān)系, 涉及陸上、海上、空中、常導(dǎo)、信息等作戰(zhàn)力量和港口、機(jī)場(chǎng)等基礎(chǔ)設(shè)施;藍(lán)方上級(jí)任務(wù)空中防御等3 個(gè), 涉及空中、海上、信息等作戰(zhàn)力量和港口、機(jī)場(chǎng)、電站等基礎(chǔ)設(shè)施, 將上述數(shù)據(jù)導(dǎo)入Neo4j 后, 如圖5 所示.

      圖5 規(guī)劃實(shí)驗(yàn)信息模型Fig.5 Experimental information models for planning

      其中, 上半部分紫色網(wǎng)絡(luò)表示藍(lán)方作戰(zhàn)力量和基礎(chǔ)設(shè)施, 下半部分左側(cè)紫色網(wǎng)絡(luò)表示紅方作戰(zhàn)力量和基礎(chǔ)設(shè)施, 下半部分紅色網(wǎng)絡(luò)表示4 個(gè)上級(jí)實(shí)驗(yàn)任務(wù).

      3.2 實(shí)驗(yàn)結(jié)果及分析

      本次選擇聯(lián)合火力打擊任務(wù)開(kāi)展規(guī)劃實(shí)驗(yàn), 將博弈概率圖規(guī)劃模型的遺傳算法種群規(guī)模參數(shù)設(shè)置為30, 遺傳代數(shù)設(shè)置為30, 實(shí)驗(yàn)結(jié)果如圖6 所示.

      圖6 目標(biāo)選擇遺傳優(yōu)化結(jié)果Fig.6 Genetic optimization results of target selection

      其中, 縱坐標(biāo)表示戰(zhàn)役任務(wù)面臨總威脅值, 橫坐標(biāo)表示遺傳算法代數(shù), 根據(jù)圖6 顯示, 遺傳算法在第17 代開(kāi)始收斂. 根據(jù)遺傳算法收斂后最優(yōu)染色體生成的行動(dòng)方案如圖7 所示.

      圖7 基于最優(yōu)染色體的行動(dòng)方案Fig.7 Action scheme based on optimal chromosome

      實(shí)驗(yàn)依托作戰(zhàn)仿真系統(tǒng)開(kāi)展, 博弈概率圖規(guī)劃模型中對(duì)作戰(zhàn)力量、基礎(chǔ)設(shè)施的實(shí)力值、毀傷、支撐關(guān)系部分, 參考了作戰(zhàn)仿真系統(tǒng)中模型建模方法, 與實(shí)際戰(zhàn)場(chǎng)情況還有一定差異. 博弈概率圖規(guī)劃模型采用資源約束替代傳統(tǒng)圖規(guī)劃步互斥方法終止單步規(guī)劃, 并采用遺傳算法對(duì)行動(dòng)方案進(jìn)行優(yōu)化, 實(shí)驗(yàn)證明, 該模型能夠?qū)⑸霞?jí)任務(wù)分解為考慮本級(jí)指揮員決策風(fēng)格的行動(dòng)方案.

      4 結(jié)論

      聯(lián)合作戰(zhàn)任務(wù)規(guī)劃不同于傳統(tǒng)智能任務(wù)規(guī)劃, 行動(dòng)方案作為規(guī)劃結(jié)果, 可以直接應(yīng)用于機(jī)器人, 以驗(yàn)證其有效性, 聯(lián)合作戰(zhàn)任務(wù)規(guī)劃的結(jié)果難以直接在真實(shí)空間進(jìn)行有效性驗(yàn)證, 本文設(shè)計(jì)了具有真實(shí)規(guī)劃、虛擬驗(yàn)證特征的虛實(shí)結(jié)合規(guī)劃框架, 提出了將上級(jí)作戰(zhàn)任務(wù)細(xì)化為本級(jí)行動(dòng)方案的博弈概率圖規(guī)劃模型,并通過(guò)聯(lián)合火力打擊作戰(zhàn)任務(wù)驗(yàn)證了該模型的有效性. 隨著研究的深入, 還存在以下3 方面改進(jìn)空間:

      1)運(yùn)用作戰(zhàn)仿真系統(tǒng)對(duì)博弈概率圖規(guī)劃模型規(guī)劃的行動(dòng)方案進(jìn)行有效性驗(yàn)證, 形成真實(shí)規(guī)劃、虛擬驗(yàn)證, 再根據(jù)虛擬驗(yàn)證結(jié)果修正真實(shí)世界博弈概率圖規(guī)劃模型的閉環(huán);

      2)擴(kuò)展紅方、藍(lán)方的策略空間, 增加藍(lán)方指揮員的決策風(fēng)格建模;

      3)在仿真推演數(shù)據(jù)中挖掘規(guī)劃知識(shí), 將人在回路的知識(shí)建模轉(zhuǎn)變?yōu)槿瞬辉诨芈返闹R(shí)建模.

      猜你喜歡
      指揮員敵方概率
      少林韋陀十八手
      少林與太極(2022年6期)2022-09-14 08:59:42
      第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
      4打5,敵方還剩幾個(gè)人?
      第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
      概率與統(tǒng)計(jì)(一)
      概率與統(tǒng)計(jì)(二)
      水果大作戰(zhàn)
      人工智能有助于處置敵方炸彈
      從兩廣作戰(zhàn)看戰(zhàn)區(qū)、戰(zhàn)役指揮員的意見(jiàn)分歧與統(tǒng)一
      軍事歷史(1993年3期)1993-08-21 06:16:08
      智勇兼優(yōu)的高級(jí)指揮員皮定均
      軍事歷史(1986年3期)1986-08-21 02:21:10
      砀山县| 肇州县| 崇左市| 玛纳斯县| 新宁县| 凤阳县| 长顺县| 兴和县| 镇雄县| 岳阳市| 通山县| 贺州市| 尖扎县| 溧阳市| 行唐县| 康定县| 木兰县| 通山县| 泰顺县| 开原市| 正镶白旗| 康马县| 文昌市| 定襄县| 康马县| 乌审旗| 高雄市| 东源县| 宜宾县| 桃江县| 湖州市| 彭水| 巴青县| 景宁| 阿拉善盟| 梅河口市| 新田县| 青铜峡市| 白山市| 军事| 娱乐|