• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      人機(jī)共生作戰(zhàn)決策系統(tǒng):發(fā)展愿景與關(guān)鍵技術(shù)*

      2022-09-14 08:22:46鄭少秋梁汝鵬張政偉
      火力與指揮控制 2022年7期
      關(guān)鍵詞:兵力指揮員人機(jī)

      鄭少秋,梁汝鵬,吳 浩,袁 翔,張政偉*

      (1.中國(guó)電子科技集團(tuán)公司第二十八研究所,南京 210007;2.中國(guó)電子科技集團(tuán)公司信息系統(tǒng)需求重點(diǎn)實(shí)驗(yàn)室,南京 210007)

      0 引言

      當(dāng)前,隨著人工智能、云計(jì)算、先進(jìn)通信等技術(shù)發(fā)展,作戰(zhàn)兵力正朝無(wú)人化、智能化、模塊化方向發(fā)展。無(wú)人自主裝備快速切入戰(zhàn)場(chǎng)前沿,極大地拓展了對(duì)抗的時(shí)空約束,模塊化兵力支持面向任務(wù)的動(dòng)態(tài)靈活組織,在為對(duì)手制造認(rèn)知和決策困境的同時(shí),極大提升了作戰(zhàn)體系效能。作戰(zhàn)兵力發(fā)展逐步引發(fā)戰(zhàn)爭(zhēng)形態(tài)、制勝機(jī)理的變革。戰(zhàn)爭(zhēng)形態(tài)日益復(fù)雜多變,分布式、多域聯(lián)合、智能化的體系作戰(zhàn)成為未來(lái)戰(zhàn)爭(zhēng)制勝關(guān)鍵。在此背景下,美軍相繼提出了“算法戰(zhàn)”[1]、“馬賽克戰(zhàn)”[2-3]、“聯(lián)合全域作戰(zhàn)”[4]等新型作戰(zhàn)概念。

      隨著無(wú)人化、智能化、模塊化作戰(zhàn)單元的廣泛運(yùn)用,作戰(zhàn)兵力的可組合性和作戰(zhàn)效能得到顯著加強(qiáng),但對(duì)作戰(zhàn)決策的快速協(xié)同、精準(zhǔn)聚優(yōu)提出了更高要求。傳統(tǒng)的以指揮員為中心的“指揮員決策、機(jī)器輔助計(jì)算”的作戰(zhàn)決策范式,難以滿足未來(lái)作戰(zhàn)時(shí)效性、精準(zhǔn)性要求,迫切需要研制與未來(lái)戰(zhàn)爭(zhēng)相匹配的智能作戰(zhàn)決策能力。

      1 相關(guān)工作

      圍繞智能化作戰(zhàn)決策,許多研究者做了諸多工作[5-8],包括情報(bào)信息處理、作戰(zhàn)態(tài)勢(shì)研判、作戰(zhàn)任務(wù)規(guī)劃等方面。具體地,在情報(bào)信息處理方面,邢世宏等[9]提出將遷移學(xué)習(xí)應(yīng)用于艦船目標(biāo)識(shí)別;李婷婷等[10]提出智能訂單方法進(jìn)行態(tài)勢(shì)產(chǎn)品服務(wù);廖鷹等[11]分析了戰(zhàn)場(chǎng)態(tài)勢(shì)分層表示與理解機(jī)理,并據(jù)此提出了面向態(tài)勢(shì)理解的復(fù)合架構(gòu)深度學(xué)習(xí)模型。在作戰(zhàn)態(tài)勢(shì)研判方面,胡曉峰等[12]將注意力機(jī)制應(yīng)用于態(tài)勢(shì)認(rèn)知,提出戰(zhàn)場(chǎng)態(tài)勢(shì)感知注意力機(jī)制框架;康凱等[13]基于貝葉斯網(wǎng)絡(luò)推理模型進(jìn)行態(tài)勢(shì)相關(guān)估計(jì),實(shí)現(xiàn)對(duì)陸戰(zhàn)場(chǎng)的實(shí)時(shí)變化態(tài)勢(shì)動(dòng)態(tài)分析、理解與判斷。在作戰(zhàn)任務(wù)規(guī)劃方面,邢思遠(yuǎn)等[14]將Apriori 數(shù)據(jù)挖掘方法應(yīng)用于武器使用規(guī)律挖掘研究,支撐根據(jù)不同地形、協(xié)同規(guī)律進(jìn)行兵力推薦;季軍亮等[15]將啟發(fā)式算法應(yīng)用于兵力編組。總體而言,主要將人工智能技術(shù)應(yīng)用到作戰(zhàn)決策單一環(huán)節(jié)業(yè)務(wù),提升其自動(dòng)化、智能化水平。

      近年來(lái),隨著AlphaGo[16]、AlphaStar[17]模型在圍棋、星際爭(zhēng)霸游戲?qū)诡I(lǐng)域的成功應(yīng)用,為聯(lián)合作戰(zhàn)決策提供新的技術(shù)思路,研究者逐步將深度強(qiáng)化學(xué)習(xí)技術(shù)應(yīng)用到作戰(zhàn)決策中。曹雷[18]對(duì)基于強(qiáng)化學(xué)習(xí)的博弈對(duì)抗方法進(jìn)行了綜述,并對(duì)軍事決策應(yīng)用進(jìn)行分析。閆實(shí)等[19]將強(qiáng)化學(xué)習(xí)應(yīng)用于多機(jī)載雷達(dá)傳感器調(diào)度管理。曹雷等[20]提出將深度強(qiáng)化學(xué)習(xí)應(yīng)用于作戰(zhàn)計(jì)劃優(yōu)選。Toubman 等[21-22]基于空戰(zhàn)行為規(guī)則,使用強(qiáng)化學(xué)習(xí)最優(yōu)組合生成戰(zhàn)斗機(jī)行為。Rijken 等[23]將深度學(xué)習(xí)應(yīng)用到空戰(zhàn)行為訓(xùn)練中,構(gòu)建的智能體在空戰(zhàn)對(duì)抗中成功擊敗人類選手。

      然而,實(shí)際的作戰(zhàn)要遠(yuǎn)比圍棋、星際爭(zhēng)霸等游戲?qū)箞?chǎng)景復(fù)雜,決策難度更高,錯(cuò)判的代價(jià)也更高。主要體現(xiàn)在以下方面,1)聯(lián)合作戰(zhàn)場(chǎng)景具有高動(dòng)態(tài)、強(qiáng)對(duì)抗性,作戰(zhàn)目標(biāo)會(huì)動(dòng)態(tài)調(diào)整,難以簡(jiǎn)單地將“高勝率”作為決策衡量的唯一指標(biāo),因此,需要人機(jī)高效、持續(xù)地進(jìn)行交互式學(xué)習(xí),機(jī)器必須能夠理解指揮員動(dòng)態(tài)變化的作戰(zhàn)決心。2)聯(lián)合作戰(zhàn)兵力的種類、行為空間、協(xié)同策略規(guī)模等均遠(yuǎn)遠(yuǎn)高于游戲,導(dǎo)致決策模型的計(jì)算復(fù)雜度更高,迫切需要高效的模型學(xué)習(xí)方法提升模型學(xué)習(xí)收斂速度和魯棒性。因此,需要研究面向作戰(zhàn)的高效智能模型學(xué)習(xí)方法。

      基于此,聚焦未來(lái)戰(zhàn)場(chǎng)聯(lián)合作戰(zhàn)兵力智能組織難題,本文提出了人機(jī)共生的作戰(zhàn)決策系統(tǒng)發(fā)展愿景,包括運(yùn)行概念、系統(tǒng)架構(gòu),并深入分析實(shí)現(xiàn)人機(jī)共生面臨的挑戰(zhàn),提出技術(shù)解決思路。在此基礎(chǔ)上,從人機(jī)交互與理解、戰(zhàn)場(chǎng)態(tài)勢(shì)認(rèn)知、智能作戰(zhàn)決策、模型可信賴可解釋增強(qiáng)等方面,提出關(guān)鍵技術(shù)體系,支撐指揮員高階戰(zhàn)場(chǎng)認(rèn)知能力與機(jī)器強(qiáng)大搜索能力融合,最終形成準(zhǔn)確、可信、全局(最)較優(yōu)的兵力規(guī)劃方案,為新一代指揮控制系統(tǒng)創(chuàng)新發(fā)展提供借鑒。

      2 發(fā)展愿景

      針對(duì)作戰(zhàn)決策,人機(jī)共生作戰(zhàn)決策系統(tǒng)發(fā)展愿景是通過(guò)人機(jī)的合理分工、充分協(xié)作,使得指揮員聚焦頂層的、模糊的、邊界不確定的問(wèn)題,并依托智慧和經(jīng)驗(yàn)將其轉(zhuǎn)換為具體的、清晰的、邊界確定的優(yōu)化問(wèn)題,而后利用機(jī)器智能的強(qiáng)大搜索能力進(jìn)行求解,指揮員根據(jù)機(jī)器快速求解結(jié)果,進(jìn)行研判評(píng)估、迭代優(yōu)化,其核心是通過(guò)人機(jī)協(xié)作,為指揮員提供更多的試錯(cuò)空間,進(jìn)而大大提高作戰(zhàn)方案發(fā)現(xiàn)概率。

      2.1 系統(tǒng)運(yùn)行概念

      假定某時(shí)刻,紅藍(lán)雙方在某地域正面開展作戰(zhàn)對(duì)抗,紅方指揮員依托人機(jī)共生作戰(zhàn)決策系統(tǒng),通過(guò)人機(jī)協(xié)同制定作戰(zhàn)計(jì)劃,人機(jī)共生作戰(zhàn)決策系統(tǒng)運(yùn)行概念如下頁(yè)圖1 所示,具體過(guò)程如下:

      圖1 人機(jī)共生的智能決策過(guò)程

      Step 1:系統(tǒng)引接戰(zhàn)場(chǎng)實(shí)時(shí)態(tài)勢(shì),進(jìn)行多源態(tài)勢(shì)信息處理融合,并在軍事知識(shí)圖譜的支撐下,完善補(bǔ)充態(tài)勢(shì)信息要素,呈現(xiàn)于指揮員;

      Step 2:指揮員基于語(yǔ)音、圖像、文本、視頻、虛擬現(xiàn)實(shí)等多模態(tài)的交互手段,進(jìn)行態(tài)勢(shì)感知、理解和干預(yù);

      Step 3:指揮員理解上級(jí)作戰(zhàn)意圖,研判敵方作戰(zhàn)目標(biāo)體系,開展作戰(zhàn)任務(wù)分析和作戰(zhàn)目標(biāo)選擇,形成敵方目標(biāo)打擊清單及毀傷效果要求,作為智能決策模型學(xué)習(xí)的目標(biāo)狀態(tài);

      Step 4:指揮員基于聯(lián)合作戰(zhàn)博弈對(duì)抗訓(xùn)練平臺(tái),開展兵力模型構(gòu)建,設(shè)計(jì)作戰(zhàn)想定,并進(jìn)行大樣本仿真對(duì)抗,形成大量仿真對(duì)抗樣本,在此基礎(chǔ)上,利用深度強(qiáng)化學(xué)習(xí)等技術(shù),開展紅方智能決策模型訓(xùn)練和生成,并將其引入到作戰(zhàn)想定中進(jìn)行自博弈,如此反復(fù),直至在構(gòu)設(shè)的作戰(zhàn)想定中達(dá)到期望的作戰(zhàn)效果,即智能決策模型學(xué)習(xí)的目標(biāo)狀態(tài),輸出作戰(zhàn)決策模型;

      Step 5:指揮員將戰(zhàn)場(chǎng)實(shí)時(shí)態(tài)勢(shì)接入作戰(zhàn)決策模型中,依托聯(lián)合作戰(zhàn)博弈對(duì)抗訓(xùn)練平臺(tái),推演戰(zhàn)場(chǎng)態(tài)勢(shì)發(fā)展,生成作戰(zhàn)決策計(jì)劃建議;

      Step 6:指揮員根據(jù)作戰(zhàn)計(jì)劃建議,開展計(jì)劃干預(yù)或確認(rèn),如果不滿足作戰(zhàn)任務(wù)要求,則重新開展態(tài)勢(shì)處理分析、作戰(zhàn)任務(wù)分析、目標(biāo)選擇清單及毀傷效果調(diào)整等;如果滿足作戰(zhàn)任務(wù)要求,則進(jìn)行確認(rèn)或微調(diào),形成最終的作戰(zhàn)計(jì)劃;

      Step 7:指揮員將向作戰(zhàn)兵力下達(dá)最終的作戰(zhàn)計(jì)劃,并密切監(jiān)視戰(zhàn)場(chǎng)態(tài)勢(shì)變化。

      人機(jī)共生智能決策核心能力主要體現(xiàn)在以下兩個(gè)方面:

      1)人機(jī)交互式協(xié)同決策,大幅度縮短指揮決策周期

      在人機(jī)共生決策過(guò)程中,Step1~Step3 以人為主,Step4~Step5 以機(jī)器為主,而后在Step6 中進(jìn)行人工判斷,如果不滿足作戰(zhàn)任務(wù)要求,則重新從Step1 開始,否則進(jìn)入Step7。一方面,通過(guò)采用高效、可靠的多模態(tài)人機(jī)交互手段,人機(jī)指揮載荷得到合理分配,分別發(fā)揮指揮員理解復(fù)雜戰(zhàn)場(chǎng)態(tài)勢(shì)、宏觀趨勢(shì)的優(yōu)勢(shì),和機(jī)器智能在大規(guī)模、模式化快速方面的計(jì)算優(yōu)勢(shì),同時(shí)規(guī)避人工指揮決策作業(yè)效率低、輔助決策系統(tǒng)缺乏指揮藝術(shù)性等問(wèn)題,實(shí)現(xiàn)揚(yáng)長(zhǎng)避短。另一方面,通過(guò)人機(jī)交互式、迭代式協(xié)同決策,在決策過(guò)程中,指揮員持續(xù)對(duì)機(jī)器智能決策質(zhì)量進(jìn)行評(píng)估,快速形成決策質(zhì)量?jī)?yōu)化的閉環(huán),快速輸出高效可行的作戰(zhàn)計(jì)劃,指揮員人在回路的干預(yù)能夠確保最終輸出作戰(zhàn)計(jì)劃的有效性,以及性能的持續(xù)提升。

      2)機(jī)器遍歷搜索決策空間,創(chuàng)新戰(zhàn)法發(fā)現(xiàn)與全局優(yōu)化

      在人機(jī)共生決策過(guò)程中,在Step4 中,基于聯(lián)合作戰(zhàn)博弈對(duì)抗訓(xùn)練平臺(tái),能夠超越人類腦力思考和戰(zhàn)爭(zhēng)實(shí)踐的邊界,根據(jù)自博弈或?qū)嶋H作戰(zhàn)數(shù)據(jù)訓(xùn)練,訓(xùn)練形成智能體內(nèi)生智慧,并持續(xù)演進(jìn)。而后,面向作戰(zhàn)任務(wù),借助機(jī)器的強(qiáng)大搜索計(jì)算能力,通過(guò)遍歷搜索,拓展戰(zhàn)場(chǎng)決策容量空間,創(chuàng)新發(fā)現(xiàn)全新戰(zhàn)法,實(shí)現(xiàn)面向任務(wù)的全局(局部)的最優(yōu)方案搜索。在智能模型訓(xùn)練過(guò)程中,可以利用群體智能對(duì)抗技術(shù)、種群聯(lián)賽機(jī)制等,實(shí)現(xiàn)持續(xù)對(duì)抗演進(jìn),可有效提升機(jī)器生成的決策建議的多樣性、泛化性,以及對(duì)復(fù)雜多變戰(zhàn)場(chǎng)環(huán)境的動(dòng)態(tài)適應(yīng)性。

      2.2 系統(tǒng)總體架構(gòu)

      人機(jī)共生作戰(zhàn)決策系統(tǒng)架構(gòu)如圖2 所示,主要包括人機(jī)交互層、指揮業(yè)務(wù)層、智能支撐層和硬件資源層。

      圖2 人機(jī)共生作戰(zhàn)決策系統(tǒng)架構(gòu)

      人機(jī)交互層主要提供語(yǔ)音、文本、視頻等多模態(tài)人機(jī)交互手段,支撐指揮員和機(jī)器高效交互與敏捷響應(yīng),并通過(guò)交互式迭代學(xué)習(xí),持續(xù)提升人機(jī)互理解水平。

      指揮業(yè)務(wù)層在人機(jī)交互基礎(chǔ)上,智能理解指揮員動(dòng)態(tài)變化的作戰(zhàn)決心,結(jié)合多源戰(zhàn)場(chǎng)實(shí)時(shí)態(tài)勢(shì)信息,研判確定對(duì)敵打擊目標(biāo)清單及毀傷效果要求,基于智能支撐層提供的決策模型生成作戰(zhàn)決策和行動(dòng)控制指令建議。

      智能支撐層主要由軍事知識(shí)圖譜、聯(lián)合作戰(zhàn)博弈對(duì)抗訓(xùn)練平臺(tái)組成。其中,軍事知識(shí)圖譜實(shí)現(xiàn)作戰(zhàn)條例、作戰(zhàn)規(guī)則、作戰(zhàn)兵力能力的形式化建模,聯(lián)合作戰(zhàn)博弈對(duì)抗訓(xùn)練平臺(tái)在仿真空間為指揮業(yè)務(wù)提供數(shù)據(jù)管理、模型訓(xùn)練和能力持續(xù)成長(zhǎng)服務(wù)。

      硬件資源層,主要為系統(tǒng)運(yùn)行、智能模型訓(xùn)練與推理、軍事知識(shí)服務(wù)等提供計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、安全等資源支撐。

      3 關(guān)鍵問(wèn)題與解決思路

      3.1 如何讓機(jī)器理解指揮員動(dòng)態(tài)多樣的作戰(zhàn)意圖

      當(dāng)前,缺乏高效精準(zhǔn)的作戰(zhàn)意圖解析方法,一是由于各軍兵種文化差異,缺乏標(biāo)準(zhǔn)化的聯(lián)合作戰(zhàn)指令描述手段,機(jī)器無(wú)法理解形式不一的作戰(zhàn)指令。二是戰(zhàn)場(chǎng)情況多變,對(duì)作戰(zhàn)意圖的理解需要充分結(jié)合上下文信息補(bǔ)充,復(fù)雜度高。

      針對(duì)此問(wèn)題,一是提供作戰(zhàn)意圖規(guī)范化描述,通過(guò)構(gòu)建聯(lián)合任務(wù)清單,針對(duì)各類任務(wù),確定任務(wù)的要素組成、描述規(guī)范,提出形式化描述方法和標(biāo)準(zhǔn)化的描述語(yǔ)言,通過(guò)作戰(zhàn)簡(jiǎn)令的方式,降低人機(jī)交互的復(fù)雜度。二是,通過(guò)構(gòu)建軍事知識(shí)圖譜,實(shí)現(xiàn)作戰(zhàn)知識(shí)的顯式描述,形成先驗(yàn)軍事知識(shí)庫(kù),為指揮員作戰(zhàn)意圖理解提供上下文知識(shí),提升對(duì)作戰(zhàn)意圖的動(dòng)態(tài)理解能力。

      3.2 如何實(shí)現(xiàn)對(duì)大規(guī)模兵力的決策空間高效搜索

      智能決策模型訓(xùn)練本質(zhì)是一個(gè)優(yōu)化問(wèn)題求解的過(guò)程,需要保持全局探索能力和局部挖掘能力的平衡。一方面,需要盡量保持解的求解過(guò)程的穩(wěn)定性,提升解的泛化性與實(shí)際效能;另一方面,需要盡量降低解的計(jì)算復(fù)雜度,提升解的收斂速度。由于作戰(zhàn)兵力逐步向模塊化、分布式方向發(fā)展,作戰(zhàn)體系構(gòu)建時(shí)兵力的可組合性指數(shù)增長(zhǎng),使得基于聯(lián)合作戰(zhàn)博弈對(duì)抗訓(xùn)練平臺(tái)進(jìn)行作戰(zhàn)兵力決策空間搜索復(fù)雜度極高,對(duì)當(dāng)前算法、算力帶來(lái)極大挑戰(zhàn)。

      針對(duì)此問(wèn)題,一是通過(guò)多粒度兵力建模、分層建模方法,在聯(lián)合作戰(zhàn)博弈對(duì)抗訓(xùn)練平臺(tái)中構(gòu)建聚合級(jí)兵力模型,降低決策問(wèn)題本身的搜索空間。二是采用更加高效的模型訓(xùn)練算法,如遷移學(xué)習(xí)、課程學(xué)習(xí)等技術(shù),將模型訓(xùn)練問(wèn)題分解為由易到難多階段任務(wù),逐步學(xué)習(xí),提高決策空間搜索的收斂速度。

      3.3 如何確保機(jī)器決策結(jié)果的可信賴、可理解

      從軍事倫理角度,軍事問(wèn)題決策要求高可信、高可靠和可解釋,確?;谌斯ぶ悄艿臋C(jī)器決策結(jié)果的可信賴和可理解是需突破的難點(diǎn)問(wèn)題。

      針對(duì)可信問(wèn)題,可構(gòu)建分層決策模型,實(shí)現(xiàn)各層解耦,涵蓋作戰(zhàn)任務(wù)、交戰(zhàn)規(guī)則、裝備能力,通過(guò)分層隔離誤差,構(gòu)建多層次模型體系,涵蓋基礎(chǔ)規(guī)則、交戰(zhàn)規(guī)則、戰(zhàn)斗力計(jì)算、智能決策模型等多個(gè)層級(jí),實(shí)現(xiàn)逐步可信。

      針對(duì)可解釋性問(wèn)題,尤其是基于大數(shù)據(jù)的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)方法黑箱問(wèn)題,可采用“軍事知識(shí)+作戰(zhàn)數(shù)據(jù)”雙重驅(qū)動(dòng)機(jī)制,將知識(shí)嵌入到數(shù)據(jù)驅(qū)動(dòng)的模型中,提升深度學(xué)習(xí)等新方法的可解釋性。

      針對(duì)可靠性問(wèn)題,利用主動(dòng)學(xué)習(xí)等人機(jī)交互式學(xué)習(xí)方法,通過(guò)人在環(huán)路干預(yù),為模型訓(xùn)練增強(qiáng)引導(dǎo)信息,實(shí)現(xiàn)人機(jī)共生的作戰(zhàn)決策新范式。

      4 技術(shù)體系

      圍繞人機(jī)共生智能決策關(guān)鍵問(wèn)題以及解決思路,從人機(jī)交互與理解、智能作戰(zhàn)決策、模型可信賴可解釋增強(qiáng)等方面,提出關(guān)鍵技術(shù)體系,如表1 所示。并圍繞作戰(zhàn)決心/指令機(jī)器理解、作戰(zhàn)兵力狀態(tài)表示、基于課程學(xué)習(xí)的作戰(zhàn)決策模型訓(xùn)練加速、基于聯(lián)賽機(jī)制的作戰(zhàn)決策模型多樣性保持策略等技術(shù)進(jìn)行詳細(xì)分析。

      表1 技術(shù)體系

      4.1 作戰(zhàn)決心機(jī)器理解技術(shù)

      指揮員作戰(zhàn)決心是動(dòng)態(tài)變化的,系統(tǒng)需要能夠?qū)⑵鋭?dòng)態(tài)、準(zhǔn)確、完整地轉(zhuǎn)換成機(jī)器智能學(xué)習(xí)訓(xùn)練的優(yōu)化目標(biāo)和約束條件。

      鑒于此,基于各類作戰(zhàn)方案,構(gòu)建聯(lián)合作戰(zhàn)任務(wù)清單,定位作戰(zhàn)任務(wù)框架、關(guān)聯(lián)關(guān)系,并利用自然語(yǔ)言處理技術(shù)對(duì)指揮員決心進(jìn)行識(shí)別分類和關(guān)鍵要素(槽位信息)提取,確定作戰(zhàn)任務(wù)類型、關(guān)聯(lián)子任務(wù),以及任務(wù)關(guān)鍵要素,即為打擊目標(biāo)清單及毀傷效果要求,明確各子任務(wù)主要內(nèi)容與序列關(guān)系;利用模糊綜合評(píng)判方法、知識(shí)圖譜技術(shù),對(duì)識(shí)別確定的任務(wù)及其關(guān)鍵要素進(jìn)行量化完善,確定優(yōu)化目標(biāo)和約束條件,如作戰(zhàn)初始態(tài)勢(shì)、終極態(tài)勢(shì)、邊界條件、兵力規(guī)模等,形成機(jī)器可以理解的語(yǔ)言表示,支撐機(jī)器智能模型訓(xùn)練,具體技術(shù)路線如圖3 所示。

      圖3 作戰(zhàn)決心/指令機(jī)器理解

      4.2 作戰(zhàn)兵力狀態(tài)表示學(xué)習(xí)技術(shù)

      由于作戰(zhàn)對(duì)抗的動(dòng)態(tài)性,作戰(zhàn)兵力之間會(huì)存在復(fù)雜的合作關(guān)系,一般采用分層強(qiáng)化學(xué)習(xí)進(jìn)行模型學(xué)習(xí),進(jìn)而降低模型訓(xùn)練的計(jì)算復(fù)雜度[24]。其中,在分層強(qiáng)化學(xué)習(xí)模型中,針對(duì)低層次作戰(zhàn)兵力狀態(tài)表示,如何最大化利用鄰域信息是一個(gè)值得研究難題,對(duì)作戰(zhàn)兵力策略實(shí)際運(yùn)行效能具有重要影響。

      基于此,考慮利用圖模型、注意力技術(shù),對(duì)各作戰(zhàn)兵力間交互關(guān)系進(jìn)行建模,基于神經(jīng)網(wǎng)絡(luò)的注意力機(jī)制進(jìn)行特征自動(dòng)聚合和選擇,能夠自動(dòng)選擇并聚合有助于決策的關(guān)鍵信息,將所選特征匯集,得到智能體的狀態(tài)表示,在傳統(tǒng)兵力狀態(tài)表示基礎(chǔ)上,強(qiáng)化對(duì)兵力間交互信息的表達(dá)水平,可以更深度地挖掘作戰(zhàn)兵力使用的實(shí)際環(huán)境信息,從而學(xué)習(xí)出更加高效的決策策略,具體作戰(zhàn)兵力狀態(tài)表示學(xué)習(xí)[25]如圖4 所示。

      圖4 作戰(zhàn)兵力狀態(tài)表示學(xué)習(xí)

      4.3 基于聯(lián)賽機(jī)制的作戰(zhàn)決策模型多樣性保持策略

      聯(lián)合作戰(zhàn)任務(wù)具有多樣化、高動(dòng)態(tài)復(fù)雜場(chǎng)景特點(diǎn),對(duì)智能決策模型泛化性提出很高要求。

      基于此,研究多樣化對(duì)手池(各種風(fēng)格)及價(jià)值回報(bào)的設(shè)計(jì)和構(gòu)建方法,并基于種群進(jìn)化思想不斷迭代優(yōu)化決策模型[3],直到模型效果穩(wěn)定,以提升模型對(duì)不同作戰(zhàn)場(chǎng)景、不同作戰(zhàn)對(duì)手的適應(yīng)性。

      1)基于聯(lián)合作戰(zhàn)場(chǎng)景的價(jià)值回報(bào)函數(shù)設(shè)計(jì)

      結(jié)合聯(lián)合作戰(zhàn)場(chǎng)景,借鑒人類指揮員經(jīng)驗(yàn),研究?jī)r(jià)值回報(bào)函數(shù)設(shè)計(jì)方法,使生成的決策方案能夠逼近作戰(zhàn)實(shí)際,并保持種群的多樣性。

      2)異構(gòu)種群持續(xù)對(duì)抗方法

      研究異構(gòu)種群持續(xù)對(duì)抗方法、種群更新迭代方法,保證智能模型的多樣性同時(shí),能夠有效提高決策模型的泛化能力,進(jìn)而提升作戰(zhàn)決策對(duì)不同作戰(zhàn)場(chǎng)景、不同作戰(zhàn)對(duì)手的適應(yīng)性。

      4.4 基于課程學(xué)習(xí)的作戰(zhàn)決策模型訓(xùn)練加速技術(shù)

      分布式模塊化作戰(zhàn)兵力廣泛運(yùn)用極大提升了決策空間搜索復(fù)雜度,使得模型訓(xùn)練難度大、收斂速度慢。

      因此,可考慮使用課程學(xué)習(xí)、遷移學(xué)習(xí)技術(shù),按照?qǐng)?zhí)行任務(wù)、對(duì)手等級(jí)、運(yùn)行環(huán)境等由簡(jiǎn)(低)到繁(高)設(shè)計(jì)的思路,研究如何面向聯(lián)合作戰(zhàn)任務(wù)進(jìn)行多階段[25]、難度遞增的課程設(shè)計(jì)方法[26-27],模型逐步訓(xùn)練,提升模型訓(xùn)練效率。如圖5 所示,首先對(duì)簡(jiǎn)單任務(wù)進(jìn)行學(xué)習(xí),如紅軍僅使用地面防空武器摧毀藍(lán)軍指揮所。然后進(jìn)一步加大任務(wù)難度,如紅軍使用多武器協(xié)同,摧毀藍(lán)方指揮所;在經(jīng)過(guò)逐步學(xué)習(xí)后,最終使用全部武器協(xié)同摧毀藍(lán)軍多個(gè)指揮所及全部兵力。

      圖5 基于課程學(xué)習(xí)的作戰(zhàn)決策模型訓(xùn)練加速

      5 結(jié)論

      人機(jī)共生作戰(zhàn)決策采用高效、可靠的新型人機(jī)交互手段,打造人機(jī)協(xié)作的作戰(zhàn)決策空間,一方面充分發(fā)揮機(jī)器強(qiáng)大計(jì)算搜索能力優(yōu)勢(shì),有效降低指揮員指揮載荷,另一方面,通過(guò)博弈對(duì)抗訓(xùn)練創(chuàng)新戰(zhàn)法,采用人在環(huán)路的交互式學(xué)習(xí)機(jī)制保證決策可信,人機(jī)共生決策將成為作戰(zhàn)決策系統(tǒng)的重要發(fā)展方向。本文提出了人機(jī)共生作戰(zhàn)決策系統(tǒng)運(yùn)行概念和總體架構(gòu),分析其關(guān)鍵問(wèn)題和解決思路,并提出了作戰(zhàn)決心機(jī)器理解、作戰(zhàn)兵力狀態(tài)表示、作戰(zhàn)決策模型高效訓(xùn)練等關(guān)鍵技術(shù)及其實(shí)現(xiàn)路線,能夠?yàn)樾乱淮鲬?zhàn)決策系統(tǒng)、智能指揮控制系統(tǒng)等發(fā)展提供借鑒參考。

      猜你喜歡
      兵力指揮員人機(jī)
      人機(jī)“翻譯員”
      從內(nèi)到外,看懂無(wú)人機(jī)
      南都周刊(2021年3期)2021-04-22 16:43:49
      “人機(jī)大戰(zhàn)”人類智慧遭遇強(qiáng)敵
      海外星云(2016年7期)2016-12-01 04:17:50
      未來(lái)深空探測(cè)中的人機(jī)聯(lián)合探測(cè)
      太空探索(2016年5期)2016-07-12 15:17:58
      中央紅軍長(zhǎng)征初期兵力損失考
      軍事歷史(2004年5期)2004-08-21 06:29:10
      官渡之戰(zhàn)中曹軍兵力考
      軍事歷史(2000年6期)2000-08-16 02:13:26
      從兩廣作戰(zhàn)看戰(zhàn)區(qū)、戰(zhàn)役指揮員的意見分歧與統(tǒng)一
      軍事歷史(1993年3期)1993-08-21 06:16:08
      百團(tuán)大戰(zhàn)參戰(zhàn)兵力究竟有多少?——與袁旭商榷
      軍事歷史(1992年5期)1992-08-15 06:23:36
      智勇兼優(yōu)的高級(jí)指揮員皮定均
      軍事歷史(1986年3期)1986-08-21 02:21:10
      日軍向中國(guó)投降之兵力及分布概況
      軍事歷史(1986年4期)1986-01-18 09:47:18
      荣昌县| 夏邑县| 都江堰市| 镇巴县| 化州市| 康保县| 海口市| 汉沽区| 涿州市| 沾化县| 望奎县| 武汉市| 利川市| 佛学| 道孚县| 洛川县| 江门市| 保亭| 阳泉市| 伊金霍洛旗| 区。| 福建省| 精河县| 乳源| 克拉玛依市| 山东| 虞城县| 龙海市| 青海省| 故城县| 廊坊市| 万安县| 阳西县| 根河市| 迁西县| 邹城市| 东山县| 无极县| 石门县| 建阳市| 抚远县|