• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      Agent視域下的人工智能賦能作戰(zhàn)系統

      2024-12-03 00:00:00劉偉謝海斌陳少飛
      指揮控制與仿真 2024年6期

      摘 要:針對作戰(zhàn)系統的智能化設計問題,提出了基于Agent的人工智能技術概念框架和應用方法。首先,闡述了Agent概念,討論了在作戰(zhàn)系統中研究Agent的重要意義。然后,介紹了基于Agent的人工智能研究框架,列舉了Agent在作戰(zhàn)系統中的多種應用方式。最后,分析了Agent技術發(fā)展趨勢及其作戰(zhàn)應用可能面臨的風險與挑戰(zhàn)。

      關鍵詞:人工智能;Agent;作戰(zhàn)系統;研究框架;大語言模型

      中圖分類號:E91;TP18 文獻標志碼:A DOI:10.3969/j.issn.1673-3819.2024.06.002

      Artificial intelligence empowered combat systems from the perspective of Agent

      LIU Wei, XIE Haibin, CHEN Shaofei

      (College of Intelligence Science and Technology, National University of Defense Technology, Changsha 410073, China)

      Abstract:Aiming at the intelligent design of combat systems, we propose a conceptual framework and application methods of Agent based on artificial intelligence technology. First, we analyze the concept of Agent and discuss the important significance of studying Agent in the combat system. Then, we introduce the research framework of artificial intelligence based on Agent, and multiple application methods of Agent in combat systems. Finally, we analyze the development trends of Agent technology and the risks and challenges that its combat applications may face.

      Key words:artificial intelligence; Agent; combat system; research framework; large language model

      收稿日期:2024-07-17修回日期:2024-09-28

      *基金項目: 國家自然科學基金項目(61722313,62376280)

      作者簡介:劉 偉(1979—),女,博士,副教授,研究方向為人工智能。

      謝海斌(1977—),男,博士,教授。

      作戰(zhàn)系統是指為實現特定作戰(zhàn)目標而設計的技術系統和組織結構的總和,包括情報采集、目標識別、威脅判斷、任務規(guī)劃和戰(zhàn)術執(zhí)行等功能模塊。現代戰(zhàn)爭具有作戰(zhàn)要素復雜、多域交叉融合、一體化聯合作戰(zhàn)的特點,要求部隊具備高度適應性和快速反應能力,武器裝備應具有強機動性和協作性特點,作戰(zhàn)系統整體亟待智能化升級。人工智能技術可增強作戰(zhàn)系統的態(tài)勢感知能力[1]、指揮控制能力[2]、決策效率[3]以及軍事行動的精準度和快速響應能力,但是如何在統一框架下進行作戰(zhàn)系統的一體化智能設計和升級改造仍是一個待研究的重要課題。

      本文提出了基于Agent的作戰(zhàn)系統人工智能技術框架和應用方法,通過將多域、多維作戰(zhàn)空間的實體要素納入統一的研究框架,探討了Agent在作戰(zhàn)系統中的應用方式,從而為作戰(zhàn)系統賦予自主性、反應性和適應性等關鍵特性,增強作戰(zhàn)系統自主能力,促進多Agent協作,提高復雜環(huán)境適應能力。

      1 Agent概念與內涵

      1.1 Agent基本概念

      一般認為,Agent是能夠通過傳感器感知環(huán)境,并且通過執(zhí)行器對環(huán)境產生影響的任何事物[4]。Agent概念具有強包容性,能夠將所有對環(huán)境進行感知和施加影響的個體包容到統一的框架下研究,無論是生命體還是人造物。作戰(zhàn)系統涉及多樣化的平臺和要素,如人類戰(zhàn)士、無人作戰(zhàn)裝備、智能軟件等,它們都可以被囊括到Agent范疇內進行設計和分析。

      多Agent系統由多個Agent組成,通過交互來解決超出個體能力或知識范圍的問題?,F代戰(zhàn)爭涉及多域作戰(zhàn),需要多兵種協同、有人與無人協同、實體與虛擬空間作戰(zhàn)能力相結合。多Agent系統為研究解決作戰(zhàn)行動中的分布式問題提供了概念框架,可基于Agent交互實現分布異構實體間的有效組織、通信和協作。

      1.2 研究Agent的意義

      在作戰(zhàn)系統中,研究Agent的意義主要體現在以下方面。

      1)利用Agent的自主性和智能性,提高作戰(zhàn)決策質量和行動速度?;贏gent統一設計作戰(zhàn)系統,可使各功能模塊間具有良好的兼容性和可擴展性,提升高強度對抗環(huán)境下的情報分析、態(tài)勢感知、規(guī)劃決策和行動執(zhí)行能力。

      2)Agent內部處理機制具有多樣性,可為作戰(zhàn)功能模塊提供技術選擇的靈活性。Agent強調智能的外在表現,可根據任務環(huán)境屬性選擇適合的人工智能技術,不局限于仿人理性思維或仿神經系統信息處理。

      3)通過不斷學習和適應,Agent能夠更好地應對復雜戰(zhàn)場環(huán)境。Agent不斷感知環(huán)境并對環(huán)境施加作用,根據交互體驗修正內建環(huán)境模型,改善感知與行動之間的映射關系。Agent憑借學習與進化能力,可打破其預設的能力界限,適應動態(tài)、不確定的開放環(huán)境。

      2 基于Agent的建模方法研究現狀

      基于Agent的建模是目前解決作戰(zhàn)復雜適應系統建模仿真最有效的方法之一。作戰(zhàn)Agent是各類作戰(zhàn)實體(層次、粒度可能不同)在仿真系統中的映射,也是基于Agent建模仿真的核心要素。Agent體系結構是從規(guī)約到實現這一中間步驟的表示,涉及系統結構選擇和框架設計、模塊分解與關系確定以及感知與行動機制建模等多個方面[5]。

      隨著基于Agent的建模方法在實際建模仿真中的應用,面向Agent的軟件工程概念應運而生,先后提出了基于知識工程的方法、基于對象技術的方法、基于角色和組織模型的方法等面向Agent的軟件工程方法學[6-7]。但是,在實際應用中發(fā)現,計算機仿真工程技術人員建立的仿真模型與軍事人員建立的軍事概念模型之間往往存在不一致性,需要經過反復的迭代修正,才能滿足軍事需求。因此,研究人員提出了用軍事概念模型直接驅動多Agent作戰(zhàn)仿真模型的建模方法,在保證仿真可信性的前提下,提高工程開發(fā)效率[8]。

      研究戰(zhàn)爭這類復雜系統對于動態(tài)環(huán)境的適應性,需要借助基于多Agent建模仿真方法?;诙郃gent作戰(zhàn)建模仿真是利用Agent對作戰(zhàn)復雜系統中各個實體構建模型,通過對作戰(zhàn)Agent個體及相互之間(包括與作戰(zhàn)環(huán)境)的行為刻畫,描述作戰(zhàn)復雜系統的宏觀行為。相對于傳統面向過程和面向對象的仿真技術,基于多Agent仿真方法對復雜系統的行為具有更強的建模與仿真能力、更高的抽象性和表達能力、更強的仿真動態(tài)性和靈活性,實現了微觀行為和宏觀行為的有機結合,是研究作戰(zhàn)復雜系統的重要手段[9]。

      在多Agent仿真中,人們重視Agent適應性對作戰(zhàn)仿真過程及其結果的影響,取得了豐碩的研究成果。如王步云等梳理了遺傳算法、強化學習、神經網絡等方法在實現作戰(zhàn)Agent適應性方面的成果[10];石鼎等從均衡決策的角度提出強化學習驅動的多Agent協同作戰(zhàn)仿真算法[11]。但是現有的研究往往只實現某一方Agent的適應性,作為對抗中的另一方仍然采用固定規(guī)則的決策模式。在仿真中如何實現紅藍雙方的同時學習、學習過程是否能夠收斂、對作戰(zhàn)仿真結果有何影響,都是有待深入研究的問題。由于作戰(zhàn)任務更加復雜,作戰(zhàn)系統組成更加多樣,有必要研究構建能夠涵蓋多種作戰(zhàn)實體類型、適應復雜多變環(huán)境的新型作戰(zhàn)體系。

      3 基于Agent的作戰(zhàn)系統智能化研究框架

      基于Agent概念,可涵蓋人工智能主要分支建立統一研究框架(圖1)。單體Agent智能涉及感知智能、認知智能和行動智能。感知智能為Agent提供數據獲取能力,是認知智能的基礎。認知智能使用感知數據進行分析和決策,是行動智能的前提。行動智能實施認知智能做出的決策,將思考轉化為行動。群體智能是由多個簡單個體間通過協作表現出的智能行為,可與上述三種智能相結合,提高系統的整體效能?;旌现悄苷喜煌闹悄茴愋停詫崿F復雜任務并適應多變環(huán)境。該研究框架有望為作戰(zhàn)系統的一體化智能設計提供新范式。

      3.1 感知智能

      感知智能是指機器通過傳感器對所處環(huán)境進行信息獲取,經信息處理和理解建立環(huán)境模型來表達所處環(huán)境信息的能力。感知數據處理是情報分析和態(tài)勢感知的關鍵組成部分。圖像情報分析中,對物體目標的識別、地形圖像的拼接以及人物目標的檢測是目標信息獲取、數據融合、目標關聯、態(tài)勢感知、目標引導等高層次情報分析的基礎。電子戰(zhàn)和情報收集中,語音識別技術可自動解析截獲的通信內容,處理

      多變性

      信號和噪聲干擾,適應不同通信環(huán)境并解析通信內容和意圖,為決策提供支持,還可以依托文本處理技術產生準確、規(guī)范的文本處理產品,為情報分析提供技術支持。

      3.2 認知智能

      認知智能是基于感知信息及已有的經驗和知識進行判斷、推理、學習、規(guī)劃并形成決策,類似于人類的分析、思考、理解和判斷等能力。在作戰(zhàn)系統中,知識庫和推理的結合為分析復雜數據提供了有力工具,可提高決策質量、速度和適應性。問題求解可用于輔助作戰(zhàn)決策、戰(zhàn)場模擬、戰(zhàn)略規(guī)劃以及無人系統的任務分配和路徑規(guī)劃。智能規(guī)劃與決策是無人機、無人車等自主系統以及模擬仿真、作戰(zhàn)任務規(guī)劃等軟件系統的核心技術。機器學習通過提升數據分析效率,增強威脅評估能力,優(yōu)化戰(zhàn)場態(tài)勢感知以及改進作戰(zhàn)策略,提高作戰(zhàn)效率、預警能力和決策精準度。

      3.3 行動智能

      行動智能是機器將決策轉化為實際行動的能力,包括智能控制和機器人運動控制等。行動智能的實現依賴于多種控制理論技術的綜合應用,利用人工智能技術提升自主性,在各種環(huán)境中進行智能響應和操作。在作戰(zhàn)系統中,智能控制利用先進的計算方法來優(yōu)化和自動化武器系統的操作,使其能夠在復雜環(huán)境中執(zhí)行偵察、監(jiān)視、目標定位和打擊任務。運動控制技術集感知、決策和行動于一體,包括單體運動控制和群體運動控制,主要應用于機器人和無人系統。

      3.4 群體智能

      群體智能體現在通過群體協作,聚合數量眾多的單體智能,實現復雜的智能行為。多Agent有助于克服單Agent的局限性,實現多流程并行處理,提高系統運行可靠性。在作戰(zhàn)仿真中,多Agent系統可用于模擬多方力量的交互和協作,以及網絡中心戰(zhàn)等應用場景,幫助指揮員理解和預測可能的行動結果,還可以通過將軍事對抗轉化為博弈問題,利用人工智能技術解決意圖判斷、威脅評估與指揮控制等問題,提高決策水平。

      3.5 混合智能

      混合智能是以生物智能和機器智能的深度融合為目標,通過連接通道,建立兼具生物的環(huán)境感知、記憶、推理、學習能力,以及機器的信息整合、搜索、計算能力的高性能智能形態(tài)。在作戰(zhàn)系統中,人機交互技術的發(fā)展使得人能夠自然、高效地與機器交流和協作,增強人機互動效率和效果。目前,無人系統在復雜動態(tài)環(huán)境下完全自主運行仍存在很大挑戰(zhàn),要遵循“平臺無人、系統有人”的特點,通過人與無人系統之間的智能交互和協同控制,實現人在回路的環(huán)境感知、態(tài)勢判斷、任務規(guī)劃、決策、行動等能力[12]。

      4 Agent在作戰(zhàn)系統中的應用方式

      Agent的常見應用模式包括:反思,Agent通過交互學習和反思來優(yōu)化決策;工具使用,Agent通過調用多種工具來完成任務,這些工具可以是軟件應用程序、算法、硬件設備或其他能幫助Agent實現其目標的資源;規(guī)劃,Agent規(guī)劃出一系列行動步驟來達到目標;多Agent協作,涉及多Agent之間的交互與協同。本文以此為基礎,結合作戰(zhàn)任務需求,構建基于反思的單體Agent、基于規(guī)劃的作戰(zhàn)任務規(guī)劃Agent、基于仿真的平行推演Agent以及基于協作的多Agent系統等。

      4.1 基于反思的單體Agent

      現代戰(zhàn)場上,戰(zhàn)爭“迷霧”是由于大量信息無法得到快速處理和理解造成的。Agent技術

      高效處理海量數據,實現精準態(tài)勢認知,為決策和行動提供依據。

      以態(tài)勢認知為例,單體Agent內部包含配置、記憶、認知和行動等基本模塊。配置模塊定義Agent的基本特征和屬性,如身份、角色、能力等。記憶模塊負責存儲Agent的歷史信息和經驗,包括過去的狀態(tài)、行為和環(huán)境反饋。認知模塊中,Agent根據其目標、當前狀態(tài)以及環(huán)境信息,形成綜合認知結果。行動模塊基于實時態(tài)勢和預測分析,提供作戰(zhàn)建議和優(yōu)化策略。此外,Agent還可能包含通信、多傳感器融合、效果評估等組件,以提高其在復雜環(huán)境中的有效性和適應性。

      反思和自省對提升Agent性能具有關鍵作用。Agent對既往行為進行反思,從錯誤中學習,完善認知過程,可提高結果質量。反思過程中,系統評估當前的行為產出,比較當前輸出與期望結果的差距,識別其中的問題或不足之處。在自省過程中,基于反思識別的問題,調整其態(tài)勢認知過程或行為策略,必要時發(fā)展全新的策略或方法。

      Agent

      通過不斷自我評估和調整,使系統能夠學習并改進認知過程,更有效應對復雜問題。

      4.2 基于規(guī)劃的作戰(zhàn)任務規(guī)劃Agent與基于仿真的平行推演Agent

      將Agent應用于作戰(zhàn)任務規(guī)劃與仿真,可對戰(zhàn)場環(huán)境中的作戰(zhàn)實體進行精確描述,為實際作戰(zhàn)提供理論依據和策略支持。圖2為基于Agent的作戰(zhàn)任務規(guī)劃與平行推演框架。

      作戰(zhàn)任務規(guī)劃Agent通過智能傳感器網絡獲取多模態(tài)感知信息,在內部規(guī)劃系統中根據給定的作戰(zhàn)目標分解復雜任務,制定具體作戰(zhàn)計劃,基于作戰(zhàn)決策給集群作戰(zhàn)單元下達作戰(zhàn)指令。智能傳感器網絡由大量傳感器節(jié)點組成,單個節(jié)點具有環(huán)境信息采集和數據處理功能,可在調度下進行主動環(huán)境感知和通信。作戰(zhàn)任務規(guī)劃Agent專注于制定計劃和提供決策支持,利用規(guī)劃能力確定最佳行動方案。集群作戰(zhàn)單元通過協作共同完成任務,為規(guī)劃系統提供行動反饋。

      平行推演Agent側重于模擬不同的未來情景來優(yōu)化決策,通過創(chuàng)建可能的未來情境來測試計劃的有效性,幫助決策者理解潛在的結果和風險。平行推演Agent接收并處理實時數據,動態(tài)生成仿真實體,并根據實時數據進行修正,以適應環(huán)境變化。通過對作戰(zhàn)計劃的分析預測,提供對未來發(fā)展的深入見解,為決策提供支持。

      4.3 基于協作的多Agent系統

      針對聯合作戰(zhàn)等復雜任務,情報分析Agent、態(tài)勢感知Agent、作戰(zhàn)任務規(guī)劃Agent、平行推演Agent以及戰(zhàn)略支援Agent等組成了多Agent系統。多Agent系統具有以下優(yōu)勢:1)數量優(yōu)勢,每個Agent從事特定工作,結合多個Agent的技能優(yōu)勢和領域知識,可提高系統效率和通用性;2)質量優(yōu)勢,多個Agent對同一問題可能產生不同觀點,Agent通過通信并結合自身知識不斷更新觀點,可有效減少虛假信息,提高結果可靠性[13]。

      交互是多Agent協同工作的關鍵,常見的交互方式有合作、競爭、協商、自組織和反饋等。不同Agent可通過角色分配和協調實現復雜任務的有效分工和執(zhí)行。例如,CAMEL探索了溝通式Agent,提出“角色扮演”的社會型多Agent框架[14]。通過觀察其他Agent的行為和結果,Agent學習新的策略和行為模式,提高自身性能。負向反饋可用來抑制某些不希望出現的行為,促進系統穩(wěn)定運行。系統還可以根據任務需求和環(huán)境變化,動態(tài)調整Agent之間的關系和組織結構[15]。

      戰(zhàn)場環(huán)境中,通信可能受干擾,計算資源受限,存在對抗攻擊風險,實時性要求高,對多Agent系統設計提出了高要求[16]。研究者開發(fā)了多種分布式決策算法,如分布式馬爾可夫決策過程、多Agent強化學習等,以實現通信受限環(huán)境下的協同作戰(zhàn)。通過自組織網絡技術,多Agent系統可在通信不穩(wěn)定或中斷時,自動調整通信結構,保持系統整體功能。設計冗余系統和自愈算法可提高系統的抗毀傷能力和自我修復能力。

      4.4 基于Agent的作戰(zhàn)系統應用舉例

      假定戰(zhàn)場地形復雜、

      天氣多變,我方作戰(zhàn)任務是奪取敵方城市中心的指揮中心,同時保護我方關鍵基礎設施,并最小化行動對平民及城市設施的影響。我方裝備了最新的人工智能驅動的作戰(zhàn)系統,包括無人作戰(zhàn)飛機、精確制導武器以及高度自動化的指揮和控制系統。敵方擁有一定數量的傳統武裝力量,包括步兵、坦克、火炮等,主要依賴傳統戰(zhàn)術執(zhí)行防御任務。

      作戰(zhàn)過程包括五個階段。在初始階段,偵察Agent部署裝備有光學、紅外、雷達等多種傳感器的無人機進行全天候偵察,通過數據融合技術實現對敵方部署的實時監(jiān)控。情報分析Agent利用深度學習算法分析收集到的大量數據,快速識別敵方布防漏洞,自動生成攻擊建議。在計劃階段,任務規(guī)劃Agent基于情報分析結果,利用優(yōu)化算法評估不同攻擊路徑和戰(zhàn)術的成功率,自動生成多套作戰(zhàn)方案供指揮官選擇。作戰(zhàn)仿真Agent通過高精度戰(zhàn)場仿真模型,模擬不同作戰(zhàn)方案的執(zhí)行效果,預測戰(zhàn)場變量和潛在風險。在執(zhí)行階段,武器控制Agent指揮無人機群和精確制導武器,實施精準打擊,同時監(jiān)控打擊效果,動態(tài)調整攻擊策略。戰(zhàn)斗執(zhí)行Agent在無人機的支援下,迅速機動我方精銳部隊,利用精確火力摧毀敵方重要目標。在調整階段,情報分析Agent與任務規(guī)劃Agent持續(xù)監(jiān)控戰(zhàn)場態(tài)勢,根據實時情報調整作戰(zhàn)計劃,必要時改變攻擊目標或增援。在結束階段,所有Agent協同作戰(zhàn),確保完全控制敵方指揮中心,同時保護我方重要設施和平民安全。通信管理Agent采用加密通信技術,確保作戰(zhàn)過程中的通信安全和信息傳輸的可靠性。

      在作戰(zhàn)系統內部,對各Agent進行統一的結構設計,為每個Agent設計標準化的輸入/輸出接口,確保它們能夠以統一的方式接收和發(fā)送信息。Agent內包括配置、記憶、認知和行動等模塊,根據不同功能允許內部處理機制的多樣性。制定統一的數據格式和協議,確保在不同Agent之間交換信息的一致性,減少解析上的誤差和延遲。所有Agent都遵循同一套行動協議,規(guī)定在特定情況下的行動策略和響應方式,從而保證各Agent的行為一致和可預測??紤]系統對可靠性和實時性的高要求,設計具有魯棒性的通信結構,確保在任何Agent失效時,系統仍能保持運行。

      5 基于Agent的作戰(zhàn)系統智能化發(fā)展趨勢

      隨著大模型和Agent技術的進步,Agent系統呈現出更復雜、更智能、更協作的發(fā)展趨勢。Agent有望融合大模型的認知能力、具身智能的行動能力和群體智能的協作能力,在作戰(zhàn)系統效能提升中發(fā)揮更大作用。

      5.1 與大模型相結合提升作戰(zhàn)Agent的自主性

      大模型在語言理解、決策制定及泛化能力等方面展現出巨大潛力,為Agent突破帶來了契機[17]。一方面,大模型龐大的訓練集包含了大量人類行為數據,為模擬類人交互奠定了基礎;另一方面,大模型涌現出上下文學習、推理、思維鏈等類人思考能力,可作為Agent的“大腦”,實現復雜問題拆解。Agent允許用戶進行復雜的交互和任務協調,根據給定目標自動創(chuàng)建合適的提示詞,更好地激發(fā)大模型的推理能力。

      如圖3所示,基于大模型的Agent 包括規(guī)劃、記憶與工具調用等模塊[18]。規(guī)劃模塊負責將復雜目標拆解為可執(zhí)行的子任務,并動態(tài)調整執(zhí)行策略,以靈活應對不確定性。任務分解過程基于思維鏈實現,通過明確展示解決問題的邏輯步驟,增強大模型的透明度和可解釋性。工具調用模塊使Agent能夠利用外部工具來執(zhí)行具體任務,如數據庫查詢、科學計算、圖像處理等。工具作為使用者能力的擴展,可在專業(yè)性、事實性、可解釋性等方面提供幫助。記憶模塊在多輪對話中保持上下文,維護Agent的世界知識和既有經驗。

      將大模型與Agent相結合,可提高作戰(zhàn)系統的自主水平和決策速度。大語言模型在情報分析、作戰(zhàn)規(guī)劃、輔助決策等方面展現出應用潛力[19]。2023年4月,美海軍陸戰(zhàn)隊測試了“赫爾墨斯”(Hermes)大語言模型在戰(zhàn)役級作戰(zhàn)規(guī)劃方面的能力。5月,美陸軍在機密網部署生成式人工智能系統“多諾萬”(Donovan),用于快速情報分析和決策支持。7月,美空軍在“全球信息優(yōu)勢”實驗中測試了5種生成式大模型,以提高獲取和處理作戰(zhàn)信息的速度。2023年7月,淵亭科技發(fā)布國內首個軍事領域大模型“天機·軍事”,融合知識圖譜、強化學習、運籌優(yōu)化等技術,服務于作戰(zhàn)指揮、無人集群協同、策略仿真等應用場景。

      基于大語言模型的Agent可用來模擬歷史戰(zhàn)爭和未來沖突場景,幫助分析和預測戰(zhàn)爭的各種可能性。例如,Hua等提出基于大語言模型的多Agent系統WarAgent,模擬了多次歷史國際沖突[20]。盡管大模型無法完全再現人類行為的復雜性,但其展現了在復雜情境重現、動態(tài)假設場景模擬、外交政策決策計算等方面的潛力。

      5.2 與虛實環(huán)境交互學習的作戰(zhàn)Agent實現自主進化

      近年來,元宇宙概念下的眾多新技術,包括增強現實(Augmented Reality,AR)、虛擬現實(Virtual Reality,VR)、頭顯、3D建模及人工智能虛擬環(huán)境,在軍事領域得到廣泛應用[21]。Agent可作為元宇宙中的智能助手,通過模擬實驗對軍事行動和武器裝備性能進行預測、優(yōu)化和評估,或作為虛擬世界的參與者,與人類進行交互和協作。

      在沙盒模型等虛擬環(huán)境中的自由探索,為Agent學習提供了足夠的交互數據和試錯機會。AutoGPT、MetaGPT、CAMEL、GPT Engineer等應用實例展現出了令人矚目的多樣性和強大性能。只需要提供要扮演的角色、描述和目標,AutoGPT就能利用GPT-4和搜索等工具,自主分解任務、執(zhí)行操作并完成任務。2023年5月,英偉達AI Agent Voyager接入GPT-4,通過自主編寫代碼,完全獨霸了《我的世界》,在游戲中進行全場景的終身學習。商湯、清華等共同提出了通才AI Agent GITM[22],能夠通過自主學習完成任務,表現優(yōu)異。

      Agent也展現了在物理世界中進行多模態(tài)理解和學習的能力[23]。針對具身智能的研究關注Agent在物理世界中有效操作的能力,以及與人類在共享空間中的安全交互,主要方法是從演示或反饋中學習,讓Agent在使用工具方面具備泛化能力。通過持續(xù)學習和強化學習,Agent在與環(huán)境交互中自我迭代和升級,自主規(guī)劃任務、開發(fā)代碼、調動工具、優(yōu)化路徑,從而實現目標。未來,Agent可能會自給自足地制造工具,從而提高其自主性和獨立性。

      5.3 作戰(zhàn)Agent實際應用面臨嚴格的風險評估

      作戰(zhàn)Agent應用于自主決策和人機協作等方面,這可能引發(fā)安全、倫理及法律問題,包括如何確保Agent的行為符合人類價值觀,如何避免其被誤用甚至濫用,如何防止泄密和保證數據安全。Agent應用風險包括:1)本體性風險,即Agent可能超出人類的控制范圍;2)能動性風險,即Agent可能在沒有人類指令的情況下采取行動;3)意外性風險,即系統故障可能導致的意外傷害。

      Agent技術成熟度仍有待提高。通常Agent只能在特定領域內有效工作,對難以表征或遷移的角色,需要通過針對性地模型微調來提高性能。面對可能的對抗性攻擊,Agent設計需要足夠魯棒,以防微小變化導致可靠性問題。作戰(zhàn)Agent需要具有非常強的適應性和可解釋性,以通過嚴格的測試和監(jiān)管。目前,Agent性能評估缺乏統一標準,不同Agent系統間難以比較優(yōu)劣?;谏鲜鲈?,Agent在作戰(zhàn)系統中的大多數應用將增強而非取代人類的作用。

      6 結束語

      隨著戰(zhàn)爭的復雜性、對抗性和實時性加劇,預期Agent技術將在作戰(zhàn)系統優(yōu)化中發(fā)揮關鍵作用。通過將Agent技術集成到作戰(zhàn)系統的各個環(huán)節(jié),可實現快速目標識別、威脅評估和戰(zhàn)術執(zhí)行,使軍事行動更加高效和準確。隨著大語言模型的發(fā)展,Agent在理解和生成自然語言方面的能力不斷提升,人機協同將更加自然高效。但是,Agent在作戰(zhàn)系統中的應用仍面臨諸多困難和挑戰(zhàn)。面對資源受限的開放環(huán)境,Agent的數據分析和推理是不充分的。需要引入先驗知識并使用驗證工具,彌補數據統計分析的不足。同時,需要在技術、道德、法律等方面對Agent系統進行協調和管控,以保證其在軍事領域的應用安全、可靠、合法、有效。

      參考文獻:

      [1] 孫怡峰,廖樹范,吳疆,等.基于大模型的態(tài)勢認知智能體[J].指揮控制與仿真,2024,46(2):1-7.

      SUN Y F, LIAO S F, WU J, et al. Research on situation awareness Agent based on large models[J]. Command Control & Simulation, 2024, 46(2): 1-7.

      [2] 李耀宇,金帥,馬滿好,等.無人空戰(zhàn)指控建模仿真方法研究[J].指揮控制與仿真,2024,46(1):85-92.

      LI Y Y, JIN S, MA M H, et al. Unmanned air combat oriented command and control simulation evaluation research[J]. Command Control &Simulation, 2024, 46(1): 85-92.

      [3] 許霄,李東,郭圣明,等. 面向聯合作戰(zhàn)兵棋推演的智能決策建??蚣埽跩]. 指揮與控制學報, 2023, 9(4): 449-456.

      XU X, LI D, GUO S M, et al. An intelligent decision-making modeling architecture for joint operation-oriented wargaming[J]. Journal of Command and Control, 2023, 9(4): 449-456.

      [4] 斯圖爾特·羅素, 皮特·諾威格. 人工智能——一種現代的方法[M].3版. 殷建平, 祝恩, 劉越, 等譯. 北京: 清華大學出版社, 2013.

      RUSSELL S, NORVIG P. Artificial intelligence: a modern approach[M]. 3rd ed. Beijing: Tsinghua University Press, 2013.

      [5] 劉永紅, 薛青, 曹波偉, 等. 基于指令機制的作戰(zhàn)Agent體系結構研究[J]. 計算機仿真, 2011(z1): 120-123.

      LIU Y H, XUE Q, CAO B W, et al. Research on the architecture of combat agents based on command mechanism[J]. Computer Simulation, 2011(z1): 120-123.

      [6] CERNUZZI L, ZAMBONELLI F. Improving comparative analysis for the evaluation of AOSE methodologies[J]. International Journal of Agent-oriented Software Engineering, 201l, 4(4): 331-352.

      [7] DAM H K, WNIKOFF M. Towards a next-generation AOSE methodology[J]. Science of Computer Programming, 2013, 78(6): 684-694.

      [8] 蒲瑋,李雄. 基于Agent行動圖的作戰(zhàn)建模方法[J]. 系統工程與電子技術, 2017, 39(4): 795-805.

      PU W, LI X. Research on warfare modeling method based on Agent action diagrams[J]. Journal of Systems Engineering and Electronics, 2017, 39(4): 795-805.

      [9] 胡曉峰, 司光亞. 戰(zhàn)爭復雜系統建模與仿真[M]. 北京: 國防大學出版社, 2006: 3.

      HU X F, SI G Y. Modeling and simulation of complex warfare systems[M]. Beijing: National Defense University Press, 2006: 3.

      [10]王步云,劉聚. 作戰(zhàn)Agent的學習算法研究進展與發(fā)展趨勢[J]. 兵工自動化, 2023, 42(9): 74-78,96.

      WANG B Y, LIU J. Research progress and development trend on learning algorithm of combat Agent[J]. Ordnance Industry Automation, 2023, 42(9): 74-78,96.

      [11]石鼎, 燕雪峰, 宮麗娜, 等. 強化學習驅動的海戰(zhàn)場多智能體協同作戰(zhàn)仿真算法[J]. 系統仿真學報, 2023, 35(4): 786-796.

      SHI D, YAN X F, GONG L, et al. Multi-agent cooperative combat simulation in naval battlefield with reinforcement learning[J]. Journal of System Simulation, 2023, 35(4): 786-796.

      [12]牛軼峰, 王菖, 冷新宇, 等. 自主無人系統及應用中的問題[M]. 北京: 科學出版社, 2024.

      NIU Y F, WANG C, LENG X Y, et al. Issues in autonomous unmanned systems and applications[M]. Beijing: Science Press, 2024.

      [13]張奇,桂韜,鄭銳,等. 大規(guī)模語言模型——從理論到實踐[M]. 北京: 電子工業(yè)出版社, 2024.

      ZHANG Q, GUI T, ZHENG R, et al. Large-scale language models: from theory to practice[M]. Beijing: Publishing House of Electronics Industry, 2024.

      [14]Guohao Li, Hasan Abed Al Kader Hammoud, Hani Itani, et al. Camel: communicative agents for "mind" exploration of large scale language model society[J]. 2023, arXiv preprint arXiv: 2303.17760.

      [15]Zijun L, Yanzhe Z, Peng L, et al. Dynamic LLM-Agent network: an llm-agent collaboration framework with Agent team optimization[J]. 2023, arXiv preprint arXiv: 2310.02170.

      [16]張堃,華帥,袁斌林,等. 基于Multi-Agent的無人機集群體系自主作戰(zhàn)系統設計[J]. 系統工程與電子技術, 2024, 46(4): 1 273-1 286.

      ZHANG K, HUA S, YUAN B L, et al. Design of autonomous combat system of unmanned cluster system based on Multi-Agent[J]. Systems Engineering and Electronics, 2024, 46(4): 1 273-1 286.

      [17]Masterman T, et al. The landscape of emerging AI Agent architectures for reasoning, planning, and tool calling: a survey[EB/OL]. 2024. arXiv: 2404.11584.

      [18]Xi Z, Chen W, Guo X, et al. The rise and potential of large language model based agents: A survey[EB/OL]. 2023, arXiv preprint arXiv: 2309.07864.

      [19]王立盟. 2023年國外軍事人工智能領域科技發(fā)展綜述[J]. 戰(zhàn)術導彈技術, 2024 (2): 17-26.

      WANG L M. An overview of science and technology development of foreign artificial intelligence in the military in 2023[J]. Tactical Missile Technology, 2024 (2): 17-26.

      [20]Hua W, Fan L, Li L, et al. lP17pj3ZJHSfgpnOjM006Q==War and peace (warAgent): large language model-based multi-agent simulation of world wars[EB/OL]. 2023, arXiv preprint arXiv: 2311.17227.

      [21]張昭,郭玉杰,趙曉寧,等. 軍事元宇宙芻議與展望[J]. 系統仿真學報, 2023, 35(7): 1 421-1 437.

      ZHANG Z, GUO Y J, ZHAO X M, et al. Military metaverse: key technologies, potential applications and future directions[J]. Journal of System Simulation, 2023, 35(7): 1 421-1 437.

      [22]Zhu X, Chen Y, Tian H, et al. Ghost in the minecraft: generally capable agents for open-world environments via large language models with text-based knowledge and memory[EB/OL]. 2023, arXiv preprint arXiv: 2305.17144.

      [23]Durante Z, Huang Q, Wake N, et al. Agent AI: surveying the horizons of multimodal interaction[EB/OL]. 2024, arXiv preprint arXiv: 2401.03568.

      (責任編輯:李楠)

      皮山县| 若尔盖县| 霍林郭勒市| 南雄市| 商都县| 德兴市| 绥滨县| 淮安市| 荆州市| 房产| 海淀区| 藁城市| 原平市| 潞城市| 沈阳市| 灵丘县| 收藏| 五峰| 富宁县| 巫山县| 新野县| 江安县| 黑水县| 沈丘县| 揭阳市| 阆中市| 济南市| 榆社县| 江川县| 井研县| 望城县| 新郑市| 句容市| 天峻县| 延津县| 滁州市| 本溪| 西峡县| 竹山县| 咸宁市| 武城县|