沈博,武文亮,楊剛,周興社
西北工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院,西安 710129
無(wú)人集群系統(tǒng)(Unmanned Swarm System,USS)是群體智能的重要載體和主流形態(tài)之一,具有自主組織、高效協(xié)作、緊密耦合等特征,既可激發(fā)個(gè)體技能,又能匯聚群體智能,以低成本、分散化形式滿足復(fù)雜任務(wù)功能需求,并針對(duì)復(fù)雜環(huán)境自主協(xié)同規(guī)劃、多域協(xié)同合作以及動(dòng)態(tài)自適應(yīng)調(diào)整,能夠有效提高完成復(fù)雜任務(wù)的能力,已在協(xié)同偵察、聯(lián)合作戰(zhàn)、戰(zhàn)場(chǎng)評(píng)估等軍事領(lǐng)域與區(qū)域物流、城市安防、搶險(xiǎn)救援等民用領(lǐng)域應(yīng)用場(chǎng)景中得到初步驗(yàn)證與應(yīng)用[1-4]。無(wú)人系統(tǒng)群體智能具體是指由眾多相對(duì)自主、人工研發(fā)的無(wú)人智能實(shí)體通過(guò)相互協(xié)作與分工涌現(xiàn)出復(fù)雜智能行為的特性[5-8]。無(wú)人機(jī)集群、無(wú)人艇集群、工業(yè)智能機(jī)器人集群等是無(wú)人系統(tǒng)群體智能目前階段的典型實(shí)例,跨域異構(gòu)無(wú)人集群則進(jìn)一步呈現(xiàn)出更為復(fù)雜的無(wú)人系統(tǒng)群體智能形態(tài)[9-11]。無(wú)人集群系統(tǒng)依據(jù)需求執(zhí)行不同任務(wù),運(yùn)行環(huán)境復(fù)雜多變,系統(tǒng)行為自主與協(xié)同并存,并表現(xiàn)出魯棒、適應(yīng)、協(xié)同、涌現(xiàn)、演化等不同程度的群體智能特性[12-16]。
人工智能自問(wèn)世以來(lái),智能評(píng)價(jià)一直與之伴隨而行。以“圖靈測(cè)試”為智能判斷標(biāo)準(zhǔn),從智能機(jī)器評(píng)價(jià)準(zhǔn)則到無(wú)人駕駛等級(jí)評(píng)價(jià),從基于模型的評(píng)價(jià)方法到無(wú)人集群系統(tǒng)群體智能評(píng)價(jià)工具研發(fā),從智能算法測(cè)試到智能系統(tǒng)競(jìng)賽等評(píng)價(jià)實(shí)踐,有力推進(jìn)了人工智能理論方法創(chuàng)新、工程實(shí)現(xiàn)優(yōu)化以及領(lǐng)域應(yīng)用發(fā)展[17-20]。人工智能的度量、解釋與分布式人工智能為人工智能理論的5 個(gè)難點(diǎn)科學(xué)問(wèn)題之一[19]。中國(guó)《新一代人工智能發(fā)展規(guī)劃》[5]明確要求建立人工智能評(píng)價(jià)體系,評(píng)價(jià)人工智能產(chǎn)品和系統(tǒng)的關(guān)鍵性能;《國(guó)家新一代人工智能標(biāo)準(zhǔn)體系建設(shè)指南》[20]將開展人工智能相關(guān)產(chǎn)品智能能力等級(jí)評(píng)價(jià)作為基礎(chǔ)共性標(biāo)準(zhǔn)建設(shè)重點(diǎn)之一。
無(wú)人集群系統(tǒng)的個(gè)體與群體智能特性是提升系統(tǒng)自主完成復(fù)雜任務(wù)能力的主要技術(shù)途徑,智能程度直接影響著無(wú)人集群系統(tǒng)的技術(shù)先進(jìn)性、運(yùn)行魯棒性、環(huán)境適應(yīng)性以及任務(wù)高效性,使得無(wú)人集群系統(tǒng)智能評(píng)價(jià)不僅具有重要的理論意義,而且具有重要的工程價(jià)值。具體而言,開展無(wú)人集群系統(tǒng)智能的定性與定量評(píng)價(jià)不僅有利于促進(jìn)此類群體智能理論方法的創(chuàng)新進(jìn)步,而且必將推動(dòng)無(wú)人集群系統(tǒng)的發(fā)展論證、系統(tǒng)選型、算法優(yōu)化等,還可有效支撐無(wú)人集群系統(tǒng)應(yīng)用優(yōu)化設(shè)計(jì)和工程驗(yàn)證,提升應(yīng)用效能。因此,智能評(píng)價(jià)是推進(jìn)無(wú)人集群系統(tǒng)及其應(yīng)用持續(xù)發(fā)展的主要驅(qū)動(dòng)力。
無(wú)人集群智能評(píng)價(jià)的主要挑戰(zhàn)在于集群面向不同環(huán)境、適應(yīng)不同場(chǎng)景、執(zhí)行不同任務(wù),使得必須依據(jù)任務(wù)或場(chǎng)景實(shí)施智能特性評(píng)價(jià)過(guò)程,形成評(píng)價(jià)驅(qū)動(dòng)的動(dòng)態(tài)性問(wèn)題;無(wú)人集群系統(tǒng)的群體學(xué)習(xí)與智能涌現(xiàn)存在不確定性,導(dǎo)致集群能力存在成長(zhǎng)或衰退的多樣變化,引發(fā)持續(xù)性評(píng)價(jià)問(wèn)題;無(wú)人集群系統(tǒng)潛在能力與智能特性反映在不同層次、不同側(cè)面,形成的表征參數(shù)多樣化,難以用一種評(píng)價(jià)方法完成評(píng)價(jià)過(guò)程,導(dǎo)致評(píng)價(jià)指標(biāo)與評(píng)價(jià)方法的多維化問(wèn)題。
面向無(wú)人集群系統(tǒng)能力與智能特性評(píng)價(jià)的主要挑戰(zhàn)性問(wèn)題,在無(wú)人集群系統(tǒng)群體觀察-判斷- 決策- 執(zhí)行(Observe-Orient-Decide-Act,OODA)行為模型基礎(chǔ)上,提出評(píng)價(jià)對(duì)象與評(píng)價(jià)系統(tǒng)(Evaluation System, ES)協(xié)同演化模型,設(shè)計(jì)適應(yīng)群體OODA 的等級(jí)評(píng)價(jià)模型,提出無(wú)人集群系統(tǒng)智能特性評(píng)價(jià)的多類方法及自主評(píng)價(jià)原型工具,并結(jié)合無(wú)人機(jī)集群系統(tǒng)及其典型應(yīng)用場(chǎng)景組織初步驗(yàn)證,其宗旨是創(chuàng)新實(shí)現(xiàn)適應(yīng)無(wú)人集群系統(tǒng)智能特性的評(píng)價(jià)模型、方法及其工程驗(yàn)證。
隨著無(wú)人集群系統(tǒng)技術(shù)與應(yīng)用的快速發(fā)展,其評(píng)價(jià)研究與實(shí)踐也伴隨而行。已有無(wú)人集群系統(tǒng)智能評(píng)價(jià)以實(shí)現(xiàn)方式分為形式化分析和工程化驗(yàn)證,以評(píng)價(jià)內(nèi)容可分為面向任務(wù)與面向能力,以評(píng)價(jià)結(jié)果可分為定性評(píng)價(jià)與定量評(píng)價(jià),以評(píng)價(jià)方法可分為基于數(shù)學(xué)分析的傳統(tǒng)方法和基于機(jī)器學(xué)習(xí)的現(xiàn)代方法。
在無(wú)人系統(tǒng)的早期發(fā)展中,自主性等級(jí)評(píng)價(jià)起了重要引領(lǐng)作用。自主性不僅直接反映了無(wú)人系統(tǒng)人工干預(yù)程度,是自我管理狀態(tài)與質(zhì)量的具體體現(xiàn),而且也隱含了完成行為過(guò)程的感知、決策、執(zhí)行等能力的高低。典型的自主性等級(jí)評(píng)價(jià)包括國(guó)防部空軍研究實(shí)驗(yàn)室提出的UAV 自主控制水平等級(jí)(AutonomousControlLevel,ACL)[21-25]、Sheridan[26]提出了的自動(dòng)化分級(jí)、美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院的無(wú)人系統(tǒng)等級(jí)劃分(Autonomy Levels for Unmanned Systems,ALFUS)[27]、NASA 飛行器系統(tǒng)計(jì)劃高空長(zhǎng)航部提出的UAV 自主性等級(jí)[28]等。ACL 等級(jí)框架按照OODA 將無(wú)人機(jī)自主性劃分為10 個(gè)等級(jí),其中1~4 級(jí)反映個(gè)體系統(tǒng)自主性逐步提升;5~7級(jí)則表達(dá)了無(wú)人機(jī)多機(jī)的自主性特征;8~10 級(jí)定義了無(wú)人機(jī)集群的自主,其中10 級(jí)是新型無(wú)人戰(zhàn)斗機(jī)的群體作戰(zhàn)方式,即多無(wú)人系統(tǒng)攻擊。當(dāng)前,全球鷹、影子和火力偵察兵等無(wú)人機(jī)處于第2等級(jí)到第3 等級(jí)之間,美國(guó)軍隊(duì)預(yù)計(jì)在2036 年全面實(shí)現(xiàn)第10 等級(jí)的群體作戰(zhàn)?;贏CL 等級(jí)標(biāo)準(zhǔn),陳宗基等[29]提出了中國(guó)無(wú)人機(jī)自主控制等級(jí),在5 級(jí)以上考慮了多機(jī)協(xié)同。
由于無(wú)人系統(tǒng)的復(fù)雜性,從多個(gè)維度共同評(píng)價(jià)無(wú)人系統(tǒng),是一種常見(jiàn)的評(píng)價(jià)方式。美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院[26]提出ALFUS 評(píng)價(jià)維度模型,以任務(wù)復(fù)雜性、環(huán)境復(fù)雜性和人機(jī)交互度為評(píng)價(jià)維度構(gòu)建了無(wú)人系統(tǒng)自主性三維評(píng)價(jià)模型,每一維度有更加細(xì)致的評(píng)價(jià)準(zhǔn)則。ALFUS 模型較長(zhǎng)時(shí)間內(nèi)在無(wú)人系統(tǒng)自主性評(píng)價(jià)中起到重要作用,但其對(duì)后續(xù)發(fā)展的無(wú)人集群系統(tǒng)評(píng)價(jià)考慮不夠充分。王越超和劉金國(guó)[30]提出的蛛網(wǎng)模型是一種多維評(píng)價(jià)模型,可以結(jié)合具體的無(wú)人系統(tǒng)進(jìn)行評(píng)價(jià)內(nèi)容實(shí)例化,例如從協(xié)同、交互、感知、導(dǎo)航及決策5 個(gè)維度分別評(píng)價(jià)無(wú)人集群系統(tǒng)自主性的關(guān)鍵技術(shù),5 個(gè)維度共同得到的整體自主水平。吳澄等[31]參考ALFUS 評(píng)價(jià)模型,提出了中國(guó)智能海洋機(jī)器人集群等級(jí)劃分,從群體智能、自主認(rèn)知和自主控制3 個(gè)維度對(duì)海洋機(jī)器人及其集群智能進(jìn)行評(píng)價(jià)。段海濱等[32]提出面向?qū)傩缘娜后w智能評(píng)價(jià)模型,從行為、拓?fù)?、環(huán)境和交互4 個(gè)維度對(duì)群體智能進(jìn)行量化評(píng)價(jià)。
為了推動(dòng)智能系統(tǒng)發(fā)展,對(duì)智能進(jìn)行形式化定義并量化其數(shù)值,得到越來(lái)越多關(guān)注。算法信息論(Algorithmic Information Theory,AIT)是信息論在計(jì)算機(jī)科學(xué)中的擴(kuò)展[33]。借助算法信息論框架,Chaitin[34]提出采用Solomonoff算法概率、Kolmogorov 算法復(fù)雜性和Chaitin 算法隨機(jī)性評(píng)價(jià)智能算法或系統(tǒng)的智能。因此,智能可被認(rèn)為是系統(tǒng)處理復(fù)雜性任務(wù)的能力。Legg 和Hutter[35]通過(guò)環(huán)境與智能體的交互,提出一種利用算法概率和價(jià)值函數(shù)的智能量化定義。Chollet[36]認(rèn)為,一個(gè)系統(tǒng)的智能可用其在一系列不同任務(wù)中獲得新能力的效率衡量,智能和系統(tǒng)的先驗(yàn)、經(jīng)驗(yàn)、及任務(wù)的泛化難度相關(guān)。在此基礎(chǔ)上,他分析了任務(wù)和智能系統(tǒng)的交互關(guān)系,使用AIT 建立了智能量化模型。羅杰等[37-38]認(rèn)為,群體智能系統(tǒng)實(shí)質(zhì)上是一類復(fù)雜非線性動(dòng)力學(xué)系統(tǒng),提出用群體熵量化描述群體智能。Iantovics 等[39]提出使用MetrIntMeas 度量評(píng)價(jià)群體系統(tǒng)智能,其出發(fā)點(diǎn)是基于問(wèn)題求解的效能得到一組智能評(píng)價(jià)指標(biāo),進(jìn)行變換衡量群體系統(tǒng)的智能。此外,還可以使用復(fù)雜網(wǎng)絡(luò)[40]和Karp-Flatt度量[41]評(píng)價(jià)智能。
在分析無(wú)人集群系統(tǒng)行為以及已有相關(guān)評(píng)價(jià)模型與方法基礎(chǔ)上,我們以評(píng)價(jià)協(xié)同演化模型為指導(dǎo),以群體能力驅(qū)動(dòng)的等級(jí)評(píng)價(jià)模型為核心,以等級(jí)和特性的評(píng)價(jià)方法為支撐,以原型工具為載體,以無(wú)人機(jī)集群典型應(yīng)用場(chǎng)景做驗(yàn)證,形成無(wú)人集群系統(tǒng)智能評(píng)價(jià)模型-方法-實(shí)現(xiàn)綜合方案,如圖1 所示。
圖1 無(wú)人集群系統(tǒng)智能評(píng)價(jià)綜合方案Fig.1 Comprehensive solution to evaluation of intelligence of unmanned swarm system
隨著智能技術(shù)的不斷進(jìn)步與應(yīng)用復(fù)雜性的不斷增加,無(wú)人集群系統(tǒng)智能處于不斷發(fā)展與進(jìn)化中。為了評(píng)價(jià)其智能進(jìn)化,相應(yīng)評(píng)價(jià)系統(tǒng)的能力也需持續(xù)加強(qiáng)與提升。另外,按照無(wú)人集群系統(tǒng)智能進(jìn)化合理預(yù)期趨勢(shì)定義的等級(jí)評(píng)價(jià)標(biāo)準(zhǔn)可以更好地指導(dǎo)其智能發(fā)展路線,為其進(jìn)一步進(jìn)化提供借鑒。以“等級(jí)評(píng)價(jià)驅(qū)動(dòng)無(wú)人集群系統(tǒng)智能進(jìn)化”為基本思想提出了圖2 所示的無(wú)人集群系統(tǒng)智能評(píng)價(jià)協(xié)同進(jìn)化模型。
圖2 無(wú)人集群系統(tǒng)智能評(píng)價(jià)協(xié)同進(jìn)化模型Fig.2 Co-evolution model of intelligence evaluation of unmanned swarm system
該模型具體由無(wú)人集群系統(tǒng)和評(píng)價(jià)系統(tǒng)2 部分組成:
1) 模型左側(cè)表示USS 及其進(jìn)化,USS=<N,C,F(xiàn)>。在該三元組中,N={n1,n2,…,nn}表示無(wú)人系統(tǒng)節(jié)點(diǎn)集合;C表示無(wú)人集群系統(tǒng)的通信網(wǎng)絡(luò);F={f1,f2,…,fn}表示USS 的智能特征集合,包括魯棒性、適應(yīng)性、成長(zhǎng)性等,|F|表示智能特征集合的勢(shì),|fi|表示智能特征的度量值。
2) 模型右側(cè)表示ES 及其進(jìn)化,ES=<P,M,T>。在該三元組中,P={p1,p2,…,pnP}表示評(píng)價(jià)參數(shù)集合;M={m1,m2,…,mnM}表示評(píng)價(jià)方法集合;T={t1,t2,…,tnT}表示評(píng)價(jià)對(duì)象集合;|P|、|M|、|T|分別表示3 個(gè)集合的勢(shì),U(A',A)表示2個(gè)集合的并集。
無(wú)人集群系統(tǒng)與評(píng)價(jià)系統(tǒng)進(jìn)化及其協(xié)同進(jìn)化關(guān)系定義如下所示。
1) 若無(wú)人集群系統(tǒng)智能進(jìn)化,F(xiàn)與F'分別表示進(jìn)化前后的智能特征集,則至少需要滿足如下2 條約束中的一條。
約束1所有|fi'|-|fi|≥0 且至少一項(xiàng)|fi'|-|fi|>0,即USS 的智能特征至少有一項(xiàng)得到提升。
約束2|F'|-|F|>0,且F'中至少新增一項(xiàng)|fj'|>0,即USS 引入新的智能特征。
2) 若評(píng)價(jià)系統(tǒng)能力進(jìn)化,ES 與ES'分別表示進(jìn)化前后的評(píng)價(jià)系統(tǒng),則要求滿足如下2 條約束。
約束3|P'|-|P|≥0、|M'|-|M|≥0、|T'|-|T|≥0 且至少一項(xiàng)非零,即要求評(píng)價(jià)系統(tǒng)的評(píng)價(jià)參數(shù)、方法或?qū)ο笾辽僖豁?xiàng)進(jìn)行擴(kuò)展。
約束4U(P',P)!=P、U(M',M)!=M、U(T',T)!=T且至少一項(xiàng)成立,即要求評(píng)價(jià)系統(tǒng)的評(píng)價(jià)參數(shù)、方法或?qū)ο笾辽僖豁?xiàng)進(jìn)行更新。
3) 無(wú)人集群系統(tǒng)智能等級(jí)與評(píng)價(jià)系統(tǒng)能力協(xié)同進(jìn)化要求。
約束5若無(wú)人集群系統(tǒng)進(jìn)化,則要求評(píng)價(jià)系統(tǒng)能力進(jìn)化,對(duì)其進(jìn)行評(píng)價(jià)。
約束6若評(píng)價(jià)系統(tǒng)能力進(jìn)化,則要求無(wú)人集群系統(tǒng)進(jìn)化,以滿足新評(píng)價(jià)要求。
無(wú)人集群系統(tǒng)智能特性參數(shù)集和評(píng)價(jià)系統(tǒng)評(píng)價(jià)參數(shù)集的具體映射實(shí)例如圖3 所示。無(wú)人集群系統(tǒng)USS 向評(píng)價(jià)系統(tǒng)ES 提出評(píng)價(jià)請(qǐng)求,ES 將USS 對(duì)應(yīng)的特征F映射為參數(shù)P。在USS 特征與ES 參數(shù)映射中,特征組合F與參數(shù)P可以滿足不同的多對(duì)多映射關(guān)系。評(píng)價(jià)系統(tǒng)在工具T上基于方法M實(shí)施評(píng)價(jià),向無(wú)人集群系統(tǒng)反饋評(píng)價(jià)結(jié)果。
圖3 USS 的特征度量與ES 的評(píng)價(jià)參數(shù)映射實(shí)例Fig.3 Mapping instance between USS feature measure and ES evaluation parameter
該模型能夠從理論、方法與實(shí)踐有效指導(dǎo)無(wú)人集群系統(tǒng)智能進(jìn)化及其評(píng)價(jià)研究與實(shí)現(xiàn)。從理論上,給出了無(wú)人集群系統(tǒng)智能與其評(píng)價(jià)的相互依賴及其進(jìn)化關(guān)系;從方法上,可以有效指導(dǎo)評(píng)價(jià)系統(tǒng)及無(wú)人集群系統(tǒng)智能的研究方向與實(shí)施策略;從實(shí)踐上,可以有效指導(dǎo)無(wú)人集群系統(tǒng)智能評(píng)價(jià)原型工具集的開發(fā)與不斷優(yōu)化。
2.2.1 無(wú)人集群系統(tǒng)的群體OODA 行為模型
觀察(Observe)-判斷(Orient)-決策(Decide)-行動(dòng)(Act)的OODA 環(huán)從基于行為主義的行為計(jì)算模型出發(fā),描述了適應(yīng)環(huán)境變化的各種反應(yīng)過(guò)程,得到了廣泛認(rèn)可[42]。無(wú)人系統(tǒng)行為同樣遵循OODA 模型,觀察主要負(fù)責(zé)根據(jù)自身的傳感設(shè)備實(shí)現(xiàn)對(duì)自身和外界環(huán)境信息的自感知、自診斷與自監(jiān)測(cè),判斷將感知數(shù)據(jù)自主轉(zhuǎn)化為有用信息,通過(guò)智能推理有效進(jìn)行行為決策,進(jìn)而依據(jù)決策結(jié)果執(zhí)行具體動(dòng)作,如此周而復(fù)始,形成具有鮮明自主性與時(shí)空性的無(wú)人系統(tǒng)OODA 行為環(huán),如圖4 所示。無(wú)人集群系統(tǒng)各無(wú)人節(jié)點(diǎn)相互配合、密切協(xié)同,涉及各無(wú)人系統(tǒng)能力的有效集成。為此將OODA 行為模型擴(kuò)展為群體OODA 模型,具體如圖5 所示。圖5 描述了各無(wú)人節(jié)點(diǎn)能力縱向聚合,在此基礎(chǔ)上聚合后的群體觀察、群體判斷、群體決策和群體執(zhí)行能力還符合集群的OODA 能力環(huán)。因此圖5 刻畫了縱向聚合產(chǎn)生的能力協(xié)同,也能夠描述群體聚合能力橫向協(xié)同產(chǎn)生的能力環(huán)。
圖4 無(wú)人系統(tǒng)OODA 行為模型Fig.4 OODA model of unmanned system
圖5 無(wú)人集群群體OODA 模型Fig.5 Collective OODA model of unmanned swarm
例如,集群內(nèi)各節(jié)點(diǎn)的觀察能力通過(guò)各自不同類別的觀察器或者同一類別不同性能的觀察器聚合成為能力更加強(qiáng)大的集群觀察能力。群體OODA 模型有效集成了無(wú)人集群內(nèi)多個(gè)無(wú)人系統(tǒng)的能力,集群成員在各個(gè)環(huán)節(jié)不僅完成自我任務(wù)優(yōu)化,并主動(dòng)協(xié)調(diào)彼此行為,實(shí)現(xiàn)無(wú)人集群效能的最大化。群體OODA 模型是對(duì)無(wú)人集群行為的高度抽象,不僅能夠描述整個(gè)集群的能力聚合,還能刻畫集群任務(wù)行動(dòng)全過(guò)程,體現(xiàn)了無(wú)人集群的群體涌現(xiàn)。
2.2.2 無(wú)人集群系統(tǒng)智能等級(jí)評(píng)價(jià)模型
無(wú)人集群系統(tǒng)智能是一個(gè)漸進(jìn)過(guò)程,不同發(fā)展階段形成不同的智能特性,并成為不同等級(jí)的劃分依據(jù)。針對(duì)無(wú)人集群智能評(píng)價(jià)的現(xiàn)狀及需求,宏觀上應(yīng)以定性等級(jí)評(píng)價(jià)為先導(dǎo)。在遵循等級(jí)劃分的計(jì)劃性、漸近性、均衡性、易用性及時(shí)效性等原則基礎(chǔ)上,提出基于群體OODA 的無(wú)人集群系統(tǒng)智能等級(jí)定性評(píng)價(jià)模型,將無(wú)人集群系統(tǒng)智能等級(jí)劃分為如表1 所示的6 級(jí):團(tuán)隊(duì)協(xié)調(diào)、行為規(guī)劃、任務(wù)重構(gòu)、合作博弈、協(xié)同認(rèn)知和群體理智。其中,團(tuán)隊(duì)協(xié)調(diào)是集群系統(tǒng)智能的最低要求,能夠完成靜態(tài)任務(wù)并協(xié)調(diào)簡(jiǎn)單動(dòng)作行為;行為規(guī)劃要求集群能夠觀察并處理預(yù)期內(nèi)變化;任務(wù)重構(gòu)要求集群能夠自主協(xié)同以執(zhí)行突發(fā)任務(wù),具備集群任務(wù)重規(guī)劃能力;合作博弈要求集群能夠在對(duì)抗環(huán)境中自主決策并完成突發(fā)任務(wù);協(xié)同感知要求集群能夠完成小范圍態(tài)勢(shì)構(gòu)建,自主進(jìn)行戰(zhàn)術(shù)層級(jí)任務(wù)決策;群體理智要求無(wú)人集群能夠自主完成戰(zhàn)略層面的態(tài)勢(shì)判斷與任務(wù)執(zhí)行,涉及完成多種未知環(huán)境下的未知戰(zhàn)術(shù)任務(wù),體現(xiàn)了集群的綜合能力及通用智能。
本文提出的智能等級(jí)劃分以群體OODA 模型為橫向構(gòu)建依據(jù),給出各個(gè)等級(jí)的詳細(xì)刻畫,明確了各等級(jí)在群體觀察、群體判斷、群體決策和群體執(zhí)行4 項(xiàng)能力的具體表現(xiàn)。該模型有助于從多維度實(shí)施無(wú)人集群系統(tǒng)智能等級(jí)驗(yàn)證評(píng)價(jià),并推動(dòng)系統(tǒng)智能逐步提升。
美國(guó)國(guó)防部自2000 年起每隔幾年提出一版無(wú)人機(jī)發(fā)展路線圖,其中多個(gè)版本采用ACL 等級(jí)劃分作為發(fā)展基準(zhǔn)。與ACL 等級(jí)相比較而言,本文所提出的智能等級(jí)劃分有3 點(diǎn)不同:①評(píng)價(jià)目標(biāo)不同,ACL 劃分針對(duì)的是自主性,本文所提等級(jí)劃分主要針對(duì)的是群體智能;②評(píng)價(jià)對(duì)象不同,ACL 劃分面向的是包含單機(jī)、多機(jī)和集群在內(nèi)的無(wú)人系統(tǒng),本文所提等級(jí)劃分面向無(wú)人集群系統(tǒng);③可擴(kuò)展性不同,ACL 主要面向軍用無(wú)人機(jī),因此很難向其它形態(tài)的無(wú)人系統(tǒng)及其應(yīng)用場(chǎng)景擴(kuò)展,本文所提等級(jí)可以擴(kuò)展為無(wú)人機(jī)集群、無(wú)人船集群、無(wú)人車集群等各種形態(tài)的無(wú)人集群在民用、軍用等不同應(yīng)用場(chǎng)景下的無(wú)人集群系統(tǒng)智能等級(jí)劃分標(biāo)準(zhǔn)。
中國(guó)工程領(lǐng)域提出一種裝備智能水平劃分,已成為該領(lǐng)域評(píng)價(jià)裝備智能的標(biāo)準(zhǔn)。與該分級(jí)標(biāo)準(zhǔn)相比較而言,本文所提出的智能等級(jí)劃分有3 點(diǎn)不同:①評(píng)價(jià)對(duì)象不同,該領(lǐng)域標(biāo)準(zhǔn)主要面向特定裝備,本文劃分主要面向無(wú)人集群系統(tǒng);②評(píng)價(jià)準(zhǔn)則不同,該標(biāo)準(zhǔn)主要以自主性、協(xié)同性、學(xué)習(xí)性3 個(gè)智能特性為分級(jí)依據(jù),以感知、決策、行動(dòng)3 個(gè)行為過(guò)程為主要要求,本文標(biāo)準(zhǔn)主要以系統(tǒng)智能特征為分級(jí)依據(jù),以群體觀察、群體判斷、群體決策和群體執(zhí)行4 個(gè)行為特征為主要要求構(gòu)建;③可擴(kuò)展性不同,該領(lǐng)域標(biāo)準(zhǔn)主要面向特定裝備,較難向其它領(lǐng)域擴(kuò)展,本文智能等級(jí)劃分的可擴(kuò)展性較好。
無(wú)人集群系統(tǒng)作為一類復(fù)雜系統(tǒng),對(duì)靜態(tài)固有能力指標(biāo)數(shù)據(jù)的分析是評(píng)價(jià)群體智能的一個(gè)維度。無(wú)人集群通過(guò)群體協(xié)同觀察、分析、決策和執(zhí)行能力,呈現(xiàn)出協(xié)同性、適應(yīng)性、魯棒性、涌現(xiàn)性、演化性、成長(zhǎng)性等群體智能特性。由于無(wú)人集群的智能具有涌現(xiàn)性會(huì)階躍變化,智能會(huì)不斷增長(zhǎng),故本文采用面向能力的智能系統(tǒng)評(píng)價(jià),并建立能力指標(biāo)網(wǎng)。為了綜合評(píng)價(jià)無(wú)人集群系統(tǒng)智能,還需要采集無(wú)人集群在特定場(chǎng)景中執(zhí)行任務(wù)的過(guò)程指標(biāo)數(shù)據(jù)與結(jié)果指標(biāo)數(shù)據(jù),因此構(gòu)建如圖6 所示的基于群體OODA 的無(wú)人集群系統(tǒng)智能評(píng)價(jià)過(guò)程模型。無(wú)人集群中個(gè)體的基礎(chǔ)能力構(gòu)成了集群的群體能力,通過(guò)分析不同能力無(wú)人集群在多種環(huán)境不同任務(wù)獲取的過(guò)程指標(biāo)與結(jié)果指標(biāo),綜合判定集群是否達(dá)到某一等級(jí)或智能特性的要求。因此,評(píng)價(jià)集群的環(huán)境應(yīng)具有普適性,涵蓋了各種復(fù)雜度;執(zhí)行的任務(wù)要具有充分性,能夠體現(xiàn)等級(jí)或特性對(duì)集群OODA 能力的不同要求。該過(guò)程模型比較清楚地解釋了無(wú)人集群系統(tǒng)能力、場(chǎng)景集合與其智能等級(jí)劃分、群體智能特性之間的相互關(guān)系。
圖6 無(wú)人集群系統(tǒng)智能評(píng)價(jià)過(guò)程模型Fig.6 Evaluation process model of intelligence of unmanned swarm system
無(wú)人集群系統(tǒng)能力具有嵌套層次性,可以分為原子能力、復(fù)合能力、行為能力和群體能力。例如,群體能力是群體OODA 4 個(gè)環(huán)節(jié)群體行為能力的聚合。由此,可構(gòu)建基于群體OODA 的層次化無(wú)人集群能力網(wǎng)。無(wú)人集群能力指標(biāo)集合具體如表2 所示,現(xiàn)對(duì)無(wú)人集群能力組合關(guān)系進(jìn)行分析。首先定義支持能力聚合運(yùn)算的能力半群?R=<?,op >,其中?表示能力集合,op 表示定義在?上的能力組合算子,且能力子集?i滿足?=∪?i,op={?,∩,∪,∧,∨}??紤]無(wú)人集群聚合能力形成的特殊性,依據(jù)能力群間能力組合方式及其算子,將無(wú)人集群能力群進(jìn)一步細(xì)化為?群、∩群、∪群、∧群和∨群。對(duì)能力群而言,能力群二元算子?運(yùn)算結(jié)果為兩元素之和,二元算子∩運(yùn)算結(jié)果為兩元素間較小元素,二元算子∪運(yùn)算結(jié)果為兩元素間較大元素,二元算子∧運(yùn)算結(jié)果為兩元素并集,二元算子∨運(yùn)算結(jié)果為兩元素交集。
表2 無(wú)人集群系統(tǒng)能力指標(biāo)集Table 2 Capacity metric set of unmanned swarm system
以群體續(xù)航能力Csna為例對(duì)能力聚合算子說(shuō)明,假設(shè)?Csna={Cina1,Cina2,…,Cinai,…,Cinan},其中Cinai表示第i個(gè)無(wú)人系統(tǒng)續(xù)航能力,以剩余續(xù)航時(shí)間為指標(biāo)。若集群中每個(gè)節(jié)點(diǎn)為對(duì)于任務(wù)執(zhí)行都必不可少,則剩余續(xù)航時(shí)間最短節(jié)點(diǎn)決定群體續(xù)航能力,以能力替代下限算子組合運(yùn)算,?RCsna=<?Csna,∩>;若集群中任一節(jié)點(diǎn)均可獨(dú)立完成任務(wù),則剩余續(xù)航時(shí)間最長(zhǎng)節(jié)點(diǎn)決定群體續(xù)航能力,以能力替代上限算子組合運(yùn)算,?RCsna=<?Csna,∪>?;诖鷶?shù)系統(tǒng)的集群能力組合可以對(duì)集群能力進(jìn)行統(tǒng)一刻畫描述,方便根據(jù)集群特性選擇合適的能力算子,對(duì)集群能力做相應(yīng)的評(píng)價(jià),提升集群資源評(píng)價(jià)的準(zhǔn)確性。
在無(wú)人集群評(píng)價(jià)實(shí)施過(guò)程中,場(chǎng)景由無(wú)人集群運(yùn)行的環(huán)境及所執(zhí)行的任務(wù)2 部分組成,是其工作空間中所有相關(guān)條件及任務(wù)流程的總和。無(wú)人集群在各種交互執(zhí)行過(guò)程中,通過(guò)場(chǎng)景中事件間的因果關(guān)系將各節(jié)點(diǎn)及子系統(tǒng)之間發(fā)生的事件連接起來(lái)形成一條系統(tǒng)執(zhí)行路徑,這種因果關(guān)系的形式化表示即無(wú)人集群的場(chǎng)景描述。無(wú)人集群場(chǎng)景描述語(yǔ)言(Scenario Language for Unmanned Swarms,SL4U)是設(shè)計(jì)用以描述無(wú)人集群場(chǎng)景的語(yǔ)言。SL4U 基于XML 語(yǔ)法規(guī)范,通過(guò)特定的XML 元素、屬性、及元素與元素之間的關(guān)系來(lái)形成SL4U 語(yǔ)法規(guī)范,具備描述集群場(chǎng)景中各組成部分的能力。使用SL4U 時(shí),首先形式化地定義一個(gè)集群場(chǎng)景文件,利用SL4U 解析器和規(guī)劃器,對(duì)場(chǎng)景文件進(jìn)行解析、規(guī)劃步驟,生成多個(gè)可由單系統(tǒng)執(zhí)行的任務(wù),最終實(shí)現(xiàn)底層控制的剝離,完成無(wú)人集群的管理。
為了實(shí)現(xiàn)這一目標(biāo),設(shè)計(jì)并實(shí)現(xiàn)了SL4U 的規(guī)劃器和解釋器。規(guī)劃器在地面站上運(yùn)行,將結(jié)合任務(wù)目標(biāo)進(jìn)行能力匹配,篩選滿足任務(wù)需求的無(wú)人系統(tǒng),隨后進(jìn)行協(xié)同規(guī)劃,將場(chǎng)景中區(qū)域任務(wù)及線任務(wù)分別確定為一組或多組點(diǎn)任務(wù),并將點(diǎn)任務(wù)分配給不同的無(wú)人系統(tǒng),最終將SL4U 文件轉(zhuǎn)為若干個(gè)單系統(tǒng)文件。無(wú)人系統(tǒng)上運(yùn)行的解釋器讀取單系統(tǒng)文件并解析為任務(wù)隊(duì)列,通過(guò)協(xié)同事件觸發(fā),操控?zé)o人系統(tǒng)能力接口執(zhí)行任務(wù),同時(shí)對(duì)異常事件進(jìn)行處理。單系統(tǒng)文件內(nèi)容也可以通過(guò)消息的方式,從地面站發(fā)送給無(wú)人系統(tǒng),若無(wú)人系統(tǒng)發(fā)生異常,可將剩余的任務(wù)隊(duì)列發(fā)送給地面站進(jìn)行重規(guī)劃和重分配。
SL4U 可以通過(guò)任務(wù)引用方便快捷的實(shí)現(xiàn)任務(wù)的調(diào)用和復(fù)用,而不需要針對(duì)相同的任務(wù),每次都由用戶給出具體的描述,提高了任務(wù)描述的效率,可以在更短的時(shí)間內(nèi)實(shí)現(xiàn)無(wú)人集群場(chǎng)景描述,并快速部署執(zhí)行任務(wù)。此外,支持場(chǎng)景文件的動(dòng)態(tài)綁定,以便對(duì)無(wú)人集群任務(wù)執(zhí)行過(guò)程中的動(dòng)態(tài)變化做出處理,進(jìn)一步提高了無(wú)人集群系統(tǒng)的可靠性。采集并分析集群在特定場(chǎng)景中的指標(biāo)數(shù)據(jù),是開展評(píng)價(jià)活動(dòng)必不可少的環(huán)節(jié)。當(dāng)前,SL4U 支持無(wú)人機(jī)、無(wú)人車的場(chǎng)景任務(wù)定義,有效降低了集群評(píng)價(jià)數(shù)據(jù)的獲取難度,縮短了評(píng)價(jià)周期。圖7 為SL4U 描述的一種場(chǎng)景示例。
圖7 無(wú)人集群系統(tǒng)搜索任務(wù)的SL4U 描述Fig.7 A SL4U description of searching scenario of unmanned swarm system
針對(duì)無(wú)人集群系統(tǒng)智能評(píng)價(jià)需求的多樣性,應(yīng)采用不同方法對(duì)具體評(píng)價(jià)目標(biāo)開展評(píng)價(jià),以判斷其是否滿足特定等級(jí)或特性的要求。常見(jiàn)的評(píng)價(jià)方法包括模糊綜合評(píng)價(jià)、逼近于理想解的排序技術(shù)(Technique for Order Preference by Similarity to an Ideal Solution, TOPSIS)評(píng)價(jià)、云模型評(píng)價(jià)與神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)等。除上述常規(guī)方法外,本節(jié)介紹2 種當(dāng)前研究的評(píng)價(jià)方法,即基于算法信息論和基于機(jī)器學(xué)習(xí)的評(píng)價(jià)方法,前者側(cè)重于評(píng)價(jià)無(wú)人集群在不同環(huán)境中的綜合表現(xiàn),后者適宜對(duì)無(wú)人集群某一維度能力或特性開展評(píng)價(jià)。
3.3.1 基于算法信息論
最初的基于算法信息論方法評(píng)價(jià)了單一智能體在任務(wù)中的智能,綜合了智能體在任務(wù)執(zhí)行過(guò)程中的表現(xiàn)。對(duì)該方法進(jìn)行了面向無(wú)人集群場(chǎng)景的改進(jìn),評(píng)價(jià)中融入OODA 環(huán)行為時(shí)間刻畫任務(wù)復(fù)雜度及系統(tǒng)能力,并用環(huán)境熵刻畫環(huán)境復(fù)雜度。該方法能夠根據(jù)無(wú)人集群在不同環(huán)境中的任務(wù)結(jié)果進(jìn)行評(píng)價(jià),例如城市搜索中無(wú)人機(jī)集群穿越空間障礙搜索目標(biāo),主要包括以下4 個(gè)步驟。
步驟1環(huán)境復(fù)雜度量化
熵被認(rèn)為是對(duì)無(wú)序的量度,熵的大小取決于無(wú)序程度,是一種特征的統(tǒng)計(jì)形式。圖像的一維熵統(tǒng)計(jì)了灰度分布聚集特征所包含的信息量,通過(guò)獲取每個(gè)灰度出現(xiàn)的次數(shù)及概率,計(jì)算環(huán)境地圖的信息熵。
步驟2復(fù)雜度概率分布統(tǒng)計(jì)
采用Kolmogorov-Smirnov 檢測(cè)對(duì)環(huán)境地圖的熵值數(shù)據(jù)進(jìn)行檢測(cè)。Kolmogorov-Smirnov 檢測(cè)是比較概率分布f(x)和理論分布g(x)或者2 個(gè)觀測(cè)值分布的檢驗(yàn)方法。為了準(zhǔn)確評(píng)價(jià)無(wú)人集群,應(yīng)該得到多個(gè)不同環(huán)境下集群的指標(biāo)數(shù)據(jù)。Kolmogorov-Smirnov 檢測(cè)可以判斷環(huán)境數(shù)據(jù)是否符合某種分布。
步驟3環(huán)境采樣
對(duì)環(huán)境數(shù)據(jù)合理采樣,選取無(wú)人集群在不同復(fù)雜度環(huán)境中的指標(biāo)數(shù)據(jù),以更加準(zhǔn)確評(píng)價(jià)無(wú)人集群,記每個(gè)環(huán)境的概率值為P(e),采樣后的環(huán)境集合為E。
步驟4評(píng)價(jià)指標(biāo)及其度量函數(shù)
針對(duì)搜索任務(wù),評(píng)價(jià)指標(biāo)可選如指標(biāo)1~指標(biāo)3 所示的3 種。
指標(biāo)1搜索成功率
無(wú)人機(jī)集群搜索到的目標(biāo)占mg個(gè)總目標(biāo)的比值,記為其中若目標(biāo)i搜索到記Hit(?i)=1,否則Hit(?i)=0。
指標(biāo)2搜索的平均時(shí)間
無(wú)人機(jī)集群搜索進(jìn)間使用群體OODA 環(huán)時(shí)間TOODA表示,每個(gè)目標(biāo)點(diǎn)被搜索成功消耗的平均時(shí)間記為
指標(biāo)3面向搜索場(chǎng)景的無(wú)人集群智能指標(biāo)
式中:w1和w2為不同指標(biāo)的權(quán)重,且滿足w1+w2=1。
為了有效確定指標(biāo)間的權(quán)重,一種常用的方法 是 采 用 CRITIC (Criteria Importance Through Interia Correlation)權(quán)重法進(jìn)行客觀權(quán)重的計(jì)算,此時(shí)需要對(duì)各場(chǎng)景獲取的評(píng)價(jià)指標(biāo)進(jìn)行歸一化處理,以消除量綱和數(shù)據(jù)方向的不一致。在無(wú)人集群智能指標(biāo)公式中,(·)'表示對(duì)該指標(biāo)通過(guò)預(yù)處理歸一化后的標(biāo)準(zhǔn)數(shù)據(jù)。根據(jù)指標(biāo)公式計(jì)算出智能評(píng)分后,再次對(duì)評(píng)分結(jié)果進(jìn)行歸一化處理,得到最終智能等級(jí)評(píng)價(jià)得分。在此基礎(chǔ)上,將無(wú)人集群得分與由專家設(shè)計(jì)的無(wú)人集群系統(tǒng)智能閾值進(jìn)行比較,判定是否通過(guò)該等級(jí)場(chǎng)景任務(wù)能力驗(yàn)證。
3.3.2 基于機(jī)器學(xué)習(xí)
XGBoost 是一種基于梯度提升和決策樹的學(xué)習(xí)方法,通過(guò)加法模型將多個(gè)弱學(xué)習(xí)器集成為一個(gè)強(qiáng)學(xué)習(xí)器,獲得高準(zhǔn)確率的機(jī)器學(xué)習(xí)模型[43]。該方法便于得到各個(gè)輸入特征的重要性,這與傳統(tǒng)評(píng)價(jià)方法中對(duì)指標(biāo)進(jìn)行人工賦權(quán)具有相似性,提升了基于機(jī)器學(xué)習(xí)評(píng)價(jià)模型的可解釋性與可信性,得到定性評(píng)價(jià)結(jié)果后便于對(duì)系統(tǒng)設(shè)計(jì)給出指導(dǎo)性反饋。此外,基于XGBoost 的評(píng)價(jià)方法屬于數(shù)據(jù)驅(qū)動(dòng),由于對(duì)數(shù)據(jù)項(xiàng)缺省具有一定適應(yīng)性,并不嚴(yán)格要求數(shù)據(jù)難度數(shù)量與準(zhǔn)確性,適用于針對(duì)部分場(chǎng)景個(gè)別參數(shù)指標(biāo)獲取困難的集群評(píng)價(jià)。因此,采用XGBoost 對(duì)無(wú)人集群進(jìn)行指定特性或能力的評(píng)價(jià),主要包括以下4 個(gè)步驟。
步驟1集群指標(biāo)體系構(gòu)建
指標(biāo)體系建立需遵從系統(tǒng)性、完整性、層次性和科學(xué)性原則,要考慮系統(tǒng)本身和應(yīng)用的多樣性、多維性、層次性,才能對(duì)目標(biāo)能力或特性進(jìn)行全面評(píng)價(jià),避免集群描述的模糊性,要包括單體系統(tǒng)的固有能力指標(biāo),也要涵蓋集群涌現(xiàn)出來(lái)的能力。
步驟2任務(wù)數(shù)據(jù)采集及處理
按照集群指標(biāo)體系完成數(shù)據(jù)采集。由于XGBoost 要求輸出變量是數(shù)值型,需要將部分采集到的數(shù)據(jù)進(jìn)行類型轉(zhuǎn)換;利用DBSCAN 算法對(duì)獲取的集群指標(biāo)集進(jìn)行數(shù)據(jù)聚類分析,聚類時(shí)剔除異常點(diǎn),并與專家經(jīng)驗(yàn)知識(shí)進(jìn)行比對(duì),以確認(rèn)聚類的合理性及每一類代表的含義;隨后,將評(píng)價(jià)數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集。
步驟3XGBoost 評(píng)價(jià)模型訓(xùn)練
XGBoost 模型的訓(xùn)練過(guò)程與梯度增加決策樹(Gradient Boosting, GB)基本一致,包括初始化模型和迭代生成多個(gè)基學(xué)習(xí)器。其中,子模型樹依賴節(jié)點(diǎn)遞歸分裂的貪心準(zhǔn)則實(shí)現(xiàn)樹的生成。
步驟4評(píng)估目標(biāo)集群所屬的能力等級(jí)
利用訓(xùn)練好的模型對(duì)待評(píng)集群數(shù)據(jù)進(jìn)行處理,以確定該集群是否通過(guò)能力或特性指標(biāo)要求。
為有效支撐智能評(píng)價(jià)工作開展,我們?cè)O(shè)計(jì)并實(shí)現(xiàn)無(wú)人集群系統(tǒng)智能評(píng)價(jià)工具。工具整體采用B-S 架構(gòu),具有評(píng)價(jià)要素管理、評(píng)價(jià)過(guò)程管理及系統(tǒng)仿真管理三大模塊。評(píng)價(jià)要素管理支持評(píng)價(jià)管理人員構(gòu)建包括無(wú)人機(jī)集群、無(wú)人車集群在內(nèi)的不同無(wú)人系統(tǒng),定義集群任務(wù)、環(huán)境及智能等級(jí),管理歷史評(píng)價(jià)數(shù)據(jù)或注入新數(shù)據(jù),支持評(píng)價(jià)方法重新訓(xùn)練及參數(shù)更新。評(píng)價(jià)過(guò)程管理支持評(píng)價(jià)用戶選擇評(píng)價(jià)的對(duì)象、場(chǎng)景、等級(jí)及方法,并可視化展示評(píng)價(jià)結(jié)果。系統(tǒng)仿真管理集成了Pygame 和Gazebo 等無(wú)人集群仿真工具,支持用戶自定義仿真對(duì)象及場(chǎng)景。工具內(nèi)嵌了參數(shù)已調(diào)節(jié)好的評(píng)價(jià)方法模型,支持上傳真實(shí)無(wú)人集群系統(tǒng)數(shù)據(jù)開展評(píng)價(jià),同時(shí)也支持先仿真獲取數(shù)據(jù)再進(jìn)行評(píng)價(jià)。此外,工具支持對(duì)比同一集群的多次評(píng)價(jià)結(jié)果,以開展持續(xù)評(píng)價(jià)衡量無(wú)人系統(tǒng)的成長(zhǎng)性,評(píng)價(jià)結(jié)果為相關(guān)系統(tǒng)開發(fā)人員參考,為后期的系統(tǒng)改進(jìn)和創(chuàng)新做出依據(jù),并為評(píng)價(jià)系統(tǒng)與評(píng)價(jià)對(duì)象協(xié)同進(jìn)化提供支撐。圖8 描述了無(wú)人集群系統(tǒng)評(píng)價(jià)原型工具的架構(gòu)與基本功能模塊。
圖8 工具架構(gòu)與功能設(shè)計(jì)Fig.8 Architecture and functionality of evaluation tools
考慮目標(biāo)搜索為當(dāng)前較為廣泛的無(wú)人機(jī)集群場(chǎng)景,以此為例,對(duì)提出的集群評(píng)價(jià)模型及方法開展驗(yàn)證。
4.2.1 無(wú)人集群系統(tǒng)智能等級(jí)劃分標(biāo)準(zhǔn)實(shí)例
2.2.2 節(jié)中提出的無(wú)人集群系統(tǒng)智能等級(jí)劃分標(biāo)準(zhǔn)可針對(duì)不同的無(wú)人集群進(jìn)行實(shí)例化,本節(jié)針對(duì)無(wú)人機(jī)集群目標(biāo)搜救場(chǎng)景,對(duì)等級(jí)劃分標(biāo)準(zhǔn)進(jìn)行場(chǎng)景實(shí)例化,如表3 所示。
表3 無(wú)人集群目標(biāo)搜索等級(jí)劃分實(shí)例Table 3 Intelligence level instance of unmanned swarm for object searching
4.2.2 基于SL4U 的評(píng)價(jià)場(chǎng)景構(gòu)建
為了描述無(wú)人集群場(chǎng)景,獲取無(wú)人集群系統(tǒng)評(píng)價(jià)數(shù)據(jù),使用SL4U 構(gòu)建了一個(gè)無(wú)人機(jī)搜索場(chǎng)景,并生成任務(wù)代碼分別部署在實(shí)物飛行與仿真環(huán)境,以驗(yàn)證兩者的一致性。任務(wù)開始后,由3 架無(wú)人機(jī)構(gòu)成的集群前往目標(biāo)區(qū)域執(zhí)行搜索任務(wù),確認(rèn)目標(biāo)位置后另外2 架無(wú)人機(jī)從原點(diǎn)出發(fā)前往救援,如實(shí)物飛行場(chǎng)景圖9 所示,圖10 顯示了無(wú)人集群的飛行軌跡。無(wú)人機(jī)集群實(shí)物飛行實(shí)驗(yàn)與基于Gazebo 的仿真飛行實(shí)驗(yàn)具有一致的飛行軌跡,驗(yàn)證了基于SML 獲取無(wú)人集群系統(tǒng)評(píng)價(jià)數(shù)據(jù)的有效性。因此,后續(xù)實(shí)驗(yàn)以Gazebo 仿真為主,獲取評(píng)價(jià)數(shù)據(jù)。
圖9 無(wú)人集群搜救飛行場(chǎng)景Fig.9 Searching scenario of unmanned swarm
圖10 無(wú)人集群搜救飛行軌跡Fig.10 Flight trajectory of unmanned swarm searching scenario
4.2.3 基于算法信息論的評(píng)價(jià)實(shí)例
基于算法信息論的評(píng)價(jià)方法主要步驟是環(huán)境熵值計(jì)算和指標(biāo)獲取,以計(jì)算評(píng)價(jià)指標(biāo)。選取100張同一城市不同區(qū)域地圖,主要分為4 類環(huán)境,包括校園環(huán)境、城市環(huán)境、鄉(xiāng)村環(huán)境以及山地環(huán)境。利用地圖處理方法,得到原始地圖柵格表示,根據(jù)障礙物數(shù)量、密度等計(jì)算環(huán)境熵值,隨后100 組數(shù)據(jù)進(jìn)行異常及無(wú)量綱化處理,最終得到91 組有效數(shù)據(jù),并計(jì)算這些地圖熵值的概率分布。
設(shè)在群體OODA 行為環(huán)中,完成“群體觀察”“群體判斷”“群體決策”“群體執(zhí)行”各階段行為所需最大時(shí)間分別為Δt1、Δt2、Δt3和Δt4,則無(wú)人集群搜索完成的時(shí)間為
TOODA中各時(shí)間點(diǎn)由仿真日志記錄。設(shè)定無(wú)人機(jī)集群由10 個(gè)無(wú)人機(jī)組成,在91 組有效地圖中隨機(jī)選取10 張,針對(duì)如下3 種場(chǎng)景進(jìn)行比較。
場(chǎng)景1環(huán)境中有20 個(gè)靜態(tài)目標(biāo),沒(méi)有無(wú)人機(jī)墜毀。
場(chǎng)景2環(huán)境中有20 個(gè)靜態(tài)目標(biāo),并引入5 個(gè)動(dòng)態(tài)目標(biāo),沒(méi)有無(wú)人機(jī)墜毀。
場(chǎng)景3環(huán)境中有20 個(gè)靜態(tài)目標(biāo),并引入5 個(gè)動(dòng)態(tài)目標(biāo),1 架無(wú)人機(jī)墜毀。
靜態(tài)目標(biāo)指集群起飛前已知曉的目標(biāo),動(dòng)態(tài)目標(biāo)是指集群起飛后才得知的待搜救目標(biāo)。根據(jù)場(chǎng)景柵格地圖信息,采用A*算法為每一個(gè)無(wú)人節(jié)點(diǎn)生成實(shí)際飛行路徑。集群在運(yùn)行中受到突發(fā)障礙物、節(jié)點(diǎn)失效和動(dòng)態(tài)任務(wù)目標(biāo)3 種干擾。針對(duì)突發(fā)障礙物,將其更新到柵格地圖中并使用A*算法重規(guī)劃路徑,其它無(wú)人節(jié)點(diǎn)按照遇到動(dòng)態(tài)任務(wù)目標(biāo)的方式處理。根據(jù)3.3.1 節(jié)中的智能評(píng)價(jià)方法,同一無(wú)人集群在3 種環(huán)境下的智能量化值如表4 所示,其中指標(biāo)權(quán)重由CRITIC 方法確定。
表4 無(wú)人集群系統(tǒng)在不同場(chǎng)景的智能值Table 4 Intelligence value of unmanned swarm system in different scenarios
評(píng)分結(jié)果與直觀一致,在引入動(dòng)態(tài)目標(biāo)后,集群搜救難度提升,智能得分下降。與專家設(shè)計(jì)的無(wú)人集群系統(tǒng)搜救場(chǎng)景等級(jí)2 智能閾值0.6 進(jìn)行比較,集群完成3 個(gè)場(chǎng)景評(píng)價(jià),通過(guò)該等級(jí)場(chǎng)景任務(wù)能力驗(yàn)證。由于地圖集涵蓋了某地的基本地貌,選取的測(cè)試地圖具有隨機(jī)性,選取的任務(wù)要求集群具備路徑重新規(guī)劃等能力,體現(xiàn)了等級(jí)2 的基本要求。因此能夠刻畫集群在某城市執(zhí)行動(dòng)態(tài)搜索的基本表現(xiàn),反映了其智能的高低。
4.2.4 面向?qū)谷蝿?wù)的成長(zhǎng)性評(píng)價(jià)實(shí)例
無(wú)人集群智能特征不僅是評(píng)價(jià)其智能等級(jí)的重要依據(jù),而且有助于反應(yīng)其智能的漸近提升與發(fā)展。成長(zhǎng)性是無(wú)人集群系統(tǒng)智能發(fā)展處于協(xié)同認(rèn)知階段時(shí)的重要特征體現(xiàn),是其在群體判斷方面的主要評(píng)價(jià)要求。以集群圍捕為典型對(duì)抗任務(wù),建立無(wú)人集群系統(tǒng)成長(zhǎng)性評(píng)價(jià)分析案例。
圍捕任務(wù)要求指定區(qū)域的圍捕集群在既定時(shí)間內(nèi)盡可能多的圍捕逃逸集群中的個(gè)體,初始時(shí)圍捕機(jī)和逃逸機(jī)隨機(jī)分布,圍捕機(jī)漫游搜索;若圍捕機(jī)發(fā)現(xiàn)了逃逸機(jī),則進(jìn)入集結(jié)態(tài);隨后對(duì)逃逸機(jī)持續(xù)追蹤,使圍捕機(jī)對(duì)逃逸機(jī)形成合圍,進(jìn)入圍捕態(tài)。當(dāng)圍捕機(jī)集群在逃逸機(jī)周圍形成封閉區(qū)域時(shí),則圍捕成功;若逃逸機(jī)逃離,則圍捕機(jī)根據(jù)當(dāng)前信息推斷可能出現(xiàn)的區(qū)域,并進(jìn)入預(yù)測(cè)搜索態(tài)。
針對(duì)成長(zhǎng)性評(píng)價(jià)要求,首先以規(guī)定時(shí)間內(nèi)完成任務(wù)的情況為依據(jù),選定無(wú)人集群系統(tǒng)成長(zhǎng)性的評(píng)價(jià)指標(biāo)并給定其測(cè)度。
1)圍捕率:被圍捕的逃逸機(jī)個(gè)數(shù)與逃逸機(jī)總數(shù)之比。
2)協(xié)同圍捕率:圍捕態(tài)無(wú)人機(jī)個(gè)數(shù)與圍捕無(wú)人機(jī)總數(shù)之比。
3)協(xié)調(diào)率:最合理圍捕機(jī)數(shù)量與圍捕態(tài)圍捕機(jī)數(shù)量之比。
4)協(xié)同追蹤率:集結(jié)態(tài)圍捕機(jī)個(gè)數(shù)與圍捕機(jī)總數(shù)之比。
5)漫游搜索率:漫游搜索態(tài)無(wú)人機(jī)個(gè)數(shù)與圍捕機(jī)總數(shù)之比。
其次,將CRITIC 賦權(quán)方法與模糊綜合評(píng)價(jià)理論相結(jié)合,確定了無(wú)人集群系統(tǒng)成長(zhǎng)性評(píng)價(jià)模型,如式(3)所示:
式中:n和m分別表示評(píng)價(jià)指標(biāo)的數(shù)目與模糊評(píng)價(jià)集的規(guī)模;pij表示第i個(gè)評(píng)價(jià)指標(biāo)在第j個(gè)評(píng)語(yǔ)上的評(píng)分;wi表示第i項(xiàng)指標(biāo)的權(quán)重,通過(guò)CRITIC 法可在評(píng)價(jià)樣本集上由評(píng)價(jià)指標(biāo)的辨別力與沖突性乘積歸一化得到。
基于MAgent 多智能體強(qiáng)化學(xué)習(xí)平臺(tái)對(duì)集群圍捕對(duì)抗場(chǎng)景進(jìn)行評(píng)價(jià)分析,如圖11 所示[44]。實(shí)驗(yàn)在200?200 的區(qū)域內(nèi)進(jìn)行,初始時(shí)隨機(jī)分布300 個(gè)紅色的圍捕機(jī),100 個(gè)藍(lán)色的逃逸節(jié)點(diǎn)與100 個(gè)灰色的靜態(tài)障礙物,兩方無(wú)人節(jié)點(diǎn)皆對(duì)周圍環(huán)境零認(rèn)知,在深度遞歸Q 網(wǎng)格(Deep Recurrent Q-Network,DRQN)算法引導(dǎo)下完成圍捕和逃逸,圍捕機(jī)/逃逸機(jī)的飛行速度為1/1.5,觀察范圍為5/4。
圖11 無(wú)人集群追捕場(chǎng)景[44]Fig.11 Pursuit scenario of unmanned swarm[44]
基于上述實(shí)驗(yàn),可對(duì)圍捕機(jī)集群在使用DQRN 算法訓(xùn)練模型時(shí)的成長(zhǎng)性進(jìn)行分析。經(jīng)計(jì)算,本實(shí)例中5 個(gè)指標(biāo)所得權(quán)重分別為0.173 6、0.182 7、0.212 0、0.169 3 和0.262 4。圖12 給出了不同迭代輪次對(duì)圍捕集群成長(zhǎng)性的影響,可以看出算法迭代輪次能夠提升無(wú)人集群成長(zhǎng)性,但成長(zhǎng)性的增長(zhǎng)會(huì)隨著迭代輪次的增加逐漸平緩。
圖12 迭代輪次對(duì)成長(zhǎng)性綜合評(píng)分的影響Fig.12 Influence of iterations on growth composite score
上述實(shí)例驗(yàn)證本文評(píng)價(jià)框架能夠客觀對(duì)無(wú)人集群開展評(píng)價(jià),與專家評(píng)價(jià)具有一致性。當(dāng)前,原型工具已結(jié)合某試飛基地研制需求,開展應(yīng)用驗(yàn)證評(píng)價(jià)。
1) 針對(duì)無(wú)人集群系統(tǒng)智能評(píng)價(jià)的迫切需求,根據(jù)應(yīng)用場(chǎng)景的復(fù)雜多樣性特征,提出了基于群體OODA 模型的無(wú)人集群智能等級(jí)劃分。該劃分以定性等級(jí)評(píng)價(jià)為先導(dǎo),以群體OODA 模型為橫向依據(jù),遵循前瞻性、漸近性、均衡性、實(shí)踐性和易用性等原則構(gòu)建,明確了各等級(jí)在群體觀察、群體判斷、群體決策和群體執(zhí)行4 個(gè)方面的具體表現(xiàn),有助于從多維度實(shí)施智能等級(jí)評(píng)價(jià)并推動(dòng)其發(fā)展。該劃分更關(guān)注于無(wú)人集群智能及其特性,更能體現(xiàn)其智能行為發(fā)展過(guò)程,且可針對(duì)不同類型集群結(jié)合應(yīng)用場(chǎng)景進(jìn)行等級(jí)實(shí)例化。此外,當(dāng)前人工智能更多是場(chǎng)景智能,無(wú)法采用一種通用方法對(duì)所有集群評(píng)價(jià)。
2) 針對(duì)無(wú)人集群智能的相對(duì)性,構(gòu)建了場(chǎng)景驅(qū)動(dòng)的評(píng)價(jià)方法,根據(jù)評(píng)價(jià)需求針對(duì)指定集群的發(fā)展水平構(gòu)建相應(yīng)評(píng)價(jià)場(chǎng)景,體現(xiàn)了對(duì)集群不同發(fā)展階段的能力要求,可準(zhǔn)確評(píng)價(jià)無(wú)人集群智能的發(fā)展。