張融愷,閆 鑌
(1. 智能博弈與決策實(shí)驗(yàn)室,北京 100091;2. 信息工程大學(xué)信息系統(tǒng)工程學(xué)院,鄭州 450001)
無人集群是面向未來的熱點(diǎn)研究領(lǐng)域,其具有低成本、低傷亡、高密度、高容錯的特點(diǎn),智能化無人集群更凸顯了分布式分?jǐn)傦L(fēng)險(100-1>0)和協(xié)同式聚合能效(1+1>2)的優(yōu)勢,成為各國科技角力的核心科研領(lǐng)域[1]。各軍事強(qiáng)國紛紛開展了分布式、小規(guī)模的集群作戰(zhàn)平臺研究[2],著眼未來戰(zhàn)爭,發(fā)展智能化、協(xié)同化的無人作戰(zhàn)系統(tǒng)[3]。目前無人系統(tǒng)已基本實(shí)現(xiàn)多無人機(jī)控制能力[4],美國開展了多項(xiàng)無人項(xiàng)目,包括“小精靈”“郊狼”“山鶉”[5],歐盟提出壓制防空無人機(jī)蜂群領(lǐng)域合作[6]。無人集群具備數(shù)量多、密集高、規(guī)?;膬?yōu)勢[7],國內(nèi)也已完成3051 架次的多無人機(jī)的同時控制[8]。
多無人機(jī)進(jìn)一步發(fā)展為無人集群,需要從數(shù)量優(yōu)勢向智能化、協(xié)同化的質(zhì)量優(yōu)勢逐步演進(jìn)。全球人工智能和機(jī)器人峰會構(gòu)想無人集群具有5S需求[9],包括集群化、智能化、小型化、安全性、敏捷性。美國規(guī)劃2025 年無人集群將實(shí)現(xiàn)高度自組織控制并具有戰(zhàn)場認(rèn)知能力[10]。目前無人集群的智能協(xié)同能力仍處于起步階段,研究場景多為靜態(tài)及可控的任務(wù),控制主要依賴預(yù)組織和預(yù)定義的程序,而未來無人集群需要面向動態(tài)復(fù)雜的高不確定性環(huán)境[11]。要實(shí)現(xiàn)無人集群智能協(xié)同能力的提升,腦驅(qū)智能啟發(fā)算法作為無人系統(tǒng)的大腦,是無人機(jī)集群感知、協(xié)同、控制能力的重要來源。
模仿生物群體智能是當(dāng)下無人集群的主要方案,借鑒自然生物群落如蟻群、蜂群、狼群的集群行為,運(yùn)用簡單的內(nèi)部規(guī)則條件控制整體行動,促進(jìn)早期無人系統(tǒng)控制獲得一定的自主能力。然而在面向復(fù)雜動態(tài)環(huán)境時,生物群體涌現(xiàn)的集群智能具有一定局限性,例如生物群體啟發(fā)的無人集群組成要素相對單一,各模塊間交互方式較為固定,智能形式呈現(xiàn)初級的自下而上模式。仿生集群方案可能面臨發(fā)展受限的問題在整體遷移性和適用性方面有待提升,難以實(shí)現(xiàn)在復(fù)雜多任務(wù)場景中的有效應(yīng)用。
隨著腦科學(xué)及神經(jīng)科學(xué)在近幾十年的快速發(fā)展[12],腦啟發(fā)算法為無人集群智能演化提供了另一種仿生思路。大腦作為自然界公認(rèn)的高級智能系統(tǒng),借鑒類腦智能的感知、決策、規(guī)劃能力成為多領(lǐng)域研究的發(fā)展趨勢。類腦智能是指受腦機(jī)制和人類認(rèn)知過程啟發(fā),基于計(jì)算建模通過軟硬件結(jié)合實(shí)現(xiàn)的機(jī)器智能[13]。人造系統(tǒng)經(jīng)過了漫長的迭代升級,然而目前沒有一種通用智能系統(tǒng)能達(dá)到人腦的智力水平[12]。因此大量研究均面向人腦的多維感知能力、環(huán)境適應(yīng)能力、自主學(xué)習(xí)能力,以促進(jìn)人造智能系統(tǒng)在相關(guān)領(lǐng)域能力的突破。目前類腦研究主要包括兩個方面,模擬大腦神經(jīng)元模型的類腦芯片,以及智能感知的類腦機(jī)器人。類腦智能在無人系統(tǒng)領(lǐng)域已開展了初步的探索,包括多維復(fù)雜態(tài)勢信息感知、分布式任務(wù)的方案優(yōu)化、無人機(jī)故障排查、無人系統(tǒng)實(shí)時路徑規(guī)劃等[13]。歐盟啟動的腦計(jì)劃研究中部署了人腦模型的高級計(jì)算架構(gòu),通過模仿人腦的工作模式啟發(fā)未來的計(jì)算機(jī)及機(jī)器人開發(fā)。類腦模型的SOAR(State,Operator,and Result,狀態(tài)、操作者和結(jié)果)架構(gòu)[14]也廣泛應(yīng)用于計(jì)算科學(xué)、機(jī)器人控制、智能感知等領(lǐng)域。此外,腦模型在硬件領(lǐng)域啟發(fā)了類腦芯片的研發(fā)和應(yīng)用,未來的高性能計(jì)算架構(gòu)將獲得類腦的低功耗和高并行能力[15]。目前廣泛研究的人工神經(jīng)網(wǎng)絡(luò)也參考大腦的功能結(jié)構(gòu),全連接網(wǎng)絡(luò)層借鑒了神經(jīng)元的連接模式,卷積神經(jīng)網(wǎng)絡(luò)模仿視覺系統(tǒng)的感受野,長短時記憶網(wǎng)絡(luò)的優(yōu)異性能受到記憶機(jī)制啟發(fā),脈沖神經(jīng)網(wǎng)絡(luò)融入了神經(jīng)元的激活和抑制特性。腦系統(tǒng)作為通用智能的參考模板,科研人員希望能夠充分學(xué)習(xí)其出色的知識遷移能力和自組織能力[16]。
現(xiàn)有無人集群的類腦研究處于起步階段,人工神經(jīng)網(wǎng)絡(luò)應(yīng)用成為當(dāng)下主流的仿腦模式,集群的腦啟發(fā)形式仍以應(yīng)用人工神經(jīng)網(wǎng)絡(luò)為標(biāo)志,這與現(xiàn)有計(jì)算設(shè)備的硬件與軟件約束有關(guān)。然而,人工網(wǎng)絡(luò)的仿腦原理與腦啟發(fā)的類腦機(jī)制不同,其在硬件構(gòu)成和功能實(shí)現(xiàn)上與真實(shí)大腦仍有差異。研究人員逐漸重視真實(shí)大腦與無人集群的關(guān)系,借鑒大腦模型構(gòu)建無人系統(tǒng),在類腦的宏觀層面上開展了無人集群的交叉研究。Zhao等[17]受到腦機(jī)制的啟發(fā),研究模仿人腦記憶通路的無人集群決策模塊,構(gòu)建個體知識庫以實(shí)現(xiàn)熟悉場景的快速洞察。無人系統(tǒng)模仿人腦路徑規(guī)劃能力,在復(fù)雜環(huán)境中動態(tài)規(guī)劃最優(yōu)路徑。魏瑞軒等[18]的研究中,運(yùn)用高密度無人集群解決碰撞問題,構(gòu)建丘腦-基底核-額葉皮層的類腦通路,協(xié)助無人集群獲得“條件反射”的實(shí)時快速調(diào)整方案。
類腦與無人系統(tǒng)的混合智能組合模式,一方面借鑒了人腦的智能決策能力,另一方面充分發(fā)揮了無人系統(tǒng)在危險惡劣環(huán)境中的執(zhí)行能力,人機(jī)結(jié)合能夠相互取長補(bǔ)短,為無人系統(tǒng)賦人腦智能將有效融合二者優(yōu)勢。研究人員已在多種無人系統(tǒng)中探索類腦方法[19],在多種無人集群的現(xiàn)實(shí)任務(wù)中獲得效能增益。強(qiáng)化學(xué)習(xí)是借鑒人與環(huán)境的交互模式[20],通過模仿人類在環(huán)境中獲得收益或懲罰的反饋通路 ,優(yōu)化無人機(jī)間的通信策略[21],訓(xùn)練無人系統(tǒng)與想定環(huán)境實(shí)時交互以獲得性能的快速迭代優(yōu)化,通過自學(xué)習(xí)過程實(shí)現(xiàn)自動的增量知識獲取。此外,類腦的智能無人集群應(yīng)進(jìn)一步拓展應(yīng)用領(lǐng)域,集群模型框架不應(yīng)約束無人機(jī)的運(yùn)行空間,系統(tǒng)應(yīng)面向體系和框架的構(gòu)建,從而打破空域壁壘實(shí)現(xiàn)跨域協(xié)同。無人集群智能的類腦啟發(fā)路線仍處于初步探索階段,腦科學(xué)的快速發(fā)展也發(fā)掘出多種創(chuàng)新的認(rèn)知理論。無人集群與類腦集合是人腦智能的復(fù)刻、拓展、延伸,多層次的腦機(jī)制模仿和運(yùn)用為無人系統(tǒng)提供了廣闊的融合發(fā)展空間。
本文對無人集群系統(tǒng)提出了多角度的探索思路,從端、邊、云三個角度討論了腦機(jī)制與無人系統(tǒng)的結(jié)合方式,為類腦和無人集群的混合智能構(gòu)建了具體方案。首先,對單體無人機(jī)的構(gòu)成要素進(jìn)行分析,參考神經(jīng)元和腦功能結(jié)構(gòu)提出通用異構(gòu)的無人機(jī)設(shè)計(jì)思路。其次,借鑒腦機(jī)制的神經(jīng)通路模型,將高效、低功耗優(yōu)勢應(yīng)用于無人集群的拓?fù)浜玩溌贩桨浮4送?,基于人腦雙向、多循環(huán)的視覺加工機(jī)制,構(gòu)建無人系統(tǒng)從感知到?jīng)Q策的環(huán)形信息交互體系。綜合上述類腦無人集群的基礎(chǔ)架構(gòu),模仿人腦的自修復(fù)、自組織、自適應(yīng)、自學(xué)習(xí)等高級認(rèn)知功能,進(jìn)一步提升無人集群的長期穩(wěn)定和自我進(jìn)化能力。最后,面向現(xiàn)階段的無人集群和類腦研究基礎(chǔ),展望后續(xù)類腦無人智能集群的探索方向。
個體無人機(jī)模仿大腦神經(jīng)元的基本結(jié)構(gòu),探索單體無人機(jī)在節(jié)點(diǎn)層面的設(shè)計(jì)方法。個體無人機(jī)是無人集群的基本實(shí)體單位,承擔(dān)觀察、通信、決策等細(xì)分任務(wù)。人腦的基本單元結(jié)構(gòu)是神經(jīng)元,在處理復(fù)雜事項(xiàng)時也可將腦功能區(qū)作為細(xì)分模塊。無人機(jī)的層次化劃分與大腦分層結(jié)構(gòu)具有共通性。本文從神經(jīng)元和腦功能區(qū)兩個類腦尺度進(jìn)行分析,討論腦啟發(fā)的未來個體無人機(jī)結(jié)構(gòu)。
平臺通用、載荷異構(gòu)的個體無人機(jī)形態(tài)具有低成本、高復(fù)用的優(yōu)勢,有利于提升無人集群整體構(gòu)建的共融協(xié)同能力。平臺通用提升了無人機(jī)間的溝通效率,并節(jié)約了開發(fā)多平臺的時間和經(jīng)濟(jì)成本。載荷異構(gòu)為無人機(jī)的任務(wù)多樣化提供了可能,便于無人集群在執(zhí)行復(fù)雜任務(wù)時細(xì)化分配子任務(wù)。前期規(guī)范化的無人機(jī)個體設(shè)計(jì)有利于集群間協(xié)作,并提升集群的再組織能力。
個體無人機(jī)可參考腦結(jié)構(gòu)中神經(jīng)元這一基本結(jié)構(gòu)和功能單位,在底層模型構(gòu)件中盡量趨同相似以實(shí)現(xiàn)平臺同構(gòu),在子任務(wù)中細(xì)化要素形成載荷異構(gòu)。大腦的神經(jīng)元基礎(chǔ)形態(tài)由胞體和軸突組成,各腦區(qū)神經(jīng)元的分子組成和主要形態(tài)并無顯著區(qū)別,根據(jù)各神經(jīng)元的任務(wù)需要演化為多種功能特質(zhì),各神經(jīng)元的胞體突起大小、軸突長短、釋放神經(jīng)遞質(zhì)種類可能存在顯著差異。參考大腦的神經(jīng)元分類方法,感覺神經(jīng)元負(fù)責(zé)刺激的傳入和感知,聯(lián)絡(luò)神經(jīng)元擔(dān)任神經(jīng)脈沖的任務(wù)傳遞,運(yùn)動神經(jīng)元主要指導(dǎo)骨骼肌的運(yùn)動。如圖1 所示,感知無人機(jī)可根據(jù)任務(wù)分工搭載功能性模塊,觀測無人機(jī)掛載紅外、雷達(dá)等感知模組,通信無人機(jī)配備鏈路交互單元,執(zhí)行無人機(jī)裝載執(zhí)行任務(wù)的專用儀器。無人集群可模仿人腦工作模式,在實(shí)際任務(wù)執(zhí)行中借鑒大腦的信息處理機(jī)制。類腦智能的無人集群在遂行任務(wù)中遵循OODA(Observation 觀察、Orientation 判斷、Decision 決策、Action執(zhí)行)環(huán)路,其常規(guī)協(xié)同流程如下:感知無人機(jī)類似無人集群的眼睛,主要負(fù)責(zé)觀察不同階段以獲取前方態(tài)勢信息,并將態(tài)勢信息源源不斷上傳至臨近通信無人機(jī);通信無人機(jī)類似無人集群的大腦和嘴巴,負(fù)責(zé)態(tài)勢信息的收集、整合和溝通,主要實(shí)現(xiàn)判斷和決策任務(wù),一方面將感興趣目標(biāo)信息反饋回感知無人機(jī)進(jìn)行進(jìn)一步觀測,另一方面指揮執(zhí)行無人機(jī)完成預(yù)期任務(wù);執(zhí)行無人機(jī)類似無人集群的雙手,主要負(fù)責(zé)執(zhí)行階段,基于搭載設(shè)備實(shí)現(xiàn)有利于集群的現(xiàn)實(shí)操作。神經(jīng)元在生物演化中進(jìn)化出整體形態(tài)相近、功能細(xì)化不同的通用異構(gòu)形態(tài),兼具低成本、高平替的特性,可以作為個體無人機(jī)規(guī)劃的參考模型。
圖1 通用異構(gòu)無人機(jī)的類腦設(shè)計(jì)Fig.1 Brain-inspired design of general heterogeneous UAV swarm
通用異構(gòu)設(shè)計(jì)方案與美軍最新的馬賽克作戰(zhàn)思想契合[19],運(yùn)用統(tǒng)一的開放式架構(gòu),應(yīng)用成熟的商用接口,面向特定任務(wù)為通用無人機(jī)部署特種功能[22]。馬賽克作戰(zhàn)思想[23]是基于大量單一、可平替的低成本平臺,構(gòu)建靈活自適應(yīng)的無人集群,以提升無人機(jī)間互操作性和自適應(yīng)性[24]。一方面,無人集群的底層個體元素由統(tǒng)一規(guī)范接口的通用無人機(jī)組成,可有效提升內(nèi)部數(shù)據(jù)共享及信息傳輸效能。另一方面,根據(jù)任務(wù)需求設(shè)計(jì)無人機(jī)的異構(gòu)方案,有利于集群的靈活組合和功能復(fù)用,提升無人系統(tǒng)整體針對動態(tài)復(fù)雜環(huán)境任務(wù)的執(zhí)行能力。
無人集群與個體無人機(jī)間一般存在多個層級,中間層級增設(shè)可提升底層組織能力和模塊間協(xié)同效率。部分無人機(jī)組成的中間層級可借鑒腦功能區(qū)的規(guī)劃模式,底層個體按照相近功能進(jìn)行聚合。
研究人員發(fā)現(xiàn)大腦的信息加工主體為腦功能區(qū),目前公認(rèn)的布洛德曼分區(qū)將大腦劃分為52 個區(qū)。解剖學(xué)研究發(fā)現(xiàn)刺激相應(yīng)腦區(qū)會影響特定認(rèn)知功能,熒光蛋白標(biāo)記研究驗(yàn)證了大腦工作依靠腦功能區(qū)間的協(xié)作。這些負(fù)責(zé)特定感知信息處理的腦功能區(qū)包括:處理視覺信息的枕葉視覺功能區(qū)、控制肢體運(yùn)動的頂葉運(yùn)動皮層、加工聽覺信息的顳葉聽覺皮層。功能區(qū)內(nèi)部的神經(jīng)元結(jié)構(gòu)和功能相近,能夠集中高效處理特定的任務(wù)信息。Tang 等模仿大腦的功能區(qū)分布提出了SPAUN 腦模擬器[25],在SPAUN 腦模擬器[26]中設(shè)置了250 萬個模擬神經(jīng)元,并將其劃分為10 個模擬腦功能區(qū),這項(xiàng)多腦區(qū)協(xié)同計(jì)算模型具有開創(chuàng)性意義。無人集群的子部分可以模擬腦功能區(qū)的聚合形式,縮小功能相近的無人機(jī)間的距離。需要注意的是,無人機(jī)間的距離減小可以是空間距離,也可以延伸為拓?fù)浣Y(jié)構(gòu)的連接距離,其主要目標(biāo)都是降低相近信息整合與交互過程中的通信損耗。此外,無人集群的分層設(shè)計(jì)可以借鑒視覺區(qū)V1、V2、V3的大腦層級架構(gòu),聚合單體神經(jīng)元的視覺能力,形成處理亮度、輪廓、紋理的高級功能。分布式的無人機(jī)個體通過聚合集中,形成超越個體的群體處理能力,得以完成高級復(fù)雜任務(wù)。
目前的無人集群主要執(zhí)行短時間的在外任務(wù),執(zhí)行長時任務(wù)需要對無人機(jī)功能分層管理。無人集群在外長期執(zhí)行任務(wù),需要穩(wěn)定可靠的生存能力,同時要具備持續(xù)更新的自學(xué)習(xí)能力。如圖2所示,大腦在進(jìn)化中逐漸發(fā)展為三層結(jié)構(gòu),底層爬蟲腦負(fù)責(zé)呼吸、體溫等生命維持功能,中層哺乳腦發(fā)育出捕食及社交能力,高層的皮質(zhì)腦進(jìn)化出人類的感知、決策和判斷功能。爬蟲腦、哺乳腦和皮質(zhì)腦分別代表了人類的生存需求、生活需求和進(jìn)化需求。當(dāng)下無人集群的發(fā)展處于爬蟲腦向哺乳腦的進(jìn)化階段,可借鑒人腦的進(jìn)化路徑增加相應(yīng)功能,首先實(shí)現(xiàn)自組織的通信和觀測能力,再逐步拓展自學(xué)習(xí)的進(jìn)化迭代功能。
圖2 類腦無人集群的功能分層管理Fig.2 Functional hierarchical management of brain-inspired UAV swarm
無人集群的分布式結(jié)構(gòu)可抽象為邊和節(jié)點(diǎn)的關(guān)系,個體元素間穿點(diǎn)成線形成集群整體,通過溝通連接共同完成任務(wù)。無人機(jī)間的連接和分布可參考大腦信息加工模式,腦系統(tǒng)進(jìn)化過程中篩選出的拓?fù)浣Y(jié)構(gòu)和連接模式是優(yōu)質(zhì)模板。本文基于腦啟發(fā)的通信等級、交互環(huán)路、網(wǎng)絡(luò)組織三個層次探討無人集群的類腦交互模式。通信等級劃分中,對海量信息進(jìn)行取舍并排序加工優(yōu)先級,預(yù)設(shè)專屬鏈路實(shí)現(xiàn)重要信息優(yōu)先處理。交互環(huán)路設(shè)計(jì)中,雙向內(nèi)外循環(huán)的指揮鏈路形成指令反饋環(huán)路并提升信息交互效率。網(wǎng)絡(luò)組織規(guī)劃中,節(jié)點(diǎn)拓?fù)浣M織形式模仿穩(wěn)定高效的“小世界”腦網(wǎng)絡(luò)。
無人集群在執(zhí)行任務(wù)時有大量信息排隊(duì)等待處理,包括原始環(huán)境采集數(shù)據(jù)和海量中間處理文件。無人系統(tǒng)對信息重要性排序并優(yōu)先處理關(guān)鍵任務(wù),將提升整體任務(wù)規(guī)劃能力并優(yōu)化數(shù)據(jù)加工流程。無人集群經(jīng)常面對目標(biāo)價值排序和任務(wù)優(yōu)先級設(shè)置問題,在規(guī)劃多任務(wù)時可參考腦系統(tǒng)中的通路設(shè)置,以類腦的專屬通路和預(yù)設(shè)通路為例,啟發(fā)無人系統(tǒng)的任務(wù)分配方案。
無人集群在分布式協(xié)作時首先要分清敵我,敵我識別的混亂將混淆任務(wù)對象和合作伙伴。大腦在進(jìn)化過程中為自我認(rèn)知構(gòu)建了專屬通路,以回答“誰是我們的敵人?誰是我們的朋友?”腦機(jī)制的自我識別功能中最具代表性的是“雞尾酒原理”,即人們在嘈雜的雞尾酒會中也能清晰地聽到自己的名字。研究發(fā)現(xiàn)人腦在潛意識下也在自動捕捉自我相關(guān)信息,當(dāng)自我屬性信息出現(xiàn)時會喚醒大范圍的大腦皮層。在心理學(xué)實(shí)驗(yàn)中被試對自我姓名和面部的按鍵反應(yīng)更快,并且對自我信息的靈敏度更高。核磁掃描發(fā)現(xiàn)大腦對自我信息有特異性反應(yīng),包括自我識別的專屬通路和右前額葉腦區(qū)的特異性激活。無人集群在自我識別時也可參照大腦機(jī)制,一方面通過設(shè)置專屬通路提升敵我識別加工的優(yōu)先性,另一方面分配部分線程進(jìn)行自動持續(xù)的身份驗(yàn)證。無人集群對自我識別的優(yōu)先處理有利于敵我態(tài)勢的實(shí)時感知,及時評估集群現(xiàn)存的行動能力,快速調(diào)整任務(wù)規(guī)劃并提供信息支撐。
無人集群大多采用固定處理流程加工環(huán)境信息,通用處理模板的多樣性感知信息能力仍有待提升,集群可以對感知信息預(yù)先分類并分配至預(yù)設(shè)通路進(jìn)行針對性加工。例如,無人集群的目標(biāo)檢測及定位可參考大腦視覺的工作模式,信息的分類加工可以參考大腦視覺處理的兩條預(yù)設(shè)通路。進(jìn)行物體的視覺加工任務(wù)時,物體的識別通過大腦腹側(cè)的“what”通路加工,而物體的位置和運(yùn)動信息通過大腦背側(cè)的“where”通路處理?!皐hat”和“where”通路分別預(yù)設(shè)了不同的視覺加工能力,前期視覺任務(wù)分類后會歸屬到特定通路進(jìn)行針對性加工。無人集群在任務(wù)處理時可借鑒預(yù)設(shè)通路的模式,預(yù)設(shè)多種人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)處理多樣化數(shù)據(jù)。如圖3 所示,以集群收集到的圖像、時序、拓?fù)湫畔槔?,采集到的視覺圖像數(shù)據(jù)應(yīng)用卷積神經(jīng)網(wǎng)絡(luò),音頻及雷達(dá)等時序信號使用長短時記憶網(wǎng)絡(luò),集群的拓?fù)鋱D信息運(yùn)用圖神經(jīng)網(wǎng)絡(luò)等,發(fā)揮神經(jīng)網(wǎng)絡(luò)各自優(yōu)勢處理類型匹配的環(huán)境數(shù)據(jù)。將不同任務(wù)分配給專業(yè)的信息加工通路,提升差異性任務(wù)的定制化加工能力。
圖3 無人集群處理多模態(tài)數(shù)據(jù)的專屬通路Fig.3 The exclusive path of the UAV swarm processes multimodal data
無人集群任務(wù)執(zhí)行中的信息主要在感受節(jié)點(diǎn)和決策節(jié)點(diǎn)間傳遞,信息傳遞方向大多為從感受節(jié)點(diǎn)到?jīng)Q策節(jié)點(diǎn)的單向自下而上模式,以及決策節(jié)點(diǎn)實(shí)時控制末端節(jié)點(diǎn)的單向自上而下模式[27]。如圖4所示,OODA 模型提出后,部分無人集群采用觀察、判斷、決策、行動的4 步驟,形成周期性重復(fù)的單向閉環(huán),規(guī)范了無人系統(tǒng)任務(wù)執(zhí)行的操作流程。現(xiàn)有OODA 模型仍可以進(jìn)一步優(yōu)化創(chuàng)新,包括縮短環(huán)路運(yùn)行周期,以及提升信息利用效率。本文提出類腦的雙向內(nèi)外循環(huán)的信息傳輸環(huán)路,雙向通路促進(jìn)了層級間信息流向的多樣化,內(nèi)外循環(huán)增加了外部數(shù)據(jù)及中間信息的復(fù)用效率。
圖4 無人集群的指令鏈路Fig.4 The instruction link of UAV swarm
外部信息的通路可以參考多級視覺皮層的信息流向,視覺信息加工框架可以應(yīng)用到無人集群的通信過程中。研究人員起初認(rèn)為視覺信息從低級V1 區(qū)逐漸向高級區(qū)V2、V3、V5 傳遞,進(jìn)一步研究發(fā)現(xiàn)高級視覺區(qū)能夠指導(dǎo)低級區(qū)的信息處理,形成了雙向的信息交互通路,例如高級認(rèn)知分配更多注意力調(diào)整低級視覺區(qū)關(guān)注感興趣的圖像細(xì)節(jié)。更深入的研究發(fā)現(xiàn)V2、V3、V4 存在內(nèi)部信息的循環(huán)交互,信息處理中產(chǎn)生的亮度、顏色、輪廓等特征經(jīng)歷了循環(huán)加工,內(nèi)部信息循環(huán)有效提升了數(shù)據(jù)利用率。研究人員在人工智能領(lǐng)域中,探索使用過雙向循環(huán)的類腦模型,例如圖靈獎得主、深度學(xué)習(xí)先驅(qū) Geoffrey Hinton 提出未來人工智能將應(yīng)用“前向-前向”的前向網(wǎng)絡(luò),在反向傳播的基礎(chǔ)上推廣了更接近大腦機(jī)制的正向傳播算法。
無人集群的防碰撞研究正在探索雙向內(nèi)外循環(huán)的交互方式,Girard等將腦啟發(fā)的碰撞規(guī)避原理應(yīng)用于無人集群的碰撞規(guī)避[28],其提出的基底核-丘腦-額葉交互模式中包含雙向通路和多層循環(huán)。魏瑞軒等提出自主心智發(fā)育的無人機(jī)防碰撞控制架構(gòu)[18],借鑒類腦模型中的避障航路方法,構(gòu)建了以知識庫、避障策略、威脅模式為功能節(jié)點(diǎn)的雙線循環(huán)通路。ACT-R模型[29]應(yīng)用腦啟發(fā)的功能區(qū)環(huán)路建模,實(shí)現(xiàn)了特定任務(wù)中的活動預(yù)測。
目前無人集群的主要拓?fù)浣Y(jié)構(gòu)包括:星形組網(wǎng)、中心式組網(wǎng)、網(wǎng)狀組網(wǎng)、分層混合組網(wǎng)等?,F(xiàn)實(shí)中根據(jù)任務(wù)難度評估無人集群所需的穩(wěn)定性、效率、交互性等因素,側(cè)重任務(wù)需求選擇相應(yīng)的拓?fù)浣Y(jié)構(gòu)。然而人為預(yù)設(shè)定的拓?fù)浞绞诫y以滿足動態(tài)的環(huán)境變化,任務(wù)牽引的無人集群自適應(yīng)拓?fù)浞绞礁蠌?fù)雜多變的現(xiàn)實(shí)任務(wù)。其中,為無人集群設(shè)計(jì)優(yōu)質(zhì)的默認(rèn)網(wǎng)絡(luò)結(jié)構(gòu)將大大降低自適應(yīng)難度,促進(jìn)集群在默認(rèn)網(wǎng)絡(luò)基礎(chǔ)上的優(yōu)化改進(jìn)。
大腦在長期進(jìn)化中發(fā)展出一套高效穩(wěn)定的基礎(chǔ)網(wǎng)絡(luò)結(jié)構(gòu),“小世界”的拓?fù)湫问皆诙喾N腦網(wǎng)絡(luò)中得以驗(yàn)證[30]。如圖5所示,“小世界”規(guī)律是指融合了相鄰節(jié)點(diǎn)的密集連接以及遠(yuǎn)距離節(jié)點(diǎn)的長程連接,其結(jié)合了正則網(wǎng)絡(luò)的穩(wěn)定性優(yōu)勢和隨機(jī)網(wǎng)絡(luò)的效率優(yōu)勢,既穩(wěn)固了相近節(jié)點(diǎn)的合作又降低了信息長傳的中轉(zhuǎn)次數(shù),在聚類能力和連接代價中保持了平衡。已有多項(xiàng)研究將“小世界”模型應(yīng)用在城市交通和社區(qū)建設(shè)中。上文將個體無人機(jī)類比大腦神經(jīng)元或功能區(qū),腦網(wǎng)絡(luò)的拓?fù)浞椒ㄍ瑯涌梢砸浦矐?yīng)用于無人機(jī)集群,提升功能相似無人機(jī)的通信頻率,增加處理任務(wù)時同類無人機(jī)的協(xié)作能力,保留部分長程中繼通信能力,為無人集群間的遠(yuǎn)距離交互留有溝通鏈路。無人集群根據(jù)環(huán)境進(jìn)行自適應(yīng)調(diào)整時,只需在默認(rèn)“小世界”拓?fù)浣Y(jié)構(gòu)中調(diào)整臨近聚類密度和長程連接數(shù)量,這將有效降低網(wǎng)絡(luò)優(yōu)化難度和重組織時間。
圖5 無人集群的交互連接方式Fig.5 Interactive connection mode of UAV swarm
通過在個體無人機(jī)與集群交互的底層框架基礎(chǔ)上構(gòu)成靜態(tài)骨架,織線成面的無人集群將進(jìn)化出更高的協(xié)同智能,實(shí)現(xiàn)動態(tài)組織和自我進(jìn)化的軟實(shí)力提升。目前的無人系統(tǒng)在高損傷情況下難以達(dá)到與腦系統(tǒng)一樣的魯棒性,并且在復(fù)雜環(huán)境中缺少穩(wěn)定的自組織協(xié)同能力。類腦無人集群借鑒人腦的自修復(fù)性提升抗毀自愈能力,應(yīng)用腦機(jī)制的自組織方案改善整體協(xié)調(diào)功能,參考腦啟發(fā)的自學(xué)習(xí)模式促進(jìn)集群持續(xù)優(yōu)化迭代。
無人集群運(yùn)行時會面臨部分節(jié)點(diǎn)失靈或損毀情況,子功能損傷可能引起上下游信息擁堵,節(jié)點(diǎn)損壞會進(jìn)一步導(dǎo)致整體性能缺陷。目前應(yīng)對突發(fā)情況通常設(shè)置緊急預(yù)案,評估集群整體損傷等級后執(zhí)行備選方案。有限固定方案難以精確應(yīng)對復(fù)雜損傷問題,無人集群仍需提升針對現(xiàn)實(shí)受損情況的自我修復(fù)能力。無人集群可以參照大腦強(qiáng)大的自我修復(fù)功能,極端案例表明,患者在失去一半大腦后仍有機(jī)會存活。本文以大腦的日常修復(fù)、部分損傷、嚴(yán)重?fù)p傷為例,討論無人集群的類腦修復(fù)方案。
日常維護(hù)是保證無人集群穩(wěn)定運(yùn)行的基礎(chǔ),無人機(jī)的狀態(tài)評估和診斷預(yù)測將有效降低其老化受損風(fēng)險。無人機(jī)自我診斷領(lǐng)域逐漸使用深度學(xué)習(xí)方法[31],Guo 等利用卷積神經(jīng)網(wǎng)絡(luò)預(yù)測無人機(jī)傳感器的故障[32],彭軍等應(yīng)用深度信念網(wǎng)絡(luò)進(jìn)行發(fā)動機(jī)的故障分類[33]。無人集群進(jìn)行周期性的測試檢修,其檢修頻率可以參考大腦睡眠周期。通常大腦在夜間睡眠時會進(jìn)行白天受損神經(jīng)元的修復(fù),在評估白天工作量和神經(jīng)元受損狀態(tài)后調(diào)整睡眠休整時長。無人集群可借鑒大腦調(diào)整工作強(qiáng)度與睡眠時長的規(guī)律,評估無人集群的任務(wù)難度以調(diào)整檢修頻率,交替排布無人機(jī)的檢修和工作時間表。
無人集群的部分損傷可通過鏈路重分配方式,從全局角度尋找重組方案來盡可能保持集群的整體性能。如圖6 所示,這種全局尋優(yōu)的修復(fù)方式可參考大腦機(jī)制,例如視力障礙患者的觸覺聽覺功能得到加強(qiáng),肢體永久損傷對應(yīng)腦區(qū)的神經(jīng)元會被近鄰腦功能區(qū)延伸占用。神經(jīng)元功能復(fù)用和重分配有效緩解了部分節(jié)點(diǎn)損失,可以延伸應(yīng)用到受損節(jié)點(diǎn)的周圍無人機(jī),與集群整體重新建立連接。通過充分利用剩余無人機(jī)構(gòu)建新的上下游連接,保障和加強(qiáng)集群內(nèi)其他功能通路的有效運(yùn)行,實(shí)現(xiàn)功能自愈并保持整體執(zhí)行能力。在集群設(shè)計(jì)初期應(yīng)預(yù)留容錯空間,布設(shè)一定比例的冗余節(jié)點(diǎn),實(shí)現(xiàn)損傷個體無人機(jī)的快速替換。若預(yù)留的冗余無人機(jī)仍難以填充現(xiàn)有損失缺口,可以參考大腦中神經(jīng)干細(xì)胞的更新方式,整合各損傷無人機(jī)中完好的部分零件,拼湊重新組合成新的組裝無人機(jī),維持集群的基本運(yùn)行。
圖6 無人集群的自修復(fù)、自組織功能Fig.6 The self-repairing and self-organizing functions of UAV swarm
目前無人集群出廠及行動前被植入基礎(chǔ)功能,使用目標(biāo)相似任務(wù)數(shù)據(jù)庫進(jìn)行離線學(xué)習(xí)。然而,離線學(xué)習(xí)數(shù)據(jù)庫的方式有一定的時間滯后性,并且需要將數(shù)據(jù)庫在目標(biāo)任務(wù)間遷移,難以適應(yīng)動態(tài)未知的現(xiàn)實(shí)任務(wù)環(huán)境。知識的獲取有利于無人集群智能化的提升,可以參考人腦對新知識的學(xué)習(xí)模式,增加無人集群在任務(wù)中的自學(xué)習(xí)能力,獲取真實(shí)環(huán)境中的動態(tài)知識。如圖7 所示,類腦無人集群的學(xué)習(xí)可以分為3 個階段:在學(xué)習(xí)庫中存儲知識、與環(huán)境交互過程中掌握知識、開辟空間持續(xù)拓展知識。
圖7 無人集群的自學(xué)習(xí)流程Fig.7 Self-learning process of UAV swarm
無人集群通過任務(wù)獲取的數(shù)據(jù)不斷擴(kuò)大知識庫,提煉整合感知的信息加入自身知識庫是自學(xué)習(xí)功能的第一步。記憶功能可參考大腦海馬體和丘腦的存儲模式,將任務(wù)經(jīng)歷重演形成知識庫的長期記憶。知識庫的構(gòu)建將動態(tài)信息持續(xù)整合形成經(jīng)驗(yàn)累積[34],同時便于相近任務(wù)決策時的知識快速檢索,縮短無人機(jī)的反應(yīng)時間。研究學(xué)者受大腦記憶模式啟發(fā),提出了可塑突出形態(tài)的赫布法則[35],深度學(xué)習(xí)領(lǐng)域也將模擬人腦神經(jīng)元的脈沖神經(jīng)網(wǎng)絡(luò)應(yīng)用于機(jī)器的記憶能力研究[17]。在無人系統(tǒng)的知識庫構(gòu)建研究中, 魏瑞軒等在無人機(jī)避障方法中引用規(guī)避策略知識庫,模擬丘腦對知識的增量獲取功能,提升無人機(jī)預(yù)防碰撞的策略發(fā)育[18]。
無人集群在知識庫的基礎(chǔ)上還需反復(fù)強(qiáng)化運(yùn)用新知識,與環(huán)境交互測試中強(qiáng)化新知識記憶通路和運(yùn)用能力,在真實(shí)場景下改善無人系統(tǒng)的環(huán)境自適應(yīng)性。強(qiáng)化學(xué)習(xí)模仿大腦的學(xué)習(xí)過程[36],通過環(huán)境反饋的獎勵結(jié)果優(yōu)化現(xiàn)有知識結(jié)構(gòu),這種無需人工干預(yù)和標(biāo)記的方法,被廣泛應(yīng)用于機(jī)器智能體的自學(xué)習(xí)過程中。Qiao 等模擬內(nèi)顳葉皮層對視覺能力設(shè)計(jì)了強(qiáng)化學(xué)習(xí)框架,提升了智能體物體識別在遮蔽、旋轉(zhuǎn)等不同視角下的魯棒性[37]。Jafari 等提出了大腦情緒模型啟發(fā)的智能控制器,情緒機(jī)制啟發(fā)的無人系統(tǒng)具有小型化和實(shí)時性優(yōu)勢,在無人機(jī)飛行測試中展現(xiàn)出更強(qiáng)的抗干擾能力[38]。機(jī)器憑借自身算力優(yōu)勢,強(qiáng)化學(xué)習(xí)的智能體在個別領(lǐng)域的能力甚至超越人類,例如DeepMind 提出的AlphaGo Zero 展現(xiàn)出極強(qiáng)的圍棋技術(shù),以及Neural Turing Machine 在多智能體協(xié)同的星際爭霸游戲中擊敗了人類世界級選手。
強(qiáng)化學(xué)習(xí)的運(yùn)用提升了無人集群的學(xué)習(xí)技能,增量學(xué)習(xí)將進(jìn)一步提升無人系統(tǒng)的終身學(xué)習(xí)能力。無人集群對新知識的增量學(xué)習(xí)促進(jìn)系統(tǒng)保持長久的進(jìn)化趨勢,同時系統(tǒng)應(yīng)保持新舊知識的更替,替換失效舊知識為新知識提供記憶空間。新舊知識替換過程可以借鑒大腦的遺忘機(jī)制,頻繁使用的知識會加強(qiáng)記憶通路,而長久未用的知識遵循遺忘曲線規(guī)律而逐漸忘記。研究人員提出了類腦的HAM人類關(guān)聯(lián)記憶模型[39],人工神經(jīng)網(wǎng)絡(luò)中的增量學(xué)習(xí)借鑒大腦遺忘模式,通過凍結(jié)舊神經(jīng)元和增補(bǔ)新神經(jīng)元獲得記憶空間,分配新記憶通路或重組記憶網(wǎng)絡(luò)獲得新知識。機(jī)器人實(shí)際應(yīng)用場景中,Sandini等[40]應(yīng)用增量學(xué)習(xí)思想提出了類腦的認(rèn)知發(fā)育機(jī)器人,Gao 等[41]應(yīng)用增量式特征提取改善機(jī)器人的辨認(rèn)和識別能力。
類腦的無人集群研究是前沿的交叉領(lǐng)域,其整體性能的提升依靠各自學(xué)科的研究發(fā)展,混合智能效果呈現(xiàn)交互的螺旋上升趨勢?,F(xiàn)有腦啟發(fā)的無人系統(tǒng)仍處于起步階段,從整體架構(gòu)到細(xì)節(jié)設(shè)計(jì)均有待探索和完善。本章列舉類腦無人集群在多個研究領(lǐng)域的未來增長點(diǎn),多方向形成合力協(xié)助無人集群的智能化發(fā)展。
未來無人集群將負(fù)責(zé)更多的巡航、觀察等態(tài)勢感知任務(wù),持續(xù)不間斷的信息采集成為無人集群的重要功能。大腦可以在消耗極低能量的情況下調(diào)控維持人體的生理功能,并在低功率狀態(tài)下完成與外界的多種交互。未來的類腦芯片使用將大大降低機(jī)器功耗,通過將脈沖神經(jīng)網(wǎng)絡(luò)、憶阻器等應(yīng)用于類腦無人機(jī),可顯著提升無人機(jī)的續(xù)航功能。低功耗的無人機(jī)可完成更長時間、長距離、高復(fù)雜度的任務(wù)內(nèi)容,提升個體無人機(jī)的連續(xù)工作能力,在接力偵察和周期巡邏中降低無人機(jī)架次。此外,對于處于靜默狀態(tài)的無人機(jī),低功耗優(yōu)勢將延長其待機(jī)和壽命年限,可在更早期部署而不需擔(dān)憂短期能源問題。
目前無人集群的學(xué)習(xí)方式主要基于離線數(shù)據(jù)庫訓(xùn)練,缺少自我學(xué)習(xí)的迭代更新能力,并且需要根據(jù)目標(biāo)任務(wù)挑選相關(guān)數(shù)據(jù)進(jìn)行預(yù)先學(xué)習(xí)。研究發(fā)現(xiàn)填鴨式教學(xué)收效快但難以迭代和創(chuàng)新,而面向環(huán)境和現(xiàn)實(shí)問題的互動啟發(fā)式教學(xué)可以調(diào)動智能體的積極性。無人集群作為智能體可借鑒交互式的訓(xùn)練方法,在現(xiàn)實(shí)場景交互過程中學(xué)習(xí)針對性知識,并根據(jù)不斷變換的外部環(huán)境更新和優(yōu)化現(xiàn)有知識庫。此外,可參考教學(xué)中的辯論和討論形式,形成智能體間的對抗[41]和博弈模型,擇優(yōu)留存性能最佳的模型樣本,或針對不同智能體優(yōu)勢構(gòu)建多場景的后臺預(yù)案。
目前無人集群任務(wù)執(zhí)行仍需人工在環(huán)路的指導(dǎo)和輔助,這需要人與機(jī)器間高效準(zhǔn)確的交互溝通,快速變換的復(fù)雜任務(wù)場景尤其需要對無人機(jī)的精確控制。類腦無人集群模仿人腦的信息加工模式,將提升中間數(shù)據(jù)處理結(jié)果的直觀性和解釋性,間接幫助操作人員對態(tài)勢信息進(jìn)行判讀和分析,有益于后方人員快速下達(dá)準(zhǔn)確的操作命令。短期內(nèi)可借助增強(qiáng)現(xiàn)實(shí)、混合現(xiàn)實(shí)等沉浸式的交互應(yīng)用技術(shù),將外界信息直接刺激個人感官系統(tǒng),協(xié)助操作員獲得全方位的態(tài)勢信息。此外,目前人機(jī)交互模式為鍵盤鼠標(biāo)及操控?fù)u桿,隨著腦機(jī)接口技術(shù)的不斷發(fā)展,腦機(jī)交互可能逐漸替代外周神經(jīng)系統(tǒng)間接控制的肢體交互,人腦將實(shí)現(xiàn)與機(jī)器的直接互聯(lián)通信。研究發(fā)現(xiàn)肢體操作信號僅占大腦神經(jīng)指令的一小部分,大腦信息的直接傳輸將提升人機(jī)交互效率和指令準(zhǔn)確性。
類腦無人集群是無人系統(tǒng)實(shí)現(xiàn)智能化和協(xié)同化的創(chuàng)新方法,腦驅(qū)智能將助力無人集群獲得類腦的感知和認(rèn)知能力。本文從個體無人機(jī)設(shè)計(jì)、集群環(huán)路搭建、高級智能呈現(xiàn)三個角度討論了腦啟發(fā)的無人系統(tǒng)應(yīng)用。類腦無人集群融合了人腦機(jī)制與機(jī)器結(jié)構(gòu)形成混合智能,將充分發(fā)揮人類智能的認(rèn)知優(yōu)勢和無人系統(tǒng)的執(zhí)行優(yōu)勢。本文借鑒人腦機(jī)制啟發(fā)無人集群的感知和決策能力,分析了無人集群與人腦系統(tǒng)的共性,并對未來無人集群的類腦方案提出研究設(shè)想及建議,為無人集群在智能化和協(xié)同化道路上的發(fā)展提供了參考。