陳軍, 張?jiān)溃?陳曉威, 佟龑
(1.西北工業(yè)大學(xué) 電子信息學(xué)院, 陜西 西安 710072; 2.江蘇自動(dòng)化研究所, 江蘇 連云港 222061)
現(xiàn)被廣泛認(rèn)可的態(tài)勢(shì)感知(SA)概念是由Endsley于1995年提出,并經(jīng)過一系列討論后形成的定義——“對(duì)特定時(shí)空中態(tài)勢(shì)元素的覺察、理解以及對(duì)其未來狀態(tài)的預(yù)測(cè)”。戰(zhàn)場(chǎng)SA相當(dāng)于“觀察- 判斷- 決策- 行動(dòng)(OODA)”環(huán)路中的觀察和判斷環(huán)節(jié),是指揮員認(rèn)知決策和無人系統(tǒng)智能決策的基礎(chǔ),是一種在復(fù)雜對(duì)抗環(huán)境中啟發(fā)決策活動(dòng)的認(rèn)知理論,如圖1所示。
圖1 SA與決策的關(guān)系Fig.1 Relationship between SA and decision making
由于SA概念起源于對(duì)人的認(rèn)知活動(dòng)的研究,目前國內(nèi)外SA的研究主要集中于人在任務(wù)過程中的SA理論模型、度量模型和應(yīng)用模型等問題。但隨著未來無人系統(tǒng)在戰(zhàn)場(chǎng)中的廣泛運(yùn)用,開展復(fù)雜戰(zhàn)場(chǎng)環(huán)境下的智能SA問題研究勢(shì)在必行,它將提高無人系統(tǒng)的智能SA水平。
近些年來,將認(rèn)知工程科學(xué)、人工智能技術(shù)應(yīng)用于無人系統(tǒng)的研究成為重要趨勢(shì)。其中,模糊認(rèn)知圖(FCM)作為一種較理想的、可用于建模和模擬動(dòng)態(tài)系統(tǒng)知識(shí)表示和決策支持的工具,其節(jié)點(diǎn)具有明確含義、結(jié)構(gòu)具有反饋機(jī)制、容易引入學(xué)習(xí)機(jī)制等優(yōu)勢(shì)使其應(yīng)用范圍非常廣泛,目前已有眾多研究者將其應(yīng)用于戰(zhàn)場(chǎng)SA的建模工作,以期為指揮人員或無人系統(tǒng)的作戰(zhàn)任務(wù)提供決策支持。因此,本文基于SA理論的3層次概念框架,針對(duì)現(xiàn)代戰(zhàn)場(chǎng)環(huán)境的動(dòng)態(tài)、不確定性特點(diǎn),采用FCM的擴(kuò)展形式——模糊灰色認(rèn)知圖(FGCM),建立戰(zhàn)場(chǎng)環(huán)境下目標(biāo)SA模型,提升無人系統(tǒng)的決策優(yōu)勢(shì)。
按照SA理論的3層次概念框架,戰(zhàn)場(chǎng)SA同樣包含了態(tài)勢(shì)元素的覺察、態(tài)勢(shì)的理解和態(tài)勢(shì)的預(yù)測(cè)3個(gè)階段。態(tài)勢(shì)覺察主要解決戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)信息的預(yù)處理,態(tài)勢(shì)理解和態(tài)勢(shì)預(yù)測(cè)主要通過態(tài)勢(shì)數(shù)據(jù)信息的關(guān)聯(lián)和推理,獲得對(duì)當(dāng)前戰(zhàn)場(chǎng)態(tài)勢(shì)的綜合評(píng)價(jià)和趨勢(shì)判斷。
目標(biāo)威脅評(píng)估和意圖預(yù)測(cè)分別是戰(zhàn)場(chǎng)態(tài)勢(shì)理解和態(tài)勢(shì)預(yù)測(cè)中最重要的內(nèi)容之一。在威脅評(píng)估領(lǐng)域,目前常用的方法有貝葉斯網(wǎng)絡(luò)、多屬性決策、神經(jīng)網(wǎng)絡(luò)等。其中,貝葉斯網(wǎng)絡(luò)和神經(jīng)網(wǎng)絡(luò)都屬于量化類威脅評(píng)估方法。不同的是貝葉斯網(wǎng)絡(luò)方法的評(píng)估結(jié)果往往以離散化的威脅等級(jí)及其概率形式呈現(xiàn);神經(jīng)網(wǎng)絡(luò)方法在有數(shù)據(jù)支撐的情況下,可以量化輸出連續(xù)的威脅值。多屬性決策方法屬于威脅排序類評(píng)估方法,以經(jīng)典的逼近理想解(TOPSIS)法為例,它是通過比較有限個(gè)評(píng)價(jià)對(duì)象與理想化目標(biāo)的接近程度來評(píng)價(jià)各方案的相對(duì)優(yōu)劣,計(jì)算的綜合評(píng)價(jià)指標(biāo)只作為排序的依據(jù),不能量化威脅值,進(jìn)而無法對(duì)單一目標(biāo)進(jìn)行威脅評(píng)估。在意圖預(yù)測(cè)領(lǐng)域,目前常用的方法有貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、模糊推理等。其中,貝葉斯網(wǎng)絡(luò)和模糊推理方法需要依賴專家先驗(yàn)知識(shí)構(gòu)建初始模型,在有數(shù)據(jù)樣本的條件下可對(duì)模型進(jìn)行優(yōu)化;神經(jīng)網(wǎng)絡(luò)方法主要采用數(shù)據(jù)驅(qū)動(dòng)的建模與推理方式,在用于意圖預(yù)測(cè)時(shí)可以將目標(biāo)的態(tài)勢(shì)數(shù)據(jù)和真實(shí)意圖標(biāo)簽作為學(xué)習(xí)的樣本,可以在無需先驗(yàn)知識(shí)的情況下達(dá)到較高的預(yù)測(cè)準(zhǔn)確率。
由此可見,在復(fù)雜、動(dòng)態(tài)、不確定戰(zhàn)場(chǎng)環(huán)境的SA建模問題中,對(duì)于貝葉斯網(wǎng)絡(luò)建模方法,在分布獨(dú)立這個(gè)假設(shè)成立的情況下,即使數(shù)據(jù)存在缺失、不完備等情況,貝葉斯網(wǎng)絡(luò)也能取得很好的建模效果。但考慮實(shí)際戰(zhàn)場(chǎng)中各態(tài)勢(shì)要素之間可能具有不同程度的關(guān)聯(lián),不能滿足分布獨(dú)立的假設(shè)前提,如何改進(jìn)和弱化獨(dú)立性假設(shè)對(duì)貝葉斯網(wǎng)絡(luò)建模的影響,還需要繼續(xù)探索。神經(jīng)網(wǎng)絡(luò)建模方法在大量訓(xùn)練數(shù)據(jù)支撐下可以達(dá)到很高的擬合精度且不依賴于先驗(yàn)知識(shí),但實(shí)際戰(zhàn)場(chǎng)中的數(shù)據(jù)通常難以獲得;同時(shí)由于干擾等因素,數(shù)據(jù)存在不確定、不完整的特性;另外,神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)無語義,推理過程具有“黑箱特性”,對(duì)神經(jīng)網(wǎng)絡(luò)建模方法的實(shí)際應(yīng)用產(chǎn)生了一定的限制。多屬性決策和模糊推理法建模過程簡(jiǎn)單,推理速度快,但模型相對(duì)固定,在具有反饋的動(dòng)態(tài)復(fù)雜系統(tǒng)建模上有一定困難。
因此,本文主要考慮到戰(zhàn)場(chǎng)環(huán)境的動(dòng)態(tài)性和數(shù)據(jù)的不確定性,嘗試?yán)肍GCM在表達(dá)和處理不確定數(shù)據(jù)、可解釋的因果推理機(jī)制等方面的建模特點(diǎn),加入環(huán)境控制節(jié)點(diǎn),改善威脅評(píng)估模型的動(dòng)態(tài)適應(yīng)性;同時(shí)引入學(xué)習(xí)算法減少建模中對(duì)專家先驗(yàn)知識(shí)的依賴,優(yōu)化模型參數(shù),以期提高意圖預(yù)測(cè)的客觀性和準(zhǔn)確性。戰(zhàn)場(chǎng)智能SA建模過程如圖2所示。
圖2 戰(zhàn)場(chǎng)智能SA建模過程Fig.2 Modeling process of intelligent situation awareness in the battlefield
表1所示為戰(zhàn)場(chǎng)目標(biāo)SA建模內(nèi)容分解與技術(shù)途徑。在態(tài)勢(shì)覺察階段,利用FGCM模型的灰數(shù)表達(dá)方式實(shí)現(xiàn)不同來源、不同結(jié)構(gòu)態(tài)勢(shì)元素的不確定性描述和量化;在態(tài)勢(shì)理解階段,以目標(biāo)威脅評(píng)估為研究對(duì)象,通過引入外部環(huán)境變量,建立能夠適應(yīng)戰(zhàn)場(chǎng)環(huán)境動(dòng)態(tài)變化的威脅評(píng)估動(dòng)態(tài)模糊灰度認(rèn)知圖(DFGCM)模型;在態(tài)勢(shì)預(yù)測(cè)階段,以目標(biāo)意圖預(yù)測(cè)為研究對(duì)象,通過引入粒子群優(yōu)化(PSO)算法提高模型對(duì)歷史數(shù)據(jù)的參數(shù)學(xué)習(xí)能力,減少模型對(duì)專家知識(shí)的依賴,實(shí)現(xiàn)知識(shí)與數(shù)據(jù)的雙驅(qū)動(dòng)。
表1 戰(zhàn)場(chǎng)智能SA建模的技術(shù)方法Tab.1 Technology and method of battlefield intelligentsituation awareness modeling
圖3 經(jīng)典FCM與FGCM關(guān)系示意圖Fig.3 Schematic diagram of relationship between FCM and FGCM
灰數(shù)的不確定程度計(jì)算公式如(1)式所示:
(1)
(2)
FGCM的節(jié)點(diǎn)狀態(tài)值推理公式如(3)式所示:
(3)
式中:表示節(jié)點(diǎn)前一時(shí)刻狀態(tài)值對(duì)當(dāng)前狀態(tài)值的影響,取值范圍為[0,1]。
激活函數(shù)(·)主要有sigmoid型和tanh型,分別對(duì)應(yīng)節(jié)點(diǎn)狀態(tài)值屬于[0,1]和[-1,1]兩種情況。
(4)
(5)
式中:為激活函數(shù)調(diào)節(jié)系數(shù);灰數(shù)的加法、乘法運(yùn)算法則如下:
(6)
(7)
將灰數(shù)轉(zhuǎn)化為準(zhǔn)確值的操作過程稱為白化,白化的一般公式為
(8)
式中:為調(diào)節(jié)白化值偏向的參數(shù),取值范圍為[0,1]。
在FGCM的實(shí)際應(yīng)用中,概念節(jié)點(diǎn)數(shù)據(jù)的量綱各不相同,需要通過模糊化操作轉(zhuǎn)變?yōu)闊o量綱的模糊數(shù)。將FGCM應(yīng)用于動(dòng)態(tài)不確定戰(zhàn)場(chǎng)環(huán)境的SA建模問題具有以下4點(diǎn)優(yōu)勢(shì):
1)FGCM采用灰數(shù)形式進(jìn)行推理,加強(qiáng)了表達(dá)和處理不確定數(shù)據(jù)的能力,并可實(shí)現(xiàn)不確定推理結(jié)果的量化輸出;
2)通過引入環(huán)境控制節(jié)點(diǎn),構(gòu)建基于DFGCM的威脅評(píng)估模型,與TOPSIS法相比,不僅能夠量化目標(biāo)的威脅程度,還能在模型推理過程中響應(yīng)外部環(huán)境的動(dòng)態(tài)變化;
3)FGCM模型為有向有環(huán)圖,可以對(duì)貝葉斯網(wǎng)絡(luò)、模糊推理等方法難以表示的節(jié)點(diǎn)間存在關(guān)聯(lián)或具有反饋的復(fù)雜系統(tǒng)進(jìn)行建模;
4)與神經(jīng)網(wǎng)絡(luò)相比,可利用FGCM模型節(jié)點(diǎn)的語義性,基于專家先驗(yàn)知識(shí)構(gòu)建可解釋的意圖預(yù)測(cè)模型結(jié)構(gòu),再引入學(xué)習(xí)算法,進(jìn)而在可用數(shù)據(jù)支持下確定模型參數(shù)。
任務(wù)想定設(shè)定為對(duì)入侵飛機(jī)目標(biāo)的戰(zhàn)場(chǎng)目標(biāo)SA建模,主要包含態(tài)勢(shì)覺察、威脅評(píng)估和意圖預(yù)測(cè)3個(gè)模塊。態(tài)勢(shì)覺察既受自下而上的數(shù)據(jù)信息驅(qū)動(dòng),也受到自上而下的任務(wù)驅(qū)動(dòng)。
建模過程中,采用受任務(wù)驅(qū)動(dòng)的態(tài)勢(shì)覺察方式,以意圖預(yù)測(cè)為最終目標(biāo),自上而下進(jìn)行態(tài)勢(shì)元素的分解,指導(dǎo)態(tài)勢(shì)覺察模塊從戰(zhàn)場(chǎng)環(huán)境中提取相關(guān)的態(tài)勢(shì)元素,并經(jīng)過不確定性表達(dá)與處理后,提供給威脅評(píng)估和意圖預(yù)測(cè)模塊。受任務(wù)驅(qū)動(dòng)的自上而下態(tài)勢(shì)元素分解過程如圖4所示。
圖4 受任務(wù)驅(qū)動(dòng)的自上而下態(tài)勢(shì)元素分解Fig.4 Task driven top-down decomposition of situation elements
由于與目標(biāo)識(shí)別等問題不同,威脅評(píng)估具有一定的主觀性,主要是作為后續(xù)行動(dòng)的依據(jù),評(píng)估結(jié)果的有效性很難直接體現(xiàn)。在模型權(quán)值的確定中直接引入學(xué)習(xí)機(jī)制比較困難,故需要一定的專家經(jīng)驗(yàn)和知識(shí),一般是利用多個(gè)專家知識(shí)進(jìn)行加權(quán)確定初始權(quán)值。因此,本文對(duì)于威脅評(píng)估的建模主要考慮動(dòng)態(tài)性特征,需要提取的態(tài)勢(shì)元素主要包括兩大類:1)與目標(biāo)能力和時(shí)空關(guān)系有關(guān)的元素,如目標(biāo)機(jī)動(dòng)能力、隱身能力等,作為模型的概念節(jié)點(diǎn);2)反映動(dòng)態(tài)戰(zhàn)場(chǎng)環(huán)境的元素,如地形、氣象、敵方支援、電子干擾等自然因素和人為因素,作為模型的外部控制節(jié)點(diǎn)。
基于態(tài)勢(shì)元素分解確定的概念節(jié)點(diǎn)及其因果關(guān)系,構(gòu)建基于FGCM的目標(biāo)威脅評(píng)估模型;分析外部控制節(jié)點(diǎn)對(duì)概念節(jié)點(diǎn)之間因果關(guān)系的影響情況,確定與FGCM關(guān)聯(lián)權(quán)值?,的動(dòng)態(tài)函數(shù),使模型推理適應(yīng)動(dòng)態(tài)變化的戰(zhàn)場(chǎng)環(huán)境。圖5所示為基于DFGCM的目標(biāo)威脅模型,圖5中威脅評(píng)估DFGCM模型的節(jié)點(diǎn)定義如表2所示。
圖5 基于DFGCM的威脅評(píng)估模型Fig.5 Threat assessment model based on DFGCM
威脅評(píng)估模型在推理過程中,權(quán)值可根據(jù)外部控制節(jié)點(diǎn)的狀態(tài)動(dòng)態(tài)調(diào)整,如(9)式~(12)式所示,權(quán)值的調(diào)整受其初始值和環(huán)境影響關(guān)系的共同作用。
當(dāng)?,為正值,因果關(guān)系受影響增強(qiáng)時(shí):
(9)
當(dāng)?,為正值,因果關(guān)系受影響減弱時(shí):
(10)
表2 威脅評(píng)估DFGCM模型的節(jié)點(diǎn)含義Tab.2 Node meaning of threat assessment DFGCM model
當(dāng)?,為負(fù)值,因果關(guān)系受影響增強(qiáng)時(shí):
(11)
當(dāng)?,為負(fù)值,因果關(guān)系受影響減弱時(shí):
(12)
式中:表示第個(gè)外部控制節(jié)點(diǎn)的狀態(tài)值;,為調(diào)節(jié)系數(shù),取值范圍為[-1,1],它決定了動(dòng)態(tài)調(diào)節(jié)的力度和方向。當(dāng)多個(gè)控制節(jié)點(diǎn)同時(shí)對(duì)一個(gè)權(quán)值?,起作用時(shí),只選取使該權(quán)值變化最大的。
DFGCM模型的輸出為灰數(shù),即區(qū)間數(shù)的表達(dá)方式。為了進(jìn)行有效的排序,需要進(jìn)行白化??紤]到模型輸出具有的不確定性越大,表示我方對(duì)目標(biāo)掌握的信息和情報(bào)越少,敵方對(duì)我方的威脅越接近推理結(jié)果的上限。因此白化公式(8)式中參數(shù)的確定按照(13)式進(jìn)行:
(13)
式中:(?)表示節(jié)點(diǎn)?根據(jù)(1)式計(jì)算出的灰度。
目標(biāo)意圖預(yù)測(cè)模型的概念節(jié)點(diǎn)來自態(tài)勢(shì)覺察模塊分解的態(tài)勢(shì)元素,同時(shí)包含了威脅評(píng)估模塊輸出的目標(biāo)威脅程度信息。表3所示為意圖預(yù)測(cè)FGCM模型的節(jié)點(diǎn)定義。
分析各概念節(jié)點(diǎn)之間的因果關(guān)系,可以構(gòu)建意圖預(yù)測(cè)FGCM模型,如圖6所示。入侵目標(biāo)飛機(jī)的作戰(zhàn)意圖節(jié)點(diǎn)(?)包括攻擊、偵察、掩護(hù)和其他4種類型,通過對(duì)輸出節(jié)點(diǎn)?狀態(tài)值的白化后,根據(jù)閾值判斷具體意圖類型,其中、、為4種意圖的分類閾值。
表3 意圖預(yù)測(cè)FGCM模型的節(jié)點(diǎn)定義Tab.3 Node definition of intention prediction FGCM model
圖6 基于FGCM的意圖預(yù)測(cè)模型Fig.6 Intention prediction model based on FGCM
由于實(shí)際戰(zhàn)場(chǎng)SA中的目標(biāo)意圖類型有限,意圖預(yù)測(cè)問題可以歸結(jié)為分類問題,與威脅評(píng)估不同的是目標(biāo)意圖是客觀的,不同戰(zhàn)術(shù)意圖下所表現(xiàn)出的態(tài)勢(shì)元素特征也不同。在有數(shù)據(jù)支撐的條件下,可將目標(biāo)真實(shí)意圖作為標(biāo)簽,引入學(xué)習(xí)算法確定權(quán)重,可以避免過度依賴專家知識(shí),并提高目標(biāo)意圖預(yù)測(cè)的客觀性、準(zhǔn)確性,也符合智能戰(zhàn)場(chǎng)SA的發(fā)展趨勢(shì)。
本文引入種群學(xué)習(xí)算法中常用的PSO算法,學(xué)習(xí)和調(diào)整意圖預(yù)測(cè)FGCM模型的關(guān)聯(lián)權(quán)值。PSO算法中的個(gè)體由圖6模型中的非零權(quán)值組成,其中非零權(quán)值有9個(gè),每個(gè)灰數(shù)權(quán)值由上、下限值組成,因此個(gè)體編碼長度為18位,如圖7所示。由FGCM的定義,在種群初始化和迭代過程中,上限值要大于或等于下限值,且在[-1,1]范圍內(nèi)。
圖7 個(gè)體編碼及其初始化Fig.7 Individual coding and its initialization
經(jīng)過編碼后,種群中每個(gè)個(gè)體就是一組權(quán)重值,評(píng)價(jià)一組權(quán)重值的優(yōu)劣,需要設(shè)計(jì)適應(yīng)度函數(shù)。適應(yīng)度函數(shù)設(shè)置為訓(xùn)練數(shù)據(jù)的分類準(zhǔn)確率,
=
(14)
式中:為相應(yīng)權(quán)值在訓(xùn)練數(shù)據(jù)下推理正確的個(gè)數(shù);為訓(xùn)練數(shù)據(jù)的總組數(shù)。因此,本文PSO算法中每一個(gè)個(gè)體,就是意圖預(yù)測(cè)FGCM模型中的一組權(quán)重,適應(yīng)度函數(shù)就是用來評(píng)價(jià)個(gè)體優(yōu)劣(即接近理想權(quán)重的程度)的標(biāo)準(zhǔn),對(duì)于每一個(gè)個(gè)體,將其代表的權(quán)重代入模型,然后根據(jù)一組訓(xùn)練數(shù)據(jù)中的輸入節(jié)點(diǎn)?~?推理出輸出節(jié)點(diǎn)?的值并進(jìn)行白化,根據(jù)白化值和圖6中的閾值~判斷是否分類正確,根據(jù)(14)式計(jì)算出每一個(gè)個(gè)體代表的權(quán)重在26組訓(xùn)練數(shù)據(jù)下的分類準(zhǔn)確率,作為其個(gè)體適應(yīng)度。個(gè)體適應(yīng)度越大,表明該個(gè)體代表的權(quán)重推理出的分類準(zhǔn)確率越高,該個(gè)體越優(yōu),后續(xù)種群的更新就要不斷向個(gè)體適應(yīng)度更高的個(gè)體靠近,取尋找最理想的權(quán)重矩陣。同時(shí),由于推理結(jié)果?是一個(gè)灰數(shù),分類結(jié)果由此灰數(shù)值白化后得到,推理結(jié)果的灰數(shù)不應(yīng)包含太大的不確定度。因此,判斷個(gè)體的優(yōu)劣時(shí)還要考慮輸出節(jié)點(diǎn)的不確定性,選擇推理結(jié)果不確定性更小的個(gè)體作為更優(yōu)個(gè)體。故將訓(xùn)練數(shù)據(jù)下輸出節(jié)點(diǎn)?的平均不確定度作為判斷個(gè)體優(yōu)劣的第2個(gè)指標(biāo):
(15)
式中:(?)為由第組訓(xùn)練數(shù)據(jù)推理出的節(jié)點(diǎn)?的不確定度,其計(jì)算方法在12節(jié)已經(jīng)給出。
綜上所述可知,評(píng)價(jià)個(gè)體優(yōu)劣時(shí),先計(jì)算其適應(yīng)度函數(shù),適應(yīng)度函數(shù)更大的個(gè)體更接近最優(yōu)解;當(dāng)兩個(gè)個(gè)體適應(yīng)度函數(shù)相同時(shí),再計(jì)算節(jié)點(diǎn)?的平均不確定度,取平均不確定度更小的個(gè)體為更優(yōu)個(gè)體。隨著迭代的進(jìn)行,準(zhǔn)確率高、平均不確定度小的個(gè)體得以保留,最終找到一個(gè)和都令人滿意的全局最優(yōu)解作為權(quán)重矩陣的學(xué)習(xí)結(jié)果。
PSO算法中,種群的更新根據(jù)以下2個(gè)公式進(jìn)行:
(16)
(17)
對(duì)種群中每個(gè)粒子都用(16)式、(17)式進(jìn)行更新,隨著迭代步數(shù)的增加,整個(gè)種群不斷地向全局最優(yōu)解靠近,最終找到令人滿意的解。PSO算法的流程如圖8所示。
圖8 PSO算法流程圖Fig.8 Flow chart of PSO algorithm
411 模型動(dòng)態(tài)適應(yīng)性驗(yàn)證
威脅評(píng)估模型中的初始權(quán)重采用多專家加權(quán)確定,專家可以先給出一個(gè)模糊數(shù)作為灰數(shù)的中心,隨后給出不確定性的大小,匯總時(shí)按照專家的專業(yè)程度、經(jīng)驗(yàn)?zāi)晗薜纫蛩?,加?quán)求權(quán)重的均值,分別加權(quán)確定灰數(shù)的中心數(shù)和不確定度。需要注意的是,灰數(shù)的上下限要在[-1,1]區(qū)間內(nèi)。最終確定初始關(guān)聯(lián)權(quán)值矩陣為
為確定(9)式~(12)式中調(diào)節(jié)系數(shù)的最佳取值,并驗(yàn)證模型在復(fù)雜多變的外部環(huán)境中的動(dòng)態(tài)適應(yīng)能力,設(shè)置5組不同的戰(zhàn)場(chǎng)環(huán)境條件,分別發(fā)生在~時(shí)刻,設(shè)置1組最具代表性的輸入?={?~?},如表4所示。5組時(shí)刻的外部環(huán)境有相對(duì)優(yōu)劣,通過常識(shí)可知環(huán)境條件越惡劣,越不利于敵方目標(biāo)飛機(jī)入侵,即敵方目標(biāo)的威脅程度越低。
表4 不同時(shí)刻的節(jié)點(diǎn)值設(shè)定Tab.4 Vk value setting at different time
先將輸入?={?~?}和、時(shí)刻的值代入模型,依次將權(quán)重調(diào)節(jié)系數(shù),設(shè)置為02、04、06和08,記錄模型推理結(jié)果?的不確定度和白化值,如圖9所示。
圖9 不同時(shí)刻和調(diào)節(jié)系數(shù)下推理結(jié)果對(duì)比Fig.9 Comparison of reasoning results in the case of different times and adjustment coefficients
由于時(shí)刻的環(huán)境更加復(fù)雜,外部控制節(jié)點(diǎn)的絕對(duì)值更大。由圖9可以看出:外部環(huán)境越復(fù)雜,權(quán)重調(diào)節(jié)系數(shù),對(duì)輸出結(jié)果的影響越明顯;,越大,模型對(duì)環(huán)境變化的敏感度越高,動(dòng)態(tài)適應(yīng)性越強(qiáng);隨著模型動(dòng)態(tài)適應(yīng)性的提高,推理結(jié)果的不確定性也在增加,故在權(quán)重調(diào)節(jié)系數(shù)的選取上要權(quán)衡模型的動(dòng)態(tài)適應(yīng)力和推理結(jié)果的不確定性。
由權(quán)重調(diào)整規(guī)則可知,當(dāng)多個(gè)控制節(jié)點(diǎn)同時(shí)對(duì)一個(gè)權(quán)值?,起作用時(shí),只選取使該權(quán)值變化最大的。為兼顧模型對(duì)環(huán)境的動(dòng)態(tài)適應(yīng)性和盡可能小的不確定性,可以根據(jù)專家知識(shí)對(duì)環(huán)境節(jié)點(diǎn)重要性的判斷,為更重要的外部控制節(jié)點(diǎn)設(shè)置更大的權(quán)重調(diào)節(jié)系數(shù),,在該原則基礎(chǔ)上經(jīng)過多次仿真,最終確定權(quán)重調(diào)節(jié)系數(shù)如表5所示。
表5 權(quán)值調(diào)節(jié)系數(shù)Tab.5 Weight adjustment coefficient
采用最終確定的調(diào)節(jié)系數(shù)來驗(yàn)證模型的動(dòng)態(tài)適應(yīng)性,在同一組輸入?={?,…,?}下分別代入~的外部環(huán)境變量,得到輸出節(jié)點(diǎn)?的不確定性和白化值如圖10所示。由圖10可以看出,對(duì)于同一組輸入,模型在不同時(shí)刻下的輸出不確定性和白化值都有所變化,威脅評(píng)估的結(jié)果也符合“環(huán)境越惡劣,敵方飛機(jī)目標(biāo)入侵難度越大,威脅越低”的規(guī)律。
412 模型有效性驗(yàn)證
為了驗(yàn)證威脅評(píng)估模型的動(dòng)態(tài)不確定性推理能力,在時(shí)刻下設(shè)置5組輸入,如表6所示。
第1組輸入的每個(gè)節(jié)點(diǎn)的灰度都為0,即第1組數(shù)據(jù)節(jié)點(diǎn)值都是精確值,用一組上下限相等的灰數(shù)表示;第2組中只有一個(gè)具有不確定性輸入的節(jié)點(diǎn)?,且灰度為02;第3組中有3個(gè)節(jié)點(diǎn)的輸入具有不確定性;第4組輸入與第3組類似,但節(jié)點(diǎn)?的灰度為1,表示目標(biāo)偵察能力數(shù)據(jù)缺失,模擬不完備信息下的威脅評(píng)估。第5組與第3組對(duì)比,用灰數(shù)表示另外3個(gè)屬性。5組數(shù)據(jù)基本涵蓋了各種類型目標(biāo)屬性的情況,根據(jù)表6定性分析可知:
圖10 不同時(shí)刻模型輸出對(duì)比Fig.10 Comparison of model outputs at different times
表6 不同時(shí)刻具有不同不確定性的輸入與模型輸出Tab.6 Input and output of model with different uncertainties at different times
1)第1組~第4組目標(biāo)各項(xiàng)參數(shù)相差不大,但數(shù)據(jù)的不確定度逐漸增加,分析可知威脅評(píng)估的白化結(jié)果應(yīng)該大致相等且不確定性程度排序?yàn)椋旱?組<第2組<第3組<第4組。
2)第4組數(shù)據(jù)目標(biāo)屬性?的灰度為1,推理結(jié)果的不確定度應(yīng)該為5組數(shù)據(jù)中最大。
3)比較第3組和第5組,由于第5組的目標(biāo)能力參數(shù)整體比第3組高,經(jīng)過白化后的第5組的目標(biāo)威脅程度應(yīng)當(dāng)大于第3組。
5組仿真數(shù)據(jù)的威脅評(píng)估仿真驗(yàn)證結(jié)果如圖11所示?;疑珘K長度代表模型評(píng)估得到的目標(biāo)威脅程度的灰度,數(shù)字分別為威脅程度的上、下限值。
圖11 基于DFGCM的威脅評(píng)估仿真結(jié)果Fig.11 Simulated results of threat assessment based on DFGCM
表6和圖11表明:
1)前3組數(shù)據(jù)的評(píng)估結(jié)果白化值大致相等,但不確定度依次增加,符合預(yù)期效果。
2)即使第4組仿真數(shù)據(jù)中對(duì)評(píng)估敵方威脅程度的探測(cè)能力參數(shù)完全未知,威脅評(píng)估模型仍能輸出較為合理的結(jié)果,但結(jié)果的不確定性會(huì)較大。
3)第3組和第5組的評(píng)估結(jié)果白化后的區(qū)分度明顯,可用于比較不同目標(biāo)的威脅程度。
綜合來看,基于DFGCM的目標(biāo)威脅評(píng)估模型有效且具備動(dòng)態(tài)適應(yīng)能力,能夠?qū)Σ煌瑧?zhàn)場(chǎng)環(huán)境下的不同目標(biāo)進(jìn)行較為合理的威脅評(píng)估。
為進(jìn)一步驗(yàn)證DFGCM模型評(píng)估的有效性和可信性,對(duì)于表6中的5組數(shù)據(jù),采用比較成熟的TOPSIS法進(jìn)行評(píng)估。由于TOPSIS法處理的是精確值,評(píng)估之前需要對(duì)表6中的灰數(shù)進(jìn)行處理,分別采取3種方法對(duì)灰數(shù)進(jìn)行處理:取灰數(shù)的下限、取灰數(shù)的上限、取灰數(shù)的白化值。例如,對(duì)于第2組數(shù)據(jù)的?=[0.5,0.7],3種方法對(duì)其處理后的精確值分別為0.5、0.7、0.61(白化結(jié)果保留兩位小數(shù)),將表6中的數(shù)據(jù)處理之后作為歸一化后的決策矩陣。由于TOPSIS法不考慮屬性之間的相互影響,每個(gè)屬性有對(duì)應(yīng)的權(quán)重,與本文方法不同的是TOPSIS法各屬性的權(quán)重之和為1,只保留圖5模型中屬性節(jié)點(diǎn)?~?指向輸出節(jié)點(diǎn)?的權(quán)重?~?進(jìn)行白化,并用(18)式進(jìn)行歸一化,得到6個(gè)屬性的相對(duì)權(quán)重:
(18)
得到?jīng)Q策矩陣和權(quán)重之后分別計(jì)算正、負(fù)理想解并計(jì)算綜合評(píng)價(jià)值,3種灰數(shù)處理方式下的綜合評(píng)價(jià)值如表7所示(結(jié)果保留4位小數(shù))。
表7 TOPSIS法評(píng)估結(jié)果對(duì)比Tab.7 Comparison of TOPSIS evaluated results
由表7可以看出對(duì)灰數(shù)采取的處理方式不同,最終的評(píng)估結(jié)果相差較大:1)取灰數(shù)下限值時(shí),前3組數(shù)據(jù)得到的綜合評(píng)價(jià)值很接近;2)取灰數(shù)上限值時(shí),第1組數(shù)據(jù)由于各項(xiàng)指標(biāo)都為5組數(shù)據(jù)中最小,因此綜合評(píng)價(jià)值為0,5組數(shù)據(jù)不管是綜合評(píng)價(jià)值還是其排序,都與取灰數(shù)下限的處理方法相差較大,表明采用TOPSIS法評(píng)價(jià)時(shí),對(duì)于灰數(shù)的處理不宜簡(jiǎn)單地取其上限值或者下限值;3)將灰數(shù)白化后再用TOPSIS法進(jìn)行評(píng)估,可以看出數(shù)據(jù)有了明顯的區(qū)分度,威脅排序的結(jié)果為:第1組<第2組<第4組<第3組<第5組。
由此可見,基于DFGCM的威脅評(píng)估推理結(jié)果白化值的排序與TOPSIS法的排序結(jié)果一致,側(cè)面再次驗(yàn)證了威脅評(píng)估DFGCM模型的有效性。與TOPSIS法不同的是,DFGCM模型考慮了節(jié)點(diǎn)之間的相互影響,更關(guān)注動(dòng)態(tài)、不確定性環(huán)境下威脅值的量化,在目標(biāo)參數(shù)不準(zhǔn)確或缺失情況下仍能進(jìn)行有效評(píng)估;TOPSIS法更關(guān)注不同目標(biāo)威脅程度的排序,得到的綜合評(píng)價(jià)值僅作為判斷相對(duì)大小的依據(jù),對(duì)于單個(gè)目標(biāo)無法進(jìn)行威脅值的量化評(píng)估。
采用《2015年全國研究生數(shù)學(xué)建模競(jìng)賽A題》和文獻(xiàn)[34]提供的目標(biāo)意圖預(yù)測(cè)樣本數(shù)據(jù),構(gòu)建包含41組數(shù)據(jù)的學(xué)習(xí)樣本庫,如表8所示。使用PSO算法對(duì)其中的26組數(shù)據(jù)樣本進(jìn)行學(xué)習(xí),其余15組數(shù)據(jù)樣本經(jīng)過不確定性處理后用于測(cè)試驗(yàn)證。由于FGCM模型處理的數(shù)據(jù)為灰數(shù),對(duì)于表8中的精確數(shù),將其歸一化后擴(kuò)展為上、下限相等的灰數(shù)形式,再與灰數(shù)形式的權(quán)值一起參與推理運(yùn)算。例如,某組數(shù)據(jù)的某一項(xiàng)參數(shù)歸一化后為0.6,則擴(kuò)展為灰數(shù)形式的[0.6,0.6],再根據(jù)(6)式和(7)式的灰數(shù)運(yùn)算法則參與運(yùn)算。根據(jù)(6)式和(7)式進(jìn)行灰數(shù)(區(qū)間數(shù))的加法和乘法運(yùn)算示例如下:
[0.3,0.5]+[0.6,0.6]=
[0.3+0.6,0.5+0.6]=[0.9,1.1];
[0.3,0.6]×[0.6,0.6]=
[min (0.3×0.6,0.3×0.6,0.6×0.6,0.6×0.6),
max (0.3×0.6,0.3×0.6,0.6×0.6,0.6×0.6)]=
[min (0.18,0.18,0.36,0.36),
max (0.18,0.18,0.36,0.36)]=
[0.18,0.36]
FGCM推理公式(3)式中的矩陣乘法根據(jù)上述法則進(jìn)行運(yùn)算,得到新的節(jié)點(diǎn)灰數(shù)值之后用sigmoid函數(shù)歸一化到[0,1]之間,進(jìn)而參與后續(xù)運(yùn)算。
4.2.1 模型不確定性推理能力驗(yàn)證
為驗(yàn)證學(xué)習(xí)算法的有效性和模型不確定性推理能力,按第3節(jié)設(shè)計(jì)的PSO算法學(xué)習(xí)權(quán)重矩陣,將學(xué)習(xí)得到的FGCM模型用于后續(xù)的仿真驗(yàn)證。對(duì)于樣本的學(xué)習(xí),PSO算法的步驟如下:
將威脅值和歸一化之后的各項(xiàng)數(shù)據(jù)賦值給對(duì)應(yīng)的節(jié)點(diǎn)?~?;分別將種群中每個(gè)個(gè)體賦值給權(quán)重矩陣。
用(3)式的FGCM推理公式,分別計(jì)算每個(gè)權(quán)重矩陣在26組訓(xùn)練數(shù)據(jù)下輸出節(jié)點(diǎn)?的值,并用(8)式、(13)式進(jìn)行白化。
表8 目標(biāo)意圖預(yù)測(cè)模型學(xué)習(xí)數(shù)據(jù)樣本庫Tab.8 Learning data sample database of target intention prediction model
根據(jù)白化值和圖6中的閾值~判斷是否分類正確,根據(jù)(14)式計(jì)算每個(gè)權(quán)重矩陣下26組數(shù)據(jù)意圖識(shí)別的準(zhǔn)確率;根據(jù)(15)式計(jì)算每個(gè)權(quán)重矩陣下26組數(shù)據(jù)輸出結(jié)果的平均不確定度。
選擇準(zhǔn)確率高、平均不確定度小的權(quán)重矩陣作為當(dāng)前最優(yōu)個(gè)體,根據(jù)(17)式、(18)式對(duì)個(gè)體進(jìn)行更新,形成新的種群。
得到更新后的種群后轉(zhuǎn)到步驟2,循環(huán)執(zhí)行步驟2~步驟6,直到滿足終止迭代條件。
設(shè)置種群大小為500,PSO算法的慣性因子取為1,學(xué)習(xí)因子取為2,為防止粒子更新步長過大,設(shè)置粒子最大速度為0.1。設(shè)置終止條件為分類準(zhǔn)確率達(dá)到95%以上或達(dá)到最大迭代步數(shù)10 000步。在學(xué)習(xí)過程中,對(duì)于超出限定范圍的個(gè)體進(jìn)行重新初始化。
仿真結(jié)果表明,26組訓(xùn)練數(shù)據(jù)的分類準(zhǔn)確率為96.15%,模型推理結(jié)果的平均灰度為0.60。為了直觀地表現(xiàn)學(xué)習(xí)結(jié)果,將目標(biāo)意圖預(yù)測(cè)FGCM模型的權(quán)值可視化,如圖12所示。圖12中,箭頭的粗細(xì)代表關(guān)聯(lián)權(quán)值白化后絕對(duì)值的大小,箭頭越粗,表示關(guān)聯(lián)權(quán)值越大;箭頭的顏色表示關(guān)聯(lián)權(quán)值的灰度,顏色越深,表示該關(guān)聯(lián)權(quán)值的灰度越?。患^的虛實(shí)表示灰數(shù)權(quán)值白化后的符號(hào),實(shí)線表示正值,虛線表示負(fù)值。
圖12 PSO算法的學(xué)習(xí)結(jié)果Fig.12 Learning result of PSO algorithm
訓(xùn)練完成的模型在15組數(shù)據(jù)的測(cè)試集上準(zhǔn)確率為93.33%,為了驗(yàn)證模型的不確定性推理能力,模擬真實(shí)情況下目標(biāo)某些數(shù)據(jù)缺失或不準(zhǔn)確的情況,分別對(duì)測(cè)試集中歸一化后的目標(biāo)參數(shù)做一定程度的不確定性處理。例如,某組數(shù)據(jù)中目標(biāo)的水平速度經(jīng)過歸一化后為0.6,表示為灰數(shù)形式為[0.6,0.6],對(duì)其進(jìn)行單側(cè)灰度為10%的不確定性處理,即對(duì)灰數(shù)下限減小10%,上限增加10%,處理結(jié)果為[0.54,0.66],將此作為目標(biāo)參數(shù)輸入FGCM模型進(jìn)行推理,驗(yàn)證是否預(yù)測(cè)準(zhǔn)確。分別對(duì)測(cè)試集數(shù)據(jù)中節(jié)點(diǎn)?、?、?做10%、20%、30%、40%的不確定性處理后輸入意圖預(yù)測(cè)FGCM模型,統(tǒng)計(jì)測(cè)試集上的準(zhǔn)確率如圖13所示。
圖13 不確定性數(shù)據(jù)下模型預(yù)測(cè)能力Fig.13 Model prediction ability for uncertain data
由圖13可以看出對(duì)節(jié)點(diǎn)進(jìn)行不確定性處理,測(cè)試集上的預(yù)測(cè)準(zhǔn)確率會(huì)受到一定程度的影響:
1)隨著不同節(jié)點(diǎn)不確定性的增加,模型整體的預(yù)測(cè)準(zhǔn)確率呈下降趨勢(shì)。但當(dāng)節(jié)點(diǎn)不確定性較小(10%,20%)時(shí),仍能取得較高的預(yù)測(cè)準(zhǔn)確率,即模型具備一定的不確定性處理能力,符合設(shè)計(jì)預(yù)期。
2)節(jié)點(diǎn)?和?的不確定性大到一定程度,預(yù)測(cè)準(zhǔn)確率下降明顯,而節(jié)點(diǎn)?的不確定性對(duì)預(yù)測(cè)準(zhǔn)確率影響不大。結(jié)合圖12中的學(xué)習(xí)結(jié)果可以發(fā)現(xiàn),節(jié)點(diǎn)不確定性對(duì)預(yù)測(cè)準(zhǔn)確率的影響程度,與其對(duì)應(yīng)的權(quán)值大小相關(guān)。
綜上分析可知,意圖預(yù)測(cè)FGCM模型允許目標(biāo)參數(shù)存在一定的不確定性,在無法獲得目標(biāo)某項(xiàng)準(zhǔn)確參數(shù)時(shí),意圖預(yù)測(cè)的結(jié)果仍然具有較高的參考價(jià)值。
4.2.2 模型預(yù)測(cè)準(zhǔn)確率對(duì)比
將本文FGCM模型結(jié)合PSO算法(FGCM模型+PSO算法)的意圖預(yù)測(cè)方法與文獻(xiàn)[28]中基于神經(jīng)網(wǎng)絡(luò)模型和Adam算法(神經(jīng)網(wǎng)絡(luò)模型+Adam算法)的意圖預(yù)測(cè)方法進(jìn)行對(duì)比分析。依據(jù)文獻(xiàn)[28]中的方法設(shè)置神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)為輸入層7個(gè)節(jié)點(diǎn),隱含層32個(gè)節(jié)點(diǎn),輸出層4個(gè)節(jié)點(diǎn),采用交叉熵作為誤差函數(shù),學(xué)習(xí)算法采用Adam算法,其各參數(shù)設(shè)置與文獻(xiàn)[28]保持一致,同樣使用本文中的訓(xùn)練集和測(cè)試集,經(jīng)過8 000步學(xué)習(xí)之后,意圖預(yù)測(cè)準(zhǔn)確率對(duì)比情況如圖14所示。
圖14 意圖預(yù)測(cè)準(zhǔn)確率對(duì)比Fig.14 Comparison of intention prediction accuracies
由圖14可以看出,神經(jīng)網(wǎng)絡(luò)模型+Adam算法的方法在訓(xùn)練集表現(xiàn)非常好,預(yù)測(cè)準(zhǔn)確率達(dá)到100%,而測(cè)試集的準(zhǔn)確率有了明顯下降,為86.67%。這種現(xiàn)象一般被稱為過擬合,即把訓(xùn)練樣本自身的一些特點(diǎn)當(dāng)作了所有潛在樣本都會(huì)具有的一般性質(zhì),導(dǎo)致模型的泛化性能下降。過擬合越嚴(yán)重,學(xué)習(xí)得到的模型在面對(duì)新的樣本時(shí)表現(xiàn)越差。
圖14中兩種方法都存在一定的過擬合現(xiàn)象,但可以發(fā)現(xiàn):
1) FGCM模型+PSO算法在訓(xùn)練集預(yù)測(cè)準(zhǔn)確率上相對(duì)較低,但測(cè)試集準(zhǔn)確率高于神經(jīng)網(wǎng)絡(luò)模型+Adam算法;
2) FGCM模型+PSO算法的訓(xùn)練集預(yù)測(cè)準(zhǔn)確率和測(cè)試集準(zhǔn)確率之間的差小于神經(jīng)網(wǎng)絡(luò)+Adam,表明FGCM模型+PSO算法可以在一定程度上降低過擬合現(xiàn)象。
綜合分析本文目標(biāo)意圖預(yù)測(cè)方法與基于神經(jīng)網(wǎng)絡(luò)的方法的特點(diǎn)如下:
1) FGCM模型綜合了灰數(shù)理論,將權(quán)值設(shè)置為灰數(shù),使得模型在無法獲得目標(biāo)屬性精確數(shù)值的情況下可以進(jìn)行推理,模型輸出結(jié)果包含的不確定度能從側(cè)面反映意圖預(yù)測(cè)的好壞,模型結(jié)構(gòu)的確定也可以利用一定程度的先驗(yàn)知識(shí);
2) PSO算法能夠得到預(yù)測(cè)準(zhǔn)確率和泛化能力都不錯(cuò)的權(quán)值參數(shù),但作為種群演化類算法,由于需要一定規(guī)模的個(gè)體并行求解,其學(xué)習(xí)過程對(duì)計(jì)算機(jī)性能要求更高,學(xué)習(xí)時(shí)間也更長;
3)神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)都轉(zhuǎn)換為精確值的情況下可以達(dá)到非常高的訓(xùn)練精度,且基于梯度下降原理的Adam模型能夠在很短的時(shí)間內(nèi)完成8 000步的學(xué)習(xí),模型在測(cè)試集上也有不錯(cuò)的預(yù)測(cè)準(zhǔn)確率,但過擬合現(xiàn)象相對(duì)嚴(yán)重一些。正如前文所述,神經(jīng)網(wǎng)絡(luò)在有大量數(shù)據(jù)支撐的情況下可以達(dá)到很高的擬合精度,適應(yīng)于數(shù)據(jù)準(zhǔn)確且容易獲得的場(chǎng)景,對(duì)于不確定數(shù)據(jù)的處理能力較弱。另外,由于神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)無明確含義,隱含層的層數(shù)和節(jié)點(diǎn)數(shù)的確定需要通過不斷仿真進(jìn)行試探,以達(dá)到最好的預(yù)測(cè)效果。
本文基于態(tài)勢(shì)覺察、態(tài)勢(shì)理解和態(tài)勢(shì)預(yù)測(cè)3層SA建模框架,提出了自上而下任務(wù)驅(qū)動(dòng)方式的態(tài)勢(shì)覺察建模思路,以目標(biāo)威脅評(píng)估和意圖預(yù)測(cè)為重點(diǎn)研究對(duì)象開展了態(tài)勢(shì)理解和態(tài)勢(shì)預(yù)測(cè)的建模工作。得出主要結(jié)論如下:
1) 威脅評(píng)估DFGCM模型能夠適應(yīng)動(dòng)態(tài)、復(fù)雜的戰(zhàn)場(chǎng)環(huán)境,威脅排序結(jié)果與經(jīng)典的TOPSIS法一致,且能夠在態(tài)勢(shì)元素不準(zhǔn)確或丟失的情況下對(duì)單一目標(biāo)進(jìn)行合理的威脅量化評(píng)估。
2) 基于FGCM模型+PSO算法的目標(biāo)意圖預(yù)測(cè)模型取得了理想的訓(xùn)練和測(cè)試準(zhǔn)確率,與基于神經(jīng)網(wǎng)絡(luò)的模型相比,F(xiàn)GCM模型+PSO算法的意圖預(yù)測(cè)模型在防止過擬合方面有更好的表現(xiàn)。
需要指出的是,本文為便于建模工作的開展,特定選擇了態(tài)勢(shì)理解層和態(tài)勢(shì)預(yù)測(cè)層中最受關(guān)注的威脅評(píng)估和目標(biāo)意圖預(yù)測(cè)兩個(gè)問題開展了建模方法的研究,可為同行提供學(xué)術(shù)啟發(fā)和方法參考。由于研究內(nèi)容相對(duì)具體,本文所提出的建模方法在通用性和適用面上相對(duì)有限,如何將其擴(kuò)展并應(yīng)用到更大范圍的指揮控制層面,還需要在后續(xù)工作中進(jìn)一步研究。