陳黎,李芳芳,鄒長虹
(北京電子工程總體研究所,北京 100854)
空中目標(biāo)意圖識別是防空作戰(zhàn)態(tài)勢評估的關(guān)鍵,是準(zhǔn)確完成目標(biāo)威脅評估、正確進(jìn)行作戰(zhàn)決策的重要基礎(chǔ)[1-2]。但是,空中目標(biāo)意圖識別涉及眾多影響因素,包括來襲目標(biāo)的類型、攜帶的武器、慣用戰(zhàn)術(shù)動作等,特別是為了掩蓋其真實(shí)作戰(zhàn)意圖會釋放電磁干擾或做出一些欺騙行動來誘使我方得到錯誤的識別結(jié)果,同時(shí)考慮到我方預(yù)警探測系統(tǒng)提供的信息具有一定程度的不確定性,因此,要實(shí)時(shí)完成對空中來襲目標(biāo)的作戰(zhàn)意圖進(jìn)行準(zhǔn)確識別具有一定的難度。目前,該問題已成為防空作戰(zhàn)態(tài)勢估計(jì)領(lǐng)域的研究熱點(diǎn)。
現(xiàn)有的空中目標(biāo)意圖識別方法大致分為基于規(guī)則推理的方法和基于數(shù)據(jù)驅(qū)動的機(jī)器學(xué)習(xí)方法2類。其中,基于規(guī)則推理的方法有貝葉斯網(wǎng)絡(luò)[3-5]、證據(jù)推理[6-7]、模板匹配等方法[8-9]。貝葉斯網(wǎng)絡(luò)方法是在概率論框架下提出的,能夠有效實(shí)現(xiàn)定性知識與定量推理結(jié)合;證據(jù)推理方法能夠表征比貝葉斯網(wǎng)絡(luò)更弱的條件,具有較好的不確定性表達(dá)能力;模板匹配方法需要依據(jù)作戰(zhàn)規(guī)則事先構(gòu)建目標(biāo)意圖模板。基于數(shù)據(jù)驅(qū)動的機(jī)器學(xué)習(xí)方法有支持向量機(jī)、深度神經(jīng)網(wǎng)絡(luò)以及強(qiáng)化學(xué)習(xí)等方法[10-15],它們都需要大量的訓(xùn)練數(shù)據(jù)。
受限于目標(biāo)運(yùn)動航跡無法進(jìn)行長時(shí)預(yù)測,現(xiàn)有基于規(guī)則推理的方法在進(jìn)行意圖預(yù)測時(shí)大都依據(jù)推理規(guī)則和實(shí)時(shí)感知的目標(biāo)特征信息估計(jì)當(dāng)前時(shí)刻的目標(biāo)作戰(zhàn)意圖;而基于數(shù)據(jù)驅(qū)動的機(jī)器學(xué)習(xí)方法雖然能夠利用預(yù)測模型和訓(xùn)練數(shù)據(jù)對目標(biāo)意圖進(jìn)行預(yù)測,但預(yù)測準(zhǔn)確率過度依賴訓(xùn)練數(shù)據(jù)的質(zhì)量。基于此,本文提出一種基于動態(tài)貝葉斯網(wǎng)絡(luò)和模板匹配的意圖識別方法,將意圖識別分為行動推理和意圖預(yù)測2 個(gè)環(huán)節(jié)。在行動推理環(huán)節(jié),不是根據(jù)目標(biāo)運(yùn)動航跡,而是根據(jù)目標(biāo)當(dāng)前的作戰(zhàn)行動,預(yù)測目標(biāo)可能的行動序列;在意圖預(yù)測環(huán)節(jié),進(jìn)一步基于目標(biāo)可能的行動序列,對目標(biāo)的作戰(zhàn)意圖進(jìn)行實(shí)時(shí)預(yù)測。意圖預(yù)測過程充分利用了實(shí)時(shí)感知的目標(biāo)特征信息、領(lǐng)域?qū)<抑R以及積累的歷史作戰(zhàn)態(tài)勢數(shù)據(jù),進(jìn)一步提升了意圖識別的準(zhǔn)確率。
假定來襲目標(biāo)實(shí)現(xiàn)一個(gè)意圖通常會逐一采取一系列相關(guān)作戰(zhàn)行動的方式來實(shí)現(xiàn)。從意圖的實(shí)現(xiàn)方來看,是一個(gè)自上而下的過程,即根據(jù)一定的條例和規(guī)則,從作戰(zhàn)意圖出發(fā),將作戰(zhàn)意圖或者作戰(zhàn)任務(wù)分解為行動序列,然后依次執(zhí)行行動序列達(dá)到實(shí)現(xiàn)作戰(zhàn)意圖或者作戰(zhàn)任務(wù)的目的[3]。
反過來,對意圖的識別方而言,其分析推理思路是自下而上的。由于來襲目標(biāo)作戰(zhàn)意圖或者作戰(zhàn)任務(wù)的不可觀測性,不能直接進(jìn)行估計(jì),同時(shí)還存在一定的隱蔽性和欺騙性,只能根據(jù)可感知的目標(biāo)各特征狀態(tài),經(jīng)過基于相應(yīng)規(guī)則或邏輯的分析推理,得到來襲目標(biāo)的作戰(zhàn)意圖或者作戰(zhàn)任務(wù)。作戰(zhàn)意圖推理流程如圖1 所示。
圖1 作戰(zhàn)意圖推理流程Fig. 1 Reasoning process of combat intention
由圖1 可知,意圖識別方需要進(jìn)行2 個(gè)環(huán)節(jié)的推理:一是由各目標(biāo)特征信息推理預(yù)測得到目標(biāo)可能的作戰(zhàn)行動序列;二是由目標(biāo)可能的作戰(zhàn)行動序列推理識別得到目標(biāo)的作戰(zhàn)意圖。完成這2 個(gè)過程的推理分析,就能夠最終得出來襲目標(biāo)的作戰(zhàn)意圖。
構(gòu)建如圖2 所示的動態(tài)貝葉斯網(wǎng)絡(luò)推理模型,綜合利用領(lǐng)域?qū)<抑R和積累的歷史作戰(zhàn)態(tài)勢數(shù)據(jù),并根據(jù)實(shí)時(shí)感知的特征信息推理來襲目標(biāo)當(dāng)前的作戰(zhàn)行動,根據(jù)目標(biāo)當(dāng)前的作戰(zhàn)行動預(yù)測來襲目標(biāo)可能的行動序列。
圖2 動態(tài)貝葉斯網(wǎng)絡(luò)推理模型Fig. 2 Reasoning model of dynamic Bayesian network
step 1:建立貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)。分析提取與目標(biāo)作戰(zhàn)意圖相關(guān)的要素變量,依靠領(lǐng)域?qū)<业闹R來建立貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),如圖3 所示。
圖3 貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)圖Fig. 3 Structure of Bayesian network
這里主要通過目標(biāo)的類型、距離、速度、航向、飛行高度等要素來推測目標(biāo)的作戰(zhàn)行動。
各節(jié)點(diǎn)要素的屬性狀態(tài)劃分如下:
目標(biāo)類型:固定翼飛機(jī)、武裝直升機(jī)、無人機(jī)等;
距離:遠(yuǎn)、中、近;
速度:大、中、??;
航向:穩(wěn)定、小幅變化、大幅變化;
慣用高度:超高、高、中、低、超低;
飛行高度:超高、高、中、低、超低;
制空程度:掌握程度大于80%,掌握程度約為50%,掌握程度小于20%;
作戰(zhàn)行動:高空盤旋、高空巡航、中空巡航、中空機(jī)動、低空巡航、低空機(jī)動、俯沖、爬升。
step 2:對網(wǎng)絡(luò)節(jié)點(diǎn)狀態(tài)建立隸屬度函數(shù)。從圖3 中各變量節(jié)點(diǎn)屬性狀態(tài)劃分來看,各節(jié)點(diǎn)屬性狀態(tài)的模糊劃分構(gòu)成模糊集,對各模糊集建立隸屬度函數(shù)。
step 3:確定貝葉斯網(wǎng)絡(luò)參數(shù)。參數(shù)學(xué)習(xí)方法是在已知網(wǎng)絡(luò)結(jié)構(gòu)的條件下,利用歷史作戰(zhàn)態(tài)勢數(shù)據(jù)來學(xué)習(xí)節(jié)點(diǎn)的參數(shù),包括邊緣概率和條件概率。邊緣概率表現(xiàn)為來襲目標(biāo)先前的戰(zhàn)術(shù)運(yùn)用特點(diǎn),條件概率表現(xiàn)為各要素之間的依賴關(guān)系。
這里采用E-M 算法估計(jì)節(jié)點(diǎn)的先驗(yàn)概率和條件概率,E-M 算法具體描述如下:
輸入:G——貝葉斯網(wǎng)絡(luò)NN的結(jié)構(gòu);D——一組關(guān)于N中變量的訓(xùn)練數(shù)據(jù);δ——收斂閾值;
輸出:θ——N的參數(shù)的估計(jì)。
過程:
t= 0,θt= 隨機(jī)參數(shù)值
oldScore =L(θt|D)
while( true)
M 步:按下式計(jì)算θt+1:
newSore =L(θt+1|D)
i(fnewSore > oldScore +δ)
oldScore = newSore
t=t+ 1
else
returnθt+1
end while
step 4:在確定了貝葉斯網(wǎng)絡(luò)模型的拓?fù)浣Y(jié)構(gòu)和相應(yīng)參數(shù)的條件下,利用實(shí)時(shí)獲取的目標(biāo)特征信息推理空中目標(biāo)的作戰(zhàn)行動。
構(gòu)建如圖4 所示基于馬爾科夫鏈的作戰(zhàn)行動預(yù)測模型θ=(A,B,π),式中:A為馬爾科夫作戰(zhàn)行動轉(zhuǎn)移概率矩陣;B為單位矩陣;π為初始作戰(zhàn)行動概率向量。
圖4 基于馬爾科夫鏈的作戰(zhàn)行動預(yù)測Fig. 4 Combat operation prediction based on Markov chain
預(yù)測過程如下所述:
step 1:利用樣本數(shù)據(jù)估計(jì)狀態(tài)轉(zhuǎn)移概率aij。采用極大似然估計(jì)法進(jìn)行估計(jì),即
step 2:基于當(dāng)前作戰(zhàn)行動進(jìn)行n步預(yù)測。這里基于馬爾科夫鏈模型θ進(jìn)行預(yù)測,計(jì)算預(yù)測作戰(zhàn)行動的條件概率,并剔除條件概率低于預(yù)置門限的作戰(zhàn)行動。
step 3:計(jì)算n步預(yù)測作戰(zhàn)行動的聯(lián)合概率。采用馬爾科夫鏈前向算法進(jìn)行計(jì)算:
step 4:對n步預(yù)測作戰(zhàn)行動的聯(lián)合概率進(jìn)行排序,取聯(lián)合概率最大的l條n步作戰(zhàn)行動,連同前m步已發(fā)生的作戰(zhàn)行動構(gòu)成l條m+n步作戰(zhàn)行動序列。
目標(biāo)作戰(zhàn)意圖或者作戰(zhàn)任務(wù)主要包括偵察、通信、佯攻、防區(qū)外打擊、臨空攻擊等,在獲取目標(biāo)m+n步作戰(zhàn)行動序列后,進(jìn)一步采用基于態(tài)勢模板匹配的方法完成目標(biāo)作戰(zhàn)意圖識別?;趹B(tài)勢模板匹配的意圖識別方法如圖5 所示。
圖5 基于態(tài)勢模板匹配的意圖識別Fig. 5 Intention recognition based on situation template matching
主要包括3 個(gè)步驟:
step 1:基于C 語言集成產(chǎn)生式系統(tǒng)(C language integrated production system,CLIPS)CLIPS 方法構(gòu)建態(tài)勢模板知識庫,根據(jù)作戰(zhàn)規(guī)則、專家經(jīng)驗(yàn)、作戰(zhàn)條例、作戰(zhàn)時(shí)段、敵方常用戰(zhàn)法等因素建立作戰(zhàn)行動與作戰(zhàn)意圖的IF-THEN 規(guī)則。
step 2:根據(jù)目標(biāo)m+n步作戰(zhàn)行動序列,綜合態(tài)勢模板知識庫里的模板進(jìn)行診斷,建立特定態(tài)勢假設(shè)的模板結(jié)構(gòu)。建立特定態(tài)勢假設(shè)模板結(jié)構(gòu)的過程與人的認(rèn)知過程相對應(yīng),即從態(tài)勢模板知識庫里裁剪出適應(yīng)于特定態(tài)勢的模板結(jié)構(gòu)。
step 3:計(jì)算m+n步作戰(zhàn)行動序列與特定態(tài)勢模板結(jié)構(gòu)的匹配程度,當(dāng)匹配程度高于預(yù)設(shè)門限時(shí),這個(gè)特定態(tài)勢模板結(jié)構(gòu)就可以用來解釋來襲目標(biāo)的作戰(zhàn)意圖。
對作戰(zhàn)行動序列輸出的作戰(zhàn)意圖進(jìn)行D-S 證據(jù)融合,在利用Dempster 規(guī)則對證據(jù)融合時(shí),如果證據(jù)沖突太大,融合結(jié)果會出現(xiàn)不合理的現(xiàn)象。這里對各證據(jù)的沖突程度進(jìn)行量化度量,當(dāng)證據(jù)沖突程度低于預(yù)設(shè)門限時(shí),將融合后的目標(biāo)意圖作為目標(biāo)的作戰(zhàn)意圖,證據(jù)融合流程如下所示。
step 1:根據(jù)證據(jù)可靠度對各證據(jù)進(jìn)行折扣,折扣因子α根據(jù)該證據(jù)對應(yīng)作戰(zhàn)行動序列的聯(lián)合概率進(jìn)行計(jì)算:
step 2:對作戰(zhàn)行動序列輸出的作戰(zhàn)意圖進(jìn)行D-S 證據(jù)融合:
式中:
step 3:計(jì)算證據(jù)間的平均證據(jù)距離:
式中:
step 4:如果滿足下述條件,則融合后的作戰(zhàn)意圖即為來襲目標(biāo)的作戰(zhàn)意圖:
式 中:m(X1) = max {m(Xi)} ;m(X2) = max {m(Xi)且Xi≠X1};ε1和ε2為預(yù)設(shè)門限。
下面在要地防空作戰(zhàn)場景下固定翼飛機(jī)執(zhí)行臨空攻擊作戰(zhàn)任務(wù),基于表1 所示歷史態(tài)勢數(shù)據(jù),并采用本文所提基于動態(tài)貝葉斯網(wǎng)絡(luò)和模板匹配的空中目標(biāo)意圖識別方法對來襲目標(biāo)的作戰(zhàn)意圖進(jìn)行識別。
表1 歷史態(tài)勢數(shù)據(jù)Table 1 Historical situation data
飛行高度隸屬度函數(shù)、飛行速度隸屬度函數(shù)、距離隸屬度函數(shù)以及航向隸屬度函數(shù)分別見表2~5。
表2 飛行高度隸屬度函數(shù)Table 2 Flight height membership function
表3 飛行速度隸屬度函數(shù)Table 3 Flight velocity membership function
表4 距離隸屬度函數(shù)Table 4 Distance membership function
表5 航向隸屬度函數(shù)Table 5 Heading membership function
對表1 所示歷史態(tài)勢數(shù)據(jù)采用E-M 算法進(jìn)行迭代估計(jì)網(wǎng)絡(luò)節(jié)點(diǎn)的先驗(yàn)概率和條件概率,得到如圖6 所示的貝葉斯網(wǎng)絡(luò)推理模型。
圖6 貝葉斯網(wǎng)絡(luò)推理模型Fig. 6 Reasoning model of Bayesian network
當(dāng)目標(biāo)類型為固定翼飛機(jī)、距離為遠(yuǎn)、速度為高、慣用高度為高、制空程度為小于20%、飛行高度為高的證據(jù)出現(xiàn)后,推理模型給出當(dāng)前作戰(zhàn)行動為“高空巡航”,如圖7 所示。
圖7 特征信息推理當(dāng)前作戰(zhàn)行動Fig. 7 Reasoning of current combat operations by feature information
進(jìn)一步利用基于馬爾科夫鏈的作戰(zhàn)行動預(yù)測模 型θ=(A,B,π) 對 目 標(biāo) 可 能 的 行 動 序 列 進(jìn) 行預(yù)測。
step 1:利用樣本數(shù)據(jù)構(gòu)建作戰(zhàn)行動預(yù)測模型如下:
step 2: 基于當(dāng)前作戰(zhàn)行動進(jìn)行3 步預(yù)測:
第1 步預(yù)測:
取預(yù)測概率門限為ξ1= 0.2,則第1 步預(yù)測可能的 作 戰(zhàn) 行 動 為:“俯 沖”(0.304),“低 空 巡 航”(0.201)。
第2 步預(yù)測:
取預(yù)測概率門限為ξ2= 0.15,則第2 步預(yù)測可能的作戰(zhàn)行動為:“低空巡航”(0.312),“中空巡航”(0.154),“低空機(jī)動”(0.151)。
第3 步預(yù)測:
取預(yù)測概率門限為ξ3= 0.15,則第3 步預(yù)測可能 的 作 戰(zhàn) 行 動 為:“低 空 巡 航”(0.284),“爬 升”(0.204),“中空巡航”(0.192)。
step 3: 計(jì)算3步預(yù)測作戰(zhàn)行動序列的聯(lián)合概率。
step 4: 對3 步預(yù)測作戰(zhàn)行動的聯(lián)合概率進(jìn)行排序,取聯(lián)合概率最大的5 條3 步作戰(zhàn)行動,連同前1步已發(fā)生的作戰(zhàn)行動(高空巡航)構(gòu)成5 條4 步作戰(zhàn)行動序列,見表6 所示。
表6 聯(lián)合概率最大的5 條作戰(zhàn)行動序列Table 6 Five combat operation sequences with maximum joint probability
采用Rete 匹配器對5 條4 步作戰(zhàn)行動序列進(jìn)行規(guī)則匹配,匹配結(jié)果如表7 所示。
表7 預(yù)測行動序列匹配作戰(zhàn)意圖Table 7 Predicted operation sequence matching combat intention
對作戰(zhàn)行動序列輸出的作戰(zhàn)意圖進(jìn)行D-S 證據(jù)融合,首先根據(jù)聯(lián)合概率對各證據(jù)進(jìn)行折扣:
m(1臨空攻擊)=1,m(1H)=0;
m(2防區(qū)外打擊)=1,m(2H)=0;
m(3臨空攻擊)=0.422,m(3H)=0.578;
m(4防區(qū)外打擊)=0.625,m(4H)=0.375;
m(5臨空攻擊)=0.375,m(5H)=0.625.
進(jìn)一步對各證據(jù)進(jìn)行D-S 證據(jù)融合:
m(臨空攻擊)=0.509 2,
m(防區(qū)外打擊)=0.490 6,
m(H)=0.000 2.
表明此時(shí)證據(jù)沖突較大,無法得到來襲目標(biāo)的作戰(zhàn)意圖。
當(dāng)目標(biāo)類型為固定翼飛機(jī)、距離為中、速度為高、航向大幅變化、制空程度為小于20%、飛行高度為中的證據(jù)出現(xiàn)后,預(yù)測行動序列匹配的作戰(zhàn)意圖如表8 所示。
表8 預(yù)測行動序列匹配作戰(zhàn)意圖Table 8 Predicted operation sequence matching combat intention
對各證據(jù)進(jìn)行D-S 證據(jù)融合:
m(臨空攻擊)=0.880 6,
m(防區(qū)外打擊)=0.119 3,
m(H)=0.000 1.
此時(shí)證據(jù)間的平均證據(jù)距離dˉ= 0.395 <ε2=0.6,同 時(shí)m(臨空攻擊)-m(防區(qū)外打擊) >ε1=0.5,表明證據(jù)沖突不大,故將融合識別結(jié)果“臨空攻擊”作為來襲目標(biāo)的作戰(zhàn)意圖。
進(jìn)一步采用本文所提方法在不同場景下對來襲目標(biāo)的作戰(zhàn)意圖進(jìn)行識別, 識別準(zhǔn)確率如表9所示。
表9 不同場景下的識別準(zhǔn)確率Table 9 Recognition accuracy in different scenarios
從上述仿真過程可以看出,該方法由于充分利用了積累的歷史作戰(zhàn)態(tài)勢數(shù)據(jù)、實(shí)時(shí)感知的目標(biāo)運(yùn)動、屬性等特征信息以及領(lǐng)域?qū)<抑R建立的行動預(yù)測模型對目標(biāo)行動序列進(jìn)行預(yù)測,因此能夠較早地準(zhǔn)確識別出目標(biāo)作戰(zhàn)意圖。這不僅提高了意圖識別的準(zhǔn)確率,而且還能夠進(jìn)一步縮短態(tài)勢評估的時(shí)間,為防空作戰(zhàn)贏得先機(jī)。同時(shí),本文所提識別方法的準(zhǔn)確率依賴于歷史作戰(zhàn)態(tài)勢數(shù)據(jù)的可信度,因此有必要對歷史作戰(zhàn)數(shù)據(jù)進(jìn)行分析和整理,特別是需要對平時(shí)和戰(zhàn)時(shí)的作戰(zhàn)數(shù)據(jù)進(jìn)行區(qū)分,進(jìn)一步提升意圖識別方法的準(zhǔn)確率。
為了解決意圖識別中的意圖預(yù)測問題,本文提出了一種基于動態(tài)貝葉斯網(wǎng)絡(luò)和模板匹配的意圖識別方法。該方法將意圖識別分為行動推理和意圖預(yù)測2 個(gè)環(huán)節(jié),在行動推理環(huán)節(jié)不是根據(jù)目標(biāo)運(yùn)動航跡而是根據(jù)目標(biāo)當(dāng)前的作戰(zhàn)行動預(yù)測目標(biāo)可能的行動序列,在意圖預(yù)測環(huán)節(jié)進(jìn)一步基于目標(biāo)可能的行動序列對目標(biāo)的作戰(zhàn)意圖進(jìn)行實(shí)時(shí)預(yù)測。仿真結(jié)果表明,意圖識別過程充分利用了實(shí)時(shí)感知的目標(biāo)特征信息、領(lǐng)域?qū)<抑R以及積累的歷史作戰(zhàn)態(tài)勢數(shù)據(jù),能夠進(jìn)一步提升意圖識別的準(zhǔn)確率。