蔣天合 胡劍文
(空軍指揮學院,北京100097)
空軍作戰(zhàn)仿真過程需要多種數(shù)據(jù)作支撐,其中既有確定數(shù)據(jù),也有大量不確定數(shù)據(jù)。傳統(tǒng)的不確定數(shù)據(jù)研究以點狀不確定數(shù)據(jù)研究為主,對具有一定范圍的多維不確定區(qū)間數(shù)據(jù)研究還不多,探索基于證據(jù)理論的多維不確定區(qū)間數(shù)據(jù)研究方法對開展空軍作戰(zhàn)仿真具有一定的支持作用。
在空軍作戰(zhàn)仿真所需的數(shù)據(jù)中,由于采集、傳輸和技術(shù)手段等多種原因,很多數(shù)據(jù)具有明顯的不確定性,如不同專家對同一問題的描述存在不一致性,不同探測裝備因性能不同對同一目標的探測結(jié)果也具有不確定性。不確定數(shù)據(jù)通常以概率形式表達,如何將不同的概率數(shù)據(jù)組合在一起,形成服務于作戰(zhàn)仿真的數(shù)據(jù),成為作戰(zhàn)仿真領(lǐng)域亟待解決的問題,證據(jù)理論可以較好地處理此類不確定數(shù)據(jù)的組合問題。
空軍作戰(zhàn)仿真中不確定數(shù)據(jù)產(chǎn)生原因比較復雜,可能是原始數(shù)據(jù)本身不準確或是采用了粗粒度的數(shù)據(jù)集合方法,也可能是為了滿足特殊應用目的或是在處理缺失值、數(shù)據(jù)集成過程中而產(chǎn)生,更多的情況是由于專家對同一問題的判斷結(jié)果不一致或不同設(shè)備對同一現(xiàn)象的不同判斷所導致[1]。
(1)采集的原始數(shù)據(jù)具有不確定性。首先,儀器采集數(shù)據(jù)的準確度受儀器本身的性能制約;其次,在網(wǎng)絡傳輸過程中,數(shù)據(jù)的準確性受到帶寬、傳輸延時、適配性等因素影響;最后,在傳感器網(wǎng)絡應用與RFID(無線射頻識別)應用等場合,周圍環(huán)境也會影響原始數(shù)據(jù)的準確度。
(2)粗細粒度數(shù)據(jù)集合相互轉(zhuǎn)換過程中會產(chǎn)生不確定性。從粗粒度數(shù)據(jù)集合轉(zhuǎn)換到細粒度數(shù)據(jù)集合的過程會產(chǎn)生不確定性,反之亦然。例如,假設(shè)某個記錄飛機位置的數(shù)據(jù)以批次飛機坐標為記錄目標,而仿真模型要求調(diào)用以單架飛機為目標的坐標數(shù)據(jù),其結(jié)果必然存在不確定性。
(3)特殊應用目的產(chǎn)生不確定性??哲娛歉呖萍急N,對作戰(zhàn)進程影響較大,其裝備性能和使用情況往往具有戰(zhàn)略性質(zhì),為此很多資料屬于保密范圍,知情范圍受限,數(shù)據(jù)需求單位只能以公開的內(nèi)容進行估計,從而產(chǎn)生不確定性。如空軍的某新型雷達探測性能數(shù)據(jù)只能進行粗略估算。
(4)缺失值處理產(chǎn)生不確定性。缺失值產(chǎn)生的原因很多,人員工作失誤、裝備故障、字段不一致、歷史原因等都可能產(chǎn)生缺失值。插值、刪除和人為填補所有含缺失值的記錄是常用的處理方式,但這些操作在一定程度上影響數(shù)據(jù)準確度。
(5)數(shù)據(jù)集成過程中產(chǎn)生不確定性??哲娮鲬?zhàn)仿真需要的數(shù)據(jù)來源廣泛,有時存在數(shù)據(jù)標準不統(tǒng)一現(xiàn)象,特別是不同數(shù)據(jù)源可能在格式、內(nèi)容、精度等方面存在不一致,在數(shù)據(jù)集成過程中會產(chǎn)生不確定性。
(6)不同專家對事物的判斷存在不確定性。由于外界條件的限制或自身知識背景的不同,不同專家對某一事物的描述不能明確地給出確切結(jié)果,而是一個相對模糊的判斷,如按概率給出肯定度、不確定度和否定度,此類結(jié)果數(shù)據(jù)在使用過程中必然存在不確定性。
無論何種原因產(chǎn)生的數(shù)據(jù)不確定性,在空軍作戰(zhàn)仿真過程中,都要按照模型的需要進行適當?shù)奶幚?,使之能夠滿足系統(tǒng)運行的要求。
主觀概率定義為在描述不確定事物時,由人的主觀因素所確定的概率,它與人的知識積累、個人偏好有關(guān)。其描述方法為:
P={(肯定),(不確定),(否定)},P表示概率分布集合,其中,肯定是指對事物的肯定判定概率,否定是指對事物的否定判斷概率,不確定指事物可能是肯定,也可能是否定,可解釋為對事物一無所知。
主觀概率分配具有以下關(guān)系,即:P(肯定)+P(不確定)+P(否定)=1
當肯定的概率為1時,表示事物是完全肯定的;當否定的概率為1時,表示事物是完全不可信的;當不確定的概率為1時,表示此判斷毫無意義,即不是確定的,也不是否定的,專家對此問題完全一無所知。
定義1 設(shè)函數(shù)M:2D→[0,1],且滿足:
則稱M是2D上的概率分配函數(shù),M(A)稱為A的基本概率數(shù)[2]。由于人的知識儲備受限,因此,在實際工作中允許專家有一定的不確定概率,即對某一事物的理解存在一定程度的一無所知,將其概率分配空間設(shè)定為{(肯定),(不確定),(否定)}。由于不同背景的專家對同一事物可能產(chǎn)生幾種不同的概率分配函數(shù),需要對它們進行組合,證據(jù)理論的組合方法可對多個概率分配函數(shù)進行正交和運算。
定義2 設(shè)M1和M2是兩個概率分配函數(shù),則其正交和M=M1⊕M2為:
如果K≠0,則正交和M也是一個概率分配函數(shù);如果K=0,則不存在正交和M,稱M1和M2矛盾。
對于多個概率分配函數(shù)M1,M2,…,Mn,如果它們可以組合,則也可通過正交和運算將它們組合為一個概率分配函數(shù)。
定義3 設(shè)M1,M2,…,Mn是n個概率分配函數(shù),則其正交和M=M1⊕M2⊕…⊕Mn為:
傳統(tǒng)的事物描述方法中,通常以確定數(shù)據(jù)給出結(jié)果,如在通過判讀空軍某次模擬對抗視頻而收集作戰(zhàn)數(shù)據(jù)的過程中,由三名專家判讀模擬數(shù)據(jù),對一次導彈攻擊,甲、乙、丙分別給了不同的擊中、未擊中和不確定三個概率分配,由證據(jù)理論可直接進行數(shù)據(jù)組合,計算出組合后的概率分配情況。但在準備空軍作戰(zhàn)仿真數(shù)據(jù)過程中,很多情況下通常要將判斷的結(jié)果描述為具有一定范圍的數(shù)據(jù),而不是某個確定的數(shù)值。不同的專家給出的數(shù)據(jù)范圍通常具有一定的重合度,但又不一定完全重合,對此類情況證據(jù)理論通常不能直接應用。為此我們將專家給出的數(shù)據(jù)區(qū)域進行分割,對專家給出的概率進行重新分配,然后針對不同的區(qū)域分別利用證據(jù)理論進行組合,得出不同分割區(qū)域的概率分配,進而分析其數(shù)據(jù),仍具有十分重要的意義。因此,首先定義區(qū)間數(shù)據(jù)。假設(shè)對給定的多維區(qū)間數(shù)據(jù)以D(N1,N2,…,Nn)來描述,其中每一維數(shù)據(jù)用一個范圍描述,即Ni=(di1,di2)(i=1,2,…,n),形成多區(qū)間數(shù)據(jù),對此空間的整體描述可表述為D(M),詳細描述為((d11,d12),(d21,d22),…,(dn1,dn2))。對二維數(shù)據(jù),其數(shù)據(jù)空間可描述為平面坐標內(nèi)的一個面狀區(qū)域,三維數(shù)據(jù)可描述為立體坐標空間的一個體積空間。
假設(shè)有N名專家對同一個事實進行判斷,得出N個描述結(jié)果,為更加科學地表達現(xiàn)實的不確定性,專家們統(tǒng)一采用概率描述形式,即M(T,I,F(xiàn)),其中T表示結(jié)果為肯定的概率,F(xiàn)表示結(jié)果為否定的概率,I表示結(jié)果為不確定的概率。以兩名專家為例,采用二維平面數(shù)據(jù)描述同一現(xiàn)象,由于數(shù)據(jù)描述范圍存在一定的交叉,其最多分割為三個區(qū)域,如圖1所示。
圖1 專家描述不確定區(qū)間數(shù)據(jù)示意圖
圖1 中,A、B表示專家的判斷范圍(為區(qū)別明顯采用不同精細的實線),1、2、3表示專家判斷的范圍相交后的分割區(qū)域。
以S1表示A被分割后的1部分面積,同理,S2、S3表示2、3部分的面積。對A專家的判斷結(jié)果,1區(qū)域中的肯定概率T1與面積成正比,1區(qū)域中的否定概率為不落入整個A判斷區(qū)域的否定概率與不落入1區(qū)域中的肯定概率(A)之和,不確定概率與整個判斷的不確定概率相同。因此,對1區(qū)域的不確定數(shù)據(jù)概率計算規(guī)則如下:
由二維推廣到多維區(qū)間數(shù)據(jù),其對不同分割部分概率計算方法如下:
式(4)中,Vi為被分割的第i個數(shù)據(jù)空間體積,V為某專家判斷的數(shù)據(jù)區(qū)間體積。T、I、F分別為專家對個人判斷結(jié)果的肯定、不確定和否定概率分配。
當一名專家的評判區(qū)域與其他專家的評判區(qū)域無交點時,則認為其他專家對此區(qū)域沒有肯定的影響,但是其他專家自身評判的肯定會對其他區(qū)域產(chǎn)生否定的影響,對不相交區(qū)域的不確定影響概率為肯定概率之外的數(shù)值,計算方法為:
由分析可知,證據(jù)理論的三元組描述方法中,加入了不確定因素,成為區(qū)別于傳統(tǒng)的非黑即白的概率判斷標準。由于不確定因素的加入,可以看出對專家判斷的每一個分割區(qū)域,其他專家的判斷結(jié)果對每個分割區(qū)域均有不同程度的影響,即一名專家的不確定概率分配會對非本人判斷的區(qū)域有一定的影響,其計算方式如下:Mi(肯定)=Ti,Mi(不確定)=Ii,Mi(否定)=Fi,其中i表示被分割的第i個區(qū)域,Ti表示不同專家對此區(qū)域作肯定判斷的主觀概率,Ii表示不同專家對此區(qū)域作不確定判斷的主觀概率,F(xiàn)i表示不同專家對此區(qū)域作否定判斷的主觀概率,當分割區(qū)域?qū)儆谀骋粚<业呐袛喾秶鷷r,按式(3)、式(4)計算,當分割區(qū)域不屬于某一專家的判斷范圍時,按式(5)計算,由此可分別計算每名專家對各個分割區(qū)域的主觀概率影響。通過各專家對不同區(qū)域的概率影響計算,可以實現(xiàn)不同分割區(qū)域的概率影響組合計算。
針對不同的分割區(qū)域,其概率分配計算過程如下:
(1)計算每個區(qū)域的面積;
(2)運用式(4)、式(5)計算專家對每個區(qū)域的概率影響;
(3)運用式(2)組合計算每個區(qū)域的概率分配;
(4)利用肯定概率與對應面積之比計算概率密度。
以圖1為例,A、B專家對1區(qū)域的肯定概率分配影響為:
在一個數(shù)據(jù)空間內(nèi),不同的分割區(qū)域具有不同的概率分配,將概率與數(shù)據(jù)分割區(qū)域的體積進行比值運算,即為概率密度,是度量概率特征的一個重要指標。
應用背景:空軍作戰(zhàn)仿真中,經(jīng)常需要判斷飛機的當前狀態(tài)參數(shù)[3]。描述狀態(tài)的參數(shù)有多種,如高度、速度、加速度、俯仰角、方向角等,為簡化問題的復雜性,選取其中的高度和速度為示例,以二維數(shù)據(jù)描述,具體如下。
選取不同背景的三名專家,分別記為A、B、C,同時描述一架飛機,其主觀概率互為獨立,描述結(jié)果為:A(9000—9500m,700—720km/h)(0.8,0.1,0.1)、B(9100—9600m,720—740km/h)(0.75,0.15,0.1)、C(9200—9700m,740—760km/h)(0.85,0.1,0.05),即三名專家的描述結(jié)果均為一個數(shù)值區(qū)間,三個區(qū)間具有一定的重合度,但又不完全重合,并且分別給出了專家的主觀概率分配情況。為計算方便,設(shè)定每個范圍的面積一樣,分別歸一化為邊長為1的正方形,三名專家的評判標準互相影響,其分割情況如圖2所示。
圖2 區(qū)間數(shù)據(jù)分割塊示意圖
圖2 中,最左邊為專家A判斷結(jié)果,中間為專家B判斷結(jié)果,右邊為專家C判斷結(jié)果,三名專家的評判區(qū)域被分割為7塊,分別用代號1—7表示。由于采用了三元組的概率分配描述方法,所以每個區(qū)域的實際概率分配受三名專家判斷結(jié)果的影響,對每個區(qū)域可通過組合理論,可計算出不同區(qū)域的概率分配情況,按照上述提出的計算過程,分別計算不同分割區(qū)域組合后的概率分配結(jié)果,見表1。
根據(jù)證據(jù)理論組合方法,分別計算不同區(qū)域的組合后概率分配和肯定概率密度,結(jié)果見表2。
表1 不同專家的評判結(jié)果對每個分割區(qū)域的概率影響
表2 不同區(qū)域的組合后概率分配與概率密度
按照每個分割區(qū)域的肯定概率分配密度作柱狀圖,如圖3所示。
圖3 組合后的肯定概率密度對照
從圖3中可以看出,三名專家判斷區(qū)域的重合部分肯定概率明顯高于其他區(qū)域。
傳統(tǒng)的證據(jù)理論概率分配空間可能很大,當因素較多時會產(chǎn)生組合爆炸問題,而文中分析的因素比較固定,其概率分配空間只有肯定、不確定和否定三種,用于對不同專家的判斷結(jié)果可信性進行分析具有較強的適用性。由計算可知,基于證據(jù)理論的不確定區(qū)間數(shù)據(jù)分析方法,在處理多維的不確定區(qū)間數(shù)據(jù)時,特別是以一定范圍描述的數(shù)據(jù)時,可以較好地解決不同專家的判斷不一致問題。由計算結(jié)果可知,當專家的評判區(qū)域重合度較高時,重合區(qū)域的肯定概率明顯高于非重合區(qū)域,可以推斷出不同專家在評判過程中,能力相近的專家容易提高數(shù)據(jù)的肯定概率,形成一致意見。相反,意見分歧過大的專家評判結(jié)果,必然重合度低,則專家意見的肯定性越高越不利于形成統(tǒng)一意見,反而使數(shù)據(jù)更加不確定。當重疊區(qū)域的肯定概率達到規(guī)定標準時,則可據(jù)此做出有效決策。通過對不確定區(qū)間數(shù)據(jù)的處理,可以為空軍作戰(zhàn)實驗提供較好的數(shù)據(jù)支撐[4]。
1 周傲英,金澈英,王國仁,等.不確定性數(shù)據(jù)管理技術(shù)研究綜述[J].計算機學報,2009(1):1-16.
2 金聰,郭京蕾.人工智能原理與應用[M].北京:清華大學出版社,2009.
3 劉學軍.論空軍作戰(zhàn)計劃的不確定性研究[J].空軍軍事學術(shù),2004(6):54-56.
4 胡曉峰,胡劍文.面向信息化戰(zhàn)爭整體需求的探索性分析方法[J].計算機仿真,2005,22(6):1-4.