徐孫慶
(92493部隊60分隊,葫蘆島 125000)
證據(jù)理論最早是由美國的數(shù)學(xué)教授Dempster A P于1967年提出來的,在他研究多值映射問題時,最早給出了上限概率以及下限概率的定義[1]。Shafer[2]對這一理論進(jìn)行了深入的拓展研究,并將基本概率分配函數(shù)引進(jìn)進(jìn)一步發(fā)展,形成了一套完整的理論體系。1981年,人工智能專家Barnett[3]將這一理論正式引進(jìn)了人工智能領(lǐng)域,并建議將這一理論定名為DS證據(jù)理論,此后證據(jù)理論迅速發(fā)展,在各領(lǐng)域的研究開花結(jié)果,文獻(xiàn)成果眾多,并且已經(jīng)廣泛的應(yīng)用于圖像處理、模式識別、故障診斷、風(fēng)險評估、技術(shù)狀態(tài)評估等相關(guān)領(lǐng)域。
盡管目前的研究如火如荼的展開著,但仍存在一些問題亟需解決。特別是對沖突證據(jù)進(jìn)行合成時,D-S證據(jù)理論并不能很好地對其進(jìn)行合成,甚至?xí)a(chǎn)生反直覺的結(jié)果。Zadeh[4]最早發(fā)文指出,這種情況是由于合成規(guī)則的固有不足造成的。查閱相關(guān)的文獻(xiàn)可知,目前大多數(shù)文獻(xiàn)對沖突證據(jù)融合的研究成果、改進(jìn)方法主要可以歸納為兩個方面:一方面是對合成規(guī)則進(jìn)行改進(jìn)。在這類方法中,較為經(jīng)典的是Yager[5]提出的將沖突分配給空集。另一方面是在證據(jù)融合前對證據(jù)進(jìn)行預(yù)處理,修改證據(jù)源模型。Murphy[6]提出的修改模型是較為經(jīng)典的加權(quán)平均法,通過對證據(jù)進(jìn)行簡單的加權(quán)處理進(jìn)而達(dá)到改善沖突證據(jù)融合結(jié)果精確性的目的。
不同方法有著不同的優(yōu)缺點。有些方法可能對高沖突證據(jù)的融合效果較好,但對差異性較小的證據(jù)的合成可能效果不好;有些方法可能會有較快的收斂速度和較高的可靠性,但可能公式更復(fù)雜,計算量更大。目前沒有一個解決方法能夠被廣泛的接受。因此,本文主要對沖突證據(jù)合成的研究現(xiàn)狀進(jìn)行了介紹,對兩種典型的改進(jìn)算法進(jìn)行對比研究,并運(yùn)用算例對不同方法的合成效果進(jìn)行了驗證。本文的結(jié)論能夠為后續(xù)改進(jìn)算法研究提供借鑒。
本節(jié)主要介紹證據(jù)理論的基本概念,以及在處理證據(jù)沖突時存在的不足。
定義1-1:假設(shè)在識別框架中,若集函數(shù)m:2Θ→[0,1]表示從集合2Θ映射到區(qū)間[0,1](2Θ為Θ的冪集),并且滿足以下條件:
則稱m為識別框架Θ上的基本信任分配函數(shù)。
定義 1-2:假設(shè)在識別框架 Θ 中,m:2Θ→[0,1]是識別框架Θ上的基本信任分配函數(shù),則由公式(3)定義的函數(shù)Bel:2Θ→[0,1]稱作識別框架Θ上的信度函數(shù).
假設(shè)E1,E2分別是識別框架下的兩個證據(jù),Bel1,Bel2是同一識別框架上的兩個信任函數(shù),m1、m2分別是兩個證據(jù)所對應(yīng)的基本信任分配函數(shù),焦元分別為 A1,…,Ak和 B1,…,Bj,若:
那么D-S證據(jù)理論的合成規(guī)則為:
證據(jù)間的差異性較小時,Dempster合成規(guī)則能夠較好地對證據(jù)進(jìn)行合成,以較高的信度得到目標(biāo)命題。但是當(dāng)證據(jù)間的差異性較大甚至完全對立、沖突時,則無法很好地合成證據(jù),甚至無法對證據(jù)進(jìn)行合成。
算例1:全沖突悖論的計算
假設(shè)存在某一識別框架為Θ={A,B},給定兩個證據(jù)E1,E2,對應(yīng)的焦元分別是 A,B,相應(yīng)的基本概率分配為:
根據(jù)前述介紹,此例中的沖突系數(shù)k=1×1+0×0=1,表明兩個證據(jù)完全對立,不能利用Dempster合成規(guī)則進(jìn)行合成,D-S證據(jù)理論失效。由于DS證據(jù)理論在這種情況下將不能使用,不能對證據(jù)進(jìn)行有效的處理。此即為Zadeh悖論,也稱為全沖突悖論。D-S證據(jù)理論無法解決全沖突悖論問題。
算例2:絕對信任悖論的計算
假設(shè)存在某一識別框架為Θ ={A,B,C},給定兩個證據(jù)E1,E2,對應(yīng)的焦元分別是A,B,C相應(yīng)的基本概率分配為:
利用Dempster合成規(guī)則,沖突系數(shù)k=0.09+0.81+0.09=0.99。證據(jù)E1,E2高度沖突。兩個證據(jù)分別以0.9的信度分別支持命題A和命題B。
利用合成規(guī)則進(jìn)行計算有:
兩個證據(jù)合成的結(jié)果顯示為支持命題C的概率值為1,這個結(jié)果是與常理相悖的,說明證據(jù)合成失效,D-S證據(jù)理論也不能用于處理此類問題。
D-S證據(jù)理論經(jīng)過幾十年的發(fā)展在各領(lǐng)域開花結(jié)果,但是對沖突證據(jù)的合成仍然沒有一個很好的解決方法。為了解決沖突證據(jù)的合成,已經(jīng)有很多研究給了一些方法。目前對D-S證據(jù)理論的改進(jìn)主要有兩個思路:一個是從證據(jù)源模型進(jìn)行改進(jìn),其代表方法是Yager法;另一個是從合成規(guī)則進(jìn)行改進(jìn),其代表方法是Murphy法。
Yager認(rèn)為證據(jù)融合失效時由于組合規(guī)則的不足引起的,因此假設(shè)識別框架是封閉的,將沖突部分全部分配給未知,其組合公式如下:
Murphy提出改進(jìn)原始證據(jù)的方法以彌補(bǔ)D-S證據(jù)組合規(guī)則的不足。首先求出所有證據(jù)的基本概率分配值的算術(shù)平均,然后利用經(jīng)典的D-S組合規(guī)則進(jìn)行n-1次融合。該方法的計算過程如下:
本節(jié)主要通過幾個算例來對比不同改進(jìn)方法的優(yōu)劣。
算例3假設(shè)識別框架為Θ ={A,B,C},各證據(jù)的基本概率賦值為:
根據(jù)計算,各算法的合成結(jié)果如表1、表2所示。
表1 兩個證據(jù)的合成結(jié)果
表2 三個證據(jù)的合成結(jié)果
由表1和表2可以看出,D-S證據(jù)理論對高沖突的證據(jù)無法很好地進(jìn)行合成。由于m2(A)=0,導(dǎo)致命題A被完全否定,即使后續(xù)有更多的證據(jù)支持命題A,合成結(jié)果永遠(yuǎn)顯示命題A的支持度為0。Yager方法也不能很好地解決沖突證據(jù)的合成問題,其合成結(jié)果過于保守,命題的不確定性增強(qiáng),特別是在證據(jù)數(shù)量較多時,無法很好地為決策服務(wù)。Murphy法對證據(jù)進(jìn)行簡單的算術(shù)平均,沒有考慮各證據(jù)間的權(quán)重及沖突,但是其合成效果較前兩種方法好。算例結(jié)果表示Murphy能夠較好地解決沖突證據(jù)的合成問題,結(jié)論也更加科學(xué)合理。
通過算例的對比計算可知,相較于改進(jìn)合成規(guī)則這一方法,對證據(jù)體本身的改進(jìn)更為有效。對合成規(guī)則的改進(jìn)破壞了可交換原則且容易喪失其良好的數(shù)學(xué)特性。實際上,如果是由于證據(jù)不可靠造成的證據(jù)沖突,那么這種情況下對合成規(guī)則進(jìn)行改進(jìn)也是沒有意義的。因此,為了更好地解決證據(jù)沖突問題,需要在證據(jù)合成前對證據(jù)進(jìn)行預(yù)處理,這樣能使合成結(jié)果更為科學(xué)準(zhǔn)確。然而,由于證據(jù)沖突的客觀存在,目前仍沒有一個統(tǒng)一的被廣泛接納的解決方法,需要進(jìn)一步加以研究。