徐智明 劉 宏 馬 琳 陳小衛(wèi)
(1.92819部隊 大連 116600)(2.海軍駐航天一院軍代室 北京 100076)(3.海軍軍訓(xùn)器材研究所 北京 100841)(4.海軍航空工程學(xué)院 煙臺 264001)
粗糙集理論[1]是分析和處理各類信息的有效工具,已成當(dāng)前研究的熱點,被廣泛知識發(fā)現(xiàn)、數(shù)據(jù)挖掘、決策分析等領(lǐng)域中[2~4]。在多屬性決策中,屬性值往往具有偏好關(guān)系,基于等價關(guān)系的經(jīng)典粗糙集則難以滿足需要。于是,Greco等[5~7]對粗糙集理論進(jìn)行擴(kuò)充,利用優(yōu)勢關(guān)系來代替等價關(guān)系,提出了基于優(yōu)勢關(guān)系的粗糙集,為多屬性決策提供了一種新方法。
然而在多屬性決策過程中,屬性值往往難以用精確數(shù)來表達(dá)。區(qū)間型多屬性決策則是多屬性決策的一種特殊情況。在區(qū)間信息系統(tǒng)上基于優(yōu)勢關(guān)系的粗糙集方法已有研究。文獻(xiàn)[8]將屬性值具有偏好關(guān)系的區(qū)間值信息系統(tǒng)稱區(qū)間序信息系統(tǒng),并定義了幾種優(yōu)勢關(guān)系;文獻(xiàn)[9]針對條件屬性和決策屬性都為區(qū)間數(shù)的多屬性決策問題,定義了三種優(yōu)勢關(guān)系;文獻(xiàn)[10]研究了不完備區(qū)間信息上基于優(yōu)勢關(guān)系的粗糙集方法;文獻(xiàn)[11]針對前面定義的幾種優(yōu)勢關(guān)系的不足,假定各屬性都服從給定區(qū)間數(shù)上的均勻分布,提出了一種概率優(yōu)勢關(guān)系,但表達(dá)形式過于復(fù)雜,同時該假定也缺乏依據(jù)。考慮到區(qū)間數(shù)多屬性決策中,通過可能度[12~13]能較好的表達(dá)區(qū)間數(shù)比較的優(yōu)于程度,本文將可能度的概念引入到優(yōu)勢關(guān)系中,提出一種基于可能度的優(yōu)勢關(guān)系,通過對可能度α∈[0.5,1]的變化,來調(diào)節(jié)優(yōu)勢關(guān)系的“優(yōu)于”程度,能較好的克服當(dāng)前區(qū)間序信息系統(tǒng)上的幾種優(yōu)勢關(guān)系的不足。
定義1[8]區(qū)間值信息系統(tǒng)是一個四元組S=(U,A,V,f),其中,U= {x1,x2,…,xn}為對象的非空有限集合,A為非空屬性集合;V=∪a∈AVa,Va為屬性a的值域,f:U×A→V為一信息函數(shù),表示對每一個a∈A,x∈U,f(x,a)∈Va,其中,Va是一個區(qū)間數(shù),定義如下
f(x,a)=[aL(x),aU(x)]={p|aL(x)≤p≤aU(x),aL(x),aU(x)∈R}
表示在屬性a下對象x的區(qū)間值。特別的aL(x)=aU(x)時,f(x,a)退化為一個實數(shù)。因此單值信息系統(tǒng)是區(qū)間值信息系統(tǒng)的特殊形式。
定義2[8]對區(qū)間值信息系統(tǒng)S=(U,A,V,f),若所有屬性都具有優(yōu)勢關(guān)系,則稱之為區(qū)間序信息系統(tǒng)。
定義3設(shè)區(qū)間序系統(tǒng)S=(U,A,V,f),B?A,幾種優(yōu)勢關(guān)系定義如下[8~11]:
1)上優(yōu)勢關(guān)系:
對定義3的幾種優(yōu)勢關(guān)系進(jìn)行分析,可以發(fā)現(xiàn)這幾種優(yōu)勢關(guān)系存在入一定的缺陷,具體如下:
1)下上優(yōu)勢關(guān)系的定義則過于嚴(yán)格。如[4.9,100]和[2,5],不滿足下上優(yōu)勢關(guān)系,但實際上可認(rèn)為[4.9,100]應(yīng)優(yōu)于[2,5]。
2)上下優(yōu)勢關(guān)系的定義過于寬松。根據(jù)上下優(yōu)勢關(guān)系,[2,3[2.999,100],同時又有[2.999,100[2,3],這也不合理,將會使得信息系統(tǒng)知識獲取中出現(xiàn)誤分類的問題。
3)上優(yōu)勢關(guān)系和下優(yōu)勢關(guān)系的定義則介于前兩者之間,但仍會產(chǎn)生不合理結(jié)果。如根據(jù)上優(yōu)勢關(guān)系,[1,3[2.98,2.99],這不符合事實。同理,根據(jù)下優(yōu)勢關(guān)系,[2,[1.999,100],這也不符合事實。
4)上上下下優(yōu)勢關(guān)系為同時滿足上優(yōu)勢和下優(yōu)勢關(guān)系的特例,但難以實現(xiàn)部分區(qū)間數(shù)的比較,從而導(dǎo)致分類的遺漏。如[1,2]和[0.9,10]無法比較,而[0.9,10]應(yīng)優(yōu)于[1,2]。
因此,有必要引入一種新的區(qū)間序信息系統(tǒng)的優(yōu)勢關(guān)系。
為了比較區(qū)間數(shù)的大小,文獻(xiàn)[13]定義了可能度的概念。
定義4當(dāng)a,b同為區(qū)間數(shù)或有一個區(qū)間數(shù)時,設(shè)a=[aL,aU],b=[bL,bU],且記la=aU-aL,lb=bU-bL,則稱
為a≥b的可能度。
可能度反映了區(qū)間數(shù)a≥b的可能性。通過可能度,能夠?qū)崿F(xiàn)任何兩個區(qū)間數(shù)進(jìn)行比較。因此,可將其引入到區(qū)間序信息系統(tǒng)中去。
對區(qū)間信息系統(tǒng)S=(U,A,V,f),對任意xi,xj∈U,a∈A,f(xi,a)=[aL(xi),aU(xi)],f(xj,a)=[aL(xj),aU(xj)],令=aU(xi)-aL(xi),=aU(xj)-aL(xj)。若f(xi,a)和f(xj,a)不同為實數(shù),則
>>
>
若f(xi,a)和f(xj,a)同為實數(shù),則
>
>
>
1)若=0,當(dāng)且僅當(dāng)aU(xj)≤aL(xi),即f(xj,a)≤f(xi,a)肯定成立。
>
>
3)若0<<1,則f(xi,a)與f(xj,a)相交或包含。
>
特別的,f(xi,a)=f(xj,a)時=0.5。即兩個區(qū)間數(shù)相等時,一個數(shù)優(yōu)于另外一個數(shù)的可能度為0.5。
>
定義5設(shè)區(qū)間值信息系統(tǒng)S=(U,A,V,f),B?A,給定可能度α∈(0,1],則可定義α-可能度優(yōu)勢關(guān)系和α-優(yōu)勢類:
>
>
在區(qū)間序信息系統(tǒng)中引入可能度α后,可以通過閾值α∈(0,1]的調(diào)節(jié)來改變滿足優(yōu)勢關(guān)系的可能程度,這樣就提高了信息處理的靈活性。
>
定理1給定區(qū)間序信息系統(tǒng)S=(U,A,V,f),B?A,
>
1)若α∈(0,0.5],則是自反的,但不是傳遞的和對稱的;
>
2)若α∈[0.5,1],則是傳遞的,但不是自反的和對稱的。
自然災(zāi)害與氣象問題對橋梁工程施工有著直接影響,火災(zāi)與爆炸這些安全事故受到工程施工現(xiàn)場環(huán)境的影響。針對這些工程環(huán)境風(fēng)險,施工企業(yè)可以利用購買工程施工保險的方法轉(zhuǎn)移風(fēng)險。有意識地將風(fēng)險與施工企業(yè)的經(jīng)濟(jì)效益聯(lián)系在一起,在安全事故發(fā)生后,盡最大可能降低施工企業(yè)的損失。另外,要在施工過程中對一切安全因素進(jìn)行有效監(jiān)控,24小時監(jiān)控施工現(xiàn)場的火災(zāi)發(fā)生影響因素與爆炸影響因素。安排專人負(fù)責(zé)工程環(huán)境風(fēng)險管理,加強(qiáng)施工現(xiàn)場的監(jiān)督力度,用規(guī)范的施工操作,預(yù)防工程環(huán)境事故的發(fā)生。
>
證明:(1)由α∈(0,0.5],則=0.5≥α,?a∈B,則(xi,xi)∈,故是自反的。同時可以驗證不滿足自反性和對稱性。
>
(2)由可能度的定義可知,α≥0.5時,對xi,xj,xk∈U,a∈B,若≥α≥α,則≥α,則可證明是傳遞的。同時可以驗證不滿足自反性和對稱性。
>
不失一般性,和有以下性質(zhì):
>
定理2給定區(qū)間序信息系統(tǒng)S=(U,A,V,f),B?A,則
>
>
證明:1)~3)可由優(yōu)勢關(guān)系和優(yōu)勢類的定義直接證明。
>
4)由定義,={(xi,xj)∈U×U≥α2,?a∈B},即對任意(xi,xj)∈,有≥α2,?a∈B。由題設(shè)條件α1≤α2,則≥α2≥α1,?a∈B,即(xi,xj)∈,由于(xi,xj)是任意的,則?。
>
5)由4)和α-優(yōu)勢類的定義可直接得到。
>
若在屬性a下對象xj優(yōu)于xi,則≥。有互補(bǔ)性知,≥0.5。由于α表示對象“優(yōu)于”的最小可能程度,為保證分類的合理性,應(yīng)取α∈[0.5,1]。
定義6設(shè)區(qū)間序信息系統(tǒng)S=(U,A,V,f),對給定的α∈[0.5,1],對任意B?A,X?U,上下近似定義如下:
由定義6,能得到如下性質(zhì)。
定理3區(qū)間序信息系統(tǒng)S=(U,A,V,f),B?A,α∈[0.5,1],則
證明:1)、2)、3)可由定義直接證明。
設(shè)有區(qū)間序信息系統(tǒng)S=(U,A,V,f),其中對象集U={x1,x2,…,x8},屬性集A={a1,a2,a3,a4,a5,a6},所有屬性均為效益型屬性。區(qū)間序信息表如表1所示。
表1 區(qū)間序信息表
利用2.2節(jié)中五種優(yōu)勢關(guān)系對表1數(shù)據(jù)進(jìn)行分類。由分類結(jié)果可知,下上優(yōu)勢關(guān)系雖然得到的分類準(zhǔn)確性高,但過于嚴(yán)格,使得分類中含有的信息過少。如對象x1與x8,f(x1,a4)=[6,12],f(x8,a4)=[11,12],計算在a4下x8優(yōu)于x1的可能度=0.857,即x8應(yīng)劃分到x1的優(yōu)勢類。但由下上優(yōu)勢關(guān)系,x8不能分到x1的優(yōu)勢類。而α-可能度優(yōu)勢關(guān)系而上下優(yōu)勢關(guān)系的定義過于寬松,雖然得到的分類信息量多,但容易引入不合理的信息。如對f(x1,a5)=[7,10],f(x2,a5)=[9,12],計算在a5下x2優(yōu)于x1的可能度=0.833,即x2優(yōu)于x1的概率大。而利用上下優(yōu)勢關(guān)系x1優(yōu)于x2,這顯然不合理。上優(yōu)勢關(guān)系和下優(yōu)勢關(guān)系的定義則介于前兩者之間,但仍會產(chǎn)生不合理結(jié)果,同時也會遺漏部分有用信息。上上下下優(yōu)勢關(guān)系為同時滿足上優(yōu)勢和下優(yōu)勢關(guān)系的特例,但難以實現(xiàn)部分區(qū)間數(shù)的比較,從而導(dǎo)致遺漏的問題。如對象x2和x6,由于f(x2,a1)=[6,14],f(x6,a1)=[12,13],采用上上下下優(yōu)勢關(guān)系則無法比較。計算在a1下x6優(yōu)于x2的可能度=0.778,即x6優(yōu)于x2的概率大。由α-可能度優(yōu)勢關(guān)系可知,x6優(yōu)于x2,即上上下下優(yōu)勢關(guān)系產(chǎn)生了漏分的問題。
從上面分析可以看出,以往的五種優(yōu)勢關(guān)系的缺點在于沒有對“優(yōu)于”的程度進(jìn)行合理的定義,從而造成分類中出現(xiàn)不合理或則遺漏信息的現(xiàn)象。下面采用本文提出的α-可能度優(yōu)勢關(guān)系進(jìn)行計算,分別令α=0.5,0.6,計算結(jié)果如下
由計算結(jié)果可看出,α-可能度優(yōu)勢關(guān)系能夠通過對α的變化來調(diào)節(jié)“優(yōu)于”的寬松程度,這樣就可以避免分類過寬和過窄而帶來的不合理性。同時通過定義的α-可能度能夠?qū)崿F(xiàn)任意兩個區(qū)間數(shù)的比較,這也避免分類中遺漏的問題。
基于優(yōu)勢關(guān)系的粗糙集方法為多屬性決策提供了一種新的思路。在現(xiàn)實世界中,由于決策問題的復(fù)雜性和不確定性,屬性值難以直接用精確數(shù)來描述,而往往采用區(qū)間數(shù)的形式來表示。區(qū)間序信息系統(tǒng)是單值信息系統(tǒng)的擴(kuò)展,針對區(qū)間序信息系統(tǒng)上的優(yōu)勢關(guān)系的研究對決策分析具有極其重要的意義。本文總結(jié)如下:
1)當(dāng)前區(qū)間序信息系統(tǒng)上的幾種優(yōu)勢關(guān)系存在著過寬或過窄的問題,從而導(dǎo)致分類出現(xiàn)不合理或遺漏的現(xiàn)象。針對這一問題,本文可能度的概念引入到優(yōu)勢關(guān)系中,提出了一種新的優(yōu)勢關(guān)系—α-可能度優(yōu)勢關(guān)系,進(jìn)而研究了α-可能度優(yōu)勢關(guān)系的基本性質(zhì)以及與其他優(yōu)勢關(guān)系的聯(lián)系,并定義了基于α-可能度優(yōu)勢關(guān)系的粗糙集模型。通過對可能度α∈[0.5,1]的變化,來調(diào)節(jié)優(yōu)勢關(guān)系的“優(yōu)于”程度,能較好的克服這些不足。
2)α表示一個對象優(yōu)于另一對象的最小可能程度,能夠反映決策者主觀愿望,因此,可由決策者直接給定。
[1]Pawlak Z.Rough set[J].International Journal of Computer and Information Sciences,1982,11(5):341-356.
[2]H.L.Li,M.H.Chen.Induction of multiple criteria optimal classification rules for biological and medical data[J].Computers in Biology and Medicine,2008,38:42-52.
[3]J.F.Liu,Q.H.Hu,D.R.Yu.A weighted rough set based method developed for class imbalance learning[J].Information Sciences,2008,178:1235-1256.
[4]L.X.Shen,H.T.Loh.Applying rough sets to market timing decisions[J].Decision Support Systems,2004,37:583-597.
[5]S.Greco,B.Matarazzo,R.Slowinski.A new rough set approach to multicriteria and multiattribute classification[J].Lecture Notes in Artificial Intelligence,1998,1424:6067.
[6]S.Greco,B.Matarazzo,R.Slowinski,Rough sets theory for multicriteria decision analysis[J].European Journal of Operational Research,2001,129:147.
[7]S.Greco,B.Matarazzo,R.Slowinski,Rough sets methodology for sorting problems in presence of multiple attributes and criteria[J].European Journal of Operational Research,2002,138:247-259.
[8]QIAN Yuhua,LIANG Jiye,DANG Chuangyin.Interval ordered information systems[J].Computers and Mathematics with Applications,2008,56(8):1994-2009.
[9]DEMBCZYNSKI K,GRECO S,SLOWINSKI R.Rough set approach to multiple criteria classification with imprecise evalu-ations and assignments [J].European Journal of Operational Research,2009,198(2):626-636.
[10]YANG X B,YU D J,YANG J Y,et al.Dominance-based Rough se t approach to incomplete interval-valued information system [J].Data & Knowledge Engineering,2009,68(11):1331-1347.
[11]楊青山,王國胤,張清華,等.基于優(yōu)勢關(guān)系的區(qū)間值粗糙集擴(kuò)充模型[J].山東大學(xué)學(xué)報(理學(xué)版),2010,45(9):7-13.
[12]沈麗容,黃洪.基于貝葉斯和可信度的糖尿病診療系統(tǒng)研究[J].計算機(jī)與數(shù)字工程,2011(11).
[13]Nakahara Y.User oriented ranking criteria and its application to fuzzy mathematical programming problems[J].Fuzzy Sets and Systems,1998,94:275-286.
[14]Nakahara Y,SaSakiM,Gen M.on the linear programming problems with interval coefficients[J].International Journal of Computer Industrial Engineering,1992,23:301-304.