李 敬,王利東
大連海事大學(xué) 理學(xué)院,遼寧 大連 116026
粗糙集理論是由波蘭數(shù)學(xué)家Pawlak于1982年提出的,其是一種有效處理不精確知識(shí)的數(shù)學(xué)工具[1]。目前該理論已經(jīng)成為人工智能以及計(jì)算智能領(lǐng)域刻畫(huà)不確定信息的主要工具,并且在機(jī)器學(xué)習(xí)、決策分析、模式識(shí)別、數(shù)據(jù)挖掘等領(lǐng)域得到廣泛應(yīng)用。
經(jīng)典的Pawlak粗糙集建立在等價(jià)關(guān)系基礎(chǔ)上,這限制了粗糙集在實(shí)際中的應(yīng)用。因此學(xué)者們不斷地對(duì)其進(jìn)行推廣,先后建立基于相容關(guān)系、優(yōu)勢(shì)關(guān)系和相似關(guān)系等的擴(kuò)展粗糙集模型[2]。Yao提出鄰域系統(tǒng)的粒度計(jì)算模型,并應(yīng)用到知識(shí)發(fā)現(xiàn)等領(lǐng)域[3]。為提升粗糙集應(yīng)對(duì)噪聲數(shù)據(jù)的適應(yīng)能力,Wong等人提出了概率粗糙集[4]。Yao等人[5]基于條件概率和兩個(gè)參數(shù)提出了決策粗糙集,并給出有效的方法選擇參數(shù)閾值。決策粗糙集模型從風(fēng)險(xiǎn)角度對(duì)決策過(guò)程進(jìn)行了更深入的刻畫(huà)。Hu等人[6]在程度粗糙集模型(graded rough set,GRS)[7]和雙定量決策粗糙集[8]基礎(chǔ)上提出了雙相對(duì)定量決策粗糙集的相關(guān)定義以及性質(zhì)。Xu等人建立了邏輯“與”、“或”視角下的雙定量決策粗糙集模型[8]。對(duì)于一個(gè)對(duì)象,一些屬性值可能是缺失的,通常針對(duì)這些屬性給定一個(gè)區(qū)分值(即定值)??紤]到信息的不完備性[9],Yang等人[10]提出不完備信息系統(tǒng)中的多粒度粗糙集。Liu等人在不完備系統(tǒng)建立決策粗糙集模型,并以區(qū)間值形式刻畫(huà)風(fēng)險(xiǎn)參數(shù)[11]。Li等人[12]針對(duì)不完備信息系統(tǒng)探討概念認(rèn)知學(xué)習(xí)的數(shù)學(xué)機(jī)理。
雙論域粗糙集模型是對(duì)經(jīng)典粗糙集模型的一種推廣形式,它能夠應(yīng)用于形式概念分析以及決策系統(tǒng),近年來(lái)受到越來(lái)越多的關(guān)注。例如,Miao等人[13]探討了雙論域上的程度粗糙集以及相應(yīng)數(shù)學(xué)性質(zhì)。楊海龍系統(tǒng)研究了多種形式背景下的雙論域粗糙集模型及其數(shù)學(xué)性質(zhì)[14]。Dai等人[15]采用粒計(jì)算方法定義了雙論域上的粗糙集,以及變精度粗糙集。在雙論域上,以雙相對(duì)定量考慮信息缺失問(wèn)題的粗糙集模型可以從廣義程度上刻畫(huà)不確定信息。本文受文獻(xiàn)[6,8,15]的啟發(fā),考慮到信息缺失,在不完備信息系統(tǒng)中提出雙論域上雙相對(duì)定量決策粗糙集,并對(duì)相應(yīng)的性質(zhì)及關(guān)系進(jìn)行了討論。
本文組織結(jié)構(gòu)如下:第2章介紹相關(guān)的知識(shí)概念;第3章介紹不完備信息系統(tǒng)中雙論域上的雙相對(duì)定量決策粗糙集定義及相關(guān)性質(zhì);第4章討論了兩種雙相對(duì)定量決策粗糙集的關(guān)系;第5章用具體實(shí)例進(jìn)一步說(shuō)明與驗(yàn)證。
下面介紹相關(guān)的基本定義,包括Pawlak粗糙集、概率粗糙集、不完備信息系統(tǒng)、單論域上的概率程度粗糙集和雙相對(duì)定量決策粗糙集。
定義1[8]設(shè)U為非空有限對(duì)象集合,R為定義在U×U上的等價(jià)關(guān)系,等價(jià)關(guān)系R生成U的一個(gè)劃分,定義U/R={[x]R|x∈U},其中[x]R表示x關(guān)于R的等價(jià)類。對(duì)于任意集合X?U,X的上下近似定義如下:
相應(yīng)的,明確包含在X中的對(duì)象形成正域,記為明確不包含在X中的對(duì)象形成負(fù)域,記為或許包含在X中的對(duì)象構(gòu)成邊界域,記為
定義2[6](U,R,P)為概率近似空間,對(duì)于任意的0≤β<α≤1,X關(guān)于概率近似空間(U,R,P)依參數(shù)α、β的概率程度上下近似定義如下:
定義3(不完備信息系統(tǒng))[16]設(shè)為一個(gè)信息系統(tǒng),其中U為對(duì)象組成的非空有限集合,AT是屬性的非空有限集合。若對(duì)于每個(gè)a∈AT有f:U→Va,其中Va為a的值域,對(duì) ?a∈AT,?x∈U,f(x,a)∈Va。如果至少有一個(gè)屬性a∈AT滿足Va含有空值,則稱S為不完備信息系統(tǒng),否則為完備的。
就已有的研究成果來(lái)看,不完備信息系統(tǒng)中的空值可以分為遺漏型和缺席型。前者是存在的,但沒(méi)有記錄,而后者被認(rèn)為是缺席的,是不容許被比較的。
定義4[6](U,R,P)為概率近似空間,U為非空有限集合,0≤δ<1,X∈P(U),則基于參數(shù)δ,X的概率程度上下近似定義如下:
相應(yīng)地,X的正域、負(fù)域、上邊界域、下邊界域以及邊界域可定義如下:
雙相對(duì)定量決策粗糙集是結(jié)合程度粗糙集[14]和概率粗糙集模型提出來(lái)的,其能從本質(zhì)上表明相對(duì)與絕對(duì)定量的結(jié)合。
(1)單論域上的第一種雙相對(duì)定量決策粗糙集
定義5[6]令I(lǐng)=(U,R,P)為概率近似空間,對(duì)于參數(shù)α、β、δ(0≤β<α≤1,0≤δ≤1),則第一種雙相對(duì)定量決策粗糙集(Drq1-DTRS)定義為,其中為X基于參數(shù)α、β的下近似,為X基于參數(shù)δ的上近似。
此外X的正域、負(fù)域、上邊界域、下邊界域和邊界域分別定義如下:
(2)單論域上的第二種雙相對(duì)定量決策粗糙集
定義6[6]令I(lǐng)=(U,R,P)為概率近似空間,對(duì)于參數(shù)α、β、δ(0≤β<α≤1,0≤δ≤1),則第二種雙相對(duì)定量決策粗糙集(Drq2-DTRS)定義為,其中為X基于參數(shù)δ的下近似,為X基于參數(shù)α、β的上近似。
此外,X的正域、負(fù)域、上邊界域、下邊界域和邊界域分別定義如下:
下面將在不完備信息系統(tǒng)中定義雙論域上的雙相對(duì)定量決策粗糙集模型,并討論該模型的相關(guān)性質(zhì)。
在實(shí)際生活中,難免會(huì)有一些信息缺失,例如文獻(xiàn)[12]展示了急性呼吸系統(tǒng)綜合征(SARS)病人的數(shù)據(jù)缺失案例,每位病人都會(huì)表現(xiàn)出相應(yīng)的癥狀,例如伴有發(fā)燒、咳嗽、呼吸困難等。隨著時(shí)間的推移,部分新患者出現(xiàn)一些新的癥狀,比如腹瀉等,則相應(yīng)的信息數(shù)據(jù)也應(yīng)得以更新,但是對(duì)于之前的病人來(lái)說(shuō)這些癥狀的信息是缺失的。因此考慮到信息缺失,對(duì)于論域x∈U,y∈V,對(duì)象x可能有癥狀y,也可能沒(méi)有。依據(jù)此背景給出不完備信息系統(tǒng)下雙論域上的粒度粗糙集模型相關(guān)定義。
令U、V為兩個(gè)論域,I?(U×V)為論域上的一個(gè)二元關(guān)系,I(x,y)={1,0,?},其中I(x,y)=1表示x、y之間一定存在關(guān)系,I(x,y)=0表示x、y之間不存在關(guān)系,則I(x,y)=?表示在某些情況下不能確定x、y之間是否存在關(guān)系[11]?;诖耍x不完備信息系統(tǒng)中雙論域上的二元關(guān)系R*={(x,y)∈U×V:I(x,y)=1∨I(x,y)=?,?x∈U,?y∈V}及其逆關(guān)系為R*′={(y,x)∈V×U:(x,y)∈R*}。因此,U中元素x的繼承域和V中元素y的前域定義如下:
定義7設(shè)U、V為不完備信息系統(tǒng)中的兩個(gè)論域,論域U到V的關(guān)系R*?(U×V)及其逆關(guān)系為R*′,對(duì)于Y?V,在雙論域上關(guān)系R*下Y的上、下近似定義如下:
定義8設(shè)U、V為不完備信息系統(tǒng)中的兩個(gè)論域,論域U到V的關(guān)系R*?(U×V)及其逆關(guān)系為R*′,對(duì)于X?U,在雙論域上關(guān)系R*下X的上、下近似定義如下:
本節(jié)將給出不完備信息系統(tǒng)中雙論域上的概率程度粗糙集的相應(yīng)定義以及相關(guān)性質(zhì)。
定義9設(shè)U、V為不完備信息系統(tǒng)中的兩個(gè)論域,論域U到V的關(guān)系R*?(U×V)及其逆關(guān)系為R*′,對(duì)于Y?V,0≤δ≤1,則基于參數(shù)δ的Y的概率程度上下近似定義如下:
相應(yīng)Y的概率程度正域、負(fù)域、上邊界域、下邊界域以及邊界域?yàn)椋?/p>
由定義9,參數(shù)δ取特殊值時(shí),可得如下性質(zhì)。
性質(zhì)1對(duì)于任意的0≤δ≤1,有以下性質(zhì)成立:
定義10設(shè)U、V為不完備信息系統(tǒng)中的兩個(gè)論域,論域U到V的關(guān)系R*?(U×V)及其逆關(guān)系為R*′,對(duì)于X?U,0≤δ≤1,則基于參數(shù)δ的X的概率程度上下近似定義如下:
相應(yīng)X的概率程度正域、負(fù)域、上邊界域、下邊界域以及邊界域?yàn)椋?/p>
性質(zhì)2由定義10,對(duì)于任意的0≤δ≤1,有以下性質(zhì)成立:
一般而言,決策粗糙集模型主要是就相對(duì)定量信息來(lái)描述近似空間,而程度粗糙集主要描述絕對(duì)定量信息[14]。同時(shí)從相對(duì)量化和絕對(duì)量化信息的角度考慮,徐偉華等人提出雙定量決策粗糙集。胡寶清等人提出概率程度粗糙集,以及將其與概率粗糙集結(jié)合提出雙相對(duì)定量決策粗糙集。本節(jié)考慮到信息的缺失,在不完備信息系統(tǒng)中給出雙論域上的雙相對(duì)定量決策粗糙集的定義,并且對(duì)相應(yīng)的性質(zhì)進(jìn)行了討論。
定義11設(shè)U、V為不完備信息系統(tǒng)中的兩個(gè)論域,U到V上的關(guān)系R*?(U×V)及其逆關(guān)系R*′,對(duì)于Y?V,參數(shù)α、β、δ(0≤β<α≤1,0≤δ≤1),Y的上下近似定義如下:
則不完備信息系統(tǒng)中雙論域上對(duì)于Y?V的第一種雙相對(duì)定量決策粗糙集定義為
此外,Y的正域、負(fù)域、上邊界域、下邊界域和邊界域定義如下:
定義12設(shè)U、V為不完備信息系統(tǒng)中的兩個(gè)論域,U到V上的關(guān)系R*?(U×V)及其逆關(guān)系R*′,對(duì)于X?U,參數(shù)α、β、δ(0≤β<α≤1, 0≤δ≤1),X的上下近似定義如下:
則不完備信息系統(tǒng)中雙論域上對(duì)于X?U的第一種雙相對(duì)定量決策粗糙集定義為
此外X的正域、負(fù)域、上邊界域、下邊界域和邊界域定義如下:
定義13設(shè)U、V為不完備信息系統(tǒng)中的兩個(gè)論域,U到V上的關(guān)系R*?(U×V)及其逆關(guān)系R*′,對(duì)于Y?V,參數(shù)α、β、δ(0≤β<α≤1,0≤δ≤1),Y的上下近似定義如下:
則不完備信息系統(tǒng)中雙論域上對(duì)于Y?V的第二種雙相對(duì)定量決策粗糙集定義為
此外Y的正域、負(fù)域、上邊界域、下邊界域和邊界域定義如下:
定義14設(shè)U、V為不完備信息系統(tǒng)中的兩個(gè)論域,U到V上的關(guān)系R*?(U×V)及其逆關(guān)系R*′,對(duì)于X?U,參數(shù)α、β、δ(0≤β<α≤1, 0≤δ≤1),X的上下近似定義如下:
則不完備信息系統(tǒng)中雙論域上對(duì)于X?U的第二種雙相對(duì)定量決策粗糙集定義為
此外X的正域、負(fù)域、上邊界域、下邊界域和邊界域定義如下:
根據(jù)以上定義,有以下性質(zhì)成立。
性質(zhì)3(1)對(duì)于第一種雙相對(duì)定量決策粗糙集而言,如果α=1,β=0,δ=0,對(duì)于Y?V,則有 (U,V,;對(duì)于X?U,則有
(2)相對(duì)定量決策粗糙集而言,如果α=1,β=0,δ=0,對(duì)于Y?V,則有對(duì)于X?U,則有
證明由定義11~定義14易得證?!?/p>
上文給出了在不完備信息系統(tǒng)中雙論域上兩種雙相對(duì)定量決策粗糙集的相關(guān)定義及性質(zhì),在此基礎(chǔ)上,下面將在參數(shù)α+β與1之間關(guān)系的基礎(chǔ)上進(jìn)一步討論兩種雙相對(duì)定量決策粗糙集的關(guān)系。
設(shè)U、V為不完備信息系統(tǒng)中的兩個(gè)論域,論域U、V上給定關(guān)系R*?(U×V),R*的逆關(guān)系為R*′,對(duì)于Y?V,參數(shù)α、β、δ(0≤β<α≤1,0≤δ≤1)有以下關(guān)系。
關(guān)系1α+β=1時(shí)
由兩種雙相對(duì)定量決策粗糙集Y的正域、負(fù)域、上邊界域、下邊界域以及邊界域的定義可得以下關(guān)系:
關(guān)系2α+β>1時(shí)
則有pos′(Y)?neg″(Yc),neg′(Y)?pos″(Yc)。
關(guān)系3α+β<1時(shí)
則有pos′(Y)?neg″(Yc),neg′(Y)?pos″(Yc)。
本文引用文獻(xiàn)[12]中的實(shí)例數(shù)據(jù)來(lái)解釋兩種雙相對(duì)定量決策粗糙集,并說(shuō)明它們之間的關(guān)系。設(shè)(U,V,R*)為一個(gè)不完備信息系統(tǒng)(如表1),其中U={x1,x2,x3,x4,x5,x6,x7,x8,x9}為9位患者,癥狀信息集合V={Fever,Cough,Headache,Difficulty breathing,Diarrhea,Muscle aches,Nausea and vomiting},為了方便將其記為V={y1,y2,y3,y4,y5,y6,y7}。如果對(duì)象xi有癥狀yj,則I(xi,yj)=1,在表1中值為1,如果對(duì)象xi沒(méi)有表現(xiàn)出癥狀yj,則I(xi,yj)=0,在表1中值為0。此外,沒(méi)有記錄對(duì)象xi是否有癥狀yj,則記為I(xi,yj)=?。
Table 1 SARS patient information table表1 SARS的病人信息表
由表1的數(shù)據(jù),相應(yīng)地可得:
相應(yīng)地對(duì)于R*′可得:
假設(shè)Y={y2,y3,y6},則Yc={y1,y4,y5,y7}。
(1)取α=0.6,β=0.4,δ=0.6,由定義11可得第一種雙相對(duì)定量決策粗糙集Y的正域、負(fù)域、上下邊界域以及邊界域如下:
類似的由定義13可得第二種雙相對(duì)定量決策粗糙集Yc的正域、負(fù)域、上下邊界域以及邊界域如下:
通過(guò)以上比較分析可驗(yàn)證文中“關(guān)系1”成立,即對(duì)于Y的第一種雙相對(duì)定量決策粗糙集的正域、負(fù)域、邊界域分別與對(duì)于Yc的第二種雙相對(duì)定量決策粗糙集的負(fù)域、正域、邊界域相等。
(2)取α=0.6,β=0.5,δ=0.6,同樣由定義11可得第一種雙相對(duì)定量決策粗糙集Y的正域、負(fù)域?yàn)椋?/p>
類似的由定義13可得第二種雙相對(duì)定量決策粗糙集Yc的正域、負(fù)域?yàn)椋?/p>
通過(guò)以上計(jì)算結(jié)果的比較可知,第二種雙相對(duì)定量決策粗糙集Yc的負(fù)域包含第一種雙相對(duì)定量決策粗糙集Y的正域,第一種雙相對(duì)定量決策粗糙集Y的負(fù)域包含第二種雙相對(duì)定量決策粗糙集Yc的正域。
(3)取α=0.6,β=0.3,δ=0.6,由定義11可得第一種雙相對(duì)定量決策粗糙集Y的正域、負(fù)域?yàn)椋?/p>
類似的由定義13可得第二種雙相對(duì)定量決策粗糙集Yc的正域、負(fù)域?yàn)椋?/p>
通過(guò)以上計(jì)算結(jié)果的比較可知文中“關(guān)系3”成立,即第二種雙相對(duì)定量決策粗糙集Yc的正域包含第一種雙相對(duì)定量決策粗糙集Y的負(fù)域,第一種雙相對(duì)定量決策粗糙集Y的正域包含第二種雙相對(duì)定量決策粗糙集Yc的負(fù)域。
雙論域上的粗糙集模型是對(duì)經(jīng)典粗糙集模型的一種推廣,本文給出了不完備信息系統(tǒng)中雙論域上的粒度粗糙集模型的定義,以及雙相對(duì)定量決策粗糙集的定義與相關(guān)性質(zhì),并在此基礎(chǔ)上探討了隨著相關(guān)參數(shù)關(guān)系的變化兩種雙相對(duì)定量決策粗糙集的關(guān)系。最后以具體實(shí)例進(jìn)一步地解釋說(shuō)明了所提出的定義以及相關(guān)關(guān)系。
[1]Pawlak Z.Rough sets[J].International Journal of Computer and Information Science,1982,11(5):341-356.
[2]Greco S,Matarazzo B,Slowinski R.Rough approximation of a preference relation by dominance relation[J].Europe Journal of Operation Research,1999,117(1):63-83.
[3]Yao Yiyu.Perspectives of granular computing[C]//Proceedings of the 2005 IEEE International Conference on Granular Computing,Beijing,Jul 25-27,2005.Piscataway:IEEE,2005:85-90.
[4]Wong S K M,Ziarko W.Comparison of the probabilistic approximate classification and the fuzzy set model[J].Fuzzy Sets and Systems,1987,21(3):357-362.
[5]Yao Yiyu,Wong S K M,Lingras P.A decision-theoretic rough set model[C]//Proceedings of the 5th International Symposium on Methodologies for Intelligent Systems,Knoxville,Oct 25-27,1990.New York:Elsevier Science Inc,1990:17-25.
[6]Fang Bowen,Hu Baoqing.Probabilistic graded rough set and double relative quantitative decision-theoretic rough set[J].International Journal of Approximate Reasoning,2016,74:1-12.
[7]Yao Yiyu,Lin T Y.Graded rough set approximations based on nested neighborhood systems[C]//Proceedings of the 5th European Congress on Intelligent Techniques and Soft Computing,Aachen,Sep 8-11,1997:196-200.
[8]Xu Weihua,Guo Yanting.Generalized multigranulation doublequantitative decision-theoretic rough set[J].Knowledge-Based Systems,2016,105:190-205.
[9]Kryszkiewicz M.Rough set approach to incomplete information systems[J].Information Sciences,1998,112(1/4):39-49.
[10]Yang Xibei,Song Xiaoning,Chen Zehua,et al.On multigranulation rough sets in incomplete information system[J].International Journal of Machine Learning and Cybernetics,2012,3(3):223-232.
[11]Liu Dun,Liang Decui,Wang Changchun.A novel threeway decision model based on incomplete information system[J].Knowledge-Based Systems,2016,91:32-45.
[12]Zhao Yingxiu,Li Jinhai,Liu Wenqi,et al.Cognitive concept learning from incomplete information[J].International Journal of Machine Learning&Cybernetics,2016,7(4):1-12.
[13]Liu Caihui,Miao Duoqian,Zhang Nan.Graded rough set model based on two universes and its properties[J].Knowledge-Based Systems,2012,33:65-72.
[14]Yang Hailong.The theory and method of rough sets on two universes[M].Beijing:Science Press,2016.
[15]Dai Jianhua,Han Huifeng,Zhang Xiaohong,et al.Catoptrical rough set model on two universes using granule-based definition and its variable precision extensions[J].Information Sciences,2017,390:70-81.
[16]Qian Yuhua.Granulation mechanism and data modeling for complex data[D].Taiyuan:Shanxi University,2011.
附中文參考文獻(xiàn):
[14]楊海龍.雙論域粗糙集理論與方法[M].北京:科學(xué)出版社,2016.
[16]錢宇華.復(fù)雜數(shù)據(jù)的?;瘷C(jī)理與數(shù)據(jù)建模[D].太原:山西大學(xué),2011.