汪小燕, 郭云婷, 申元霞
(安徽工業(yè)大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,安徽 馬鞍山 243032)
粗糙集理論[1]是Pawlak 等學(xué)者在1982年提出的處理不確定、不精確和不完全數(shù)據(jù)的一種新的數(shù)學(xué)工具,主要研究內(nèi)容是屬性約簡[2]和規(guī)則提取。多粒度粗糙集[3-6]作為一種新型的多視角數(shù)據(jù)分析方法,可以從多個粒度空間對目標(biāo)概念進行近似逼近,使得邊界區(qū)域減少,目標(biāo)概念的表示精度得到提高,并且與其他處理不確定知識的理論結(jié)合,受到了學(xué)者們的廣泛關(guān)注。文獻[7]將多粒度粗糙集擴展到變精度多粒度粗糙集,文獻[8]將其擴展到程度多粒度粗糙集,文獻[9]將其擴展到可變多粒度粗糙集,眾多學(xué)者更是從模糊關(guān)系[10]、不完備信息系統(tǒng)[11-13]、鄰域關(guān)系[14]、證據(jù)理論[15]等角度對多粒度粗糙集進行了深入的擴展,這些研究工作促進了多粒度粗糙集理論和應(yīng)用的發(fā)展。文獻[16]提出了基于等價關(guān)系的精度與程度“邏輯或”粗糙集模型,融合了相對量化信息和絕對量化信息。文中針對不完備信息系統(tǒng),將精度與程度“邏輯或”粗糙集擴展到基于限制容差關(guān)系的不完備信息系統(tǒng)中,融入多粒度思想,提出基于限制容差關(guān)系的變精度與程度“邏輯或”多粒度粗糙集,包括“邏輯或”樂觀多粒度粗糙集和“邏輯或”悲觀多粒度粗糙集,研究“邏輯或”樂觀、悲觀多粒度粗糙集的性質(zhì)和相互之間的關(guān)系,并通過實例分析和實驗驗證了模型及所提出理論的有效性。
限制容差關(guān)系是不完備信息系統(tǒng)中,用于對象分類的一種重要的二元關(guān)系,可以使分類更加合理。
定義1[17]假定不完備信息系統(tǒng)IS=〈U,AT,V,f〉及U 上定義的二元關(guān)系L(限制容差關(guān)系),對于A?AT,則
其中PA(x)={a|a∈A∧a(x)≠*}。
定義2[17]設(shè)不完備信息系統(tǒng)IS=〈U,AT,V,f〉,對于?X?U,A?AT,X 在限制容差關(guān)系L(A)的下近似、上近似分別為
其中LA(x)是x 的限制容差類。
在不完備信息系統(tǒng)中,文獻[18]結(jié)合限制容差關(guān)系,提出樂觀多粒度粗糙集和悲觀多粒度粗糙集的下近似、上近似定義。
定義3[18]設(shè)不完備信息系統(tǒng)IS=〈U,AT,V,f〉,A={A1,A2,…,Am}是AT 的m 個屬性子集,?X?U,在限制容差關(guān)系族L(A1),L(A2),…,L(Am)下的樂觀多粒度粗糙集下近似、上近似分別定義為
定義4[18]設(shè)不完備信息系統(tǒng)IS=〈U,AT,V,f〉,A={A1,A2,…,Am}是AT 的m 個屬性子集,?X?U,在限制容差關(guān)系族L(A1),L(A2),…,L(Am)下的悲觀多粒度粗糙集下近似、上近似分別定義為
變精度粗糙集模型和程度粗糙集模型是兩類重要的粗糙集擴展模型,其中精度反映了近似空間的相對量化信息,而程度則刻畫了近似空間的絕對量化信息。文獻[16]為了融合這兩種特性,提出精度與程度“邏輯或”粗糙集。
定義5[16]設(shè)信息系統(tǒng)S=〈U,AT〉,A?AT,k 為任意自然數(shù),β∈[0,0.5),?X?U,X 關(guān)于A 依精度1-β、程度k 的邏輯或下、上近似算子分別定義為
程度粗糙集存在當(dāng)[x]A∩X=?,|[x]A|-|[x]A∩X|≤k 可能成立,即的問題,現(xiàn)結(jié)合限制容差關(guān)系,在下近似中增加約束條件,構(gòu)建基于限制容差關(guān)系的變精度與程度“邏輯或”模型。
定義6設(shè)不完備信息系統(tǒng)IS=〈U,AT,V,f〉,A={A1,A2,…,Am}是AT 的m 個屬性子集,k 為任意自然數(shù),β∈[0,0.5),?X?U,在限制容差關(guān)系L(A)下,X 變精度與程度“邏輯或”粗糙集的下近似、上近似分別定義為
為了進一步對多粒度粗糙集進行拓展,在定義6 的基礎(chǔ)上,融入多粒度思想,提出變精度與程度“邏輯或”多粒度粗糙集模型。
定義7設(shè)不完備信息系統(tǒng)IS=〈U,AT,V,f〉,A={A1,A2,…,Am}是AT 的m 個屬性子集,k 為任意自然數(shù),β∈[0,0.5),?X?U,在限制容差關(guān)系族L(A1),L(A2),…,L(Am)下的變精度與程度“邏輯或”樂觀多粒度粗糙集下近似、上近似分別定義為
定義8設(shè)不完備信息系統(tǒng)IS=〈U,AT,V,f〉,A={A1,A2,…,Am}是AT 的m 個屬性子集,k 為任意自然數(shù),β∈[0,0.5),?X?U,在限制容差關(guān)系族L(A1),L(A2),…,L(Am)下的變精度與程度“邏輯或”悲觀多粒度粗糙集下近似、上近似分別定義為
說明在基于限制容差關(guān)系的變精度與程度“邏輯或”樂觀多粒度粗糙集中,要求對象至少有一個粒度層次上的限制容差類滿足c(LAi(x),X)≤β∨(|LAi(x)-X|≤k∧LAi(x)∩X≠?),則定義為其下近似。在基于限制容差關(guān)系的變精度與程度“邏輯或”悲觀多粒度粗糙集中,要求對象所有粒度層次上的限制容差類滿足c(LAi(x),X)≤β∨(|LAi(x)-X|≤k∧LAi(x)∩X≠?),則定義為其下近似。
定理1設(shè)不完備信息系統(tǒng)IS=〈U,AT,V,f〉,A={A1,A2,…,Am}是AT 的m 個屬性子集,k 為任意自然數(shù),β∈[0,0.5),?X?U,在限制容差關(guān)系族L(A1),L(A2),…,L(Am)下的變精度與程度“邏輯或”樂觀多粒度粗糙集有如下性質(zhì):
(2)k1、k2為任意自然數(shù),β1、β2∈[0,0.5),若k1≤k2、β1≤β2,則
綜上所述,在建筑工程項目的設(shè)計過程中運用BIM技術(shù),可以有效縮短工期,從而減少施工成本。同時還會促進建筑設(shè)計企業(yè)工作水平的不斷上升,從而在保證建筑設(shè)計企業(yè)經(jīng)濟效益的同時獲得社會效益,保證其可持續(xù)性發(fā)展。
證明
(1)?X?U,?Ai∈A,由于LAi(x)?U,故有c(LAi(x),U)=0,從而對于β∈[0,0.5),顯然有c(LAi(x),U)≤β 成立?;蛘遼LAi(x)-U|=0,從而對于任意自然數(shù)k,顯然有|LAi(x)-U|≤k∧LAi(x)∩U≠? 成立,因此,
又由于k1≤k2、β1≤β2,從而c(LAi(x),X)≤β2∨(|LAi(x)-X|≤k2∧LAi(x)∩X≠?),因此,即有由定義7 得,
若c(LAi(x),X)≤β 成立,則若|LAi(x)-X|≤0 成立,則必有LAi(x)?X,此時c(LAi(x),X)=0,從而對于β∈[0,0.5),顯然c(LAi(x),X)≤β 成立,則因此,反之,若則至少存在某個Ai∈{A1,A2,…,Am},使得c(LAi(x),X)≤β,由定義7 知即有所以綜合有由定義7 知,又由第一部分結(jié)論知故有
若c(LAi(x),X)≤0 成立,此時|LAi(x)|-|LAi(x)∩X|≤0,從而對于任意自然數(shù)k,顯然|LAi(x)|-|LAi(x)∩X|≤k,則若|LAi(x)-X|≤k 成立,又因為LAi(x)∩X≠?,顯然|LAi(x)|-|LAi(x)∩X|≤k, 則因此,反之,若則至少存在某個Ai∈{A1,A2,…,Am},使得|LAi(x)|-|LAi(x)∩X|≤k,又因為LAi(x)∩X≠?,故|LAi(x)-X|≤k,從而由定義7 可知即有所以綜合有由定義7 可知,又由第一部分結(jié)論知故有
定理2設(shè)不完備信息系統(tǒng)IS=〈U,AT,V,f〉,A={A1,A2,…,Am}是AT 的m 個屬性子集,k 為任意自然數(shù),β∈[0,0.5),?X?U,在限制容差關(guān)系族L(A1),L(A2),…,L(Am)下的變精度與程度“邏輯或”悲觀多粒度粗糙集有如下性質(zhì):
(2)k1、k2為任意自然數(shù),β1、β2∈[0,0.5),若k1≤k2、β1≤β2,則
定理2 的證明類似于定理1 的證明。
定理1 性質(zhì)(3)和定理2 性質(zhì)(3)說明,當(dāng)k=0,變精度與程度“邏輯或”樂(悲)觀多粒度粗糙集就退化為變精度樂(悲)觀多粒度粗糙集。定理1 性質(zhì)(4)和定理2 性質(zhì)(4)說明,當(dāng)β=0,變精度與程度“邏輯或”樂(悲)觀多粒度粗糙集就退化為程度樂(悲)觀多粒度粗糙集。
定理3設(shè)不完備信息系統(tǒng)IS=〈U,AT,V,f〉,A={A1,A2,…,Am}是AT 的m 個屬性子集,k 為任意自然數(shù),β∈[0,0.5),?X?U,則變精度與程度“邏輯或”樂觀和悲觀多粒度粗糙集的關(guān)系如下:
證明由定義7 和定義8 可證。
設(shè)不完備決策系統(tǒng)IS=〈U,AT,V,f〉,其中對象集U={x1,x2,…,x8},條件屬性AT={c1,c2,c3,c4},d 為決策屬性,取β=0.3,k=1。。
由表1[4]知U/IND(j5i0abt0b)={D1,D2},其中D1={x1,x3,x4,x6},D2={x2,x5,x7,x8},設(shè)決策信息系統(tǒng)的屬性子集族如下
表1 不完備決策系統(tǒng)
分別計算出變精度與程度“邏輯或”樂觀多粒度粗糙集、變精度與程度“邏輯或”悲觀多粒度粗糙集的下近似和上近似:
(1)決策類D1的下近似和上近似分別為
(2)決策類D2的下近似和上近似分別為
由計算結(jié)果知以下公式成立
同理,對D2也有以上公式成立。
為了驗證基于限制容差關(guān)系的變精度與程度“邏輯或”多粒度粗糙集的性質(zhì),選用UCI 機器學(xué)習(xí)數(shù)據(jù)集上Zoo 和Tic-tac-toe (http:// archive.Ics.uci.edu/ml/machine-learning-databases/) 進行仿真實驗,數(shù)據(jù)描述見表2。
首先對數(shù)據(jù)處理,使該系統(tǒng)存在缺失值,根據(jù)決策屬性將Zoo 分為7 個決策類D1,D2,D3,D4,D5,D6,D7。文中選取屬性集合A={A1,A2,A3},令第1~6 個屬性為A1,第6~11 個屬性為A2,第11~16 個屬性為A3,在β=0.3,k=1 的前提下,分別計算變精度與程度“邏輯或”樂觀多粒度粗糙集、變精度與程度“邏輯或”悲觀多粒度粗糙集的下、上近似的樣本個數(shù),見表3。類似可得Tic-tac-toe 的結(jié)果,見表4。
表2 數(shù)據(jù)描述
表3 Zoo數(shù)據(jù)集上的結(jié)果
表4 Tic-tac-toe 數(shù)據(jù)集上的結(jié)果
在Zoo數(shù)據(jù)集上有7 個決策類,對于每個決策類,從表3 中可以看出,變精度與程度“邏輯或”悲觀多粒度粗糙集下近似對象個數(shù)都少于變精度與程度“邏輯或”樂觀多粒度粗糙集下近似對象個數(shù)。而變精度與程度“邏輯或”悲觀多粒度粗糙集上近似對象個數(shù)都多于變精度與程度“邏輯或”樂觀多粒度粗糙集上近似對象個數(shù),在表4 中Tic-tac-toe 數(shù)據(jù)集上也同樣存在這樣的結(jié)論。實驗結(jié)果表明,變精度與程度“邏輯或”樂觀多粒度粗糙集和變精度與程度“邏輯或”悲觀多粒度粗糙集的上、下近似之間存在包含關(guān)系,從實驗角度驗證了定理的正確性。
從精度與程度“邏輯或”的角度出發(fā),基于限制容差關(guān)系提出變精度與程度“邏輯或”樂觀多粒度、變精度與程度“邏輯或”悲觀多粒度粗糙集模型。該模型可通過調(diào)節(jié)閾值β、k,使分類更加準確。接下來的工作將研究變精度與程度“邏輯或”多粒度粗糙集的約簡和決策規(guī)則的獲取等問題。