• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      猶豫模糊信息下的協(xié)相關(guān)度與聚類(lèi)分析*

      2018-05-10 02:19:05毛軍軍
      計(jì)算機(jī)與生活 2018年5期
      關(guān)鍵詞:模糊集交叉權(quán)重

      汪 峰,毛軍軍,祖 璇,鄒 斌

      1.安徽大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,合肥 230601

      2.安徽大學(xué) 計(jì)算智能與信號(hào)處理教育部重點(diǎn)實(shí)驗(yàn)室,合肥 230039

      3.安徽師范大學(xué) 皖江學(xué)院 經(jīng)濟(jì)系,安徽 蕪湖 241008

      4.安徽廣播電視大學(xué) 教育科學(xué)學(xué)院,合肥 230022

      1 引言

      由于客觀世界的復(fù)雜性和個(gè)人認(rèn)知水平的差異性,針對(duì)同一問(wèn)題往往有不同的看法,有時(shí)很難達(dá)成一致。例如在經(jīng)濟(jì)管理與決策問(wèn)題中,討論備選方案滿足某一準(zhǔn)則時(shí),有些專(zhuān)家給出的隸屬度值是0.6,有些專(zhuān)家認(rèn)為是0.7,還有些專(zhuān)家堅(jiān)持0.8比較合理。他們觀點(diǎn)不一,又難以說(shuō)服對(duì)方。又如決策者在做決策時(shí)常常表現(xiàn)出猶豫不決和優(yōu)柔寡斷的狀態(tài),這時(shí)用來(lái)描述決策信息的模糊集的隸屬度用一個(gè)確定的值來(lái)刻畫(huà)很難反映決策者的真實(shí)情況。為此,Torra和Narukawa[1-2]提出了另一種廣義模糊集——猶豫模糊集。猶豫模糊集的隸屬度是由一些可能的數(shù)值組成的集合,這樣可以兼顧決策者的不同偏好,得到更合理全面的決策結(jié)果。更為重要的是,它避免了使用各種算子來(lái)合成各專(zhuān)家提供的數(shù)據(jù),能直觀描述不同決策成員給出的意見(jiàn),因而可以直接反映和處理它們,從而減少了數(shù)據(jù)的流失。Torra等人在文獻(xiàn)[1-2]討論了猶豫模糊集與直覺(jué)模糊集[3]、二型模糊集[4]和模糊多集[5]之間的區(qū)別與聯(lián)系,指出猶豫模糊集包含直覺(jué)模糊集,它是二型模糊集的特例,與模糊多集形式上相同,但運(yùn)算法則不同。猶豫模糊集自誕生以來(lái),發(fā)展速度很快,其中徐澤水和夏梅梅及其團(tuán)隊(duì)[6-10]為猶豫模糊集的進(jìn)一步研究做出了重要貢獻(xiàn)。

      熵和相關(guān)性測(cè)度是模糊集理論中兩個(gè)重要的研究課題,其理論早被應(yīng)用到諸如數(shù)據(jù)分析、模式識(shí)別、聚類(lèi)分析、決策以及圖像處理等許多領(lǐng)域。從原先熱學(xué)上的熵到信息論中的信息熵、相對(duì)熵,再到模糊集上的模糊熵、直覺(jué)模糊熵、猶豫模糊熵,最終形成了一套公理化體系。其中交叉熵測(cè)度主要度量?jī)蓚€(gè)集合的區(qū)別信息,吸引了眾多學(xué)者對(duì)其進(jìn)行研究。文獻(xiàn)[11]提出了一些直覺(jué)模糊環(huán)境下的交叉熵和直覺(jué)模糊熵的公式,并把它們運(yùn)用到群決策當(dāng)中。文獻(xiàn)[12-15]給出了熵、交叉熵、距離測(cè)度和相似性側(cè)度之間的聯(lián)系以及公理化定義,并把它們應(yīng)用到區(qū)間值模糊集上。文獻(xiàn)[16]將模糊集的熵、交叉熵推廣到猶豫模糊環(huán)境下,給出猶豫模糊集的熵測(cè)度、交叉熵測(cè)度及其公理化形式,并討論了猶豫模糊集的熵、相似度以及交叉熵之間的關(guān)系,最終將它們應(yīng)用到多屬性決策中。Gerstenkorn和Manko[17]把統(tǒng)計(jì)學(xué)中相關(guān)系數(shù)的概念推廣到直覺(jué)模糊集上,Hong和Hwang[18]又把它們定義到概率空間上。文獻(xiàn)[19]通過(guò)重心法來(lái)計(jì)算直覺(jué)模糊集的相關(guān)系數(shù),此后又有學(xué)者將相關(guān)系數(shù)推廣到區(qū)間型直覺(jué)模糊集上[20-21]。文獻(xiàn)[22]仔細(xì)分析了猶豫模糊信息下距離與相關(guān)度的關(guān)系,提出了基于距離的相關(guān)度公式,該公式構(gòu)造合理,易被人們接受,但其結(jié)構(gòu)不精,適用面不寬,很多情形下與事實(shí)不符。文獻(xiàn)[23]提出了基于距離的猶豫模糊相似度公式,但公式的分辨率不夠高,度量結(jié)果有時(shí)與實(shí)際情況相差很大。文獻(xiàn)[24]把信息論中的相對(duì)熵遷移到猶豫模糊集上,并把猶豫模糊相對(duì)熵對(duì)稱(chēng)化,提出對(duì)稱(chēng)交互熵,針對(duì)基于距離的相似度公式的缺陷,利用對(duì)稱(chēng)交互熵定義一種新的相似度公式。文獻(xiàn)[25]將直覺(jué)模糊集的相關(guān)性測(cè)度延伸至猶豫模糊環(huán)境下,定義并證明了猶豫模糊集的兩種相關(guān)系數(shù),但這種相關(guān)系數(shù)實(shí)際上是基于向量的觀點(diǎn),會(huì)出現(xiàn)即使兩個(gè)樣本不同,其相關(guān)系數(shù)也可能為1的情況。

      聚類(lèi)是把一系列的對(duì)象、方案或事件等分成若干個(gè)類(lèi)的過(guò)程,每個(gè)類(lèi)中對(duì)象的特征比其他類(lèi)有更高的相似性。聚類(lèi)分析是利用數(shù)學(xué)的方法按照確定的標(biāo)準(zhǔn)對(duì)客觀事物進(jìn)行分類(lèi),將樣本的相似程度作為劃分原則,這樣選擇合適的相似度就成為聚類(lèi)的關(guān)鍵。隨著信息時(shí)代的到來(lái),特別是在大數(shù)據(jù)趨勢(shì)下,聚類(lèi)分析作為信息處理的重要一步,越來(lái)越受到人們的重視。因?yàn)楝F(xiàn)實(shí)的分類(lèi)往往伴隨著模糊性,所以用模糊理論來(lái)進(jìn)行聚類(lèi)分析會(huì)顯得更自然,更符合客觀實(shí)際,因此便產(chǎn)生了模糊聚類(lèi)分析。面對(duì)不同的模糊環(huán)境,人們提出了各種聚類(lèi)算法來(lái)處理不同類(lèi)型的模糊數(shù)據(jù),如直覺(jué)模糊聚類(lèi)算法[26-28]、二型模糊聚類(lèi)算法[29-30]等。在猶豫模糊情形下,文獻(xiàn)[24]是通過(guò)編網(wǎng)的聚類(lèi)方法,在利用相似度公式計(jì)算得到的關(guān)聯(lián)矩陣上直接進(jìn)行表上作業(yè),此方法快速有效,操作簡(jiǎn)單,直觀性很強(qiáng),但它所有的聚類(lèi)邊界或者是水平的,或者是豎直的,沒(méi)有對(duì)角的邊界,結(jié)構(gòu)單一,過(guò)程粗糙,且當(dāng)樣本容量較大時(shí),容易產(chǎn)生混亂甚至無(wú)法進(jìn)行操作,同時(shí)它很難利用計(jì)算機(jī)進(jìn)行程序設(shè)計(jì),這種直觀分類(lèi)在一定程度上降低了聚類(lèi)的質(zhì)量和準(zhǔn)確性;文獻(xiàn)[25]利用導(dǎo)出的相關(guān)系數(shù)公式構(gòu)造相似矩陣,通過(guò)平方法獲得等價(jià)矩陣,進(jìn)而對(duì)樣本數(shù)據(jù)進(jìn)行聚類(lèi)分析,采用經(jīng)典方法聚類(lèi),但聚類(lèi)結(jié)果不夠精細(xì),與事實(shí)不是特別吻合。

      針對(duì)以上問(wèn)題,本文首先從文獻(xiàn)[16]關(guān)于猶豫模糊元的公理化定義出發(fā),構(gòu)造任意兩個(gè)猶豫模糊元新的交叉熵公式,把它作為一種距離,并與文獻(xiàn)[23]中的各種距離公式進(jìn)行比較,突出其優(yōu)勢(shì)所在。然后基于此交叉熵距離,在屬性權(quán)重完全未知的情況下,根據(jù)離差最大化[31]原則建立非線性規(guī)劃模型得到屬性權(quán)重公式。接著由概率統(tǒng)計(jì)[32]中相關(guān)系數(shù)的定義結(jié)構(gòu),得出猶豫模糊集的協(xié)相關(guān)度公式,并證明了它與一般相關(guān)系數(shù)類(lèi)似的性質(zhì)??紤]到論域里不同元素對(duì)結(jié)果的影響不同,故將協(xié)相關(guān)度加權(quán)(權(quán)重通過(guò)得出的屬性權(quán)重公式獲得),最后利用加權(quán)的協(xié)相關(guān)度公式構(gòu)造協(xié)相關(guān)矩陣,再把協(xié)相關(guān)矩陣轉(zhuǎn)化為等價(jià)矩陣,進(jìn)而做聚類(lèi)分析。

      2 概念準(zhǔn)備

      定義1[1-2]設(shè)X是一個(gè)給定的集合,稱(chēng)為論域,則二元組A={x,hA(x)|x∈X}稱(chēng)為定義在X上的一個(gè)猶豫模糊集。其中hA(x)是區(qū)間[0,1]上若干個(gè)不同的數(shù)組成的集合,表示元素x屬于集合A若干個(gè)可能的隸屬度。為表述方便,把有限論域X上的全體猶豫模糊集記為HFS(X),稱(chēng)hA(x)為A的猶豫模糊元,簡(jiǎn)寫(xiě)為hA。

      特別地,當(dāng)猶豫模糊集的每一個(gè)猶豫模糊元都只有一個(gè)元素時(shí),則猶豫模糊集就退化為普通模糊集??梢?jiàn)猶豫模糊集是普通模糊集的推廣,這里主要是隸屬度的推廣,由一值變?yōu)槎嘀怠?/p>

      值得注意的是,不同的猶豫模糊元中元素的個(gè)數(shù)可能不同且這些元素的排列順序通常是紊亂的,為便于不同猶豫模糊元的比較與運(yùn)算,這里做出規(guī)定:

      (1)所有元素統(tǒng)一按升序排列。令σ:(1,2,…,n)→(1,2,…,n)為一個(gè)排序,使得hσ(j)(xi)<hσ(j+1)(xi),即 ?xi∈分別表示hA(xi)和hB(xi)中第j小的元素,當(dāng)且僅當(dāng)時(shí),有hA(xi)=hB(xi)。

      (2)用l(hA(xi))、l(hB(xi))分別表示hA(xi)和hB(xi)中元素的個(gè)數(shù),令li=max{l(hA(xi)),l(hB(xi))},若l(hA(xi))≠l(hB(xi)),則在元素少的集合里重復(fù)添加元素,使得該集合的元素個(gè)數(shù)達(dá)到li。添加的原則依據(jù)決策者的風(fēng)險(xiǎn)偏好:喜好風(fēng)險(xiǎn)的決策者會(huì)對(duì)預(yù)期結(jié)果有比較樂(lè)觀的估計(jì),通常添加該集合中最大的元素;而厭惡風(fēng)險(xiǎn)的決策者對(duì)預(yù)期結(jié)果的估計(jì)一般比較悲觀,則是添加該集合中最小的元素。為方便起見(jiàn),本文不妨統(tǒng)一采用樂(lè)觀準(zhǔn)則添加元素。例如兩個(gè)猶豫模糊元:hA(x1)={0.2,0.4},hB(x1)={0.3,0.5,0.6},很明顯l(hA(xi))<l(hB(xi)),為保證運(yùn)算能夠進(jìn)行,將hA(x1)擴(kuò)充為hA(x1)={0.2,0.4,0.4}。

      為了度量不同猶豫模糊集的區(qū)別信息,這里引入交叉熵的概念。文獻(xiàn)[16]給出了兩個(gè)猶豫模糊元的交叉熵的公理化定義。

      定義2[16]設(shè)α、β是任意兩個(gè)猶豫模糊元,則它們的交叉熵C(α,β)應(yīng)滿足下面兩個(gè)公理化條件:

      (1)C(α,β)≥ 0

      (2)C(α,β)=0?ασ(i)=βσ(i),?i=1,2,…,l

      按照以上定義方式,構(gòu)造任意兩個(gè)猶豫模糊元的交叉熵公式。

      定義3設(shè)hA(xi)、hB(xi)分別為猶豫模糊集A和B的猶豫模糊元,?xi∈X,X={x1,x2,…,xn},則稱(chēng):

      為猶豫模糊元hA(xi)和hB(xi)的交叉熵,簡(jiǎn)記為C(hA,hB)。

      由定義3交叉熵的結(jié)構(gòu),不難得到下面的定理。

      定理1設(shè) ?A,B∈HFS(X),hA、hB分別是A和B的猶豫模糊元,則C(hA,hB)滿足:

      (1)C(hA,hB)≥ 0

      (2)C(hA,hB)=0 ?hA=hB,即X,j=1,2,…,li

      (3)C(hA,hB)=C(hB,hA)

      證明令:

      (1)要證C(hA,hB)≥0,只需證c≥0。設(shè)f(x)=xp,0≤x≤ 1且p>1,則f″(x)=p(p-1)xp-2≥ 0,即f(x)是下凸函數(shù),因此有Jensen不等式成立:

      因此有c≥0,又,故C(hA,hB)≥ 0。

      (2)若兩個(gè)猶豫模糊元hA=hB,即=,j=1,2,…,li,顯然有C(hA,hB)=0;若C(hA,hB)=0,則必有c=0。由Jensen不等式等號(hào)成立的條件,當(dāng)且僅當(dāng)x1=x2=x3=x4時(shí),等式成立,即當(dāng)?xi∈X,j=1,2,…,li,時(shí),等號(hào)成立,這時(shí)有hA=hB。

      (3)結(jié)論顯然。

      由定理1可知,定義3中的交叉熵實(shí)際上是一種距離測(cè)度,因此可以把C(hA,hB)看作兩個(gè)猶豫模糊元hA和hB的距離。C(hA,hB)越大,表示hA與hB的差別越大,反之說(shuō)明hA與hB越接近。在猶豫模糊信息下,關(guān)于距離的定義很多。文獻(xiàn)[23]給出了很多猶豫模糊元距離的公式,但本文提出的交叉熵距離在許多情形下特別是當(dāng)兩個(gè)猶豫模糊元比較接近的時(shí)候,具有更高的分辨效果。

      例設(shè)X={x1,x2},定義在X上的3個(gè)猶豫模糊集A、B、C分別為:

      比較這3個(gè)猶豫模糊集不難發(fā)現(xiàn),猶豫模糊元hA(x1)與hB(x1),hA(x2)與hB(x2),hB(x2)與hC(x2)它們相互間的隸屬度很接近,因此在直觀上A與B的差別程度就比B與C小,B與C的差別程度比A與C小。

      利用文獻(xiàn)[23]中的廣義加權(quán)平均猶豫模糊距離公式:

      λ=1,式(2)是歸一化Hamming距離;λ=2,式(2)變成歸一化Euclidean距離。

      廣義Hausdorff猶豫模糊距離:

      λ=1,式(3)是Hamming-Hausdorff距離;λ=2,式(3)變?yōu)镋uclidean-Hausdorff距離。

      在實(shí)際應(yīng)用中,有時(shí)還要度量猶豫模糊集之間的差別信息,為此定義:

      d(A,C)、d(B,C)、di(A,C)、di(B,C)可類(lèi)似定義。分別利用式(1)、(2)、(3)計(jì)算hA與hB,hB與hC,hA與hC的距離,最終各猶豫模糊集間的距離如表1和表2所示。

      Table 1 Generalized hesitant fuzzy distance under different parameters表1 不同參數(shù)下的廣義猶豫模糊距離

      Table 2 Cross-entropy distance under different parameters表2 不同參數(shù)下的交叉熵距離

      從表1、表2可以看出,若用式(3)計(jì)算它們的距離,無(wú)論λ取1還是2,其結(jié)果都是0.1,與直觀認(rèn)識(shí)不符;用式(2)計(jì)算A與C的距離,λ取1和2,其值也都是0.1,由于這是一個(gè)靜態(tài)的值,這就意味著無(wú)論猶豫模糊集B是怎樣的,在比較A與B,B與C的相似程度時(shí),式(2)失去了意義。最后看本文提出的式(1),觀察各個(gè)值可以看到,用式(1)算出的結(jié)果沒(méi)有出現(xiàn)上述對(duì)象間差別程度相同的情況??梢源笾驴闯鯝、B、C兩兩之間的距離(比如在比較A與B,B與C之間的距離時(shí)),總體來(lái)看式(1)得出的結(jié)果表示的相互差異性最大(盡管A、B、C比較接近),這意味著相比于傳統(tǒng)意義上的距離,新型的交叉熵距離的靈敏度更高,其表征的差異度明顯。因此,用式(1)作為猶豫模糊元的距離是很合理的。

      3 基于交叉熵的屬性權(quán)重確定方法

      在多屬性決策中,不同的屬性對(duì)最終的決策起著不同的作用,應(yīng)當(dāng)賦予不同的權(quán)重。對(duì)于屬性信息完全未知的多屬性決策問(wèn)題,需要從決策矩陣中挖掘出屬性權(quán)重信息。本文提出的交叉熵既然可視作一種距離,那么就用這種距離來(lái)反映對(duì)象間的離差(上文已說(shuō)明這種離差差別反映明顯,因此用在此方法上很合理),由離差最大化方法獲取屬性權(quán)重。若所有對(duì)象在某屬性下的屬性值差異越小,說(shuō)明該屬性對(duì)決策結(jié)果所起的作用越??;反之,如果某屬性能使所有對(duì)象的屬性值有較大差異,則說(shuō)明其對(duì)決策起重要作用。因此,從決策的角度考慮,對(duì)象屬性值偏差越大的屬性應(yīng)該賦予越大的權(quán)重。

      設(shè)對(duì)象集A={A1,A2,…,Am},屬性集X={x1,x2,…,xn},權(quán)重向量w=(w1,w2,…,wn)T。用dijk表示在屬性xk下,對(duì)象Ai與Aj在相應(yīng)猶豫模糊元間的交叉熵距離,即dijk=C(hAi(xk),hBj(xk))。令Dk(w)=(k=1,2,…,n),表示對(duì)屬性xk而言,所有對(duì)象與其他對(duì)象的總離差。

      根據(jù)上述分析,加權(quán)向量w的選擇應(yīng)使所有屬性對(duì)所有對(duì)象的總離差最大。為此,可建立如下的優(yōu)化模型:

      解此模型,作Lagrange函數(shù):

      然后將函數(shù)L分別對(duì)wk和ξ求偏導(dǎo),并令之為0,得:

      由此得到:

      再將權(quán)重歸一化,得:

      從式(4)可以看出,在屬性xk下,各對(duì)象間的總離差越大,該屬性的權(quán)重就越大,反之相應(yīng)的權(quán)重越小。因此,式(4)的結(jié)果符合上述權(quán)重分配的要求。

      4 猶豫模糊集的協(xié)相關(guān)度

      在統(tǒng)計(jì)學(xué)中,兩組數(shù)據(jù)X和Y的相關(guān)系數(shù)定義為:

      其中cov(X,Y)=E{[X-E(X)][Y-E(Y)]}表示隨機(jī)變量X和Y的協(xié)方差;D(X)=E[X-E(X)]2,D(Y)=E[Y-E(Y)]2分別表示X和Y的方差。

      鑒于這種構(gòu)造思想,可以類(lèi)比得出兩個(gè)猶豫模糊集的協(xié)相關(guān)度。

      定義4設(shè)A={xi,hA(xi)|xi∈X},B={xi,hB(xi)|xi∈…,li},hB(xi)={hσ(j)B(xi)|j=1,2,…,li},X={x1,x2,…,xn},則A與B的協(xié)相關(guān)度:

      其中:

      定理2?A,B∈HFS(X),R(A,B)都滿足:

      (1)R(A,B)=R(B,A)

      (2)-1≤R(A,B)≤ 1

      (3)A=B?R(A,B)=1

      證明(1)由R(A,B)公式定義的結(jié)構(gòu),結(jié)論顯然成立。

      (2)由Cauchy-Schwarz不等式:

      (3)顯然成立。

      由定理2知,R(A,B)∈[-1,1]。當(dāng)R(A,B)>0 時(shí),表示猶豫模糊集A與B正相關(guān),其值越大表明它們的相關(guān)性就越大;當(dāng)R(A,B)<0時(shí),說(shuō)明A與B負(fù)相關(guān),其值越小表示它們的這種負(fù)相關(guān)性越強(qiáng)。簡(jiǎn)而言之,當(dāng)|R(A,B)|越靠近1時(shí),認(rèn)為A與B的相關(guān)性越強(qiáng)。

      在實(shí)際應(yīng)用中,論域里不同的元素占有不同的地位,應(yīng)賦予不同的權(quán)重。設(shè)元素xi(i=1,2,…,n)的權(quán)重為wi,滿足且wi∈[0,1],故在式(5)的基礎(chǔ)上,將協(xié)相關(guān)度公式加權(quán):

      同樣地,Rw(A,B)也滿足下面的性質(zhì):

      (1)Rw(A,B)=Rw(B,A)

      (2)-1≤Rw(A,B)≤ 1

      (3)A=B?Rw(A,B)=1

      證明過(guò)程與定理2類(lèi)似,這里不再贅述。

      5 基于猶豫模糊協(xié)相關(guān)度的聚類(lèi)分析

      5.1 知識(shí)準(zhǔn)備

      定義5設(shè)A1,A2,…,Am是m個(gè)猶豫模糊集,稱(chēng)R=(ρij)m×n為協(xié)相關(guān)矩陣,其中ρij=Rw(Ai,Aj),i=1,2,…,m,表示兩個(gè)猶豫模糊集Ai與Aj的協(xié)相關(guān)度,滿足:

      (1)0≤ρij≤ 1

      (2)ρii=1

      (3)ρij=ρji

      從定義5可以看出,協(xié)相關(guān)矩陣是主對(duì)角元全為1的對(duì)稱(chēng)矩陣,且所有元素均在0到1之間,因此協(xié)相關(guān)實(shí)際上是一種相似關(guān)系。

      定義6設(shè)R=(ρij)m×n是一個(gè)協(xié)相關(guān)矩陣,稱(chēng)Rα=(ρij(α))m×n為α-截矩陣,其中:

      顯然協(xié)相關(guān)矩陣的α-截矩陣是一個(gè)布爾矩陣。

      定義 7[28]設(shè)R=(ρ)是一個(gè)協(xié)相關(guān)矩陣,稱(chēng)ijm×mR2=R°R=(ij)m×m為協(xié)相關(guān)矩陣的復(fù)合(乘積),其中

      聚類(lèi)分析的基本思想是用相似性尺度來(lái)衡量事物之間的親疏程度,并以此來(lái)實(shí)現(xiàn)分類(lèi)。由普通聚類(lèi)可知,同類(lèi)元素具有等價(jià)關(guān)系,因此在進(jìn)行模糊聚類(lèi)分析前必須建立模糊等價(jià)關(guān)系,其實(shí)質(zhì)是根據(jù)研究對(duì)象本身的屬性來(lái)構(gòu)造模糊矩陣。基于相似關(guān)系下的模糊矩陣當(dāng)然是相似矩陣,而本文主要應(yīng)用模糊等價(jià)關(guān)系將對(duì)象聚類(lèi),因此必須把協(xié)相關(guān)關(guān)系下的相似矩陣改造成模糊等價(jià)矩陣。改造方法很多,本文采用平方法:R→R2→(R2)2→…→R2k→…,直到。這時(shí),模糊等價(jià)矩陣(R的傳遞閉包)

      5.2 猶豫模糊聚類(lèi)途徑方法

      設(shè)A={A1,A2,…,Am},X={x1,x2,…,xn},w=(w1,w2,…,wn)T依次為對(duì)象集、屬性集和權(quán)重向量。決策專(zhuān)家組對(duì)所有對(duì)象按各屬性進(jìn)行測(cè)度,得到猶豫模糊決策矩陣D=(hij)m×n,hij=hAi(xj)。在進(jìn)行對(duì)象聚類(lèi)分析前,需要對(duì)猶豫模糊決策矩陣D=(hij)m×n進(jìn)行規(guī)范化處理,以消除各屬性指標(biāo)的量綱差別和數(shù)量級(jí)差別帶來(lái)的影響。本文假設(shè)決策矩陣D已經(jīng)過(guò)標(biāo)準(zhǔn)化處理。

      有了以上各節(jié)的討論,便可以給出猶豫模糊環(huán)境下基于等價(jià)關(guān)系的聚類(lèi)途徑,具體步驟如下:

      (1)利用式(1)計(jì)算任意兩個(gè)猶豫模糊集Ai與Aj在屬性xk下的交叉熵dijk,利用式(4)計(jì)算屬性xk的權(quán)重wk(k=1,2,…,n)。

      (2)利用式(7)計(jì)算Ai與Aj加權(quán)的協(xié)相關(guān)度Rw(Ai,Aj),構(gòu)造協(xié)相關(guān)矩陣R。

      (3)利用平方法將協(xié)相關(guān)矩陣R改造成等價(jià)關(guān)系矩陣t(R)。

      (4)利用t(R)對(duì)所有對(duì)象進(jìn)行聚類(lèi)處理,給定不同置信水平α,求α-截矩陣t(R)α。一個(gè)α水平截矩陣就代表一種聚類(lèi),其方法是:布爾矩陣t(R)α的第i行(列)的所有元素與第j行(列)的相應(yīng)元素都相等,那么Ai與Aj就歸為一類(lèi)。很明顯,當(dāng)α=1時(shí),所有對(duì)象自成一類(lèi),隨著α值的降低,對(duì)象由細(xì)到粗逐漸被歸并,當(dāng)α從1變化到0時(shí),其分類(lèi)數(shù)從m類(lèi)變化到1類(lèi),最后形成動(dòng)態(tài)聚類(lèi)譜系圖。

      5.3 算例分析

      某電腦大賣(mài)場(chǎng)欲對(duì)7種不同的電腦Ai(i=1,2,…,7)進(jìn)行分類(lèi),需要考慮4個(gè)因素:價(jià)格x1,功能x2,服務(wù)x3,質(zhì)量x4。決策組分別從這4個(gè)因素對(duì)這7種電腦進(jìn)行評(píng)價(jià),其決策信息以猶豫模糊集的形式給出,組成決策矩陣D=(hij)7×4,hij表示對(duì)象Ai滿足屬性xj的被評(píng)估值,如表3所示。

      Table 3 Hesitant fuzzy decision matrix表3 猶豫模糊決策矩陣

      (1)計(jì)算同一個(gè)屬性下任意兩個(gè)猶豫模糊元的交叉熵(由于決策矩陣牽涉到7個(gè)對(duì)象在4個(gè)屬性下的交叉熵距離,數(shù)量龐大,故這些數(shù)據(jù)不再列出)。然后由式(4)得到屬性權(quán)重w=(0.312 0,0.163 7,0.273 3,0.250 9)T。

      (2)根據(jù)式(7)得到任兩種電腦Ai與Aj(i,j=1,2,…,7)加權(quán)的協(xié)相關(guān)度Rw(Ai,Aj),其協(xié)相關(guān)矩陣為:

      (3)利用Matlab軟件計(jì)算得到矩陣:

      因此模糊等價(jià)矩陣t(R)=R4。

      (4)選定置信水平α∈[0,1],構(gòu)建α-截矩陣t(R)α,令α由1降至0,按t(R)α進(jìn)行動(dòng)態(tài)聚類(lèi):

      ①當(dāng)0.998 6<α≤0時(shí),Ai(i=1,2,…,7)被分為7類(lèi):{A1},{A2},{A3},{A4},{A5},{A6},{A7};

      ②當(dāng) 0.992 1<α≤0.998 6時(shí),Ai(i=1,2,…,7)被分為6類(lèi):{A1},{A2,A3},{A4},{A5},{A6},{A7};

      ③當(dāng) 0.986 7<α≤0.992 1時(shí),Ai(i=1,2,…,7)被分為5類(lèi):{A1},{A2,A3},{A4,A6},{A5},{A7};

      ④當(dāng) 0.913 2<α≤0.986 7時(shí),Ai(i=1,2,…,7)被分為4類(lèi):{A1,A2,A3},{A4,A6},{A5},{A7};

      ⑤當(dāng) 0.752 7<α≤0.913 2時(shí),Ai(i=1,2,…,7)被分為3類(lèi):{A1,A2,A3},{A4,A6,A7},{A5};

      ⑥當(dāng) 0.576 9<α≤0.752 7時(shí),Ai(i=1,2,…,7)被分為2類(lèi):{A1,A2,A3},{A4,A5,A6,A7};

      ⑦當(dāng)0<α≤0.576 9時(shí),Ai(i=1,2,…,7)被分為1類(lèi):{A1,A2,A3,A4,A5,A6,A7}。

      如果利用文獻(xiàn)[25]中猶豫模糊集的相關(guān)系數(shù)公式:

      計(jì)算關(guān)聯(lián)矩陣C,得:

      構(gòu)造等價(jià)關(guān)聯(lián)矩陣,計(jì)算C2,C4,…,C2n,…,有C8=C4,即C4為一個(gè)等價(jià)關(guān)聯(lián)矩陣:

      選擇不同的截割水平α∈[0,1],建立C4的α-截矩陣,所得聚類(lèi)結(jié)果如表4左側(cè)所示,文獻(xiàn)[33]和文獻(xiàn)[34]中的聚類(lèi)方法得到的聚類(lèi)結(jié)果見(jiàn)表4中側(cè)和右側(cè)。

      通過(guò)比較可以發(fā)現(xiàn),文獻(xiàn)[25]的聚類(lèi)結(jié)果與本文主要有以下差別:(1)文獻(xiàn)[25]中的相關(guān)系數(shù)公式最多可將樣品分成6類(lèi),本文的協(xié)相關(guān)度公式所得結(jié)果則更加精細(xì),可以滿足不同層次的需求。(2)聚類(lèi)結(jié)果存在很大差異。在聚為6類(lèi)時(shí),文獻(xiàn)[25]把A2和A4歸為一類(lèi),事實(shí)上A2和A4更接近,有的屬性下甚至相等。在聚為5類(lèi)時(shí),文獻(xiàn)[25]把A6和A7歸為一類(lèi),而A4與A6更相似,因此本文將A2與A3,A4與A6作為一類(lèi)更合理,這也與文獻(xiàn)[33]和文獻(xiàn)[34]所得結(jié)果一致。

      Table 4 Comparison of various clustering results表4 各種聚類(lèi)的結(jié)果比較

      造成這些差異的原因在于構(gòu)造相似矩陣時(shí)所用的計(jì)算猶豫模糊集相關(guān)程度的公式上,本文的協(xié)相關(guān)度公式是源于統(tǒng)計(jì)學(xué)中相關(guān)系數(shù)的構(gòu)造思想,因此有一定的理論支撐,它比文獻(xiàn)[25]的相關(guān)系數(shù)公式復(fù)雜,這就保證了能充分利用決策矩陣中的數(shù)據(jù),減少信息流失。此外,在計(jì)算論域里各元素的權(quán)重(屬性權(quán)重)時(shí),本文提出的交叉熵距離表示的差異程度相對(duì)于其他距離公式有更高的分辨率,用它得出的權(quán)重公式更加合理,能客觀反映不同屬性的地位差別。而文獻(xiàn)[25]提出的方法需要權(quán)重矢量完全已知,沒(méi)有充分挖掘決策信息本身,其結(jié)果與實(shí)際情況有一定的偏差。

      文獻(xiàn)[33]和文獻(xiàn)[34]所用的聚類(lèi)方法得到的分類(lèi)結(jié)果與本文也有所不同。劉小弟等人[24]指出,文獻(xiàn)[33]使用層次聚類(lèi)法對(duì)猶豫模糊集進(jìn)行聚類(lèi)分析,利用最小距離作為聚類(lèi)依據(jù),一旦一組樣本被合并,就需要利用猶豫模糊平均算子在新生成的類(lèi)上重新計(jì)算聚類(lèi)中心,這種反復(fù)性的計(jì)算很繁瑣,而且平均算子的使用勢(shì)必會(huì)造成一部分的信息丟失,導(dǎo)致最后的結(jié)果不可靠;文獻(xiàn)[34]利用最小生成樹(shù)(minimum spanning tree,MST)算法得到聚類(lèi)結(jié)果,它所使用的距離公式分辨率不夠高,且屬性權(quán)重帶有一定的主觀性,計(jì)算出的結(jié)果有時(shí)與事實(shí)有較大偏差,這必然會(huì)影響最后的聚類(lèi)。

      本文利用猶豫模糊信息的交叉熵作為距離,基于離差最大化方法獲得屬性權(quán)重,提出加權(quán)的協(xié)相關(guān)度公式,使用模糊等價(jià)聚類(lèi)方法,借助于計(jì)算機(jī)軟件計(jì)算模糊等價(jià)矩陣,進(jìn)而獲得聚類(lèi)結(jié)果。相比于其他方法,該算法設(shè)計(jì)合理,操作過(guò)程程序化,便于計(jì)算機(jī)處理,易形成動(dòng)態(tài)聚類(lèi),且能有效保留信息,使計(jì)算結(jié)果客觀可靠。

      6 結(jié)束語(yǔ)

      模糊集理論作為不確定理論中重要的一支,因能深刻真實(shí)地反映現(xiàn)實(shí)客觀世界與人們內(nèi)心世界而被廣泛應(yīng)用到運(yùn)籌與管理、經(jīng)濟(jì)與決策各個(gè)領(lǐng)域,相繼出現(xiàn)了直覺(jué)模糊集、模糊軟集、區(qū)間型模糊集以及模糊數(shù)等推廣演變形式,它們構(gòu)成了一個(gè)模糊理論體系,但這些理論對(duì)實(shí)際問(wèn)題刻畫(huà)得不夠細(xì)致具體。在進(jìn)行重大決策時(shí)經(jīng)常是多個(gè)決策者共同參與,這就勢(shì)必會(huì)出現(xiàn)意見(jiàn)不統(tǒng)一或者決策者自身就徘徊不定的情況,因此猶豫模糊集被提出。它是經(jīng)典模糊集的另一種推廣,其隸屬度允許一個(gè)或幾個(gè)可能的值,這樣就能全面描述人們的真實(shí)想法,且能避免使用各種算子來(lái)合成各個(gè)專(zhuān)家提供的數(shù)據(jù),從而能直接處理它們,減少了信息的丟失。

      聚類(lèi)分析是數(shù)量統(tǒng)計(jì)中多元分析的一個(gè)分支,它是一種硬劃分,把每個(gè)待辨識(shí)的對(duì)象嚴(yán)格地劃分到某個(gè)類(lèi)當(dāng)中,具有非此即彼的性質(zhì),這種分類(lèi)的類(lèi)別界限是分明的。因?yàn)楝F(xiàn)實(shí)的分類(lèi)往往伴隨著模糊性,所以用模糊理論來(lái)進(jìn)行聚類(lèi)分析會(huì)顯得更自然,更符合客觀實(shí)際[35]。目前模糊理論在聚類(lèi)分析方面的應(yīng)用已得到很大發(fā)展,但數(shù)據(jù)類(lèi)型是猶豫模糊元的聚類(lèi)分析還不多見(jiàn)。本文針對(duì)猶豫模糊環(huán)境下的聚類(lèi)分析,提出猶豫模糊集的協(xié)相關(guān)度的概念,在獲取論域各元素的權(quán)重上,使用分辨率較高的交叉熵距離建立優(yōu)化模型得到,以確保加權(quán)的協(xié)相關(guān)度公式在計(jì)算不同猶豫模糊集的關(guān)聯(lián)程度時(shí)更加靈敏合理,構(gòu)建的關(guān)聯(lián)矩陣更能體現(xiàn)不同對(duì)象的差異性?;谶@些理論成果,最后給出了猶豫模糊信息下的聚類(lèi)方法,并通過(guò)具體實(shí)例說(shuō)明了所提聚類(lèi)方法的可行性與有效性。

      [1]Torra V,Narukawa Y.On hesitant fuzzy sets and decision[C]//Proceedings of the 18th IEEE International Conference on Fuzzy Systems,Jeju Island,Aug 20-24,2009.Piscataway:IEEE,2009:1378-1382.

      [2]Torra V.Hesitant fuzzy sets[J].International Journal of Intelligent Systems,2010,25(6):529-539.

      [3]Atanassov K T.Intuitionistic fuzzy sets[J].Fuzzy Sets and Systems,1986,20(1):87-96.

      [4]Dubois D,Prade H.Fuzzy sets and systems:theory and applications[M].Orlando:Academic Press,Inc,1980.

      [5]Yager R R.On the theory of bags[J].International Journal of General Systems,1986,13(1):23-37.

      [6]Xia Meimei,Xu Zeshui.Hesitant fuzzy information aggregation in decision making[J].International Journal of Approximate Reasoning,2011,52(3):395-407.

      [7]Xia Meimei,Xu Zeshui,Chen N.Some hesitant fuzzy aggregation operators with their application in group decision making[J].Group Decision and Negotiation,2013,22(2):259-279.

      [8]Xu Zeshui,Zhang Xiaolu.Hesitant fuzzy multi-attribute decision making based on TOPSIS with incomplete weight information[J].Knowledge-Based Systems,2013,52(6):53-64.

      [9]Zhu Bin,Xu Zeshui,Xia Meimei.Dual hesitant fuzzy sets[J].Journal of Applied mathematics,2012.doi:10.1155/2012/879629.

      [10]Zhu Bin,Xu Zeshui.Some results for dual hesitant fuzzy sets[J].Journal of Intelligent and Fuzzy Systems,2014,26(4):1657-1668.

      [11]Xia Meimei,Xu Zeshui.Entropy/cross entropy-based group decision making under intuitionistic fuzzy environment[J].Information Fusion,2012,13(1):31-47.

      [12]Liu Xuecheng.Entropy,distance measure and similarity measure of fuzzy sets and their relations[J].Fuzzy Sets Systems,1992,52(3):305-318.

      [13]Zeng Wenyi,Li Hongxing.Relationship between similarity measure and entropy of interval-valued fuzzy sets[J].Fuzzy Sets Systems,2006,157(11):1477-1484.

      [14]Zeng Wenyi,Guo Ping.Normalized distance,similarity measure,inclusion measure and entropy of interval-valued fuzzy sets and their relationship[J].Information Sciences,2008,178(5):1334-1342.

      [15]Zhang Qiansheng,Jiang Shengyi.Relationships between entropy and similarity measure of interval-valued intuitionistic fuzzy sets[J].International Journal of Intelligent Systems,2010,25(11):1121-1140.

      [16]Xu Zeshui,Xia Meimei.Hesitant fuzzy entropy and crossentropy and their use in multiattribute decision-making[J].International Journal of Intelligent Systems,2012,27(9):799-822.

      [17]Gerstenkorn T,Manko J.Correlation of intuitionistic fuzzy sets[J].Fuzzy Set Systems,1991,44(1):39-43.

      [18]Hong D H,Hwang S Y.Correlation of intuitionistic fuzzy sets in probability spaces[J].Fuzzy Set Systems,1995,75(1):77-81.

      [19]Hung W L,Wu J W.Correlation of intuitionistic fuzzy sets by centroid method[J].Information Sciences,2002,144(1/4):219-225.

      [20]Bustince H,Burillo P.Correlation of interval-valued intuitionistic fuzzy sets[J].Fuzzy Set Systems,1995,74(2):237-244.

      [21]Hong D H.A note on correlation of interval-valued intuitionistic fuzzy sets[J].Fuzzy Set Systems,1998,95(1):113-117.

      [22]Xu Zeshui,Xia Meimei.On distance and correlation measures of hesitant fuzzy information[J].International Journal of Intelligent Systems,2011,26(5):410-425.

      [23]Xu Zeshui,Xia Meimei.Distance and similarity measures for hesitant fuzzy sets[J].Information Sciences,2011,181(11):2218-2138.

      [24]Liu Xiaodi,Zhu Jianjun,Liu Sifeng.Similarity measure of hesitant fuzzy sets based on symmetric cross entropy and its application in clustering analysis[J].Control and Decision,2014,29(10):1816-1822.

      [25]Chen Na,Xu Zeshui,Xia Meimei.Correlation coefficients of hesitant fuzzy sets and their applications to clustering analysis[J].Applied Mathematical Modeling,2013,37(4):2197-2211.

      [26]Xu Zeshui.Intuitionistic fuzzy hierarchical clustering algo-rithms[J].Journal of Systems Engineering and Electronics,2009,20(1):90-97.

      [27]Wang Zhong,Xu Zeshui,Liu Shousheng,et al.A netting clustering analysis method under intuitionistic fuzzy environment[J].Applied Soft Computing,2011,11(8):5558-5564.[28]Xu Zeshui,Chen Jian,Wu Junjie.Clustering algorithm for intuitionistic fuzzy sets[J].Information Sciences,2008,178(19):3775-3790.

      [29]Hwang C,Rhee F C H.Uncertain fuzzy clustering:interval type-2 fuzzy approach to C-means[J].IEEE Transactionson Fuzzy Systems,2007,15(1):107-120.

      [30]Yang M S,Lin D C.On similarity and inclusion measures between type-2 fuzzy sets with an application to clustering[J].Computers and Mathematical with Applications,2009,57(6):896-907.

      [31]Xu Zeshui.Uncertain multiple attribute decision making[M].Beijing:Tsinghua University Press,2004.

      [32]Shen Hengfan.Probability theory and mathematical statistics[M].Beijing:Higher Education Press,2011.

      [33]Zhang Xiaolu,Xu Zeshui.Hesitant fuzzy agglomerative hierarchical clustering algorithms[J].International Journal of Systems Science,2015,46(3):562-576.

      [34]Zhang Xiaolu,Xu Zeshui.A MST clustering analysis method under hesitant fuzzy environment[J].Control and Cybernetics,2012,41(3):645-666.

      [35]Hu Baoqing.Fuzzy theory foundation[M].Wuhan:Wuhan University Press,2010.

      附中文參考文獻(xiàn):

      [24]劉小弟,朱建軍,劉思峰.基于對(duì)稱(chēng)交互熵的猶豫模糊信息相似度及聚類(lèi)應(yīng)用[J].控制與決策,2014,29(10):1816-1822.

      [31]徐澤水.不確定多屬性決策方法及應(yīng)用[M].北京:清華大學(xué)出版社,2004.

      [32]沈恒范.概率論與數(shù)理統(tǒng)計(jì)教程[M].北京:高等教育出版社,2011.

      [35]胡寶清.模糊理論基礎(chǔ)[M].武漢:武漢大學(xué)出版社,2010.

      猜你喜歡
      模糊集交叉權(quán)重
      基于上下截集的粗糙模糊集的運(yùn)算性質(zhì)
      權(quán)重常思“浮名輕”
      “六法”巧解分式方程
      為黨督政勤履職 代民行權(quán)重?fù)?dān)當(dāng)
      基于公約式權(quán)重的截短線性分組碼盲識(shí)別方法
      E-不變凸模糊集
      連一連
      基于Fast-ICA的Wigner-Ville分布交叉項(xiàng)消除方法
      E-廣義凸直覺(jué)模糊集①
      雙線性時(shí)頻分布交叉項(xiàng)提取及損傷識(shí)別應(yīng)用
      乌拉特中旗| 仁布县| 无极县| 景德镇市| 尼勒克县| 汶上县| 惠水县| 长寿区| 寿阳县| 汉川市| 晋城| 襄樊市| 广汉市| 德阳市| 常宁市| 合江县| 达孜县| 石景山区| 姜堰市| 平乡县| 株洲县| 井冈山市| 凭祥市| 龙江县| 交口县| 尼玛县| 宁城县| 毕节市| 清远市| 图木舒克市| 富源县| 西宁市| 易门县| 依安县| 山东省| 广州市| 曲阳县| 文山县| 黔东| 临江市| 上高县|