• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于拉普拉斯矩陣的K-mean聚類

      2017-09-22 04:54:28潘正高路紅梅李雪竹
      綏化學(xué)院學(xué)報 2017年9期
      關(guān)鍵詞:鄰接矩陣拉普拉斯宿州

      王 超 潘正高 路紅梅 李雪竹

      (宿州學(xué)院信息工程學(xué)院 安徽宿州 234000)

      基于拉普拉斯矩陣的K-mean聚類

      王 超 潘正高 路紅梅 李雪竹

      (宿州學(xué)院信息工程學(xué)院 安徽宿州 234000)

      譜聚類的方法被廣泛用在模式識別各個領(lǐng)域。文章運用K-mean聚類方法,主要闡述了如何由樣本的相似度矩陣構(gòu)造的拉普拉斯矩陣來求解樣本的低維映射譜,根據(jù)低維映射譜進行譜聚類。

      拉普拉斯矩陣;譜聚類;K-means

      樣本聚類是無監(jiān)督學(xué)習(xí)的一種重要分類方法。對于無標(biāo)簽的樣本,要實現(xiàn)分類只能根據(jù)樣本本身的相似度進行分類,度量樣本相似度就是相似度聚類[1]。傳統(tǒng)聚類方法要知道樣本在N維空間的矢量[2]。但是拉普拉斯譜聚類的方法只需要知道樣本的相似度矩陣就能進行聚類。

      一、圖譜理論到拉普拉斯矩陣

      拉普拉斯矩陣式表示圖的一種矩陣,給定一個n個頂點的圖,則拉普拉斯矩陣被定義為:L=D-W

      其中D為圖的度矩陣,W為圖的鄰接矩陣。

      舉個例子,給定一個簡單圖,如下:

      圖1 一個鄰接圖

      把該圖轉(zhuǎn)化成鄰接矩陣的形式記為W則:

      把W的每一列元素加起來得到n個數(shù),然后把這個數(shù)放在對角線上其余位置都是零,組成一個n×n的對角矩陣,記為度矩陣D,如下所示:

      根據(jù)拉普拉斯定義L=D-W可得拉普拉斯矩陣如下所示:

      通過上面這個簡單例子,我們明白了拉普拉斯矩陣在連接圖上的定義。下面我們對于更一般的情況的數(shù)學(xué)描述如下:對于一個圖中定義A子圖和B子圖[3],它們之間的所有邊的權(quán)值之和可以由鄰接矩陣W的一般形式求解如下:

      其中,Wij定義為節(jié)點i到節(jié)點j的權(quán)值,如果兩個節(jié)點不相連,則權(quán)值為零。與某個節(jié)點i鄰接的所有邊的權(quán)值之和定義為該頂點i的度di,多個di形成一個度矩陣D。

      由以上定義可知拉普拉斯矩陣的性質(zhì)如下:

      (1)L是對稱半正定矩陣;

      (2)L·1=0·1,即L的最小特征值是0,相應(yīng)的特征向量是1;

      (3)L有n個非負特征值0=λ1≤λ2≤…λn;

      (4)對于任何一個實向量υ?Rn,有以下表達式成立:

      對性質(zhì)(4)的證明如下:

      二、聚類的圖譜解釋

      聚類是把一堆樣本合理地分成兩份或份。從圖論的角度看,聚類問題就是圖的分割問題[4]。給定一個圖G=(V,M),頂點集表示各樣本,帶權(quán)的邊表示各樣本之間的相似度,譜聚類的目的是要找到一種合理的分割圖的方法,把圖分割為若干個子圖,使得連接不同子圖的邊的權(quán)重或者相似度盡可能的低,同一子圖內(nèi)邊的權(quán)重或者相似度盡可能高。相似的聚集在一起,不相似的彼此遠離。為了達到這樣一個目的,就需要被切割的這些邊的權(quán)值之和最小[5]。

      假設(shè)圖不相交的子圖分別為A1,A2,…,AK,求其代價最小的分割的目標(biāo)函數(shù)如下:

      其中k表示分成了k個組,Ai表示第i組,Ai表示Ai的補集表示Ai,與Ai相連的所有邊之和。綜合上式就表示所有要切割的邊的權(quán)重之和。就是分割成個組要使得上式取最小值。這個目標(biāo)函數(shù)在實際的操作中,常常把圖分割為一個點和其余n-1各點。為了讓每個圖都有合適的大小,上述的目標(biāo)函數(shù)改寫成如下式子:

      下面對這個目標(biāo)函數(shù)進行推導(dǎo):

      則上式可以化為:

      我們從RatioCut推導(dǎo)出了vTLv,這也就是說拉普拉斯矩陣L和我們要優(yōu)化的目標(biāo)函數(shù)RatioCut有密切的聯(lián)系。因為是一個常量。最小化RatioCut,也就是最小化vTLv。

      又因為:

      顯然上式n是一個定值,要最小化vTLv也就是最小化λ。因此我們下面只有找到拉普拉斯矩陣L最小特征值是零,對應(yīng)的特征向量就行了。這里有一個問題,就是我們討論過的拉普拉斯矩陣最小特征值是零,對應(yīng)的特征向量是1。不滿足v⊥1的條件了,這里根據(jù)文獻[2]所說理論。我們?nèi)〉?小特征值對應(yīng)特征向量。進一步,由于實際中的特征向量里的元素是連續(xù)的任意實數(shù),所以可以根據(jù)v是大于0還是小于0對應(yīng)到離散情況下的,決定vi是取還是取。而如果能求取v的前K個特征向量,進行K-means聚類,得到K個簇,便從二聚類擴展到了K聚類問題。而這里要求的K個特征向量就是拉普拉斯矩陣的特征向量。所以問題就轉(zhuǎn)換成了:求取拉普拉斯矩陣的前K特征值對應(yīng)的特征向量,然后用這前K個特征值對應(yīng)的特征向量進行K-means聚類。

      三、K-means聚類

      (一)隨機在圖中取K個點作為中心點。

      (二)然后計算圖中所有點到K個中心點距離,假如P點離中心點S點最近,那么P點屬于S點群。

      (三)分完群計算點群中心,用新的中心點作為點群中心點。

      (四)重復(fù)步驟(2)和(3),直到中心點不再移動,聚類完畢。

      四、結(jié)語

      基于拉普拉斯矩陣的K-means聚類,一般步驟如下:

      (一)根據(jù)數(shù)據(jù)構(gòu)造一個圖,圖中每一個節(jié)點對應(yīng)一個數(shù)據(jù)點,將各個數(shù)據(jù)點連接起來,并且邊的權(quán)重表示數(shù)據(jù)的相似度。把這個圖用鄰接矩陣W表示出來。

      (二)把鄰接矩陣每一列元素加起來得到n個數(shù),把它們放在對角線上,其他地方補零構(gòu)成一個的對角陣,記為度矩陣D,并構(gòu)造拉普拉斯矩陣L且L=D-W。

      (三)求出拉普拉斯矩陣的前K個特征值對應(yīng)的特征向量,特征值由小到大順序排列的。

      (四)把這些特征向量(列向量)排列在一起組成一個nx·k的矩陣,將其中每一行看做k維空間的一個向量,并使用K-means算法進行聚類。聚類結(jié)果每一行所屬類別就是圖中節(jié)點也就是n個數(shù)據(jù)點分別所屬類別。

      譜聚類算法和傳統(tǒng)聚類方法相比,譜聚類只需要數(shù)據(jù)之間的相似度矩陣就可以了,而不必想單純K-means聚類需要數(shù)據(jù)在N維歐式空間中的向量。

      [1]H.Zha,C.Ding,M.Gu,X.He,and H.D.Simon.Spectral relaxationfor K-meansclustering[C].AdvancesinNeuralInformation ProcessingSystems14,Vancouver,Canada.Dec.2001:1057-1064.

      [2]Fouss,F.,Pirotte,A.,Renders,J.-M.,and Saerens,M.. Random-walk computation of similar-ities between nodes of a graph with application to collaborative recommendation[J].IEEE Trans.Knowl.DataEng.[J].2007,19(3):355-369.

      [3]Kannan,R.,Vempala,S.,andVetta,A..Onclusterings:Good, badandspectral.JournaloftheACM[J].2004,51(3):497-515.

      [4]Hagen,L.andKahng,A.Newspectralmethodsforratiocut partitioning and clustering.IEEE Trans.Computer-Aided Design [J].1992,11(9):1074-1085.

      [5]Gutman,I.andXiao,W.Generalizedinverse of the Laplacian matrixandsomeap plications[J].Bulletindel’Academie Serbedes Sciencesatdes Arts(Cl.Math.Natur.),2004,129:15-23.

      [責(zé)任編輯 鄭麗娟]

      TP391

      A

      2095-0438(2017)09-0153-03

      2017-05-09

      王超(1981-),男,安徽宿州人,宿州學(xué)院信息工程學(xué)院助教,碩士,研究方向:模式識別、人工智能、物聯(lián)網(wǎng)、圖像處理。

      安徽省青年人才支持項目(gxfxzd2016256);安徽省科技廳科技攻關(guān)項目(1502052053)。

      猜你喜歡
      鄰接矩陣拉普拉斯宿州
      輪圖的平衡性
      安徽宿州靈璧縣:多措并舉發(fā)展特色產(chǎn)業(yè)
      宿州學(xué)院
      宿州綠地城基坑防洪安全設(shè)計
      基于鄰接矩陣變型的K分網(wǎng)絡(luò)社團算法
      “鉆”研40年 宿州地下終于挖出鉆石
      基于超拉普拉斯分布的磁化率重建算法
      一種判定的無向圖連通性的快速Warshall算法
      Inverse of Adjacency Matrix of a Graph with Matrix Weights
      位移性在拉普拉斯變換中的應(yīng)用
      栾城县| 义乌市| 嵩明县| 宜君县| 镇远县| 岱山县| 昭通市| 新干县| 岫岩| 大新县| 桃源县| 合作市| 吉林省| 开封县| 会泽县| 杂多县| 东乌| 股票| 巴林左旗| 景德镇市| 吴川市| 武胜县| 边坝县| 姚安县| 兴城市| 黑河市| 木兰县| 新巴尔虎右旗| 上饶县| 肇源县| 阜城县| 辛集市| 丰宁| 晋城| 鄂温| 乌审旗| 皮山县| 册亨县| 青阳县| 彭水| 西林县|