• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      密度峰值快速聚類(lèi)算法優(yōu)化研究

      2018-08-23 03:06:50王鵬飛楊余旺柯亞琪
      關(guān)鍵詞:光暈聚類(lèi)局部

      王鵬飛,楊余旺,柯亞琪

      (1.南京理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,江蘇 南京 210094; 2.南京農(nóng)業(yè)大學(xué)園藝學(xué)院,江蘇 南京 210095)

      1 引言

      近年來(lái)隨著數(shù)據(jù)的不斷增長(zhǎng)和累積,如何從這些大數(shù)據(jù)中挖掘出有用的信息成為了當(dāng)前的研究熱點(diǎn),聚類(lèi)就是一種能夠從大數(shù)據(jù)中挖掘出有用信息的有效方法[1]。聚類(lèi)是聚類(lèi)分析的簡(jiǎn)稱,是一種無(wú)監(jiān)督的學(xué)習(xí)過(guò)程[2]。聚類(lèi)是在無(wú)先驗(yàn)認(rèn)知的條件下,根據(jù)發(fā)現(xiàn)的數(shù)據(jù)對(duì)象的相似性,將對(duì)象分組,從而達(dá)到對(duì)數(shù)據(jù)的深刻理解,獲得有用信息或者壓縮數(shù)據(jù)的目的[3,4]。

      聚類(lèi)分析現(xiàn)在已經(jīng)應(yīng)用于諸多領(lǐng)域,如:數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)、計(jì)算機(jī)視覺(jué)、圖像處理、生物信息學(xué)等[5]。正因?yàn)榫垲?lèi)分析的實(shí)用性,許多聚類(lèi)算法已經(jīng)被人們提出,其中比較經(jīng)典的有K-means算法、模糊C-means算法、具有噪聲的基于密度的聚類(lèi)方法DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法等,近幾年又提出了近鄰傳播AP(Affinity Propagation)算法和CFSFDP(Clustering by Fast Search and Find of Density Peaks)算法[6]。這些聚類(lèi)算法都旨在解決不同情況下的大數(shù)據(jù)聚類(lèi)問(wèn)題。K-means算法是一種基于距離的迭代式算法,其旨在將數(shù)據(jù)點(diǎn)劃分到距離最近的聚類(lèi)中心所在的簇中,但K-means算法需要提前指定聚類(lèi)中心的個(gè)數(shù),且對(duì)于非球形的數(shù)據(jù)集很難取得令人滿意的聚類(lèi)結(jié)果[7]?;跀?shù)據(jù)點(diǎn)的密度進(jìn)行聚類(lèi)的算法,如經(jīng)典的DBSCAN算法,則擺脫了對(duì)數(shù)據(jù)集形狀要求的束縛,它可以得到任意形狀的類(lèi)簇。DBSCAN算法需選擇一個(gè)密度閾值,密度高于該閾值的點(diǎn)則成為“核心點(diǎn)”,之后將所有“密度相連”的點(diǎn)聚合為一個(gè)類(lèi)[8]。DBSCAN算法不需要事先確定聚類(lèi)中心的個(gè)數(shù),且能夠很好地排除噪聲點(diǎn)和離群點(diǎn)。但是,該算法對(duì)于密度分布不均勻的數(shù)據(jù)集所取得的效果并不理想,且該算法最終的結(jié)果對(duì)所選擇的密度閾值十分敏感,這使得對(duì)于密度閾值的選擇有一定的困難。除了上述兩個(gè)問(wèn)題外,DBSCAN算法的計(jì)算復(fù)雜度也很高,這也導(dǎo)致它很難運(yùn)用于高維數(shù)據(jù)環(huán)境[9]。

      Rodriguez等人[10]于2014年在《Science》上提出了一種基于密度峰值的空間聚類(lèi)算法,該算法可以對(duì)任何無(wú)規(guī)則的數(shù)據(jù)集進(jìn)行聚類(lèi)[11]??焖賹ふ颐芏葮O點(diǎn)聚類(lèi)算法CFSFDP算法首先通過(guò)使用一截?cái)嗑嚯x來(lái)計(jì)算每個(gè)點(diǎn)的局部密度,然后計(jì)算各數(shù)據(jù)點(diǎn)與局部密度高于它們的數(shù)據(jù)點(diǎn)之間的最小距離;然后根據(jù)計(jì)算出的每個(gè)點(diǎn)的局部密度和最小距離繪制決策圖,接著在決策圖中人工選取聚類(lèi)的中心,之后將剩余的非聚類(lèi)中心的數(shù)據(jù)點(diǎn)劃分到與之距離最近的聚類(lèi)中心所在的簇中;最后再將所得到的各個(gè)簇劃分為簇核心和簇光暈,從而得到最終的聚類(lèi)結(jié)果。使用CFSFDP算法進(jìn)行聚類(lèi)時(shí)只需要計(jì)算一次距離,并且不需要進(jìn)行迭代,因此算法的計(jì)算速度很快。但是,該算法選擇聚類(lèi)中心的時(shí)候需要在決策圖中人工選取,這增加了算法的冗余性,不利于算法的自動(dòng)化,且在最后將簇劃分為簇核心和簇光暈時(shí)會(huì)將簇邊緣的本屬于簇核心的一些點(diǎn)劃分到簇光暈中,影響最終的聚類(lèi)效果。

      針對(duì)CFSFDP算法上述兩個(gè)不足點(diǎn),本文引入了一種聚類(lèi)中心的自動(dòng)選擇策略,通過(guò)使用異常檢測(cè)的思想自動(dòng)計(jì)算得到數(shù)據(jù)集的聚類(lèi)中心,從而避免了CFSFDP算法需要在決策圖中人工選擇聚類(lèi)中心,影響算法自動(dòng)化的問(wèn)題。并且在得到初步的聚類(lèi)結(jié)果后進(jìn)行簇核心和簇光暈的劃分時(shí),引入了簇內(nèi)局部密度的概念,改進(jìn)了CFSFDP算法原本的劃分方法,使得簇核心和簇光暈點(diǎn)劃分結(jié)果更為合理。實(shí)驗(yàn)結(jié)果表明,本文提出的算法可以有效地提高CFSFDP算法的自動(dòng)化程度,并且最終得到的聚類(lèi)結(jié)果與CFSFDP算法相比更為準(zhǔn)確合理。

      2 CFSFDP算法

      CFSFDP算法進(jìn)行聚類(lèi)時(shí)首先需要確定類(lèi)的中心點(diǎn),其假設(shè)簇的聚類(lèi)中心的局部密度高于其周?chē)鷶?shù)據(jù)點(diǎn)的局部密度,并且聚類(lèi)中心與那些局部密度更高的數(shù)據(jù)點(diǎn)之間的距離較大。對(duì)于一個(gè)給定的數(shù)據(jù)集,CFSFDP算法需要為每個(gè)數(shù)據(jù)點(diǎn)計(jì)算兩個(gè)量化值:數(shù)據(jù)點(diǎn)的局部密度ρi和它與局部密度比其高的數(shù)據(jù)點(diǎn)之間的距離δi。

      數(shù)據(jù)點(diǎn)xi的局部密度ρi有兩種計(jì)算方式:基于截?cái)嗪说挠?jì)算方式和基于高斯核的計(jì)算方式。使用截?cái)嗪擞?jì)算局部密度ρi的公式為:

      χ(δij-dc)

      (1)

      使用高斯核計(jì)算局部密度ρi的公式為:

      (2)

      其中,δij為數(shù)據(jù)點(diǎn)之間的距離,Is為i的值域,dc為截?cái)嗑嚯x即距離閾值。使用該計(jì)算方式得到的局部密度ρi仍然滿足與數(shù)據(jù)點(diǎn)xi的距離小于dc的點(diǎn)越多,局部密度ρi就越大的結(jié)論。使用截?cái)嗪擞?jì)算局部密度和使用高斯核計(jì)算局部密度這兩種計(jì)算方式的區(qū)別在于使用截?cái)嗪擞?jì)算得到的結(jié)果為離散值而使用高斯核計(jì)算得到的結(jié)果為連續(xù)值。因此,相對(duì)而言,使用高斯核計(jì)算得到的數(shù)據(jù)點(diǎn)具有相同的局部密度的概率比使用截?cái)嗪擞?jì)算得到的數(shù)據(jù)點(diǎn)具有相同的局部密度的概率要小,使用高斯核計(jì)算局部密度ρi更方便比較數(shù)據(jù)點(diǎn)局部密度之間的大小關(guān)系。

      數(shù)據(jù)點(diǎn)之間的距離δi是通過(guò)計(jì)算數(shù)據(jù)點(diǎn)xi與比該數(shù)據(jù)點(diǎn)局部密度高的其他數(shù)據(jù)點(diǎn)的距離得到的,數(shù)據(jù)點(diǎn)之間的距離δi可以根據(jù)公式(3)計(jì)算得到。

      (3)

      一般而言,數(shù)據(jù)點(diǎn)之間的距離δi為數(shù)據(jù)點(diǎn)i與比該數(shù)據(jù)點(diǎn)局部密度ρi更高的其他數(shù)據(jù)點(diǎn)的所有距離中的最小值,但對(duì)于局部密度ρi最高的點(diǎn),數(shù)據(jù)點(diǎn)之間的距離δi為其他數(shù)據(jù)點(diǎn)與之距離的最大值。

      CFSFDP算法根據(jù)數(shù)據(jù)點(diǎn)之間的距離δi與數(shù)據(jù)點(diǎn)的局部密度ρi的各自的大小關(guān)系繪制決策圖,通過(guò)在決策圖中人工選取簇的聚類(lèi)中心,其決策圖如圖1所示。算法將δi值大且ρi值較大的點(diǎn)認(rèn)定為簇的聚類(lèi)中心,即在決策圖中處于右上角與其他點(diǎn)分離明顯的部分點(diǎn)。在確定簇的聚類(lèi)中心之后,便將其他剩余的數(shù)據(jù)點(diǎn)劃分到局部密度比其高且與之距離最近的聚類(lèi)中心所在的簇中。

      Figure 1 Decision graph of CFSFDP圖1 CFSFDP算法決策圖

      CFSFDP算法不同于DBSCAN等聚類(lèi)算法,其對(duì)于較低密度的簇類(lèi)點(diǎn)沒(méi)有引入噪聲的概念,而是為每一個(gè)簇引入了一個(gè)光暈的概念,簇的光暈中則包含了其他算法中所定義的噪聲以及數(shù)據(jù)集中的離散點(diǎn)。CFSFDP算法將一個(gè)簇劃分為簇核心和簇光暈,屬于簇核心中的數(shù)據(jù)點(diǎn)的局部密度ρi較大,而屬于簇光暈中的數(shù)據(jù)點(diǎn)的局部密度ρi較小,局部密度ρi較小的點(diǎn)則包含了簇的噪聲點(diǎn)以及數(shù)據(jù)集的離散點(diǎn)。為了劃分簇的簇核心與簇光暈,CFSFDP算法引入了“邊界區(qū)域”的概念,它的定義為:數(shù)據(jù)點(diǎn)屬于該簇,但在與該數(shù)據(jù)點(diǎn)的距離小于dc的范圍內(nèi)存在屬于其他簇的數(shù)據(jù)點(diǎn),由這些點(diǎn)構(gòu)成的區(qū)域范圍稱為該簇的“邊界區(qū)域”。在取得每個(gè)簇的“邊界區(qū)域”后,將“邊界區(qū)域”中局部密度最大的點(diǎn)的局部密度值作為該簇的簇核心與簇光暈的分割閾值ρb。最后根據(jù)該簇中的數(shù)據(jù)點(diǎn)的局部密度ρi與該簇的密度閾值ρb的關(guān)系將該簇?cái)?shù)據(jù)點(diǎn)劃分到簇核心或者簇光暈中,若該簇內(nèi)的數(shù)據(jù)點(diǎn)的局部密度ρi大于ρb,則該數(shù)據(jù)點(diǎn)劃分到該簇的簇核心中,否則將其劃分到該簇的簇光暈中。經(jīng)過(guò)將各簇進(jìn)行簇核心與簇光暈的劃分之后便得到了CFSFDP算法最終的聚類(lèi)結(jié)果。

      3 CFSFDP算法改進(jìn)

      CFSFDP算法在選擇聚類(lèi)中心時(shí)需要人工輔助選擇,選擇方式為在決策圖中,將右上角的點(diǎn)作為起點(diǎn),向左下方拉矩形,利用矩形框選擇與其它點(diǎn)差異最大的一組點(diǎn),該組點(diǎn)即為聚類(lèi)中心。該過(guò)程因?yàn)樾枰斯⑴c,使得算法的冗余性增加,并且人工選擇具有一定的主觀性,選擇結(jié)果的不同將會(huì)影響最終聚類(lèi)的結(jié)果,這不利于最終結(jié)果的準(zhǔn)確性以及算法的自動(dòng)化。除此之外,CFSFDP算法在劃分簇核心和簇光暈時(shí),會(huì)將一些處于簇邊緣的數(shù)據(jù)點(diǎn)劃分到簇光暈中,使得最終得到的聚類(lèi)結(jié)果的準(zhǔn)確性降低。本節(jié)針對(duì)CFSFDP算法上述兩個(gè)不足點(diǎn)提出了優(yōu)化方案,使得算法可以自動(dòng)選擇聚類(lèi)中心且對(duì)于簇核心與簇光暈的劃分更為合理,從而獲得更合理的聚類(lèi)效果。

      3.1 聚類(lèi)中心的自動(dòng)選擇

      通過(guò)對(duì)CFSFDP算法的介紹可知,CFSFDP算法有兩個(gè)基本立足點(diǎn):

      (1)聚類(lèi)中心的局部密度很大。

      (2)聚類(lèi)中心與其他局部密度更大的數(shù)據(jù)點(diǎn)之間的距離相對(duì)較大。

      根據(jù)這兩個(gè)基本立足點(diǎn)可知,聚類(lèi)中心的局部密度ρi和與局部密度比其高的數(shù)據(jù)點(diǎn)之間的距離δi這兩個(gè)值都是比較大的。鑒于此,本文提出的聚類(lèi)中心自動(dòng)選擇的策略為:使用標(biāo)準(zhǔn)化的局部密度ρi和相鄰距離δi的乘積來(lái)評(píng)測(cè)聚類(lèi)點(diǎn)之間的差異度,然后對(duì)于該乘積使用高斯分布進(jìn)行異常檢測(cè)的方法得出其中的異常點(diǎn),對(duì)于需要進(jìn)行聚類(lèi)的數(shù)據(jù)集而言,這些異常點(diǎn)即為聚類(lèi)中心。高斯分布是非常適合做異常檢測(cè)的一個(gè)模型,分布在兩端的小概率事件可認(rèn)為是異常點(diǎn),利用這一點(diǎn)可以得到數(shù)據(jù)集的聚類(lèi)中心。

      首先引入一個(gè)簇中心權(quán)值的概念,定義一個(gè)數(shù)據(jù)點(diǎn)的簇中心權(quán)值γi為:

      (4)

      (5)

      (6)

      接著對(duì)于每個(gè)γi,根據(jù)公式(7)分別計(jì)算它們各自的概率密度。

      (7)

      最后根據(jù)p(γi)與給定的一個(gè)閾值ε的關(guān)系來(lái)判斷數(shù)據(jù)點(diǎn)是否為異常點(diǎn)即聚類(lèi)中心,ε為一個(gè)較小的常數(shù),本文選取的閾值為0.005。對(duì)于交叉驗(yàn)證集可以嘗試多個(gè)ε,并基于該ε計(jì)算交叉驗(yàn)證集上的F1值,取最高者返回。F1的定義如下:

      (8)

      Figure 2 3-spiral dataset圖2 三螺旋數(shù)據(jù)集

      Figure 3 Clustering center obtained from anomaly detection圖3 異常檢測(cè)所得的聚類(lèi)中心圖

      算法1給出了聚類(lèi)過(guò)程中簇的聚類(lèi)中心自動(dòng)選擇的具體步驟。

      算法1聚類(lèi)中心自動(dòng)選擇策略

      步驟1將每個(gè)數(shù)據(jù)點(diǎn)的局部密度ρi和數(shù)據(jù)點(diǎn)間的距離δi標(biāo)準(zhǔn)化。

      步驟2求取每個(gè)點(diǎn)的簇中心權(quán)值γi。

      步驟4求取每個(gè)點(diǎn)的概率密度p(γi)。

      步驟5判斷p(γi)與閾值ε的大小關(guān)系,若滿足p(γi)<ε,則該數(shù)據(jù)點(diǎn)為簇中心,否則不是聚類(lèi)中心。

      3.2 簇核心與簇光暈的分割優(yōu)化

      χ(διj-dc),ci=cj

      (9)

      算法2給出了在得到初步的聚類(lèi)結(jié)果后,所得到的簇的簇核心與簇光暈分割的具體步驟。

      算法2簇核心與簇光暈分割策略

      步驟1確定簇的“邊界區(qū)域”。

      步驟2求取“邊界區(qū)域”內(nèi)每個(gè)數(shù)據(jù)點(diǎn)的簇內(nèi)局部密度。

      步驟3計(jì)算“邊界區(qū)域”的平均簇內(nèi)局部密度。

      Figure 4 Three types of classical datasets圖4 三種典型的數(shù)據(jù)集

      4 仿真實(shí)驗(yàn)

      為了表明本文所提算法的有效性,使用Matlab進(jìn)行數(shù)據(jù)仿真得到聚類(lèi)結(jié)果。選用三個(gè)具有代表性的數(shù)據(jù)集:數(shù)據(jù)集1來(lái)自文獻(xiàn)[13],是一組模擬的二維數(shù)據(jù)集,如圖4a所示,共有788個(gè)數(shù)據(jù)點(diǎn),該數(shù)據(jù)集的數(shù)據(jù)分布較為密集,各區(qū)域間的分隔較為明顯,一般該數(shù)據(jù)集根據(jù)數(shù)據(jù)點(diǎn)的聚集情況被劃分為7類(lèi);數(shù)據(jù)集2來(lái)自文獻(xiàn)[14],是一組由15個(gè)相似的二維高斯分布組成的模擬數(shù)據(jù)集,如圖4b所示,共有600個(gè)數(shù)據(jù)點(diǎn),該數(shù)據(jù)集中,四周的數(shù)據(jù)分布較為稀疏,中間部分的數(shù)據(jù)分布較為密集且各區(qū)域之間粘連較多,一般該數(shù)據(jù)集根據(jù)數(shù)據(jù)點(diǎn)的聚集情況被劃分為15類(lèi);數(shù)據(jù)集3是一組選自O(shè)livetti人臉數(shù)據(jù)集(Olivetti Face Database)中的部分圖像,圖中每一行為同一個(gè)人的不同表情的圖像,同一個(gè)人的不同圖像之間有細(xì)微的差別,是一組真實(shí)的數(shù)據(jù)集,如圖4c所示。

      圖5為使用原始CFSFDP算法對(duì)數(shù)據(jù)集1和數(shù)據(jù)集2進(jìn)行聚類(lèi)時(shí)得到的決策圖,圖中灰色的點(diǎn)為人工選擇得出的數(shù)據(jù)集的聚類(lèi)中心,點(diǎn)的個(gè)數(shù)即為數(shù)據(jù)集聚類(lèi)時(shí)類(lèi)的個(gè)數(shù),這些點(diǎn)是多次人工選擇聚類(lèi)中心進(jìn)行實(shí)驗(yàn)后選出的最為合理的聚類(lèi)中心點(diǎn)。圖6為使用本文所提出的異常檢測(cè)方法所得到的數(shù)據(jù)集中的聚類(lèi)中心,圖中灰色的點(diǎn)為算法自動(dòng)計(jì)算得出的聚類(lèi)中心。

      Figure 5 Decision graphs obtained by CFSFDP圖5 利用原始CFSFDP算法獲得的決策圖

      Figure 6 Clustering center obtained from improved CFSFDP anomaly detection圖6 改進(jìn)的CFSFDP算法異常檢測(cè)得到的聚類(lèi)中心圖

      Figure 7 Comparison of decision graph and anomaly detection of datasets 1圖7 數(shù)據(jù)集1決策圖法與異常檢測(cè)法實(shí)驗(yàn)結(jié)果對(duì)比

      Figure 8 Experimental result comparison between decision graph and anomaly detection of datasets 2圖8 數(shù)據(jù)集2決策圖法與異常檢測(cè)法實(shí)驗(yàn)結(jié)果對(duì)比

      圖7和圖8為對(duì)數(shù)據(jù)集1和數(shù)據(jù)集2使用CFSFDP決策圖方法得到的聚類(lèi)結(jié)果與使用改進(jìn)的CFSFDP算法的異常檢測(cè)方法得到的聚類(lèi)結(jié)果,圖中每種灰度代表一個(gè)簇,黑色的點(diǎn)則為各簇的簇光暈部分。圖7和圖8中使用異常檢測(cè)法得到的聚類(lèi)結(jié)果中,簇核心與簇光暈的劃分使用的是原始CFSFDP算法中簇核心與簇光暈的劃分方法。從圖7和圖8對(duì)比可以看出,使用改進(jìn)的常檢測(cè)方法得到的聚類(lèi)結(jié)果與使用原始決策圖法得到的聚類(lèi)結(jié)果完全相同,這表明使用改進(jìn)的CFSFDP算法得到的聚類(lèi)中心較為準(zhǔn)確,可以代替使用原始CFSFDP算法的決策圖法人工選擇聚類(lèi)中心,實(shí)現(xiàn)對(duì)CFSFDP算法的進(jìn)一步自動(dòng)化。

      在得到初步的聚類(lèi)結(jié)果后,對(duì)得到的簇進(jìn)行簇核心與簇光暈分割優(yōu)化后的實(shí)驗(yàn)結(jié)果如圖9所示,圖中黑色的點(diǎn)為分割后的簇的簇光暈部分。通過(guò)圖9a與圖7a的對(duì)比以及圖9b與圖8a的對(duì)比可以看出,使用本文提出的簇核心與簇光暈優(yōu)化分割方法得到的實(shí)驗(yàn)結(jié)果,將簇的邊緣部分本屬于簇核心部分的數(shù)據(jù)點(diǎn)劃入簇光暈中的幾率變小,只有簇之間粘連部分的數(shù)據(jù)點(diǎn)以及數(shù)據(jù)集中的離散點(diǎn)被劃入了簇光暈中,得到的最終實(shí)驗(yàn)結(jié)果與CFSFDP算法得到的實(shí)驗(yàn)結(jié)果相比更為合理。

      Figure 9 Division optimization results of cluster core and cluster halo圖9 簇核心與簇光暈分割優(yōu)化實(shí)驗(yàn)結(jié)果圖

      圖10為對(duì)數(shù)據(jù)集3的Olivetti人臉數(shù)據(jù)集聚類(lèi)后的結(jié)果,圖10a為使用CFSFDP算法得到的聚類(lèi)結(jié)果,圖10b為使用本文改進(jìn)的CFSFDP算法得到的聚類(lèi)結(jié)果。圖10中的人臉小圖的右上角使用圓點(diǎn)標(biāo)記的為算法所選擇的聚類(lèi)中心,人臉小圖左下角的每種小圖標(biāo)代表一個(gè)簇,左下角未被小圖標(biāo)標(biāo)記的人臉小圖則不屬于任何一個(gè)簇。從實(shí)驗(yàn)結(jié)果可以看出,本文改進(jìn)的CFSFDP算法自動(dòng)選取的聚類(lèi)中心與原始CFSFDP算法人工選取的聚類(lèi)中心相同,從聚類(lèi)的結(jié)果來(lái)看本文改進(jìn)的方法略優(yōu)于原始的CFSFDP算法。

      Figure 10 Clustering result comparison between CFSFDP and the optimized CFSFDP 圖10 原始CFSFDP算法與本文改進(jìn)的CFSFDP算法對(duì)Olivetti人臉數(shù)據(jù)集進(jìn)行聚類(lèi)的實(shí)驗(yàn)結(jié)果圖

      從上述對(duì)比實(shí)驗(yàn)可以看出,本文提出的方法可以有效地提高CFSFDP算法的自動(dòng)化程度,且聚類(lèi)效果更準(zhǔn)確有效。

      5 結(jié)束語(yǔ)

      本文提出的算法是對(duì)CFSFDP算法的兩點(diǎn)不足進(jìn)行的優(yōu)化改進(jìn)。針對(duì)CFSFDP算法需要在決策圖中人工選擇聚類(lèi)中心,導(dǎo)致算法的準(zhǔn)確性和自動(dòng)化受到影響,本文采用改進(jìn)的CFSFDP算法的異常檢測(cè)方法自動(dòng)計(jì)算出聚類(lèi)中心,針對(duì)CFSFDP算法最后進(jìn)行簇核心與簇光暈分割時(shí)會(huì)將簇的邊緣數(shù)據(jù)點(diǎn)劃入簇光暈中,影響實(shí)驗(yàn)結(jié)果,本文通過(guò)引入簇內(nèi)局部密度,根據(jù)簇內(nèi)數(shù)據(jù)點(diǎn)的局部密度與簇內(nèi)局部密度的平均值的關(guān)系劃分簇核心和簇光暈。仿真實(shí)驗(yàn)對(duì)比結(jié)果表明,本文提出的算法是有效可行的,其實(shí)驗(yàn)結(jié)果比原始CFSFDP算法的實(shí)驗(yàn)結(jié)果更為準(zhǔn)確合理。

      猜你喜歡
      光暈聚類(lèi)局部
      盧美涵:夕陽(yáng)
      局部分解 巧妙求值
      非局部AB-NLS方程的雙線性B?cklund和Darboux變換與非線性波
      基于DBSACN聚類(lèi)算法的XML文檔聚類(lèi)
      局部遮光器
      吳觀真漆畫(huà)作品選
      基于改進(jìn)的遺傳算法的模糊聚類(lèi)算法
      微軟大作《光暈》首現(xiàn)iOS射擊視角變了
      一種層次初始的聚類(lèi)個(gè)數(shù)自適應(yīng)的聚類(lèi)方法研究
      自適應(yīng)確定K-means算法的聚類(lèi)數(shù):以遙感圖像聚類(lèi)為例
      诸暨市| 淮安市| 阿图什市| 进贤县| 博爱县| 威信县| 平陆县| 碌曲县| 文成县| 潼南县| 阜平县| 泰和县| 定边县| 张北县| 连城县| 达孜县| 昔阳县| 郎溪县| 景泰县| 新巴尔虎左旗| 棋牌| 荃湾区| 迁安市| 鄱阳县| 嘉兴市| 柏乡县| 江达县| 大理市| 成安县| 普兰县| 安阳县| 青神县| 德钦县| 诸暨市| 江华| 榕江县| 长沙县| 全椒县| 大兴区| 大英县| 泰兴市|