• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于LTE小區(qū)評估的SOM和k-means算法比較

      2022-07-04 07:10:32王曉東
      微處理機 2022年3期
      關鍵詞:高維質(zhì)心聚類

      王曉東

      (陜西飛機工業(yè)責任有限公司,陜西 漢中,723200)

      1 引言

      無線移動網(wǎng)絡的大規(guī)模建設保證了網(wǎng)絡的覆蓋優(yōu)勢,也為未來的5G大規(guī)模商用鋪平了道路,但龐大的網(wǎng)絡規(guī)模進一步增加了網(wǎng)絡優(yōu)化的難度。移動接入網(wǎng)絡產(chǎn)生了大量運營、管理和維護數(shù)據(jù),在運營商基于基本網(wǎng)絡運營模式的情況下,如何組織、管理有限的無線網(wǎng)絡資源變得越發(fā)緊迫,是電信運營商不可回避的難題。智能網(wǎng)絡規(guī)劃工具的出現(xiàn)為解決這一問題給出了方案,它可以通過評估小區(qū)和用戶性能來實時調(diào)整無線資源的分配。為了解決此類問題,移動網(wǎng)絡運營商也越來越注重工具和流程的創(chuàng)新,這些工具和流程不僅能夠幫助工程師維護和優(yōu)化移動無線電網(wǎng)絡,也會使網(wǎng)絡更加自治。在這其中,機器學習近來已成為一項熱門技術,用于平衡問題計算的復雜性和準確性,引起數(shù)學優(yōu)化界的廣泛關注[1]。同樣的趨勢也在無線通信領域促使研究人員利用機器學習算法來解決無線網(wǎng)絡優(yōu)化的有限資源分配問題[2]。

      2 研究背景

      數(shù)據(jù)處理技術領域的最新發(fā)展為使用機器學習技術鋪平了道路,也為探索自動評估移動網(wǎng)絡性能的解決方案提供了動力[3]?;陉P鍵性能指標評估網(wǎng)絡性能的數(shù)據(jù)在無線移動網(wǎng)絡中被普遍使用。例如,文獻[4]提出了由支持向量機(SVM)、譜聚類和深度學習方法組成的檢測模型,通過檢測異常用戶來評估無線性能,結(jié)果表明譜聚類等傳統(tǒng)機器方法在異常檢測中的表現(xiàn)具有更好的性能。此項工作中使用的數(shù)據(jù)有明確的正負標簽,很容易計算每種算法的準確性。與此同時,在移動通信領域,Lavneet Singh等人[5]通過對電信用戶數(shù)據(jù)集的分類,比較了SOM、k-means和層次聚類算法,證明了SOM和kmeans在3G網(wǎng)絡中的性能優(yōu)于層次聚類算法。此研究的創(chuàng)新之處在于其任務是使用SOM和k-means算法來對蜂窩小區(qū)行為模式進行提取,分析LTE蜂窩小區(qū)的性能,同時對SOM和k-means集群結(jié)果的質(zhì)量進行有效評估。最后,Santos等人[6]進行了一項類似的研究,使用性能指標比較了三種聚類算法。研究表明,與使用k-means獲得的結(jié)果相比,使用高斯混合模型期望最大化和基于不同KPI的LTE小區(qū)聚類中的頻譜聚類所獲得的結(jié)果沒有顯著差異。該方法側(cè)重于比較三種傳統(tǒng)算法,但是其實驗數(shù)據(jù)集維度過低,不夠貼近現(xiàn)實生活中的實際情況。

      由于聚類算法的數(shù)據(jù)集取決于小區(qū)的樣本特征數(shù)目,本研究嘗試通過仿真模擬不同維度的小區(qū)數(shù)據(jù)的聚類來評估不同機器學習算法的優(yōu)劣。

      3 SOM和k-means聚類

      SOM是一種無監(jiān)督神經(jīng)網(wǎng)絡,其算法的工作原理是將n維輸入數(shù)據(jù)投影到某些表示上。通過降低數(shù)據(jù)維度,可以使用視覺聚類來獲得直觀的表示[7]。其結(jié)構(gòu)包括一個向量輸入層和一個競爭輸出層,允許通過競爭層來可視化輸出[8],使高維數(shù)據(jù)項目表示在低維空間中[9]。

      在網(wǎng)絡中,SOM是一個單一的神經(jīng)網(wǎng)絡,其N個節(jié)點呈網(wǎng)格分布,大多數(shù)分布模式是六邊形和矩形。SOM不同于其他人工神經(jīng)網(wǎng)絡,其采用的是競爭學習而不是錯誤校正學習,同時使用了鄰域函數(shù)來保持輸入空間的拓撲屬性。在SOM模型中,一個輸入節(jié)點與其他節(jié)點廣泛連接,相互激勵,其交互強度由連接權重決定。連接權重包括輸入層和競爭層神經(jīng)元之間的權重,以及競爭輸出層節(jié)點之間的權重。前者代表神經(jīng)元對外部輸入的反應,后者代表神經(jīng)元之間的相互作用。SOM可以根據(jù)外部刺激動態(tài)地改變其結(jié)構(gòu),從而形成合適的簇。SOM的拓撲結(jié)構(gòu)如圖1所示。

      圖1 SOM網(wǎng)絡拓撲圖

      k-means算法的基本思想是以每個簇子集中數(shù)據(jù)樣本的均值作為簇的代表點進行迭代。該過程將數(shù)據(jù)集劃分為不同類別,以便進行聚類評估。能量的準則函數(shù)可以達到最優(yōu),從而生成每個簇。簇與簇的間距是緊湊和獨立的[10]。在迭代過程中,不斷移動聚類集中的對象,直到獲得理想的聚類集,每個簇都用類似聚類過程獲得。使用k-means得到的聚類簇,簇中對象的相似度很高,不同簇對象之間的相異程度也很高[11]。

      “肘部”方法是通過擬合k的一系列值來幫助數(shù)據(jù)科學家選擇最佳聚類數(shù)。如果折線圖類似于手臂,則“肘部”(對應于曲線上的拐點)能很好地表明基礎模型在該點最適合。在可視化器中,“肘部”將用虛線注釋。在聚類分析中,肘部法是一種啟發(fā)式方法,用于確定數(shù)據(jù)集中的聚類數(shù)量。該方法包括將解釋的變化繪制為集群數(shù)量的函數(shù),并選擇曲線的肘部作為要使用的集群數(shù)量。

      圖2顯示了一個肘形圖,用于確定聚類的數(shù)量。X軸表示聚類的數(shù)量,Y軸表示聚類簇內(nèi)的質(zhì)心距離和簇間質(zhì)心距離的比率[12]。質(zhì)心內(nèi)聚類距離也稱為聚類內(nèi)距離,表示聚類內(nèi)樣本到聚類質(zhì)心的距離。相反,簇間距離是兩個不同簇的質(zhì)心之間的距離。這是兩個非常重要的無監(jiān)督學習聚類指標??捎^察得知,當k<4時,曲線迅速下降;當k>4時,曲線趨于波動,最終越來越穩(wěn)定。

      圖2 最佳聚類數(shù)擬合

      由此,認為拐點4是通過肘部法獲得的最佳k值。最終,初始聚類最優(yōu)數(shù)目設置為4,同時SOM模型的神經(jīng)元數(shù)目也設置為相同數(shù)值。

      4 結(jié)果分析

      4.1 不同樣本小區(qū)的低維聚類

      在此次仿真實驗中,首先通過使用不同小區(qū)數(shù)據(jù)作為輸入,其小區(qū)特征是低維度的。例如,CQI(信道質(zhì)量指標)是下行頻譜效率指標,它表示從終端測量的網(wǎng)絡質(zhì)量,即在某些無線電條件(干擾條件)下,一個終端的下行吞吐量的多少。因此,CQI可以準確地反映具體的無線電狀況[13]。下行鏈路吞吐量或下行鏈路網(wǎng)絡吞吐量是從通信信道到終端的成功消息傳遞率。吞吐量通常以每秒兆比特(Mb/s)為單位,有時以每秒數(shù)據(jù)包或每個時隙的數(shù)據(jù)包為單位。如此建模,便能夠探索在數(shù)據(jù)集特征值較低時小區(qū)特征提取分析的可行性。

      SOM和k-means定位質(zhì)心和簇內(nèi)距離(低維特征)實驗數(shù)據(jù)如表1所示。可見當兩種算法都聚類為4種不同簇時,SOM小區(qū)聚類的簇內(nèi)質(zhì)心距離比kmeans略微大些。例如,SOM中的集群#1、#2、#3和#4都大于相同的k-means集群。這四個簇之間的距離差距分別為0.12、0.14、0.02和0.17。與簇內(nèi)小區(qū)集群距離相比,兩種算法簇間距離非常接近。由于簇內(nèi)質(zhì)心距離越短聚類效果越好,可以得出k-means聚類簇內(nèi)的距離更近,聚類效果更好。

      表1 定位質(zhì)心和簇內(nèi)距離(低維特征)

      k-means聚類的小區(qū)模式描述實驗結(jié)果如表2所示。其中,簇#1和#4的距離幾乎相同,#2和#3也相似,意味著SOM的間距和低維k-means差異不大,即質(zhì)心間距越大,集群性能越好。因此,只能將聚類簇內(nèi)的距離作為評估標準。

      表2 k-means聚類的小區(qū)模式描述

      SOM和k-means聚類中心分布情況實驗結(jié)果如圖3所示。圖中可見SOM和k-means簇質(zhì)心在吞吐量和CQI特征內(nèi)的63個蜂窩小區(qū)樣本中的分布。在SOM聚類的簇#3中,質(zhì)心坐標與在k-means算法中的簇#4是相同的。

      圖3 聚類中心分布情況

      SOM聚類的小區(qū)模式描述實驗結(jié)果如表3所示。比較表2和表3便可發(fā)現(xiàn),k-means聚類簇#3和#4的簇特征類似于SOM聚類簇#3和#2,唯一區(qū)別在于簇#1和#4之間,例如k-means簇#2的特點是下行吞吐量最低。簇#2的CQI跨度很大,覆蓋從0.013到1的區(qū)間,其中包括在相似的下行鏈路吞吐量內(nèi)從低到高的CQI。但在SOM小區(qū)聚類中,簇#4的特征具有最低的CQI和下行鏈路吞吐量。因此可得出結(jié)論,SOM聚類中的簇#4與k-means中的簇#2相似,但k-means聚類的簇#2中樣本已經(jīng)包含了SOM聚類簇#4中的所有樣本。

      表3 SOM聚類的小區(qū)模式描述

      最終,k-means聚類的簇#1和SOM聚類的簇#1特征也不盡相同。對于SOM聚類的簇#1,它具有中等CQI和高下行吞吐量。同時,k-means的簇#1具有較高的CQI和中等的下行吞吐量,因此這兩個簇的特征非常接近。概括來講,對比兩種聚類結(jié)果可以發(fā)現(xiàn),在低維特征中,蜂窩小區(qū)模式聚類存在一定的差異,SOM和k-means的聚類結(jié)果大體上相似,但k-means的聚類結(jié)果更直觀。

      4.2 不同樣本小區(qū)的高維特征聚類

      與上述使用低維蜂窩小區(qū)特征數(shù)據(jù)不同,此處使用高維特征數(shù)據(jù)(即每個小區(qū)包含29個特征)來測試SOM和k-means的性能。

      k-means和SOM之間的距離比較實驗結(jié)果數(shù)據(jù)如表4所示。在第一階段,在k-means和SOM中,簇的平均距離與樣本的平均距離之間的總體差異并不明顯。例如,k-means和SOM中的簇#2和#3相似且更接近。唯一存在巨大差異的是簇#4,分別為0.93和0.53。k-means中不同簇質(zhì)心的平均距離小于SOM。

      表4 距離比較(高維特征)

      k-means的簇內(nèi)質(zhì)心樣本平均距離以及簇間質(zhì)心的平均距離是相似的,例如,簇#3中這兩個值分別是0.56和0.64,比較接近。由此可以得出結(jié)論:kmeans可以對高維數(shù)據(jù)進行聚類,但是聚類簇內(nèi)的樣本小區(qū)距離和聚類間距離非常接近。另一方面,SOM的簇質(zhì)內(nèi)和簇間距離上具有良好的性能。因此,對于高維數(shù)據(jù)集,k-means的聚類效果不盡如人意,較少被研究人員選用。

      對高維特征樣本小區(qū)k-means和SOM聚類結(jié)果對比情況如表5所示。表中顯示出SOM和kmeans的聚類簇中所包含的小區(qū)數(shù)目。小區(qū)樣本在SOM拓撲下的分布情況如圖4所示。通過對比可發(fā)現(xiàn)此兩種方法在簇#1和#2中的小區(qū)數(shù)相似,分別為12、23和11、21。SOM和k-means之間的小區(qū)數(shù)量之間的唯一區(qū)別是簇#3和#4。

      表5 高維特征樣本小區(qū)聚類結(jié)果(小區(qū)數(shù)目)

      5 結(jié)束語

      使用聚類技術對真實LTE蜂窩小區(qū)的網(wǎng)絡性能進行評估,由于聚類算法的數(shù)據(jù)集取決于小區(qū)的樣本特征數(shù)目,通過仿真模擬不同維度的小區(qū)數(shù)據(jù)的聚類來評估不同機器學習算法的優(yōu)劣。在低維數(shù)據(jù)聚類中,與使用SOM得到的結(jié)果相比,k-means小區(qū)聚類效果要優(yōu)于SOM。但是,與其他高維數(shù)據(jù)集聚類相比,LTE小區(qū)數(shù)據(jù)的KPI特征在高維特征空間中充當特征向量,使用SOM進行聚類的結(jié)果在小區(qū)聚類中獲得的性能更好,也意味著得到的小區(qū)分類更加精準。在網(wǎng)絡優(yōu)化中使用大數(shù)據(jù)分析和挖掘,能夠?qū)崿F(xiàn)在現(xiàn)有的高度可擴展的方法上進行網(wǎng)絡性能調(diào)整。通過聚類的方法高效地利用大數(shù)據(jù),幾乎能夠?qū)崟r地識別感興趣的區(qū)域,對減少蜂窩網(wǎng)絡運營商的運營支出,有重要的參考價值。

      猜你喜歡
      高維質(zhì)心聚類
      重型半掛汽車質(zhì)量與質(zhì)心位置估計
      基于GNSS測量的天宮二號質(zhì)心確定
      一種改進的GP-CLIQUE自適應高維子空間聚類算法
      測控技術(2018年4期)2018-11-25 09:46:48
      基于DBSACN聚類算法的XML文檔聚類
      電子測試(2017年15期)2017-12-18 07:19:27
      基于加權自學習散列的高維數(shù)據(jù)最近鄰查詢算法
      電信科學(2017年6期)2017-07-01 15:44:37
      基于改進的遺傳算法的模糊聚類算法
      一般非齊次非線性擴散方程的等價變換和高維不變子空間
      一種層次初始的聚類個數(shù)自適應的聚類方法研究
      高維Kramers系統(tǒng)離出點的分布問題
      一種海洋測高衛(wèi)星質(zhì)心在軌估計算法
      航天器工程(2014年5期)2014-03-11 16:35:53
      巴林左旗| 达拉特旗| 定州市| 军事| 阿鲁科尔沁旗| 西乌| 周至县| 惠安县| 万安县| 长白| 平山县| 安阳市| 富裕县| 诸城市| 邻水| 武功县| 扶余县| 保靖县| 蒙自县| 舟曲县| 泽州县| 越西县| 延寿县| 永丰县| 神农架林区| 甘德县| 芮城县| 蚌埠市| 遂川县| 蓝田县| 喀喇沁旗| 漯河市| 咸宁市| 南陵县| 新安县| 永安市| 临江市| 普陀区| 时尚| 墨竹工卡县| 绥滨县|