盛莉莉 谷俊江
中國(guó)聯(lián)合網(wǎng)絡(luò)通信有限公司江蘇省分公司
隨著移動(dòng)互聯(lián)網(wǎng)業(yè)務(wù)的普及,人們對(duì)無(wú)線移動(dòng)網(wǎng)絡(luò)質(zhì)量的要求越來(lái)越高。尤其是視頻、游戲業(yè)務(wù)的發(fā)展使得用戶對(duì)于數(shù)據(jù)業(yè)務(wù)的流量要求越來(lái)越高。無(wú)線小區(qū)的業(yè)務(wù)流量也成為網(wǎng)絡(luò)后期規(guī)劃擴(kuò)容的依據(jù)。但是從KPI指標(biāo)體現(xiàn)的業(yè)務(wù)流量是否反映了該小區(qū)下用戶的實(shí)際流量需求?最常見(jiàn)的,容量的瓶頸會(huì)導(dǎo)致用戶的實(shí)際業(yè)務(wù)需求無(wú)法滿足,同樣,由于干擾,覆蓋等問(wèn)題也會(huì)導(dǎo)致用戶在使用業(yè)務(wù)時(shí)由于速率過(guò)低放棄繼續(xù)使用數(shù)據(jù)業(yè)務(wù)的情況。這就是用戶的實(shí)際流量需求被壓抑的情況。因此,現(xiàn)網(wǎng)中由于各種因素的干擾,KPI指標(biāo)所反映的業(yè)務(wù)流量和實(shí)際用戶需求流量是存在差異的。如果用現(xiàn)網(wǎng)的指標(biāo)作為流量預(yù)測(cè)的根據(jù),將會(huì)導(dǎo)致預(yù)測(cè)不準(zhǔn),使得網(wǎng)絡(luò)規(guī)劃跟不上用戶需求的發(fā)展,最終導(dǎo)致用戶感知和滿意度的下降,因此,需要有手段對(duì)網(wǎng)絡(luò)中的流量壓抑進(jìn)行識(shí)別,并將還原后的流量指標(biāo)作為網(wǎng)絡(luò)擴(kuò)容規(guī)劃的依據(jù)。同時(shí)也需要對(duì)流量受壓抑的根因進(jìn)行判斷,以便做出快速有效的調(diào)整措施,及時(shí)改善用戶感知。
本方案通過(guò)標(biāo)桿小區(qū)的確定,找到指標(biāo)正常、感知正常、不存在流量壓抑情況的小區(qū),探索其流量和指標(biāo)之間的特性并建立模型,將其他小區(qū)的指標(biāo)輸入模型之后判斷是否存在流量壓抑,整個(gè)流程分為分類、擬合、異常識(shí)別、壓抑預(yù)估、根因判斷5個(gè)步驟,實(shí)現(xiàn)方法如圖1所示:
圖1 流量壓抑識(shí)別流程
PRB(PHYSICAL RESOURCEBLOCK)利用率是反映無(wú)線網(wǎng)業(yè)務(wù)量最為直觀的指標(biāo),正常情況下該指標(biāo)會(huì)隨著用戶數(shù)和業(yè)務(wù)量的增加而增加。因此,小區(qū)的PRB利用率和小區(qū)的流量一定存在直接的關(guān)系,但是由于實(shí)際網(wǎng)絡(luò)環(huán)境的復(fù)雜性、用戶行為的差異以及無(wú)線環(huán)境的差異,兩者之間的關(guān)系也一定存在差異,比如,在存在干擾的情況下會(huì)存在PRB利用率虛高的情況,少量的小包業(yè)務(wù)也會(huì)影響PRB的調(diào)度。因此,需要通過(guò)多個(gè)維度對(duì)小區(qū)進(jìn)行分類,以確定不同類型下標(biāo)桿小區(qū)的PRB利用率和流量之間的不同關(guān)系。分類的維度可以包括:社會(huì)場(chǎng)景、業(yè)務(wù)類型、用戶規(guī)模、無(wú)線環(huán)境、頻段特征等。利用以上維度作為特征值,采用k-means聚類算法,可以獲得無(wú)線小區(qū)的分類。
分類完成之后首先進(jìn)行標(biāo)桿小區(qū)的確定,標(biāo)桿小區(qū)即不存在容量瓶頸的小區(qū)。
擬合,是為了獲得PRB利用率和流量之間的關(guān)系。對(duì)于每一類標(biāo)桿小區(qū)的數(shù)據(jù)集,計(jì)算該場(chǎng)景下PRB利用率和流量之間的關(guān)系模型即流量預(yù)估模型,為增加魯棒性,此處采用線性模型。
任何原因的流量壓抑均會(huì)導(dǎo)致用戶的感知惡化,但是由于KQI指標(biāo)比較主觀,相應(yīng)的指標(biāo)需要從信令中匯總計(jì)算獲得,處理復(fù)雜度較大。并且KQI性能惡化不一定是單個(gè)因素造成,可能是多個(gè)因素組合導(dǎo)致。因此,本文首先對(duì)通過(guò)FPGrowth算法學(xué)習(xí)無(wú)線性能指標(biāo)惡化與用戶感知異常事件的關(guān)系,并形成網(wǎng)優(yōu)性能指標(biāo)與感知異常的關(guān)聯(lián)規(guī)則庫(kù)(KK關(guān)聯(lián)規(guī)則庫(kù)),并通過(guò)設(shè)置置信度門限甄別出感知異常小區(qū)。
(1)輸入正負(fù)樣本
正樣本包括正常小區(qū)及其無(wú)線性能指標(biāo),負(fù)樣本包括異常小區(qū)及其無(wú)線性能指標(biāo)。正負(fù)樣本提取需要部署用戶級(jí)定界組件,針對(duì)定界后的結(jié)果進(jìn)行規(guī)則學(xué)習(xí)。
(2)獲得關(guān)聯(lián)規(guī)則
通過(guò)FPGrowth算法,學(xué)習(xí)無(wú)線性能指標(biāo)與感知的關(guān)系規(guī)則庫(kù),即當(dāng)小區(qū)哪些無(wú)線性能指標(biāo)惡化時(shí)會(huì)導(dǎo)致感知惡化以及該規(guī)則在過(guò)往歷史中的置信度。
數(shù)據(jù)處理:對(duì)數(shù)據(jù)進(jìn)行一致性檢查、缺失值的處理、數(shù)據(jù)關(guān)聯(lián)、異常值處理等;
機(jī)器學(xué)習(xí):對(duì)數(shù)據(jù)進(jìn)行數(shù)值離散化處理、規(guī)則挖掘并進(jìn)行模型檢驗(yàn)及優(yōu)化;
建立規(guī)則文檔:將挖掘出來(lái)的規(guī)則生成文檔。即哪些因素會(huì)導(dǎo)致該KQI差,并包含其對(duì)應(yīng)的置信度(即該組合導(dǎo)致KQI劣化的概率)。
(3)感知異常小區(qū)識(shí)別
通過(guò)設(shè)置置信度門限,有效甄別出由于無(wú)線原因?qū)е碌母兄惓P^(qū)。
對(duì)于前面獲取的感知異常小區(qū)再根據(jù)擬合步驟中得到小區(qū)的流量預(yù)估模型計(jì)算得到理論的流量值。流量理論值減去實(shí)際值的差即為流量壓抑預(yù)估值,當(dāng)流量壓抑預(yù)估值大于設(shè)定的門限時(shí),認(rèn)為該小區(qū)存在流量壓抑的情況。具體步驟如下:
(1)匹配分組:按找對(duì)應(yīng)的場(chǎng)景、頻段、業(yè)務(wù)類型,人數(shù)規(guī)模等維度匹配對(duì)應(yīng)分組,并獲得相應(yīng)的線性回歸標(biāo)桿函數(shù)f(x);
(2)估算小區(qū)應(yīng)有流量:將目標(biāo)小區(qū)的用戶平均數(shù)據(jù)代入其對(duì)應(yīng)分組的線性回歸標(biāo)桿函數(shù)f(x),估算小區(qū)應(yīng)有的總流量。(當(dāng)估算PRB利用率小于當(dāng)前利用率時(shí),按照當(dāng)前利用率計(jì)算);
(3)計(jì)算小區(qū)壓抑流量:小區(qū)應(yīng)有流量減去其現(xiàn)有流量得出受壓抑流量,即受壓抑流量= f(x)–目標(biāo)小區(qū)當(dāng)前流量(當(dāng)數(shù)值小于零時(shí),填為零);
(4)與設(shè)定門限值對(duì)比,判定是否存在流量壓抑。
流量壓抑識(shí)別后,需要對(duì)造成流量壓抑的無(wú)線側(cè)根因進(jìn)行定位。本方案采用根因矩陣識(shí)別算法進(jìn)行根因識(shí)別。本方案對(duì)覆蓋、質(zhì)量、容量、切換、干擾指標(biāo)進(jìn)行分級(jí),根據(jù)設(shè)定絕對(duì)門限和質(zhì)差門限,分為指標(biāo)良好,指標(biāo)較差、指標(biāo)差按三個(gè)等級(jí)。
STEP 1:覆蓋、質(zhì)量根因識(shí)別
如表1所示。覆蓋差定義為RSRP>-105的采樣點(diǎn)比例滿足絕對(duì)門限。
表1 覆蓋問(wèn)題判斷示意圖
覆蓋較差定位為RSRP>-105的采樣點(diǎn)比例滿足質(zhì)差門限。
覆蓋好定義為RSRP>-105的采樣點(diǎn)比例不滿足絕對(duì)門限,也不滿足質(zhì)差門限。
質(zhì)量差定義為CQI≥7的比例滿足絕對(duì)門限。
質(zhì)量較差定義為CQI≥7的比例滿足質(zhì)差門限。
質(zhì)量好定義為CQI≥7的比例不滿足絕對(duì)門限,也不滿足質(zhì)差門限。
STEP 2:干擾根因識(shí)別
如表2所示?;跓o(wú)線、質(zhì)量根因識(shí)別的結(jié)果,再結(jié)合干擾的情況進(jìn)行根因識(shí)別。干擾嚴(yán)重定義為干擾噪聲平均值滿足絕對(duì)門限。
有干擾較差定義為干擾噪聲平均值滿足質(zhì)差門限。
無(wú)干擾定義為干擾噪聲平均值低于質(zhì)差門限。
表2 干擾問(wèn)題判斷示意圖
STEP 3:切換根因識(shí)別
切換差定義為切換相關(guān)指標(biāo)中有一項(xiàng)滿足絕對(duì)門限。
切換較差高定義為切換相關(guān)指標(biāo)均不滿足絕對(duì)門限,但有一項(xiàng)切換指標(biāo)滿足質(zhì)差門限。
切換好定義為切換相關(guān)指標(biāo)中沒(méi)有一項(xiàng)滿足絕對(duì)門限,同時(shí)也沒(méi)有一項(xiàng)滿足質(zhì)差門限。
STEP 4:容量根因識(shí)別
如表3所示。負(fù)荷很高定義為容量相關(guān)指標(biāo)中有一項(xiàng)滿足絕對(duì)門限。
表3 質(zhì)差門限、絕對(duì)門限定義
負(fù)荷較高定義為容量相關(guān)指標(biāo)均不滿足絕對(duì)門限,但有一項(xiàng)容量滿足質(zhì)差門限。
負(fù)荷正常定義為容量相關(guān)指標(biāo)中沒(méi)有一項(xiàng)滿足絕對(duì)門限,同時(shí)也沒(méi)有一項(xiàng)滿足質(zhì)差門限。
根因類別 質(zhì)差門限 絕對(duì)門限175 ≥250最大RRC連接用戶數(shù) 容量31(800M) ≥90干擾噪聲平均值 干擾 ≤-95dBm ≤-90dBm X2接口切換成功率 切換 98% 95%eNodeB內(nèi)切換成功率 切換 98% 95%
本文涉及的功能已經(jīng)在江蘇聯(lián)通上線并應(yīng)用。從數(shù)據(jù)評(píng)估上看,蘇州流量壓抑較為嚴(yán)重,且根因分析判斷大部分為覆蓋引起,這與現(xiàn)網(wǎng)實(shí)際情況比較一致?,F(xiàn)網(wǎng)對(duì)于干擾引起的流量壓抑問(wèn)題進(jìn)行了整改,效果較為明顯。圖2是針對(duì)蘇州的流量壓抑小區(qū)SZ_KS_HW_仕泰隆拉遠(yuǎn)電信雞鳴塘_FL_B_1的分析處理結(jié)果,根據(jù)根因判斷,該小區(qū)由于干擾問(wèn)題導(dǎo)致流量壓抑,從表4的KPI指標(biāo)中可以明顯看出該小區(qū)存在干擾。圖3顯示,采取優(yōu)化措施解決干擾問(wèn)題后,日均流量顯著提升。
圖2 系統(tǒng)分析界面
表4 受壓抑小區(qū)指標(biāo)
經(jīng)實(shí)際驗(yàn)證,基于機(jī)器學(xué)習(xí)算法和KQI/KPI指標(biāo)關(guān)聯(lián)可以有效識(shí)別網(wǎng)絡(luò)中的流量壓抑情況,對(duì)于識(shí)別網(wǎng)絡(luò)中的偽低負(fù)荷小區(qū),還原用戶實(shí)際流量需求,激發(fā)網(wǎng)絡(luò)流量,改善用戶感知有積極作用,也能為網(wǎng)絡(luò)擴(kuò)容和規(guī)劃發(fā)展提供更精準(zhǔn)的決策數(shù)據(jù)。
圖3 調(diào)整前后日均流量對(duì)比