熊建勝 孫洋洋 鄭 圣 尤 耀 季成健
中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司江蘇省分公司
近年來,移動通信網(wǎng)絡(luò)快速發(fā)展,多制式網(wǎng)絡(luò)共存,各類新業(yè)務(wù)不斷涌現(xiàn),設(shè)備連接海量化,移動數(shù)據(jù)流量爆發(fā)式增長,隨之而來的是基站數(shù)量和能耗的快速增長,節(jié)能降耗、提升網(wǎng)絡(luò)能效已經(jīng)成為通信網(wǎng)絡(luò)發(fā)展的必然要求。
傳統(tǒng)基站節(jié)能方案主要基于人工經(jīng)驗,確定各關(guān)鍵指標(biāo)閾值及節(jié)能時段,低于閾值時啟動節(jié)能,或者基于歷史業(yè)務(wù)數(shù)據(jù)的統(tǒng)計分析,得到每天業(yè)務(wù)的閑時和忙時時段,再對閑時時段(如00:00-06:00)進(jìn)行節(jié)能操作。面對通信網(wǎng)絡(luò)復(fù)雜化、業(yè)務(wù)場景多樣化的發(fā)展趨勢,難以在保障用戶業(yè)務(wù)性能、不引起用戶投訴的前提下實現(xiàn)最大化節(jié)能,而人工智能技術(shù)(AI)在通信領(lǐng)域的應(yīng)用為這個問題帶來了新的解決方案。
目前已有不少學(xué)者提出基于AI的節(jié)能方案,很多方案采用時間序列預(yù)測的方法,基于歷史數(shù)據(jù)預(yù)測關(guān)鍵業(yè)務(wù)指標(biāo)在未來一段時間的走勢,并與設(shè)置好的閾值對比,當(dāng)關(guān)鍵指標(biāo)低于閾值時,則對小區(qū)進(jìn)行相關(guān)的節(jié)能操作;另外也有方案是基于智能場景識別,利用AI聚類算法識別出話務(wù)流量潮汐現(xiàn)象明顯的場景,對其實施節(jié)能操作。
上述AI算法方案均沒有綜合利用多個業(yè)務(wù)指標(biāo),本文引入基站小區(qū)價值度的概念,利用多個關(guān)鍵業(yè)務(wù)指標(biāo)對每個基站小區(qū)每小時的價值度進(jìn)行綜合評估預(yù)測,使得基站能夠在節(jié)能的同時,實現(xiàn)重點用戶的差異化保障。本文利用多個機器學(xué)習(xí)算法模型融合的算法方案對現(xiàn)網(wǎng)大量數(shù)據(jù)進(jìn)行分析,建立業(yè)務(wù)模型,實現(xiàn)參數(shù)訓(xùn)練及業(yè)務(wù)預(yù)測?;趦r值度預(yù)測結(jié)果,識別未來一段時間內(nèi)基站小區(qū)業(yè)務(wù)負(fù)載低、用戶數(shù)少的低價值時段,為節(jié)能策略提供更科學(xué)的支持。
為更好的評估基站小區(qū)是否可節(jié)能,引入基站小區(qū)價值度的概念,多角度考慮多個關(guān)鍵指標(biāo),摒棄以往節(jié)能中只考慮單個指標(biāo)的情況。共選擇6個關(guān)鍵指標(biāo)用于計算小區(qū)價值度,包括上下行流量、上下行PRB利用率四個網(wǎng)絡(luò)業(yè)務(wù)指標(biāo),以及VIP用戶數(shù)、4/5G用戶數(shù)兩個用戶指標(biāo)。用戶指標(biāo)根據(jù)網(wǎng)絡(luò)類型進(jìn)行調(diào)整。下面以4G網(wǎng)絡(luò)為例進(jìn)行說明。
對國內(nèi)某省會城市一個月內(nèi)所有基站的逐小時數(shù)據(jù)進(jìn)行統(tǒng)計分析,并去除缺失值、異常值等,數(shù)據(jù)量超過三百萬。
關(guān)鍵指標(biāo)有6個,分別為上行流量、下行流量、上行PRB利用率、下行PRB利用率、4G用戶數(shù)、VIP用戶數(shù)。根據(jù)統(tǒng)計分析可知,各個關(guān)鍵指標(biāo)的數(shù)據(jù)分布均近似于指數(shù)分布,故可以用指數(shù)分布對各個關(guān)鍵指標(biāo)進(jìn)行擬合,得到每個指標(biāo)的指數(shù)概率密度函數(shù)。
由概率密度函數(shù)積分可得到各個關(guān)鍵指標(biāo)的累積概率分布函數(shù),累積概率分布函數(shù)F(X)定義如下:其中,X是一個隨機變量,x是任意實數(shù)。表示隨機變量X取值小于等于x時的概率。
根據(jù)6個指標(biāo)的累積概率分布函數(shù),當(dāng)各個指標(biāo)的概率值小于0.2時,相應(yīng)指標(biāo)的取值均很小,基站小區(qū)基本處于空閑狀態(tài),業(yè)務(wù)負(fù)載低,用戶數(shù)很少,可認(rèn)為該狀態(tài)下的小區(qū)為低價值小區(qū)。
由此引出本文中小區(qū)價值度的定義:6個關(guān)鍵指標(biāo)的累積概率分布函數(shù)值的加權(quán)平均值。實際應(yīng)用中計算基站小區(qū)價值度時,根據(jù)大量歷史數(shù)據(jù)擬合得到的指數(shù)分布函數(shù),將當(dāng)前小區(qū)各關(guān)鍵指標(biāo)數(shù)值代入函數(shù)中計算對應(yīng)的累積概率分布函數(shù)值,再取平均值,公式為:公式中,m為關(guān)鍵指標(biāo)個數(shù),F(xiàn)(x)為關(guān)鍵指標(biāo)取值為x時的累積概率分布函數(shù)值。
可以看到,小區(qū)價值度取值范圍為[0,1],當(dāng)小區(qū)價值度低于0.2時,認(rèn)為該小區(qū)為低價值小區(qū)。各個指標(biāo)的權(quán)重可根據(jù)需要進(jìn)行調(diào)整,如更關(guān)注小區(qū)的業(yè)務(wù)負(fù)載,只有當(dāng)業(yè)務(wù)負(fù)載很低時才認(rèn)為是低價值小區(qū),則可增大價值度中網(wǎng)絡(luò)業(yè)務(wù)指標(biāo)的權(quán)重。
為了實現(xiàn)基站小區(qū)精準(zhǔn)節(jié)能,設(shè)計了基于機器學(xué)習(xí)的基站小區(qū)節(jié)能算法方案,如圖1所示。
圖1 算法方案流程
步驟一:采集基站小區(qū)的性能數(shù)據(jù)、話單數(shù)據(jù)、小區(qū)感知數(shù)據(jù)、MR數(shù)據(jù)等,并進(jìn)行解析入庫;
步驟二:對采集的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、特征構(gòu)建、特征選擇等操作,使其滿足機器學(xué)習(xí)算法訓(xùn)練和預(yù)測的要求;
步驟三:基于處理后的歷史數(shù)據(jù)計算基站小區(qū)價值度,作為場景聚類和時序模型的輸入;
步驟四:基于30天的基站小區(qū)歷史價值度數(shù)據(jù),利用時間序列模型對未來一段時間內(nèi)的基站小區(qū)價值度進(jìn)行預(yù)測;
步驟五:基于基站小區(qū)歷史價值度數(shù)據(jù),采用時間序列形狀聚類k-shape算法進(jìn)行聚類,識別相似場景,并基于場景聚類結(jié)果進(jìn)一步分場景訓(xùn)練分類模型進(jìn)行小區(qū)價值度預(yù)測,以提升分類模型準(zhǔn)確率;
步驟六:將分類模型和時序模型結(jié)果進(jìn)行融合,對基站小區(qū)每一時次價值度預(yù)測結(jié)果取兩者最大值,以提升基站小區(qū)價值度預(yù)測查準(zhǔn)率;
步驟七:模型融合結(jié)果經(jīng)過策略過濾后,生成可節(jié)能的基站小區(qū)清單;
步驟八:對基站小區(qū)節(jié)能效果進(jìn)行監(jiān)控,包括投訴、感知以及用戶相關(guān)反饋信息,以輔助優(yōu)化模型,調(diào)整模型參數(shù)、低價值小區(qū)閾值等,實現(xiàn)整個算法方案的閉環(huán)。
2.2.1 數(shù)據(jù)準(zhǔn)備
從Hadoop平臺上定時獲取模型所需數(shù)據(jù),包括設(shè)備層、網(wǎng)絡(luò)層、業(yè)務(wù)層、用戶感知四類數(shù)據(jù),如表1所示。
表1 模型數(shù)據(jù)說明
類型 字段 獲取頻次業(yè)務(wù)層 上下行流量、4G用戶數(shù)、5G用戶數(shù)、VIP用戶數(shù)等 每小時用戶感知 上下行TCP建立成功率、RRC掉線率、上下行RTT總時延等 每小時
2.2.2 數(shù)據(jù)處理
涉及多模型,對于不同的模型采用不同的數(shù)據(jù)處理方法。
聚類模型基于時間序列進(jìn)行形狀聚類,故聚類模型與時間序列模型數(shù)據(jù)處理方法一致。
時間序列模型基于一個月的基站小區(qū)歷史價值度數(shù)據(jù)進(jìn)行預(yù)測。對大量基站小區(qū)歷史價值度數(shù)據(jù)進(jìn)行統(tǒng)計分析表明,該時間序列數(shù)據(jù)具有明顯的周期性,因此數(shù)據(jù)處理主要針對異常值去除和缺失值填充,以提升時間序列模型擬合效果。異常值去除采用箱線圖法,當(dāng)某一數(shù)值超過下四分位值減去1.5倍四分位距,或者上四分位值加上1.5倍四分位距時,即認(rèn)為該數(shù)值為異常值,予以去除。時間序列模型要求時間序列中不能存在缺失值,故需對去除的異常值及原始存在的缺失值進(jìn)行填充,由于該時間序列存在明顯周期性,故首先利用歷史數(shù)據(jù)一周內(nèi)同一時次的平均值進(jìn)行缺失值填充,然后利用雙線性插值算法進(jìn)行第二次缺失值填充,保證數(shù)據(jù)的完整性。
圖2為商業(yè)中心某小區(qū)的5天價值度時序圖示例,時序存在明顯的周期性,凌晨價值度低,上午11點和下午15點前后價值度高。
圖2 商業(yè)中心小區(qū)價值度時序
分類模型中數(shù)據(jù)處理主要包括數(shù)據(jù)標(biāo)注、特征選擇及特征構(gòu)造。
利用方差法、相關(guān)系數(shù)、假設(shè)檢驗等方法篩選模型特征,共篩選出以下幾類特征:(1)價值度相關(guān)特征,包括過去24、48、72小時的各個關(guān)鍵指標(biāo)數(shù)值;(2)時間特征,包括小時、天、節(jié)假日等;(3)統(tǒng)計特征,如根據(jù)基站小區(qū)ID、小時、節(jié)假日進(jìn)行分組后,對標(biāo)簽求均值作為特征;(4)基站小區(qū)屬性特征,包括小區(qū)ID、小區(qū)所屬城市、地區(qū)等。
對特征數(shù)據(jù)進(jìn)行缺失值處理后,將其劃分為訓(xùn)練集和測試集。
2.2.3 數(shù)據(jù)建模
時間序列模型采用三次指數(shù)平滑算法(Holt-Winters)和統(tǒng)計分析相結(jié)合的方案。
三次指數(shù)平滑算法可以預(yù)測有趨勢且有周期性的時間序列,由于基站小區(qū)價值度周期性變化明顯,故利用Holt-Winters模型預(yù)測時,引入歷史數(shù)據(jù)的影響,對一個月的歷史數(shù)據(jù)根據(jù)一周內(nèi)同一天同一小時分組后取均值,與模型預(yù)測結(jié)果進(jìn)行加權(quán),以減小單一的Holt-Winters模型的預(yù)測偏差,權(quán)重可根據(jù)實際數(shù)據(jù)進(jìn)行適當(dāng)調(diào)整。
為將基站小區(qū)根據(jù)不同的業(yè)務(wù)場景進(jìn)行區(qū)分,采用k-shape算法進(jìn)行聚類分析,依據(jù)時間序列數(shù)據(jù)的形狀相似性,將形狀相似的時間序列聚為一個類別,由此可得到多個業(yè)務(wù)場景。
為提高分類模型的準(zhǔn)確率,分類模型在聚類模型基礎(chǔ)上進(jìn)行訓(xùn)練,對于聚類出的場景,分別進(jìn)行分類模型的建模,分類模型均采用LightGBM算法,LightGBM算法相對于其他boosting算法,如GBDT和XGBoost算法,訓(xùn)練速度更快,且準(zhǔn)確率依然很好,對于大量的高維度基站小區(qū)數(shù)據(jù),采用LightGBM算法進(jìn)行處理能夠更好地適用于生產(chǎn)環(huán)境。
為將分類模型預(yù)測結(jié)果與時序模型預(yù)測結(jié)果融合,需要對分類模型預(yù)測結(jié)果進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換公式為:V=1–Pred,該式中,Pred為分類模型預(yù)測概率值,V為價值度預(yù)測值。當(dāng)預(yù)測概率值很大時,即有很大的概率該小區(qū)該時次為低價值,利用上述公式可以將概率轉(zhuǎn)換為價值度。若對價值度低于0.2的基站小區(qū)進(jìn)行節(jié)能,即可認(rèn)為是對分類模型結(jié)果中有80%的概率為低價值的小區(qū)進(jìn)行節(jié)能,此種轉(zhuǎn)換可以保證節(jié)能的準(zhǔn)確性。
為進(jìn)一步提升節(jié)能算法的準(zhǔn)確性,對時間序列模型和分類模型的價值度預(yù)測結(jié)果進(jìn)行融合,對基站小區(qū)每一時次價值度預(yù)測結(jié)果取兩者最大值,將其作為最終的模型預(yù)測結(jié)果。
完整的數(shù)據(jù)建模流程如下:
2.2.4 模型驗證
基于全量樣本集劃分出的五百萬數(shù)據(jù)量測試集,對模型效果進(jìn)行驗證,模型AUC值為0.96。為在實際應(yīng)用中測試模型準(zhǔn)確性,2021年春節(jié)期間對江蘇全省價值度預(yù)測結(jié)果進(jìn)行效果評估表明,模型查準(zhǔn)率95%以上,對分類錯誤的樣本進(jìn)行分析表明,絕大部分樣本的價值度均較低,與正負(fù)樣本劃分的價值度閾值0.2相近,由此可保證節(jié)能的效果。
2020年江蘇省試點節(jié)能期間,對南京和蘇州基站小區(qū)節(jié)能前后兩個月的投訴工單數(shù)據(jù)進(jìn)行分析,結(jié)果表明,節(jié)能前10月份投訴總量為2637,節(jié)能后11月份投訴總量為2383,未發(fā)現(xiàn)由于節(jié)能引起投訴總量的明顯變化。因節(jié)能時段為0-6點,根據(jù)投訴手機號查找其晚常駐基站小區(qū),并與參與節(jié)能的基站小區(qū)進(jìn)行比對,結(jié)果表明,未發(fā)現(xiàn)由于基站小區(qū)節(jié)能引起的投訴。
上述節(jié)能算法方案在江蘇全省4G基站小區(qū)進(jìn)行了推廣應(yīng)用,節(jié)能策略較保守,根據(jù)業(yè)務(wù)部門需求,從算法提供的低價值基站小區(qū)清單中篩選部分參與節(jié)能的小區(qū),將節(jié)能時段限制為凌晨0點至6點,在保證用戶感知和鄰區(qū)覆蓋的情況下,對一個月的節(jié)能小區(qū)數(shù)據(jù)進(jìn)行統(tǒng)計表明,AI算法日均可節(jié)省電量超過1萬度,涉及節(jié)能的小區(qū)近4萬個,持續(xù)應(yīng)用,預(yù)計年度省電超過400萬度。
基于AI技術(shù),引入基站小區(qū)價值度概念,提出利用時間序列和分類算法相結(jié)合預(yù)測小區(qū)價值度的方案,基于價值度預(yù)測結(jié)果可進(jìn)行相關(guān)節(jié)能操作。小區(qū)價值度的引入使得節(jié)能時可綜合考慮各個關(guān)鍵指標(biāo)的作用,此外,也使得我們可以利用基站歷史數(shù)據(jù)對小區(qū)以及整個基站的價值度進(jìn)行分析,對于高價值的基站,可以提供更好的保障服務(wù)。