[劉洋 吳威 宋偉 林彬]
隨著大數(shù)據(jù)、云計(jì)算、智能化、平臺(tái)化的信息革命時(shí)代的到來(lái),傳統(tǒng)網(wǎng)優(yōu)行業(yè)有著難以承受的痛:風(fēng)險(xiǎn)大、效率低、效果不一?,F(xiàn)代通信行業(yè)的工作模式已經(jīng)逐漸向平臺(tái)化、系統(tǒng)化、自動(dòng)化和智能化的模式轉(zhuǎn)變。安全、高效、全面、智能是未來(lái)通信行業(yè)發(fā)展的方向。隨著4G 網(wǎng)絡(luò)用戶(hù)的增長(zhǎng)與網(wǎng)絡(luò)規(guī)模的擴(kuò)大和無(wú)線(xiàn)網(wǎng)絡(luò)傳播環(huán)境的日趨復(fù)雜,LTE 網(wǎng)絡(luò)優(yōu)化難度增加。本文引入人工智能相關(guān)算法,介紹人工智能在場(chǎng)景識(shí)別及智能優(yōu)化中的應(yīng)用。
隨著中國(guó)移動(dòng)從2G 到5G 不斷地演進(jìn)式的發(fā)展,目前所有的移動(dòng)業(yè)務(wù)都是通過(guò)無(wú)線(xiàn)網(wǎng)接入,想要保持良好的網(wǎng)絡(luò)質(zhì)量,就需要不斷對(duì)網(wǎng)絡(luò)進(jìn)行大量的優(yōu)化調(diào)整,同時(shí)無(wú)線(xiàn)網(wǎng)絡(luò)中業(yè)務(wù)場(chǎng)景實(shí)時(shí)變化,從眾多KPI 指標(biāo)中判斷業(yè)務(wù)類(lèi)形態(tài),工作量大、無(wú)法與話(huà)務(wù)模型實(shí)時(shí)匹配,優(yōu)化調(diào)整策略?xún)H通過(guò)工程師個(gè)體經(jīng)驗(yàn)難以保證質(zhì)量。通過(guò)智能算法引入,實(shí)現(xiàn)兩個(gè)維度的智能優(yōu)化策略。
(1)滿(mǎn)足場(chǎng)景識(shí)別、海量參數(shù)修改需求。例如在KPI 指標(biāo)惡化或者在大型會(huì)議、比賽、通信保障等特殊場(chǎng)景下,采用人工識(shí)別場(chǎng)景并修改參數(shù),效率較低。我們的產(chǎn)品通過(guò)CNN(卷積神經(jīng)網(wǎng)絡(luò))實(shí)現(xiàn)網(wǎng)絡(luò)畫(huà)像深度學(xué)習(xí),通過(guò)時(shí)間序列可以對(duì)高容量、大話(huà)務(wù)、CBD 商業(yè)區(qū)、高速、高校進(jìn)行快速準(zhǔn)確的智能網(wǎng)絡(luò)畫(huà)像,從而識(shí)別出網(wǎng)絡(luò)場(chǎng)景,自動(dòng)匹配策略進(jìn)行參數(shù)自動(dòng)修改,可節(jié)省大量工作并提高優(yōu)化精度。
(2)預(yù)測(cè)參數(shù)調(diào)整后指標(biāo)情況、推薦最優(yōu)策略。結(jié)合歷史數(shù)據(jù),通過(guò)多元線(xiàn)性歸算法對(duì)效果進(jìn)行預(yù)測(cè),尋求最優(yōu)調(diào)整策略并執(zhí)行。擺脫了以往單純依靠人工經(jīng)驗(yàn)的形式,使得網(wǎng)絡(luò)調(diào)整更科學(xué)、精確。
通過(guò)MR、話(huà)統(tǒng)指標(biāo)等數(shù)據(jù)進(jìn)行相關(guān)性分析并降維處理,利用PCA 主成份分析法將多維數(shù)據(jù)降至一維并繪制網(wǎng)絡(luò)模型,根據(jù)網(wǎng)絡(luò)模型繪制場(chǎng)景圖片,并使用CNN 卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行模型訓(xùn)練識(shí)別小區(qū)場(chǎng)景特征并進(jìn)行場(chǎng)景分類(lèi),場(chǎng)景識(shí)別過(guò)程如圖1 所示。
圖1 場(chǎng)景識(shí)別過(guò)程
聚類(lèi)算法相關(guān)性分析:采用該算法完成了海量數(shù)據(jù)的精準(zhǔn)定位。通過(guò)協(xié)方差及相關(guān)性系數(shù)的計(jì)算,找出了最直接影響網(wǎng)絡(luò)狀況的幾類(lèi)指標(biāo)。
“相關(guān)系數(shù)”正的協(xié)方差表達(dá)了正的相關(guān)性,負(fù)的協(xié)方差表達(dá)了負(fù)的相關(guān)性。對(duì)于同樣的兩個(gè)隨機(jī)變量來(lái)說(shuō),計(jì)算出的協(xié)方差越大,相關(guān)性越強(qiáng)。
以吞吐量等跟話(huà)務(wù)高相關(guān)的指標(biāo)為主,篩選出相關(guān)性高于90%相關(guān)字段。
降維算法PCA 主成分分析法:通過(guò)該算法計(jì)算出了話(huà)務(wù)模型矩陣(T=ABT其中A是元件矩陣,B是源數(shù)據(jù)。)。將龐大的數(shù)據(jù)量壓縮為一維數(shù)組,結(jié)合時(shí)間序列形成網(wǎng)絡(luò)畫(huà)像。
通過(guò)歸一化、球形、卡方檢驗(yàn)通過(guò)后進(jìn)行PCA 降維。壓縮為一維數(shù)組,該數(shù)組為“話(huà)務(wù)模型因子”。
模型簡(jiǎn)單理解是錄入數(shù)據(jù)后,模型輸出影響指標(biāo)因素多個(gè)矩陣。各個(gè)矩陣依次以影響大小排序(如圖2 所示)。一般取用影響最大的幾個(gè)(例如得分高于1)。圖2的情況僅有一個(gè)字段得分高于1。因此可以降為一維。(降為幾維是根據(jù)結(jié)果決定而不是事先決定。但是數(shù)據(jù)篩選時(shí)可以加以干涉,例如相關(guān)性分析。)
圖2 數(shù)據(jù)降維處理
將得到的元件矩陣帶回原先的數(shù)據(jù)中得出一維的“話(huà)務(wù)模型因子”
公式:話(huà)務(wù)模型因子T=ABT
其中A是元件矩陣,B是源數(shù)據(jù)。
如圖3 所示為例,該部分是以某一基站通過(guò)算法計(jì)算后得出的網(wǎng)絡(luò)畫(huà)像(與該圖像相似的基站約占試點(diǎn)區(qū)域總基站數(shù)的18%)。其網(wǎng)絡(luò)規(guī)律非常顯著并且常年保持該圖形分布。其規(guī)律分別在0~8 點(diǎn)期間以及20~24 點(diǎn)期間為低谷,8~20 點(diǎn)期間為相對(duì)高峰。該活動(dòng)規(guī)律與寫(xiě)字樓區(qū)域的活動(dòng)規(guī)律類(lèi)似(分為上班時(shí)間和下班時(shí)間)。因此將此類(lèi)分布定義為“寫(xiě)字樓型”方便理解記憶。
圖3 場(chǎng)景繪制樣例
通過(guò)話(huà)務(wù)模型,分析不同話(huà)務(wù)模型特征,并定義其對(duì)應(yīng)的場(chǎng)景類(lèi)型,進(jìn)入深度學(xué)習(xí)網(wǎng)絡(luò)中需要剔除各類(lèi)噪聲。(例如坐標(biāo)軸、數(shù)字、邊框,特征需要盡可能明顯。)大致類(lèi)型分為:
①Break 故障型(通信行為全天幾乎為零);
② Office 寫(xiě)字樓型(上班時(shí)間通信行為為高峰其余時(shí)間為低谷);
③Line 離散型(全天的通信行為處于震蕩式可以理解為待定);
④ Market 商場(chǎng)型(中午吃飯時(shí)段及晚上六點(diǎn)至九點(diǎn)處于通信行為高峰,其余時(shí)間為低谷);
⑤ Pub 酒吧型(夜晚及凌晨時(shí)間通信行為為高峰,其余時(shí)間為低谷);
⑥ Uptown 住宿區(qū)型(除去午夜凌晨時(shí)段外,其余時(shí)間都處于高峰的通信行為);
⑦ Village 鄉(xiāng)村型(全天有通信行為,但皆處于低谷);
試點(diǎn)的90%為以上類(lèi)別的分布,其余10%類(lèi)別歸入Line 離散型當(dāng)中。經(jīng)過(guò)各個(gè)月的抽檢,同一基站的圖形性質(zhì)不變。
期間會(huì)出現(xiàn)識(shí)別過(guò)程中圖片同時(shí)與其余類(lèi)別趨于一致的問(wèn)題。默認(rèn)交由深度學(xué)習(xí)網(wǎng)絡(luò)自動(dòng)識(shí)別,由于類(lèi)別間相似因此調(diào)整參數(shù)的策略誤差在可以接受的范圍內(nèi),場(chǎng)景繪制結(jié)果如圖4 所示。
圖4 場(chǎng)景繪制結(jié)果
CNN 可以用來(lái)識(shí)別位移、縮放及其它形式扭曲不變性的二維或三維圖像。CNN的特征提取層參數(shù)是通過(guò)訓(xùn)練數(shù)據(jù)學(xué)習(xí)得到的,所以其避免了人工特征提取,而是從訓(xùn)練數(shù)據(jù)中進(jìn)行學(xué)習(xí);其次同一特征圖的神經(jīng)元共享權(quán)值,減少了網(wǎng)絡(luò)參數(shù),這也是卷積網(wǎng)絡(luò)相對(duì)于全連接網(wǎng)絡(luò)的一大優(yōu)勢(shì)。共享局部權(quán)值這一特殊結(jié)構(gòu)更接近于真實(shí)的生物神經(jīng)網(wǎng)絡(luò)使CNN 在圖像處理、語(yǔ)音識(shí)別領(lǐng)域有著獨(dú)特的優(yōu)越性,另一方面權(quán)值共享同時(shí)降低了網(wǎng)絡(luò)的復(fù)雜性,且多維輸入信號(hào)(語(yǔ)音、圖像)可以直接輸入網(wǎng)絡(luò)的特點(diǎn)避免了特征提取和分類(lèi)過(guò)程中數(shù)據(jù)重排的過(guò)程。
在實(shí)踐中,我們搭建CNN 卷積神經(jīng)網(wǎng)絡(luò)框架,以約10 萬(wàn)張訓(xùn)練圖片,學(xué)習(xí)率0.000 1,批量大小15 完成60 000 次迭代后形成最終的深度學(xué)習(xí)模型。該模型能以高精度、高效率、全智能方式完成各大網(wǎng)絡(luò)畫(huà)像的場(chǎng)景識(shí)別,為智能優(yōu)化打下堅(jiān)實(shí)的基礎(chǔ)。
訓(xùn)練數(shù)據(jù)來(lái)源于先前的策略經(jīng)驗(yàn)積累,模型通過(guò)預(yù)測(cè)結(jié)果以及不斷獲取的現(xiàn)有網(wǎng)絡(luò)動(dòng)態(tài)完成模型優(yōu)化以及策略庫(kù)的經(jīng)驗(yàn)積累。最終通過(guò)預(yù)測(cè)實(shí)施的方式計(jì)算出各大場(chǎng)景各個(gè)時(shí)段各個(gè)人流量下的最佳的優(yōu)化策略。并結(jié)合場(chǎng)景識(shí)別的監(jiān)控模式實(shí)時(shí)完成參數(shù)自動(dòng)調(diào)整。
第一步:根據(jù)優(yōu)秀網(wǎng)優(yōu)工程師經(jīng)驗(yàn)設(shè)定每類(lèi)場(chǎng)景常用優(yōu)化參數(shù)、調(diào)整步長(zhǎng)和參數(shù)調(diào)整范圍,參數(shù)設(shè)置區(qū)間及步長(zhǎng)如表1 所示。
表1 參數(shù)設(shè)置區(qū)間及步長(zhǎng)
第二步:根據(jù)不同場(chǎng)景特征制定關(guān)聯(lián)指標(biāo)并設(shè)置相關(guān)權(quán)值。
表2 指標(biāo)健康度計(jì)算
低于基準(zhǔn)值得0 分,高于挑戰(zhàn)值的滿(mǎn)分,基準(zhǔn)值和挑戰(zhàn)值之間按照線(xiàn)性得分計(jì)算。指標(biāo)健康度計(jì)算如表2 所示(峰值利用率只有一個(gè)門(mén)限,大于等于50%得0 分,小于50%得滿(mǎn)分)。
多元回歸分析預(yù)測(cè)法,是指通過(guò)對(duì)兩個(gè)或兩個(gè)以上的自變量與一個(gè)因變量的相關(guān)分析,建立預(yù)測(cè)模型進(jìn)行預(yù)測(cè)的方法。當(dāng)自變量與因變量之間存在線(xiàn)性關(guān)系時(shí),稱(chēng)為多元線(xiàn)性回歸分析。
寫(xiě)字樓類(lèi)的最終得分的多元回歸方程:
多次迭代計(jì)算已知值便可求出所有的系數(shù)b,以及誤差范圍e。J函數(shù)是懲罰函數(shù)加了正則項(xiàng)。已知值指的是工程師判斷的結(jié)果。
通過(guò)不同參數(shù)組合數(shù)次迭代預(yù)測(cè)指標(biāo)變化情況,根據(jù)給定的指標(biāo)權(quán)限計(jì)算小區(qū)健康度得分,得分最優(yōu)的參數(shù)組合即為機(jī)器建議值,智能優(yōu)化過(guò)程如圖5 所示。
圖5 智能優(yōu)化過(guò)程
隨著人工智能在各個(gè)行業(yè)中的應(yīng)用,網(wǎng)優(yōu)智能化發(fā)展已實(shí)在必行,本文從場(chǎng)景識(shí)別和智能優(yōu)化方面進(jìn)入手,探討人工智能在網(wǎng)絡(luò)優(yōu)化中的應(yīng)用,并給出合理的算法和可行性,為后續(xù)人工智能在網(wǎng)絡(luò)優(yōu)化中大規(guī)模應(yīng)用提供思路。