蔡超,袁林,張錫娜
(1.中訊郵電咨詢設(shè)計(jì)院有限公司,河南 鄭州450007;2.中國聯(lián)合網(wǎng)絡(luò)通信有限公司重慶市分公司,重慶400042)
運(yùn)營技術(shù)廣角
集約化寬帶服務(wù)智能運(yùn)維體系構(gòu)建方法
蔡超1,袁林2,張錫娜2
(1.中訊郵電咨詢設(shè)計(jì)院有限公司,河南 鄭州450007;2.中國聯(lián)合網(wǎng)絡(luò)通信有限公司重慶市分公司,重慶400042)
隨著寬帶提速戰(zhàn)略的推行和IPTV/OTT等視頻類流媒體業(yè)務(wù)的迅速發(fā)展,用戶對(duì)運(yùn)營商網(wǎng)絡(luò)服務(wù)體驗(yàn)的要求不斷提升,現(xiàn)有分層、分段、缺乏關(guān)聯(lián)的運(yùn)維體系和方法已不能滿足新形勢下的網(wǎng)絡(luò)運(yùn)維工作需求。以流媒體業(yè)務(wù)為聚焦點(diǎn),提出一套在寬帶IP網(wǎng)內(nèi)基于“端到端網(wǎng)絡(luò)質(zhì)量監(jiān)控”和“故障自診斷功能”構(gòu)建集約化寬帶服務(wù)智能運(yùn)維體系的方法,以期對(duì)運(yùn)營商網(wǎng)絡(luò)運(yùn)維工作的效率及智能化水平的提升有所助益。
寬帶網(wǎng)絡(luò);質(zhì)量監(jiān)控;故障自診斷;智能運(yùn)維
從電信運(yùn)營商角度著眼,隨著國家“寬帶提速”戰(zhàn)略的實(shí)施和網(wǎng)內(nèi)視頻流媒體應(yīng)用流量的快速增長,接入速率的提高和業(yè)務(wù)體驗(yàn)的提升是未來寬帶業(yè)務(wù)發(fā)展的必然趨勢。隨著“光進(jìn)銅退,光纖接入”的規(guī)模部署和CDN等關(guān)鍵技術(shù)的規(guī)模應(yīng)用,寬帶用戶的互聯(lián)網(wǎng)使用行為隨之發(fā)生改變——視頻類流媒體業(yè)務(wù)興起,并迅速成為固定互聯(lián)網(wǎng)及移動(dòng)互聯(lián)網(wǎng)流量最主要的增長點(diǎn)。技術(shù)和應(yīng)用的發(fā)展改變著用戶的網(wǎng)絡(luò)期望:由于用戶對(duì)視頻類流媒體業(yè)務(wù)的質(zhì)量非常敏感,運(yùn)營商寬帶用戶已不再僅僅關(guān)注通斷性故障,轉(zhuǎn)而更加專注網(wǎng)絡(luò)質(zhì)量和業(yè)務(wù)體驗(yàn),這也給目前的網(wǎng)絡(luò)、建設(shè)工作帶來嚴(yán)峻挑戰(zhàn)和沉重壓力。本文以流媒體業(yè)務(wù)為聚焦點(diǎn),提出一套在寬帶IP網(wǎng)內(nèi)基于“端到端網(wǎng)絡(luò)質(zhì)量監(jiān)控”和“故障自診斷功能”構(gòu)建集約化寬帶服務(wù)智能運(yùn)維體系的方法,以期對(duì)運(yùn)營商網(wǎng)絡(luò)運(yùn)維工作的效率及智能化水平的提升有所助益。
圖1 業(yè)務(wù)的端到端網(wǎng)絡(luò)體系
2.1 現(xiàn)狀及問題
流量經(jīng)營時(shí)代,建立以用戶感知為中心的網(wǎng)絡(luò)運(yùn)維服務(wù)體系,從傳統(tǒng)的關(guān)注轉(zhuǎn)發(fā)指標(biāo)的網(wǎng)絡(luò)維護(hù)跨越到新型的面向用戶感知的網(wǎng)絡(luò)維護(hù),已經(jīng)成為電信運(yùn)營商的共同訴求。但現(xiàn)網(wǎng)網(wǎng)絡(luò)分層建設(shè)、分段管理、端到端割裂的運(yùn)維、建設(shè)管理模式無法滿足網(wǎng)絡(luò)運(yùn)維工作的新需求,給運(yùn)維轉(zhuǎn)型帶來困擾:無法對(duì)網(wǎng)絡(luò)運(yùn)營狀況進(jìn)行端到端的系統(tǒng)性監(jiān)控和分析;故障定位過程復(fù)雜,無法快速獲取用戶業(yè)務(wù)及網(wǎng)絡(luò)關(guān)鍵數(shù)據(jù),排障難度高,排障效率低下;業(yè)務(wù)及網(wǎng)絡(luò)質(zhì)量劣化無法預(yù)警。
此外,現(xiàn)網(wǎng)各類業(yè)務(wù)支撐系統(tǒng)及運(yùn)營支撐系統(tǒng)(各級(jí)網(wǎng)管系統(tǒng)、號(hào)線系統(tǒng)、計(jì)費(fèi)認(rèn)證系統(tǒng)、營賬系統(tǒng)、用戶服務(wù)系統(tǒng)等)雖然分類較細(xì),細(xì)分功能強(qiáng)大,但各系統(tǒng)相對(duì)獨(dú)立,無法做到資源共享、數(shù)據(jù)互通和系統(tǒng)聯(lián)動(dòng),資源利用效率低下。
2.2 主客觀條件
在當(dāng)前形勢下,運(yùn)營商謀求構(gòu)建以用戶感知為中心的集約化寬帶服務(wù)智能運(yùn)維體系,實(shí)現(xiàn)運(yùn)維工作跨越式轉(zhuǎn)型,具備以下有利條件:
·隨著互聯(lián)網(wǎng)思維的沖擊和專業(yè)間融合,運(yùn)營商運(yùn)維、建設(shè)各團(tuán)隊(duì)專業(yè)人員全網(wǎng)思路已形成,運(yùn)維建設(shè)團(tuán)隊(duì)較以往更加關(guān)注網(wǎng)絡(luò)整體、關(guān)注業(yè)務(wù)體驗(yàn)、關(guān)注用戶維系;
·經(jīng)過十余年的建設(shè)和發(fā)展,目前運(yùn)營商網(wǎng)絡(luò)信息化水平大幅度提升,縱向及橫向管理支撐系統(tǒng)較為完善,數(shù)據(jù)采集類目齊全;
· 近年來,大數(shù)據(jù)分析技術(shù)從方法、工具到實(shí)踐均已實(shí)現(xiàn)成熟,數(shù)據(jù)關(guān)聯(lián)和數(shù)據(jù)挖掘更易產(chǎn)生質(zhì)變。思想上的轉(zhuǎn)變和資源、技術(shù)上的有利條件使運(yùn)營商運(yùn)維管理工作的跨越式轉(zhuǎn)型成為可能。
2.3 研究目標(biāo)
充分挖掘現(xiàn)有系統(tǒng)價(jià)值、整合各類支撐系統(tǒng)數(shù)據(jù)信息資源,輔以目前能實(shí)現(xiàn)的技術(shù)條件,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)“端到端”的業(yè)務(wù)質(zhì)量監(jiān)控,并進(jìn)而構(gòu)建集約化的寬帶服務(wù)智能運(yùn)維體系,是本研究的目標(biāo)。
對(duì)相關(guān)概念及范圍做必要說明如下。
(1)業(yè)務(wù)
鑒于視頻類業(yè)務(wù)發(fā)展迅猛,而其相較于傳統(tǒng)業(yè)務(wù),業(yè)務(wù)承載環(huán)節(jié)更多、鏈條更長、用戶體驗(yàn)更敏感,因此著重以視頻類流媒體業(yè)務(wù)作為關(guān)注對(duì)象。
(2)端到端網(wǎng)絡(luò)
以視頻類流媒體業(yè)務(wù)為例,端到端是指用戶網(wǎng)絡(luò)→寬帶接入網(wǎng)→寬帶城域網(wǎng)→流媒體業(yè)務(wù)平臺(tái)全程網(wǎng)絡(luò)。傳統(tǒng)寬帶業(yè)務(wù)應(yīng)用類似。業(yè)務(wù)的端到端網(wǎng)絡(luò)體系如圖1所示。
(3)監(jiān)控
監(jiān)控即監(jiān)測和控制。高效準(zhǔn)確的全網(wǎng)常態(tài)化質(zhì)量監(jiān)測和故障定位是基礎(chǔ),而通過接口與網(wǎng)絡(luò)及支撐系統(tǒng)的交互控制能力則使遠(yuǎn)程一鍵式排障成為可能。監(jiān)測和控制是構(gòu)建集約化的寬帶服務(wù)智能運(yùn)維體系的必要手段。
3.1 總體思路
對(duì)網(wǎng)絡(luò)及業(yè)務(wù)質(zhì)量的“端到端”監(jiān)控是構(gòu)建集約化寬帶服務(wù)智能運(yùn)維體系的前提,其實(shí)現(xiàn)基礎(chǔ)則是對(duì)業(yè)務(wù)網(wǎng)絡(luò)及業(yè)務(wù)支撐系統(tǒng)的各環(huán)節(jié)進(jìn)行關(guān)鍵數(shù)據(jù)采集。
通過與現(xiàn)網(wǎng)系統(tǒng)打通接口,能夠采集到涵蓋以下3個(gè)層面的數(shù)據(jù)信息:網(wǎng)絡(luò) (用戶網(wǎng)絡(luò)、接入網(wǎng)絡(luò)、IP城域網(wǎng)絡(luò));業(yè)務(wù)(寬帶上網(wǎng)、IPTV/OTT視頻業(yè)務(wù)等);用戶(簽約套餐、用戶狀態(tài)等)。
通過對(duì)采集數(shù)據(jù)的分類管理、邏輯分析、應(yīng)用呈現(xiàn),即可實(shí)現(xiàn)針對(duì)具體業(yè)務(wù)的端到端網(wǎng)絡(luò)質(zhì)量監(jiān)測;并進(jìn)而能夠根據(jù)分析結(jié)果與周邊支撐體系進(jìn)行互動(dòng),實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)和業(yè)務(wù)的集約化服務(wù)、支撐、管控。各環(huán)節(jié)中,數(shù)據(jù)采集是前提、數(shù)據(jù)管理是基礎(chǔ)、對(duì)數(shù)據(jù)的集中分析和邏輯判斷是靈魂,數(shù)據(jù)應(yīng)用是目的。集約化寬帶服務(wù)智能運(yùn)維體系實(shí)現(xiàn)架構(gòu)如圖2所示。
所需基礎(chǔ)數(shù)據(jù)來源如下。
·運(yùn)營商網(wǎng)絡(luò)側(cè)網(wǎng)管系統(tǒng):寬帶接入網(wǎng)網(wǎng)管、IP數(shù)據(jù)網(wǎng)綜合網(wǎng)管、IPTV/OTT平臺(tái)側(cè)專業(yè)網(wǎng)管。
·用戶網(wǎng)絡(luò)側(cè)探針系統(tǒng):機(jī)頂盒探針、PC客戶端探針。
· 資源管理系統(tǒng):接入網(wǎng)號(hào)線系統(tǒng)。
此外,為最終形成集約化的寬帶服務(wù)智能運(yùn)維體系,實(shí)現(xiàn)客服側(cè)故障預(yù)先處理、工單自動(dòng)派發(fā)、故障快速定位、提升排障效率等目標(biāo),還需與以下系統(tǒng)打通接口,形成跨系統(tǒng)交互。
·業(yè)務(wù)支持系統(tǒng):包括寬帶認(rèn)證鑒權(quán)系統(tǒng)(AAA)、計(jì)費(fèi)營賬系統(tǒng)、寬帶測速系統(tǒng)。
·客服支撐系統(tǒng):包括客服系統(tǒng)、電子運(yùn)維系統(tǒng)、工單系統(tǒng)。
對(duì)數(shù)據(jù)信息基于應(yīng)用目的進(jìn)行邏輯處理是本文研究的核心問題。從形成集約化的“寬帶服務(wù)智能運(yùn)維體系”目標(biāo)出發(fā),并結(jié)合現(xiàn)網(wǎng)運(yùn)維需求進(jìn)行分析,體系至少應(yīng)具備以下兩方面的能力:
· 端到端的常態(tài)化網(wǎng)絡(luò)質(zhì)量監(jiān)測能力;
· 基于端到端網(wǎng)絡(luò)監(jiān)測體系的故障診斷能力。
3.2 端到端的常態(tài)化網(wǎng)絡(luò)質(zhì)量監(jiān)測的實(shí)現(xiàn)
端到端的常態(tài)化網(wǎng)絡(luò)質(zhì)量監(jiān)控,具體來說即實(shí)現(xiàn)“網(wǎng)絡(luò)劣化預(yù)警”能力,其應(yīng)具備如下特點(diǎn):精準(zhǔn)定位、事先預(yù)警;聚焦網(wǎng)絡(luò)、聚焦業(yè)務(wù)。常態(tài)化網(wǎng)絡(luò)質(zhì)量監(jiān)測由被動(dòng)監(jiān)測和主動(dòng)監(jiān)測兩類手段協(xié)同完成。
3.2.1 被動(dòng)信息采集監(jiān)測
被動(dòng)監(jiān)測是常態(tài)化網(wǎng)絡(luò)質(zhì)量監(jiān)測體系的基礎(chǔ),是對(duì)網(wǎng)絡(luò)質(zhì)量變化情況的初步感知。通過對(duì)現(xiàn)網(wǎng)網(wǎng)管支撐系統(tǒng)的數(shù)據(jù)采集,可實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)質(zhì)量的靜態(tài)監(jiān)測:通過現(xiàn)網(wǎng)測速系統(tǒng)數(shù)據(jù),結(jié)合號(hào)線系統(tǒng)信息,對(duì)近期測速不達(dá)標(biāo)區(qū)域進(jìn)行定位和預(yù)警,并可通過GIS進(jìn)行呈現(xiàn);通過現(xiàn)網(wǎng)網(wǎng)管系統(tǒng),從網(wǎng)絡(luò)層面對(duì)中繼負(fù)荷較高區(qū)域進(jìn)行預(yù)警。常態(tài)化網(wǎng)絡(luò)質(zhì)量監(jiān)測實(shí)現(xiàn)原理(被動(dòng)監(jiān)測)如圖3所示。
圖3 常態(tài)化網(wǎng)絡(luò)質(zhì)量監(jiān)測實(shí)現(xiàn)原理(被動(dòng)監(jiān)測)
3.2.2 前向主動(dòng)信息采集監(jiān)測
主動(dòng)監(jiān)測手段是對(duì)被動(dòng)監(jiān)測結(jié)果的驗(yàn)證和補(bǔ)充。主動(dòng)監(jiān)測在不同場景下有不同的實(shí)現(xiàn)手段。
(1)場景一:未部署用戶側(cè)探針
圖2 集約化寬帶服務(wù)智能運(yùn)維體系實(shí)現(xiàn)架構(gòu)
主動(dòng)監(jiān)測以經(jīng)過被動(dòng)監(jiān)測初步確認(rèn)的網(wǎng)絡(luò)質(zhì)量劣化預(yù)警區(qū)域?yàn)楸O(jiān)測目標(biāo)。對(duì)于未部署用戶側(cè)探針的用戶,通過主動(dòng)ping操作獲取網(wǎng)絡(luò)各段時(shí)延、抖動(dòng)等信息并進(jìn)行分析對(duì)比;對(duì)于無法ping通終端的用戶(原因可能是不在線),對(duì)同區(qū)域用戶進(jìn)行隨機(jī)掃描:如在寬帶業(yè)務(wù)并發(fā)比50%左右的情況下,若隨機(jī)掃描的區(qū)域內(nèi)10個(gè)用戶均不在線,則可確認(rèn)為大面積故障并觸發(fā)預(yù)警。如圖4所示,場景一可實(shí)現(xiàn)對(duì)運(yùn)營商側(cè)網(wǎng)絡(luò)的端到端監(jiān)測。
圖4 場景一實(shí)現(xiàn)運(yùn)營商側(cè)網(wǎng)絡(luò)的端到端監(jiān)測
(2)場景二:用戶側(cè)部署PC端軟探針
若用戶側(cè)部署有探針系統(tǒng),則可通過主動(dòng)撥測、循環(huán)上報(bào)等方式獲取信息。
主動(dòng)撥測:由遠(yuǎn)端后臺(tái)指定策略,由客戶端發(fā)起測試任務(wù)并將采集數(shù)據(jù)上報(bào)后臺(tái)。具體原理如圖5所示。
圖5 用戶側(cè)PC探針主動(dòng)撥測原理
主動(dòng)循環(huán)上報(bào):探針按照規(guī)定頻率或時(shí)間節(jié)點(diǎn),自動(dòng)發(fā)起網(wǎng)絡(luò)指標(biāo)測試任務(wù),并將系統(tǒng)上報(bào)遠(yuǎn)端后臺(tái),具體原理如圖6所示。
圖6 PC探針主動(dòng)循環(huán)上報(bào)原理
如圖7所示,場景二可實(shí)現(xiàn)從用戶網(wǎng)絡(luò)到運(yùn)營商網(wǎng)絡(luò)的端到端監(jiān)測。
圖7 場景二實(shí)現(xiàn)家庭到運(yùn)營商網(wǎng)絡(luò)的端到端監(jiān)測
場景二針對(duì)傳統(tǒng)寬帶業(yè)務(wù),檢測采集的網(wǎng)絡(luò)指標(biāo)主要有:以太網(wǎng)吞吐率、以太網(wǎng)分組個(gè)數(shù)、IP分組吞吐率、IP分組個(gè)數(shù)、平均IP分組大小、分組丟失率、抖動(dòng)、時(shí)延。
(3)場景三:用戶側(cè)部署IPTV/OTT TV機(jī)頂盒軟探針
場景三與場景二類似,可通過主動(dòng)撥測、循環(huán)上報(bào)等方式獲取信息。
主動(dòng)撥測:由遠(yuǎn)端后臺(tái)指定策略,由客戶端發(fā)起測試任務(wù),并將采集數(shù)據(jù)上報(bào)后臺(tái)。用戶側(cè)TV探針主動(dòng)撥測原理如圖8所示。
圖8 用戶側(cè)TV探針主動(dòng)撥測原理
主動(dòng)循環(huán)上報(bào):探針按照規(guī)定頻率或時(shí)間節(jié)點(diǎn),自動(dòng)發(fā)起網(wǎng)絡(luò)指標(biāo)測試任務(wù),并將系統(tǒng)上報(bào)遠(yuǎn)端后臺(tái),具體原理如圖9所示。
圖9 TV探針主動(dòng)循環(huán)上報(bào)原理
撥測服務(wù)器設(shè)置:為了實(shí)現(xiàn)TV類流媒體業(yè)務(wù)端到端的質(zhì)量監(jiān)測,可通過部署撥測服務(wù)器,對(duì)視頻源和EPG服務(wù)器按照既定策略進(jìn)行撥測,實(shí)時(shí)了解視頻源質(zhì)量和服務(wù)器質(zhì)量,完善網(wǎng)絡(luò)探針端到端的監(jiān)測能力。主動(dòng)撥測應(yīng)用場景有以下方面:
· 對(duì)視頻源進(jìn)行撥測,監(jiān)測各頻道的節(jié)目質(zhì)量狀況,判斷節(jié)目的可用性;
·對(duì)EPG服務(wù)器進(jìn)行撥測,監(jiān)測EPG服務(wù)器的性能;·對(duì)業(yè)務(wù)平臺(tái)服務(wù)器進(jìn)行撥測,監(jiān)測用戶認(rèn)證、EPG
下發(fā)等功能;
·對(duì)CDN服務(wù)器進(jìn)行撥測,監(jiān)測服務(wù)器性能。
撥測服務(wù)器工作流程如下:后臺(tái)根據(jù)撥測策略,向撥測服務(wù)器發(fā)送撥測指令,撥測服務(wù)器向目標(biāo)服務(wù)器發(fā)起撥測,采集節(jié)目性能指標(biāo)、服務(wù)器性能指標(biāo)等數(shù)據(jù),回送至網(wǎng)絡(luò)探針平臺(tái)進(jìn)行分析和展示。針對(duì)流媒體業(yè)務(wù)的策略撥測原理如圖10所示。
圖10 針對(duì)流媒體業(yè)務(wù)的策略撥測原理
場景三可實(shí)現(xiàn)從用戶到業(yè)務(wù)平臺(tái)的端到端的網(wǎng)絡(luò)質(zhì)量監(jiān)測,如圖11所示。
圖11 場景三實(shí)現(xiàn)對(duì)業(yè)務(wù)的端到端監(jiān)測
場景三針對(duì)流媒體視頻TV類業(yè)務(wù),除了前述網(wǎng)絡(luò)指標(biāo)外,還需要采集與業(yè)務(wù)相關(guān)的網(wǎng)絡(luò)參數(shù),主要指標(biāo)如下。
· 網(wǎng)絡(luò)指標(biāo):以太網(wǎng)吞吐率、以太網(wǎng)分組個(gè)數(shù)、IP層吞吐率、IP分組個(gè)數(shù)、平均IP分組大小、分組丟失、抖動(dòng)、時(shí)延。
·IPTV指標(biāo):頻道切換時(shí)間、DF、MLR、MLT-15、RTP吞吐率、RTP分組個(gè)數(shù)、RTP字節(jié)數(shù)、RTP收到分組數(shù)、RTP分組丟失數(shù)、視頻播放時(shí)延。
·OTT TV指標(biāo):卡屏?xí)r長、卡屏次數(shù)、點(diǎn)播時(shí)延HLS分片間隔偏離、HLS分片下載時(shí)間偏離、HLS亂序分片數(shù)、TCP重傳率、TCP重復(fù)率、TCP建立時(shí)間、HTTP響應(yīng)時(shí)延、HTTP錯(cuò)誤碼。
·EPG指標(biāo):EPG用戶數(shù)、EPG訪問數(shù)、成功EPG訪問數(shù)、EPG請求成功率、EPG頁面響應(yīng)時(shí)延、EPG頁面下載時(shí)延、域名解析時(shí)長、頁面大小、返回碼、頁面URL、HTTP請求數(shù)、HTTP響應(yīng)數(shù)。
3.3 基于端到端網(wǎng)絡(luò)監(jiān)測體系的故障診斷及處理
3.3.1 故障診斷流程
全程全網(wǎng)的故障診斷和定位原理概述如下:根據(jù)故障類型抽象多種細(xì)分的“原子”故障診斷功能,按照故障診斷場景進(jìn)行配置組合,并經(jīng)過邏輯判斷流程予以最終確認(rèn)。一個(gè)完整的故障診斷行為的實(shí)現(xiàn),是基于多種診斷“原子”功能組合分析的結(jié)果,如圖12所示。
圖12 故障自診斷流程
基礎(chǔ)“原子”功能以及解決具體問題的“‘原子’功能組合”可以根據(jù)具體需求進(jìn)行邏輯流程定義。對(duì)一些關(guān)鍵的“原子”功能和典型的診斷實(shí)例進(jìn)行描述。
3.3.2 診斷“原子”功能
(1)大面積故障診斷
診斷功能說明:根據(jù)網(wǎng)絡(luò)實(shí)際情況設(shè)定參考門限判斷網(wǎng)絡(luò)各層面設(shè)備是否中斷、時(shí)延是否正常、分組丟失率是否過高、抖動(dòng)是否偏大,具體方法如下。
· 同步設(shè)備告警:設(shè)備上報(bào)告警信息。
·主動(dòng)ping測:網(wǎng)管系統(tǒng)定時(shí)ping測告警。
·設(shè)備性能故障:根據(jù) ping測的時(shí)延(如超過 40~60 ms)結(jié)合流量(大于或等于85%)判斷設(shè)備是否出現(xiàn)性能故障。
· 診斷次數(shù)分析:系統(tǒng)記錄診斷賬號(hào),并關(guān)聯(lián)資源鏈路進(jìn)行分析,如發(fā)現(xiàn)同一設(shè)備下的用戶存在多次(需確定閾值)記錄,則將該設(shè)備列為疑似故障設(shè)備。
(2)接入層設(shè)備診斷
診斷功能說明:提供寬帶接入網(wǎng)設(shè)備(DSLAM、ONU、OLT)診斷測試功能,給出診斷結(jié)論以及故障原因。
通過用戶賬號(hào)(用戶身份證號(hào)碼)等基本信息條件,實(shí)現(xiàn)對(duì)DSLAM、ONU、OLT接入設(shè)備的診斷測試,測試主要內(nèi)容為設(shè)備基本信息,如:設(shè)備名稱、設(shè)備類型、設(shè)備型號(hào)、設(shè)備板卡、設(shè)備端口、小區(qū)名稱、設(shè)備生產(chǎn)廠商、設(shè)備IP地址、上聯(lián)端口名稱、下聯(lián)端口名稱、設(shè)備性能、中繼流量等。
(3)接入線路質(zhì)量診斷
診斷功能說明:對(duì)寬帶用戶(ADSL、FTTB、FTTH接入方式)接入線路進(jìn)行實(shí)時(shí)診斷測試,給出診斷結(jié)論以及故障原因。
通過用戶賬號(hào)(用戶身份證號(hào)碼)等基本信息,實(shí)現(xiàn)對(duì)ADSL、FTTB、FTTH寬帶用戶接入線路的診斷測試,測試主要內(nèi)容如下。
·ADSL、FTTB寬帶用戶,測試主要內(nèi)容為:電氣線長、最新使用模板、最新下行MABR、下行平均MABR、下行最大MABR、下行最小MABR、最新上行MABR、上行平均MABR、上行最大MABR、上行最小MABR、最新下行噪聲容限、平均下行噪聲容限、最大下行噪聲容限、最小下行噪聲容限、最新上行噪聲容限、平均上行噪聲容限、最大上行噪聲容限、最小上行噪聲容限、最新下行同步速率、平均下行同步速率、最大下行同步速率、最小下行同步速率、最新上行同步速率、平均上行同步速率、最大上行同步速率、最小上行同步速率、是否與ADSL1同步、穩(wěn)定性、不穩(wěn)定原因、高能噪聲、虛接、廣播噪聲、脈沖噪聲、阻抗不平衡、高頻高能噪聲、下行MABR偏低、上行MABR偏低、同步狀態(tài)、上行可達(dá)率、下行可達(dá)率、上行實(shí)際可達(dá)率、下行實(shí)際可達(dá)率、上行噪聲容限、下行噪聲容限、上行衰減、下行衰減等。
·對(duì)于FTTH接入方式的寬帶用戶,測試主要內(nèi)容為:上行光衰、下行光衰、家庭網(wǎng)關(guān)(OUN)發(fā)送及接收光功率、OLT發(fā)送及接收光功率等。
(4)IP承載網(wǎng)設(shè)備診斷
診斷功能說明:提供IP城域網(wǎng)設(shè)備 (接入?yún)R聚交換機(jī)、環(huán)網(wǎng)交換機(jī)、BRAS、核心路由器)診斷測試功能,給出診斷結(jié)論以及故障原因。
通過用戶賬號(hào)(用戶身份證號(hào)碼)等基本信息條件,實(shí)現(xiàn)對(duì)接入?yún)R聚交換機(jī)、環(huán)網(wǎng)交換機(jī)、BRAS、核心路由器設(shè)備的診斷測試,測試主要內(nèi)容為:設(shè)備基本信息(例如:設(shè)備名稱、設(shè)備類型、設(shè)備生產(chǎn)廠商、設(shè)備IP地址、上聯(lián)端口名稱、下聯(lián)端口名稱)、設(shè)備配置問題(例如:端口帶寬)、設(shè)備狀態(tài)(例如:設(shè)備CPU平均利用率、內(nèi)存平均利用率、入口速率、入口利用率、入口分組丟失率、出口速率、出口利用率、出口分組丟失率)等。
(5)承載網(wǎng)質(zhì)量診斷
診斷功能說明:提供對(duì)寬帶承載網(wǎng)設(shè)備(接入?yún)R聚交換機(jī)、環(huán)網(wǎng)交換機(jī)、BRAS、核心路由器)實(shí)時(shí)ping測試功能,給出診斷網(wǎng)絡(luò)質(zhì)量測試結(jié)論。
通過用戶賬號(hào)(用戶身份證號(hào)碼)等基本信息條件,實(shí)現(xiàn)對(duì)接入?yún)R聚交換機(jī)、環(huán)網(wǎng)交換機(jī)、BRAS、核心路由器)設(shè)備的實(shí)時(shí)ping測試功能,測試顯示結(jié)果主要為:分組時(shí)延、分組丟失率、時(shí)延、抖動(dòng)等實(shí)時(shí)信息。
(6)AAA認(rèn)證診斷
數(shù)據(jù)采集:以寬帶賬號(hào)為索引,系統(tǒng)登錄“AAA認(rèn)證計(jì)費(fèi)系統(tǒng)”,判斷AAA系統(tǒng)登錄可用性,登錄成功查詢:賬號(hào)是否存在、賬號(hào)開戶時(shí)間、賬號(hào)套餐、賬號(hào)服務(wù)帶寬、端口綁定標(biāo)志、賬號(hào)綁定標(biāo)識(shí)、賬號(hào)服務(wù)可用性、賬號(hào)在線狀態(tài)、賬號(hào)認(rèn)證狀態(tài)、賬號(hào)最近一次登錄時(shí)間、賬號(hào)認(rèn)證失敗原因、賬號(hào)黑名單狀態(tài)、次數(shù)。查詢賬號(hào)對(duì)應(yīng)設(shè)備號(hào)、內(nèi)外層VLAN、IP地址、MAC地址判斷賬號(hào)對(duì)應(yīng)的賬號(hào)BAS設(shè)備、DSLAM設(shè)備/ONU(亦可從號(hào)線系統(tǒng)中獲?。?、用戶IP地址、用戶MAC地址。
判斷邏輯:A賬號(hào)是否存在;B賬號(hào)是否可用;C賬號(hào)是否綁定;D賬號(hào)綁定關(guān)系是否一致;E最近是否正常;F賬號(hào)是否在線;G認(rèn)證失敗原因;H賬號(hào)是否進(jìn)入黑名單。
(7)用戶賬戶診斷
判斷邏輯:通過調(diào)用營賬、CRM等系統(tǒng),獲取用戶賬務(wù)狀態(tài)、用戶賬戶余額等信息并進(jìn)行分析,判斷是否因資費(fèi)問題導(dǎo)致服務(wù)提供異常。
(8)帶寬配置診斷
數(shù)據(jù)采集:以賬號(hào)為索引查詢“營賬系統(tǒng)”中賬號(hào)基本信息、開戶帶寬、賬號(hào)狀態(tài)(正常、欠停、拆機(jī));查詢AAA系統(tǒng)/BRAS中的用戶配置帶寬、結(jié)合提速系統(tǒng)信息進(jìn)行匹配分析。
判斷邏輯:A是否欠費(fèi)停機(jī);B是否與AAA系統(tǒng)中賬號(hào)信息一致;C賬號(hào)狀態(tài)是否一致;D配置帶寬是否一致。
(9)綁定關(guān)系診斷
判斷邏輯:通過調(diào)用AAA系統(tǒng)認(rèn)證日志 (包括認(rèn)證時(shí)間、認(rèn)證失敗原因、賬號(hào)綁定信息)、號(hào)線系統(tǒng)(接入設(shè)備IP地址、接入設(shè)備端口號(hào))、網(wǎng)管系統(tǒng)(BAS的IP地址、BAS的端口)等信息),判斷是否因綁定關(guān)系錯(cuò)誤導(dǎo)致服務(wù)提供異常。
(10)終端狀態(tài)診斷
判斷邏輯:在用戶側(cè)探針中獲取信息,如客戶端系統(tǒng)是否正常、負(fù)荷是否正常、網(wǎng)卡工作是否正常等。
3.3.3 故障診斷實(shí)例
基于診斷“原子”功能,列舉部分常見故障的診斷流程邏輯實(shí)例。
(1)用戶信息綜合查詢
通過用戶賬號(hào)(用戶身份證號(hào)碼)等基本信息,匯總以下用戶關(guān)聯(lián)信息:
·用戶基本信息:用戶姓名、用戶住址、用戶聯(lián)系方式;
·用戶業(yè)務(wù)信息:用戶入網(wǎng)時(shí)間、用戶購買產(chǎn)品名稱、產(chǎn)品協(xié)議到期時(shí)間、協(xié)議帶寬;
·用戶賬務(wù)信息:用戶賬戶余額、是否欠費(fèi)、付費(fèi)類型;
·用戶狀態(tài)(AAA):用戶賬號(hào)狀態(tài)、用戶綁定信息、用戶是否在線、AAA配置帶寬;
·提速狀態(tài):用戶提速信息,提速狀態(tài);
· 用戶在線狀態(tài):用戶是否在線;
·用戶認(rèn)證信息:用戶最后一次認(rèn)證時(shí)間、認(rèn)證結(jié)果、最后一次認(rèn)證失敗原因(跟用戶在線狀態(tài)、端口綁定狀態(tài)、AAA用戶狀態(tài)關(guān)聯(lián))。
(2)撥號(hào)超時(shí)(錯(cuò)誤678、651)故障定位診斷
撥號(hào)超時(shí)故障自診斷流程如圖13所示,共涉及3個(gè)診斷“原子”功能。
圖13 撥號(hào)超時(shí)故障自診斷流程
(3)用戶密碼認(rèn)證錯(cuò)誤定位診斷
用戶認(rèn)證故障自診斷流程如圖14所示,共涉及3個(gè)診斷“原子”功能。
圖14 用戶認(rèn)證故障自診斷流程
(4)網(wǎng)速卡頓故障定位診斷
網(wǎng)速卡頓故障自診斷流程如圖15所示。
(5)“頻繁掉線”故障定位診斷
掉線故障自診斷流程如圖16所示。
3.3.4 快速故障處理
在快速故障定位的基礎(chǔ)上,集中的支撐體系平臺(tái)可通過系統(tǒng)間接口交互進(jìn)行集約化快速故障處理,在端到端監(jiān)測基礎(chǔ)上實(shí)現(xiàn)故障修復(fù)和管控。常用基本排障措施如下:
圖15 網(wǎng)速卡頓故障自診斷流程
圖16 掉線故障自診斷流程
· 設(shè)備端口重啟;
· 用戶付費(fèi)狀態(tài)同步;
· 用戶賬號(hào)解綁、下線,重置密碼;
· 簽約帶寬與配置帶寬同步,配置帶寬調(diào)整。
在反向操作過程中,需通過嚴(yán)格的網(wǎng)絡(luò)安全配置、操作認(rèn)證流程、分權(quán)分域規(guī)則保障各系統(tǒng)和網(wǎng)絡(luò)安全。
4.1 IPTV/OTT機(jī)頂盒內(nèi)置軟探針部署
網(wǎng)絡(luò)探針可以部署在用戶側(cè)、網(wǎng)絡(luò)側(cè)、視頻源側(cè)。部署在用戶側(cè)的軟探針性能最好,但難度也較大,首先需要適配各個(gè)廠商的IPTV/OTT機(jī)頂盒,其次還要做到讓用戶無感知的便捷部署。對(duì)于用戶側(cè)軟探針的部署思路如下:由于現(xiàn)網(wǎng)客戶端機(jī)頂盒業(yè)已部署,因此只能考慮采用服務(wù)器更新方式為終端機(jī)頂盒部署探針。實(shí)踐可采用和機(jī)頂盒廠商ROM進(jìn)行版本集成分發(fā),利用升級(jí)服務(wù)器統(tǒng)一進(jìn)行版本升級(jí)的方式完成機(jī)頂盒軟探針快速部署。
4.2 接入端口數(shù)據(jù)采集指標(biāo)的完整性保證
由于接入層端口的速率、衰減、噪聲容限等關(guān)鍵指標(biāo)的采集需通過SNMP(simple network management protocol,簡單網(wǎng)管協(xié)議)實(shí)現(xiàn)。對(duì)于在線用戶可實(shí)時(shí)采集,若用戶不在線則無法實(shí)時(shí)獲取數(shù)據(jù)。
可通過以下方法保障接入端口數(shù)據(jù)采集指標(biāo)的完整性。
· 加大數(shù)據(jù)采集的頻度。經(jīng)實(shí)測,若每天對(duì)每個(gè)用戶輪詢采集8次,則當(dāng)月覆蓋用戶率可以達(dá)到97%以上。
· 提升號(hào)線系統(tǒng)中賬號(hào)與設(shè)備、端口的對(duì)應(yīng)關(guān)系準(zhǔn)確性,以確保賬號(hào)能對(duì)應(yīng)上相應(yīng)的端口數(shù)據(jù)。
4.3 大數(shù)據(jù)應(yīng)用分析的引入
端到端、多系統(tǒng)、實(shí)時(shí)、輪詢、迭代的數(shù)據(jù)采集使各項(xiàng)功能的實(shí)現(xiàn)更加準(zhǔn)確,也使后續(xù)的功能擴(kuò)展成為可能。面對(duì)長期積累下來的海量數(shù)據(jù),利用大數(shù)據(jù)手段,對(duì)數(shù)據(jù)進(jìn)行合理的歸類、迭代、去冗,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)、業(yè)務(wù)、用戶3個(gè)層面的數(shù)據(jù)統(tǒng)計(jì)分析成為必然選擇。
在實(shí)際應(yīng)用中,大數(shù)據(jù)分析結(jié)合GIS(地理信息系統(tǒng))信息,可以通過表格、圖形等多種方式呈現(xiàn)全網(wǎng)、分區(qū)域、分小區(qū)、分客戶類型的多維度的網(wǎng)絡(luò)業(yè)務(wù)質(zhì)量情況,支撐運(yùn)維、建設(shè)、市場等工作。
在互聯(lián)網(wǎng)業(yè)務(wù)應(yīng)用和技術(shù)發(fā)展的大背景下,運(yùn)營商網(wǎng)絡(luò)智能化被賦予更多的內(nèi)涵和外延,構(gòu)建“基于業(yè)務(wù)的端到端的智能網(wǎng)絡(luò)管道”和“基于用戶體驗(yàn)的智能運(yùn)維體系”是運(yùn)營商網(wǎng)絡(luò)發(fā)展的必由之路。
以業(yè)務(wù)應(yīng)用體驗(yàn)為聚焦點(diǎn),構(gòu)建“用戶+網(wǎng)絡(luò)+應(yīng)用”三位一體的寬帶智能運(yùn)維支撐體系,在縱向上覆蓋從業(yè)務(wù)平臺(tái)到家庭側(cè)的端到端網(wǎng)絡(luò),橫向上充分利用各類已部署支撐系統(tǒng),并輔以數(shù)據(jù)建模、PC客戶端軟探針、家庭網(wǎng)關(guān)軟探針、終端App等創(chuàng)新手段,實(shí)現(xiàn)跨專業(yè)、跨網(wǎng)絡(luò)、跨平臺(tái)的數(shù)據(jù)共享、整合及聯(lián)動(dòng)。這對(duì)電信運(yùn)營商來說既是從流程、組織到技術(shù)手段上的有益創(chuàng)新,也是對(duì)未來網(wǎng)絡(luò)智能化運(yùn)營的積極探索。
基于該研究成果的寬帶服務(wù)智能運(yùn)維系統(tǒng)已在南方某省運(yùn)營商現(xiàn)網(wǎng)部署并測試應(yīng)用,實(shí)踐證明,該系統(tǒng)能夠切實(shí)提升網(wǎng)絡(luò)運(yùn)維工作的效率和智能化水平。在當(dāng)前寬帶提速及業(yè)務(wù)應(yīng)用快速發(fā)展的背景下,具有現(xiàn)實(shí)參考意義。當(dāng)前研究成果和實(shí)踐集中于解決“運(yùn)維智能化”問題,為更好地聚焦和服務(wù)用戶業(yè)務(wù),基于用戶對(duì)各類業(yè)務(wù)體驗(yàn)容忍基線的調(diào)研和模擬,采用動(dòng)態(tài)數(shù)據(jù)建模方法進(jìn)行“業(yè)務(wù)體驗(yàn)量化評(píng)測”將是下一步的研究方向。
[1]吳簡.面向業(yè)務(wù)的基于模糊關(guān)聯(lián)規(guī)則挖掘的網(wǎng)絡(luò)故障診斷[D].成都:電子科技大學(xué),2012. WU J.Service-oriented network fault diagnosis based on fuzzy association rule mining[D].Chengdu:University of Electronic Science and Technology,2012.
[2]馮月霞,樊志強(qiáng).智能巡檢系統(tǒng)提升網(wǎng)絡(luò)運(yùn)維自動(dòng)化水平的研究[J].移動(dòng)通信,2015(14):54-57. FENG Y X,FAN Z Q.Research on automation enhancement of network operation and maintenance based on intelligent inspection system[J].Mobile Communications,2015(14):54-57.
[3]逯利軍,錢培專,凌志輝.IPTV網(wǎng)絡(luò)中實(shí)現(xiàn)業(yè)務(wù)故障診斷定位的方法:CN102710453A[P].2012. LU L J,QIAN P Z,LING Z H.Method for realizing fault diagnosis and location of service in IPTV network: CN102710453A[P].2012.
[4]陳崗.網(wǎng)絡(luò)用戶、性能、故障管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].南京:東南大學(xué),2000. CHEN G.The research and implementation of network user management,performance management and fault management[D]. Nanjing:Southeast University,2000.
[5]苗磊.通信網(wǎng)絡(luò)在線診斷與重構(gòu)分布式性能管理的設(shè)計(jì)與實(shí)現(xiàn)[D].沈陽:東北大學(xué),2001. MIAO L.Design and implementation of communication network on line diagnosis and reconfiguration of distributed performance management[D].Shenyang:Northeastern University,2001.
[6]李彤巖.基于數(shù)據(jù)挖掘的通信網(wǎng)告警相關(guān)性分析研究[D].成都:電子科技大學(xué),2010.LI T Y.Researches on data mining based alarm correlationanalysis in communication networks[D].Chengdu:University of Electronic Science and Technology,2010.
Construction of an intelligent maintenance system of intensive broadband service
CAI Chao1,YUAN Lin2,ZHANG Xina2
1.China Information Technology Designing Consulting Institute Co.,Ltd.,Zhengzhou 450007,China 2.Chongqing Branch of China United Network Communication Co.,Ltd.,Chongqing 400042,China
With the spreading of broadband acceleration strategy and the quick development of streaming media such as IPTV/OTT,a higher quality of experience on the services of telecom operators need to be satisfied.The current maintenance system and method is operating on different levels and segments,which is lack of interactive functions and cooperation.Therefore,a new method is required to satisfy the network maintenance work in the new developing environment.A new method was proposed to construct the intelligent maintenance system of the intensive broadband service.With this method,it is able to achieve the end-to-end quality monitoring and automatic self-diagnosis functions.The method will benefit the services of telecom operators and will improve the efficiency and intelligence of telecom operators.
broadband network,quality monitoring,automatic self-diagnosis,intelligent maintenance
TN915
A
10.11959/j.issn.1000-0801.2017016
蔡超(1984-),男,中訊郵電咨詢設(shè)計(jì)院有限公司工程師,主要從事數(shù)據(jù)網(wǎng)規(guī)劃及設(shè)計(jì)工作。
袁林(1974-),男,中國聯(lián)合網(wǎng)絡(luò)通信有限公司重慶市分公司工程師、維護(hù)中心高級(jí)經(jīng)理,主要從事IP網(wǎng)及支撐系統(tǒng)維護(hù)管理工作。
張錫娜(1989-),女,中國聯(lián)合網(wǎng)絡(luò)通信有限公司重慶市分公司工程師,主要從事IP網(wǎng)及支撐系統(tǒng)運(yùn)維管理工作。
2016-11-13;
2017-01-05