熊鷹,周御峰,謝捷( 中國移動(dòng)通信集團(tuán)四川有限公司達(dá)州分公司,達(dá)州 635000; 中國移動(dòng)通信集團(tuán)四川有限公司, 成都 60097)
基于數(shù)據(jù)挖掘技術(shù)的告警恢復(fù)模型
熊鷹1,周御峰2,謝捷2
(1 中國移動(dòng)通信集團(tuán)四川有限公司達(dá)州分公司,達(dá)州 635000;2 中國移動(dòng)通信集團(tuán)四川有限公司, 成都 610097)
隨著信息通信網(wǎng)絡(luò)設(shè)備功能和業(yè)務(wù)服務(wù)的發(fā)展,監(jiān)控部門在網(wǎng)絡(luò)維護(hù)日常工作中的作用日益突出。本文利用數(shù)據(jù)挖掘中的K-means算法對半年內(nèi)的原始告警做聚類分析,論述了告警恢復(fù)所遵循的普遍規(guī)律,并分別利用離散和連續(xù)兩種方法建立數(shù)學(xué)模型對最佳派單時(shí)間點(diǎn)的設(shè)置進(jìn)行研究,為告警管理的提升以及大數(shù)據(jù)技術(shù)在電信運(yùn)營商中的使用提供了思路和建議。
大數(shù)據(jù);數(shù)據(jù)挖掘;K-means;回歸分析
近些年來,隨著國民經(jīng)濟(jì)的不斷發(fā)展以及電信業(yè)改革的不斷深入,信息通信網(wǎng)絡(luò)在規(guī)模上不斷擴(kuò)大,在多業(yè)務(wù)上逐漸融合,并且新業(yè)務(wù)的引入速度也在加快,這些變化無疑會(huì)給電信網(wǎng)絡(luò)管理及維護(hù)工作帶來極大的挑戰(zhàn),另外,目前的國內(nèi)通信服務(wù)競爭態(tài)勢更是日益白熱化。因此,“支撐一線”、“客戶感知”和“網(wǎng)絡(luò)質(zhì)量”將會(huì)是電信運(yùn)營商日常工作的重中之重,如何保障通信企業(yè)的生命線,作為一項(xiàng)迫切需要解決的任務(wù),已經(jīng)擺在了新形勢下的電信運(yùn)營商面前。
監(jiān)控部門作為網(wǎng)絡(luò)維護(hù)工作中的核心部門,承擔(dān)著全省通信網(wǎng)絡(luò)7×24 h集中故障管理以及重大故障、突發(fā)事件的快速響應(yīng)任務(wù),有著舉足輕重的作用。與此同時(shí),四川省與東部省份相比,具有特殊的地貌特征并且地震、泥石流等自然災(zāi)害發(fā)生的次數(shù)較多,這不僅給一線網(wǎng)絡(luò)維護(hù)工作帶來了影響,也使得對網(wǎng)絡(luò)中產(chǎn)生的大量告警進(jìn)行有效地工單派發(fā)成為了一個(gè)重要而迫切的管理需求。
告警分析作為監(jiān)控部門的一項(xiàng)日常工作早已深入人心,其不僅對網(wǎng)絡(luò)維護(hù)工作具有實(shí)際的指導(dǎo)意義,同時(shí)也將直接決定故障處理時(shí)長,從而影響客戶感知。
為了深化網(wǎng)絡(luò)運(yùn)維體制改革,加快形成“集中化網(wǎng)絡(luò)維護(hù)管理和屬地化服務(wù)支撐相結(jié)合”的運(yùn)維模式,以省為單位的集中故障管理模式作為提升通信企業(yè)競爭力的途徑之一應(yīng)運(yùn)而生。
在集中化故障管理的具體實(shí)施過程中,故障從發(fā)生到通知維護(hù)人員處理再到消除,大致需要經(jīng)歷以下7個(gè)階段:網(wǎng)絡(luò)設(shè)備告警獲取、告警關(guān)聯(lián)、告警標(biāo)準(zhǔn)化處理、故障工單派發(fā)、維護(hù)人員處理故障、故障工單回復(fù)和故障工單質(zhì)檢。因此,故障工單派發(fā)規(guī)則是否高效將直接影響故障歷時(shí)。
故障工單派發(fā)時(shí)延點(diǎn)的設(shè)置,對于告警管理的效率具有至關(guān)重要的影響。其中,若是派單時(shí)間點(diǎn)設(shè)置的靠后,雖說可以減少故障工單的數(shù)量,但另一方面也會(huì)使告警失去意義,無法發(fā)揮監(jiān)控部門故障及時(shí)發(fā)現(xiàn)并通知一線的作用;若是派單時(shí)間點(diǎn)設(shè)置的靠前,雖說能夠及時(shí)派單,減少故障歷時(shí),但同時(shí)也會(huì)使得故障工單數(shù)量大幅度上升,從而導(dǎo)致分公司花費(fèi)大量人力、物力苦于回復(fù)故障工單的情況。在目前的日常監(jiān)控工作中,告警派發(fā)故障工單的時(shí)間點(diǎn)設(shè)置,一般來說都是維護(hù)人員和監(jiān)控人員根據(jù)經(jīng)驗(yàn)隨意設(shè)定的一個(gè)延遲值,該延遲值的界定規(guī)則是模糊的,延遲或者提前多久缺乏嚴(yán)格的理論依據(jù)。與此同時(shí),延遲值設(shè)置的合理性是由一線維護(hù)人員的接單量多少來核算,只要接單量過大,就認(rèn)為不合理。因此,若是能夠通過一種有效的算法設(shè)置派單時(shí)延,并且科學(xué)地給出其合理性的評判標(biāo)準(zhǔn),則必將提高新形勢下網(wǎng)絡(luò)維護(hù)工作的管理效率。
在現(xiàn)有通信網(wǎng)絡(luò)中,不同專業(yè)、不同級別和不同地市的告警種類和特征繁多,若是對全量告警建立故障工單,不僅不會(huì)減少浩大的維護(hù)工作量,反而還會(huì)隱藏關(guān)鍵的故障源點(diǎn),從而導(dǎo)致故障得不到及時(shí)處理,直接影響網(wǎng)絡(luò)質(zhì)量。因此,需要對全量告警進(jìn)行統(tǒng)計(jì)分析。
以半年內(nèi)的64 892 918條告警為研究對象,按照不同專業(yè)、不同地市和不同級別的維度對其進(jìn)行整理,發(fā)現(xiàn)其中絕大多數(shù)告警的恢復(fù)模式并非是以勻速走勢呈現(xiàn),而是會(huì)在短時(shí)間內(nèi)自動(dòng)恢復(fù),如圖1所示。
圖1 多維度告警恢復(fù)模式
從圖1中可以得出,不同專業(yè)、不同地市和不同級別的告警恢復(fù)都呈現(xiàn)類似的“潮涌”現(xiàn)象,不難發(fā)現(xiàn),在告警恢復(fù)模式圖中存在這樣的一點(diǎn):該點(diǎn)之前的每一分鐘內(nèi)告警的恢復(fù)量較多,該點(diǎn)之后的每一分鐘內(nèi)告警恢復(fù)的較少。在本例中,具有這樣特征的點(diǎn)稱之為告警恢復(fù)拐點(diǎn)。可以猜想,若是把派單時(shí)間點(diǎn)設(shè)置在告警恢復(fù)拐點(diǎn),不僅可以大量減少故障工單派發(fā)量,同時(shí)也能夠使故障得到及時(shí)處理,從而提高告警管理能力。
由上述可知,不能僅僅分析各種告警匯總的表現(xiàn),而是應(yīng)該采取逐一分析的方式研究告警恢復(fù)模式。與此同時(shí),考慮到研究對象是半年內(nèi)由網(wǎng)絡(luò)設(shè)備獲取的64 892 918條原始告警,數(shù)據(jù)量極大,因此,需要采用大數(shù)據(jù)的分析手段首先對原始告警進(jìn)行處理。對64 892 918條原始告警按照告警標(biāo)題進(jìn)行篩選,可以劃分為4 439種相互獨(dú)立的告警。通過對這些告警的分析,發(fā)現(xiàn)不同告警的告警量存在極大的差異,極少數(shù)的告警具有極大的告警數(shù)量,絕大多數(shù)的告警的數(shù)量卻是微不足道。若是設(shè)定一種告警平均每天發(fā)生11次為門限(平均每個(gè)月發(fā)生333次,半年發(fā)生1 998次),超過此門限值,則認(rèn)為屬于大告警量的告警,那么,統(tǒng)計(jì)結(jié)果近似符合2/8原則,即超過這一門限值的告警共有885種,占總數(shù)的19.937%,大約20%種告警產(chǎn)生的告警次數(shù)占總次數(shù)的80%。因此,對于告警恢復(fù)模式的分析,只需要關(guān)注那些告警量大、告警級別高的告警。
3.1大數(shù)據(jù)與電信運(yùn)營商
隨著“互聯(lián)網(wǎng)+”新形態(tài)、新業(yè)態(tài)的推進(jìn),物聯(lián)網(wǎng)、云計(jì)算和大數(shù)據(jù)等作為新一代信息技術(shù)必將在經(jīng)濟(jì)社會(huì)中得到更大的延伸和發(fā)展。新的技術(shù)往往會(huì)帶來新的變革,目前,已經(jīng)有越來越多的企業(yè)和個(gè)人意識(shí)到大數(shù)據(jù)的巨大價(jià)值,也意識(shí)到大數(shù)據(jù)分析給傳統(tǒng)數(shù)據(jù)分析和處理技術(shù)帶來的挑戰(zhàn)。大數(shù)據(jù),是需要新處理模式才能具有更強(qiáng)決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn),具有Volume(大量)、Velocity(高速)、Variety(多樣)和Value(價(jià)值)的4V特點(diǎn)。
大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進(jìn)行專業(yè)化處理。電信運(yùn)營商的系統(tǒng)本質(zhì)是為用戶與用戶、設(shè)備與設(shè)備、用戶與設(shè)備之間提供通信信道,每天承載著海量信息,是互聯(lián)網(wǎng)大數(shù)據(jù)的源頭。在大數(shù)據(jù)應(yīng)用方面,電信運(yùn)營商具備無可比擬的數(shù)據(jù)資源,這在網(wǎng)絡(luò)維護(hù)和網(wǎng)絡(luò)優(yōu)化分析中體現(xiàn)的尤為充分。
3.2數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的以及隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。數(shù)據(jù)挖掘技術(shù)運(yùn)用于網(wǎng)絡(luò)指標(biāo)分析中,不需要事先對網(wǎng)絡(luò)的具體結(jié)構(gòu)或者組成有深層次的掌握,其主要是從有效地歷史告警數(shù)據(jù)集合中依靠挖掘工具來發(fā)現(xiàn)數(shù)據(jù)背后的規(guī)律。常見的數(shù)據(jù)挖掘系統(tǒng)模型如圖2所示。
圖2 數(shù)據(jù)挖掘系統(tǒng)模型
利用數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)進(jìn)行分析,常用的方法主要有以下幾種:分類、回歸分析、聚類、關(guān)聯(lián)規(guī)則、偏差分析、Web頁挖掘等,它們分別從不同的維度對數(shù)據(jù)進(jìn)行挖掘。其中,較為常見的是聚類分析,它是把一組數(shù)據(jù)按照相似性和差異性分為幾個(gè)類別,每個(gè)類別又稱之為簇,其目的是使得屬于同一類別的數(shù)據(jù)之間的相似性盡可能大,不同類別的數(shù)據(jù)之間的相似性盡可能小。該分析方法常常應(yīng)用在客戶背景分析、客戶購買趨勢預(yù)測以及市場的細(xì)分等領(lǐng)域。
3.3K-means聚類算法
K-means算法是聚類分析中的經(jīng)典算法,采用歐氏距離作為相似性的評價(jià)指標(biāo),即認(rèn)為兩個(gè)對象的距離越近,其相似度就越大。該算法認(rèn)為簇是由距離靠近的對象所組成,因此,把得到緊湊且獨(dú)立的簇作為最終的目標(biāo)。其計(jì)算過程可以非常直觀地分為以下5步。
(1)從D中隨機(jī)取K個(gè)元素,作為K個(gè)簇的各自的中心。
(2)分別計(jì)算剩下的元素到K個(gè)簇中心的相異度,將這些元素分別劃歸到相異度最低的簇。
(3)根據(jù)聚類的結(jié)果,重新計(jì)算K個(gè)簇各自的中心,計(jì)算方法是取簇中所有元素各自維度的算術(shù)平均數(shù)。
(4)將D中全部元素按照新的中心重新聚類,直到標(biāo)準(zhǔn)測度函數(shù)開始收斂為止,標(biāo)準(zhǔn)測度函數(shù)一般選取均方差。
(5)將結(jié)果輸出。
利用K-means算法確定的K個(gè)簇到達(dá)的平方誤差最小。另外,在處理大數(shù)據(jù)集時(shí),相對可伸縮,其計(jì)算復(fù)雜度為O(NKt),其中N是數(shù)據(jù)對象的數(shù)目,t是迭代次數(shù)。
3.4數(shù)據(jù)分析
利用K-means算法對4 439種告警進(jìn)行聚類分析。4 439種告警作為一個(gè)元素集合,對集合中的每一個(gè)元素進(jìn)行30維坐標(biāo)量化,坐標(biāo)值為(A_1,A_2…A_29,A_30),其中,A_n為告警在單位時(shí)間內(nèi)的恢復(fù)占比。從元素集合中隨機(jī)挑選5個(gè)元素作為第一次聚類的中心,然后,分別計(jì)算剩余的4 434種告警和5個(gè)中心之間的歐氏距離以判斷相異度,并把相異度最小的劃分到一個(gè)簇中,依次迭代,直到標(biāo)準(zhǔn)測度函數(shù)收斂。聚類分析的結(jié)果如圖3所示。
圖3 K-means聚類分析
從圖3可以看出, 4 439種告警聚合成為5大類,其中,占比特征-1所占比例最大(57.2%),其告警恢復(fù)曲線衰減極快,占比特征-2所占比例次之(26.0%),恢復(fù)曲線衰減緩慢,占比特征-3/4/5所占比例較小,并且恢復(fù)曲線的峰值不在最初的幾分鐘,即潮涌現(xiàn)象不明顯。因此,占比特征-1中的級別較高的告警將是值得關(guān)注的重點(diǎn)。
以占比特征-1告警中的PWE3-CES分組丟失狀態(tài)告警(一級告警)為研究對象,對其恢復(fù)模式曲線建立數(shù)學(xué)模型以求得告警恢復(fù)拐點(diǎn),并把此點(diǎn)作為派發(fā)工單時(shí)間點(diǎn)用于工程實(shí)踐。
4.1原有模型
PWE3-CES分組丟失狀態(tài)告警的恢復(fù)模式曲線如圖4所示,以7個(gè)點(diǎn)的分布來代替在某個(gè)時(shí)間點(diǎn)鄰域內(nèi)的曲線走勢,即以某一點(diǎn)為中心,往前取3個(gè)點(diǎn),往后取3個(gè)點(diǎn),進(jìn)行模擬。以n=4為例:
圖4 模型原理圖
由于只關(guān)注K4在K1~K30中是否為最大,并不關(guān)注具體的值,因此,為了方便計(jì)算,可以對上式進(jìn)行歸一化處理:
進(jìn)而可以抽象出一般權(quán)值公式:
在上式中,Kn代表不同時(shí)間點(diǎn)的權(quán)值,An是指單位時(shí)間內(nèi),告警恢復(fù)的百分比。例如A3代表的是2~3 min期間恢復(fù)的告警占總告警的百分比。0~30 min 內(nèi)Kn最大時(shí)的那個(gè)n,就是我們尋找的告警恢復(fù)拐點(diǎn)。
通過公式(3)計(jì)算可得,本例中的n=4時(shí),Kn取得最大值0.593 5。因此,對于PWE3-CES分組丟失狀態(tài)告警,最佳派發(fā)時(shí)間點(diǎn)應(yīng)該設(shè)置為4 min。
4.2原有模型的分析
模擬曲線所用的離散點(diǎn)個(gè)數(shù)是設(shè)置在一個(gè)比較模糊的規(guī)則之上,模型中采用7個(gè)點(diǎn)是依據(jù)經(jīng)驗(yàn)所設(shè),并沒有進(jìn)行準(zhǔn)確性論證,因此,無法和設(shè)置為其它個(gè)數(shù)時(shí)的情況相比較。另外,針對每一條告警,都需要計(jì)算30 個(gè)Kn(K1~K30),每一個(gè)Kn又需要利用前后共7個(gè)點(diǎn)進(jìn)行11次運(yùn)算,因此,該模型總共需要進(jìn)行146.5萬次(4 439×30×11≈1.46×106)運(yùn)算,無疑會(huì)增加系統(tǒng)的空間復(fù)雜度和時(shí)間復(fù)雜度。基于以上兩點(diǎn)的分析,考慮對原有模型進(jìn)行改進(jìn),用回歸分析代替離散擬合,從而彌補(bǔ)原有模型的局限性。
4.3模型的改進(jìn)
4.3.1冪函數(shù)、最小二乘法、多元函數(shù)極值
由于告警恢復(fù)模式和冪函數(shù)分布及其相似,因此,考慮采用冪函數(shù)模型進(jìn)行回歸分析:
由于最小二乘法具有較好的線性擬合特性,因此,對公式(4)兩邊取對數(shù),進(jìn)一步化簡得到:
對公式(5)進(jìn)行變量代換轉(zhuǎn)化(Y=logy,A=loga,B=b,X=logx;),得到:
根據(jù)最小二乘法原理,可以構(gòu)造出如下形式的多元函數(shù)M=M(A,B),當(dāng)公式(6)中的函數(shù)值與實(shí)驗(yàn)數(shù)據(jù)之間的偏差最小時(shí),M取得最小值,從而可以確定出公式(4)中的待定常數(shù)a和b,以滿足回歸分析的準(zhǔn)確性:
由多元函數(shù)極值的必要條件可知,當(dāng)M取極小值時(shí),必有公式(8)成立:
即:
通過列表計(jì)算,可得:
進(jìn)而求得:
把求得的a和b帶入公式(3~4),從而得到擬合后的曲線表達(dá)式:
4.3.2冪函數(shù)、SPSS回歸分析
通過SPSS軟件做出告警恢復(fù)模式的散點(diǎn)圖,并利用冪函數(shù)進(jìn)行回歸分析,結(jié)果如圖5所示。
從圖5中可以看出,通過冪函數(shù)進(jìn)行擬合的可決系數(shù)為99.3%, R2的值越接近于1,回歸方程的擬合度越好。同時(shí),從圖中也可以得到回歸方程的數(shù)學(xué)表達(dá)式:
形式上與最小二乘法求得的結(jié)果相一致。
4.3.3數(shù)學(xué)模型構(gòu)造
上式中,f'(n)代表n時(shí)刻擬合曲線的導(dǎo)數(shù)值(斜率),f'(n-1)代表前一時(shí)刻的導(dǎo)數(shù)值,Kn代表n時(shí)刻斜率相對于n-1時(shí)刻斜率的變化率,并作為n時(shí)刻告警恢復(fù)時(shí)間點(diǎn)的權(quán)值,使Kn最大的那個(gè)n值,就是我們尋找的告警恢復(fù)拐點(diǎn)。
圖5 SPSS回歸分析
把公式(11)代入(12)中,可以得到,當(dāng)n=2時(shí),Kn取得最大值0.855 7。因此,對于PWE3-CES分組丟失狀態(tài)告警,最佳派發(fā)時(shí)間點(diǎn)應(yīng)該設(shè)置為min。
4.4改進(jìn)后模型的分析
通過回歸分析建立的模型與真實(shí)值的誤差較小,即99.3%可以由該模型進(jìn)行解釋。另外,結(jié)合公式(12)可以得到該模型需要進(jìn)行的計(jì)算量為39.9萬次(4 439×30×3≈ 3.99× 105),明顯少于原有模型,這不僅可以減輕系統(tǒng)運(yùn)算負(fù)荷,同時(shí)也能夠縮短運(yùn)算時(shí)長。
在工程實(shí)踐中,最終是選擇4 min還是2 min作為派單時(shí)間點(diǎn),還需要統(tǒng)籌兼顧綜合考慮。四川省各個(gè)地市分公司的維護(hù)條件不同,若是按照模型計(jì)算的結(jié)果統(tǒng)一設(shè)定明顯不合理,例如甘孜藏族自治州和自貢市相比,甘孜最遠(yuǎn)的基站離康定城區(qū)700多公里,驅(qū)車需要近20 h,就是當(dāng)?shù)伛v點(diǎn)的維護(hù)人員到最遠(yuǎn)的基站也需要15 h左右,然而自貢最遠(yuǎn)的基站離城區(qū)僅2 h車程。另外,四川省的地貌特征呈現(xiàn)多樣化,就算是在同一個(gè)分公司,地理環(huán)境也不盡相同,例如綿陽分公司的直屬區(qū)屬平原地形,江油市屬丘陵地形,北川羌族自治縣屬山區(qū)地形。
因此,以上兩種模型所計(jì)算出的結(jié)果只是作為派單時(shí)延點(diǎn)參考值,具體在工單派發(fā)系統(tǒng)上設(shè)定時(shí)仍需多方面考慮。
4.5派單策略的擴(kuò)展
4 439種告警聚合成5大類,每類占比特征各不相同,在具體的告警工單處理程序中,針對不同告警提供不同派單時(shí)延點(diǎn),如圖6所示。
圖6 派單策略實(shí)現(xiàn)框圖
對于告警量達(dá)到一定門限并且恢復(fù)模式符合“潮涌”現(xiàn)象的,利用模型計(jì)算時(shí)延點(diǎn)并把結(jié)果更新至告警派單時(shí)延映射表中,對于那些不符合條件的告警則根據(jù)其告警級別和專業(yè),采用默認(rèn)的派單時(shí)延并更新至映射表中。
通過兩種建模方法分別對告警恢復(fù)模式進(jìn)行分析,實(shí)現(xiàn)了大數(shù)據(jù)處理技術(shù)與數(shù)學(xué)模型的有效結(jié)合,對于監(jiān)控部門的日常告警分析工作具有實(shí)際指導(dǎo)意義。本例中,在PWE3-CES分組丟失狀態(tài)告警的工單派發(fā)策略更改前,時(shí)延點(diǎn)的設(shè)置為25 min,告警恢復(fù)占比為97%,工單派發(fā)量3張;策略更改后,時(shí)延點(diǎn)的設(shè)置改為3 min,恢復(fù)占比變?yōu)?8%,工單派發(fā)量變?yōu)?張,由此可以看出,采用新的工單派發(fā)策略后,工單派發(fā)量僅僅多了一張,然而派單時(shí)延點(diǎn)卻提前了88%(22 min),這就使得在控制工單量的基礎(chǔ)上故障仍然能夠及時(shí)通知的效果得到了充分體現(xiàn)。
另外,派單時(shí)間點(diǎn)的設(shè)置只是上述數(shù)學(xué)模型的一個(gè)應(yīng)用,其它方面,如網(wǎng)絡(luò)故障查找、告警關(guān)聯(lián)性分析是否也能夠應(yīng)用該模型可以作為未來工作的一個(gè)研究方向。在模型的改進(jìn)中,采用了斜率變化率的概念,若是改為曲率或者高階導(dǎo)數(shù)思想重新構(gòu)造數(shù)學(xué)模型,效果會(huì)不會(huì)更加完善,也可以作為以后工作的研究內(nèi)容。
大數(shù)據(jù)作為互聯(lián)網(wǎng)時(shí)代發(fā)展的必然產(chǎn)物,具有變革價(jià)值、變革經(jīng)濟(jì)和變革組織的力量,其核心在于對海量數(shù)據(jù)進(jìn)行存儲(chǔ)和分析。處于移動(dòng)互聯(lián)網(wǎng)時(shí)代的電信運(yùn)營商若是能夠有效地利用大數(shù)據(jù)分析技術(shù),并且充分發(fā)揮自身豐富的信息資源優(yōu)勢,則必然能挖掘出更多的價(jià)值,從而更好地服務(wù)于社會(huì)。
[1] 黎娟. 通信網(wǎng)網(wǎng)管支撐系統(tǒng)運(yùn)行質(zhì)量管控的研究與實(shí)現(xiàn)[J].電信科學(xué), 2013,29(12):139-144.
[2] 矯秀梅. 推進(jìn)集中故障管理提升網(wǎng)絡(luò)生產(chǎn)效率[J]. 科技與創(chuàng)新, 2014(20):75-77.
[3] 包劼. 大數(shù)據(jù),大變化,大未來-大數(shù)據(jù)支撐驅(qū)動(dòng)電信運(yùn)營商轉(zhuǎn)型發(fā)展[J].通信世界,2013(20):49-50.
[4] (加)Han J, Kamber M.數(shù)據(jù)挖掘概念與技術(shù)[M]. 范明, 孟小峰,等譯. 北京:機(jī)械工業(yè)出版社, 2001.223-262.
[5] 姜啟源. 數(shù)學(xué)模型[M]. 北京:高等教育出版社, 2011.
[6] 韓中庚. 數(shù)學(xué)建模方法及其應(yīng)用[M]. 北京:高等教育出版社,2009.
Discussion of alarm recovery model based on data mining technology
XIONG Ying1, ZHOU Yu-feng2, XIE Jie2
(1 China Mobile Group Sichuan Co., Ltd. Dazhou Branch, Dazhou 635000, China; 2 China Mobile Group Sichuan Co.,Ltd., Chengdu 610097, China)
With the development of the information communication network equipment functions and business services, the role of the monitoring department has become an increasing important in the daily work of network maintenance. In this paper, use the k-means algorithm of data mining to make cluster analysis with the original alarms which come from six months, discussing the universal rule of alarm restoration,establishing mathematical mode with discrete and continuous ways to study the setting of the optimum time, offering some ideas and suggestions for the alarm management and the use of big data technology.
big data; data mining; k-means; regression analysis
TN915
A
1008-5599(2016)08-0069-07
2016-01-01