• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      智能運(yùn)維,基于自學(xué)習(xí)的自動(dòng)化運(yùn)維

      2018-05-03 10:01:24杜永生
      信息通信技術(shù) 2018年1期
      關(guān)鍵詞:運(yùn)維規(guī)則預(yù)測(cè)

      杜永生

      中興通訊股份有限公司上海200123

      在AlphaGo戰(zhàn)勝李世石之后,深度學(xué)習(xí)和人工智能在各個(gè)行業(yè)迅速變得火熱起來(lái)。電信和金融兩個(gè)數(shù)字化最為成熟的領(lǐng)域首先受到影響,人工智能如何開(kāi)展,成為領(lǐng)域內(nèi)最為關(guān)注的問(wèn)題之一。因?yàn)檫@不僅僅涉及到企業(yè)當(dāng)前效率的提高,更有可能會(huì)影響到企業(yè)發(fā)展的后勁。本文從人工智能的發(fā)展出發(fā),衍生到如何在通信的運(yùn)維引入AI,進(jìn)一步闡述其解決的問(wèn)題以及對(duì)應(yīng)的方案,最后就后續(xù)的機(jī)會(huì)和挑戰(zhàn)作出介紹。由于個(gè)人知識(shí)有限,行業(yè)正處于高速發(fā)展的初期,所以本文的目的也僅是拋磚引玉,希望能引起大家的共鳴和思考。

      1 AI發(fā)展的三個(gè)階段

      人工智能的發(fā)展總體來(lái)說(shuō),分為三個(gè)階段,如圖1。第一個(gè)階段是以理解和模仿人的邏輯為主,典型的代表是“專(zhuān)家系統(tǒng)”(Expert Systems),產(chǎn)生各式各樣的規(guī)則。第二個(gè)階段是統(tǒng)計(jì)學(xué)習(xí)(Statistical Learning)階段,也是我們現(xiàn)在所處的階段,通過(guò)一些數(shù)據(jù)統(tǒng)計(jì)、概率分布的方式來(lái)發(fā)現(xiàn)數(shù)據(jù)之間的規(guī)律和問(wèn)題,比如通過(guò)回歸、隨機(jī)森林、SVM、GBM等方法,這個(gè)階段的顯著特點(diǎn)是需要事先通過(guò)專(zhuān)家確定好數(shù)據(jù)的特征,不同的特征對(duì)應(yīng)不同的算法。第三個(gè)階段是深度學(xué)習(xí)階段,這個(gè)階段的顯著特征是無(wú)需事先準(zhǔn)備特征,自動(dòng)生成模型,以神經(jīng)網(wǎng)絡(luò)算法為主。例如針對(duì)圖像識(shí)別,無(wú)須事先知道圖片的顏色、灰度、長(zhǎng)寬高等特征,就能夠自動(dòng)訓(xùn)練,對(duì)圖片進(jìn)行識(shí)別。

      圖1 人工智能發(fā)展的三個(gè)階段

      2 智能運(yùn)維的發(fā)展趨勢(shì):從基于規(guī)則到基于學(xué)習(xí)

      通信網(wǎng)絡(luò)的整個(gè)運(yùn)維過(guò)程,可以從高層抽象為4個(gè)過(guò)程(見(jiàn)圖2):被運(yùn)維對(duì)象建模,性能告警監(jiān)控,對(duì)于收到的數(shù)據(jù)進(jìn)行分析后再通過(guò)專(zhuān)家經(jīng)驗(yàn)進(jìn)行決策,最后通過(guò)配置腳本下發(fā)控制到被運(yùn)維對(duì)象上。這個(gè)過(guò)程中,多數(shù)自動(dòng)化措施和相關(guān)工具都是采用規(guī)則的方式實(shí)施,這種規(guī)則類(lèi)似第一代人工智能中的規(guī)則,通過(guò)其來(lái)達(dá)到管理系統(tǒng)的自動(dòng)化運(yùn)維。例如告警的過(guò)濾規(guī)則、性能管理中的QoS規(guī)則、自組織網(wǎng)絡(luò)中的ANR(自動(dòng)相鄰小區(qū)關(guān)系配置規(guī)則)。這里設(shè)置的規(guī)則都是專(zhuān)家經(jīng)驗(yàn)的積累,被設(shè)置到軟件系統(tǒng)中,用來(lái)達(dá)到自動(dòng)化運(yùn)維的目標(biāo)。

      圖2 運(yùn)維的過(guò)程抽象

      此處的規(guī)則就是在不同場(chǎng)景的運(yùn)維過(guò)程中由維護(hù)人員定義符合本場(chǎng)景需求的各種事件、行為之間的邏輯關(guān)系,然后軟件依照這種現(xiàn)場(chǎng)定義的邏輯關(guān)系來(lái)運(yùn)行,提高運(yùn)維的自動(dòng)化程度。目前,規(guī)則一般是由運(yùn)維人員在現(xiàn)場(chǎng)給出來(lái),并且也運(yùn)行的很好,那么由此會(huì)產(chǎn)生一個(gè)疑問(wèn),既然這樣,為什么還要改進(jìn)這個(gè)系統(tǒng),采用機(jī)器學(xué)習(xí)的方法呢?這是因?yàn)橐?guī)則設(shè)置的方式存在幾個(gè)缺陷:首先我們這個(gè)邏輯過(guò)程不能太復(fù)雜,否則只能用代碼實(shí)現(xiàn),而為了靈活性,我們又希望在現(xiàn)場(chǎng)直接定義,這樣就產(chǎn)生了矛盾;其次我們發(fā)現(xiàn)這個(gè)規(guī)則在少量節(jié)點(diǎn)的時(shí)候比較好定義,但是如果存在大量節(jié)點(diǎn),需要定義幾萬(wàn)、幾十萬(wàn)個(gè)規(guī)則,就非常困難了;最后對(duì)于大型的開(kāi)放網(wǎng)絡(luò),往往存在一定的生態(tài)性,即運(yùn)維人員不知道什么時(shí)候在這個(gè)網(wǎng)絡(luò)中會(huì)產(chǎn)生一個(gè)新的角色,這個(gè)角色會(huì)和其他角色產(chǎn)生什么關(guān)系,所以等到產(chǎn)生問(wèn)題,再來(lái)設(shè)置規(guī)則監(jiān)控時(shí),往往損失已經(jīng)發(fā)生,這類(lèi)典型的問(wèn)題就是金融風(fēng)控問(wèn)題,而通信中的5G網(wǎng)絡(luò)已經(jīng)被設(shè)計(jì)為大容量、能力開(kāi)放的生態(tài)網(wǎng)絡(luò),上面存在多層虛擬業(yè)務(wù)往來(lái),會(huì)不斷產(chǎn)生新的類(lèi)型的用戶,所以5G生態(tài)性的問(wèn)題如何監(jiān)控,也需要未雨綢繆。

      由此,我們把智能運(yùn)維定義為基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的運(yùn)維方式,其通過(guò)對(duì)運(yùn)維數(shù)據(jù)的學(xué)習(xí),能自行生成各種規(guī)則用于自動(dòng)監(jiān)控網(wǎng)絡(luò)異常,分析網(wǎng)絡(luò)異常事件原因,選擇網(wǎng)絡(luò)優(yōu)化和愈合行為;且隨著網(wǎng)絡(luò)運(yùn)行質(zhì)量和網(wǎng)絡(luò)拓?fù)涞淖兓?,原有的各種運(yùn)維規(guī)則能進(jìn)行自我演進(jìn)來(lái)適合當(dāng)前網(wǎng)絡(luò)的狀況。

      3 智能運(yùn)維場(chǎng)景研究

      既然要做智能運(yùn)維,首先要定義清楚我們利用機(jī)器學(xué)習(xí)相關(guān)技術(shù)能解決什么運(yùn)維問(wèn)題。業(yè)界對(duì)于這個(gè)問(wèn)題的解答,一般有兩個(gè)角度,一個(gè)是自上而下,看這些算法的應(yīng)用領(lǐng)域主要擅長(zhǎng)哪些問(wèn)題,盡量利用這些成熟的算法解決方案來(lái)解決問(wèn)題;其次是自下而上,對(duì)現(xiàn)有運(yùn)維流程進(jìn)行梳理,看存在哪些問(wèn)題,這些問(wèn)題能使用哪些算法解決或者改進(jìn)。

      前者往往容易實(shí)現(xiàn),且容易產(chǎn)生一些顛覆性的思路,但是不一定和現(xiàn)有管理非常貼合。目前深度學(xué)習(xí)的主要應(yīng)用領(lǐng)域在于語(yǔ)音、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理,這些領(lǐng)域有大量的論文,基本直接拿來(lái)就可以使用。例如目前深度學(xué)習(xí)的無(wú)人機(jī)技術(shù),AT&T正是從這個(gè)角度出發(fā),把能用的成熟的應(yīng)用技術(shù)放在自己的運(yùn)維體系中,通過(guò)無(wú)人機(jī)來(lái)進(jìn)行基站巡檢[1],使用深度學(xué)習(xí)的計(jì)算機(jī)視覺(jué)領(lǐng)域成果,發(fā)現(xiàn)基站的異常,一定程度上解決了國(guó)外人工費(fèi)用昂貴的問(wèn)題;另外通過(guò)無(wú)人機(jī)來(lái)尋找弱覆蓋區(qū)域[2],在覆蓋區(qū)域合理的部署無(wú)人機(jī),一定程度地解決整個(gè)運(yùn)維過(guò)程的真實(shí)閉環(huán)問(wèn)題,可以代替部分路測(cè)效果。

      目前自下而上的方式依然是主要的解決方向,這樣的流程改進(jìn)包含很多方面,例如部分國(guó)外運(yùn)營(yíng)商從SON或者網(wǎng)絡(luò)優(yōu)化流程出發(fā),通過(guò)將SON的算法調(diào)整到機(jī)器學(xué)習(xí)的算法,保證調(diào)整優(yōu)化的算法能夠自我演進(jìn),適用于不同的網(wǎng)絡(luò)狀況;或者通過(guò)預(yù)測(cè)提前進(jìn)行網(wǎng)絡(luò)調(diào)整。也有部分運(yùn)營(yíng)商從運(yùn)維角度出發(fā),提出根因分析、車(chē)輛優(yōu)化調(diào)度、無(wú)人值守等方案,都有其合理性。

      讓我們跳出通信網(wǎng)絡(luò)運(yùn)營(yíng)的范疇,看看相關(guān)的IT領(lǐng)域是如何看待這個(gè)問(wèn)題的。谷歌2016年提出基于機(jī)器學(xué)習(xí)的Zero Touch Network[3]的概念,其通過(guò)機(jī)器學(xué)習(xí)讓網(wǎng)絡(luò)層自適應(yīng)運(yùn)營(yíng)業(yè)務(wù)的變化,保證自動(dòng)擴(kuò)容,編排新的業(yè)務(wù)。Gartner 2017年的關(guān)于AI OPS[4]的報(bào)告中,則把智能運(yùn)維的關(guān)注點(diǎn)放在智能檢測(cè)、預(yù)測(cè)、根因分析三個(gè)維度。

      總結(jié)下來(lái),智能運(yùn)維解決的問(wèn)題,從抽象的層次來(lái)看,分為如下三點(diǎn)。

      1)提升網(wǎng)絡(luò)運(yùn)維的自動(dòng)化程度,減少人工參與,尤其在面對(duì)超大規(guī)模網(wǎng)絡(luò)的時(shí)候,光靠人力不僅運(yùn)維的及時(shí)性難以得到保證,運(yùn)維質(zhì)量的差異也非常大。

      2)其次接近開(kāi)放網(wǎng)絡(luò)生態(tài)性的問(wèn)題。所謂生態(tài)性就是開(kāi)放網(wǎng)絡(luò)具備不斷產(chǎn)生新的角色,網(wǎng)絡(luò)不斷演進(jìn)的特征。相對(duì)于人,智能運(yùn)維具備對(duì)新網(wǎng)絡(luò)更快的學(xué)習(xí)能力,實(shí)時(shí)產(chǎn)生新運(yùn)維規(guī)則保證網(wǎng)絡(luò)安全和服務(wù)質(zhì)量。

      3)最后基于機(jī)器學(xué)習(xí)的智能網(wǎng)絡(luò)具備一定的預(yù)測(cè)能力,能對(duì)某些問(wèn)題提前預(yù)測(cè),進(jìn)行解決和補(bǔ)償,相對(duì)于傳統(tǒng)運(yùn)維的事后處理,能夠讓運(yùn)營(yíng)商的相關(guān)運(yùn)維成本大大降低。

      筆者從當(dāng)前AI發(fā)展的技術(shù)特點(diǎn)、通信網(wǎng)絡(luò)的特征、運(yùn)維的場(chǎng)景幾個(gè)角度來(lái)看,智能運(yùn)維應(yīng)該分為以下(如圖3)四個(gè)階段,分別是規(guī)則、理解、預(yù)測(cè)、閉環(huán)。每個(gè)階段都有自己的獨(dú)立任務(wù)。

      圖3 智能運(yùn)維的四個(gè)階段和用例

      規(guī)則階段就是指當(dāng)前的階段,主要集中在當(dāng)前網(wǎng)絡(luò)管理系統(tǒng)的各種規(guī)則和腳本的編制階段。

      第二個(gè)階段則是理解階段,是指人工智能對(duì)于網(wǎng)絡(luò)的理解,包含各種數(shù)據(jù)、場(chǎng)景本身的理解以及各種數(shù)據(jù)場(chǎng)景之間因果關(guān)系的理解,未來(lái)5G網(wǎng)絡(luò)中采用多層虛擬網(wǎng)絡(luò),通過(guò)編排的方式為用戶提供服務(wù)[5],其中的數(shù)據(jù)節(jié)點(diǎn)和業(yè)務(wù)眾多,不同節(jié)點(diǎn)和業(yè)務(wù)的特征不同,通過(guò)人力來(lái)找到大量的個(gè)體特征幾乎無(wú)法完成,如網(wǎng)絡(luò)中的配置數(shù)據(jù)合理性的智能檢測(cè)、小區(qū)負(fù)荷潮汐效應(yīng)的特征檢測(cè)、告警的根因分析,而AI的學(xué)習(xí)能力恰好能彌補(bǔ)這一點(diǎn)。另外未來(lái)的5G網(wǎng)絡(luò)具備開(kāi)放性,新類(lèi)型的用戶不斷產(chǎn)生,AI能實(shí)時(shí)跟蹤理解這些角色的變化。

      第三個(gè)階段是指預(yù)測(cè)階段。在對(duì)于現(xiàn)有數(shù)據(jù)理解的基礎(chǔ)上,AI能力進(jìn)而可以發(fā)展到對(duì)于現(xiàn)有網(wǎng)絡(luò)未來(lái)趨勢(shì)的預(yù)測(cè)。運(yùn)營(yíng)商進(jìn)行運(yùn)維的最大目的是提高用戶感受,降低企業(yè)OPEX(運(yùn)營(yíng)成本)。傳統(tǒng)事后修復(fù)必然導(dǎo)致用戶感受的下降從而帶來(lái)OPEX的上升。如果能預(yù)測(cè),提前修復(fù)補(bǔ)償,這樣理論上網(wǎng)絡(luò)總是處于一種最優(yōu)的狀態(tài),OPEX理論上可以接近于零。最新的AI OPS[4]相關(guān)文章已經(jīng)把它作為自動(dòng)智能愈合的替代者來(lái)看待,認(rèn)為與其事后自動(dòng)優(yōu)化,不如事前預(yù)測(cè)后修復(fù)。

      第四階段是指閉環(huán)運(yùn)維階段。首先對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行理解,得到問(wèn)題的準(zhǔn)確上下文,然后通過(guò)日志分析學(xué)習(xí)用戶的運(yùn)維行為,把兩者通過(guò)策略結(jié)合在一起,形成一個(gè)閉環(huán)自動(dòng)運(yùn)維過(guò)程。

      如圖4所示,這個(gè)場(chǎng)景把智能運(yùn)維分為智能檢測(cè)和智能監(jiān)控兩個(gè)維度,每個(gè)維度有三個(gè)相關(guān)的大的場(chǎng)景,每個(gè)維度相關(guān)的主要數(shù)據(jù)在圓圈中說(shuō)明。這樣的維度分類(lèi)和通信網(wǎng)絡(luò)影響大、范圍廣的特征相關(guān)。由于AI的結(jié)果往往是一些概率性的結(jié)果,即使是高概率的結(jié)果,但是低概率的事情一旦發(fā)生,依然對(duì)于整個(gè)通信網(wǎng)絡(luò)的影響非常巨大,所以從運(yùn)營(yíng)的角度來(lái)看必然先發(fā)展智能監(jiān)測(cè)這個(gè)只讀場(chǎng)景。在智能監(jiān)測(cè)維度中,相對(duì)傳統(tǒng)運(yùn)維的流程大的改變是多了一個(gè)預(yù)測(cè)場(chǎng)景,即對(duì)網(wǎng)絡(luò)各種事件進(jìn)行預(yù)測(cè),好處前面已經(jīng)說(shuō)明;其次是傳統(tǒng)運(yùn)維場(chǎng)景中的改進(jìn)版本,智能的事件監(jiān)測(cè)和根因分析。而在智能監(jiān)控維度,第一個(gè)場(chǎng)景是原來(lái)SON(自組織網(wǎng)絡(luò))的改進(jìn),智能優(yōu)化,通過(guò)網(wǎng)絡(luò)事件預(yù)測(cè)和個(gè)性化網(wǎng)絡(luò)特征提取,使網(wǎng)絡(luò)優(yōu)化更加及時(shí)和更有針對(duì)性;智能編排則是針對(duì)用戶業(yè)務(wù)的修改,根據(jù)學(xué)習(xí)配備合適的網(wǎng)絡(luò)資源來(lái)滿足用戶新的服務(wù)質(zhì)量要求;自愈則是通過(guò)對(duì)于運(yùn)維知識(shí)庫(kù)的積累,從修復(fù)行為推薦逐漸演進(jìn)到自動(dòng)修復(fù)網(wǎng)絡(luò)軟件故障。

      圖4 智能運(yùn)維場(chǎng)景

      4 智能運(yùn)維解決方案

      智能運(yùn)維對(duì)應(yīng)的架構(gòu)如何設(shè)計(jì)才能滿足以上的場(chǎng)景和未來(lái)需要,我們選取IEEE 5G峰會(huì)中的《Autonomic Networks—Challenges in closing the loop》[6]文章中的架構(gòu)設(shè)計(jì)來(lái)略見(jiàn)一斑,這個(gè)結(jié)構(gòu)如圖5所示,由分析處理模塊、模型管理、推薦決策、校驗(yàn)應(yīng)用4個(gè)主要模塊構(gòu)成,其對(duì)應(yīng)的職責(zé)如下。

      分析處理(Lift,Analyze,Process)模塊:主要對(duì)于生產(chǎn)環(huán)境的實(shí)時(shí)數(shù)據(jù)進(jìn)行預(yù)處理、歸一化、相關(guān)性分析之后,通過(guò)模型匹配來(lái)輸出結(jié)果,此類(lèi)結(jié)果包含系統(tǒng)內(nèi)部的各種異常(例如單板、KPI指標(biāo)、KQI指標(biāo)異常等等),網(wǎng)絡(luò)關(guān)鍵事件的各種預(yù)測(cè)結(jié)果(例如小區(qū)負(fù)荷、信道頻率、指紋覆蓋、天饋老化、容量趨勢(shì)的預(yù)測(cè)),通過(guò)根因分析輸出某一個(gè)特殊事件的上下文,通常通過(guò)這個(gè)上下文能確定問(wèn)題的根本原因。

      模型管理模塊:主要職責(zé)是獲取歷史數(shù)據(jù),進(jìn)行機(jī)器學(xué)習(xí),輸出各種推理模型。其中輸出上下文識(shí)別、預(yù)測(cè)、異常檢測(cè)模型到分析處理模塊進(jìn)行上下文處理、策略和規(guī)則等到推薦決策模塊用于自動(dòng)化閉環(huán)運(yùn)維。

      推薦決策模塊:基于分析處理的上下文識(shí)別來(lái)確定當(dāng)前事件所處的環(huán)境之后,根據(jù)策略匹配對(duì)應(yīng)的后續(xù)處理行為,而行為列表則是基于用戶的維護(hù)習(xí)慣學(xué)習(xí)得來(lái)。通過(guò)這樣的方式,達(dá)到自動(dòng)運(yùn)維。

      校驗(yàn)應(yīng)用:通過(guò)各種規(guī)則對(duì)自動(dòng)運(yùn)維的結(jié)果進(jìn)行業(yè)務(wù)監(jiān)控,防止整個(gè)自動(dòng)化運(yùn)維跑偏。

      圖5 智能運(yùn)維架構(gòu)

      整個(gè)系統(tǒng)設(shè)計(jì)中,分析處理對(duì)應(yīng)上述的智能監(jiān)測(cè)閉環(huán),推薦決策對(duì)應(yīng)于智能控制閉環(huán),兩個(gè)閉環(huán)可以分別演進(jìn);其次存在一個(gè)糾偏系統(tǒng),這個(gè)是由大量的業(yè)務(wù)規(guī)則組成的,這也是由于通信網(wǎng)絡(luò)的重要性造成的,也是由于通信網(wǎng)絡(luò)生成(設(shè)備商)和經(jīng)營(yíng)(運(yùn)營(yíng)商)分離的特性導(dǎo)致的;最后這個(gè)架構(gòu)存在超級(jí)管理者,可以把整個(gè)自動(dòng)化智能運(yùn)維過(guò)程切斷;另外可以看到整個(gè)通信網(wǎng)絡(luò)機(jī)器學(xué)習(xí)的推理模型分為需求、預(yù)測(cè)、模式、推薦四種,分別代表用戶對(duì)于結(jié)果的要求、預(yù)測(cè)行為、問(wèn)題的上下文識(shí)別行為、自愈行為。

      目前通信網(wǎng)絡(luò)一般由OSS、EMS和NE(即一層網(wǎng)絡(luò)實(shí)體和兩層管理系統(tǒng))構(gòu)成。上述方案中的訓(xùn)練、分析、推薦、反饋系統(tǒng)和現(xiàn)有系統(tǒng)的關(guān)系如圖6,網(wǎng)元一般情況下只會(huì)增加一個(gè)通用推理功能,接收其他管理系統(tǒng)訓(xùn)練后的推理模型,在實(shí)際生產(chǎn)環(huán)境中接收實(shí)時(shí)數(shù)據(jù)后,實(shí)時(shí)推理,這種方式的特點(diǎn)是網(wǎng)絡(luò)的反應(yīng)具備實(shí)時(shí)性,這個(gè)稱(chēng)之為自環(huán);其次是在EMS中,對(duì)于本網(wǎng)絡(luò)的數(shù)據(jù)進(jìn)行訓(xùn)練,得到推理模型,然后在收到實(shí)時(shí)數(shù)據(jù)后進(jìn)行推理,或者把模型推送給網(wǎng)元。他具備了以上架構(gòu)中的所有元素,區(qū)別在于出于成本和職責(zé)的定位,其主要面對(duì)數(shù)據(jù)量不大的情況,非實(shí)時(shí)的推理情況,不會(huì)采取集群運(yùn)算和大規(guī)模矩陣運(yùn)算。最上層是大數(shù)據(jù)和AI平臺(tái)層,架構(gòu)元素則類(lèi)似EMS,只不過(guò)其支持大數(shù)據(jù)量訓(xùn)練、集群計(jì)算、矩陣運(yùn)算,其訓(xùn)練的推理模型可以在圖中的三個(gè)層次進(jìn)行共享。

      圖6 智能運(yùn)維三種環(huán)路

      這個(gè)架構(gòu)和當(dāng)前各層生產(chǎn)系統(tǒng)的現(xiàn)有模塊的關(guān)系還體現(xiàn)在其主要設(shè)計(jì)為側(cè)掛系統(tǒng),如Cognet報(bào)告[7]中所述,即提供各種服務(wù)給當(dāng)前生成系統(tǒng),如果撤除智能運(yùn)維框架,現(xiàn)有生產(chǎn)系統(tǒng)也照樣運(yùn)行,只是自動(dòng)化程度降低而已。

      5 智能運(yùn)維算法

      目前經(jīng)典的算法主要集中在智能監(jiān)測(cè)領(lǐng)域,對(duì)于智能控制這個(gè)領(lǐng)域的相關(guān)論文進(jìn)展不大,所以我們只針對(duì)最有可能落地的智能檢測(cè)的一些典型問(wèn)題、思路和相關(guān)算法做一下討論。圖7給出了關(guān)鍵算法問(wèn)題。

      圖7 智能運(yùn)維關(guān)鍵算法問(wèn)題定義

      自上而下看,任何一個(gè)異常,在監(jiān)測(cè)之后都希望找到其根本原因,根本原因則是通過(guò)故障傳播鏈來(lái)得到。一個(gè)故障傳播鏈需要從以下這樣幾個(gè)部分得到。

      通過(guò)機(jī)器聚類(lèi)學(xué)習(xí)在一些隨機(jī)事件中把屬于同一類(lèi)別的事件進(jìn)行歸類(lèi);然后通過(guò)異常事件之間的相關(guān)性分析,來(lái)發(fā)現(xiàn)這些事件的相關(guān)性有多大;通過(guò)異常服務(wù)和事件貢獻(xiàn)度的分析,找到導(dǎo)致異常服務(wù)的具體網(wǎng)絡(luò)事件;通過(guò)全鏈路調(diào)用挖掘發(fā)現(xiàn)不同組件、拓?fù)鋵?duì)象之間的關(guān)系,結(jié)合前面的分析,找到故障傳播鏈。另外對(duì)于事件的預(yù)測(cè)也可以成為事件異常檢測(cè)的一種手段,如果發(fā)現(xiàn)檢測(cè)的值相離預(yù)測(cè)值較遠(yuǎn),則認(rèn)為是異常。對(duì)于這些智能運(yùn)維關(guān)鍵問(wèn)題的通用算法總結(jié)如下。

      事件異常檢測(cè):基于窗口、預(yù)測(cè)、近似性、隱式馬爾可夫模型,也有機(jī)器學(xué)習(xí)、集成學(xué)習(xí)、遷移學(xué)習(xí)、深度學(xué)習(xí)、深度生成模型等算法。

      事件趨勢(shì)預(yù)測(cè):有ARIMA、EWMA、時(shí)序數(shù)據(jù)分解、RNN等算法。

      事件相關(guān)性:基本算法包括DTW、MK最佳配對(duì)等算法。

      事件聚類(lèi):聚類(lèi)用到的基本算法包括DBSCAN、K-medoids、CLARANS等算法。

      服務(wù)—事件貢獻(xiàn)度:用基本算法包括Pearson關(guān)聯(lián)分析、 J-Measure、 Two-sample test等算法。

      故障傳播鏈:現(xiàn)有文獻(xiàn)中常見(jiàn)的算法有FPGrowth、Apriori、隨機(jī)森林等算法。

      6 機(jī)會(huì)和挑戰(zhàn)

      盡管智能運(yùn)維有著美好的前景,但是不可否認(rèn),未來(lái)依然是機(jī)會(huì)和挑戰(zhàn)共存。筆者認(rèn)為,未來(lái)的挑戰(zhàn)來(lái)自如下幾個(gè)方面。

      首先是算法的挑戰(zhàn),由于智能運(yùn)維屬于專(zhuān)業(yè)領(lǐng)域,人工智能近幾年的發(fā)展主要集中在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言、語(yǔ)音等領(lǐng)域,在智能運(yùn)維領(lǐng)域的學(xué)術(shù)研究并不太多。目前的一些經(jīng)典算法主要集中在監(jiān)測(cè)領(lǐng)域,對(duì)于控制領(lǐng)域的算法和應(yīng)用則需要從業(yè)人員從基礎(chǔ)算法的選擇、超參尋找、參數(shù)調(diào)優(yōu)等探索開(kāi)始,起點(diǎn)比較低;同時(shí)高水平的人工智能學(xué)者目前也都處于視覺(jué)、語(yǔ)言等領(lǐng)域,本領(lǐng)域如果要提高影響力,則需要通過(guò)數(shù)據(jù)、業(yè)務(wù)進(jìn)行開(kāi)源,舉辦公開(kāi)比賽做起,如同谷歌李飛飛教授舉辦的ImageNet比賽,通過(guò)幾年的競(jìng)賽一下子把圖像識(shí)別的識(shí)別率超過(guò)了人類(lèi)。這些擴(kuò)大影響的措施則需要大家后續(xù)的共同努力。

      其次是數(shù)據(jù)同源的挑戰(zhàn),不可否認(rèn)目前在電信領(lǐng)域沉淀著非常多的數(shù)據(jù),但這些數(shù)據(jù)來(lái)自不同廠商,存儲(chǔ)類(lèi)型也不同,例如關(guān)系型、對(duì)象型、日志、文件型等等,性質(zhì)也不同,有生產(chǎn)數(shù)據(jù)、管理數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、網(wǎng)絡(luò)質(zhì)量數(shù)據(jù)等等。機(jī)器學(xué)習(xí)最擅長(zhǎng)的是數(shù)據(jù)相互之間關(guān)聯(lián)和發(fā)現(xiàn),那么關(guān)聯(lián)訪問(wèn)的效率也是一個(gè)非常大的挑戰(zhàn),另外把這些數(shù)據(jù)重新清洗、脫敏也是一個(gè)非常大的工程。

      最后一個(gè)是電信領(lǐng)域特有的問(wèn)題,電信領(lǐng)域網(wǎng)絡(luò)目前是生產(chǎn)和運(yùn)營(yíng)分離,對(duì)于不同運(yùn)營(yíng)商的網(wǎng)絡(luò),其所處地域、經(jīng)濟(jì)發(fā)展都不同,所以網(wǎng)絡(luò)模型也會(huì)存在差異。這樣對(duì)于生產(chǎn)商做出來(lái)的基礎(chǔ)算法模型,在不同的運(yùn)營(yíng)商不同的地域都需要重新訓(xùn)練和調(diào)整,這個(gè)就涉及到遷移學(xué)習(xí)的問(wèn)題,這也是通信領(lǐng)域面臨的一個(gè)挑戰(zhàn)。

      盡管存在一些問(wèn)題,但是基于機(jī)器學(xué)習(xí)的智能運(yùn)維目前已經(jīng)勢(shì)不可擋。經(jīng)營(yíng)常態(tài)促使我們不斷思考如何讓運(yùn)維更智能,不僅限于滿足業(yè)務(wù),而且能挖掘出新的創(chuàng)新型業(yè)務(wù)機(jī)會(huì),更好地服務(wù)最終用戶。

      [1]AT&T and Intel? to Test Drones on LTE Network.Mobile World Congress in Barcelona[EB/OL].[2018-1-10].http://about.att.com/story/att_and_intel_to_test_drones_on_lte_network.html

      [2]Betsy Lillian.AT&T Exploring Artificial Intelligence for UAV Tower Inspections.Unmanned-Aerial Online[EB/OL].[2018-1-10].https://unmanned-aerial.com/attexploring-artificial-intelligence-uav-tower-inspections

      [3]Bikash Koley.The Zero Touch Network[EB/OL].[2018-1-10].https://research.google.com/pubs/pub45687.html

      [4]2017 Market Guide for AIOps Platforms[EB/OL].[2018-1-5].https://www.moogsoft.com/resources/aiops/guide/gartner-2017-aiops-market-guide/

      [5]5G PPP Architecture Working Group.View on 5G Architecture[EB/OL].[2018-1-10].https://5g-ppp.eu/wpcontent/uploads/2014/02/5G-PPP-5G-Architecture-WPJuly-2016.pdf

      [6]5G & Autonomic Networks Challenges in Closing the Loop.5gsummit[EB/OL].[2018-1-10].http://www.5gsummit.org/docs/slides/Sven-Meer-5GSummit-Princeton-05262015.pdf

      [7]An NFV/SDN based architecture for Autonomic 5GNetwork Management using Machine Learning[EB/OL].[2018-1-10].http://www.cognet.5g-ppp.eu/wpcontent/uploads/2015/08/ETSI-CogNet-A0_Poster_final.pdf

      猜你喜歡
      運(yùn)維規(guī)則預(yù)測(cè)
      無(wú)可預(yù)測(cè)
      黃河之聲(2022年10期)2022-09-27 13:59:46
      選修2-2期中考試預(yù)測(cè)卷(A卷)
      選修2-2期中考試預(yù)測(cè)卷(B卷)
      撐竿跳規(guī)則的制定
      數(shù)獨(dú)的規(guī)則和演變
      運(yùn)維技術(shù)研發(fā)決策中ITSS運(yùn)維成熟度模型應(yīng)用初探
      風(fēng)電運(yùn)維困局
      能源(2018年8期)2018-09-21 07:57:24
      讓規(guī)則不規(guī)則
      Coco薇(2017年11期)2018-01-03 20:59:57
      雜亂無(wú)章的光伏運(yùn)維 百億市場(chǎng)如何成長(zhǎng)
      能源(2017年11期)2017-12-13 08:12:25
      不必預(yù)測(cè)未來(lái),只需把握現(xiàn)在
      建始县| 湘潭县| 宣威市| 云林县| 洞头县| 湖口县| 灵宝市| 桦南县| 定襄县| 青海省| 三亚市| 禄劝| 达孜县| 新龙县| 舞钢市| 汽车| 射洪县| 宝丰县| 揭阳市| 苏尼特右旗| 太保市| 石泉县| 烟台市| 佛坪县| 佛冈县| 富平县| 乳山市| 海南省| 江城| 阳春市| 阳朔县| 垫江县| 武清区| 江源县| 拜泉县| 正蓝旗| 和林格尔县| 南康市| 崇阳县| 固镇县| 万安县|