當(dāng)前運(yùn)維已由監(jiān)控告警的初級形式向著自動化、智能化方向演進(jìn)。進(jìn)入運(yùn)維4.0時代后,通過引入網(wǎng)絡(luò)流量分析數(shù)據(jù)來實(shí)現(xiàn)針對大量應(yīng)用、業(yè)務(wù)日志的集中式高效分析。
成都科來軟件有限公司技術(shù)經(jīng)理齊宇飛(如圖1)解釋了運(yùn)維新時代的實(shí)現(xiàn)途徑,即以大數(shù)據(jù)和機(jī)器學(xué)習(xí)為手段,整合現(xiàn)有多種監(jiān)控?cái)?shù)據(jù)和業(yè)務(wù)數(shù)據(jù)、事件,結(jié)合原有的人工運(yùn)維操作等,實(shí)現(xiàn)復(fù)雜能力的工具化,進(jìn)而實(shí)現(xiàn)運(yùn)維操作的自動化,或稱之為“AIOps”,如圖2。
科來以網(wǎng)絡(luò)全流量分析作為切入點(diǎn),努力實(shí)現(xiàn)以上目標(biāo),但要實(shí)現(xiàn)全流量的分析并不簡單, 對于數(shù)據(jù)中心而言,傳統(tǒng)數(shù)據(jù)中心與云數(shù)據(jù)中心的運(yùn)維也有所不同,齊宇飛認(rèn)為,第一,如何獲取流量,比如有些數(shù)據(jù)中心是通過SDN的流量,它并不是那種傳統(tǒng)上可以做鏡像的,而科來是可以通過一定手段去實(shí)現(xiàn)的;第二是整體處理性能,當(dāng)萬兆口流量出現(xiàn)了,整機(jī)處理能力能不能跟上;第三,是否支持?jǐn)?shù)據(jù)中心級的部署模式,因?yàn)橐粋€數(shù)據(jù)中心有無數(shù)多的點(diǎn)要去采集,所以構(gòu)架一定是分布式的,多點(diǎn)采集,到統(tǒng)一的分析中心匯總;第四,在海量數(shù)據(jù)中如何找出問題點(diǎn)。
圖1 科來 齊宇飛
圖2 AIOps框架圖
現(xiàn)代化的數(shù)據(jù)中心是全流量分析的重要應(yīng)用場景,在數(shù)據(jù)中心側(cè),要能夠?qū)崿F(xiàn)應(yīng)用的全局監(jiān)控,快速準(zhǔn)確的展現(xiàn)應(yīng)用和業(yè)務(wù)運(yùn)行狀態(tài),同時對于應(yīng)用路徑的各個環(huán)節(jié)也必須實(shí)現(xiàn)全路徑監(jiān)控。不僅如此,還要考慮云計(jì)算虛擬化環(huán)境、SDN、移動互聯(lián)網(wǎng)等場景,并能在應(yīng)用交易路徑的所有環(huán)節(jié)都要部署流量采集點(diǎn),并加以統(tǒng)一視圖的分析。
在IT團(tuán)隊(duì)建設(shè)上,新一代的智能運(yùn)維平臺不能僅面向某一個團(tuán)隊(duì),網(wǎng)絡(luò)、應(yīng)用、研發(fā)、安全等各部門的配合也是業(yè)務(wù)穩(wěn)定運(yùn)行的關(guān)鍵,智能運(yùn)維平臺應(yīng)具備多層次的監(jiān)控運(yùn)維能力,既針對特定部門的特定需求提供精準(zhǔn)的監(jiān)控和操作工具,也可以針對部門間配合協(xié)調(diào)需求,提供集成化監(jiān)控分析和操作手段。
在未來,智能運(yùn)維是運(yùn)維發(fā)展的重要方向,而基于全流量分析技術(shù)則是實(shí)現(xiàn)智能運(yùn)維的重要手段之一,在此次“2018中國數(shù)據(jù)中心建設(shè)論壇”上,科來榮獲“2018企業(yè)級數(shù)據(jù)中心建設(shè)十大用戶信賴品牌”獎。