路沙
系統(tǒng)規(guī)模越來越復(fù)雜、組件越來越多、用戶的流量不斷上升、事件變更指標(biāo)呈非線性增長……面對不斷變化的應(yīng)用場景,傳統(tǒng)金融業(yè)的運(yùn)維方式和手段似乎顯得有些無能為力,不僅無法滿足互聯(lián)網(wǎng)金融的建設(shè)要求,無法隨著業(yè)務(wù)的需求實(shí)現(xiàn)敏捷開發(fā),更不能實(shí)現(xiàn)快速持續(xù)交付、融合化及互聯(lián)網(wǎng)化的目標(biāo)。
失去運(yùn)維保障,金融業(yè)務(wù)開展勢必會困難重重、寸步難行。然而,摒棄傳統(tǒng)的運(yùn)維方式,什么樣的運(yùn)維方式才能一勞永逸地解決所有問題呢?在IBM大中華區(qū)全球信息科技服務(wù)部, 技術(shù)支持服務(wù)部副總裁安婷看來,AI技術(shù)的出現(xiàn)使得金融行業(yè)的運(yùn)維痛點(diǎn)迎刃而解。智能運(yùn)維不再是金融行業(yè)的可選項(xiàng),而成為發(fā)展的必選項(xiàng)。
為此,IBM聯(lián)合清華大學(xué)智能運(yùn)維Netman實(shí)驗(yàn)室、一線銀行數(shù)據(jù)中心專家共同發(fā)布了首部《金融行業(yè)AIOps智能運(yùn)維白皮書》,旨在集合最高端的產(chǎn)、學(xué)、研能力,為廣大金融機(jī)構(gòu)和企業(yè)支招,以人機(jī)超融合,推動智能運(yùn)維的實(shí)踐落地?!禝BM 商業(yè)價值研究院 2018 人工智能報告》顯示,63%的企業(yè)缺乏能夠可靠利用人工智能潛力的技能。同時,大多數(shù)企業(yè)也認(rèn)為在IT、信息安全、創(chuàng)新、客戶服務(wù)和風(fēng)險管理方面采用人工智能可以獲得最大的價值。而人工智能的應(yīng)用在金融服務(wù)等數(shù)字化程度較高的行業(yè)很可能會加速推廣。需求與價值的有效對接勢必會碰撞出不一樣的火花。
復(fù)雜IT環(huán)境凸顯智能運(yùn)維深層價值
一直以來,金融行業(yè)都走在IT技術(shù)應(yīng)用發(fā)展的第一梯隊。一方面金融行業(yè)有著過往30年采用企業(yè)級IOE軟件硬件基礎(chǔ)架構(gòu)的長期經(jīng)驗(yàn),另一方面金融行業(yè)也在積極踐行開源軟件和互聯(lián)網(wǎng)架構(gòu)的應(yīng)用實(shí)施。
在迫切的業(yè)務(wù)需求面前,金融行業(yè)傳統(tǒng)IT運(yùn)維仍舊面臨著交付效率、運(yùn)維質(zhì)量等方面的多重壓力。再加上傳統(tǒng)金融機(jī)構(gòu)降低應(yīng)用成本、提高運(yùn)營效率、提升用戶體驗(yàn)以及持續(xù)挖掘內(nèi)部潛力的需求也使得有效解決運(yùn)維難題顯得更為急迫。
為此,智能時代所帶來的DevOps、AIOps等方法及技術(shù),正在通過自動化替代傳統(tǒng)的工作方式,成為企業(yè)安全高效地進(jìn)行運(yùn)維和管理工作的重要工具。將AI與業(yè)務(wù)運(yùn)維場景結(jié)合,可以實(shí)現(xiàn)智能化異常監(jiān)測與預(yù)測、智能化告警引擎、自動化故障處置。而通過對數(shù)據(jù)的有效整合和利用,能夠幫助企業(yè)建立全新的數(shù)字化業(yè)務(wù)監(jiān)控指標(biāo)體系和業(yè)務(wù)運(yùn)維考評規(guī)范,確保業(yè)務(wù)管理流程的高效管控。
這與IBM所倡導(dǎo)的AIOps理念不謀而合。而在此基礎(chǔ)上,IBM還提出打造“運(yùn)維大腦”以及構(gòu)建人機(jī)超融合的運(yùn)維模式,希望以智能運(yùn)維的方式帶來顛覆性的運(yùn)維思維和效應(yīng),從而賦予現(xiàn)有系統(tǒng)智能。
構(gòu)建智能運(yùn)維平臺 打造“運(yùn)維大腦”
經(jīng)過多年的發(fā)展,金融企業(yè)不同時期應(yīng)用的硬件、軟件眾多,品牌、架構(gòu)復(fù)雜。IBM智能運(yùn)維架構(gòu),可以幫助不同用戶整合不同的IT產(chǎn)品,最終實(shí)現(xiàn)智能運(yùn)維。IBM認(rèn)為,基于AI的智能運(yùn)維平臺將是未來運(yùn)維的焦點(diǎn)核心,并將成為數(shù)據(jù)中心的“運(yùn)維大腦”。
“運(yùn)維大腦”通過機(jī)器學(xué)習(xí)可以了解歷史數(shù)據(jù)的運(yùn)行規(guī)律,通過分析和總結(jié)系統(tǒng)運(yùn)維過程中的各種狀況和規(guī)律,并針對不同應(yīng)用場景建立模型,可以實(shí)現(xiàn)對針對性能指標(biāo)的異常波動進(jìn)行提前預(yù)警,主動運(yùn)維,并自動挖掘數(shù)據(jù)背后的現(xiàn)象,快速定位系統(tǒng)瓶頸,從而為銀行的各種應(yīng)用提供安全防護(hù)。
以某全國性大型銀行為例,該銀行在 2016 年率先啟動 IBM 智能運(yùn)維平臺項(xiàng)目,每日處理數(shù)據(jù)增量達(dá)TB級,覆蓋個人網(wǎng)銀、手機(jī)銀行等重要業(yè)務(wù)系統(tǒng),初步建立了數(shù)據(jù)中心的“運(yùn)維大腦”。如某一時段發(fā)現(xiàn)手機(jī)銀行發(fā)生交易緩慢,而影響手機(jī)銀行交易緩慢的主要原因是磁盤IO響應(yīng)時間,通過智能運(yùn)維平臺的切片分析發(fā)現(xiàn)該指標(biāo)的瞬間峰值是平時正常均值的20~30倍,通過應(yīng)用智能運(yùn)維平臺可以很快定位到故障的根源,從而為故障恢復(fù)爭取了時間。
人機(jī)超融合運(yùn)維保障企業(yè)永續(xù)
在過去30年,IBM專家團(tuán)隊在幫助金融客戶爆發(fā)式成長的過程中,積累了大量運(yùn)維實(shí)戰(zhàn)經(jīng)驗(yàn),通過人機(jī)融合能夠?qū)?fù)雜的運(yùn)維經(jīng)驗(yàn)轉(zhuǎn)化為抽象的AI語言,即把運(yùn)維知識沉淀總結(jié)為AI平臺可以接受的標(biāo)簽數(shù)據(jù),再通過AI平臺正向反饋和轉(zhuǎn)化成專家知識在運(yùn)維工作的價值,從而實(shí)現(xiàn)人機(jī)超融合的運(yùn)維新方式。
在安婷看來,面臨新的形勢,能夠充分利用最新科技、踐行永續(xù)理念的企業(yè)將先人一步,并有可能成為行業(yè)顛覆者和最后的贏家。在這個過程當(dāng)中,人機(jī)超融合運(yùn)維將發(fā)揮越來越重要的作用。
對此,IBM大中華區(qū)全球信息科技服務(wù)部、技術(shù)服務(wù)產(chǎn)品管理部總經(jīng)理孫建鋼也提到,智能運(yùn)維正處于天時地利人和俱佳的時期。IBM作為整個IT運(yùn)維行業(yè)的領(lǐng)先者,過去30多年與金融行業(yè)客戶共同成長。因此,在未來IBM也將和企業(yè)、客戶共同努力,將金融行業(yè)IT運(yùn)維水平提升到一個新臺階,實(shí)現(xiàn)與用戶的創(chuàng)新發(fā)展。