李東昊
摘要:為落實國家“十三五”信息化發(fā)展規(guī)劃的要求,更好地滿足業(yè)務部門需求,金融業(yè)信息化建設日益復雜,軟硬件的數量與規(guī)模成倍增長,這給IT運維人員帶來了極大的困難。以人工智能為代表的高新技術為IT運維打開了新局面。該文以IT運維的發(fā)展歷程為起點,分析了智慧運維在金融信息化建設存在的問題,并對未來發(fā)展提出了一些建議。
關鍵詞: 信息化建設; 金融業(yè); IT; 智慧運維
中圖分類號:TP391? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)08-0234-02
Abstract:In order to implement the requirements of the national 13th five year plan for information development and better meet the needs of business departments, the informatization construction of the financial industry has become increasingly complex, and the number and scale of software and hardware have increased exponentially, which has brought great opportunities to IT operation and maintenance personnel Difficulties. The new technology represented by artificial intelligence has opened a new horizon for IT operation and maintenance. Based on the development of IT operation and maintenance, this paper analyzes the problems of smart operation and maintenance in financial information construction, and puts forward some suggestions for future development.
Key words:information construction; financial industry; IT; smart operation and maintenance
運維是指運維人員通過規(guī)劃網絡、系統(tǒng)資源,從軟硬件兩個方面使用系統(tǒng)監(jiān)控、事件預警、業(yè)務調度、故障排查、安全維護及升級等手段保證信息系統(tǒng)處于安全穩(wěn)定,業(yè)務處于高可用的狀態(tài)。
隨著金融業(yè)信息化建設的不斷發(fā)展,運維體系經歷了從人工運維到自動化運維的轉變。人工智能領域的發(fā)展、大數據技術的推廣應用使人們的焦點從降低運維復雜度,轉向對智能化運維的探索。智慧運維指通過為運維技術賦“智”能,構建高效率的運維服務體系。
目前,金融業(yè)信息化建設已經從封閉、專用、集中的單數據中心轉型成了國產、開放、分布式的多數據中心。這使得傳統(tǒng)的運維手段難以適應當前的業(yè)務需求,科技部門需要花費大量人工成本去管理信息系統(tǒng)與設備。同時,生產環(huán)境下的業(yè)務系統(tǒng)需要穩(wěn)定的運行環(huán)境,增加了機房值守人員的運維壓力。綜上,加劇了金融業(yè)對現有的運維體系的創(chuàng)新需求。
1 研究現狀
智慧運維的思想由Gartner公司2016年提出并產生了AIOps這一專有名詞,最開始是Algorithmic IT Operations的縮寫。隨著人工智能領域的發(fā)展,越來越多的學者嘗試將AI技術引入到IT運維中,如今時代賦予了AIOps更加特殊的含義,即AI for IT Operations。2017年裴丹教授在中國應用性能管理大會上發(fā)表演講《智能運維中的科研問題》,主張應用AI技術從海量IT信息資源中學習運維規(guī)則。
IT運維的發(fā)展經歷了三個時期:手工運維、自動化運維、智慧運維。
受限于人為因素,手工運維在運維效率、系統(tǒng)可用性、系統(tǒng)可靠性上表現較差。同時在運維時需要掌握多種系統(tǒng)操作知識,指令多、流程復雜、學習成本大?;谝陨咸匦裕止み\維不適用于大型分布式、集群式的系統(tǒng)運維場景,在金融信息化領域已經較少使用。
為了降低人工成本,提高運維效率,自動化運維將煩瑣重復的操作命令,集成到自動化執(zhí)行工具中,有效地提升了運維效率。同時自動化的執(zhí)行指令,能夠避免因人為原因輸錯指令導致系統(tǒng)出現異常,因此具有較高的系統(tǒng)可靠性與可用性,在一定程度上降低了運維成本,節(jié)約了人力資源,是目前金融業(yè)廣泛使用的運維手段。國有商業(yè)銀行已基本實現IT集中化運維管理,并持續(xù)向深度自動化、云服務化方向發(fā)展[1]。
人工智能的發(fā)展促進了IT運維產業(yè)的發(fā)展,智慧運維通過應用大數據、深度學習等技術,能夠自動分析響應系統(tǒng)事件,并級聯(lián)多種自動化的運維工具處理事件,有效地提升了運維效率。通過預訓練智能化的模型,采用多種策略能夠及時對潛在異常進行智能分析、預警、決策,系統(tǒng)可靠性與可靠性表現最好,是目前針對大規(guī)模分布式系統(tǒng)運維的最理想的解決方案。
依托于目前運維監(jiān)控工具,能夠實現對IT基礎設施進行一定程度的可視化展示,這為智慧運維的發(fā)展奠定了基礎。通過運用AI技術、數據挖掘技術,構建模型預測或鑒別故障,實現智能化運維。通過動態(tài)調節(jié)參數閾值,結合數據實際進行運行情況分析,能夠及時發(fā)現潛在運行風險,提升故障檢測效率,同時也能降低金融機構的運維成本。相關互聯(lián)網商業(yè)產品不斷完善,其中,阿里巴巴GOC團隊發(fā)布了AIOps智能運維故障管理平臺;華為針對金融、運營商等行業(yè)提出了FusionInsight企業(yè)級大數據平臺,滿足行業(yè)日常運行維護需求。藍鯨智云運維平臺優(yōu)化任務調度引擎,實現了業(yè)務的自助式管理。在以金融業(yè)為代表的數據密集型行業(yè)中:中國聯(lián)通廣西分公司構建了一個高可用的微服務開發(fā)平臺,驗證了容器環(huán)境部署分布式運維支撐系統(tǒng)的可行性[2]。湖南煙草局針對云管理系統(tǒng)上的信息資源設計實現了基于大數據的智能運維系統(tǒng),智能分析采集的數據并快速做出響應,簡化了日常運維工作[3]。交通銀行構建了一體化運維體系,實現了業(yè)務生產系統(tǒng)的高效自動化運維[4],各功能模塊的低耦合設計,為AI技術的使用與推廣奠定基礎。工商銀行數據中心已經開始逐步規(guī)范運維對象改造現有運維系統(tǒng),從監(jiān)控體系、運維管理平臺、數據治理、新技術探索四個方面展開[5]。陽光保險從應用系統(tǒng)出發(fā)網絡、中間件、數據庫等數據層面打造了全鏈路監(jiān)控平臺,有效提升了企業(yè)系統(tǒng)運維能力。劉亞軍[6]設計提出了一個針對銀行IT服務運維監(jiān)控系統(tǒng),解決了跨平臺設備通用性差的問題,從而實現了對IT資源的有效管理。興業(yè)銀行在自動化運維的基礎上引入AI、大數據等技術,主動向精細化的以算法為主導的智慧運維轉型[7]。文獻[8] 提出了一種基于巡檢機器人的數據采集系統(tǒng)架構,探索了巡檢機器人在運營商數據中心的應用方式。這些案例說明智慧運維在金融行業(yè)正處于起步階段,還存在一些問題需要進一步研究。
2 智慧運維在金融業(yè)推廣存在的困難
2.1 智慧運維建設成本大,維護更新頻繁
建設成本主要體現在運行基礎環(huán)境以及后期維護上,智慧運維是在數據驅動的基礎上通過經過大量運算實現的,需要耗費大量的計算資源及數據存儲資源。同時在部署與應用過程中需要根據采集數據不斷對模型進行更新維護,難以預測對業(yè)務的影響范圍且在業(yè)務場景下的故障溯源工作量大。
2.2 多來源數據采集存在壁壘
智慧運維依靠異常檢測、時序預測等模式識別技術對采集數據進行關聯(lián)分析。要實現高質量的運維離不開高質量的數據,業(yè)務穩(wěn)定運行過程中存在大量數據信息,包括硬件設備、數據庫、中間件、運行物理環(huán)境等監(jiān)控數據,系統(tǒng)、應用、網絡等日志數據,加之對應設備的配置數據,如何關聯(lián)時序信息,打通多源數據交互通道仍是智慧運維體系建設所面臨的挑戰(zhàn)。
2.3 金融科技標準規(guī)范需要更進一步加強
金融業(yè)務場景下,應用人工智能技術試點單位較少,以人工智能為代表的新技術尚未在金融業(yè)運維場景下證明其技術穩(wěn)定性與可靠性。將人工智能技術引入金融領域,目前仍存較大金融風險,其中涉及機構金融信息保護,金融數據安全,相應的金融應用新技術風險排查制度及對應金融標準制定不夠詳細,需要進一步完善。
3 結束語
金融業(yè)的高速發(fā)展離不開科技的支持,隨著高新技術的發(fā)展,銀行對信息化建設要求更高,運維任務更重。智慧運維技術的出現很好地解決了事前預測、事后定位回溯等傳統(tǒng)運維難題,對金融業(yè)的發(fā)展具有重要意義。未來引導高新技術與生產環(huán)境相適應,可采取試點的方式,逐步從測試到生產環(huán)境過度。
參考文獻:
[1] 莫軍輝.商業(yè)銀行數據中心運維自動化建設探討[J].金融科技時代,2019,27(8):13-19.
[2] 羅勻嶺,陳海波,陸薈,等.基于分布式容器環(huán)境的智慧運維開發(fā)平臺研究[J].廣西通信技術,2019(3):43-47.
[3] 鐘湘瓊.基于云計算的大數據智能運維系統(tǒng)設計[J].信息通信,2016,29(2):146-147.
[4] 孫宇峰,李銳.商業(yè)銀行信息系統(tǒng)自動化運維的研究與實踐[J].金融電子化,2018(9):82-84.
[5] 丁旭東.數據中心的智能運維方法[J].金融電子化,2019(1):43.
[6] 劉亞軍.濟南天津銀行IT設備運維監(jiān)控系統(tǒng)的設計與實現[D].成都:電子科技大學,2014.
[7] 張慶豐,孟錦婷.擁抱自動化智能化,推動運維模式轉型——興業(yè)銀行數據中心運維轉型探索與實踐[J].中國金融電腦,2018(7):32-35.
[8] 劉孝頌,黃挺.巡檢機器人在互聯(lián)網數據中心智能運維中的應用探索與研究[J].電信科學,2018,34(12):132-137.
【通聯(lián)編輯:代影】