姜東參 扶湘典 黃紫翎
摘 要:三峽通航目前已經(jīng)建設了調(diào)度系統(tǒng)、安檢系統(tǒng)、遠程申報系統(tǒng)、綜合監(jiān)管系統(tǒng)、CCTV系統(tǒng)、PTN系統(tǒng)等大量信息系統(tǒng)。隨著新系統(tǒng)、新設備投入建設和使用,以及移動互聯(lián)網(wǎng)的迅速發(fā)展,原有的運維管理模式不足以滿足信息化水平的發(fā)展。對于如何優(yōu)化設備運行維護方式,提高運維管理效率,成為當前形勢下三峽通航信息化系統(tǒng)運維面臨的實際問題。本文結(jié)合實際,在IT運維監(jiān)管平臺的基礎上,結(jié)合局內(nèi)各業(yè)務系統(tǒng)的現(xiàn)狀,進行系統(tǒng)運維的功能分析和技術分析,就如何實現(xiàn)高效率的系統(tǒng)運維提供了經(jīng)驗和解決技術方案。
關鍵詞:三峽通航;IT運維監(jiān)管平臺;系統(tǒng)運維管理
中圖分類號:692? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? 文章編號:1006—7973(2021)11-0047-03
1 三峽通航系統(tǒng)運維現(xiàn)狀分析
按照“十三五”信息化發(fā)展的要求,三峽通航已經(jīng)建成了IT運維監(jiān)管平臺和故障管理系統(tǒng),在設備監(jiān)控、故障管理方面發(fā)揮了重要的作用,監(jiān)管對象主要包括調(diào)度系統(tǒng)、安檢系統(tǒng)、CCTV系統(tǒng)、數(shù)據(jù)中心和網(wǎng)絡系統(tǒng)的部分設備,但未能完全實現(xiàn)主動運維、精細運維的目標,距離現(xiàn)代化運維管理要求有一定的差距。隨著新增業(yè)務系統(tǒng)的上線,現(xiàn)有的運維管理模式無法滿足信息系統(tǒng)維護需求,主要表現(xiàn)在以下幾個方面:
(1)三峽局新增業(yè)務系統(tǒng)較多,對新增的業(yè)務系統(tǒng)無法實現(xiàn)運維監(jiān)測。
(2)IT運維管理平臺的監(jiān)控對設備的狀態(tài)監(jiān)控時能發(fā)揮較好的作用,但是對生產(chǎn)業(yè)務層面的監(jiān)控較為薄弱,對一些重要的接口、服務無法做到實時監(jiān)測狀態(tài)。
(3)IT運維監(jiān)管平臺監(jiān)管對象劃分不清晰,指標設置不能完全滿足精細運維的要求。
(4)故障申告系統(tǒng)具備故障申報記錄和故障處理的信息錄入功能,缺乏對故障的流程管理和故障反饋的評價。
這些問題將會導致故障發(fā)現(xiàn)不及時,影響系統(tǒng)的可用性。因此基于IT運維監(jiān)管平臺完善對相關業(yè)務的監(jiān)管提升運維管理效率是非常有必要的。
2 提升運維效率的技術應用分析
2.1技術應用分析
現(xiàn)有的移動互聯(lián)網(wǎng)技術具備覆蓋范圍廣、數(shù)據(jù)通信容量大的優(yōu)勢,IT運維管理平臺是三峽通航系統(tǒng)運維必備的系統(tǒng),將他們?nèi)诤掀饋恚_發(fā)出適應新需求和發(fā)展的功能服務模塊,是當前迅速實現(xiàn)要求有效的解決方案。
目前比較常用的有手機APP和企業(yè)微信兩種方式。手機APP安裝在移動終端上的軟件,以實現(xiàn)特定的功能;企業(yè)微信是專業(yè)化辦公管理工具,可以利用企業(yè)微信豐富的接口實現(xiàn)移動辦公的需求和應用,對比兩種技術,在開發(fā)難度、維護便捷性、交互性、網(wǎng)絡安全等方面進行統(tǒng)一考量,企業(yè)微信方式相對比較適合故障告警信息在移動互聯(lián)網(wǎng)客戶端推送。
2.2系統(tǒng)功能需求分析
2.2.1故障告警
通過移動端接口和內(nèi)部IT運維監(jiān)管平臺進行對接,系統(tǒng)產(chǎn)生故障后移動端自動推送信息給相應負責人員進行及時處理,實現(xiàn)故障告警提醒,需要對當前綜合運維管理系統(tǒng)的監(jiān)管對象和指標進行梳理,調(diào)整監(jiān)管對象、優(yōu)化性能監(jiān)管指標,明確哪些設備屬于哪個系統(tǒng)。按照系統(tǒng)類型,對設備進行詳細分類與補全,將之前沒有納入IT運維監(jiān)管平臺的設備添加進去,彌補以往單一根據(jù)設備類型分類的不足,增加按照業(yè)務系統(tǒng)分類的分類方式,根據(jù)業(yè)務系統(tǒng)劃分負責人,明確告警信息發(fā)送對象,同時,告警內(nèi)容詳細豐富,界面簡明。
2.2.2 設備分類及指標優(yōu)化
優(yōu)化對設備狀態(tài)監(jiān)控,添加需要監(jiān)控的設備狀態(tài),做到對各個系統(tǒng)以及通信信息設備做到全方位監(jiān)控,優(yōu)化不必要監(jiān)控的狀態(tài),防止因為過于追求監(jiān)控效果,導致監(jiān)控項增加,占用過多系統(tǒng)資源,進行影響系統(tǒng)的運行。此前,受監(jiān)控設備的分類比較單一,只按照設備類型分類,如操作系統(tǒng),數(shù)據(jù)庫,中同件,Web平臺,虛擬化平臺,網(wǎng)絡設備,CCTV,光纖交換機,存儲設備,動環(huán)及PTN等設備類型,沒有明確該設備所屬的系統(tǒng),一種類型的設備可能會存在多個系統(tǒng)之中,這樣系統(tǒng)產(chǎn)生故障并分派維修員時,容易造成不必要的麻煩。所以需要對受監(jiān)管設備進行詳細分類,按照設備類型以及所屬業(yè)務系統(tǒng)分類,明確系統(tǒng)責任人,按照所屬業(yè)務系統(tǒng)對設備進行分類,即GPS系統(tǒng),數(shù)據(jù)中心系統(tǒng),政務網(wǎng)站系統(tǒng),保障系統(tǒng),VTS系統(tǒng),CCTV系統(tǒng),網(wǎng)絡系統(tǒng)、調(diào)度系統(tǒng)等。明確主機名,IP、業(yè)務系統(tǒng)、管理員以及位置。示例如表1:
同時需要對監(jiān)控指標進行優(yōu)化,此前根據(jù)不同的系統(tǒng),用不同的監(jiān)控方式。網(wǎng)絡系統(tǒng)每三分鐘 ping 一次,判斷是否通斷:業(yè)務系統(tǒng)需要在服務器上安裝代理收集系統(tǒng)狀態(tài)信息,然后根據(jù)設定的闌值判斷是否發(fā)送告警信息。ping 間隔時間過短,代理監(jiān)控內(nèi)容過多,發(fā)送告警的指標與實際情況有出入。需要將 ping間隔時間改為十分鐘,減少因為偶爾丟包而產(chǎn)生的誤告警:去除不必要監(jiān)控的指標類型,防止因為監(jiān)控內(nèi)容過多,對 CPU產(chǎn)生更多負荷:優(yōu)化指標的閾值,根據(jù)有關標準,結(jié)合當前實際,優(yōu)化告警的值,示例如表2:
2.2.3信息集中展示
將故障告警信息統(tǒng)一展示,對故障進行分級,一般警告通過界面集中展示,影響業(yè)務的警告通過平臺發(fā)送至設備運維人員的移動端。
2.2.4 接口監(jiān)控
將API監(jiān)控采用shell腳本的方式進行實現(xiàn)。腳本放在監(jiān)控服務器上,通過主監(jiān)控服務器代理,定時執(zhí)行shell腳本,采集API接口數(shù)據(jù),并根據(jù)數(shù)據(jù)進行判斷,如果不符合預期數(shù)據(jù),則產(chǎn)生告警。
2.2.5報表統(tǒng)計
(1)故障匯總:按選定的時間段導出已經(jīng)處理完成的故障。
(2)事件匯總:按選定的時間段導出已經(jīng)處理完成的事件。
(3)統(tǒng)計分析:按選定的時間段對故障率、故障時間進行匯總分析。
(4)月報導出:將故障和事件按月導出,進行分類估計和匯總統(tǒng)計。
3 實際應用中的主要技術措施
3.1故障告警功能實現(xiàn)
在明確監(jiān)管對象以及指標以后,確定各個系統(tǒng)的負責人,根據(jù)后臺終端以及企業(yè)微信的不同特點,對告警信息進行處理,使數(shù)據(jù)適合在不同平臺上展示。
3.2設備分類及指標的優(yōu)化實現(xiàn)
根據(jù)需求,對設備進行分類,明確了監(jiān)控的設備對象,在此基礎上,優(yōu)化設備監(jiān)管指標。
3.3接口監(jiān)控的實現(xiàn)
根據(jù)需求,明確了具體監(jiān)控的接口,通過增加接口url地址,可以采集到對應接口的返回數(shù)據(jù),當前通過訪問接口地址監(jiān)控所添加的接口狀態(tài),如果出現(xiàn)異常則進行告警。
4 結(jié)語
根據(jù)梳理三峽局信息系統(tǒng)目前主要的業(yè)務,分析設備運維的基本需求,在已有的IT運維監(jiān)管平臺上結(jié)合企業(yè)微信,完善設備分類,增加接口監(jiān)控,使運維管理工作更加精準高效。此外,有些功能目前還需要和其他業(yè)務系統(tǒng)對接才能實現(xiàn),有些功能還需要進一步提高和完善,讓信息化為提高系統(tǒng)運維效率和安全提供更多的保障。
參考文獻:
[1] 梅沁、蔡晶晶.基于ITM的電力信息系統(tǒng)智能監(jiān)控管理的應用[B].江蘇電機工程,1009-0665(2010)03-0063-04.
[2] 索燕.基于ITM的第二代支付系統(tǒng)運維監(jiān)控平臺建設[B].金融科技時代,2014(022)008.