• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      智慧監(jiān)控在云服務(wù)商重要業(yè)務(wù)監(jiān)控中的應(yīng)用

      2023-08-21 09:39:37孫維亞吳興國胡林森
      無線互聯(lián)科技 2023年12期

      孫維亞 吳興國 胡林森

      摘要:云服務(wù)商提供的云服務(wù)承載了政務(wù)、金融等諸多重要客戶業(yè)務(wù)。如何提升云上部署重要業(yè)務(wù)的監(jiān)控水平是當(dāng)前面臨的難題。文章以基線預(yù)警系統(tǒng)為例,從系統(tǒng)的模型構(gòu)建、實現(xiàn)原理、部署方法和應(yīng)用效果等幾個方面詳細(xì)進(jìn)行了闡述。該系統(tǒng)實現(xiàn)了客戶業(yè)務(wù)主動監(jiān)控,業(yè)務(wù)流量變化快速感知,大幅提升了運維人員響應(yīng)效率,為探索云服務(wù)商提升重要業(yè)務(wù)的監(jiān)控能力提供了新的方法。

      關(guān)鍵詞:云服務(wù)商;智慧監(jiān)控;基線預(yù)警

      中圖分類號:TN711.1? 文獻(xiàn)標(biāo)志碼:A

      0 引言

      近年來,在數(shù)字經(jīng)濟大潮的引領(lǐng)下,云計算技術(shù)從互聯(lián)網(wǎng)行業(yè)向政務(wù)、金融、工業(yè)、醫(yī)療等傳統(tǒng)行業(yè)加速滲透,在各行業(yè)得到了迅速發(fā)展和廣泛應(yīng)用[1]。云計算具有高性價比、高可靠性、高安全性、快速部署、方便擴展等特點[2-3],大幅節(jié)約了使用成本,提升了管理效率。

      由云服務(wù)商提供算力服務(wù)的政務(wù)云平臺,承載了諸如健康碼、疫苗追溯管理系統(tǒng)等涉及民生的重要業(yè)務(wù),在特定時期發(fā)揮了重要作用??蛻魹樘嵘龢I(yè)務(wù)穩(wěn)定性,通常會選取兩個云服務(wù)商,分別部署一些重要的政務(wù)服務(wù),用于業(yè)務(wù)冗余。當(dāng)主用平臺發(fā)生故障時,緊急啟用備用平臺,以提升服務(wù)的連續(xù)性、穩(wěn)定性。從云服務(wù)商角度來看,當(dāng)客戶業(yè)務(wù)系統(tǒng)功能故障或用戶流量突增時,客戶會將部分或全部用戶流量分流到備用平臺。一般來說,部署在租戶層面的監(jiān)控由客戶單位進(jìn)行管理,可及時感知到業(yè)務(wù)流量變化;但對于云服務(wù)商的平臺運維人員,卻無相關(guān)手段在第一時間內(nèi)感知到客戶重要業(yè)務(wù)的切換。如何做好此類場景的通信保障工作成了一個新的研究課題。

      1 構(gòu)建智慧監(jiān)控能力

      為提升云服務(wù)商智慧化運維能力,本文采用智慧監(jiān)控手段,對客戶部署在云平臺上的重要業(yè)務(wù),采用基線預(yù)警系統(tǒng)進(jìn)行監(jiān)控,其工作原理如下。

      1.1 構(gòu)建基線模型

      基線預(yù)警系統(tǒng)構(gòu)建的基線模型由網(wǎng)絡(luò)基線、存儲基線、計算基線構(gòu)成,如圖1所示。系統(tǒng)針對云平臺承載的重點客戶業(yè)務(wù),通過設(shè)置網(wǎng)絡(luò)基線進(jìn)行監(jiān)控。當(dāng)云平臺重點指標(biāo)(如防火墻會話數(shù)、出口帶寬等)劣化時,系統(tǒng)會生成告警,實現(xiàn)故障提前發(fā)現(xiàn)和預(yù)測。該模型以網(wǎng)絡(luò)基線為主要指標(biāo),同時引入存儲基線、計算基線作為輔助驗證手段,參考租戶虛機磁盤讀寫率的變化,以及虛機CPU、內(nèi)存變化趨勢,用于輔助驗證客戶業(yè)務(wù)承載狀態(tài),提高系統(tǒng)識別準(zhǔn)確率。

      1.1.1 網(wǎng)絡(luò)基線

      包含防火墻會話數(shù)、指定IP會話數(shù)、出口帶寬、端口CRC誤碼率等指標(biāo)。

      1.1.2 存儲基線

      包含IOPS、存儲流量兩個指標(biāo)。

      1.1.3 計算基線

      包含宿主機CPU利用率、內(nèi)存利用率,云主機CPU利用率、內(nèi)存利用率等指標(biāo)。

      1.1.4 設(shè)定閾值

      根據(jù)承載客戶業(yè)務(wù)日常運營數(shù)據(jù)作為參考值。重要告警閾值:取參考值的2倍;緊急告警閾值:取參考值的5倍。以云平臺出口網(wǎng)絡(luò)帶寬為例,若出口網(wǎng)絡(luò)帶寬月度峰值1.01 Gb/s為參考值,則重要告警閾值:2.02 Gb/s;緊急告警閾值:5.05 Gb/s。同時,根據(jù)客戶業(yè)務(wù)特點,若日間業(yè)務(wù)峰值與夜間業(yè)務(wù)峰值有顯著區(qū)別,基線可根據(jù)時間動態(tài)調(diào)整。

      1.2 系統(tǒng)工作原理及部署方法

      1.2.1 系統(tǒng)工作原理

      基線預(yù)警系統(tǒng)由采集模塊、通知模塊、頁面展示 ?模塊組成,如圖2所示。采集模塊通過部署采集機,限定源、目的IP地址及端口,安全接入云平臺管理網(wǎng)絡(luò),定時從相關(guān)網(wǎng)絡(luò)設(shè)備實時獲取業(yè)務(wù)的重要指標(biāo)。

      圖2 基線預(yù)警系統(tǒng)工作原理

      當(dāng)指標(biāo)超過設(shè)定的閾值時,由通知模塊調(diào)用監(jiān)控告警平臺接口,向運維人員派發(fā)告警通知。同時根據(jù)運維人員關(guān)注的云平臺重要指標(biāo),如出口網(wǎng)絡(luò)實時流量、防火墻總會話數(shù)、指定業(yè)務(wù)會話數(shù)等,將這些信息整合關(guān)聯(lián),以短信或郵件的方式及時告知平臺運維人員,使運維人員全方位掌握云平臺運行情況。

      通知模塊還設(shè)定了告警恢復(fù)機制,當(dāng)指標(biāo)低于設(shè)定的告警閾值時,由通知模塊調(diào)用監(jiān)控告警平臺接口,向運維人員發(fā)送業(yè)務(wù)恢復(fù)短信。

      同時,該系統(tǒng)提供了頁面展示模塊,定時將運維人員關(guān)注的平臺重點運行性能指標(biāo)記錄下來,如圖3所示,進(jìn)行可視化展示,性能指標(biāo)包含:云平臺出口流量、防火墻總會話數(shù)、重要業(yè)務(wù)會話數(shù)等,方便運維人員及時回溯監(jiān)控數(shù)據(jù),如圖4所示。

      1.2.2 部署方法

      我們以監(jiān)控某健康碼系統(tǒng)為例,基線預(yù)警系統(tǒng)在配置好待監(jiān)控的業(yè)務(wù)IP后,系統(tǒng)調(diào)用采集模塊定時登錄云平臺防火墻設(shè)備,獲取業(yè)務(wù)IP實時防火墻會話數(shù)。我們根據(jù)客戶業(yè)務(wù)模型及業(yè)務(wù)高峰時段,動態(tài)設(shè)定告警閾值。系統(tǒng)每隔3分鐘獲取一次客戶業(yè)務(wù)會話數(shù)。為降低誤報概率,當(dāng)連續(xù)2次獲取的會話數(shù)超過閾值,即觸發(fā)告警機制,由通知模塊調(diào)用監(jiān)控告警系統(tǒng)API,發(fā)送告警工單預(yù)警,如圖5所示。同時整合采集到的云平臺出口流量、防火墻總會話數(shù)等重要指標(biāo),定時發(fā)送報平安短信到運維人員,如圖6所示。

      當(dāng)獲取的業(yè)務(wù)實時會話數(shù),連續(xù)2次低于設(shè)定的閾值,系統(tǒng)即判定業(yè)務(wù)高峰已恢復(fù),發(fā)送一條業(yè)務(wù)恢復(fù)工單,告知運維人員業(yè)務(wù)峰值已過。

      1.3 系統(tǒng)應(yīng)用效果

      基線預(yù)警系統(tǒng)自投入使用以來,對部署在云平臺上的某健康碼平臺進(jìn)行7*24小時監(jiān)控,共完成客戶業(yè)務(wù)重保10次,改變了之前人工判斷業(yè)務(wù)流量切換的現(xiàn)狀,平均響應(yīng)時間由原來的90分鐘,縮短為10分鐘以內(nèi),響應(yīng)效率大幅度提升。

      2 結(jié)語

      本文結(jié)合當(dāng)前云服務(wù)商具體運維工作面臨的難點,采用智慧監(jiān)控手段,自研基線預(yù)警系統(tǒng),設(shè)定網(wǎng)絡(luò)、存儲、計算基線模型,實時獲取重要平臺指標(biāo),整合云平臺重要運維數(shù)據(jù),實現(xiàn)了客戶業(yè)務(wù)主動監(jiān)控,業(yè)務(wù)流量變化快速感知,大幅提升了運維人員響應(yīng)效率。

      參考文獻(xiàn)

      [1]中國信息通信研究院.云計算發(fā)展研究[J].大數(shù)據(jù)時代,2020(8):28-39.

      [2]王佳雋,呂智慧,吳杰,等.云計算技術(shù)發(fā)展分析及其應(yīng)用探討[J].計算機工程與設(shè)計,2010(20):4404-4409.

      [3]戴元順.云計算技術(shù)簡述[J].信息通信技術(shù),2010(2):29-35.

      (編輯 李春燕)

      Application of intelligent monitoring in key business monitoring of cloud service providers

      Sun? Weiya, Wu? Xingguo, Hu? Linsen

      (China Telecom Anhui Branch Hefei Co., Ltd., Hefei 230000, China)

      Abstract:? The cloud services provided by cloud service providers carry many important customer businesses, such as government affairs and finance. How to improve the monitoring level of important business deployed on the cloud is the current challenge. Taking the baseline warning system as an example, this paper expounds the model construction, implementation principle, deployment method and application effect of the system in detail . The system realizes the active monitoring of customers business and rapid perception of business flow changes, greatly improves the response efficiency of operation and maintenance personnel, and provides a new method for exploring cloud service providers to improve the monitoring ability of key businesses.

      Key words: cloud service provider; intelligent monitoring; baseline warning

      新干县| 剑川县| 衡东县| 思南县| 白沙| 沭阳县| 莒南县| 古田县| 确山县| 西城区| 泾源县| 怀仁县| 嘉义县| 江永县| 榆社县| 万荣县| 威海市| 遂昌县| 乐至县| 普安县| 利津县| 五家渠市| 涡阳县| 吉木萨尔县| 洪洞县| 文昌市| 灵石县| 江津市| 临城县| 平昌县| 惠安县| 平泉县| 化州市| 绥棱县| 定襄县| 澳门| 乐业县| 顺义区| 潮州市| 恭城| 丰镇市|