茍毅博 劉偉 西安郵電大學(xué)計(jì)算機(jī)學(xué)院
我單位在監(jiān)控系統(tǒng)的歷程中,先后建立多種監(jiān)控系統(tǒng),如監(jiān)控網(wǎng)絡(luò)質(zhì)量、監(jiān)控服務(wù)器硬件、監(jiān)控操作系統(tǒng),監(jiān)控存儲(chǔ)設(shè)備等十幾個(gè)系統(tǒng)。在各系統(tǒng)的單一監(jiān)控部署完成且通過磨合期 之后,為了實(shí)現(xiàn)系統(tǒng)基礎(chǔ)資源的統(tǒng)一監(jiān)控,需要將各監(jiān)控系統(tǒng)進(jìn)行整合。將來自各個(gè)不同監(jiān)控系統(tǒng) 的監(jiān)控信息進(jìn)行篩選、分類、閥值匹配、事件關(guān)聯(lián), 然后通過多途徑的報(bào)警機(jī)制對(duì)異常信息以聲響、短 信、郵件等方式進(jìn)行通報(bào)。具體分為以下幾個(gè)大塊:
圖1
我們通過學(xué)習(xí)運(yùn)維管理中的一些理論,如CMDB(配置管理),ITIL(IT基礎(chǔ)架構(gòu))、BSM(業(yè)務(wù)服務(wù)管理)和SLA(運(yùn)維服務(wù)等級(jí)),借助開源監(jiān)控系統(tǒng)Zabbix的選型和部署為測試、以及結(jié)合工作需求,通過腳本、接口實(shí)現(xiàn)了存儲(chǔ)監(jiān)控和虛擬化監(jiān)控的運(yùn)維需求,最終實(shí)現(xiàn)融合監(jiān)控平臺(tái)的搭建。
后期還可以實(shí)現(xiàn)報(bào)表展示等二次開發(fā)。 將以被動(dòng)報(bào)警為主的I T監(jiān)控平臺(tái)提升為主動(dòng)分析 處理的專家型I T綜合監(jiān)控平臺(tái)。
通過標(biāo)準(zhǔn)協(xié)議和接口獲取的數(shù)據(jù),需要標(biāo)準(zhǔn)化處理,如字符串要限定格式,數(shù)值類要限定類型,最終標(biāo)準(zhǔn)化格式為具有時(shí)間序列的一條記錄:
網(wǎng)絡(luò)地址 指標(biāo)名稱 結(jié)果 獲取時(shí)間192.168.1.16 內(nèi)存利用率 30 2018/02/12 19:30
同時(shí),與系統(tǒng)資源庫表中的閥值策略對(duì)比,如上述內(nèi)存利用率在生產(chǎn)環(huán)境中我們?cè)O(shè)定的閥值為60%到80%,即內(nèi)存利用率小于60%為正常范圍,60%與80%之間為問題關(guān)注范圍,大于80%則認(rèn)為嚴(yán)重問題,此時(shí)需要產(chǎn)生事件,并且發(fā)送告警信息給相關(guān)責(zé)任人。
在大數(shù)據(jù)的背影下,這些指標(biāo)數(shù)據(jù)的潛能也被發(fā)掘出來了。來自各系統(tǒng)全面的監(jiān)控?cái)?shù)據(jù)使得預(yù)測性維修具備了可行性。并使我們的運(yùn)維工作思維及工作方式發(fā)生了轉(zhuǎn)變。
指標(biāo)數(shù)據(jù)積累形成的原始數(shù)據(jù),即可以提供給其它系統(tǒng),又可以通過分析來作為設(shè)備的負(fù)載和后期資源擴(kuò)容的判斷標(biāo)準(zhǔn),目前采用的判斷算法來源局限于工作中的經(jīng)驗(yàn)比例。
基于大數(shù)據(jù)的故障預(yù)測也被稱為預(yù)測性維護(hù),即以這些數(shù)據(jù)為基礎(chǔ),從策略層面來實(shí)施維護(hù)流程,那么設(shè)施管理人員就可以實(shí)現(xiàn)所謂的預(yù)測性維護(hù)——將維護(hù)技術(shù)與從不同設(shè)備和機(jī)器上得到的實(shí)時(shí)信息關(guān)聯(lián)起來,從而可以實(shí)現(xiàn)按需完成維護(hù)工作。這樣不僅可以降低停機(jī)時(shí)間,提高產(chǎn)量,還能消除在不必要的維護(hù)上所花費(fèi)的時(shí)間和資源。
一旦設(shè)備完成網(wǎng)絡(luò)連接,具有測量和監(jiān)視數(shù)據(jù)功能,生產(chǎn)運(yùn)營經(jīng)理就可以與數(shù)據(jù)專家合作,確保設(shè)備能夠以最優(yōu)的方式采集和使用數(shù)據(jù)。數(shù)據(jù)專家可以通過對(duì)現(xiàn)場甚至是虛擬場景的評(píng)估,來改進(jìn)數(shù)據(jù)運(yùn)營。聯(lián)網(wǎng)設(shè)備采集的數(shù)據(jù),可以存儲(chǔ)在云端,通過一個(gè)基于服務(wù)器的模型來實(shí)現(xiàn)虛擬監(jiān)視。當(dāng)數(shù)據(jù)被虛擬存儲(chǔ)時(shí),就可以對(duì)其進(jìn)行訪問、分析,并在數(shù)據(jù)專家的幫助和指導(dǎo)下,用其指揮和實(shí)施預(yù)測性維護(hù)。這種虛擬化,作為數(shù)據(jù)專家提供服務(wù)的一種,可以加速在工廠內(nèi)實(shí)現(xiàn)預(yù)測維護(hù)
當(dāng)系統(tǒng)的負(fù)載壓力就明顯上升時(shí),就應(yīng)該考慮項(xiàng)目擴(kuò)容。常規(guī)考慮的因素有IOPS、CPU、內(nèi)存、磁盤空間,借助運(yùn)維知識(shí)庫和預(yù)測模型,從而大大提高整體的運(yùn)維管理水平,從系統(tǒng)架構(gòu)角度來關(guān)聯(lián)分析和定位擴(kuò)容根源。
對(duì)底層IT資源到業(yè)務(wù)應(yīng)用系統(tǒng)的提供統(tǒng)一的多融合監(jiān)控解決方案,可實(shí)現(xiàn)對(duì)應(yīng)用系統(tǒng)所依托的網(wǎng)絡(luò)資源、主機(jī)資源、應(yīng)用系統(tǒng)資源等信息基礎(chǔ)設(shè)置進(jìn)行統(tǒng)一綜合管理和全方位的監(jiān)控,同時(shí)在業(yè)務(wù)支撐、應(yīng)用系統(tǒng)、自動(dòng)化故障處理等方面顯示明顯的功能優(yōu)勢。綜合考量,可作為大數(shù)據(jù)背影下企業(yè)復(fù)雜網(wǎng)絡(luò)環(huán)境和IT系統(tǒng)使用的一體化監(jiān)控系統(tǒng)。
[1]熊桂喜,王小虎譯,計(jì)算機(jī)網(wǎng)絡(luò)(第三版),北京:清華大學(xué)出版社,1998
[2]曾誠;高性能ASP.NET應(yīng)用程序的探討與研究[J];湖北大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年01期
[3]劉權(quán);;基于CMDB的網(wǎng)管系統(tǒng)業(yè)務(wù)可用性監(jiān)控平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[J];電信工程技術(shù)與標(biāo)準(zhǔn)化;2012年10期
[4]葉枝平;;IT監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2010年06期
[5]李春剛;;淺談IT業(yè)務(wù)系統(tǒng)應(yīng)用程序監(jiān)控的實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2009年20期
[6]丁美珍;黃晨;;基于Nagios的網(wǎng)絡(luò)監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];信息技術(shù)與信息化;2015年04期
[7] 孫桂萍;基于SNMP協(xié)議的網(wǎng)絡(luò)拓?fù)渥詣?dòng)發(fā)現(xiàn)的方法與實(shí)現(xiàn)[D];山東大學(xué);2006年
[8]孫柔玲;楊旭;莊磊;項(xiàng)穎;張曉軍;;ITIL變更管理在ERP系統(tǒng)運(yùn)維中的應(yīng)用[A];2012電力行業(yè)信息化年會(huì)論文集[C];2012年
[9] 李成鐵;顧德英;汪晉寬;;基于B/S結(jié)構(gòu)在線監(jiān)控研究應(yīng)用[A];中國儀器儀表學(xué)會(huì)第六屆青年學(xué)術(shù)會(huì)議論文集[C];2004年
[10]羅可;數(shù)據(jù)庫中數(shù)據(jù)挖掘理論方法及應(yīng)用研究[D];湖南大學(xué);2005年
[11]韋志勇;張子良;;基于開源的軟件產(chǎn)品測試過程研究[J];企業(yè)科技與發(fā)展;2010年22