李 偉, 袁 煒
(1.合肥工業(yè)大學(xué) 計(jì)算機(jī)與信息學(xué)院,安徽 合肥 230009;2.安徽三聯(lián)學(xué)院 電子電氣工程學(xué)院,安徽 合肥 230601;3.中國電信合肥分公司,安徽 合肥 230001)
基于IM的網(wǎng)絡(luò)監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
李 偉1,2, 袁 煒3
(1.合肥工業(yè)大學(xué) 計(jì)算機(jī)與信息學(xué)院,安徽 合肥 230009;2.安徽三聯(lián)學(xué)院 電子電氣工程學(xué)院,安徽 合肥 230601;3.中國電信合肥分公司,安徽 合肥 230001)
提出了將現(xiàn)有的城域網(wǎng)監(jiān)控系統(tǒng)與個(gè)人通信工具相結(jié)合,當(dāng)設(shè)備運(yùn)行出現(xiàn)故障時(shí),由監(jiān)控系統(tǒng)將障礙的相關(guān)信息直接發(fā)送給維護(hù)人員,告知設(shè)備出現(xiàn)的問題,使設(shè)備維護(hù)變得簡捷方便.
及時(shí)通信;城域網(wǎng);監(jiān)控系統(tǒng)
在現(xiàn)有的城域網(wǎng)設(shè)備監(jiān)控中,使用SNMP(simple network management protocol)管理城域網(wǎng)中的數(shù)據(jù)設(shè)備,并將設(shè)備運(yùn)行的記錄保存在一臺(tái)指定的服務(wù)器上,最后通過繪圖軟件rrdtool或gnuplot結(jié)合PHP技術(shù)在網(wǎng)頁上顯示出來,同時(shí)可以根據(jù)設(shè)定的參數(shù)顯示某一時(shí)間段內(nèi)設(shè)備的運(yùn)行狀況,這種方法很好地跟蹤了設(shè)備的狀態(tài).而當(dāng)設(shè)備在運(yùn)行的過程中出現(xiàn)故障時(shí),可以根據(jù)保存在服務(wù)器中的運(yùn)行記錄判別設(shè)備的故障,便于對設(shè)備進(jìn)行跟蹤,知道設(shè)備在什么時(shí)間出現(xiàn)了故障,結(jié)合該時(shí)間段內(nèi)用戶使用情況查找障礙的原因.但是,這種方法有一個(gè)比較明顯的缺陷,那就是當(dāng)設(shè)備出現(xiàn)故障的時(shí)候,不能及時(shí)地獲知,這樣給維護(hù)帶來了很大的被動(dòng)性.如果能夠在第一時(shí)間獲知設(shè)備出現(xiàn)了故障,并進(jìn)行及時(shí)的處理,不僅可以極大地提高維護(hù)效率,消除許多隱患,而且還能延長設(shè)備正常運(yùn)行的時(shí)間[1-5].
如果將現(xiàn)有的城域網(wǎng)監(jiān)控系統(tǒng)與個(gè)人通信工具相結(jié)合,當(dāng)設(shè)備運(yùn)行出現(xiàn)故障時(shí)由監(jiān)控系統(tǒng)將障礙的相關(guān)信息直接發(fā)送給維護(hù)人員,告知設(shè)備出現(xiàn)了什么問題,設(shè)備維護(hù)將變得非常便捷[6].
選擇合適的IM(instant message)軟件,并將其與原有的基于SNMP的城域網(wǎng)設(shè)備監(jiān)控體系相結(jié)合,可用較小的代價(jià)將被動(dòng)式的記錄監(jiān)控升級為主動(dòng)式的跟蹤監(jiān)控,并且可以對整個(gè)城域網(wǎng)的二層、三層設(shè)備及核心設(shè)備進(jìn)行7×24 h的不間斷跟蹤監(jiān)控.在障礙出現(xiàn)時(shí)自動(dòng)將故障信息通知維護(hù)人員,不但可以縮短障礙的處理時(shí)間,而且真正做到了即時(shí)處理[7-9].而該系統(tǒng)所需的投入僅僅是1臺(tái)中等性能的服務(wù)器,并且由于使用了免費(fèi)的IM軟件,在后期故障的信息通知上不會(huì)產(chǎn)生其他費(fèi)用,這樣可以通過很少的投入,獲得較大的潛在經(jīng)濟(jì)效益.
2.1 系統(tǒng)運(yùn)行環(huán)境的搭建
由于該監(jiān)控平臺(tái)需要的軟件都是開源軟件,需要在一個(gè)開放的平臺(tái)上運(yùn)行,可以選Linux,首先要在服務(wù)器上安裝Linux操作系統(tǒng).Ubuntu是一個(gè)完全以 Linux為基礎(chǔ)的操作系統(tǒng), 可自由獲得,并能得到網(wǎng)絡(luò)虛擬社區(qū)和專業(yè)人員的支持.同時(shí)Ubuntu覆蓋了所有的桌面應(yīng)用程序, 包含文字處理、電子表格、Internet應(yīng)用程序、Web Server 軟件、E-mail 軟件、開發(fā)設(shè)計(jì)工具和常用工具等.所以選擇Ubuntu作為服務(wù)器的操作系統(tǒng),至于Ubuntu的安裝,和其他Linux操作系統(tǒng)的安裝沒有明顯區(qū)別,需要一個(gè)swap分區(qū)和一個(gè)ext3分區(qū),然后再配上事先分配好的IP(Internet Protocol)地址即可.
2.2 監(jiān)控平臺(tái)的生成
1)NET-SNMP的安裝.此監(jiān)控平臺(tái)需要SNMP采集城域網(wǎng)中設(shè)備的運(yùn)行信息,然后對其進(jìn)行處理.選擇開源軟件NET-SNMP實(shí)現(xiàn)此功能,所以首先需要安裝NET-SNMP軟件.
首先解壓該軟件,命令為
tar zxvf net-snmp-5.4.1.1.tar.gz
該命令生成一個(gè)net-snmp-5.4.1.1文件夾,進(jìn)入該文件夾,按序執(zhí)行如下命令:
./configure;make install;make
如果沒有報(bào)錯(cuò)即表示成功安裝了該軟件.
2)Nagios的安裝.在安裝Nagios之前必須先確保在Ubuntu上安裝如下3個(gè)數(shù)據(jù)包:Apache 2,GCC compiler and development libraries,GD development libraries.這些是運(yùn)行Nagios平臺(tái)必需的數(shù)據(jù)包.
接著到網(wǎng)站(http://www.nagios.com)下載最新的Nagios軟件Nagios-3.0.2.tar.gz和插件Nagios-plugins-1.4.11.tar.gz,安裝命令見表1.
表1 Nagios的安裝命令
主軟件和插件安裝完成后,只需把Nagios加載到Ubuntu的運(yùn)行進(jìn)程中即可通過Web界面訪問(表2).
表2 Nagios的加載
圖1 Nagios主界面Fig.1 Nagios’s main interface
如果配置沒有問題,就可以啟動(dòng)Nagios,并登錄http://202.102.192.58/nagios/檢查Nagios是否能夠正常使用.從圖1可以看出,Nagios已經(jīng)安裝成功.
3)Fetion的安裝.通過對當(dāng)前各種IM軟件的綜合比較,最終選取移動(dòng)的飛信作為發(fā)送短信的通信軟件.
運(yùn)行Fetion需要libc6,libace5.4.7c2a,libace-ssl5.4.7c2a這3個(gè)庫文件,它們在安裝Linux的時(shí)候基本上會(huì)自動(dòng)裝好,如果缺少了哪個(gè)庫可以通過apt-get命令來更新即可.做好這些準(zhǔn)備工作后,即可安裝Fetion,具體安裝命令為
tar xzf fetion_linux_20080402.tar.gz
接著即可發(fā)送消息,命令為
sms -f 13761592001 -p pwd12345 -t 13761592002,13761592003 -i a.txt
說明:-f后的參數(shù)是Fetion的賬號,-p為Fetion密碼,-t為接收信息的號碼,-i為發(fā)送的信息內(nèi)容.如果13761592002、13761592003在好友列表里,就會(huì)發(fā)送成功.
至此,此監(jiān)控平臺(tái)的運(yùn)行環(huán)境已經(jīng)安裝完畢.
2.3 主動(dòng)跟蹤監(jiān)控功能的實(shí)現(xiàn)
主動(dòng)跟蹤監(jiān)控功能要在服務(wù)器上定時(shí)(如每隔5 min)采集城域網(wǎng)中設(shè)備運(yùn)行參數(shù),判斷設(shè)備的運(yùn)行狀況,主要包括以下幾個(gè)方面.
1)定時(shí)功能的實(shí)現(xiàn);
2)CPU(central processing unit)采集功能的實(shí)現(xiàn);
3)相關(guān)數(shù)據(jù)的判別處理.
下面以設(shè)備的CPU利用率為例進(jìn)行說明.
首先通過NET-SNMP軟件中snmpget或snmpwalk命令提取設(shè)備CPU運(yùn)行參數(shù),然后將獲取到的參數(shù)用一段事先編好的shell程序進(jìn)行處理.在處理CPU利用率的案例中,只需要判別獲取到的設(shè)備的CPU利用率是否超過了設(shè)定的門限值,如果超過了則讓其通過Fetion給指定的手機(jī)發(fā)送短信,告知維護(hù)人員哪臺(tái)設(shè)備的CPU利用率過高,便于維護(hù)人員及時(shí)處理.
以 CPU利用率數(shù)據(jù)的判別處理為例,將處理程序放在cpu_usage-1_deal.sh shell程序中,其目的是判別獲取到的各臺(tái)設(shè)備CPU利用率是否超過門限值65,如果超過,則調(diào)用/home/monitor/sms/目錄下的sms.sh程序,將超過門限值65的相關(guān)設(shè)備標(biāo)識(shí)發(fā)送到指定的手機(jī)中,維護(hù)人員就可及時(shí)獲知運(yùn)行中出現(xiàn)問題的設(shè)備以及問題的相關(guān)信息.
2.4 應(yīng)用效果
在實(shí)際應(yīng)用中,通過ping命令測試網(wǎng)絡(luò)的可靠性和可達(dá)性,監(jiān)控城域網(wǎng)中設(shè)備運(yùn)行狀況.當(dāng)測試網(wǎng)絡(luò)中的某臺(tái)設(shè)備時(shí),如果不通則說明這臺(tái)設(shè)備的可達(dá)性可能出了問題,這時(shí)通過Fetion立刻給指定手機(jī)發(fā)送消息;或者當(dāng)ping網(wǎng)絡(luò)中的某臺(tái)設(shè)備突然時(shí)延變得非常大,則說明這臺(tái)設(shè)備的可靠性出現(xiàn)了問題——出現(xiàn)抖動(dòng),也有可能是網(wǎng)絡(luò)產(chǎn)生了擁塞,這時(shí)也會(huì)對指定手機(jī)發(fā)送消息,管理員可在第一時(shí)間登錄到設(shè)備上處理出現(xiàn)的問題.測試結(jié)果如圖2和圖3所示. 這兩幅圖說明了測試設(shè)備的時(shí)候突然出現(xiàn)時(shí)延比較大的問題.
目前這種通過IM發(fā)送即時(shí)障礙信息的城域網(wǎng)監(jiān)控系統(tǒng)已應(yīng)用在了合肥市城域網(wǎng)中,對合肥市城域網(wǎng)的思科和華為設(shè)備進(jìn)行7×24 h的主動(dòng)跟蹤監(jiān)控.
圖2 抖動(dòng)時(shí)的短信Fig.2 Tremulous quivering message
圖3 無抖動(dòng)時(shí)的短信Fig.3 Normal state message
由于當(dāng)今網(wǎng)絡(luò)技術(shù)發(fā)展日新月異,互聯(lián)網(wǎng)業(yè)務(wù)也不斷推陳出新,這就對作為載體的城域網(wǎng)提出了新的要求,在今后的工作中需要順應(yīng)這些變化,根據(jù)業(yè)務(wù)需要,可以將重點(diǎn)關(guān)注的設(shè)備指標(biāo)納入該主動(dòng)跟蹤監(jiān)控系統(tǒng)中,不斷豐富監(jiān)控手段,完善監(jiān)控體系,不斷提高監(jiān)控、維護(hù)技術(shù)[10-12].
[1] 孫翌,王昕,施曉華,等.IM技術(shù)在圖書館中的應(yīng)用[M].上海:上海交通大學(xué)出版社,2010:74-78.
[2] 陳曦,胡左浩,唐景蓮.即時(shí)通信業(yè)務(wù)營銷案例分析——以移動(dòng)飛信為例[C].成都:MSE,2011-10-01:80-82.
[3] 黃明石.面向電信運(yùn)營商的即時(shí)通信業(yè)務(wù)探討[J].電信技術(shù),2006(5):95-97.
[4] 張?jiān)拼?即時(shí)通信的企業(yè)級應(yīng)用研究[J].企業(yè)經(jīng)濟(jì),2005(6):30-35.
[5] 劉淑嫻,金鵬飛.簡單即時(shí)通信開發(fā)的安全研究[J].現(xiàn)代計(jì)算機(jī),2012,23(11):25-29.
[6] 黃林,李欣宇.即時(shí)通信監(jiān)控系統(tǒng)設(shè)計(jì)及實(shí)現(xiàn)研究[J].中國新通信,2013,7(10):69.
[7] 夏堅(jiān).通信運(yùn)營商即時(shí)通信業(yè)務(wù)發(fā)展問題研究[J].電腦知識(shí)與技術(shù),2011(20):30-32.
[8] 龐怡,許洪光,姜媛.即時(shí)通訊工具現(xiàn)狀及發(fā)展趨勢分析[J].科技情報(bào)開發(fā)經(jīng)濟(jì),2006(16):38-41.
[9] 代印唐,張世永.即時(shí)通信安全研究[J].電信科學(xué),2006,4(1):10-16.
[10]張世永.網(wǎng)絡(luò)安全原理與應(yīng)用[M].北京:科學(xué)出版社,2003:169-172.
[11]單文盛.淺析即時(shí)通訊軟件業(yè)的現(xiàn)狀和發(fā)展[J].中國高新技術(shù)企業(yè),2009(11):77-79.
[12]陳青,才力.中國即時(shí)通訊:整合與變革的前夜[J].中國經(jīng)濟(jì)周刊,2004(4):32-33.
The Design and Implementation of Network MonitoringSystem Based on IM
LI Wei1,2, YUAN Wei3
(1.SchoolofComputerandInformation,HefeiUniversityofTechnology,Hefei230009,China;2.SchoolofElectronicandElectricalEngineering,AnhuiSanlianUniversity,Hefei230601,China;3.HefeiBranchofChinaTelcom,Hefei230001,China)
The combination of the existing monitoring system of metropolitan area network and personal communication tools is proposed as it becomes much easier and convenient in maintenance. The fault information can be sent directly to the maintainer to inform them about the details when the operation fails.
instant message; metropolitan area network; monitoring system
2014-06-10
安徽省高等學(xué)校省級自然科學(xué)研究項(xiàng)目“IM在中小企業(yè)網(wǎng)絡(luò)監(jiān)控中的應(yīng)用”(KJ2010B069)
李 偉(1980—),女,江蘇徐州人,安徽三聯(lián)學(xué)院電子電氣工程學(xué)院講師.
10.3969/j.issn.1007-0834.2014.04.014
TN98
A
1007-0834(2014)04-0055-04