單位接入路由器出現(xiàn)傳輸速率明顯下降,訪問內(nèi)部網(wǎng)站時延較大,而且多個網(wǎng)絡(luò)通信端口都有嚴重數(shù)據(jù)丟失現(xiàn)象。重新開啟路由器時網(wǎng)絡(luò)運行正常,但上網(wǎng)一段時間后就經(jīng)常掉線,關(guān)閉路由器后再重啟又可以連通網(wǎng)絡(luò)。
引起這種故障的原因比較復雜,可能是由于硬件方面的問題,也可能是由于路由協(xié)議設(shè)置不當造成的,還有可能是受網(wǎng)絡(luò)攻擊、病毒感染、路由器內(nèi)存不足或者占用過多,以及路由器CPU持續(xù)過載等,都有可能導致這種現(xiàn)象的發(fā)生。先從輸入電源和工作環(huán)境排查,均未發(fā)現(xiàn)可疑現(xiàn)象。遭受木馬病毒攻擊是網(wǎng)絡(luò)頻繁掉線的一個典型特征,因此懷疑可能網(wǎng)內(nèi)有遭受病毒或ARP攻擊的用戶,因計算機感染病毒或木馬,對內(nèi)部網(wǎng)絡(luò)進行阻斷性流量攻擊所致。為此,使用查毒軟件和木馬專殺工具,掃描檢測各用戶計算機硬盤,重新安裝軟件防火墻。通過檢查未發(fā)現(xiàn)內(nèi)部計算機受病毒感染的嚴重癥狀,基本上排除病毒或木馬攻擊的可能。
使 用“disp memory”命令查看路由器內(nèi)存使用情況(如圖 1),發(fā)現(xiàn)路由器內(nèi)存利用率32%,可用內(nèi)存足夠,排除內(nèi)存不足的原因。然后使用“disp cpu-usage”命令查看路由器的CPU利用率(如圖 2),發(fā)現(xiàn) CPU利用率已經(jīng)超過80%,屬于嚴重過載。正常情況下5分鐘內(nèi)CPU利用率不應(yīng)大于60%,如果長時間持續(xù)過載,則會導致路由器工作效率下降,進而導致一個或者多個端口轉(zhuǎn)發(fā)的數(shù)據(jù)包丟失。
繼續(xù)分析導致路由器掉線或網(wǎng)絡(luò)丟包問題出現(xiàn)的其他原因,需要借助網(wǎng)管軟件對網(wǎng)絡(luò)情況進行分析判斷。通過監(jiān)測網(wǎng)內(nèi)流量和網(wǎng)絡(luò)丟包的時間特征分析,可能是在共享網(wǎng)絡(luò)中存在大流量下載等影響網(wǎng)速問題的用戶訪問。因此,在頻繁掉線發(fā)生的時間范圍,檢查局域網(wǎng)內(nèi)是否有經(jīng)常使用各種軟件上傳下載電影音樂等的用戶,并分析用戶使用特征及影響因素,逐步逼近問題根源。
圖1 路由器內(nèi)存占用情況
圖2 路由器CPU利用率情況
為確切分析流量來源,借助Sniffer工具軟件統(tǒng)計分析網(wǎng)絡(luò)通信流量情況,發(fā)現(xiàn)BT點對點傳輸占用了大量帶寬,基本確定網(wǎng)絡(luò)故障是由于用戶使用BT軟件上傳下載大容量資源,導致嚴重影響網(wǎng)絡(luò)性能。
隨著內(nèi)部網(wǎng)絡(luò)覆蓋范圍的擴大,網(wǎng)絡(luò)帶寬資源管理日益重要,在對單位各部門入網(wǎng)限速的同時,還應(yīng)對占用大量帶寬資源的應(yīng)用實施有效的監(jiān)管。為此,采取以下措施加以解決。
一是分析整個網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu),按單位組成結(jié)構(gòu)基于各交換機端口劃分樹型層級VLAN,對不同VLAN組用戶以及用戶與服務(wù)器之間進行有效隔離,確保每個子網(wǎng)環(huán)境相對獨立性,利用VLAN對邏輯網(wǎng)絡(luò)的隔離特性,有效防止網(wǎng)絡(luò)沖突和廣播風暴等網(wǎng)絡(luò)阻塞問題。
二是借助路由器IP訪問列表禁用BT端口,并將該IP列表應(yīng)用于路由器LAN端口。同時,在內(nèi)網(wǎng)防火墻上添加訪問控制策略,禁止BT等大流量應(yīng)用通過。此后,路由器工作狀態(tài)恢復正常,網(wǎng)絡(luò)用戶訪問丟包現(xiàn)象基本消失。
另外,路由器、文換機等網(wǎng)絡(luò)設(shè)備對電源和接地特性都較敏感,為此,更換性能優(yōu)良的在線式UPS作為供電電源,采取措施改進網(wǎng)絡(luò)機房接地性能,改善機房工作環(huán)境,提高供電穩(wěn)定性,確保網(wǎng)絡(luò)設(shè)備和信息系統(tǒng)正常運行。