交換機(jī)作為局域網(wǎng)連接的主要設(shè)備,成為應(yīng)用普及最快的網(wǎng)絡(luò)設(shè)備之一。在日常網(wǎng)絡(luò)運(yùn)維過程中,充分了解和掌握網(wǎng)絡(luò)的流量模式,是能否發(fā)揮交換機(jī)作用的一個非常重要的因素。因?yàn)槭褂媒粨Q機(jī)的目的就是盡可能地減少和過濾網(wǎng)絡(luò)中的數(shù)據(jù)流量,所以如果網(wǎng)絡(luò)中的某臺交換機(jī)由于配置不規(guī)范,需要轉(zhuǎn)發(fā)接收到的所有數(shù)據(jù)包的話,交換機(jī)就無法發(fā)揮優(yōu)化網(wǎng)絡(luò)性能的作用,反而降低了數(shù)據(jù)的傳輸速度。
筆者單位的一臺交換機(jī)端口流量達(dá)到100%,正在準(zhǔn)備進(jìn)行鏈路擴(kuò)容的時候,仔細(xì)觀察到端口廣播包異常,根據(jù)這一現(xiàn)象,將交換機(jī)設(shè)備互聯(lián)端口中的默認(rèn)VLAN刪除后故障排除。
圖1 網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
近日,網(wǎng)管中心通告一臺專線交換機(jī)端口流量超越閾值,根據(jù)網(wǎng)管中心的通報,我們立即對設(shè)備的使用狀態(tài)進(jìn)行查看。使用show命令查看到端口的利用率入方向已達(dá)100%,按照常規(guī)做法,我們會立刻對端口進(jìn)行擴(kuò)容,但是根據(jù)現(xiàn)有網(wǎng)絡(luò)狀態(tài)進(jìn)行分析,該交換機(jī)主要承擔(dān)某單位的專線接入工作,該專線業(yè)務(wù)比較單純,并沒有新增的數(shù)據(jù)業(yè)務(wù),為什么端口的流量一下子猛增上來呢?
通過網(wǎng)管平臺查看最近一個月的交換機(jī)端口流量情況,發(fā)現(xiàn)流量是從兩天前開始上升起來的。咨詢專線單位,得到的答案是,最近沒有新增業(yè)務(wù)。那么流量增加肯定存在問題。
為了盡快搞清楚故障的原因,首先梳理下網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),具體的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖1所示。
從圖1可以看到,專線匯聚交換機(jī)A承擔(dān)著各分支點(diǎn)的數(shù)據(jù)匯聚,以及將數(shù)據(jù)轉(zhuǎn)發(fā)至專線單位分部,同時又有一條鏈路將該專線資源上傳至專線總部。端口利用率100%的交換機(jī)端口即我方數(shù)據(jù)機(jī)房的專線交換機(jī)A連接專線單位分部的交換機(jī)B端口。
根據(jù)拓?fù)浣Y(jié)構(gòu)很容易得知,交換機(jī)A的入方向?qū)?yīng)的是B交換機(jī)出方向。根據(jù)這一具體的故障現(xiàn)象,需要分析故障產(chǎn)生的原因,在交換機(jī)A上執(zhí)行命 令display interface GigabitEthernet 4/0/31,查看到該端口的廣播報文很多,而且廣播報文甚至超過了端口的單播報文數(shù)量。端口上的廣播報文從何而來呢?同單播和多播相比,廣播幾乎占用了子網(wǎng)內(nèi)網(wǎng)絡(luò)的所有帶寬。網(wǎng)絡(luò)中不能長時間出現(xiàn)大量的廣播幀,否則就會出現(xiàn)所謂的“廣播風(fēng)暴”。
廣播風(fēng)暴是指當(dāng)廣播數(shù)據(jù)充斥網(wǎng)絡(luò)無法處理,并占用大量網(wǎng)絡(luò)帶寬,導(dǎo)致正常業(yè)務(wù)不能運(yùn)行,甚至徹底癱瘓。一個數(shù)據(jù)幀或包被傳輸?shù)奖镜鼐W(wǎng)段上的每個節(jié)點(diǎn)就是廣播,由于網(wǎng)絡(luò)拓?fù)涞脑O(shè)計和連接問題,或其他原因?qū)е聫V播在網(wǎng)段內(nèi)大量復(fù)制,傳播數(shù)據(jù)幀,導(dǎo)致網(wǎng)絡(luò)性能下降,甚至網(wǎng)絡(luò)癱瘓,這就是廣播風(fēng)暴。廣播風(fēng)暴是網(wǎng)絡(luò)長時間被大量的廣播數(shù)據(jù)包所占用,使正常的點(diǎn)對點(diǎn)通信無法正常進(jìn)行,其外在表現(xiàn)為網(wǎng)絡(luò)速度慢。出現(xiàn)廣播風(fēng)暴的原因有很多。要避免廣播風(fēng)暴,可以采用恰當(dāng)劃分VLAN、縮小廣播域、隔離廣播風(fēng)暴,還可在千兆以太網(wǎng)口上啟用廣播風(fēng)暴控制,最大限度地避免網(wǎng)絡(luò)再次陷入癱瘓。
根據(jù)我們對廣播風(fēng)暴的簡單了解,接下來就開始進(jìn)行故障處理。首先使用命令display currentconfiguration interface GigabitEthernet 4/0/31查看下專線交換機(jī)端口的配置,具體查看命令即:
根據(jù)兩側(cè)交換機(jī)端口的配置,我們可以發(fā)現(xiàn)配置存在不規(guī)范的地方,首先端口允許通過的VLAN是全部,其實(shí)該端口并沒有多少VLAN,所以這里我們需要規(guī)范地配置業(yè)務(wù)VLAN。其次交換機(jī)端口還需要限制VLAN1通過,VLAN1是該品牌交換機(jī)的默認(rèn)VLAN,如果對VLAN1沒有需求,需要將該VLAN1進(jìn)行刪除,否則如果網(wǎng)絡(luò)拓?fù)溥^大,使用的交換機(jī)過多,網(wǎng)絡(luò)架構(gòu)復(fù)雜后,VLAN1就會在網(wǎng)絡(luò)中形成巨大的廣播風(fēng)暴,從而會引起網(wǎng)絡(luò)擁塞。
根據(jù)這一思路,接下來就更改一下端口的配置。具體配置即:
上面我們完成了專線交換機(jī)的端口配置,用相同的方法再修改一下專線分部交換的端口配置。完成這些操作后,再一次使用命令display interface GigabitEthernet 4/0/31查看端口的廣播包以及端口利用率,其中廣播包得到了實(shí)質(zhì)性的下降,而端口利用率從原來的100%下降至20%,網(wǎng)絡(luò)通道得到了明顯的改善,這樣網(wǎng)絡(luò)就得到了優(yōu)化。
上面我們從端口的利用率居高開始入手,通過對專線業(yè)務(wù)實(shí)際情況和網(wǎng)絡(luò)拓?fù)涞姆治?,并使用show命令查看端口存在廣播包過多的情況,并對廣播報的產(chǎn)生進(jìn)行了分析,得知端口配置不規(guī)范,存在默認(rèn)VLAN1不規(guī)范使用的情況。最后,通過對配置的修改,達(dá)到了網(wǎng)絡(luò)優(yōu)化的目的。
后期,我們通過調(diào)研得知,專線單位交換機(jī)是最近剛剛更換的,在配置和我方互聯(lián)端口時,由于專線單位網(wǎng)管人員不熟悉業(yè)務(wù),采取了端口VLAN全部通過的辦法,巧合的是我方交換機(jī)端口也是VLAN全部通過,從而引發(fā)網(wǎng)絡(luò)廣播風(fēng)暴。針對此次網(wǎng)絡(luò)的處理思路,我們計劃對現(xiàn)網(wǎng)所有網(wǎng)絡(luò)設(shè)備進(jìn)行默認(rèn)VLAN的清理,從小處著手,一步一步地對網(wǎng)絡(luò)進(jìn)行優(yōu)化。