引言: 在日常網(wǎng)絡(luò)使用中,會(huì)有出現(xiàn)很多網(wǎng)絡(luò)故障,原因多種多樣,故障現(xiàn)象也多種多樣。在這些網(wǎng)絡(luò)故障中,最難排除、排除用時(shí)最長(zhǎng)的故障當(dāng)屬丟包類(lèi)故障,而丟包類(lèi)網(wǎng)絡(luò)故障的產(chǎn)生,很多都是由網(wǎng)絡(luò)設(shè)備使用不規(guī)范、配置操作方法不當(dāng)、沒(méi)有按照標(biāo)準(zhǔn)布設(shè)線(xiàn)路等原因造成的。本文介紹筆者在日常工作中碰到的三起比較典型的丟包類(lèi)網(wǎng)絡(luò)故障。
在日常網(wǎng)絡(luò)使用中,會(huì)有出現(xiàn)很多網(wǎng)絡(luò)故障,原因多種多樣,故障現(xiàn)象也多種多樣,有些網(wǎng)絡(luò)故障雖然很少出現(xiàn),但故障排除時(shí)卻很棘手,有些看上去甚至是很奇葩的網(wǎng)絡(luò)故障。在這些網(wǎng)絡(luò)故障中,最難排除、排除用時(shí)最長(zhǎng)的故障當(dāng)屬丟包類(lèi)故障,而丟包類(lèi)網(wǎng)絡(luò)故障的產(chǎn)生,很多都是由網(wǎng)絡(luò)設(shè)備使用不規(guī)范、配置操作方法不當(dāng)、沒(méi)有按照標(biāo)準(zhǔn)布設(shè)線(xiàn)路等原因造成的。筆者在日常工作中,曾碰到過(guò)三起比較典型的丟包類(lèi)網(wǎng)絡(luò)故障。
單位網(wǎng)絡(luò)機(jī)房對(duì)所有的網(wǎng)絡(luò)設(shè)備進(jìn)行了備份檢修,對(duì)所有的網(wǎng)絡(luò)線(xiàn)路進(jìn)行了整治,加裝了配線(xiàn)架和很多配線(xiàn)面板,重新布設(shè)了部分網(wǎng)絡(luò)線(xiàn)路,便于日常使用管理。任務(wù)完成后,各網(wǎng)絡(luò)經(jīng)測(cè)試運(yùn)行均正常。一天,有用戶(hù)反映無(wú)法打開(kāi)外網(wǎng)網(wǎng)站,筆者使用值班計(jì)算機(jī)打開(kāi)該網(wǎng)站,發(fā)現(xiàn)該網(wǎng)站確實(shí)無(wú)法打開(kāi),使用Windows下的ping命令進(jìn)行測(cè)試,發(fā)現(xiàn)至該網(wǎng)站的網(wǎng)絡(luò)正常,回顯沒(méi)有發(fā)現(xiàn)掉包和明顯異常延時(shí)。筆者判斷可能是該網(wǎng)站存在問(wèn)題,然后又測(cè)試打開(kāi)其他外網(wǎng)網(wǎng)站,發(fā)現(xiàn)也無(wú)法打開(kāi)。隨即又測(cè)試對(duì)外部網(wǎng)絡(luò)的其他網(wǎng)絡(luò)應(yīng)用,發(fā)現(xiàn)對(duì)外的文電收發(fā)正常,使用FTP下載外網(wǎng)軟件,雖然速率慢點(diǎn),但是也能下載。該網(wǎng)絡(luò)對(duì)外連接采用2M同軸專(zhuān)線(xiàn)連接,通過(guò)光端機(jī)2M端口連接外部網(wǎng)絡(luò),中間加裝有路由器和硬件防火墻。針對(duì)出現(xiàn)的故障現(xiàn)象,筆者判斷可能是硬件防火墻在維護(hù)時(shí)出現(xiàn)了維護(hù)故障,有可能同事在防火墻上增加了禁止訪(fǎng)問(wèn)外網(wǎng)80端口的控制策略,因路由器和交換機(jī)上均未做相關(guān)的訪(fǎng)問(wèn)控制策略。進(jìn)入硬件防火墻配置界面,沒(méi)有防火墻并沒(méi)有禁止訪(fǎng)問(wèn)外網(wǎng)80端口的策略,這個(gè)故障讓人難以理解和解決。為確保故障解決,筆者電話(huà)聯(lián)系外網(wǎng)網(wǎng)站管理員,詢(xún)問(wèn)其網(wǎng)站運(yùn)行是否存在故障,是否對(duì)筆者單位的網(wǎng)絡(luò)IP地址段做了訪(fǎng)問(wèn)限制。經(jīng)詢(xún)問(wèn),該外網(wǎng)網(wǎng)站運(yùn)行良好,沒(méi)有出現(xiàn)無(wú)法訪(fǎng)問(wèn)的故障,同時(shí)也未對(duì)筆者單位的IP地址做訪(fǎng)問(wèn)限定,筆者還是第一次遇到這樣的故障現(xiàn)象。故障具體可以描述為:無(wú)法訪(fǎng)問(wèn)外網(wǎng)網(wǎng)站卻可以Ping通外網(wǎng)網(wǎng)站,其他外網(wǎng)應(yīng)用均基本正常,防火墻、路由器和交換機(jī)未做限制訪(fǎng)問(wèn)策略,外網(wǎng)網(wǎng)站運(yùn)行正常,外網(wǎng)也未針對(duì)本單位進(jìn)行做任何訪(fǎng)問(wèn)限制。
遇到這個(gè)故障,除了一些常規(guī)的故障排除手段外,筆者幾乎無(wú)從下手。后筆者在1臺(tái)Linux服務(wù)器上Ping外網(wǎng)網(wǎng)站,發(fā)現(xiàn)竟然有丟包,而且丟包率高達(dá)33%,但在Windows操作系統(tǒng)中卻沒(méi)有丟包也沒(méi)有很明顯的延時(shí)。
后查閱了相關(guān)資料,發(fā)現(xiàn)Windows操作系統(tǒng)中的Ping命令功能相對(duì)單一,其主要作用是檢測(cè)網(wǎng)絡(luò)連通性,只能進(jìn)行很少的參數(shù)設(shè)置,只要能正常接收到目標(biāo)的回復(fù)報(bào)文就說(shuō)明目標(biāo)可達(dá),但對(duì)回復(fù)報(bào)文的具體內(nèi)容不做任何解讀。而Linux操作系統(tǒng)中的Ping命令功能卻相對(duì)強(qiáng)大,除具備Windows操作系統(tǒng)中Ping命令的功能外,對(duì)回復(fù)得到的報(bào)文也會(huì)進(jìn)行解讀,如果報(bào)回復(fù)文內(nèi)容不正確、長(zhǎng)度不正確,則會(huì)認(rèn)為是無(wú)效包,進(jìn)而理解為丟包。
針對(duì)此故障,筆者對(duì)前期網(wǎng)絡(luò)機(jī)房和網(wǎng)絡(luò)線(xiàn)路的相關(guān)操作進(jìn)行了梳理,并認(rèn)真查看了值班日志。對(duì)網(wǎng)絡(luò)機(jī)房的檢修整治后,對(duì)所有的網(wǎng)絡(luò)進(jìn)行了測(cè)試,所有的網(wǎng)絡(luò)運(yùn)行狀態(tài)均正常,而故障產(chǎn)生前一天,還能正常訪(fǎng)問(wèn)外網(wǎng)網(wǎng)站。看來(lái)故障就發(fā)生在當(dāng)天。
通過(guò)查看日志,發(fā)現(xiàn)當(dāng)日進(jìn)入過(guò)網(wǎng)絡(luò)機(jī)房的有一名同事,負(fù)責(zé)打掃網(wǎng)絡(luò)機(jī)房的衛(wèi)生,通過(guò)詢(xún)問(wèn)該同事,該同事說(shuō)打掃衛(wèi)生時(shí),未觸碰網(wǎng)絡(luò)設(shè)備和網(wǎng)絡(luò)線(xiàn)路,通過(guò)調(diào)閱視頻監(jiān)控,發(fā)現(xiàn)該同事進(jìn)入機(jī)房后主要清理了地板和配線(xiàn)架機(jī)柜,通過(guò)分析,筆者感覺(jué)故障原因可能還是產(chǎn)生于網(wǎng)絡(luò)機(jī)房。
進(jìn)入網(wǎng)絡(luò)機(jī)房后,發(fā)現(xiàn)在配線(xiàn)架上有許多掉落的細(xì)長(zhǎng)銅絲,而這些細(xì)銅絲是前期網(wǎng)絡(luò)線(xiàn)路整治中,制作2M同軸線(xiàn)時(shí)掉落的,本來(lái)這些細(xì)鋼絲是在配線(xiàn)架機(jī)柜頂上,而打掃衛(wèi)生的同事在清理時(shí)將部分銅絲掉落至配線(xiàn)架上。進(jìn)一步檢查發(fā)現(xiàn),有1根細(xì)銅絲將配線(xiàn)架至光端機(jī)和配線(xiàn)架至基帶子Modem的2個(gè)配線(xiàn)接頭連接在了一起,造成了短路。雖然細(xì)銅絲非常細(xì),而且也僅僅是很細(xì)微的觸碰了配線(xiàn)接頭,就造成了短路。在將該銅絲清理后,再訪(fǎng)問(wèn)外網(wǎng)網(wǎng)站,發(fā)現(xiàn)可以正常訪(fǎng)問(wèn),故障排除。
單位開(kāi)始逐步對(duì)所有的老舊網(wǎng)絡(luò)交換機(jī)進(jìn)行升級(jí),使用10M/100M/1000M的華為交換機(jī)替換原有僅有10M的銳捷網(wǎng)絡(luò)交換機(jī),其他網(wǎng)絡(luò)設(shè)備和線(xiàn)路都沒(méi)有做任何更改。在更換了某個(gè)單位的交換機(jī)后,該單位反映有部分計(jì)算機(jī)網(wǎng)絡(luò)異常,各網(wǎng)絡(luò)應(yīng)用無(wú)法正常使用。在網(wǎng)絡(luò)中心值班計(jì)算機(jī)上Ping該單位的無(wú)法上網(wǎng)計(jì)算機(jī)的網(wǎng)關(guān),可以Ping通,因單位劃分了VLAN,該單位的上網(wǎng)網(wǎng)關(guān)設(shè)置在網(wǎng)絡(luò)中心的核心交換上,能夠Ping通也屬正常。然后再Ping該單位的無(wú)法上網(wǎng)計(jì)算機(jī)IP地址,卻無(wú)法Ping通。經(jīng)詢(xún)問(wèn),在更換新的交換機(jī)后,未修改計(jì)算機(jī)的網(wǎng)絡(luò)參數(shù)。
到了該單位后,使用ipconfig /all命令查看該計(jì)算機(jī)網(wǎng)絡(luò)配置,發(fā)現(xiàn)其IP地址為169.254.x.x,原來(lái)是沒(méi)有獲得正確的IP地址,為確保其正確上網(wǎng),使用手動(dòng)方式設(shè)置正確的IP地址,再使用ipconfig /all命令進(jìn)行查看,發(fā)現(xiàn)配置正確。在該單位計(jì)算機(jī)上對(duì)其網(wǎng)關(guān)進(jìn)行Ping操作,發(fā)現(xiàn)仍然不通??磥?lái)可能是網(wǎng)絡(luò)線(xiàn)路或網(wǎng)絡(luò)設(shè)備存在問(wèn)題,因其網(wǎng)絡(luò)結(jié)構(gòu)僅有交換機(jī)發(fā)生了變化,故觀察更換的新交換機(jī),發(fā)現(xiàn)交換機(jī)各指示燈顯示均正常,從該交換機(jī)端口上連接上筆者的筆記本電腦,發(fā)現(xiàn)上網(wǎng)正常??磥?lái)還是該計(jì)算機(jī)可能存在問(wèn)題,而最常見(jiàn)的原因一般是計(jì)算機(jī)存在病毒,網(wǎng)卡損壞或操作系統(tǒng)故障等。該計(jì)算機(jī)擁有者說(shuō)在更換交換機(jī)之前上網(wǎng)均正常,而在更換交換機(jī)后計(jì)算機(jī)沒(méi)有開(kāi)機(jī)使用,出現(xiàn)上述故障的可能性不高。按照故障排除方法對(duì)該計(jì)算機(jī)進(jìn)行病毒查殺,發(fā)現(xiàn)沒(méi)有病毒,再對(duì)其網(wǎng)卡進(jìn)行檢測(cè),發(fā)現(xiàn)該臺(tái)計(jì)算機(jī)無(wú)法Ping通其他計(jì)算機(jī),看來(lái)很可能是操作系統(tǒng)或網(wǎng)卡故障,使用交叉網(wǎng)線(xiàn)將該臺(tái)計(jì)算機(jī)直接連接筆者筆記本電腦,使用Ping命令進(jìn)行互Ping測(cè)試,可能互通。由此筆者判斷出故障產(chǎn)生在交換機(jī)和該臺(tái)計(jì)算機(jī)的網(wǎng)絡(luò)線(xiàn)路上,重新制作了RJ45水晶頭,重新測(cè)試,還是無(wú)法上網(wǎng)。筆者又對(duì)該計(jì)算機(jī)的網(wǎng)卡進(jìn)行設(shè)置檢查,發(fā)現(xiàn)其網(wǎng)卡的工作模式和速率為均為“AUTO-SENSE”,也就是說(shuō)該網(wǎng)卡使用的是速率自適應(yīng)模式,筆者將其手動(dòng)設(shè)置為“10M,F(xiàn)ULL”,再重新進(jìn)行測(cè)試,發(fā)現(xiàn)竟然可以Ping通,而且上網(wǎng)也恢復(fù)正常。筆者對(duì)該網(wǎng)線(xiàn)進(jìn)行檢查發(fā)現(xiàn),該網(wǎng)線(xiàn)為混用網(wǎng)線(xiàn),從交換機(jī)上連接出來(lái)的網(wǎng)線(xiàn)為正品超5類(lèi)網(wǎng)線(xiàn),但至該臺(tái)網(wǎng)絡(luò)故障計(jì)算機(jī)因網(wǎng)線(xiàn)長(zhǎng)度不足,使用了網(wǎng)線(xiàn)對(duì)接頭,而網(wǎng)線(xiàn)對(duì)接頭至該臺(tái)計(jì)算機(jī)的網(wǎng)線(xiàn)使用的為劣質(zhì)網(wǎng)線(xiàn),其連接速率根本無(wú)法達(dá)到100M,而交換機(jī)和網(wǎng)卡自適應(yīng)協(xié)商后的默認(rèn)網(wǎng)速為100M,但網(wǎng)線(xiàn)無(wú)法達(dá)到100M,最后造成其網(wǎng)絡(luò)異常。在重新更換了正品超5類(lèi)網(wǎng)線(xiàn)后,再將其網(wǎng)卡的工作模式和速率調(diào)整為“ATUO-SENSE”模式,發(fā)現(xiàn)操作系統(tǒng)提示網(wǎng)絡(luò)速率為“100M”,網(wǎng)絡(luò)恢復(fù)正常。
單位在野外臨時(shí)搭設(shè)了兩個(gè)帳篷,在兩個(gè)帳篷之間需要連通網(wǎng)絡(luò)來(lái)傳輸數(shù)據(jù),網(wǎng)絡(luò)應(yīng)用要求速率不少于1Mbps,網(wǎng)絡(luò)必須保持穩(wěn)定,且不得中斷。因兩個(gè)帳篷之間距離約4公里且之間無(wú)法通視,無(wú)法使用微波等無(wú)線(xiàn)設(shè)備來(lái)溝通網(wǎng)絡(luò)。由于天氣原因,利用衛(wèi)星構(gòu)建的網(wǎng)絡(luò)不太穩(wěn)定。因?yàn)榈靥幤?,無(wú)法使用公共網(wǎng)絡(luò),只能自主架設(shè)有線(xiàn)來(lái)構(gòu)建網(wǎng)絡(luò)。時(shí)間緊急,臨時(shí)架設(shè)光纜用時(shí)較長(zhǎng),故選擇架設(shè)非屏蔽的電話(huà)線(xiàn)來(lái)架構(gòu)網(wǎng)絡(luò),兩端使用數(shù)/模調(diào)制解調(diào)器來(lái)傳輸數(shù)據(jù),速率可以達(dá)到2Mbps,可以滿(mǎn)足需求。
網(wǎng)絡(luò)構(gòu)建完成后并進(jìn)行了測(cè)試,發(fā)現(xiàn)網(wǎng)絡(luò)中有丟包,丟包率還很高,網(wǎng)絡(luò)根本無(wú)法滿(mǎn)足需求。有丟包就說(shuō)明網(wǎng)絡(luò)不穩(wěn)定,不穩(wěn)定由可能是因設(shè)備原因造成,也可能是電話(huà)線(xiàn)在架設(shè)過(guò)程中被壓或各接頭連接不緊密造成。隨即兩端均更換了新的調(diào)制解調(diào)器進(jìn)行測(cè)試,并重新制作了水晶頭,重新進(jìn)行測(cè)試,跳過(guò)交換機(jī),結(jié)果發(fā)現(xiàn)網(wǎng)絡(luò)中仍然有丟包現(xiàn)象。根據(jù)日常保障經(jīng)驗(yàn),最大的可能性會(huì)出現(xiàn)在架設(shè)的電話(huà)線(xiàn)上,一般是電話(huà)線(xiàn)接頭連接不緊密或電話(huà)線(xiàn)有損傷造成的。使用電話(huà)線(xiàn)兩端連接磁石電話(huà)進(jìn)行檢測(cè),發(fā)現(xiàn)線(xiàn)路正常,通話(huà)質(zhì)量很好。將電話(huà)線(xiàn)一頭短接并使用萬(wàn)用表進(jìn)行測(cè)試,發(fā)現(xiàn)電話(huà)線(xiàn)沒(méi)有短路和斷路現(xiàn)象,電阻值也在正常范圍。但電話(huà)可以正常使用不代表傳輸網(wǎng)絡(luò)數(shù)據(jù)就行,因語(yǔ)音通話(huà)對(duì)線(xiàn)路要求不高,速率更是只要幾Kbps就可以滿(mǎn)足需要,而網(wǎng)絡(luò)則不然,隨后還是安排同事對(duì)電話(huà)線(xiàn)進(jìn)行巡線(xiàn)檢查。通過(guò)檢查,發(fā)現(xiàn)有部分接頭連接確實(shí)不是很緊密,部分接頭還被浸泡在水下。在重新進(jìn)行了連接和整改后,網(wǎng)絡(luò)質(zhì)量有明顯好轉(zhuǎn),網(wǎng)絡(luò)可以使用,但仍然有丟包現(xiàn)象。線(xiàn)路沒(méi)有短路斷路,各網(wǎng)絡(luò)設(shè)備正常,各接頭連接良好,在端對(duì)端連接的情況下還是出現(xiàn)了丟包現(xiàn)象。筆者通過(guò)分析得出結(jié)論,故障還是由電話(huà)線(xiàn)引發(fā)的。
后檢查發(fā)現(xiàn),因兩個(gè)帳蓬地處偏僻,帳蓬的供電分別有兩臺(tái)車(chē)載式柴油發(fā)電機(jī)進(jìn)行供給,沒(méi)有使用市電,而電話(huà)線(xiàn)在架設(shè)過(guò)程中有經(jīng)過(guò)該兩臺(tái)發(fā)電機(jī),發(fā)電機(jī)的電磁干擾引發(fā)電話(huà)線(xiàn)內(nèi)模擬信號(hào)受到干擾,進(jìn)而造成網(wǎng)絡(luò)不穩(wěn)定。隨即對(duì)電話(huà)線(xiàn)進(jìn)行了重新調(diào)整,調(diào)整后,網(wǎng)絡(luò)恢復(fù)正常,沒(méi)有丟包現(xiàn)象出現(xiàn)。
很多故障都是在不經(jīng)意間產(chǎn)生的,雖然發(fā)生的概率很少,但是在排除故障時(shí)確實(shí)是很棘手。而這些網(wǎng)絡(luò)故障的產(chǎn)生都是因?yàn)槭褂谜呤褂貌灰?guī)范、操作不得當(dāng)、沒(méi)有按照標(biāo)準(zhǔn)要求布設(shè)線(xiàn)路和使用網(wǎng)絡(luò)設(shè)備造成的。