歐運(yùn)娟
廣東省機(jī)械高級(jí)技工學(xué)校,廣東廣州 510450
校園網(wǎng)Internet訪問緩慢的分析與解決
歐運(yùn)娟
廣東省機(jī)械高級(jí)技工學(xué)校,廣東廣州 510450
隨著校園網(wǎng)規(guī)模的逐漸擴(kuò)大和系統(tǒng)應(yīng)用的不斷深入,校園網(wǎng)實(shí)現(xiàn)了校際間的信息共享及與Internet共享連接,為學(xué)校的教學(xué)、管理等各方面提供全面、切實(shí)的支持。但網(wǎng)絡(luò)問題也隨之而來,網(wǎng)絡(luò)系統(tǒng)在運(yùn)行中會(huì)經(jīng)常不斷出現(xiàn)網(wǎng)絡(luò)故障的問題,尤其是Internet訪問緩慢的故障率最高,嚴(yán)重影響了校園網(wǎng)的正常使用。本文探討如何分析和解決Internet訪問緩慢的故障現(xiàn)象,為校園網(wǎng)的穩(wěn)定運(yùn)行排憂解難。
Internet;共享接入;緩慢故障
Internet訪問緩慢是指訪問網(wǎng)絡(luò)是連通的,互聯(lián)網(wǎng)上的服務(wù)器已經(jīng)接受了用戶的請求,但數(shù)據(jù)傳輸速度非常緩慢。有些規(guī)模較小的校園網(wǎng),會(huì)選用帶路由功能的ADSL Modem接入方式共享上網(wǎng),更時(shí)常會(huì)遇到上網(wǎng)緩慢的現(xiàn)象,例如,IE瀏覽器長時(shí)間打不開目標(biāo)網(wǎng)頁,本地連接只有發(fā)送信息量沒有接收信息量等,許多人會(huì)下意識(shí)地認(rèn)為ADSL設(shè)備發(fā)生了斷流現(xiàn)象,事實(shí)上造成共享上網(wǎng)速度下降的原因有很多。
采用Internet共享接入方式上網(wǎng)比單機(jī)上網(wǎng)無論在結(jié)構(gòu)、配置和維護(hù)等方面,都要復(fù)雜得多,因此當(dāng)Internet訪問緩慢故障發(fā)生的時(shí)候,眾多的故障原因造成對(duì)Internet訪問緩慢故障的判斷及解決有一定的困難,絕非像計(jì)算機(jī)單機(jī)上網(wǎng)故障那么簡單。對(duì)Internet訪問緩慢故障的判斷,既需要長期的知識(shí)和經(jīng)驗(yàn)積累,又需要按照一定的故障判斷流程進(jìn)行,以及依靠相關(guān)軟硬件工具的幫助。
引起Internet訪問緩慢故障的原因比較復(fù)雜,既有硬件原因也有軟件原因;既有內(nèi)網(wǎng)問題也有外網(wǎng)問題;既有病毒攻擊也有人為攻擊等。例如,受接入端帶寬的限制、網(wǎng)絡(luò)用戶需求過大、網(wǎng)絡(luò)廣播風(fēng)暴的影響、代理服務(wù)器I/O性能問題、防火墻的設(shè)置問題、計(jì)算機(jī)病毒的影響等均是引起Internet訪問緩慢的誘因。為清晰、高效地判斷故障原因,可按照一定的流程進(jìn)行,其流程如下:
1)識(shí)別和描述故障現(xiàn)象
排故前,須確切地知道共享網(wǎng)絡(luò)上是否真的發(fā)生Internet訪問緩慢,還是在上網(wǎng)過程中經(jīng)常掉線。識(shí)別故障現(xiàn)象時(shí),通常應(yīng)該向投訴故障的操作者詢問以下幾個(gè)基本的問題:
(1)故障現(xiàn)象發(fā)生時(shí),正在運(yùn)行什么進(jìn)程(即操作者正在對(duì)計(jì)算機(jī)進(jìn)行什么操作);
(2)這個(gè)進(jìn)程以前運(yùn)行過嗎?
(3)以前這個(gè)進(jìn)程的運(yùn)行是否成功?
(4)這個(gè)進(jìn)程最后一次成功運(yùn)行是什么時(shí)候?
(5)從那時(shí)起哪些發(fā)生了改變?
根據(jù)詢問結(jié)果,開始對(duì)故障現(xiàn)象進(jìn)行客觀的詳細(xì)描述,例如在使用Web瀏覽時(shí),無論鍵入哪個(gè)網(wǎng)站都返回“該頁無法顯示”之類的信息。使用ping命令時(shí),無論P(yáng)ing哪個(gè)IP地址都顯示超時(shí)連接信息等。諸如此類的出錯(cuò)消息會(huì)為縮小故障范圍提供許多有價(jià)值的信息。
在故障現(xiàn)場還要收集以下的故障信息:例如,故障的出現(xiàn)是否有規(guī)律,最近是否加入了新用戶,最近是否添加了新設(shè)備,是否有設(shè)備移動(dòng)、修改或更換,是否修改了用戶權(quán)限,網(wǎng)絡(luò)操作系統(tǒng)是否重新配置過等等。經(jīng)過詢問、核實(shí)和故障信息收集,確認(rèn)所發(fā)生的故障現(xiàn)象的真實(shí)性。
2)列舉故障疑似原因
引起Internet訪問緩慢故障的原因比較復(fù)雜,既有硬件原因也有軟件原因,有內(nèi)網(wǎng)問題也有外網(wǎng)問題,既有病毒攻擊也有人為攻擊等。當(dāng)故障發(fā)生時(shí)應(yīng)綜合考慮各種可能的原因,例如,網(wǎng)卡硬件故障、網(wǎng)絡(luò)連通性故障、網(wǎng)絡(luò)設(shè)備故障、網(wǎng)絡(luò)協(xié)議故障或設(shè)置不當(dāng)?shù)鹊?,并將其一一列舉出來,以供故障排查參考。
列舉故障疑似原因的思路應(yīng)該是先硬后軟,范圍應(yīng)集中在網(wǎng)絡(luò)連通性、網(wǎng)絡(luò)連接設(shè)備和服務(wù)設(shè)備、網(wǎng)絡(luò)設(shè)置問題這幾方面,列舉的依據(jù)應(yīng)該基于計(jì)算機(jī)網(wǎng)絡(luò)的原理、實(shí)戰(zhàn)經(jīng)驗(yàn)的積累、以及對(duì)故障的描述。
3)分步排查故障原因
分步排查故障的基本步驟是:首先將所列舉的故障疑似原因按優(yōu)先級(jí)別進(jìn)行排序,排序的原則是從外到內(nèi)。例如應(yīng)該第一優(yōu)先排查Internet共享接入的服務(wù)設(shè)備(如代理服務(wù)器)和互連設(shè)備(如路由器),然后按順序逐一對(duì)故障疑似原因進(jìn)行隔離測試及排查,不斷地縮小搜索范圍,最終把真正的故障原因找出來。
在排查的過程中,除了利用先進(jìn)的網(wǎng)絡(luò)測試工具之外,為了提高排查速度,應(yīng)先觀察網(wǎng)卡、交換機(jī)、Modem、路由器面板上的LED指示燈。因?yàn)檫@些指示燈是網(wǎng)絡(luò)當(dāng)前運(yùn)行狀態(tài)的標(biāo)志,以及可以立即告訴你故障發(fā)生的所在地。
4)故障點(diǎn)及原因定位
經(jīng)反復(fù)測試和排查后,圈定故障點(diǎn)及故障屬性,然后要進(jìn)一步驗(yàn)證故障產(chǎn)生的真實(shí)原因。例如最終排查結(jié)果是代理服務(wù)器的問題,那么到底是主機(jī)的硬件故障還是服務(wù)軟件出錯(cuò)?因此,在已確認(rèn)故障點(diǎn)的情況下,還必須采用一些有效的手段對(duì)其故障原因進(jìn)行確切的定位。
下面通過一例實(shí)際個(gè)案說明如何運(yùn)用上述的Internet故障判斷流程解決問題,希望可以作為故障排除的共性參考。
案例:某校培訓(xùn)中心是一個(gè)獨(dú)立的局域網(wǎng),劃分為A、B兩個(gè)子網(wǎng),相互之間的通信可經(jīng)路由器進(jìn)行。其中A網(wǎng)原有32臺(tái)機(jī),后來增加了20臺(tái),合計(jì)52臺(tái);B網(wǎng)共有40臺(tái)機(jī)。所有的工作站匯聚到路由器后通過代理服務(wù)器,按指定IP地址的方式共享訪問Internet,代理服務(wù)器安裝的是WinGate代理軟件。寬帶接入是一條2M的ADSL專線。故障現(xiàn)象是A網(wǎng)增加了用戶之后,局域網(wǎng)中有些工作站能夠正常上網(wǎng),而有些工作站雖能接入Internet,但非常緩慢,甚至無法打開任何網(wǎng)站的網(wǎng)頁。
第一步:識(shí)別和描述故障現(xiàn)象
通過在現(xiàn)場的詢問和查看,知道在A網(wǎng)增加工作站之前,兩個(gè)網(wǎng)段的所有工作站從未出現(xiàn)過上網(wǎng)緩慢的故障,但是A網(wǎng)增加了20臺(tái)工作站之后,在上網(wǎng)高峰期,B網(wǎng)有些工作站連接Internet很慢,甚至無法打開任何網(wǎng)站的網(wǎng)頁,而A網(wǎng)所有的工作站則上網(wǎng)速度正常,與未增加用戶之前無異。
現(xiàn)收集到與本故障相關(guān)的主要信息如下:
1)A網(wǎng)增加工作站之前,B網(wǎng)所有工作站上網(wǎng)速度正常;
2)斷開A網(wǎng)或減少開機(jī)的用戶,故障現(xiàn)象立即消失或緩解;
3)在非上網(wǎng)高峰期故障現(xiàn)象不明顯;
4)A網(wǎng)的主機(jī)型號(hào)是P4系列,外置網(wǎng)卡;B網(wǎng)的主機(jī)型號(hào)是P3系列,板載網(wǎng)卡;
5)電信部門提供的ADSL寬帶上行512K,下行2M,申請擴(kuò)容一直未批。
6)B網(wǎng)中同一個(gè)工作站上網(wǎng)緩慢的現(xiàn)象并不固定在同一個(gè)狀態(tài),即在某個(gè)時(shí)間段不是太慢,但在另一時(shí)間段慢至打不開任何網(wǎng)站的網(wǎng)頁。
根據(jù)故障信息收集結(jié)果,基本上可以將本故障描述為:當(dāng)A網(wǎng)用戶增加時(shí),在上網(wǎng)高峰期B網(wǎng)有些用戶出現(xiàn)上網(wǎng)緩慢甚至無法打開網(wǎng)頁的故障現(xiàn)象,而A網(wǎng)則完全正常;當(dāng)A網(wǎng)新增用戶退出或完全脫離網(wǎng)絡(luò)時(shí),上述故障則自然消失。該故障的主要特征是上網(wǎng)緩慢,直至無法打開網(wǎng)頁。
第二步:列舉故障疑似原因
Internet訪問緩慢故障的疑似原因比較多,既有硬件方面的原因,也有軟件方面的原因,還有人為因素的影響。本故障現(xiàn)象看似簡單實(shí)則比較罕見,一般性的認(rèn)為,該故障非常普通,只是ADSL帶寬不足的問題,只需增加外網(wǎng)帶寬即可。但進(jìn)一步深入分析,發(fā)現(xiàn)若真是帶寬不足問題,對(duì)全網(wǎng)所有用戶都應(yīng)該有一定的影響,為什么只有B網(wǎng)部分用戶不正常。最費(fèi)解的是,在A網(wǎng)增加工作站通常只會(huì)造成A子網(wǎng)的交換機(jī)或路由器端口阻塞,只影響本子網(wǎng)的用戶上網(wǎng),為什么A網(wǎng)自己一切正常反而波及到與之完全隔離的B網(wǎng)用戶呢。還有,該故障即時(shí)有時(shí)無,更增加了判斷的難度。因此,該故障原因很可能牽涉到局域網(wǎng)交換機(jī)、路由器和代理服務(wù)器的軟硬件性能問題(如網(wǎng)絡(luò)瓶頸、配置文件失效等),還可能牽涉到內(nèi)網(wǎng)各節(jié)點(diǎn)之間的動(dòng)態(tài)連通性(指用戶訪問服務(wù)器的實(shí)時(shí)連接狀況)或線路干擾問題。
根據(jù)計(jì)算機(jī)網(wǎng)絡(luò)的基本原理、實(shí)戰(zhàn)經(jīng)驗(yàn)和故障描述,列舉以下疑似故障原因:
1)代理服務(wù)器可能出現(xiàn)性能瓶頸使帶寬減少,或者是Win Gate代理軟件的設(shè)置有缺陷。
2)A網(wǎng)增加用戶之后數(shù)據(jù)量增大,可能會(huì)導(dǎo)致路由器過載,時(shí)延重大、帶寬減少而影響用戶上網(wǎng)。由于A網(wǎng)工作站的性能比B網(wǎng)的高,所以只影響到B網(wǎng)的用戶。
3)兩個(gè)子網(wǎng)之間可能存在線路干擾,因A網(wǎng)用戶多,主干線路產(chǎn)生的磁場強(qiáng)度大,故干擾了B網(wǎng)的用戶正常上網(wǎng)。
4)在上網(wǎng)高峰期,B網(wǎng)的用戶與代理服務(wù)器之間的動(dòng)態(tài)連通性(指數(shù)據(jù)傳輸丟包率)可能有問題。
第三步:分步排查故障原因
1)利用代理服務(wù)器操作系統(tǒng)自帶的網(wǎng)絡(luò)監(jiān)視器和性能監(jiān)視器,在上網(wǎng)高峰期查看是否存在服務(wù)器訪問瓶頸,測試結(jié)果是:CPU占用率60%;內(nèi)存占用率54%;網(wǎng)絡(luò)利用率只有37%,顯然代理服務(wù)器的性能不存在問題。再檢查Win Gate代理軟件的設(shè)置并無異常,每個(gè)用戶的訪問流量(帶寬)自動(dòng)調(diào)節(jié)在20K左右,滿足了瀏覽Internet的基本要求(上網(wǎng)瀏覽一般有15K以上即可)。排除了這個(gè)故障原因。
2)采用Opti View網(wǎng)絡(luò)綜合協(xié)議分析儀,在上網(wǎng)高峰期測試路由器A端口的實(shí)際吞吐量、時(shí)延和帶寬等參數(shù),測試結(jié)果全部都在路由器額定技術(shù)指標(biāo)之下(產(chǎn)品說明書提供),完全不存在路由器過載的問題。也排除了這個(gè)故障原因。
3)將A、B網(wǎng)的主干雙絞線換成STP(屏蔽雙絞線),意在抗線路干擾,但結(jié)果是故障依舊。排除了線路干擾的原因。
4)在上網(wǎng)高峰期采用Ping命令檢查B網(wǎng)工作站與代理服務(wù)器之間的動(dòng)態(tài)連通性能。在任意一臺(tái)工作站中首先測試與代理服務(wù)器靜態(tài)連通性 (直接ping代理服務(wù)器的IP地址),正常;接著測試動(dòng)態(tài)連通性(執(zhí)行“ping 10.176.6.112 -l 65500”命令),發(fā)現(xiàn)代理服務(wù)器無法Ping通,而且測試結(jié)果是連續(xù)四個(gè)“Request time out”,表明數(shù)據(jù)傳輸丟包率幾乎達(dá)到了100%,將Sent Bytes數(shù)值逐步減少進(jìn)行依次測試,當(dāng)Sent Bytes數(shù)值大于2000時(shí),線路連接丟包率就達(dá)到100%,再多選幾臺(tái)工作站測試,結(jié)果都是一樣。若斷開A網(wǎng)或削減用戶數(shù),則丟包率明顯減少。測試結(jié)果說明B網(wǎng)的工作站與代理服務(wù)器之間的動(dòng)態(tài)連接,在網(wǎng)絡(luò)高峰期時(shí)出現(xiàn)丟包問題。為進(jìn)一步證實(shí),馬上在A網(wǎng)作同樣的測試,結(jié)果完全是沒有任何問題。
第四步:故障點(diǎn)及原因定位
排查結(jié)果基本可以確定本故障的原因是B網(wǎng)的用戶與代理服務(wù)器之間的動(dòng)態(tài)連通性差,導(dǎo)致丟包率高,從而影響了上網(wǎng)速度。如何對(duì)故障原因進(jìn)一步定位呢?實(shí)際上這又是一個(gè)更深入的原因列舉和排查過程。
數(shù)據(jù)丟包率原因通常與路由器、交換機(jī)及網(wǎng)卡有直接關(guān)系,以此為據(jù)繼續(xù)排查:
1)路由器是共用的,置換A、B網(wǎng)的路由端口,故障依舊,說明路由器無問題。
2)置換A、B網(wǎng)的交換機(jī),故障依舊,說明交換機(jī)無問題。
3)懷疑B網(wǎng)的主機(jī)的網(wǎng)卡有問題,故任選一機(jī),禁用其板載網(wǎng)卡,添加外置網(wǎng)卡;完成新網(wǎng)卡的驅(qū)程和設(shè)置上網(wǎng)參數(shù)后,立即訪問Internet,目標(biāo)網(wǎng)頁迅速打開了,故障成功解決。
故障原因分析——板載網(wǎng)卡屬于內(nèi)置網(wǎng)卡,由于過多占用系統(tǒng)資源,其數(shù)據(jù)傳輸性能比外置網(wǎng)卡(硬網(wǎng)卡)差很遠(yuǎn)。在A網(wǎng)未增加工作站之前,代理服務(wù)器自動(dòng)分配給各用戶的帶寬約為30K左右,但A網(wǎng)增加工作站之后自動(dòng)減為20K左右;由于B網(wǎng)的用戶主機(jī)的網(wǎng)卡傳輸性能差,帶寬減少后訪問請求的時(shí)間必然增長,訪問速度降低,導(dǎo)致超時(shí)登錄失而無法打開網(wǎng)頁。但當(dāng)上網(wǎng)用戶數(shù)減少時(shí),代理服務(wù)器又自動(dòng)將每戶的帶寬增大,故障便悄然消失。
解決的辦法可以向電信部門申請拓展ADSL帶寬至3M或以上,但必須長時(shí)間支付所增加的線路成本,而更換B網(wǎng)工作站的所有網(wǎng)卡則屬一次性投資。學(xué)校領(lǐng)導(dǎo)最后決定采取后一個(gè)方案。
由于影響Internet訪問緩慢故障的因素比較多,在網(wǎng)絡(luò)的三個(gè)層面(物理層、數(shù)據(jù)鏈路層、網(wǎng)絡(luò)層)都有產(chǎn)生故障的可能,對(duì)其故障的處理過程基于一定的知識(shí)和經(jīng)驗(yàn),以及相關(guān)的軟硬件測試工具,通過由彼及此的排查手段,逐步縮小故障范圍,最終確定故障部位及原因,采取有效措施把故障消除。
[1]譚珂,全惠民.網(wǎng)絡(luò)典型故障分析及排除.1版.人民郵電出版社,2003:56,135-254,186-192.
[2]劉曉輝,王春海.網(wǎng)絡(luò)常見問題與故障1000例.1版.清華大學(xué)出版社,2005:56,60-89.
[3]劉曉輝.網(wǎng)絡(luò)故障與常見問題排查.1版.中國鐵道出版社 2004:172-180,186-196.
TP393
A
1674-6708(2010)22-0213-02