摘 要:本文用針對不同類型設備的分類構(gòu)造方法得到網(wǎng)絡故障模型,總結(jié)了網(wǎng)絡設備類型故障表象和故障類型的映射關(guān)系。本文以知識庫的形式表達各種網(wǎng)絡模型,當被觀測對象滿足一定的表象現(xiàn)象時,可以推理得到相應的故障類型。
關(guān)鍵詞:網(wǎng)絡故障管理 故障診斷
中圖分類號:TP393文獻標識碼:A文章編號:1674-098X(2012)04(b)-0037-01
計算機技術(shù)和網(wǎng)絡技術(shù)不斷發(fā)展,網(wǎng)絡的應用越來越普及,使得網(wǎng)絡規(guī)模更大,網(wǎng)絡更加復雜。因此,網(wǎng)絡故障管理面臨巨大的挑戰(zhàn)。傳統(tǒng)的集中式網(wǎng)絡管理模型不能適應當前分布式、動態(tài)性的網(wǎng)絡環(huán)境。本文采用分布式網(wǎng)絡管理模型,提出基于多代理技術(shù)的網(wǎng)絡故障管理框架,并且針對網(wǎng)絡故障管理各個階段詳述了分布式網(wǎng)絡故障管理的具體實現(xiàn)方法。
1 網(wǎng)絡故障現(xiàn)象與MIB變量的關(guān)系
管理信息庫(MIB)提供了網(wǎng)絡管理數(shù)據(jù)的標準,為網(wǎng)絡故障管理提供了豐富的網(wǎng)絡狀態(tài)信息。在這個標準里規(guī)定了網(wǎng)絡設備必須保存的數(shù)據(jù)項目、數(shù)據(jù)類型,以及允許在每個數(shù)據(jù)項目中的操作。通過對這些數(shù)據(jù)項目的存取訪問,就可以得到該設備的統(tǒng)計數(shù)據(jù)。MIB II定義了11組MIB變量,在這些MIB變量組定義的變量中,定義了很
多與故障管理有關(guān)的變量。例如,IF組中可用于故障管理的MIB對象有:接口丟棄的輸入包數(shù)(iflnDiscards)、接口丟棄的輸出包數(shù)(ifOutDiscards)、包含錯誤的輸入包數(shù)(iflnErrors)、包含錯誤的輸出包數(shù)(ifOutErrors)、接口接收的字節(jié)數(shù)(必Octets)、接口發(fā)送的字節(jié)數(shù)(ifDutOctets),輸入的單播包數(shù)(ifinUNcatPkts)、輸出的單播包數(shù)(ifOutUcastPkts)、輸入的非單播包數(shù)(iflnNUcastPkts)、輸出的非單播包數(shù)(ift7utNUcastPkts)、因定向到一個未知或不支持的協(xié)議而被丟棄的包數(shù)(IfInUnknownProtos),輸出隊列中的所有包數(shù)(IfOutQlen)。其它組中也有與故障管理有關(guān)的對象屬性,例如IP組中:收到的全部IP分組數(shù)(ipInReceives)、收到的全部IP分組中成功發(fā)送到IP的上層協(xié)議的個數(shù)(iplnDelivers),IP的上層協(xié)議提供給IP傳送的全部IP分組數(shù)(ipOutRequests)等;UDP組中:接收到的UDP數(shù)據(jù)報總數(shù)(udpInDatagrams),發(fā)送的UDP數(shù)據(jù)報總數(shù)(udpOutDatagrams)等;TCP組中:接收到的TCP段總數(shù)(tcplnSegs)、發(fā)送的 TCP段總數(shù)(tcpOutSegs)等等。
因為MIB變量并不是為了網(wǎng)絡故障診斷而設計的,所以許多網(wǎng)絡故障表現(xiàn)與MIB變量之間不存在一一對應關(guān)系,即無法通過某個MIB變量直接判斷是否存在網(wǎng)絡故障。但是利用多個MIB變量的組合式能指示網(wǎng)絡的當前狀態(tài),可以有效地表示網(wǎng)絡故障特征.如利用查詢得到的MIB對象的組合得到如網(wǎng)絡吞吐率、負載率、傳輸時延等有關(guān)網(wǎng)絡參數(shù)。
2 路由器設備的故障診斷
參照路由器故障的層次劃分,我們將路由器中可能出現(xiàn)的各種網(wǎng)絡故障匯集在一起,組成一顆描述路由器故障的故障樹。以下的模型中僅以Cisco公司2600系列路由器為例,列出了它們的MIB變量標識符,事實上,對于不同廠家的路由器,只需要找到功能相同的MIB變量,就可以同樣依照上述模型進行故障診斷。
2.1 絕對連接不通
故障1:以太網(wǎng)端口硬件壞、線路斷或?qū)Ψ皆O備故障。
表現(xiàn)現(xiàn)象:端口狀態(tài)down,鏈路協(xié)議狀態(tài)down o
對應MIB:1.3.6.1.2.1.2.2.1.8.x(端口號片(down)
1.3.6.1.4.1.9.2.2.1.1.2.x(端口號) (down)
故障2:以太網(wǎng)端口被管理性關(guān)閉。
表現(xiàn)現(xiàn)象:端口狀態(tài)down,鏈路協(xié)議狀態(tài)down,端口管理狀態(tài)downs。
對應MIB:1.3.6.1.2.1.2.2.1.8.×(端口號)=2(down)
1.3.6.1.4.1.9.2.2.1.1.2.×(端口號=0(down)
1.3.6:1.2.1.2.2.7.×(端口號)=2(down)
2.2 串行接口
故障1:串口的模式設置不對,一般串口應設定為SCTE模式。
表現(xiàn)現(xiàn)象:串口狀態(tài)即,線路協(xié)議狀態(tài)down,串口的DSU不是SCTE模式。
對應MIB:1.3.6.1.2.1.2.2.1.8.×(端口號)=1(up)
1.3.6.1.4.1.9.2.2.1.1.2.×(端口號)=0(down)
故障2:串口數(shù)據(jù)鏈路協(xié)議錯(與原來的設置不相符)。
表現(xiàn)現(xiàn)象:串口狀態(tài)down,線路協(xié)議狀態(tài)down,鏈路協(xié)議與原來的設定值不一致。
對應MIB:1.3.6.1.2.1.2.2.1.8.x(端口號)=2(down)
1.3.6.1.4.1.9.2.2.1.1.2.x(端口號)=0(down)
3 三層交換機設備故障診斷
3.1 絕對連接不通
故障1:交換機的連接端口(下連)硬件壞、線路斷或?qū)Ψ皆O備故障:
表現(xiàn)現(xiàn)象:端口狀態(tài)down,鏈路協(xié)議狀態(tài)down o
對應MIB:1.3.6.1.2.1.2.2.1.8.x=2(down)
1.3.6.1.4.1.43.29.4.8.2.1.4.x(a3ComSysEthernetPortLinkStatus)=2(down)
故障2:交換機的連接端口被管理性關(guān)閉
表現(xiàn)現(xiàn)象:端口狀態(tài)down,鏈路協(xié)議狀態(tài)down,端口管理狀態(tài)down o
對應MIB: 1.3.6.1:?.1.2.2.1.8.x=2(down)
1.3.6.1.2.1.2.2.1.7.x=2(down)
1.3.6.1.4.1.43.29.4.8.2.1.4.x(a3ComSysEthernetPortLinkStatus)=2(down)
3.2 相對連接不通
MAC地址沖突。
表現(xiàn)現(xiàn)象:三層交換機中某個端口的固化表中有網(wǎng)絡工作站IPI或IP2所對應的MAC1或MAC2的地址。如果在連接線路上經(jīng)過了路由器,而固化了該MAC地址的交換機端口不能到達路由器,則要加入對路由器對應的以太網(wǎng)端口的MAC地址的判斷。
對應MIB:1.3.6. I .4.1.43.29.4.10.2.1.19(a3ComSysBridgeAddressLearnMode)
1.3.6.1.4.1.43.29.4.I O.S.1.5(a3ComSysBridgePortAddressIsStatic)
{isStatic(1),isDynamic(2)}
3.3 連接性能故障
故障1:線路噪音:由于線纜類型不對、接口卡壞、干擾信號等.
表現(xiàn)現(xiàn)象:端口的CRC錯誤增多,沖突數(shù)不增多。
對應MIB:1.3.6.1.2.1.16.1.1.1.8(etherStatsCRCAIignErrors)
1.3.6.1.2.1.16.1.1.1.13(etherStatsCollisions)
故障2:后沖突;由于線纜過長或中繼過多.
表現(xiàn)現(xiàn)象:端口的后沖突數(shù)增加。
對應MIB:1.3.6.1.2.1.10.7.2.1.8(dot3StatsLateCollisions)
在網(wǎng)絡故障定位之后,網(wǎng)絡故障的處理范圍己經(jīng)縮小到故障點,接下來的工作就是要根據(jù)故障點的表現(xiàn)現(xiàn)象判定網(wǎng)絡故障類型和產(chǎn)生故障的原因。本文用針對不同類型設備的分類構(gòu)造方法得到網(wǎng)絡故障模型,總結(jié)了網(wǎng)絡設備類型故障表象和故障類型的映射關(guān)系。本文以知識庫的形式表達各種網(wǎng)絡模型,當被觀測對象滿足一定的表現(xiàn)現(xiàn)象時,可以推理得到相應的故障類型。