謝 芳,黃 河
(海峽之聲廣播電臺,廈門 361001)
隨著IP技術(shù)廣泛應(yīng)用,傳統(tǒng)的SDH傳輸技術(shù)以越來越無法滿足人們的需求,MSTP越來越被人們重視起來。本文列舉了MSTP設(shè)備常見的幾類故障場景,并針對各個故障場景,逐一給出故障現(xiàn)象及故障處理方法。
隨著MSTP設(shè)備應(yīng)用的廣泛,MSTP設(shè)備的維護也得到了重視。簡單的設(shè)備維護可以從以下幾個步驟入手:
步驟一:日常數(shù)據(jù)備份
數(shù)據(jù)庫自動備份策略設(shè)置的網(wǎng)管入口:系統(tǒng)>網(wǎng)元軟件管理>網(wǎng)元備份策略管理,ASON&分組網(wǎng)元每天一次,其他網(wǎng)元每周一次。
網(wǎng)管腳本定時備份:在網(wǎng)管上創(chuàng)建“全網(wǎng)配置腳本”文件的定時備份任務(wù),每周一次。
網(wǎng)管數(shù)據(jù)庫定時備份:在網(wǎng)管上創(chuàng)建數(shù)據(jù)庫定時備份任務(wù),每月一次。
網(wǎng)管側(cè)業(yè)務(wù)路徑信息導出:網(wǎng)管側(cè)SDH業(yè)務(wù)路徑導出,ASON控制鏈路/TE鏈路/智能電路信息導出,分組Tunnel/PWE3業(yè)務(wù)路徑導出,每周一次。
步驟二:采集工具部署
在Support網(wǎng)站下載“UEasyDataCollection”工具后安裝在U2000網(wǎng)管服務(wù)器上。
步驟三:日常例行檢查
數(shù)據(jù)庫檢查:在Support網(wǎng)站下載“DBCheckerUI"工具檢查。
高危告警檢查:篩查&處理全網(wǎng)高危告警(如下表),禁止屏蔽。
表1 重要告警列表
故障信息采集是較為重要的一環(huán),我們可以借助相關(guān)工具來更加快速精準的完成故障信息采集。
故障業(yè)務(wù)相關(guān)信息反饋:
(1)故障發(fā)生時間、網(wǎng)管告警、網(wǎng)元異常狀態(tài)(如脫管、響應(yīng)慢等)。
(2)業(yè)務(wù)保護類型&狀態(tài)、設(shè)備類型&版本。
(3)中斷業(yè)旁類別數(shù)量,選取一條中斷業(yè)務(wù)給出路徑信息。
故障前后異常&操作信息反饋:
(1)故障前:是否有升級、掉電、割接、光纖中斷、對接設(shè)備的操作等。
(2)故障后:是否有網(wǎng)管配置上下載、業(yè)務(wù)配置、拔插纖纜/單板等。
數(shù)據(jù)備份情況:
是否有網(wǎng)元數(shù)據(jù)庫/網(wǎng)管配置腳本備份、巡檢數(shù)據(jù)等。
數(shù)據(jù)采集:
采集網(wǎng)管當前告警、操作日志、異常事件(推薦使用UEasyDataCollection工具快速采集)。
3.1.1 環(huán)形復用段業(yè)務(wù)中斷
故障現(xiàn)象:
環(huán)形復用段倒換或倒換恢復后業(yè)務(wù)中斷,或者環(huán)形復用段狀態(tài)異常。
處理方法:
(1)復用段協(xié)議全環(huán)停啟(可能會導致環(huán)上業(yè)務(wù)短暫中斷)。
(2)復用段斷纖點區(qū)段兩側(cè)強制倒換。
(3)斷纖點兩端網(wǎng)元交叉板主備倒換。
(4)復用段環(huán)先刪后建。
(5)核實故障業(yè)務(wù)是否配置在復用段的額外通道上、是否多點斷纖、是否光纖錯連。
3.1.2 線性復用段業(yè)務(wù)中斷
故障現(xiàn)象:
線性復用段創(chuàng)換或倒換恢復后業(yè)務(wù)中斷,或者線性復用段狀態(tài)異常。
處理方法:
(1)停啟復用段協(xié)議。
(2)強制倒換到保護通道。
(3)復用段先刪后建。
(4)排查1+1線性復用段是否缺少雙發(fā)業(yè)務(wù)。
(5)若和友商設(shè)備對接,關(guān)閉激光器觸發(fā)對端倒換。
(6)若和友商設(shè)備對接,修改兩端配置為1+1單端線性復用段保護。
3.2.1 EoS板業(yè)務(wù)中斷
故障現(xiàn)象:
EoS板端口流量為0或很小,其他TDM業(yè)務(wù)正常,即可判定為EoS板業(yè)務(wù)中斷。
處理方法:
若有配置操作,則回退。
若無,則判定SDH通道是否異常:
(1)數(shù)據(jù)板是否存在SDH側(cè)告警(如AIS、UNEQ、SLM、EXC、SQM等)。
(2)測試幀結(jié)果是否正常。
(3)修改數(shù)據(jù)板通道開銷J1/J2(VC4只能在線路板修改J1)在對端檢測實收值。
若SDH通道異常,則去激活后激活SDH業(yè)務(wù)或更換SDH路徑。
若SDH通道正常:
(1)倒換BPS/PPS/DLAG/LAG。
(2)去使能后重新使能以太端口;去使能后集新使能LCAS。
(3)刪除VCTRUNK綁定后重新綁定。
(4)刪除后重配以太業(yè)務(wù)。
(5)硬復位單板(會影響整板業(yè)務(wù))。
(6)修改專網(wǎng)為專線業(yè)務(wù)。
檢查端口參數(shù):
檢查端口TAG屬性&工作模式&封裝模式&VLAN ID是否配置正確。
3.2.2 EoS板業(yè)務(wù)成環(huán)
故障現(xiàn)象:
對于EoS專網(wǎng)業(yè)務(wù),故障端口廣播或組播流量達到1M以上,或單板響應(yīng)很慢、查詢端口實際工作模式等命令超時,或存在ETHOAM_SELF_LOOP、ETHOAM_ VCG_SELF_LOOP告警,其他TDM業(yè)務(wù)正常。
處理方法:(1)若有配置操作(如新增交叉、配置VCTRUNK等),則回退。(2)檢查Hub/Spoke屬性。注:若單板響應(yīng)慢導致命令無法下發(fā),請先在網(wǎng)管設(shè)置,然后硬復位單板,使配置生效。
(3)刪除VB內(nèi)所有端口后逐一添加,判斷添加到哪個端口后業(yè)務(wù)異常。
3.3.1 ASON網(wǎng)絡(luò)資源不足
故障現(xiàn)象:
ASON網(wǎng)絡(luò)斷纖/斷纜后:
(1)故障業(yè)務(wù)存在CP_SRV_INT/CP_SER_INT/SER_INT告警。
(2)查看網(wǎng)管異常事件,故障業(yè)務(wù)在對應(yīng)時間點存在重路由失敗(事件錯誤碼為40497)。
處理方法:
盡快修復中斷的光纖/纜(如無法立即修復,可嘗試如下操怍):
(1)國將與故障業(yè)務(wù)源宿節(jié)點相同的鉆石級業(yè)務(wù)轉(zhuǎn)為銀級業(yè)務(wù)(選中需要操作的業(yè)務(wù),單擊鼠標右鍵選擇“在線轉(zhuǎn)換”->“銀級”)。
(2)手工優(yōu)化其他相關(guān)的ASON業(yè)務(wù)路由,確保中斷的業(yè)務(wù)有資源可重路由。
(3)若存在CP TEL DEGRADE告警,排查鏈路DCC通道的 D4-D12是否配置正常(“網(wǎng)元管理器”->“通信”->“DCC 管理”)。
3.3.2 ASON業(yè)務(wù)中斷
斷纖/斷纜觸發(fā)的ASON重路由后業(yè)務(wù)中斷(已排除ASON資源不足)
故障現(xiàn)象&判定:
(1)ASON網(wǎng)內(nèi)故障:故障業(yè)務(wù)存在CP_SRV_INT/CP_SER_INT/SER_INT告警。
(2)ASON網(wǎng)外故障:業(yè)務(wù)源端有RLOS/RLOF/AU_CMM/AU_AIS/HP_UNEQ或CP_SRV_INT_OUT告警。
處理方法:
(1)若是ASON網(wǎng)內(nèi)故障:一是解除鎖定:在“智能路徑管理”界面選中故障路徑,單擊鼠標右鍵選擇“設(shè)置路由屬性”,修改成不鎖定。二是業(yè)務(wù)優(yōu)化:在“配置”>“SDH智能”>“智能路徑管理”>“維護”界面中,單擊優(yōu)化。三是重新配置:去激活后重新激活業(yè)務(wù);刪除智能業(yè)務(wù)后重建靜態(tài)業(yè)務(wù)。
(2)若是ASON網(wǎng)外故障:一是接入點保護倒換:若ASON業(yè)務(wù)的源/宿接入點存在1+1或1:1MSP保護,進行保護倒換。二是接入點告警清除:若ASON業(yè)務(wù)源/宿節(jié)點端口有RLOS/RLOF/AU_CMM/AU_AIS/AU_LOP/HP_UNEQ/HP_TIM等告警,先清除這些告警。
除了以上列舉的故障外還有一些比較簡單的其他故障,如電源故障、單板故障等。MSTP技術(shù)一定會被越來越多的人接受,其設(shè)備的日常維護與故障處理保障也將成為必要。