武海英
【摘要】 SDH2.5G光板—S16光板在處理光路和業(yè)務(wù)方面正常,但處理倒換K字節(jié)異常,影響了復(fù)用段環(huán)的正常倒換,造成復(fù)用段環(huán)上的業(yè)務(wù)中斷。由于K字節(jié)只有在倒換時才發(fā)送,無法提前通過告警等發(fā)現(xiàn)異常,正因?yàn)镾16光板本身無告警,給故障處理帶來了一定的難度。
【關(guān)鍵詞】 光板 K字節(jié) 異常 中斷
SDH2.5G光板—S16光板在處理光路和業(yè)務(wù)方面正常,但處理倒換K字節(jié)異常,影響了復(fù)用段環(huán)的正常倒換,造成復(fù)用段環(huán)上的業(yè)務(wù)中斷。由于K字節(jié)只有在倒換時才發(fā)送,無法提前通過告警等發(fā)現(xiàn)異常,正因?yàn)镾16光板本身無告警,給故障處理帶來了一定的難度?,F(xiàn)將由于太原一樞紐S16光板處理倒換K字節(jié)出現(xiàn)異常導(dǎo)致部分臨汾業(yè)務(wù)中斷的故障情況做以下詳細(xì)的介紹。
一、系統(tǒng)網(wǎng)絡(luò)情況介紹
省南環(huán)WDM32λ系統(tǒng)建于2002年,以太原一、二樞紐為核心,覆蓋太原以南的榆次、臨汾、運(yùn)城、晉城、長治、陽泉6個地市,采用華為Optix BWS 320G設(shè)備,每波速率為2.5Gb/s或10Gb/s,共32波,現(xiàn)已占用24波,承載IP2.5G/10G顆粒及SDH2.5G/10G傳輸系統(tǒng)。其中第λ8波承載太原臨汾環(huán)SDH2.5G系統(tǒng),為兩纖雙向復(fù)用段保換環(huán),環(huán)上開有臨汾的多條2M固話交換電路、大客戶出租電路、2條114百兆電路。
省南環(huán)WDM32λ系統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu)圖如圖1。
第λ8波承載的太原臨汾環(huán)SDH2.5G系統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu)圖如圖2。
二、故障現(xiàn)象
臨汾告部分臨汾2M固話交換電路、大客戶出租電路、2條114百兆電路均不好。查看這些電路均開在省南環(huán)WDM32λ系統(tǒng)第λ8波承載的太原臨汾環(huán)SDH2.5G系統(tǒng)中,分別為臨汾S-1N0009、臨汾S-1N0012、臨汾FE0001、臨汾FE002。查看網(wǎng)管太原臨汾環(huán)SDH2.5G系統(tǒng)中205-臨汾-1-PQ1板和205-臨汾-3-PQ1板的63個2M口均有TU-AIS告警、205-臨汾-14-EFS板4個FE口均有VC3-AIS告警 。查看太原臨汾環(huán)SDH2.5G系統(tǒng)太原二樞紐-臨汾段之間發(fā)生復(fù)用段倒換。
三、故障處理及定位過程
1、首先查看太原臨汾環(huán)SDH2.5G的復(fù)用段倒換狀態(tài),未發(fā)現(xiàn)異常,后重新啟停全網(wǎng)復(fù)用段協(xié)議無效。
2、接著根據(jù)省南環(huán)WDM32λ系統(tǒng)第λ8波的信號流查看90-臨汾-7-TWC板無誤碼,84-榆次-5-TWC板無誤碼,145-太原二樞紐-4-RWC板有大誤碼,初步判定是省南環(huán)WDM32λ系統(tǒng)第λ8波太原二樞紐收榆次之間波道不好,導(dǎo)致第λ8波下掛太原臨汾環(huán)SDH2.5G發(fā)生倒換。
3、為盡快恢復(fù)波道,需要通過空閑波道倒接的方法臨時搶通榆次到太原二樞紐之間的第λ8波。由于太原二樞紐為無人值守機(jī)房,通知太原派人到二樞紐處理。
4、為盡快搶通受影響的臨汾業(yè)務(wù),決定先在網(wǎng)管上通過更改業(yè)務(wù)配置,即業(yè)務(wù)走環(huán)網(wǎng)另外一個方向路由的方法來快速恢復(fù)業(yè)務(wù)。利用太原臨汾環(huán)SDH2.5G臨汾—太原段之間第1-8個VC4時隙中空閑VC4時隙重新配置交叉連接數(shù)據(jù),先恢復(fù)了205-臨汾3-PQ1板的的2M業(yè)務(wù),即臨汾S-1N0012上的所有2M電路,接著恢復(fù)了205-臨汾-14-EFS板的第2個百兆業(yè)務(wù),即臨汾FE0002電路。
5、由于太原臨汾環(huán)SDH2.5G臨汾-太原段之間空閑VC4時隙不足,剩余臨汾業(yè)務(wù)無法通過更改業(yè)務(wù)配置的方法進(jìn)行恢復(fù)。接著又對網(wǎng)元復(fù)用段配置、復(fù)用段倒換事件等信息進(jìn)行采集分析,逐條分析倒換事件,發(fā)現(xiàn)211-二樞紐倒換沒有正常執(zhí)行,分析三個站點(diǎn)的K字節(jié)傳送,發(fā)現(xiàn)202-太原的5槽位S16板始終接收不正確的K字節(jié),但沒有發(fā)送,初步判斷可能為202-太原的5槽位S16板故障,處理K字節(jié)有誤碼,影響復(fù)用段環(huán)倒換。
6、太原維護(hù)人員到達(dá)二樞紐機(jī)房后,榆次與太原二樞紐用空閑通道進(jìn)行倒接,榆次到太原二樞紐之間波分側(cè)恢復(fù)正常,太原臨汾環(huán)SDH2.5G太原二樞紐到臨汾的光路顯示恢復(fù),10分鐘后,太原臨汾環(huán)SDH2.5G復(fù)用段倒換結(jié)束,剩余部分中斷的臨汾業(yè)務(wù)恢復(fù)。至此,臨汾業(yè)務(wù)全部恢復(fù)正常。
7、對現(xiàn)網(wǎng)數(shù)據(jù)再次進(jìn)行分析,基本確定是202-太原的5槽位S16光板故障。需要在晚上0點(diǎn)以后進(jìn)行測試處理。
四、故障的最終徹底解決
晚上0:00分開始,對太原臨汾環(huán)SDH2.5G進(jìn)行測試處理。首先在網(wǎng)管上模擬中斷202-太原到205-臨汾之間的光路,太原臨汾環(huán)SDH2.5G倒換,倒換后業(yè)務(wù)正常。接著更換202-太原的5槽位S16板,倒換恢復(fù)后,修改205-臨汾的3槽位PQ1業(yè)務(wù)配置路由,恢復(fù)回原來的路由—臨汾和太原二樞紐之間。模擬中斷205-臨汾到211-二樞紐之間的光路,觀察205-臨汾的3槽位PQ1板業(yè)務(wù),未發(fā)現(xiàn)中斷,分析復(fù)用段倒換事件,未發(fā)現(xiàn)異常,確認(rèn)復(fù)用段倒換正常。后將太原臨汾環(huán)SDH2.5G逐段模擬光路中斷進(jìn)行倒換測試,均未發(fā)現(xiàn)有業(yè)務(wù)中斷情況,確認(rèn)問題解決。
五、后續(xù)建議和改進(jìn)措施
1、光板在處理光路和業(yè)務(wù)方面正常,處理倒換k字節(jié)異常時,由于K字節(jié)只有在倒換時才發(fā)送,因此無法提前通過告警等發(fā)現(xiàn),只能通過倒換測試發(fā)現(xiàn)。今后要定期對SDH環(huán)進(jìn)行倒換測試,以便能及時發(fā)現(xiàn)網(wǎng)絡(luò)隱患。
2、在處理波分側(cè)故障時,在SDH環(huán)倒換時,首先確認(rèn)SDH環(huán)倒換情況,若倒換失敗,則需要馬上恢復(fù)波分光路,以便業(yè)務(wù)能快速恢復(fù)。
3、目前省南、北環(huán)WDM32λ在網(wǎng)時間已有11年,設(shè)備已進(jìn)入后生命周期,需要盡快整體替換該網(wǎng)絡(luò)。