李茜
山西陽泉升華通信技術(shù)有限公司, 山西 陽泉 045000
我在單位主要負責(zé)EWSD交換機的運行維護,故障處理。工作近二十年來,從1994年8月開通的全國首家專網(wǎng)六千門EWSD程控交換機到現(xiàn)在發(fā)展成五萬余門的規(guī)模,設(shè)備第一次出現(xiàn)雙側(cè)硬盤均UNA的嚴重情況,相對來說比較重視。特認真分析,仔細研究,寫成論文,以便今后更好地管理維護,保證交換機安全、可靠、穩(wěn)定運行。
2006年7月22日,我局所屬703分局突然出現(xiàn)AIC-0告警,即風(fēng)扇告警。由于當(dāng)時我離告警現(xiàn)場較遠,只好電話通知就近的非維護人員看了一下程控機房的空調(diào)及CP113C機柜的風(fēng)扇。但未看出什么問題,空調(diào)未停,機柜風(fēng)扇也轉(zhuǎn)。我有些奇怪,以前遇見的風(fēng)扇告警都是停電告警,通電告警自動消除。這次是?急急忙忙往告警地點趕。沒想到人未到,故障繼續(xù)升級惡化,具體告警內(nèi)容顯示如下:
表明1側(cè)硬盤已退出服務(wù),于是采取相應(yīng)動作,試圖激活該側(cè)硬盤,但不成功。此時,0側(cè)硬盤也出現(xiàn)告警,雙硬盤故障產(chǎn)生!告警消息如下:
通過以上報告,可以得出結(jié)論:1側(cè)硬盤及其上級單元IOC-1均UNA,因此決定先激活0側(cè)硬盤,并嚴格按照雙硬盤故障處理流程操作,命令如下:
交換機隨后提示如下消息:
根據(jù)操作流程,決定執(zhí)行第三條命令CONTMDDACT;
意思是在雙側(cè)硬盤均UNA的情況下,`用文件控制處理機去重新激活。命令執(zhí)行.
接著UPDGEN; 命令接受。52秒后命令執(zhí)行。
該命令為的是在硬盤上恢復(fù)一個可執(zhí)行的GEN,繼續(xù)系統(tǒng)的操作。這條命令可被用來在硬盤故障調(diào)試程序期間保存非永久性數(shù)據(jù)。
此時全部電話正常,都能打出去了。系統(tǒng)已從雙硬盤故障中恢復(fù),接下來要檢查相應(yīng)數(shù)據(jù)。
2.1 此次故障原因是703局停電,交換機靠蓄電池供電,幾乎快放空所致。在這個過程中,風(fēng)扇是一個一個往下掉電,而且是首先告警,然后是MDD1側(cè)和0側(cè)。我讓非維護人員看空調(diào)和風(fēng)扇,那時設(shè)備已來電,但硬盤均UNA。不到現(xiàn)場輸命令,設(shè)備不能自動恢復(fù)。還算發(fā)現(xiàn)的及時,否則,后果不堪設(shè)想。再拖延一段時間,那就會造成話費丟失的重大故障。這就要求我們維護人員一定要及時迅速處理故障,勿因小失大。
2.2 事后,我仔細看了OMT上的自動輸出報告發(fā)現(xiàn):其實在13:59時已有POWER FAILURE的告警自動提示。說明EWSD交換機軟件系統(tǒng)對此早有考慮。告警很準確,很到位。是很成熟的產(chǎn)品。機房的技術(shù)資料中也有這類描述。平日多翻翻,積少成多,天長日久,維護水平才會不斷提高。
2.3 程控交換機告警的同時,703局ADSL設(shè)備也同樣有故障,上不了網(wǎng)。一般來說,它們之間互不影響。有經(jīng)驗的技術(shù)人員應(yīng)馬上懷疑到它們的共性:電源問題!