陳平煒
摘 要:文章對(duì)軟交換CS域CE網(wǎng)絡(luò)的應(yīng)急預(yù)案進(jìn)行了分析,適用于漳州聯(lián)通公司移動(dòng)通信網(wǎng)軟交換CS域CE在節(jié)假日、設(shè)備故障、自然災(zāi)害、反恐事件、公共突發(fā)事件、重大活動(dòng)、軍事演習(xí)的應(yīng)急通信保障,以及在自然災(zāi)害和其他突發(fā)事件中遭到破壞情況的應(yīng)急處置和通信恢復(fù)。
關(guān)鍵詞:軟交換;路由器;應(yīng)急
中圖分類號(hào):TN915.02 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-8937(2015)23-0074-02
1 網(wǎng)絡(luò)概況
漳州聯(lián)通軟交換網(wǎng)絡(luò)備采用中興軟交換設(shè)備和CE設(shè)備,CE路由器采用中興T64E和T600,交換機(jī)采用T64G。MSC SERVER下掛兩個(gè)MGW,其中一個(gè)MGW與MSC SERVER同機(jī)房同網(wǎng)段,另一個(gè)MGW在另一個(gè)機(jī)房,需要跨CE跨IP承載網(wǎng)流量。
2 通路組織情況
2.1 總體介紹
軟交換CS域CE設(shè)備提供軟交換端局MGW和MSC SERVER之間信令傳輸?shù)某休d,主要包括CE路由器和匯聚交換機(jī)?,F(xiàn)網(wǎng)每個(gè)局點(diǎn)配置一對(duì)CE路由器,每個(gè)機(jī)房配置一對(duì)匯聚交換機(jī)。一對(duì)匯聚交換機(jī)通過(guò)GE接口,以口字型接入一對(duì)CE路由器;一對(duì)CE路由器通過(guò)GE接口以口字型接入本地一對(duì)AR路由器。軟交換端局MSC Server和MGW通過(guò)GE/FE連接至匯聚交換機(jī)。AR路由器與CE路由器間采用靜態(tài)路由協(xié)議,CE路由器之間或者匯聚交換機(jī)之間起VRRP協(xié)議。根據(jù)IP承載設(shè)計(jì)的特點(diǎn),軟交換的信令流,在默認(rèn)情況下,通過(guò)CE1-AR1路由器上IP承載網(wǎng),回程路由也是通過(guò)AR1-CE1來(lái)疏通的。只有1側(cè)設(shè)備出現(xiàn)故障時(shí),才會(huì)啟用2側(cè)設(shè)備。而且,只要下一跳的2側(cè)和1側(cè)鏈路完好,流量會(huì)在下一跳從2側(cè)回到1側(cè)設(shè)備,回程路由亦是如此。
2.2 漳州分公司CE及軟交換網(wǎng)絡(luò)結(jié)構(gòu)、業(yè)務(wù)流量介紹
漳州移動(dòng)網(wǎng)絡(luò)公司在榮昌機(jī)房、新浦機(jī)房2個(gè)局點(diǎn)設(shè)有軟交換設(shè)備,如圖1所示。
2個(gè)局點(diǎn)各設(shè)置了1對(duì)中興T600路由器,作為CE 接入設(shè)備。在榮昌3層、新浦5層2個(gè)有軟交換設(shè)備的機(jī)房?jī)?nèi)各設(shè)置1對(duì)中興T64G作為匯聚交換機(jī)。業(yè)務(wù)流量流向:ZZMGW1歸屬ZZSS1,信令流量流向ZZMGW1<->漳州榮昌3層T64G-1<->ZZSS1(注:由于ZZMGW1和ZZSS1在同一網(wǎng)段)ZZMGW2歸屬ZZSS1,信令流量流向ZZMGW2<->漳州新浦5層T64G-1<->漳州新浦CE1<->漳州AR1<->漳州榮昌CE1<->漳州榮昌3層T64G-1<->ZZSS1,從另一個(gè)角度分析漳州榮昌CE路由器出的問(wèn)題,將會(huì)影響漳州MGW2下掛用戶的業(yè)務(wù),以及XMSS3對(duì)漳州MGW1業(yè)務(wù)的備用功能;漳州新浦CE路由器出問(wèn)題,將會(huì)影響漳州MGW2下掛用戶的業(yè)務(wù),以及XMSS3對(duì)漳州MGW2下掛用戶業(yè)務(wù)的備份功能;漳州榮昌T64G出問(wèn)題,將會(huì)影響漳州MGW1、漳州MGW2下掛用戶的業(yè)務(wù)以及XMSS3對(duì)漳州MGW1下掛用戶業(yè)務(wù)的備份功能;漳州新浦T64G出問(wèn)題,將會(huì)影響漳州MGW2下掛用戶的業(yè)務(wù),以及XMSS3對(duì)漳州MGW2下掛用戶業(yè)務(wù)的備份功能;若匯聚交換機(jī)之間的互聯(lián)鏈路(該TRUNK為VRRP的心跳檢測(cè)鏈路)全部中斷,將造成下掛軟交換設(shè)備找不到網(wǎng)關(guān),業(yè)務(wù)全阻。
3 應(yīng)急措施
正常情況下,具體流量如圖2所示。
3.1 主用CE路由器與匯聚交換機(jī)的鏈路中斷后
主用CE路由器與匯聚交換機(jī)的鏈路中斷后,根據(jù)部署的VRRP協(xié)議備用CE路由器成為master,但是軟交換設(shè)備的網(wǎng)關(guān)不改變。
出流量:軟交換端局->{1}->{9}->{3}->{10}->{5}->{12}->{8};入流量:由于主用AR路由器到軟交換設(shè)備路徑優(yōu)于備用AR路由器到路徑,因此入流量依然主用AR路由器->{7}->{11}->{6}->{12}->{5}。此時(shí),如果{6}中斷,將造成業(yè)務(wù)全阻。
3.2 主用CE路由器與主用AR之間鏈路中斷
出流量:軟交換端局->{1}->{9}->{4}->{11}->{6}->{12}->{8};入流量:備用AR路由器->{8}->{12}->{6}->{11}->{4}->{9}->{1};此時(shí),如果{6}中斷,將造成業(yè)務(wù)全阻。如果{3}中斷,可能會(huì)造成業(yè)務(wù)全阻。
3.3 軟交換設(shè)備的主用鏈路中斷
出流量:軟交換端局->{2}->{10}->{3}->{9}->{4}->{11}->{7};入流量:主用AR路由器->{7}->{11}->{4}->{9}->{3}->{10}->{2};此時(shí),如果{3}中斷,可能會(huì)造成業(yè)務(wù)全阻。
3.4 主用匯聚交換機(jī)宕機(jī)
出流量:軟交換端局->{2}->{10}->{5}->{12}->{8};入流量:主用AR路由器->{7}->{11}->{6}->{12}->{5}->{10}->{2}
3.5 主用CE路由器宕機(jī)出流量
軟交換端局->{1}->{9}->{3}->{10}->{5}->{12}->{8};入流量:備用AR路由器->{8}->{12}->{5}->{10}->{3}->{9}->{1}
3.6 CE路由器之間的相關(guān)故障
CE路由器之間的互聯(lián)鏈路全部中斷、軟交換備用鏈路中斷、備用匯聚交換機(jī)與備用CE路由器之間鏈路中斷、備用CE路由器與備用AR路由器間鏈路中斷、備用匯聚交換機(jī)宕機(jī)、備用CE路由器宕機(jī):由于業(yè)務(wù)正常情況下,只通過(guò){1}、{9}、{4}、{11}、{7}主用AR路由器疏通流量,因此只要主用側(cè)設(shè)備、鏈路正常,備用側(cè)鏈路或設(shè)備故障,不會(huì)影響業(yè)務(wù)的流量流向。
3.7 匯聚交換機(jī)之間的互聯(lián)鏈路全部中斷
通常情況下,匯聚交換機(jī)之間采用多條鏈路捆綁為一個(gè)TRUNK,其中單條鏈路的中斷不會(huì)影響該TRUNK的正常。但是由于該TRUNK為VRRP的心跳檢測(cè)鏈路,如果該TRUNK的所有鏈路都中斷,將造成下掛軟交換設(shè)備找不到網(wǎng)關(guān),業(yè)務(wù)全阻。
4 應(yīng)急啟動(dòng)條件及處理措施
4.1 故障判斷過(guò)程
在MGW(新浦10.1.66.165/榮昌10.0.67.37)上ping榮昌Server (10.0.67.39),如果MGW能ping通榮昌Server,但是話務(wù)不通,則判斷為軟交換設(shè)備故障,啟動(dòng)軟交換應(yīng)急預(yù)案。
如果MGW不能ping通榮昌Server,或大量丟包,則判斷為承載網(wǎng)故障,啟動(dòng)CE應(yīng)急預(yù)案。立即檢查CE設(shè)備情況,使用PING、TRACERT等手段,逐段判斷鏈路是否正常。初步判定故障點(diǎn)后,如果業(yè)務(wù)仍不正常,則說(shuō)明設(shè)備或鏈路故障,但由于某種原因,流量未自動(dòng)切換到備用路由上,則啟動(dòng)如下處理過(guò)程。
4.2 CE故障處理流程以及應(yīng)急方法
CE故障處理流程以及應(yīng)急方法,此處理流程在MGW與Server之間通信異常,初步判斷故障為承載網(wǎng)故障的情況下適用。
①若網(wǎng)管能正常使用,榮昌MGW1(10.0.67.37)無(wú)法PING通榮昌SERVER(10.0.67.39),則判斷T64G部分端口故障,可為MGW1或SERVER重新分配端口,重新PING測(cè),確認(rèn)故障恢復(fù);若網(wǎng)管也無(wú)法正常使用,則判斷為T64G整機(jī)故障,則復(fù)位SIPI單板,將T64G-2倒換為主用。
②若新浦MGW2(10.1.66.165)無(wú)法PING通榮昌SERVER(10.0.67.39),則啟動(dòng)以下操作步驟。
在新浦MGW(10.1.66.165)上ping新浦MGW網(wǎng)關(guān)地址(新浦T600路由器VRRP的浮動(dòng)IP地址):10.1.66.161;如果新浦MGW不能ping通MGW的網(wǎng)關(guān)地址,則定位為新浦MGW與新浦T600-1設(shè)備之間通信有故障,需要檢查新浦MGW的地址和網(wǎng)關(guān)配置,檢查新浦MGW與新浦T64G-1交換機(jī),新浦T64G-1交換機(jī)與新浦T600-1路由器之間的鏈路以及設(shè)備狀態(tài)。如果無(wú)法判斷定位具體故障,則啟用應(yīng)急方法,如果啟用應(yīng)急方法后,MGW到Server通信仍異常,則直接轉(zhuǎn)步驟3。
應(yīng)急方法:Shutdown新浦T600-1的上下行端口和榮昌AR1與新浦T600-1互聯(lián)的端口;或斷開新浦T600-1的上行和下行鏈路。即:斷開新浦T600-1與新浦T64G-1之間的鏈路,同時(shí)斷開新浦T600-1與AR-1之間的鏈路。如果新浦MGW能ping通MGW的網(wǎng)關(guān)地址,則轉(zhuǎn)步驟2。
③在新浦MGW(10.1.66.165)上ping AR-1路由器與新浦T600-1互聯(lián)的接口地址(AR-1與新浦T600-1互聯(lián)地址):10.0.64.177;如果新浦MGW不能ping通AR-1與新浦T600-1互聯(lián)地址,則定為新浦MGW與AR-1之間通信故障,需要檢查新浦T600-1與AR-1之間的鏈路是否正常工作,T600-1與AR-1設(shè)備運(yùn)行是否正常。如果無(wú)法判斷定位具體故障,則啟用應(yīng)急方法, 如果啟用應(yīng)急方法后,新浦MGW到榮昌Server通信仍異常,則轉(zhuǎn)步驟3。
應(yīng)急方法:Shutdown 新浦T600-1的上下行端口和榮昌AR1與新浦T600-1互聯(lián)的端口;或斷開新浦T600-1的上行和下行鏈路。即:斷開新浦T600-1與新浦T64G-1之間的鏈路,同時(shí)斷開新浦T600-1與AR-1之間的鏈路。如果新浦MGW能ping通AR-1路由器與新浦T600-1的互聯(lián)地址,則轉(zhuǎn)步驟3。
在榮昌Server(10.0.67.39)上ping Server網(wǎng)關(guān)地址(榮昌T600的VRRP浮動(dòng)IP):10.0.67.33。如果榮昌Server不能ping通榮昌Server的網(wǎng)關(guān)地址(榮昌T600-1的VRRP浮動(dòng)IP),則定位為榮昌Server與榮昌T600-1之間通信故障,需要檢查榮昌Server的地址和網(wǎng)關(guān)配置是否正確,檢查榮昌Server與榮昌T64G-1,榮昌T64G-1交換機(jī)與榮昌T600-1之間的鏈路是否正常,檢查榮昌T64G-1和T600-1設(shè)備是否正常。如果無(wú)法定位到具體故障,則啟用應(yīng)急方法,如果啟用應(yīng)急方法后,新浦MGW到榮昌Server通信仍異常,則直接轉(zhuǎn)步驟5。
應(yīng)急方法:Shutdown 榮昌T600-1的上下行端口和榮昌AR1與榮昌T600-1互聯(lián)的端口;斷開榮昌T600-1的上行和下行鏈路。即:斷開榮昌T600-1與榮昌T64G-1之間的鏈路,同時(shí)斷開榮昌T600-1與AR-1之間的鏈路。如果榮昌Server能ping通榮昌Server的網(wǎng)關(guān)地址(榮昌T600-1的VRRP浮動(dòng)IP地址),則轉(zhuǎn)步驟4。
在榮昌Server上ping AR-1路由器的榮昌側(cè)接口地址(AR-1與榮昌T600-1的互聯(lián)地址):10.0.64.141;如果榮昌Server不能ping通AR-1與榮昌T600-1的互聯(lián)地址,側(cè)定位為榮昌T600-1與AR-1之間通信故障,需要檢查榮昌T600-1與AR-1之間的鏈路是否正常,榮昌T600-1與AR-1設(shè)備是否正常工作。如果無(wú)法定位到具體故障,則啟用應(yīng)急方法,如果啟用應(yīng)急方法后,新浦MGW到榮昌Server通信仍異常,則轉(zhuǎn)步驟5。
應(yīng)急方法:Shutdown 榮昌T600-1的上下行端口和榮昌AR1與榮昌T600-1互聯(lián)的端口;斷開榮昌T600-1的上行和下行鏈路。即:斷開榮昌T600-1與榮昌T64G-1之間的鏈路,同時(shí)斷開榮昌T600-1與AR-1之間的鏈路。
如果Server能ping通AR-1與Server側(cè)T600-1的互聯(lián)地址,MGW到Server通信仍異常,則轉(zhuǎn)步驟5。
4.3 疏導(dǎo)后業(yè)務(wù)的恢復(fù)測(cè)試
業(yè)務(wù)路由倒換后,從MGW ping MSC SERVER,觀察ping測(cè)是否丟包,時(shí)延是否正常。如果ping測(cè)正常,說(shuō)明MGW和MSC SERVER之間的IP承載恢復(fù)正常,觀察業(yè)務(wù)是否恢復(fù)正常(詳見“三、疏導(dǎo)后業(yè)務(wù)恢復(fù)測(cè)試”)。如果ping測(cè)不正常,說(shuō)明MGW和MSC SERVER之間的IP承載仍有問(wèn)題,回到“故障初定位和處理措施“,進(jìn)行下一步的處理。
參考文獻(xiàn):
[1] 李家龍,陳燕林,王松柏.軟交換系統(tǒng)A/Iu CS口IP化改造的研究與應(yīng)用[J].數(shù)字技術(shù)與應(yīng)用,2014,(5).
[2] 任華,孫建強(qiáng),王曉周.軟交換核心網(wǎng)CE設(shè)備安全保障探討[J].電信工程技術(shù)與標(biāo)準(zhǔn)化,2013,(5).
企業(yè)技術(shù)開發(fā)·中旬刊2015年8期