徐瑞宏
如果CPU各模塊負荷不均衡,需要進行模塊間負荷調(diào)整。
如果CPU各模塊負荷已經(jīng)比較均衡且負荷都很高,需要進行擴容業(yè)務(wù)處理。
c、數(shù)據(jù)調(diào)整
關(guān)閉加密,鑒權(quán)次數(shù)減少直到關(guān)閉,關(guān)閉全網(wǎng)尋呼等,以減少信令流量。
二、典型場景分析
1 場景:大量用戶同時位置更新導(dǎo)致C/D接口擁塞
當出現(xiàn)因A/Abis接口、C/D接口傳輸長時間中斷或者呼叫處理模塊重啟等情況,導(dǎo)致較長時間的業(yè)務(wù)中斷后,在系統(tǒng)恢復(fù)正常后,大量的用戶同時位置更新,造成C/D接口嚴重擁塞,業(yè)務(wù)受到較大影響。
1.1 界定方法:
1) 觀察是否有C/D口鏈路擁塞或者故障告警;
2) 觀察是否存在大量的位置更新操作超時統(tǒng)計;
3) 觀察位置管理業(yè)務(wù)測量話統(tǒng),如果發(fā)現(xiàn)位置更新成功率顯著下降,遠遠低于平時的指標, 并且存在大量的位置更新操作超時的統(tǒng)計,則確認發(fā)生C/D接口發(fā)生擁塞。
1.2 應(yīng)急處理:
1) 第一時間關(guān)閉所有鑒權(quán)加密配置,減輕C/D口負荷。
2) 使用HLR HTR增強流控。
當MSC到被監(jiān)控的HLR鏈路出現(xiàn)擁塞、難以到達(HTR)的現(xiàn)象時,MSC自動啟動流控,根據(jù)擁塞情況按比例拒絕業(yè)務(wù),達到緩解鏈路擁塞的目的。 MSC根據(jù)當前監(jiān)控周期內(nèi)的流控級別進行過濾。
流控級別:0~15級。0級為不進行流控。級別越高,被拒掉的請求越多,如級別為15級,則每16個位置更新請求中會拒掉15個,允許通過一個。MSC/VLR根據(jù)鏈路是否出現(xiàn)HTR來調(diào)整流控級別。
2 場景:尋呼成功率低
2.1 界定方法:
一般情況下,BSC每小時處理的尋呼請求次數(shù)在15-20萬次以下。在BSC每小時處理的尋呼請求次數(shù)超過BSC尋呼處理能力,觀察“位置區(qū)話務(wù)量測量”話統(tǒng)中的尋呼次數(shù)、尋呼響應(yīng)次數(shù)。根據(jù)位置區(qū)和BSC的對應(yīng)關(guān)系,可以計算出發(fā)向某個BSC的尋呼次數(shù)和BSC響應(yīng)的尋呼響應(yīng)次數(shù)。如果尋呼成功率會大幅下降,需要啟動尋呼策略調(diào)整。
2.2 預(yù)防處理:
話務(wù)高峰期間,建議提前評估,針對可能存在尋呼過載的BSC,提前修改尋呼策略:
1) 關(guān)閉系統(tǒng)中配置的全網(wǎng)尋呼;
2) 調(diào)整不合理的LAI-BSC配置:
2.3 應(yīng)急處理:
將部分業(yè)務(wù)比如短消息的尋呼次數(shù)減少為1次;
如果尋呼量遠遠大于BSC的處理能力,建議對于所有業(yè)務(wù)的尋呼都
修改為1次。
3 場景:大量短消息業(yè)務(wù)導(dǎo)致接通率低
3.1 界定方法:
1) 觀察短消息業(yè)務(wù)測量話統(tǒng),短消息的移動始發(fā)短消息試發(fā)次數(shù),移動終接短消息試發(fā)次數(shù)的數(shù)量大量增加;
2) 觀察局向出入局話統(tǒng),中繼局向出入局話統(tǒng),接通率明顯下降;
3) 觀察和短消息中心連接的鏈路的負荷,同時觀察到短消息中心的鏈路所在模塊的CPU的負荷情況;
4) 如果短消息的試發(fā)次數(shù)數(shù)量大量增加,并且觀察到接通率明顯下降,進一步觀察到短消息中心連接的鏈路的負荷有較大增長,并且到短消息中心的鏈路所在模塊的CPU的負荷有較大增長,可以判斷由于大量短消息業(yè)務(wù)導(dǎo)致接通率低。
3.2 應(yīng)急處理:
啟動業(yè)務(wù)流控,進行終結(jié)短消息的流控。
4 場景:大量呼叫處理模塊WCCU過載
4.1 界定方法:
1) 觀察CPU占用率測量話統(tǒng);
2) 觀察是否出現(xiàn)單板CPU過載的告警;
3) 觀察各大局向的中繼局向話統(tǒng),分析局向話務(wù)統(tǒng)計情況;
4) 出現(xiàn)大量模塊頻繁過載時,分析各個流向的話務(wù)量是否正常,確定系統(tǒng)處于正常過載還是異常過載。
4.2 預(yù)防處理:
啟動業(yè)務(wù)流控:
首先查看業(yè)務(wù)流控的話統(tǒng)結(jié)果,在現(xiàn)網(wǎng)話統(tǒng)的基礎(chǔ)之上,綜合考慮模塊的CPU占用率情況,得出業(yè)務(wù)流控的合理閥值 ,進行配置。
4.3 應(yīng)急處理
1) 對于正常過載,模塊CPU占用率穩(wěn)定在過載門限上下波動,接通話務(wù)量保持穩(wěn)定,對于此類情況,建議不進行處理;
2) 對于異常過載,需要使用業(yè)務(wù)流控降低話務(wù)量,保持CPU負荷的穩(wěn)定,并保證一定的接通話務(wù)量。
三、實例-四川移動某局點512實施應(yīng)急保障方案后網(wǎng)絡(luò)運行分析
1.1 512地震后采取的應(yīng)急措施
地震后當天下午,試呼次數(shù)是平常的9倍,系統(tǒng)擁塞嚴重,立即采取了如下措施:
1) 關(guān)閉鑒權(quán)、加密;
2) 尋呼次數(shù)調(diào)整為1次,尋呼間隔7秒;
3) 關(guān)閉彩鈴功能;
4) 打開業(yè)務(wù)流控,每個CCU模塊對始發(fā)呼叫MO和接收短信SMT進行限制;MO每個模塊10-15次,SMT每個模塊20次;
5) 漫游號碼釋放時長從90秒修改為7秒;