田家雨
(中國電信股份有限公司常熟分公司網(wǎng)絡維護中心,蘇州 215500)
本地光纖用戶規(guī)模龐大,涵蓋了寬帶、itv、語音等各類應用。EPON網(wǎng)絡由三部分組成:OLT、ODN、ONU。OLT為局端設備,以華為設備為主;ODN為OLT到ONU之間的線路部分;ONU為用戶端設備,既俗稱的光貓。
為了承載更多的用戶,EPON采用了時分復用技術。下行方向,OLT通過廣播方式將數(shù)據(jù)包發(fā)送給所有ONU;上行方向,OLT給每個ONU分配唯一的llid,并通過GATE幀分配不同的時隙,ONU在自己的時隙發(fā)光,向OLT發(fā)送數(shù)據(jù)包。
案例1:同一光分下大部分ONU不起,查看注冊信息,ONU不停的反復注冊,現(xiàn)場光分下收光,發(fā)現(xiàn)某根纖下ONU有發(fā)光,更換新ONU后障礙恢復。
案例2:同一光分下較多用戶寬帶、itv使用異常,OLT上查看CRC錯誤幀增長較快,用戶處ping包存在丟包現(xiàn)象,現(xiàn)場插拔光分下纖,當拔下某根纖后錯誤幀不再增長,ping包正常,更換后障礙恢復。
案例3:新裝ONU無法注冊,關閉光分下任意一個ONU后能注冊,但關閉的ONU打開后無法注冊,在OLT的diagnose模式下查看llid,存在UserReserve狀態(tài),更換該狀態(tài)對應ONU后狀態(tài)全為InService,ONU能成功注冊。
上述典型案例結合時分復用技術理論,我們可以得出流氓ONU的特性:不是自己的時隙也在發(fā)光,上行方向與正常發(fā)光的ONU產生沖突,從而影響了其它ONU的性能;由于沖突的產生,OLT在同一時隙收到2個ONU發(fā)來的數(shù)據(jù)包,無法判斷是由誰發(fā)出,丟棄了數(shù)據(jù)包,因此,流氓ONU也會導致錯誤幀的存在。
整理更換下來的ONU終端,發(fā)現(xiàn)流氓ONU主要是以下兩種原因引起:(1)由于使用年限較長導致光模塊產生異?;蛘哕浖霈F(xiàn)問題;(2)部分質量不過關的雜牌ONU。
根據(jù)ONU的發(fā)光情況,流氓ONU可以分為以下三種:
(1)長發(fā)光ONU:任意時間都在發(fā)光的ONU,影響幾乎光分下所有ONU;
(2)不定時發(fā)光ONU:ONU在不屬于自己的時隙不規(guī)則發(fā)光,可以提前也可以延后,這類ONU比較常見,只影響部分ONU,因此也是最難排查的;
(3)非法占用llid的ONU:在OLT上看該ONU已經下線,OLT釋放llid,但是ONU由于自身異常,顯示仍然在線,占用的llid未釋放;新的ONU上線并被分配了該llid,兩個ONU在上行方向產生沖突,從而導致新ONU無法注冊。此類ONU屬于不定時發(fā)光ONU的特殊情況,也稱為“假在線”O(jiān)NU,只影響一個其他ONU,同樣難以排查。
流氓ONU處理過程分為三步:檢測、排查、解決。
檢測既確定存在流氓ONU,存在的前提為更換PON口光模塊、更換PON板均無效。由于流氓ONU影響的是同一個光分下的其它ONU,所以當整個光分存在下列現(xiàn)象之一時,一般認為存在疑似流氓ONU:
(1)光分下大部分ONU不起,或者是頻繁的注冊,上下線;
(2)光分下部分ONU使用異常,上網(wǎng)、itv卡頓、ping包丟包等情況;
(3)華為OLT診斷模式diagnose下,使用display statistics emac frameid/slotid portid命令查看,PON口存在CRC錯誤幀,且增長明顯(PON板型號為EPBD、EPBC時能夠使用);
(4)OLT使用display statistics ont-line-quality frameid/slotid portid ontid命令查看障礙用戶線路質量,存在FCS錯誤幀;
(5)新裝ONU1無法注冊,關閉光分下任意ONU2后能注冊,但是打開ONU2后2無法注冊;使用命令display ont version和display ont info,分別查詢PON口下ONU數(shù)量不相等。
雖然OLT設備帶有自檢及隔離流氓ONU功能,但經過實踐發(fā)現(xiàn)經常會將正常ONU隔離,所以排查以現(xiàn)場拔纖為主,OLT查看為輔;以障礙恢復為排查成功原則。由于光分有一級光分、二級光分兩種,所以排查時先插拔二級光分,再插拔一級光分。
(1)diagnose模式下使用display epon llid alloc-record current命令查看llid是否存在UserReserve狀態(tài),如果存在則拔下該狀態(tài)對應的纖,否則進入步驟3;
(2)如果拔纖后障礙恢復,且UserReserve狀態(tài)不再存在,說明該纖對應ONU為流氓ONU,否則進入下一步;
(3)光功率計在光分反向收光,如果有光則該處存在流氓ONU;
(4)如果存在二級光分,則先斷開一半的二級光分,觀察障礙情況、CRC錯誤幀及FCS錯誤幀,如果恢復則說明斷開的二級光分中存在流氓ONU,依次還原并觀察直到找出流氓ONU所在的二級光分,進行步驟5;如果障礙未恢復,則繼續(xù)斷開剩下二級光分的一半,以此類推直到障礙恢復;
(5)斷開一級或者經步驟4確認存在流氓ONU的二級光分上一半的纖,操作方法同上,直到找出流氓ONU所在的纖為止。
流氓ONU的解決根據(jù)排查的結果分為兩種情況:
(1)找出了流氓ONU所在的纖,更換纖所對應的ONU;
(2)極少數(shù)情況插拔完整個光分仍未找出,可以更換具備保護功能的PON板EPSD型號應急,該板對ONU發(fā)光時隙有限制,能將流氓ONU的影響范圍減??;待障礙恢復后,后續(xù)通過廠家研發(fā)使用內部命令繼續(xù)排查。
流氓ONU故障是EPON網(wǎng)絡維護中面臨的一個難題,根據(jù)日常維護案例整理總結出的檢測、排查、解決手段能處理絕大多數(shù)此類障礙,且準確率較高,但仍然存在低效的缺點。一方面,隨著各項技術的成熟,維護經驗的增長,解決流氓ONU的辦法相信會越來越多;另一方面,要根本上解決此類障礙,還需要加強對終端ONU的管理,避免老舊ONU在網(wǎng)使用,拒絕兼容性欠佳的雜牌ONU入網(wǎng)。
[1] 華為EPON技術指導書.