近日,同事反映某小區(qū)部分用戶不能正常上網(wǎng),寬帶撥號(hào)錯(cuò)誤代碼678。該小區(qū)機(jī)房都部署了2臺(tái)OLT設(shè)備,小區(qū)內(nèi)的OLT采用串聯(lián)的方式連接,第一級(jí)OLT連接了一臺(tái)匯聚交換機(jī),然后這臺(tái)交換機(jī)上聯(lián)BRAS完成整個(gè)上網(wǎng)過程。
該小區(qū)的互聯(lián)網(wǎng)用戶分別屬于不同的OLT,但是這2個(gè)OLT都連接到了一臺(tái)交換機(jī)。我們首先排查了交換機(jī),通過對(duì)端口流量、CPU和內(nèi)存利用率的查看,并沒有發(fā)現(xiàn)異常,查看ONU設(shè)備的接收光功率都在正常范圍內(nèi)。
因?yàn)樾^(qū)位置較遠(yuǎn),我們決定和故障現(xiàn)場采用兩頭一起查,逐漸將故障范圍向中間縮小的辦法進(jìn)行處理。首先在機(jī)房匯聚交換機(jī)上進(jìn)行測試,上網(wǎng)沒有問題。這時(shí)現(xiàn)場的同事告訴我們,其中一個(gè)小區(qū)的級(jí)聯(lián)OLT上測試也沒有問題。趕到小區(qū)機(jī)房,安排同事到故障用戶家中進(jìn)行配合,通過ONU的MAC地址查找到該ONU屬于第一級(jí)型號(hào)為6800的OLT。立即在該OLT上進(jìn)行上網(wǎng)測試,結(jié)果是撥號(hào)不成功,錯(cuò)誤代碼678。
回顧一下故障現(xiàn)象,能在級(jí)聯(lián)OLT上撥號(hào)成功,而在第一級(jí)OLT上卻不能撥號(hào)成功,會(huì)不會(huì)是第一級(jí)OLT出現(xiàn)了故障,還是級(jí)聯(lián)OLT影響的?斷開級(jí)聯(lián)OLT的端口后,第一級(jí)OLT可以正常上網(wǎng),故障用戶家中的同事也反映可以正常撥號(hào)了,但是級(jí)聯(lián)OLT下的用戶由于和第一級(jí)OLT斷開,則不能正常上網(wǎng)。
為了徹底排除故障,我們決定在第一級(jí)OLT上進(jìn)行抓包,發(fā)現(xiàn)整個(gè)OLT上充斥著大量的異常報(bào)文。經(jīng)分析得知,這是OLT設(shè)備默認(rèn)VLAN1發(fā)送的廣播包。由于VLAN1廣播域太大,會(huì)造成ONU地址表學(xué)滿。通過查看ONU上聯(lián)口,發(fā)現(xiàn)其學(xué)到約1200條MAC,從而導(dǎo)致第一級(jí)OLT上的ONU數(shù)據(jù)由于VLAN1而擁塞,出現(xiàn)寬帶錯(cuò)誤代碼678。
在OLT 的所有GE端口間斷開VLAN1流量,從而達(dá)到了禁止VLAN的廣播包在OLT內(nèi)洪范的問題。做完這些操作后,故障得以排除。