李鴻
摘要:本文通過(guò)對(duì)各種類型的計(jì)量自動(dòng)化終端上行通信故障的診斷分析,探討如何幫助計(jì)量運(yùn)維人員排查、處理因上行通信故障而造成計(jì)量自動(dòng)化終端與主站無(wú)法正常通訊的現(xiàn)象,制定日常維護(hù)方案以保證終端上線率和減少故障率,介紹通過(guò)應(yīng)用故障排查方法,在日常維護(hù)中取得的成效。
關(guān)鍵詞:上行通信;故障;診斷;分析;應(yīng)用
引言
計(jì)量自動(dòng)化終端與主站能否正常通訊的關(guān)鍵環(huán)節(jié)在于上行通信鏈路正常。由于計(jì)量自動(dòng)化運(yùn)維工作與通信知識(shí)密切相關(guān),針對(duì)部分計(jì)量運(yùn)維人員對(duì)通信專業(yè)不了解的情況,無(wú)法排查調(diào)試過(guò)程中由于各種原因?qū)е陆K端無(wú)法與主站建立連接,造成調(diào)試工作的停滯,影響電能量數(shù)據(jù)的正常采集。本文通過(guò)深入分析各類終端上行通信故障,摸索總結(jié)出各類終端參數(shù)設(shè)置、通道故障排查、前置機(jī)排查的方法及分享經(jīng)驗(yàn)和應(yīng)用成效。
1.計(jì)量自動(dòng)化上行通信技術(shù)
目前可用于計(jì)量自動(dòng)化終端與主站的遠(yuǎn)程通信技術(shù)主要有:PSTN電話撥號(hào)、4線音頻專線、數(shù)據(jù)網(wǎng)絡(luò)和GPRS/CDMA無(wú)線公網(wǎng)。其中負(fù)控終端、配變終端、低壓集抄(以下簡(jiǎn)稱為無(wú)線公網(wǎng)終端)是采用GPRS/CDMA通信方式;廠站終端則采用電話線、專線、網(wǎng)線3種通信方式與主站通信。
2.計(jì)量自動(dòng)化終端上行通信故障診斷分析
2.1無(wú)線公網(wǎng)終端通信故障分析
2.1.1無(wú)線公網(wǎng)終端撥號(hào)流程
GPRS(或CDMA)模塊初始化→開始撥號(hào)連接→撥號(hào)成功發(fā)送登陸幀→登陸成功→與主站正常通信。
2.1.2撥號(hào)故障分析
若終端撥號(hào)失敗,則說(shuō)明終端尚未連接至無(wú)線運(yùn)營(yíng)商,需檢查SIM卡是否欠費(fèi)、腐蝕或接觸不良、卡槽、模塊故障等;
若終端撥號(hào)成功,則說(shuō)明終端已經(jīng)正常連接無(wú)線運(yùn)營(yíng)商基站或服務(wù)器,無(wú)線運(yùn)營(yíng)商基站或服務(wù)器至計(jì)量自動(dòng)化主站的通道出現(xiàn)異常。
2.2廠站電能量采集終端通信故障分析
2.2.1上行通道故障:包括網(wǎng)絡(luò)通道、電話通道、四線專線通道故障。
2.2.2 設(shè)備故障:網(wǎng)卡、模塊、裝置故障等。
3.計(jì)量自動(dòng)化終端上行通信故障排查方法
3.1 無(wú)線公網(wǎng)終端通信故障排查
3.1.1 檢查無(wú)線公網(wǎng)終端通信通道是否正常
所謂的公網(wǎng)終端通信通道也就是指無(wú)線通信運(yùn)營(yíng)商提供一條專給電力專網(wǎng)提供的數(shù)據(jù)專線,因此若出現(xiàn)無(wú)緣故大批量的終端掉線現(xiàn)象,則首先應(yīng)提供一批因這次故障而掉線的終端IP給通信運(yùn)營(yíng)商查找原因,分析到底是SIM卡數(shù)據(jù)未捆綁好需要重置數(shù)據(jù)還是因?yàn)橥ǖ拦收闲枰幚怼?/p>
3.1.2檢查終端參數(shù)設(shè)置是否不正確或未設(shè)置
(1)檢查APN設(shè)置:在新安裝或更換終端時(shí),需在終端設(shè)置好APN(即登錄電力專網(wǎng)的身份通行證),沒(méi)有設(shè)置好(以湛江地區(qū)為例APN為ZJDLCB.GD)這個(gè)密碼,則所上傳的數(shù)據(jù)無(wú)法通過(guò)電力網(wǎng)關(guān)。
(2)檢查主站IP地址設(shè)置:需在終端設(shè)置好主站的服務(wù)器IP地址,(以湛江地區(qū)為例:負(fù)控服務(wù)器地址是192.168.2.30;配變是192.168.2.40),各類終端都有自己所屬的主站IP地址,否則數(shù)據(jù)無(wú)法到達(dá)指定的目的地。
(3)檢查通信協(xié)議及終端端口號(hào)(以湛江地區(qū)為例:TCP為5112、UDP為6112)。
3.2 廠站電能量采集終端通信故障排查
3.2.1 網(wǎng)絡(luò)通道故障排查
(1)檢查網(wǎng)絡(luò)連接情況(通過(guò)遠(yuǎn)程服務(wù)器ping交換機(jī)網(wǎng)關(guān)IP)。
(2)檢查裝置登錄情況(通過(guò)遠(yuǎn)程服務(wù)器ping終端IP,然后telnet終端)。
(3)通過(guò)終端調(diào)試軟件進(jìn)行測(cè)試,(將網(wǎng)線接頭接入筆記本電腦,筆記本電腦的IP、端口號(hào)等設(shè)置與終端一致,通過(guò)模擬主站檢查能否遠(yuǎn)程鏈接到筆記本電腦上。)
(4)重啟終端(檢查有的終端是否處在死機(jī)狀態(tài))。
3.2.2電話通道故障排查
(1)使用手機(jī)撥通終端接入電話號(hào)碼,查看是否有moden音
(2)使用萬(wàn)用表測(cè)量測(cè)量電話線電壓是否正常(直流50伏左右)
3.2.3 四線專線故障排查
(1)核對(duì)終端內(nèi)四線音頻專線MODEM 波特率、起止位、字節(jié)長(zhǎng)度、校驗(yàn)位與主站通信系統(tǒng)是否匹配。
(2)信號(hào)收發(fā)接線是否錯(cuò)誤,局方四芯專線的發(fā)(TX)要接終端的收(RX),終端的發(fā)(TX)接局方的收(RX)如下圖3-1所示。
(3)檢查四芯專線上送頻率是否正確,四芯專線的中心頻率為1700Hz,頻偏:±400 Hz,發(fā)送“1”,頻率為1300Hz,發(fā)送“0”,頻率為2100Hz,可用萬(wàn)用表測(cè)頻率是否為1(T+與T-間交流電壓約0.6V左右)。
(4)將四芯專線環(huán)測(cè),主站發(fā)命令進(jìn)行自發(fā)自收測(cè)試。
4.計(jì)量自動(dòng)化主站設(shè)備故障排查方法
如下圖4-1所示為計(jì)量自動(dòng)化系統(tǒng)數(shù)據(jù)傳遞流程,計(jì)量自動(dòng)化終端將現(xiàn)場(chǎng)采集的電能量信息通過(guò)通訊模塊,經(jīng)由各種通信方式經(jīng)通道到達(dá)電力專用網(wǎng)絡(luò)登錄主站系統(tǒng)。這些數(shù)據(jù)首先經(jīng)過(guò)防火墻的安全認(rèn)證,投送目標(biāo)地址,這些數(shù)據(jù)包在經(jīng)過(guò)確認(rèn)安全之后再轉(zhuǎn)發(fā)給路由器,路由器對(duì)數(shù)據(jù)包的報(bào)文報(bào)頭進(jìn)行解析,確定數(shù)據(jù)包交換機(jī)的轉(zhuǎn)發(fā)到達(dá)前置設(shè)備,前置設(shè)備對(duì)這些收到的數(shù)據(jù)進(jìn)行解析和初步處理,再將處理后的數(shù)據(jù)發(fā)給主站服務(wù)器,再由主站進(jìn)行后期處理和數(shù)據(jù)存儲(chǔ)等。其中交換機(jī)用來(lái)拓展網(wǎng)絡(luò)數(shù)量和劃分網(wǎng)絡(luò); 路由器主要起到網(wǎng)絡(luò)數(shù)據(jù)包的轉(zhuǎn)發(fā)和解析; 防火墻用來(lái)應(yīng)付整個(gè)網(wǎng)絡(luò)的攻擊。所以無(wú)論防火墻、路由器、交換機(jī)、前置機(jī)哪一環(huán)節(jié)出現(xiàn)問(wèn)題,都會(huì)影響數(shù)據(jù)是否最后進(jìn)入數(shù)據(jù)庫(kù)。通過(guò)多年來(lái)的運(yùn)行維護(hù)統(tǒng)計(jì),出現(xiàn)故障最多的還是在前置機(jī)是否正常工作、服務(wù)器的網(wǎng)絡(luò)連接是否正常這個(gè)環(huán)節(jié)。
4.1檢查是否為服務(wù)器無(wú)法啟動(dòng)
主要原因?yàn)椋孩偈须娀螂娫淳€故障(斷電或接觸不良);②電源或電源模塊故障;③內(nèi)存故障(一般伴有報(bào)警聲);④CPU故障(一般也會(huì)有報(bào)警聲);⑤主板故障;⑥其它插卡造成中斷沖突。
4.2檢查系統(tǒng)是否頻繁重啟
主要原因?yàn)椋孩匐娫垂收希ㄌ鎿Q法判斷解決);②內(nèi)存故障(可從BIOS錯(cuò)誤報(bào)告中查出);③網(wǎng)絡(luò)端口數(shù)據(jù)流量過(guò)大(工作壓力過(guò)大);④軟件故障(更新或重裝操作系統(tǒng)解決)。
4.3檢查是否死機(jī),進(jìn)行前置機(jī)硬件和軟件檢查
4.4當(dāng)原硬盤壞了,檢查更換新硬盤時(shí)是否出現(xiàn)無(wú)法通過(guò)機(jī)器自檢現(xiàn)象
4.5將新的硬盤取下,檢查機(jī)器是否可以自檢通過(guò)
4.6檢查新增加的硬盤的ID號(hào)是否與原來(lái)的硬盤的ID號(hào)相同,如果硬盤的ID號(hào)相同的話,自檢將無(wú)法通過(guò)
5.終端本體或本體器件故障排查方法
無(wú)論是GPRS公網(wǎng)終端或廠站電能量采集終端,到現(xiàn)場(chǎng)首先第一步還是要檢查終端是否已死機(jī),分析其故障原因.
5.1 看是否能夠重啟終端
5.2檢查GPRS模塊是否故障
5.3 檢查SIM卡或網(wǎng)線接口、網(wǎng)卡等其他模塊故障
6.基于計(jì)量自動(dòng)化上行通信日常維護(hù)方案
人長(zhǎng)時(shí)間工作,會(huì)出現(xiàn)勞損的現(xiàn)象,機(jī)器也不例外,所以需制定日常維護(hù)工作方案,做好日常維護(hù)工作,減少故障發(fā)生次數(shù)。
6.1做好前置機(jī)日常維護(hù)工作
前置設(shè)備是位于應(yīng)用系統(tǒng)服務(wù)器端(計(jì)量自動(dòng)化系統(tǒng)主站)與客戶端之間的獨(dú)立處理設(shè)備,肩負(fù)數(shù)據(jù)格式轉(zhuǎn)換、連接管理、業(yè)務(wù)流管理外圍調(diào)度、外圍處理,報(bào)文認(rèn)證、個(gè)人密碼PIN變換、并把業(yè)務(wù)數(shù)據(jù)交后臺(tái)應(yīng)用服務(wù)系統(tǒng)處理等任務(wù)。因此,它是日常維護(hù)的一個(gè)核心部分。計(jì)量自動(dòng)化班必須每天專人進(jìn)行跟蹤檢查并做好日志記錄。
6.2做好通道的監(jiān)測(cè)維護(hù)工作
上行通道是終端數(shù)據(jù)的必經(jīng)之路,做好這方面的日常監(jiān)視維護(hù)工作至關(guān)重要。當(dāng)終端與主站無(wú)法正常連接可以首先考慮是否為通道的問(wèn)題。如公網(wǎng)終端通道就與無(wú)線運(yùn)營(yíng)商聯(lián)系處理,廠站終端通道則采取通過(guò)遠(yuǎn)程服務(wù)器ping交換機(jī)網(wǎng)關(guān)IP, ping終端IP,然后telnet終端的方式。如果還是不通就到現(xiàn)場(chǎng)排查故障,如果是通道故障則需通知調(diào)通中心運(yùn)維部門處理。
6.3 做好終端在線率監(jiān)測(cè)
每日做好終端在線監(jiān)測(cè)至關(guān)重要,將掉線的終端逐一篩選出來(lái)分析一遍,然后再進(jìn)行主站故障排查、通道故障排查、終端本體故障及其他原因逐一排查。
6.3.1如果在線率與上日比較下降2%左右,查看停電終端是否有明顯增加,與各區(qū)縣局責(zé)任人聯(lián)系,核實(shí)是否存在線路停電或線路改造。
6.3.2由于通訊廠商業(yè)務(wù)升級(jí)導(dǎo)致在線下降。在計(jì)量自動(dòng)化系統(tǒng)查看終端掉線清單,查看終端IP段屬于哪個(gè)通信運(yùn)營(yíng)商 (以湛江地區(qū)為例:192.168開頭是移動(dòng)卡,192.169是電信卡,192.170是聯(lián)通卡)。掉線終端突然增多,聯(lián)系通訊廠商技術(shù)員查找原因。經(jīng)過(guò)多年的經(jīng)驗(yàn)統(tǒng)計(jì),移動(dòng)主要是業(yè)務(wù)切換故障;聯(lián)通經(jīng)常為數(shù)據(jù)轉(zhuǎn)換器故障;電信常出現(xiàn)路由器故障。
6.3.3由于主站程序異常導(dǎo)致在線率不穩(wěn)定,突高突低,需檢查前置機(jī)運(yùn)行程序。
6.3.4新安裝某終端廠家參數(shù)出廠問(wèn)題導(dǎo)致在線率下降,應(yīng)去現(xiàn)場(chǎng)檢查故障終端,查看終端設(shè)置等情況。
6.3.5由于部分區(qū)域信號(hào)導(dǎo)致在線率下降或終端反復(fù)登陸主站。出現(xiàn)此類問(wèn),應(yīng)與通信運(yùn)營(yíng)商聯(lián)系。
7.故障排查應(yīng)用實(shí)例介紹
7.1 因公網(wǎng)終端上行通道故障導(dǎo)致批量掉線故障處理實(shí)例
2012年6月30日9點(diǎn)45分湛江計(jì)量自動(dòng)化系統(tǒng)出現(xiàn)大批量終端掉線現(xiàn)象,其中配變終端掉線約3000臺(tái),負(fù)控終端掉線約5000臺(tái),共計(jì)約8000臺(tái)。由本人擔(dān)任工作負(fù)責(zé)人進(jìn)行計(jì)量自動(dòng)化緊急消缺處理。①首先排查前置機(jī)的運(yùn)行狀態(tài):登陸管理員賬戶,核對(duì)系統(tǒng)應(yīng)用服務(wù)的運(yùn)行情況,查驗(yàn)是否有未知服務(wù)器開啟;查看所有管理員賬戶數(shù)量和賬戶ID,核對(duì)賬戶是否被修改或新添加的管理員賬戶,如有被修改或添加賬戶應(yīng)及時(shí)向賬戶持有人核對(duì);檢查設(shè)備是否有新的服務(wù)端口開啟,如有新的端口開啟應(yīng)立即關(guān)閉,然后再核實(shí)新開端口的安全性;檢查有沒(méi)有病毒;檢查CPU性能好壞情況;檢查內(nèi)存是否滿足,確認(rèn)數(shù)據(jù)的存取空間是否滿足等。做完這些工作后,確認(rèn)前置機(jī)是正常工作的,服務(wù)器的網(wǎng)絡(luò)都是正常的,那就可以很肯定地排除了是前置設(shè)備異常導(dǎo)致的故障。②考慮到移動(dòng)專線通道的問(wèn)題,本人導(dǎo)出了所有掉線終端的IP地址發(fā)送給移動(dòng)公司,并聯(lián)系移動(dòng)公司工程師赴機(jī)房進(jìn)行故障處理。6月30日11點(diǎn)15分,配合移動(dòng)協(xié)維工程師檢查路由器,故障原因確診為RT互聯(lián)結(jié)構(gòu)2層改3層優(yōu)化實(shí)施時(shí),廣州CR01/CR02與廣州RT01/RT02無(wú)法交互路由導(dǎo)致GZRT01/RT02下掛業(yè)務(wù)全阻和設(shè)備脫管,影響湛江局GPRS企業(yè)接入業(yè)務(wù)。協(xié)維工程師在兩臺(tái)CR上與RT所有互聯(lián)接口開啟OSPF點(diǎn)對(duì)點(diǎn)屬性,完成該節(jié)點(diǎn)工程優(yōu)化改造并檢查確認(rèn)業(yè)務(wù)正常。6月30日11點(diǎn)50分終端與主站上行通信恢復(fù)正常。
7.2應(yīng)用效果
在6月30日當(dāng)晚能及時(shí)排除和處理大批量掉線異?,F(xiàn)象,保證系統(tǒng)上線率正常,使7月1號(hào)抄表日數(shù)據(jù)采集、營(yíng)銷收費(fèi)不受故障影響。
8.結(jié)束語(yǔ)
本文通過(guò)多年來(lái)的工作經(jīng)驗(yàn),摸索分析了計(jì)量自動(dòng)化各類型終端上行通信故障原因和總結(jié)出故障排查的各種方法,詳細(xì)描述了上行通信知識(shí)的原理,解決計(jì)量運(yùn)維人員對(duì)通信專業(yè)不了解、無(wú)法排查終端與主站建立連接的故障現(xiàn)象,制定了日常維護(hù)工作方案以及達(dá)到持續(xù)提升終端上線率的實(shí)效。
參考文獻(xiàn):
[1]肖勇,周尚禮,申妍華,伍少成.大規(guī)模大客戶負(fù)荷管理系統(tǒng)數(shù)據(jù)采集方案的研究.電測(cè)與儀表,2010,8
[2]肖勇,周尚禮.基于VxWorks實(shí)時(shí)嵌入式操作系統(tǒng)平臺(tái)的計(jì)量自動(dòng)化遠(yuǎn)方監(jiān)控終端的設(shè)計(jì).電測(cè)與儀表,2008,07
[3]關(guān)飛,吳小美,劉朝輝.基于GPRS通訊的配變監(jiān)測(cè)管理系統(tǒng).電測(cè)與儀表,2010,8
[4]肖勇,周尚禮,張新建,化振謙.電能計(jì)量自動(dòng)化技術(shù).中國(guó)電力出版社,2011,11
[5]鐘仕超.惠州計(jì)量自動(dòng)化系統(tǒng)的設(shè)計(jì)和應(yīng)用[J].中國(guó)高新技術(shù)企業(yè),2009,7