徐建云,李 飛,張 琳,王鴻璽,馬紅明
(國網(wǎng)河北省電力公司電力科學(xué)研究院,石家莊 050021)
Xu Jianyun,Li Fei,Zhang Lin,Wang Hongxi,Ma Hongming
(State Grid Hebei Electric Power Research Institute, Shijiazhuang 050021,China)
?
基于Linux系統(tǒng)的集中器故障分析及處理
徐建云,李 飛,張 琳,王鴻璽,馬紅明
(國網(wǎng)河北省電力公司電力科學(xué)研究院,石家莊 050021)
針對現(xiàn)場運(yùn)行低壓電力集中器死機(jī),無法正常啟動的問題,通過對故障集中器進(jìn)行檢查,確定集中器Linux系統(tǒng)數(shù)據(jù)區(qū)溢出,程序運(yùn)行空間不足導(dǎo)致死機(jī),提出程序優(yōu)化方案及處理措施,并試驗(yàn)驗(yàn)證了其可行性。
用電信息采集系統(tǒng);集中器;Linux;故障
Xu Jianyun,Li Fei,Zhang Lin,Wang Hongxi,Ma Hongming
(State Grid Hebei Electric Power Research Institute, Shijiazhuang 050021,China)
用電信息采集系統(tǒng)集電能表數(shù)據(jù)采集、數(shù)據(jù)傳輸、數(shù)據(jù)存儲、數(shù)據(jù)處理及供電控制等功能于一體,可以使供電部門及時掌握用戶用電情況,監(jiān)測有無竊電行為;根據(jù)需要進(jìn)行供電控制;通過遠(yuǎn)程抄表,節(jié)省抄表的人力物力。低壓電力集中器作為低壓電力用戶電能數(shù)據(jù)采集、存儲、管理、上傳的重要設(shè)備,對用電信息采集起著至關(guān)重要的作用[1]。
隨著智能電表的推廣應(yīng)用和用電信息采集系統(tǒng)的完善,低壓電力集中器在河北南網(wǎng)廣泛應(yīng)用。近期河北南網(wǎng)應(yīng)用用電信息采集系統(tǒng)主站時發(fā)現(xiàn),某廠家生產(chǎn)的11臺集中器陸續(xù)無法通信,召測無應(yīng)答,主站狀態(tài)變?yōu)椴辉诰€,檢查發(fā)現(xiàn)11臺集中器運(yùn)行時發(fā)生死機(jī)現(xiàn)象,集中器無法下行與電能表通信,按鍵可以喚醒顯示屏,集中器斷電后重新上電也無法正常啟動,現(xiàn)場連接RS485也無法正常抄讀信息。且隨著運(yùn)行時間的延長,同類故障的集中器數(shù)量大幅增長,嚴(yán)重影響用電信息采集和臺區(qū)線損統(tǒng)計。
對故障集中器進(jìn)行檢查,發(fā)現(xiàn)現(xiàn)場環(huán)境正常,電壓電流符合技術(shù)規(guī)范要求,無硬件損壞。進(jìn)一步對集中器軟件運(yùn)行檢測,通過測試工具軟件檢查集中器Linux系統(tǒng)內(nèi)部存儲區(qū),為了模擬現(xiàn)場環(huán)境,保證使集中器滿足實(shí)際運(yùn)行情況,在實(shí)驗(yàn)室搭建試驗(yàn)裝置,檢測集中器存儲區(qū)運(yùn)行狀況,確立了以下檢測試驗(yàn)方案:
a. 搭建1個采集環(huán)境,1臺集中器下掛10臺電能表通過RS485接口進(jìn)行抄表,通過RS485接口可保證通訊的速率和可靠性。
b. 修改集中器程序,改為每30 s對交采數(shù)據(jù)及下掛電能表數(shù)據(jù)進(jìn)行抄讀,集中器30 s內(nèi)抄完所有數(shù)據(jù),模擬出現(xiàn)場真實(shí)情況,縮短正常存儲數(shù)據(jù)時間,使集中器存儲快速達(dá)到飽和狀態(tài)。
c. 延長運(yùn)行時間,并使用Liunx系統(tǒng)存儲查詢軟件,查看集中器存儲區(qū)使用情況。
在實(shí)驗(yàn)室對現(xiàn)場故障集中器相同批次的新集中器進(jìn)行試驗(yàn),試驗(yàn)測試情況如下所示:
運(yùn)行1 h存儲情況見表1。
表1 試驗(yàn)1 h集中器Linux系統(tǒng)存儲情況
文件系統(tǒng)存儲空間已使用空間剩余空間已使用空間占比系統(tǒng)存儲區(qū)19.4M6.4M13.0M33%程序存儲區(qū)20.0M5.4M14.6M27%數(shù)據(jù)存儲區(qū)92.0M24.5M67.5M27%
運(yùn)行3 h存儲情況見表2。
表2 試驗(yàn)3 h集中器Linux系統(tǒng)存儲情況
文件系統(tǒng)存儲空間已使用空間剩余空間已使用空間占比系統(tǒng)存儲區(qū)19.4M6.4M12.9M33%程序存儲區(qū)20.0M5.4M14.6M27%數(shù)據(jù)存儲區(qū)92.0M91.1M932.0K99%
運(yùn)行4.5 h存儲情況見表3。
表3 試驗(yàn)4.5 h集中器Linux系統(tǒng)存儲情況
文件系統(tǒng)存儲空間已使用空間剩余空間已使用空間占比系統(tǒng)存儲區(qū)19.4M6.4M12.9M33%程序存儲區(qū)20.0M5.4M14.6M27%數(shù)據(jù)存儲區(qū)92.0M92.0M36.0K100%
運(yùn)行4.5 h后集中器出現(xiàn)死機(jī)現(xiàn)象,現(xiàn)象同現(xiàn)場故障集中器情況相同。用測試工具軟件查看數(shù)據(jù)存儲區(qū)使用率為100%。由該試驗(yàn)可見,隨著時間的延長和存儲數(shù)據(jù)量增加,系統(tǒng)數(shù)據(jù)存儲區(qū)占用比逐漸增高,當(dāng)已使用空間占比達(dá)到100%寫滿后,終端無法完成數(shù)據(jù)存儲,造成終端死機(jī)。
針對現(xiàn)場集中器運(yùn)行情況,分析故障原因?yàn)椋夯贚inux系統(tǒng)的集中器數(shù)據(jù)存儲區(qū),隨著運(yùn)行時間和存儲數(shù)據(jù)的增加,可用有效存儲空間越來越小,不能進(jìn)行存儲數(shù)據(jù)的自動刪除,最終導(dǎo)致存儲區(qū)數(shù)據(jù)溢出,沒有有效的數(shù)據(jù)存儲空間可供程序運(yùn)行,導(dǎo)致現(xiàn)場集中器程序無法正常運(yùn)行,進(jìn)而導(dǎo)致發(fā)生死機(jī),失去上行下行通信功能,重新上電也無法正常啟動。
針對集中器故障原因,對軟件程序進(jìn)行修改,優(yōu)化數(shù)據(jù)存儲策略,增加數(shù)據(jù)存儲空間回收機(jī)制,當(dāng)數(shù)據(jù)存儲區(qū)剩余空間小于20%時,及時清除最早的數(shù)據(jù)文件,保證剩余數(shù)據(jù)空間充裕,避免由于沒有數(shù)據(jù)存儲空間而導(dǎo)致寫數(shù)據(jù)失敗以致死機(jī);使用升級程序?qū)ΜF(xiàn)場取回的故障終端和故障分析試驗(yàn)時發(fā)生死機(jī)的終端分別進(jìn)行升級;重復(fù)上述故障發(fā)生時使用的試驗(yàn)方案進(jìn)行試驗(yàn),運(yùn)行時間增加到24 h。試驗(yàn)測試情況如下:
運(yùn)行1 h存儲情況見表4。
表4 試驗(yàn)1 h集中器Linux系統(tǒng)存儲情況
文件系統(tǒng)存儲空間已使用空間剩余空間已使用空間占比系統(tǒng)存儲區(qū)19.4M11.4M7.9M59%程序存儲區(qū)20.0M8.9M11.1M45%數(shù)據(jù)存儲區(qū)92.0M30.0M62.0M33%
運(yùn)行4 h存儲情況見表5。
表5 試驗(yàn)4 h集中器Linux系統(tǒng)存儲情況
文件系統(tǒng)存儲空間已使用空間剩余空間已使用空間占比系統(tǒng)存儲區(qū)19.4M11.8M7.6M61%程序存儲區(qū)20.0M8.9M11.1M44%數(shù)據(jù)存儲區(qū)92.0M74.7M17.3M81%
運(yùn)行24 h存儲情況見表6。
表6 試驗(yàn)24 h集中器Linux系統(tǒng)存儲情況
文件系統(tǒng)存儲空間已使用空間剩余空間已使用空間占比系統(tǒng)存儲區(qū)19.4M11.8M7.5M61%程序存儲區(qū)20.0M8.9M11.1M44%數(shù)據(jù)存儲區(qū)92.0M74.8M17.2M81%
可以看出,運(yùn)行4 h數(shù)據(jù)區(qū)存儲占比達(dá)到81%,運(yùn)行24 h后數(shù)據(jù)區(qū)存儲占比仍然為81%,說明通過程序的優(yōu)化升級,當(dāng)可用空間小于20%時,清除了部分?jǐn)?shù)據(jù)文件,騰出存儲空間,試驗(yàn)用集中器程序運(yùn)行正常,未發(fā)生死機(jī)現(xiàn)象。
針對出現(xiàn)故障的同一廠家集中器提出對集中器程序進(jìn)行升級,增加集中器數(shù)據(jù)區(qū)存儲空間回收機(jī)制,當(dāng)數(shù)據(jù)存儲區(qū)剩余空間小于20%時,及時清除最早的數(shù)據(jù)文件,保證剩余數(shù)據(jù)空間充裕,消除故障隱患?,F(xiàn)場運(yùn)行集中器通過數(shù)據(jù)區(qū)空間回收機(jī)制升級,長時間運(yùn)行不再發(fā)生故障,現(xiàn)場集中器運(yùn)行狀況說明了故障原因和處理措施的有效性。
隨著用電信息采集技術(shù)的深入發(fā)展,集中器應(yīng)用程序的科學(xué)設(shè)計和持續(xù)改進(jìn)具有重要意義。根據(jù)實(shí)際現(xiàn)場運(yùn)行中出現(xiàn)的集中器故障,分析了故障原因?yàn)榛贚inux系統(tǒng)的數(shù)據(jù)區(qū)溢出,沒有回收機(jī)制,導(dǎo)致存儲空間不足,提出了程序優(yōu)化方案,并用試驗(yàn)驗(yàn)證了故障原因和優(yōu)化方案的可行性。通過集中器運(yùn)行中發(fā)現(xiàn)的問題,用電信息采集技術(shù)的可靠性將進(jìn)一步提高。
[1] 李 飛.低壓電力集中器故障原因分析及處理[J].河北電力技術(shù),2014,33(4):49-50.
本文責(zé)任編輯:羅曉曉
Analysis and Treatment of Concentrator Fault Based on Linux System
Low voltage power concentrator crashes, can not start properly, through the experimental analysis of the failure causes, concentrator Linux system data overflow, lack of space to run the program lead to crashes, puts forward the treatment measures, effective measures is proved by experiment.
concentrator; Linux; fault; electric power
2016-06-27
徐建云(1987-),男,工程師,主要從事電能計量及采集方面工作。
TM769
B
1001-9898(2016)05-0061-02