王小紅
(陜西省委黨校 陜西 西安 710061)
基于RS并行約簡算法的配電網(wǎng)故障診斷方法
王小紅
(陜西省委黨校 陜西 西安710061)
隨著電力系統(tǒng)對系統(tǒng)故障診斷智能化的要求越來越高,為了解決傳統(tǒng)專家系統(tǒng)對不完整知識處理的局限性以及減少誤判、漏判的情況,本文提出一種基于RS并行約簡算法,將約簡算法中計(jì)算相對正域的過程和計(jì)算核值的過程實(shí)現(xiàn)了并行化處理。實(shí)驗(yàn)結(jié)果顯示,本方法提高了粗糙集中決策表屬性約簡的準(zhǔn)確性,同時(shí)降低了屬性約簡的時(shí)間。本方法對配電網(wǎng)故障診斷的決策規(guī)則的自動(dòng)化生成、實(shí)時(shí)故障信息進(jìn)行分類判斷和識別具有重要意義。
配電網(wǎng);故障診斷;并行計(jì)算;粗糙集
配電網(wǎng)故障診斷主要是對各級各類保護(hù)裝置產(chǎn)生的報(bào)警信息,斷路器的狀態(tài)變化信息以及電壓、電流等電氣量測量的特征進(jìn)行分析,根據(jù)保護(hù)動(dòng)作的邏輯和運(yùn)行人員的經(jīng)驗(yàn)來推斷可能的故障位置和故障類型。為了應(yīng)對電力系統(tǒng)快速增長的各種海量信息,研究人員引入了許多方法和技術(shù),并且取得了一定的成功,例如,基于貝葉斯網(wǎng)絡(luò)[7]、遺傳算法[8]、進(jìn)化技術(shù)、Petri網(wǎng)絡(luò)等的智能故障定位診斷。
以上這些方法雖然都取得了較為滿意的結(jié)果,但都存在診斷所依據(jù)的實(shí)時(shí)信息不完備或信息受畸變時(shí)產(chǎn)生錯(cuò)誤的診斷 結(jié)論的情況。而粗糙集理論作為一種處理不精確、不一致、不完整等各種不完備的信息有效的工具,其較強(qiáng)的容錯(cuò)能力使得它在電力系統(tǒng)中的應(yīng)用發(fā)展[1,2]很快。基于粗糙集的應(yīng)用研究[3-6]主要集中在屬性約簡、規(guī)則獲取、基于粗糙集的計(jì)算智能算法研究等方面。由于屬性約簡是一個(gè)NP難問題,許多學(xué)者都進(jìn)行了系統(tǒng)的研究。王國胤等人[6]從信息論的觀點(diǎn)出發(fā)對粗糙集理論的基本概念和運(yùn)算進(jìn)行分析,并基于此給出了基于條件信息熵對決策表進(jìn)行屬性約簡的兩個(gè)算法——CEBARKNC和CEBARKCC,前者以所有條件屬性集為起點(diǎn),自頂向下逐步去掉不必要的屬性,后者則是以決策表核屬性集為起點(diǎn),自底向上逐步增加屬性。由于約簡算法普遍低效,特別是對于大規(guī)模數(shù)據(jù)集,因而開始有學(xué)者試圖運(yùn)用粒計(jì)算的劃分模型[9]來進(jìn)行屬性約簡算法的研究。
然而,傳統(tǒng)的粗糙集約簡方法都是基于單機(jī)進(jìn)行的??紤]到屬性約簡具有很高得計(jì)算復(fù)雜度,傳統(tǒng)的基于單機(jī)的屬性約簡方法已經(jīng)不能滿足大規(guī)模數(shù)據(jù)的屬性約簡的需要[10]。幸運(yùn)的是,當(dāng)前基于MapReduce的并行計(jì)算平臺為大規(guī)模數(shù)據(jù)的智能化處理提供了一種可行的解決方案。Hadoop作為MapReduce的一個(gè)實(shí)現(xiàn)框架,基于分布式文件系統(tǒng)(HDFS),通過利用map和reduce函數(shù)可以將現(xiàn)有的集中式處理任務(wù)并行化地部署在多臺計(jì)算機(jī)節(jié)點(diǎn)上進(jìn)行處理,可以大大提高計(jì)算效率。文中將基于Hadoop平臺,提出了一種并行屬性約簡算法和并行值約簡算法方法。通過一個(gè)具體算例,根據(jù)收集的故障信息所建立的決策表進(jìn)行約簡,得到診斷決策規(guī)則,并將其作為實(shí)時(shí)故障診斷的依據(jù),從而實(shí)現(xiàn)配電網(wǎng)的故障診斷和定位。
由于粗糙集理論可以很好地處理因保護(hù)裝置和斷路器誤動(dòng)作、信號傳輸誤碼而造成的錯(cuò)誤或不完整的故障信號,形成魯棒性較強(qiáng)的電網(wǎng)故障診斷專家知識庫,所以將粗糙集應(yīng)用于配電網(wǎng)故障診斷。通過決策表約簡提取出決策規(guī)則,依據(jù)決策規(guī)則能夠快速地根據(jù)故障區(qū)域判斷產(chǎn)生故障的元件,調(diào)度員及時(shí)做出決策消除故障,便于檢修和事故后的快速恢復(fù),確保電力系統(tǒng)安全穩(wěn)定運(yùn)行。本文設(shè)計(jì)的并行約簡的故障診斷(Parallel Reduction for Fault Diagnosis,簡稱為PRFD)。該診斷過程可分為 3個(gè)模塊,故障信息決策表(Fault Decision Table,簡稱FDT)的建立模塊,F(xiàn)DT約簡模塊,抽取診斷規(guī)則(Diagnosis Rules,簡稱DR)模塊以及故障診斷模塊[11]。
故障信息決策表(FDT)建立模塊主要用于建立初始故障信息表。從故障信息庫中提取故障記錄,判斷每條故障信息記錄中是否含有狀態(tài)缺失信息,若不含缺失信息,則將其加入故障信息庫,否則加入不完備知識庫。從故障信息庫讀取故障記錄時(shí),只將各個(gè)元件狀態(tài)和故障發(fā)生位置屬性加入初始故障信息表,其他的相關(guān)信息在該系統(tǒng)中不考慮。
診斷規(guī)則(DR)提取模塊的主要功能是完成對初始故障信息表的約簡以及故障規(guī)則的提取,其中約簡部分又包括屬性約簡和值約簡,利用屬性約簡可以去掉故障信息表中冗余的屬性,而值約簡則用于刪除每條故障記錄中的冗余屬性值。診斷規(guī)則是從最終故障決策表中提取出來的,用于診斷實(shí)時(shí)故障。約簡后的最終故障決策表中每行記錄即為一條診斷規(guī)則,且每條診斷規(guī)則都不含冗余信息。
圖1 基于PRFD方法的診斷過程Fig.1 Diagnosis procedure based on PRFD
故障診斷模塊完成對實(shí)時(shí)故障進(jìn)行故障定位和診斷。診斷規(guī)則庫建立后,從實(shí)際配電網(wǎng)使用過程中出現(xiàn)的故障可以根據(jù)診斷規(guī)則判斷哪些元件導(dǎo)致故障的發(fā)生。如若根據(jù)規(guī)則庫中的診斷規(guī)則無法進(jìn)行判斷,此時(shí)將記錄下該故障發(fā)生時(shí)各個(gè)元件的狀態(tài)信息,并將該故障記錄轉(zhuǎn)入FDT建立模塊進(jìn)行處理。該條記錄中若無缺失信息,則將其加入歷史故障數(shù)據(jù)庫,否則加入缺失信息庫。對于缺失信息庫中的記錄,如果可以根據(jù)診斷規(guī)則進(jìn)行判斷,則將其刪除。
文中屬性約簡基于文獻(xiàn)[4]的思想,將并行計(jì)算融入粗糙集[12-13]的決策表約簡,具體并行屬性約簡的算法流程如圖2和圖3所示,其中假設(shè)參與計(jì)算的處理器的個(gè)數(shù)為K,并令第一個(gè)處理器P1為主處理器,故障屬性約簡集合記為R,待處理的屬性集記為Attr_left=CR。該約簡主要分為屬性擴(kuò)張和屬性收縮兩個(gè)部分。
在屬性擴(kuò)張階段,首先在主進(jìn)程中計(jì)算屬性核CORED (C),令R的初始值為屬性核。然后將剩余的屬性Attr_left分為K組(S1,S2,…,SK)分配給K個(gè)進(jìn)程同時(shí)處理,其中每組中的屬性個(gè)數(shù)相差不大于1,接下來在每個(gè)處理進(jìn)程中,根據(jù)相對正域中元素的個(gè)數(shù)選擇出每個(gè)分組Si中必要的屬性Cselect_i,并將Cselect_i和POS{R∪Cselect_i}(D)發(fā)送給主進(jìn)程,主進(jìn)程再根據(jù)相對正域中元素的個(gè)數(shù)在各分進(jìn)程提交的屬性中選擇出必要屬性Cselect,并更新R=R∪Cselect同時(shí)更新Attr_left,重復(fù)上述操作直至POSR(D)=POSC(D),然后進(jìn)入屬性收縮階段。屬性擴(kuò)張如圖2所示。
圖2 屬性擴(kuò)張流程Fig.2 Procedure of attribute expansion
在屬性收縮階段中,主要對加入到R中的非核屬性進(jìn)行處理,判斷它們相對于故障位置屬性是否是多余的。首先將R/CORED(C)中的各個(gè)屬性分別分配到K個(gè)進(jìn)程中進(jìn)行處理,分配完成后若還存在剩余的屬性,則等待下一批處理。在各個(gè)進(jìn)程中判斷其分配到的屬性是否相對于故障位置屬性是多余的,若是,則將其發(fā)送給主進(jìn)程,否則記為-1后發(fā)送給主進(jìn)程;主進(jìn)程將收到的多余屬性進(jìn)行篩選,選出第一個(gè)多余屬性Cdelete,若Cdelete≠箒1,則更新R=R/Cdelete,再次判斷剩余的非核屬性中是否存在多余屬性;若Cdelete=箒1且所有非核屬性均已判斷,則R即為約簡后的屬性集;若Cdelete=箒1但尚存在未判斷的屬性,則將這些屬性分配到K個(gè)進(jìn)程中按上述步驟進(jìn)行處理。屬性收縮如圖3所示。
圖3 屬性收縮流程Fig.3 Procedure of attribute contraction
經(jīng)過以上并行屬性約簡和并行值約簡后得到的最終故障決策表中,所有屬性值均為該表的值核,所有記錄均為該故障信息表對應(yīng)的診斷規(guī)則。本階段只需將每條記錄存儲于診斷規(guī)則庫中,作為對實(shí)時(shí)故障的診斷和定位的依據(jù)。此外,也要對診斷規(guī)則庫進(jìn)行定期的更新,保證該系統(tǒng)的正確診斷率。
為驗(yàn)證本文設(shè)計(jì)的PRFD系統(tǒng)的可用性和有效性,在該系統(tǒng)上運(yùn)行UCI數(shù)據(jù)集進(jìn)行測試,并與基于粗糙集傳統(tǒng)約簡算法的專家系統(tǒng)(RSES)進(jìn)行比較。本文測試所用的標(biāo)準(zhǔn)測試數(shù)據(jù)集UCI是來自于加州大學(xué)歐文分校機(jī)器學(xué)習(xí)數(shù)據(jù)收集庫(http://archive.ics.uci.edu/ml/),本文選擇了其中的6個(gè)數(shù)據(jù)集作為實(shí)驗(yàn)數(shù)據(jù),且測試的數(shù)據(jù)集的大小變化不等,以此測試系統(tǒng)在大數(shù)據(jù)集下的運(yùn)行效率。某些數(shù)據(jù)集中可能含有缺失值,以此來測試該系統(tǒng)對不完整記錄的處理情況,這些數(shù)據(jù)集的具體特征如表1所示。
表1 數(shù)據(jù)集及其特征Tab.1 Data sets and their characteristics
文中設(shè)計(jì)的系統(tǒng)PRFD與傳統(tǒng)RSES系統(tǒng)的比較結(jié)果如下圖4和圖5所示。由圖4可知,當(dāng)數(shù)據(jù)集的記錄個(gè)數(shù)小于1024時(shí),得到最小約簡時(shí)兩個(gè)系統(tǒng)的運(yùn)行時(shí)間相當(dāng),這是因?yàn)楸疚脑O(shè)計(jì)的PRFD系統(tǒng)中所使用的約簡算法的通信時(shí)間只與條件屬性個(gè)數(shù)有關(guān),當(dāng)數(shù)據(jù)量較小時(shí),其通信時(shí)間在整個(gè)約簡時(shí)間中所占的比例較大,然后當(dāng)數(shù)據(jù)集中記錄個(gè)數(shù)足夠大時(shí),該系統(tǒng)的優(yōu)勢越來越明顯,運(yùn)行時(shí)間相比傳統(tǒng)的方法大大縮減,說明PRFD系統(tǒng)對大數(shù)據(jù)集仍具有一定的高效性。由圖5可以看出,當(dāng)數(shù)據(jù)集不大時(shí),兩個(gè)系統(tǒng)的準(zhǔn)確率相當(dāng);且隨著記錄數(shù)目越來越大,系統(tǒng)的準(zhǔn)確率都會有所下降,但相比RSES,PRFD系統(tǒng)的準(zhǔn)確率較高,并且準(zhǔn)確率下降的速度較緩,主要原因是在獲取決策規(guī)則的過程中,PRFD系統(tǒng)是根據(jù)當(dāng)前的約簡結(jié)果來計(jì)算屬性重要性,屬于一種動(dòng)態(tài)的貪心策略,能夠得到最優(yōu)或次優(yōu)的約簡結(jié)果,從而得到較為準(zhǔn)確的診斷規(guī)則。
圖4 PRFD系統(tǒng)和RSES系統(tǒng)運(yùn)行時(shí)間對比曲線Fig.4 Comparison of system uptime between PRFD and RSES
圖5 PRFD和RSES系統(tǒng)準(zhǔn)確率對比曲線Fig.5 Comparison of system accuracy between PRFD and RSES
文中提出一種并行粗糙集約簡算法,通過屬性擴(kuò)張和收縮,實(shí)現(xiàn)并行化處理。相關(guān)實(shí)驗(yàn)仿真顯示,較傳統(tǒng)方法比較而言本文方法降低了數(shù)據(jù)約簡的執(zhí)行時(shí)間,而且也提高了約簡的準(zhǔn)確率。文中方法復(fù)雜配電網(wǎng)絡(luò)的故障診斷提供了一種可行的解決方案。
[1]束洪春,孫向飛,于繼來.電力系統(tǒng)自動(dòng)化粗糙集理論在電力系統(tǒng)中的應(yīng)用[J].電力系統(tǒng)自動(dòng)化,2004,28(3):90-95.
[2]孫秋野,張化光,戴瓂.基于改進(jìn)粗糙集約簡算法的配電系統(tǒng)在線故障診斷[J].中國電機(jī)工程學(xué)報(bào),2007,27(7):58-64.
[3]束洪春,孫向飛,司大軍.基于粗糙集理論的配電網(wǎng)故障診斷研究[J].中國電機(jī)工程學(xué)報(bào),2001,2l(10):73-78.
[4]肖大偉,王國胤,胡峰.一種基于粗糙集理論的快速并行屬性約簡算法[J].計(jì)算機(jī)科學(xué),2009,36(3):208-211.
[5]CHEN De-gang,ZHAO Su-yun,ZHANG Lei,et al.Sample pair selection for attribute reduction with rough set[J].IEEE Transactions on Knowledge and Data Engineering,2012,24 (11):2080-2093.
[6]王國胤,于洪,楊大春.基于條件信息熵的決策表約簡[J].計(jì)算機(jī)學(xué)報(bào),2002,25(7):759-766.
[7]ZHU Yong-li,LU Jin-ling.Bayesian networks-based approach for power systems fault diagnosis[J].IEEE Transactions on Power Delivery,2006,21(2):634-639.
[8]LIN Xiang-ning,KE Shuo-hao.A fault diagnosis method of power systems based on improved objective function and genetic algorithm-tabu search[J].IEEE Transactions on Power Delivery,2010,25(3):1268-1274.
[9]劉清,劉群.粒及粒計(jì)算在邏輯推理中的應(yīng)用[J].計(jì)算機(jī)研究與發(fā)展,2004,41(4):546-551.
[10]童曉陽,謝紅濤,孫明蔚.計(jì)及時(shí)序信息檢查的分層模糊Petri網(wǎng)電網(wǎng)故障診斷模型[J].電力系統(tǒng)自動(dòng)化,2013,37 (6):63-68.
An RS parallel reduction based approach for distribution network fault diagnosis
WANG Xiao-hong
(Shaanxi Provincial Party School of the CPC,Xi’an 710061,China)
With the increasing demand of intelligent fault diagnosis of distribution network,an RS parallel reduction based approach is proposed in this paper in order to address the limitations of incomplete information processing in traditional expert systems.This approach computes relevant positive areas and core values of rough set in parallel.The experiment results show that our approach improves the accuracy of attributes reduction and reduces the performing time of executing reduction.Our approach has the significance to automatic generation of decision rules and classification and recognition of fault information.
distribution network;fault diagnosis;parallel reduction;rough set
TN302
A
1674-6236(2016)01-0181-03
2015-10-29稿件編號:201510219
國家自然科學(xué)基金項(xiàng)目(61372184)
王小紅(1975—),女,陜西寶雞人,講師。研究方向:數(shù)據(jù)挖掘與知識工程。