董貫雷 姜曉東 孫鵬 楊光 耿俊琪 王家文 渠帥 黃勝 王晨 尚盈
摘要:提出基于分布式光纖傳感技術(shù)的人工神經(jīng)網(wǎng)絡(luò)有載變壓器故障檢測(cè)預(yù)報(bào)模型,通過人工模擬變壓器的故障狀態(tài)及正常運(yùn)行狀態(tài),并通過k-means SMOTE數(shù)據(jù)擴(kuò)充方法,可以有限擴(kuò)充少量故障數(shù)據(jù)集,使故障數(shù)據(jù)量可以和正常數(shù)據(jù)量達(dá)到一致,將擴(kuò)充后的故障數(shù)據(jù)與正常運(yùn)行的數(shù)據(jù)一起送入長(zhǎng)短期記憶卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks long short term memory, CNN-LSTM)識(shí)別模型,最終可以將故障的識(shí)別率提升到100%,這對(duì)采用分布式光纖傳感技術(shù)在有載變壓器故障識(shí)別系統(tǒng)上的發(fā)展具有重要意義。
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò);分布式聲傳感器;有載變壓器;故障檢測(cè);SMOTE算法;模式識(shí)別;數(shù)據(jù)增強(qiáng)
中圖分類號(hào):TN247?? 文獻(xiàn)標(biāo)志碼:A?? 文章編號(hào):1002-4026(2023)05-0052-08
On-load transformer fault detection based on distributed optical fiber sensing system
DONG Guanlei1,JIANG Xiaodong1,SUN Peng1,YANG Guang1,GENG Junqi1,WANG Jiawen2* ,
QU Shuai2, HUANG Sheng2, WANG Chen2, SHANG Ying2
(1. Zibo Power Supply Company,State Grid Shandong Electric Power Company,Zibo 255000, China;2.Laser Institute,Qilu University of Technology(Shandong Academy of sciences),Jinan 250014,China)
Abstract∶This paper proposes an artificial neural network-based fault detection and prediction model for on-load transformers using distributed fiber optic sensing technology. By artificially simulating the fault and normal operating states of transformers and using the k-means synthetic minority oversampling technique data expansion method, a small number of fault datasets can be limitedly expanded so that the amount of fault data can be consistent with that of normal data. Therefore, the expanded fault data and normal operation data can be input into the convolutional neural networks long short term memory identification model. Finally, the fault recognition rate can be increased to 100%, which has significant implications for the development of fault recognition systems for on-load transformers based on distributed fiber optic sensing technology.
Key words∶neural network; distributed acoustic sensor; on-load transformer; fault detection; smote; SMOTE algorithm; Pattern recognition; data enhancement
隨著我國(guó)電力工業(yè)的快速發(fā)展和持續(xù)轉(zhuǎn)型升級(jí),電力系統(tǒng)的結(jié)構(gòu)形態(tài)及運(yùn)行日趨復(fù)雜,因電力設(shè)備故障而引發(fā)的系統(tǒng)事故也越來(lái)越多,造成了嚴(yán)重的經(jīng)濟(jì)損失和負(fù)面影響[1]。因此,為有效預(yù)防并減少電力設(shè)備故障的發(fā)生,需根據(jù)實(shí)際需求開展對(duì)其運(yùn)行狀態(tài)進(jìn)行監(jiān)測(cè)的技術(shù)研究工作,這對(duì)確保電力設(shè)備及電力系統(tǒng)的安全穩(wěn)定運(yùn)行具有重大意義。
電力變壓器是電力系統(tǒng)中不可或缺的核心設(shè)備[2],具有不可替代的作用,其運(yùn)行狀況對(duì)整個(gè)供配電系統(tǒng)的可靠運(yùn)行影響極大。其中,有載分接開關(guān)(on-load tap-changer,OLTC)作為變壓器的重要部件[3],發(fā)揮著穩(wěn)定負(fù)荷中心電壓、增加電網(wǎng)靈活度、改善電能質(zhì)量等重要功能。因此,OLTC 被廣泛安裝于重要的輸、配電調(diào)壓變壓器中,有助于實(shí)現(xiàn)電網(wǎng)的安全穩(wěn)定運(yùn)行和電力的可靠供應(yīng)。OLTC 運(yùn)行可靠性隨著運(yùn)輸、裝配及投入使用之后受到大量的電氣沖擊和機(jī)械沖擊逐漸降低,輕則調(diào)壓失敗,重則造成電力變壓器的燒毀。此類故障的發(fā)生難免會(huì)造成電氣設(shè)備的損壞和人力物力的浪費(fèi),也會(huì)給電力系統(tǒng)帶來(lái)不良的經(jīng)濟(jì)和社會(huì)影響。據(jù)統(tǒng)計(jì),國(guó)內(nèi)OLTC故障約占變壓器故障的20%,且呈現(xiàn)逐年上升的趨勢(shì)。國(guó)外發(fā)達(dá)國(guó)家由于OLTC的高使用率導(dǎo)致其異常工作而引發(fā)的變壓器故障高達(dá)40%,尤其是OLTC主要故障類型為機(jī)械故障,給變壓器造成了嚴(yán)重的安全威脅[4]。目前OLTC故障檢測(cè)器主要采用加速度傳感器等一系列點(diǎn)式傳感器,但此類傳感器由于本身帶有金屬裝置,會(huì)受到電磁干擾影響以及其本身不耐腐蝕,在測(cè)試時(shí)僅測(cè)試有限個(gè)數(shù)點(diǎn)的信息,同時(shí),其安全性不佳。近年來(lái),為了彌補(bǔ)傳統(tǒng)傳感器的不足,分布式光纖聲傳感器(distributed acoustic sensing, DAS)逐漸走進(jìn)研究者的視野中,DAS系統(tǒng)是一種能夠?qū)饫w沿線范圍內(nèi)的物體進(jìn)行遠(yuǎn)程實(shí)時(shí)監(jiān)測(cè)的傳感系統(tǒng),具有抗電磁干擾、抗腐蝕、靈敏度高、實(shí)時(shí)性好等特點(diǎn)[5],目前已在各個(gè)領(lǐng)域取得廣泛的應(yīng)用,包括重要領(lǐng)域的安全監(jiān)測(cè)、管道監(jiān)測(cè)、海底電力電纜監(jiān)測(cè)等。雖然DAS系統(tǒng)的發(fā)展迅速,但事件識(shí)別能力一直是制約其在現(xiàn)場(chǎng)應(yīng)用的瓶頸,復(fù)雜的環(huán)境和額外的人為干擾會(huì)顯著降低其識(shí)別能力。而以機(jī)器學(xué)習(xí)和深度學(xué)習(xí)為基礎(chǔ)的數(shù)據(jù)驅(qū)動(dòng)模式識(shí)別如今已經(jīng)成為基于DAS系統(tǒng)識(shí)別領(lǐng)域的趨勢(shì)[6-7]。Sun等[8]提出了一種以形態(tài)特征提取和相關(guān)向量機(jī)(RVM)為基礎(chǔ)的分類方法,實(shí)現(xiàn)了對(duì)光纖沿線信號(hào)特征的識(shí)別。孫鋼[9]提出了一種基于小波能量譜和RVM的識(shí)別方法,簡(jiǎn)化了SVM分類器,并構(gòu)造了更加具有針對(duì)性的子分類器。Jia等[10]提出了一種基于近類別支持向量機(jī)(NC-SVM)的事件識(shí)別方法,利用k-最近鄰(KNN)算法將分類器擴(kuò)展為多分類問題,神經(jīng)網(wǎng)絡(luò)的分類方式根據(jù)樣本自動(dòng)提取特征,無(wú)需人工尋找信號(hào)的特征。Zhang等[11]提出了基于訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)(CNN)的圖像去噪模型,極大地消除DAS傳感系統(tǒng)中不需要的噪聲,提高了DAS在故障判別中的準(zhǔn)確性。Wu等[12]將Spiking神經(jīng)網(wǎng)絡(luò)引入分布式聲傳感器系統(tǒng),可以在不平衡數(shù)據(jù)集下提高DAS系統(tǒng)判斷的準(zhǔn)確性。
以上的方法在獲取大量數(shù)據(jù)集的情況之下,在識(shí)別率等方面都可以取得很好的效果。但是,在實(shí)際的數(shù)據(jù)采集過程中,往往會(huì)出現(xiàn)某一類別的數(shù)據(jù)集數(shù)量極少的情況。比如,在OLTC的運(yùn)行中,故障發(fā)生就必須及時(shí)斷電進(jìn)行設(shè)備維修,只能獲取少量的故障樣本數(shù)據(jù)。同時(shí),訓(xùn)練數(shù)據(jù)的減少會(huì)導(dǎo)致深度學(xué)習(xí)網(wǎng)絡(luò)的過擬合,進(jìn)而影響這類數(shù)據(jù)的分類精度。而小樣本學(xué)習(xí)(few-shot learning,F(xiàn)SL)是一種只需要少量訓(xùn)練樣本的機(jī)器學(xué)習(xí)方法[13]。人工數(shù)據(jù)增強(qiáng)[14]是FSL中能夠有效緩解過擬合問題的方法之一。Ma等[15]提出了一種基于合成少數(shù)過采樣技術(shù)(SMOTE)的方法,可以有效改善在傳統(tǒng)方法由于類別樣本數(shù)量較少而導(dǎo)致的精度不高的問題。
SMOTE是一種常用的人工樣本合成方法,其通過在少數(shù)樣本之間進(jìn)行線性插值來(lái)實(shí)現(xiàn)新樣本的生成,其將占比多的一方與離它最近的占比少的另一方配對(duì),將這個(gè)配對(duì)刪去,更有利于樣本的分類。
Wu等[16]使用了一種新的過采樣技術(shù)Radius-SMOTE,強(qiáng)調(diào)基于安全半徑距離創(chuàng)建合成數(shù)據(jù)的初始選擇方法,可以有效提高系統(tǒng)判別的準(zhǔn)確率。
本文提出一種基于瑞利散射的分布式聲傳感系統(tǒng)對(duì)OLTC故障進(jìn)行實(shí)時(shí)監(jiān)測(cè),相較于點(diǎn)式傳感器,分布式聲傳感器具有極好的抗電磁干擾能力,同時(shí)由于變壓器園區(qū)里有諸多OLTC變壓器件,選擇分布式聲傳感器可以同時(shí)檢測(cè)各個(gè)變壓器的運(yùn)行狀態(tài),進(jìn)一步實(shí)現(xiàn)智能電網(wǎng)監(jiān)測(cè)要求。由于OLTC故障發(fā)生的低概率性,導(dǎo)致難以獲得足夠多的故障數(shù)據(jù)量,為提高數(shù)據(jù)多樣性,增強(qiáng)系統(tǒng)性能,本文在算法方面進(jìn)一步提出了一種基于k-means SMOTE的數(shù)據(jù)增強(qiáng)方法,可以有效提高小樣本數(shù)據(jù)量,進(jìn)而優(yōu)化系統(tǒng)性能,并將增強(qiáng)后的數(shù)據(jù)送入CNN-LSTM的網(wǎng)絡(luò)架構(gòu)。選用CNN-LSTM的原因在于DAS系統(tǒng)采集率高達(dá)20 kHz,導(dǎo)致DAS系統(tǒng)采集到的信息數(shù)據(jù)都是長(zhǎng)序列數(shù)據(jù),而CNN-LSTM可以很好地解決長(zhǎng)序列問題。對(duì)于數(shù)據(jù)采集與增強(qiáng)的方法如下:首先,采集設(shè)備故障運(yùn)行和設(shè)備正常運(yùn)行的數(shù)據(jù)量。其中某些數(shù)據(jù)量是充足的,例如被測(cè)系統(tǒng)正常運(yùn)行時(shí),此為多數(shù)類別;而有些類型的數(shù)據(jù)量是不充足的,例如當(dāng)被測(cè)系統(tǒng)發(fā)生故障時(shí),此為少數(shù)類別。其次,將采集到的數(shù)據(jù)集通過k-mean SMOTE方法進(jìn)行數(shù)據(jù)量擴(kuò)展,使得少數(shù)類別數(shù)據(jù)量可以達(dá)到多數(shù)類數(shù)據(jù)量。最后,將所得數(shù)據(jù)集作為預(yù)訓(xùn)練輸入CNN-LSTM網(wǎng)絡(luò),用于數(shù)據(jù)訓(xùn)練。
1 原理與方法
1.1 分布式聲傳感器
本文采用的DAS系統(tǒng)的實(shí)驗(yàn)設(shè)置如圖1所示,選取線寬約3 kHz的窄線寬激光器作為光源,激光器發(fā)出的連續(xù)光經(jīng)隔離器進(jìn)入聲光調(diào)制器(AOM)調(diào)制成脈沖信號(hào),脈沖信號(hào)的重復(fù)頻率為20 kHz,脈寬為50 ns的脈沖方波信號(hào);之后,調(diào)制后的脈沖光進(jìn)入摻鉺光纖放大器1進(jìn)行脈沖放大,摻鉺放大器1內(nèi)置有濾波器,可以濾除放大器的自發(fā)輻射噪聲,放大后的脈沖信號(hào)經(jīng)環(huán)形器1進(jìn)入傳感光纖。后向瑞利散射信號(hào)經(jīng)傳感光纖返回進(jìn)入另一個(gè)摻鉺光纖放大器2進(jìn)行放大。放大后的后向瑞利散射信號(hào)經(jīng)過另一個(gè)環(huán)形器2進(jìn)入非平衡邁克爾遜干涉儀,其由3×3耦合器和兩個(gè)法拉第旋轉(zhuǎn)鏡組成,法拉第旋轉(zhuǎn)鏡用于反射經(jīng)過3×3耦合器的后向瑞利散射光,反射回的瑞利散射光信號(hào)由3個(gè)探測(cè)器(PD)進(jìn)行探測(cè),最后由數(shù)據(jù)采集卡采集并在計(jì)算機(jī)(PC)中處理[17]。數(shù)據(jù)采集卡的采樣頻率為100 MHz,掃描頻率為20 kHz,聲光調(diào)制器頻移為200 MHz,脈沖帶寬為50 ns,傳感光纖為G652單模光纖,長(zhǎng)度約為200 m,覆蓋在OLTC頂部和外壁上。
本實(shí)驗(yàn)設(shè)置故障事件為小類別事件。故障事件的樣本數(shù)量只有24個(gè),正常樣本有9 084個(gè)。在此,每個(gè)樣本采集的時(shí)間為1 s,由于發(fā)生故障事件必須及時(shí)進(jìn)行維護(hù),因此只取1 s的反應(yīng)時(shí)間以保證設(shè)備的安全運(yùn)行。PD將采集到的后向瑞利散射信號(hào)作為數(shù)據(jù)矩陣的一行,其中行是指某一時(shí)刻內(nèi)的所有位置信息,列指某一位置所有的時(shí)間信息,可理解為橫行表示空間域,縱列表示時(shí)間域。經(jīng)過解調(diào)相位信息,得到每個(gè)點(diǎn)在每個(gè)時(shí)刻的具體信息。再將保存的信息由labview讀取,作為原始數(shù)據(jù)集的輸入。
1.2 數(shù)據(jù)采集方法
對(duì)于實(shí)驗(yàn)數(shù)據(jù),為了驗(yàn)證對(duì)小樣本事件的識(shí)別,將小樣本事件設(shè)置為一個(gè)短時(shí)沖擊信號(hào)。在實(shí)驗(yàn)室模擬了OLTC設(shè)備故障信號(hào)的發(fā)生。實(shí)驗(yàn)設(shè)備有封閉水箱一個(gè),內(nèi)部安放揚(yáng)聲器,揚(yáng)聲器連接信號(hào)發(fā)生器,同時(shí)將光纜放置在密閉水箱的管壁周圍和密閉水箱的頂部,將信號(hào)發(fā)生器頻率設(shè)置為600 Hz,幅值設(shè)置為8 V,采集時(shí)長(zhǎng)為1 s的樣本,信號(hào)發(fā)生器發(fā)出信號(hào)后通過揚(yáng)聲器將信號(hào)發(fā)出,共發(fā)出24次,設(shè)為24個(gè)樣本數(shù),并將此樣本設(shè)為小樣本事件;隨后設(shè)置信號(hào)發(fā)生器頻率為20 Hz,幅值為6 V,將此事件設(shè)置為正常運(yùn)行狀態(tài),取9 024 s,每1 s為一個(gè)樣本,共9 024個(gè)樣本數(shù);并通過布置在水箱周圍的分布式光纖傳感器進(jìn)行信號(hào)采集,并進(jìn)行數(shù)據(jù)存儲(chǔ),隨后對(duì)數(shù)據(jù)進(jìn)行處理與分析。
1.3 數(shù)據(jù)增強(qiáng)方法
當(dāng)少數(shù)類別事件發(fā)生時(shí),基于深度學(xué)習(xí)的類識(shí)別方法由于缺少對(duì)小類樣本數(shù)據(jù)分析的信息,因此對(duì)少數(shù)類別事件的識(shí)別能力較差。而數(shù)據(jù)增強(qiáng)可以改善這個(gè)問題,傳統(tǒng)的數(shù)據(jù)增強(qiáng)手段有SMOTE,基于k-means的SMOTE數(shù)據(jù)增強(qiáng)手段等[18]。在此采用基于k-means的SMOTE數(shù)據(jù)增強(qiáng)進(jìn)行改進(jìn),一般的k-means聚類手段應(yīng)用于少數(shù)類別事件內(nèi),只保留少數(shù)類樣本比例高的聚類,將比例低的聚類刪除,此方法對(duì)于SMOTE算法有很大的改進(jìn)。在此將k-means聚類后的結(jié)果在進(jìn)行SMOTE改進(jìn),按照k-means聚類后的比例進(jìn)行數(shù)據(jù)擴(kuò)充,使得SMOTE后的數(shù)據(jù)仍然與k-means聚類后的類別比相同,這極大地保留了少數(shù)類別事件的特征?;趉-means的SMOTE數(shù)據(jù)增強(qiáng)算法[19]過程如下。
步驟一 選擇1 s為樣本長(zhǎng)度,分別將故障數(shù)據(jù)與正常數(shù)據(jù)切片,構(gòu)成原始數(shù)據(jù)集。
步驟二 將原始數(shù)據(jù)集取出一部分?jǐn)?shù)據(jù),作為驗(yàn)證集,其余作為訓(xùn)練集和測(cè)試集。
步驟三 將訓(xùn)練集數(shù)據(jù)單獨(dú)取出,對(duì)其中的小類別事件的數(shù)據(jù)進(jìn)行k-means聚類分析,其是最常用的基于歐式距離的聚類算法,具體過程為:
(1) 導(dǎo)入數(shù)據(jù),通過輪廓系數(shù)法獲取相對(duì)最好的k值。輪廓系數(shù)法的核心指標(biāo)輪廓系數(shù)S為
(2) 初始化聚類中心,常使用隨機(jī)數(shù);
(3) 計(jì)算每個(gè)點(diǎn)到K個(gè)聚類中心的距離,即歐氏距離,根據(jù)距離最小原則將數(shù)據(jù)分配到K個(gè)類中;
(4) 利用K個(gè)類中數(shù)據(jù),計(jì)算并更新均值更新K個(gè)聚類中心;
(5) 重復(fù)步驟(3)~(4),直到收斂。
步驟四 將聚類后的數(shù)據(jù)進(jìn)行SMOTE算法分別進(jìn)行數(shù)據(jù)擴(kuò)充,SMOTE算法流程圖見圖2,其中圖2(b)是對(duì)原始數(shù)據(jù)進(jìn)行SMOTE數(shù)據(jù)增強(qiáng),將原始數(shù)據(jù)的數(shù)據(jù)量進(jìn)行擴(kuò)充,用小類別數(shù)據(jù)集中的相鄰點(diǎn)相連接,紅線為兩個(gè)點(diǎn)相連線,中間為新生成的數(shù)據(jù),然后得到新的數(shù)據(jù)集。
經(jīng)過擴(kuò)充之后,小樣本數(shù)據(jù)集從原始的24個(gè)樣本增到9 024個(gè)樣本,與正常樣本的數(shù)目相同,再將所得的數(shù)據(jù)作為訓(xùn)練集輸入給CNN-LSTM網(wǎng)絡(luò),進(jìn)而提高DAS系統(tǒng)的判準(zhǔn)率。
2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
2.1 整體網(wǎng)絡(luò)結(jié)構(gòu)
基于k-means Smote CNN-LSTM的DAS系統(tǒng)識(shí)別方法概述的網(wǎng)絡(luò)整體結(jié)構(gòu)圖如圖3所示,主要包括4個(gè)步驟:(1)信號(hào)采集;(2)數(shù)據(jù)擴(kuò)充;(3)模型調(diào)試;(4)在線測(cè)試。選取DAS系統(tǒng)采集的振動(dòng)位置的時(shí)域信號(hào)作為原始數(shù)據(jù)。由于多數(shù)類別事件的數(shù)據(jù)量足夠多,可以直接作為CNN-LSTM系統(tǒng)的數(shù)據(jù)集,對(duì)于少數(shù)類別事件,則需要進(jìn)行k-means SMOTE數(shù)據(jù)擴(kuò)充,最后將擴(kuò)充后的數(shù)據(jù)與多數(shù)類別事件一起作為數(shù)據(jù)集送入CNN-LSTM網(wǎng)絡(luò)。
將擴(kuò)充后的數(shù)據(jù)集作為CNN-LSTM的原始數(shù)據(jù)集,由于故障樣本數(shù)較少,單憑準(zhǔn)確率不能說明建立系統(tǒng)的優(yōu)越性,尤其是在OLTC故障檢測(cè)中,若發(fā)生故障而系統(tǒng)并沒有監(jiān)測(cè)出來(lái),這對(duì)于OLTC的傷害是極大且不可逆的。所以本論文選取混淆矩陣作為系統(tǒng)性能的判別指標(biāo),混淆矩陣的判別結(jié)果如表1所示。
其中預(yù)測(cè)結(jié)果為真,可以理解為預(yù)測(cè)沒有發(fā)生故障,且實(shí)際結(jié)果也為真時(shí),即實(shí)際結(jié)果沒有發(fā)生故障,我們將這類判別情況為TP。預(yù)測(cè)結(jié)果為真,即預(yù)測(cè)沒有發(fā)生故障,而實(shí)際結(jié)果為假,即實(shí)際發(fā)生了故障,那么我們將這類情況判別為FP。而預(yù)測(cè)為假,即預(yù)測(cè)為發(fā)生了故障,而實(shí)際結(jié)果為真,即沒有發(fā)生故障,將此類別判別為FN。預(yù)測(cè)為假,即預(yù)測(cè)為發(fā)生了故障,而實(shí)際結(jié)果為假,即發(fā)生故障,將此類別判別為TN。
此外,我們定義精確率= TP/(TP+FN),召回率=TP/(TP+FP)。式中精確率表示預(yù)測(cè)對(duì)的比率,而召回率表示對(duì)于發(fā)生故障的事件在預(yù)測(cè)中的準(zhǔn)確率。由于OLTC故障發(fā)生后對(duì)于電力系統(tǒng)的危害過大,所以在本文中更加重視召回率指標(biāo)。
2.2 CNN-LSTM網(wǎng)絡(luò)結(jié)構(gòu)
卷積神經(jīng)網(wǎng)絡(luò)是一類特殊的人工神經(jīng)網(wǎng)絡(luò),其最主要的特點(diǎn)是卷積運(yùn)算操作。卷積神經(jīng)網(wǎng)絡(luò)主要由卷積層和池化層組成。卷積層能夠保持圖像的空間連續(xù)性,能將圖像的局部特征提取出來(lái)。池化層可以采用最大池化或平均池化,池化層能降低中間隱含層的維度,減少接下來(lái)各層的運(yùn)算量,并提供了旋轉(zhuǎn)不變性。長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)在輸入、輸出、忘記過去信息上分別加入了輸入門、輸出門、遺忘門來(lái)控制允許多少信息通過。而CNN-LSTM則是將CNN處理之后連接LSTM,將CNN的輸出作為長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的輸入,再進(jìn)行網(wǎng)絡(luò)模型的訓(xùn)練。由于我們的數(shù)據(jù)集是時(shí)間序列的數(shù)據(jù)集,在CNN 進(jìn)行卷積處理后再由LSTM處理可以更好地解決時(shí)序問題,提高模型的精準(zhǔn)率,圖4為CNN-LSTM網(wǎng)絡(luò)架構(gòu)。
在本文中,采集到的數(shù)據(jù)集一共有多數(shù)類別事件和少數(shù)類別事件。對(duì)采集到的少數(shù)類別事件進(jìn)行數(shù)據(jù)擴(kuò)充操作,而將采集到的多數(shù)類別事件的數(shù)據(jù)集直接作為原始數(shù)據(jù)集進(jìn)行操作。需注意的是,將采集到的數(shù)據(jù)提前取出一部分作驗(yàn)證集,用擴(kuò)充后的數(shù)據(jù)作為模型訓(xùn)練用的數(shù)據(jù)集,訓(xùn)練后的模型再用從未見過的數(shù)據(jù)進(jìn)行測(cè)試,以此驗(yàn)證系統(tǒng)的性能。
3 實(shí)驗(yàn)結(jié)果與分析
基礎(chǔ)數(shù)據(jù)集共有一個(gè)多數(shù)類別和一個(gè)少數(shù)類別事件作為CNN-LSTM的輸入數(shù)據(jù)。為了對(duì)比更加明顯,一共分設(shè)4種訓(xùn)練類別。在此,混淆矩陣都是測(cè)試集的訓(xùn)練結(jié)果,最終得出如圖5所示的4種混淆矩陣的結(jié)果,其中0代表為正常運(yùn)行狀態(tài),1代表故障運(yùn)行狀態(tài),圖5(a)代表為無(wú)k-means SMOTE的ANN網(wǎng)絡(luò)中真實(shí)狀態(tài)為正常運(yùn)行的共有9 084個(gè)樣本,預(yù)測(cè)結(jié)果為正常運(yùn)行的有9 080個(gè)樣本,故障狀態(tài)共有24個(gè)樣本,預(yù)測(cè)為正常運(yùn)行的有12個(gè)樣本。圖5(b)為無(wú)k-means SMOTE的CNN-LSTM網(wǎng)絡(luò),正常運(yùn)行的共有9 084個(gè)樣本,預(yù)測(cè)結(jié)果為正常運(yùn)行的有9 081個(gè)樣本,故障狀態(tài)共有24個(gè)樣本,預(yù)測(cè)為正常運(yùn)行的有24個(gè)樣本。圖5(c)為經(jīng)過k-means SMOTE的ANN網(wǎng)絡(luò),正常運(yùn)行的共有9 084個(gè)樣本,預(yù)測(cè)結(jié)果為正常運(yùn)行的有9 084個(gè)樣本,故障狀態(tài)共有24個(gè)樣本,預(yù)測(cè)為正常運(yùn)行的有22個(gè)樣本。圖5(d)為經(jīng)過k-means SMOTE[JP]的CNN-LSTM網(wǎng)絡(luò),正常運(yùn)行的共有9 084個(gè)樣本,預(yù)測(cè)結(jié)果為正常運(yùn)行的有9 084個(gè)樣本,故障狀態(tài)共有24個(gè)樣本,預(yù)測(cè)為正常運(yùn)行的有24個(gè)樣本。
根據(jù)上圖所得的混淆矩陣圖像,可以得出4種不同網(wǎng)絡(luò)結(jié)構(gòu)預(yù)測(cè)結(jié)果的精確率、召回率、準(zhǔn)確率、F1值,見表2。
從表2可以得出,經(jīng)過SMOTE的CNN-LSTM網(wǎng)絡(luò)結(jié)構(gòu)所取得的結(jié)果是最好的,無(wú)論是識(shí)別率還是召回率都可以達(dá)到100%,意味著在面臨不均衡樣本的條件下,可以取得很好的識(shí)別效果。
4 總結(jié)
由于有載變壓器系統(tǒng)具有短時(shí)沖擊,發(fā)生故障的頻率低等特點(diǎn),所以如何擴(kuò)充故障樣本集并實(shí)現(xiàn)對(duì)故障運(yùn)行狀態(tài)的檢測(cè)是難點(diǎn)問題。本文通過k-means SMOTE方法擴(kuò)充了樣本集,同時(shí)由于實(shí)驗(yàn)數(shù)據(jù)量過大而采用了CNN-LSTM深度學(xué)習(xí)的處理方法,可以有效實(shí)現(xiàn)對(duì)于故障事件的識(shí)別,同時(shí)本文首次將分布式光纖傳感系統(tǒng)應(yīng)用到有載調(diào)壓開關(guān)監(jiān)測(cè)方向,經(jīng)過實(shí)驗(yàn)室模擬試驗(yàn),通過DAS采集到OLTC的模擬故障數(shù)據(jù)與正常運(yùn)行數(shù)據(jù),再通過k-means SMOTE算法增強(qiáng)故障數(shù)據(jù)集,最終將所有數(shù)據(jù)集送入到自行搭建的CNN-LSTM網(wǎng)絡(luò)中,對(duì)于故障的識(shí)別率可以達(dá)到100%,這對(duì)于OLTC的故障識(shí)別具有極大的提高,表明了將DAS系統(tǒng)應(yīng)用到OLTC是可行的,具有開創(chuàng)意義,為將來(lái)DAS應(yīng)用于OLTC提供了指導(dǎo)意義。
參考文獻(xiàn):
[1]林明霞. 一種實(shí)現(xiàn)φ-OTDR系統(tǒng)長(zhǎng)距離監(jiān)測(cè)的方法及系統(tǒng):CN201410817348.X [P]. 2015-03-25.
[2]張知先, 陳偉根, 湯思蕊, 等. 基于互補(bǔ)集總經(jīng)驗(yàn)?zāi)B(tài)分解和局部異常因子的有載分接開關(guān)狀態(tài)特征提取及異常狀態(tài)診斷[J]. 電工技術(shù)學(xué)報(bào), 2019, 34(21): 4508-4518. DOI: 10.19595/j.cnki.1000-6753.tces.181320.
[3]聶鵬. 淺談電力變壓器故障分析及其診斷方法[J]. 科技創(chuàng)新與應(yīng)用, 2014(12):121.
[4]石秀立.基于振動(dòng)信號(hào)特征的有載分接開關(guān)機(jī)械故障診斷策略研究[D].焦作:河南理工大學(xué),2018.
[5]鐘龍申,高學(xué)軍,王振友. 一種新的基于K-means改進(jìn)的SMOTE算法在不平衡數(shù)據(jù)分類中的應(yīng)用[J]. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí), 2015, 45(19):198-206.
[6]趙彤. 有載分接開關(guān)機(jī)械狀態(tài)的在線監(jiān)測(cè)與故障診斷技術(shù)研究[D]. 濟(jì)南: 山東大學(xué), 2008.
[7]SHI Y, WANG Y Y, WANG L Y, et al. Multi-event classification for Φ-OTDR distributed optical fiber sensing system using deep learning and support vector machine[J]. Optik, 2020, 221: 165373. DOI: 10.1016/j.ijleo.2020.165373.
[8]SUN Q, FENG H, YAN X Y, et al. Recognition of a phase-sensitivity OTDR sensing system based on morphologic feature extraction[J]. Sensors (Basel, Switzerland), 2015, 15(7): 15179-15197. DOI: 10.3390/s150715179.
[9]孫鋼. 基于SVM的入侵檢測(cè)系統(tǒng)研究[D]. 北京: 北京郵電大學(xué), 2007.
[10]JIA H Z, LIANG S, LOU S Q, et al. A k-nearest neighbor algorithm-based near category support vector machine method for event identification of φ-OTDR[J]. IEEE Sensors Journal, 2019, 19(10): 3683-3689. DOI: 10.1109/JSEN.2019.2891750.
[11]ZHANG T, LI Z N, ZHU Q, et al. Improved procedures for training primal Wasserstein GANs[C]//2019 IEEE SmartWorld, Ubiquitous Intelligence & Computing, Advanced & Trusted Computing, Scalable Computing & Communications, Cloud & Big Data Computing, Internet of People and Smart City Innovation (SmartWorld/SCALCOM/UIC/ATC/CBDCom/IOP/SCI). Leicester, UK. IEEE, 2020: 1601-1607. DOI: 10.1109/SmartWorld-UIC-ATC-SCALCOM-IOP-SCI.2019.00286.
[12]WU H J, CHEN J P, LIU X R, et al. One-Dimensional CNN-Based Intelligent Recognition of Vibrations in Pipeline Monitoring With DAS [J]. Journal of Lightwave Technology, 2019, 37(17): 4359-4366. DOI:10.1109/JLT.2019.2923839
[13]SNELL J, SWERSKY K, ZEMEL R S. Prototypical networks for few-shot learning[EB/OL]. 2017: arXiv: 1703.05175. https://arxiv.org/abs/1703.05175.
[14]吳飛. 人工智能: 從規(guī)則學(xué)習(xí), 到數(shù)據(jù)驅(qū)動(dòng), 再到能力增強(qiáng)[J]. 杭州科技, 2017(2): 51-53.
[15]MA G M, SHI C, QIN W Q, et al. A non-intrusive electrical discharge localization method for gas insulated line based on phase-sensitive OTDR and Michelson interferometer[J]. IEEE Transactions on Power Delivery, 2019, 34(4): 1324-1331. DOI: 10.1109/TPWRD.2019.2892306.
[16]WU L W, HUANG S S, WU F, et al. Protein subnuclear localization based on radius-SMOTE and kernel linear discriminant analysis combined with random forest[J]. Electronics, 2020, 9(10): 1566. DOI: 10.3390/electronics9101566.
[17]張俊楠, 婁淑琴, 梁生. 基于SVM算法的φ-OTDR分布式光纖擾動(dòng)傳感系統(tǒng)模式識(shí)別研究[J]. 紅外與激光工程, 2017, 46(4): 219-225. DOI: 10.3788/IRLA201746.0422003.
[18]劉明山, 于艷玲, 周原, 等. 基于k-means改進(jìn)的SMOTE算法: CN110852388A[P]. 2020-02-28.
[19]沈艷, 余冬華, 王昊雷. 粒子群k-means聚類算法的改進(jìn)[J]. 計(jì)算機(jī)工程與應(yīng)用, 2014, 50(21): 125-128. DOI: 10.3778/j.issn.1002-8331.1401-0357.