• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于改進MFCC和3D-CNN的變壓器鐵心松動故障聲紋識別模型

      2023-01-11 01:09:20崔佳嘉馬宏忠
      電機與控制學(xué)報 2022年12期
      關(guān)鍵詞:聲紋鐵心降維

      崔佳嘉,馬宏忠

      (河海大學(xué) 能源與電氣學(xué)院,江蘇 南京 211100)

      0 引 言

      電力變壓器在運輸、使用過程中出現(xiàn)的碰撞、擠壓和外部短路故障等將導(dǎo)致鐵心松動變形,繼而造成嚴重的事故。因此對變壓器鐵心狀態(tài)進行監(jiān)測,對電網(wǎng)的安全運行具有重要意義。

      目前監(jiān)測變壓器鐵心松動的方法主要是振動信號監(jiān)測法[1-2]。根據(jù)已有的研究證明,存在缺陷的變壓器運行時,振動信號含有更多的高頻分量[4],高頻分量的峰度值能夠反映變壓器鐵心的壓緊程度[5]?;谡駝有盘柕墓收显\斷方法已經(jīng)取得了較為成熟的研究成果,但是振動傳感器的安裝通常是附著于變壓器的器身,振動信號的識別方法更依賴于傳感器的安裝位置及靈敏度??紤]到配電變壓器具有分布廣、數(shù)量多的特點,普遍采用巡檢的方式進行故障診斷,在巡檢過程中難以獲取振動信號,因此基于振動信號的故障診斷方法不適用于配電變壓器。

      雖然使用振動信號對變壓器進行故障診斷存在上述缺點,但是變壓器的聲紋信號和振動信號具有相關(guān)性,因此可以利用聲信號代替振動信號對其進行監(jiān)測和診斷[6]。聲紋信號的采集具有傳感器非接觸,測量便捷的優(yōu)點,更適合于人工巡檢。劉云鵬等[1]提出了基于Mel時頻譜—卷積神經(jīng)網(wǎng)絡(luò)的變壓器鐵心松動聲紋識別方法,能夠較好地識別故障;耿琪深等人[6]提出一種基于Gammatone濾波器倒譜系數(shù)和鯨魚算法優(yōu)化隨機森林的變壓器故障診斷方法,能有效地識別鐵心及繞組的松動故障;華北電力大學(xué)張重遠等[7]采用盲源分離的方法針對局部放電故障進行了研究,使用2D-CNN對數(shù)據(jù)進行了深度學(xué)習(xí),但未證明是否可用于鐵心松動的故障診斷。上海交通大學(xué)王豐華團隊[8]采用加權(quán)降維的MFCC與傳統(tǒng)的機器學(xué)習(xí)VQ相結(jié)合,對鐵心壓緊程度進行了診斷;已有研究存在的不足是:特征提取采用提取梅爾頻率倒譜系數(shù)(MFCC)或者線性倒譜系數(shù)(LPCC),特征向量有過高的維數(shù),導(dǎo)致計算機運行的速度大大下降;目前對語音信號進行識別使用的識別模型是卷積神經(jīng)網(wǎng)絡(luò),主要采用的是一維或二維卷積神經(jīng)網(wǎng)絡(luò)(2D-CNN),2D-CNN雖然可以同時提取時域和頻域的信息,但是識別準確率仍有上升的空間。三維卷積神經(jīng)網(wǎng)絡(luò)(3D-CNN)目前已被有效地應(yīng)用于動作的識別,不同于2D-CNN,其還能提取出反映時間變化上的信息。

      針對上述問題,本文采用經(jīng)LLE降維的MFCC作為聲紋信號的特征量,降維后的數(shù)據(jù)維度大大縮減,以降低計算的復(fù)雜度,提高計算速度;并首次使用3D-CNN識別模型對變壓器鐵心不同松動程度進行診斷,進一步提高故障識別的準確率。

      1 噪聲信號特征提取

      1.1 梅爾倒譜系數(shù)

      1.1.1 噪聲信號預(yù)處理

      噪聲信號x(t)的預(yù)處理包括分幀、加窗和離散傅里葉變換。截取一段變壓器在某工況下的噪聲信號,首先對截取的片段作分幀處理,幀長選擇太長會影響特征量的準確性,幀長選擇太短會提取不到有用的特征量。取每幀N=2 500為50 ms(采樣頻率為50 kHz),為了使幀與幀之間能平滑過渡,取重疊率為50%。其次,若是直接對分幀后的數(shù)據(jù)進行離散傅里葉變換,會出現(xiàn)頻譜泄露的情況,因此需要對每一幀先作加窗處理,選擇加漢明窗ω(n),使信號兩端變得平滑減少信號的失真,即

      (1)

      最后,根據(jù)下式再對分幀加窗后的每一幀數(shù)據(jù)作離散傅里葉變換得到能反應(yīng)時頻關(guān)系的復(fù)向量Y(k),為

      (2)

      1.1.2 MFCC特征向量提取

      在語音識別技術(shù)中,梅爾倒譜系數(shù)(MFCC)是最常見的一種語音信號特征提取方法[8]。它是基于Mel頻率域的倒譜系數(shù),是根據(jù)人耳聽覺感知特征變換的頻率域,將線性頻譜映射到Mel頻率域中,再轉(zhuǎn)換到倒譜上。求取MFCC特征向量的步驟包括對預(yù)處理后的各幀信號Mel濾波、對數(shù)變換及逆變換(離散余弦變換)。

      Mel頻率和實際頻率的轉(zhuǎn)換公式為

      (3)

      式中:p為實際頻率,Hz;fmel(p)為Mel頻率。

      Mel濾波器是一個由m個三角形濾波器組成的濾波器組。其中心頻率為f(m),在Mel頻率刻度上,濾波器之間的距離是等寬的。該濾波器組的傳遞函數(shù)為

      (4)

      其中,f(m)定義為

      (5)

      式中:fh與fl為濾波器濾波頻率的上限與下限;fs為變壓器聲紋采樣的采樣頻率(fs=50 kHz);N為進行短時傅里葉變化時的幀長。

      信號經(jīng)過濾波器后可得到m個參數(shù)Mi(i=1,2,…,m)并取對數(shù),計算公式為

      (6)

      將計算得到的Mi進行離散余弦變換,即可得到分幀信號的MFCC特征信號,其計算公式為

      (7)

      梅爾倒譜系數(shù)(MFCC),它的物理含義是語言信號的能量在不同頻率范圍的分布。特征量具體提取步驟是:

      1)對聲紋信號分幀加窗。本文是將一段2 s的信號首先截取成4段,分別對每段(0.5 s)進行分幀加窗。取每幀N=2 500為50 ms(采樣頻率為50 kHz),重疊率為50%,并使用漢明窗處理使信號兩端變得平滑減少信號的失真,此時每段(0.5 s)可以得到加窗后的二維數(shù)組[19×2 500];

      2)傅里葉變換。對步驟1)的每一幀作N=4 096的傅里葉變換,得到頻率特征的二維矩陣[19×2 049],并計算每一幀的能量得到能量譜E[19×2 049],將每幀的能量相加得到該幀的能量和有F[19×1];

      3)計算能量特征參數(shù)的和能量總值。將步驟2)得到的能量譜E通過梅爾濾波器組,計算能量特征參數(shù)的和能量總值二維矩陣[19×26];

      4)計算MFCC特征向量的基礎(chǔ)參數(shù)(第一組參數(shù))。對每一行作離散傅里葉變化,由于變壓器本體噪聲的頻率集中在低頻區(qū),因此只取每幀的前13個數(shù)據(jù),即二維數(shù)組[19×13],對該數(shù)組作升倒譜操作,得到MFCC參數(shù)的基礎(chǔ)參數(shù)也是第一組參數(shù)記作feat[19×13];

      5)計算MFCC特征向量的第二、三組參數(shù)。第二組參數(shù)是在已有的基礎(chǔ)參數(shù)(feat[19×13])下作一階微分操作得二維數(shù)組feat′[19×13],第三組參數(shù)在第二組參數(shù)下作一階微分操作得二維數(shù)組feat″[19×13],即對基礎(chǔ)參數(shù)導(dǎo)數(shù)的導(dǎo)數(shù);

      6)MFCC特征向量。將feat、feat′及feat″三個二維數(shù)組拼湊得到MFCC最終的特征向量數(shù)組[19×39]。

      1.2 改進的MFCC特征向量

      使用上述方法提取的MFCC特征向量在高維度的情況下,能有效地提取到噪聲信號中的信息,但是過高維度的數(shù)據(jù)會耗費大量的時間,并且增加計算的復(fù)雜性,因此考慮使用局部線性嵌入(locally linear embedding,LLE)算法對提取到的高維度的MFCC特征向量進行降維,且保證能保留變壓器噪聲信號的有效信息。

      LLE算法的主要思想是高維的數(shù)據(jù)樣本點可以利用局部領(lǐng)域的點進行線性表示,并保持局部領(lǐng)域權(quán)值不變,且在低維空間中利用修改權(quán)值重新構(gòu)造原來的數(shù)據(jù)點,并使得重構(gòu)誤差達到最小[9]。對于數(shù)據(jù)X={x1,x2,…,xN}∈RD×N是高維歐式空間RD的數(shù)據(jù)集,通過LLE降維算法可將高維數(shù)據(jù)(D維)X降維到低維數(shù)據(jù)(d維)Y={y1,y2,…,yN}∈Rd×N,d

      1)尋找數(shù)據(jù)樣本點xi(i=1,2,…,N)的k(k

      (8)

      2)計算重構(gòu)權(quán)值矩陣。構(gòu)造誤差函數(shù)ε(W),并使得誤差最小,定義為

      (9)

      式中:xij表示為xi的第j個近鄰點(j=1,2,…,k),wij為xi和xij之間的權(quán)值,同時滿足

      (10)

      綜合式(9)和式(10),即有最小誤差函數(shù)

      (11)

      3)將樣本點從高維空間映射到低維空間。在低維空間中應(yīng)滿足:

      (12)

      式中:yi為xi映射在低維空間的輸出向量;yij表示為yi的第j個近鄰點(j=1,2,…,k),同時滿足

      (13)

      (14)

      則映射在低維空間的輸出向量Y=(y1,y2,…,yN),可以用下式求解:

      Y(I-W)(I-W)TYT=YMYT。

      (15)

      式中:Ii為N×N單位矩陣的第i列;Wi為矩陣W的第i列。

      4)求解輸出向量Y。由推導(dǎo)公式可知,Y應(yīng)由矩陣M的從小到大排列的d個非零特征值的特征向量構(gòu)成的矩陣??紤]到最小的非零特征值無限趨近于0,因此選擇第2至第d+1個特征值對應(yīng)的特征向量作為LLE降維算法的輸出向量Y。

      2 基于三維卷積神經(jīng)網(wǎng)絡(luò)的模式識別

      卷積神經(jīng)網(wǎng)絡(luò)是一種前饋神經(jīng)網(wǎng)絡(luò),具有局部連接特性和權(quán)值共享特性,能夠自動對原始數(shù)據(jù)進行局部空間特征提取,因此被廣泛應(yīng)用于圖像識別等領(lǐng)域[10]。研究表明,卷積神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)到人工難以提取的深層次的特征,使用CNN有助于提高模型的判別能力和泛化能力。它通常是由多個卷積層、池化層和全連接層組成,每一層網(wǎng)絡(luò)輸入輸出的數(shù)據(jù)均是二維數(shù)據(jù),由多個獨立神經(jīng)元組成,有較高的識別精確度。

      對于傳統(tǒng)的2D-CNN,只能提取二維圖像的特征信息,而3D-CNN適用于更高維度的圖像數(shù)據(jù),在處理過程中增加了時間維度的信息(連續(xù)幀),可以同時提取出時間與空間的信息。相比于二維卷積,三維卷積更能捕捉到時序上的特征。3D-CNN的卷積公式為

      (16)

      2.1 數(shù)據(jù)集制作

      將采集的2 s原始數(shù)據(jù)分為4幀數(shù)據(jù),用上述方法生成4組MFCC特征向量,此時數(shù)據(jù)大小為[4×19×39×1],再將每一組數(shù)據(jù)經(jīng)過LLE算法降維,則數(shù)據(jù)大小縮小為[4×19×39×1],其中4表示數(shù)據(jù)深度;19表示時間分量;18表示特征維度,1表示輸入網(wǎng)絡(luò)的通道。則三維卷積神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)集制作如圖1所示。

      2.2 網(wǎng)絡(luò)結(jié)構(gòu)及性能指標

      本文根據(jù)CNN網(wǎng)絡(luò)輸入數(shù)據(jù)的大小和特點,設(shè)計了用于識別變壓器鐵心松動故障的聲紋特征的網(wǎng)絡(luò)結(jié)構(gòu),該網(wǎng)絡(luò)能避免訓(xùn)練過程中出現(xiàn)的過擬合和梯度爆炸現(xiàn)象,且能有較高的識別率。

      在搭建CNN結(jié)構(gòu)時,采用激活函數(shù)ReLU,它能極大地提高網(wǎng)絡(luò)的訓(xùn)練速度;為了防止發(fā)生過擬合,使之在訓(xùn)練集上訓(xùn)練良好卻在測試集上準確率低的現(xiàn)象,因此選擇在全連接層進行了dropout操作,它是通過概率隨機丟棄部分神經(jīng)元,使得訓(xùn)練樣本在保持輸入和輸出神經(jīng)元數(shù)量不發(fā)生變化的情況下進行參數(shù)的迭代;另外,為了防止發(fā)生梯度消失,又能夠加快學(xué)習(xí)收斂的速度,采用批規(guī)范操作,提高網(wǎng)絡(luò)的性能。

      圖1 數(shù)據(jù)集制作過程Fig.1 Dataset production process

      本文使用的3D-CNN是由兩層卷積層、兩層池化層及兩層全連接層組成,均采用“SAME”補零方式。其中,卷積層后接有激活層,激活層選擇的是線性整流函數(shù)(ReLu),dropout是一種非常有效的提高泛化能力,降低過擬合的方法,因此選擇在每一個全連接層后設(shè)置dropout層,速率均設(shè)置為0.5。由于本文作四分類問題,將最后一層設(shè)置為4節(jié)點,用softmax函數(shù)激活作分類。網(wǎng)絡(luò)的詳細結(jié)構(gòu)如表1所示(batch size表示批尺寸:一次輸入網(wǎng)絡(luò)訓(xùn)練的樣本數(shù)量)。

      表1 3D-CNN網(wǎng)絡(luò)結(jié)構(gòu)Table 1 3D-CNN network structure

      給每一段音頻生成經(jīng)過LLE降維后的MFCC特征向量標記,送入3D-CNN模型中分別訓(xùn)練,用損失值loss和準確率acc來評判模型的優(yōu)劣,損失值loss用來描述預(yù)測值與實際值之間的差距,acc表示正確分類的數(shù)量占總預(yù)測樣本的比例。loss值越小,acc值越大,則判定該模型越適合變壓器鐵心松動故障的識別。其中,損失函數(shù)選擇的是傳統(tǒng)的交叉熵損失函數(shù)(softmax loss)。softmax loss是由softmax和cross-entropy loss 組合而成的損失函數(shù),其損失函數(shù)的表達式為

      (17)

      2.3 LLE改進的MFCC-CNN的模式識別

      鐵心的噪聲能代表變壓器運行時的狀態(tài)信息,在不同的運行工況下或者發(fā)生故障情況下,它的噪聲信號在時域、頻域會出現(xiàn)不同程度的變化,但是這種狀態(tài)信息的變化非常復(fù)雜,難以直接通過某一個數(shù)值的變化辨別,因此構(gòu)造由LLE改進的MFCC-CNN的變壓器聲紋識別模型,用于變壓器鐵心松動故障的診斷。

      通過第1節(jié)的噪聲MFCC特征的提取并通過LLE的降維,將預(yù)處理后的特征向量作為CNN網(wǎng)絡(luò)的輸入量進行深度學(xué)習(xí),形成基于LLE降維的MFCC-CNN識別模型,從而實現(xiàn)變壓器的鐵心在不同程度松動下的聲紋特征的提取與故障的識別?;贚LE降維的MFCC-CNN識別模型實現(xiàn)的具體步驟為:

      1)搭建變壓器鐵心松動故障試驗?zāi)M平臺,采集鐵心在松動不同程度下的變壓器噪聲信號;

      2)給采集的噪聲數(shù)據(jù)規(guī)范為統(tǒng)一的數(shù)據(jù)長度并添加數(shù)據(jù)標簽;

      3)提取每一段信號的MFCC特征并使用LLE算法對其降維并制作成輸入網(wǎng)絡(luò)的數(shù)據(jù)集;

      4)搭建3D-CNN網(wǎng)絡(luò)結(jié)構(gòu),將步驟3)制作的數(shù)據(jù)集輸入網(wǎng)絡(luò)進行訓(xùn)練,并調(diào)整網(wǎng)絡(luò)參數(shù)至最佳;

      5)使用測試集測試訓(xùn)練好的模型。

      3 試驗描述

      3.1 試驗平臺搭建

      為了驗證基于LLE降維的MFCC-CNN識別模型的變壓器鐵心松動故障的識別效果,搭建了變壓器鐵心松動故障試驗平臺,采集鐵心在不同松動程度下的噪聲信號。

      試驗對象為一臺S13-M-200/10變壓器,根據(jù)國標GB/T 1094.10—2003對該變壓器噪聲測量的標準和要求,采用電容式麥克風作為聲傳感器對變壓器鐵心不同松動情況下的噪聲進行測量,采樣頻率為50 kHz,頻率響應(yīng)為20 Hz~20 kHz。試驗在變壓器廠廠房中進行,廠房空間較為空曠,幾乎不存在聲波反射的情況。試驗環(huán)境如圖2所示。

      圖2 試驗環(huán)境Fig.2 Test environment

      在設(shè)置鐵心不同松緊程度時,將變壓器油抽出后吊心,鐵心的壓緊程度是通過改變螺栓的預(yù)緊力來確定的,首先使用扭力扳手確定鐵心的額定預(yù)緊力,再通過調(diào)整不同的預(yù)緊力達到模擬鐵心不同松緊程度的目的,模擬過程如圖3所示。在低壓側(cè)加400 V電壓,對變壓器做空載運行如圖4所示,分別采集變壓器鐵心未松動、松動40%、松動80%、松動100%時若干個聲紋信號。

      圖3 模擬鐵心松動故障Fig.3 Simulated core looseness fault

      圖4 空載運行控制圖Fig.4 No load operation control diagram

      分別采集鐵心在未松動情況下的樣本82個,松動40%時的樣本129個,松動80%時的樣本129個,松動100%時的樣本140個(每個樣本的截取時間為2 s)。將變壓器鐵心在同一種松動程度下的數(shù)據(jù)歸為一類,并統(tǒng)一添加標簽,使用卷積神經(jīng)網(wǎng)絡(luò)進行無參特征量的訓(xùn)練學(xué)習(xí)。為了驗證模型的泛化能力,隨機在樣本中抽取80%作為訓(xùn)練集,剩余20%則作為測試集。同時,在每一次訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)時,都將樣本數(shù)據(jù)重新打亂排序,以保證模型的有效性。

      3.2 聲紋數(shù)據(jù)分析

      限于篇幅,本文以圖2中②號傳感器采集的聲紋信號測試結(jié)果為例進行計算分析。圖為試驗變壓器在鐵心未松動、松動40%、松動80%及松動100%時的聲紋信號的頻率分布圖。由圖可見,在鐵心處于不同松動程度時,變壓器的聲紋信號的頻譜特征各不相同。

      從圖5可以看出,鐵心在未松動時(正常狀態(tài)下),聲紋信號的頻率主要集中在100、200、300 Hz等偶次諧波,并伴隨少量奇次諧波的存在;在鐵心發(fā)生松動時,聲音信號的能量在不同頻率范圍的分布發(fā)生了改變,具體表現(xiàn)為:各頻率分量的幅值均發(fā)生改變,且明顯出現(xiàn)了500、600、800、1 000 Hz等分量。對不同松動程度的聲紋信號作3層小波包分解,分解出0~2 500 Hz的8個頻率帶,其各個頻段能量所占的比例分布圖如圖6所示。從圖6中可以明顯看出,隨著松動程度的不同,各個頻率帶的能量比例會發(fā)生不同程度的變化,這為聲紋識別提供了可能。

      且變壓器聲紋能量集中在低頻部分,從梅爾頻率的定義可以看出,梅爾濾波器加強了低頻部分,削弱了高頻部分,所以將變壓器聲紋信號映射到梅爾頻率域上,可以突出變壓器聲紋信號中富含信息的低頻部分,有助于對聲紋信號中有用信息的提取。

      圖5 鐵心不同松動程度的聲紋頻率分布Fig.5 Distribution of voiceprint frequency of iron core with different looseness

      4 結(jié)果分析

      4.1 基于LLE降維的MFCC特征提取

      將變壓器噪聲信號通過3.1采集并制作成數(shù)據(jù)集后,分別提取信號的MFCC特征量,再對特征向量LLE降維。采集變壓器各種狀態(tài)下的穩(wěn)定聲紋信號2 s并截取成4段(每段0.5 s),對每段作相同處理:取每幀長為50 ms,重疊率為50%。由此提取到的MFCC特征向量的每一幀的時間幀數(shù)為19,每一幀頻率的維數(shù)為39,此時數(shù)據(jù)的大小為[4×19×39×1] ,4代表的是將1個樣本數(shù)據(jù)分成4段,[19×39]代表每一幀數(shù)據(jù)的大小,1代表通道數(shù)。

      將上述的特征向量使用LLE降維,降維后的每一個樣本的數(shù)據(jù)大小為[4×19×18×1],選擇降維后的維度是18的原因是,當維度低于18時,降維后的數(shù)據(jù)將提取不到有效的特征量,導(dǎo)致后續(xù)的3D-CNN計算不收斂,泛化性極低,因此選擇將數(shù)據(jù)降到18維。取某一幀數(shù)據(jù)提取MFCC后降維前后的計算結(jié)果如圖7所示,數(shù)據(jù)尺寸被大大縮小。

      圖6 不同松動程度聲紋的各個頻段能量所占比例分布圖Fig.6 Distribution of energy proportion of each frequency band of voiceprint with different looseness

      4.2 超參數(shù)優(yōu)化

      在模型訓(xùn)練過程中,卷積神經(jīng)網(wǎng)絡(luò)超參數(shù)的選擇會直接影響網(wǎng)絡(luò)的訓(xùn)練結(jié)果。本文選擇調(diào)整的超參數(shù)為批尺寸(batch size)和學(xué)習(xí)率(learning rate)。

      4.2.1 批尺寸優(yōu)化

      不同的batch size直接影響的是完成一次完整樣本的訓(xùn)練所需要的次數(shù),batch size值越大,處理一次完整樣本的速度就越快,則當需要達到相同精度時其需要迭代的次數(shù)也越多。在這個過程中,會存在一個最優(yōu)的數(shù)值,此時模型的訓(xùn)練結(jié)果最佳。本文選取batch size分別等于10、20、30、60,訓(xùn)練結(jié)果如圖8、圖9所示。

      圖7 特征量將為前后對比Fig.7 Comparison before and after dimensionality reduction of feature quantity

      圖8 不同批尺寸下的準確率曲線Fig.8 Accuracy curve under different batch sizes

      從圖8可以明顯看出,當batch size=10、20、30時,訓(xùn)練過程中準確率波動很大,且在圖7的loss曲線中,沒有呈現(xiàn)穩(wěn)定下降趨勢,因此當批尺寸選擇10、20或30時,可能會導(dǎo)致模型最終不能收斂。而當batch size=60時,在訓(xùn)練過程中,當?shù)螖?shù)達到43以后,準確率已穩(wěn)定在1,且loss值在迭代過程中總體呈現(xiàn)出穩(wěn)定下降的趨勢。不同批尺寸最終訓(xùn)練模型在測試集上的表現(xiàn)效果如表2所示,當batch size=60時,準確率最高達到96.88%;對于每個模型都選擇迭代100次,從表2中平均每次迭代所需時間可以看出,批尺寸的選擇對計算時間影響不大。因此根據(jù)準確率與損失函數(shù)曲線選擇batch size=60。

      圖9 不同批尺寸下的損失函數(shù)曲線Fig.9 Loss function curve under different batch sizes

      表2 不同批尺寸的訓(xùn)練結(jié)果Table 2 Training results of different batch sizes

      4.2.2 學(xué)習(xí)率優(yōu)化

      學(xué)習(xí)率(Learning rate)作為監(jiān)督學(xué)習(xí)以及深度學(xué)習(xí)中重要的超參數(shù),其決定著目標函數(shù)能否收斂到局部最小值以及何時收斂到最小值。合適的學(xué)習(xí)率能夠使目標函數(shù)在合適的時間內(nèi)收斂到局部最小值。本文選取Learning rate分別等于1,0.1,0.01,0.001,訓(xùn)練結(jié)果如圖10、圖11所示。

      如圖10所示,當learning rate=1時,訓(xùn)練過程中準確率在0.2以下浮動,且呈現(xiàn)不收斂趨勢;learning rate=0.1時,隨著迭代次數(shù)的增加,準確率和損失值還存在大幅度的波動,使得模型訓(xùn)練不穩(wěn)定;而對于learning rate=0.01和0.001,當learning rate=0.001時,迭代次數(shù)在25次以后,訓(xùn)練集的準確率維持在1,而learning rate=0.01雖然在迭代次數(shù)36以后準確率維持在1,但是在圖9損失函數(shù)曲線中,可以觀察到learning rate=0.01的曲線在learning rate=0.001的下方,且在測試集中,模型采用學(xué)習(xí)率為0.01的準確率為98.33%,而模型采用學(xué)習(xí)率為0.001的準確率為95.00%,且在表3中平均每次迭代的時間也達到近11 s.因此為該卷積神經(jīng)網(wǎng)絡(luò)選擇的學(xué)習(xí)率為0.01。

      圖10 不同學(xué)習(xí)率下的準確率曲線Fig.10 Accuracy curve under different learning rates

      圖11 不同學(xué)習(xí)率下的損失函數(shù)曲線Fig.11 Loss function curve under different learning rates

      表3 不同學(xué)習(xí)率的訓(xùn)練結(jié)果Table 3 Training results of different learning rates

      4.3 3D-CNN識別結(jié)果

      將上述調(diào)參后的3D-CNN使用MFCC直接進行卷積神經(jīng)網(wǎng)絡(luò)計算和基于LLE降維的MFCC進行訓(xùn)練的結(jié)果如表4所示。直接使用MFCC提取的特征量維數(shù)是39,而經(jīng)過LLE降維的MFCC的特征量維數(shù)是18,因此在網(wǎng)絡(luò)訓(xùn)練過程中計算量將大量下降,就會縮短每次迭代所需要的平均時間。從表4中可以看出采用改進后的基于LLE降維的MFCC的特征量并使用調(diào)參后的3D-CNN訓(xùn)練的準確率可以從90%提高到98.33%,且平均每次迭代的時間大大縮短。

      表4 改進算法前后對比Table 4 Comparison before and after the improved algorithm

      4.4 與2D-CNN比較

      使用2D-CNN作為識別模型進行變壓器鐵心故障診斷時,并不采用“連續(xù)幀”來制作數(shù)據(jù)集,而是將每個2 s的數(shù)據(jù)樣本直接提取MFCC特征向量,再使用LLE對其進行降維。為了驗證3D-CNN識別模型比2D-CNN識別模型的優(yōu)越性,采用與表1相同數(shù)量的卷積層和池化層。計算結(jié)果表明,采用2D-CNN模型同樣能收斂,但最終在測試集上的準確率為93.33%,平均每次迭代時間為9.153 81 s,相較于表中顯示的基于LLE降維的MFCC提取的特征量并使用3D-CNN模型的識別效果準確率達到98.33%,平均迭代時間只有8.511 26 s,那么隨著樣本數(shù)量的增加,2D-CNN訓(xùn)練所需要的時間要比3D-CNN大幅度增加,因此采用3D-CNN更有優(yōu)勢。

      5 結(jié) 論

      1)采用LLE算法降維后的MFCC作為變壓器聲紋信號的特征向量,能夠完整地保留其主要特征信息,并大幅降低模型的計算量,從而提高模型的識別速率,將平均每次迭代時間從14.337 0 s降至8.511 26 s;

      2)使用經(jīng)LLE降維的MFCC作為特征量,消除MFCC的特征向量中不能反應(yīng)運行狀況的冗余的特征向量,較直接使用MFCC作為特征量的準確率從90.00%提高到98.33%。

      3)構(gòu)建了相同網(wǎng)絡(luò)結(jié)構(gòu)的2D-CNN和3D-CNN,并使其訓(xùn)練同一批數(shù)據(jù)集,計算顯示在準確率和識別速率上,3D-CNN更具優(yōu)勢。

      猜你喜歡
      聲紋鐵心降維
      混動成為降維打擊的實力 東風風神皓極
      車主之友(2022年4期)2022-08-27 00:57:12
      異步電動機定子鐵心模態(tài)及振動響應(yīng)分析
      防爆電機(2021年3期)2021-07-21 08:12:54
      降維打擊
      海峽姐妹(2019年12期)2020-01-14 03:24:40
      屏幕即指紋識別
      汽輪發(fā)電機階梯段鐵心損耗分析
      江西寧都:鐵心硬手守護綠水青山
      交/直流線路并行運行對鐵心飽和不穩(wěn)定的影響
      基于數(shù)字水印的人臉與聲紋融合識別算法
      拋物化Navier-Stokes方程的降維仿真模型
      計算物理(2014年1期)2014-03-11 17:00:18
      基于特征聯(lián)合和偏最小二乘降維的手勢識別
      乡宁县| 台州市| 台前县| 即墨市| 于都县| 会宁县| 东乌珠穆沁旗| 丹巴县| 马龙县| 崇义县| 芦山县| 安宁市| 新安县| 遂溪县| 乌审旗| 南宁市| 台北市| 平定县| 来宾市| 民丰县| 嵩明县| 垫江县| 鹤峰县| 峨眉山市| 通渭县| 无为县| 萨迦县| 福海县| 万盛区| 北碚区| 普格县| 沛县| 天气| 富川| 新闻| 清丰县| 瑞金市| 沁源县| 康定县| 白水县| 云梦县|