李 鵬陸 一楊佳康徐永凱
(1.南京信息工程大學(xué),江蘇省氣象探測與信息處理重點實驗室,江蘇 南京 210044;2.南京信息工程大學(xué),江蘇省大氣環(huán)境與裝備技術(shù)協(xié)同創(chuàng)新中心,江蘇 南京 210044;3.無錫學(xué)院自動化學(xué)院,江蘇 無錫 214105)
?;瘹怏w是工業(yè)生產(chǎn)、存儲和運轉(zhuǎn)必不可少的組成部分,一旦發(fā)生?;瘹怏w泄漏,將對生命、財產(chǎn)、環(huán)境產(chǎn)生重大影響[1],如何對氣體泄漏進行檢測,及時發(fā)現(xiàn)并消除泄漏故障是減少此類事故發(fā)生的途徑之一。因此,研究人員提出各種檢測氣體泄漏技術(shù),如D-S 證據(jù)理論微小孔檢測[2]、紅外圖像檢測[3]和聲學(xué)檢測方法[4],其中聲學(xué)檢測方法具有較高的靈敏度、效率和精度。
在聲學(xué)檢測方法中,氣體逸出壓力容器的聲音信號通常是非平穩(wěn)的,采用時頻分析方法能夠有效分析非平穩(wěn)信號。Yan 等[5]提出一種新的時頻分析方法-頻率切片小波變換(Frequency Slice Wavelet Transform,FSWT),從頻域的角度引入了頻率切片函數(shù)(Frequency Slice Function,FSF),實現(xiàn)時頻分析功能。近年來,該分析方法被應(yīng)用到軸承故障診斷[6]、大地電磁信號去噪[7]、生物信號分析[8]等領(lǐng)域,引入該方法對泄漏聲信號進行時頻分析,并依據(jù)該方法提取相應(yīng)的特征做后續(xù)處理。此外,在實際應(yīng)用過程中,僅判斷出有無氣體泄漏往往不能給工程維修人員提供有效的故障維修信息,因此有必要提出氣體泄漏程度的判斷方法。隨著人工智能的發(fā)展,研究人員已經(jīng)使用機器學(xué)習(xí)的方法來檢測泄漏并對其進行分類。其中,支持向量機(Support Vector Machine,SVM)作為分類問題的監(jiān)督學(xué)習(xí)方法被廣泛使用。Mandal 等[9]提出了基于粗糙集理論和SVM 的泄漏檢測方案,實驗結(jié)果表明精度達到95.19%。El-Zahab 等[10]提出一種用于泄漏檢測的線性SVM 模型,其準(zhǔn)確率為96.44%。在實際應(yīng)用中,用于建立SVM 分類器的特征或者指標(biāo)受到噪聲影響、壓力容器內(nèi)部壓力變化等影響較大,魯棒性不強,鑒于聲學(xué)信號的非平穩(wěn)特性,將時域、頻域和時頻域特征相結(jié)合更加合理。
針對上述不足,將FSWT 與SVM 相結(jié)合,提出了一種判斷氣體容器是否存在泄漏和泄漏程度識別的綜合方法。首先,使用FSWT 對容器泄漏聲信號進行去噪,研究泄漏聲信號的優(yōu)化基礎(chǔ)和特征。其次,基于變換結(jié)果,提出了一種高質(zhì)量的時頻特征來識別不同泄漏程度,采用一種特征選擇方法來減少冗余特征,提高預(yù)測性能,減少訓(xùn)練和利用時間。然后利用所選擇的特征建立SVM 分類器,以網(wǎng)格搜索的方式搜索適合的SVM 值,使檢測準(zhǔn)確率達到最大。最后通過實驗驗證該方法的有效性。
假設(shè)信號f(t)∈L2(R),為f(t)的傅里葉變換,為頻率切片函數(shù)p(t)的傅里葉變換,則從頻域上定義的FSWT 為[5]:
式中:t為觀測時間;w為觀測頻率;λ為能量系數(shù),通常取1;u為評估頻率;σ為尺度因子或w、t、u的函數(shù);*表示共軛;i 為虛數(shù)單位。
根據(jù)Parseval 能量守恒關(guān)系和傅里葉變換對偶關(guān)系列出:
求得其時域表達式為:
為了便于分析,引入新的尺度參數(shù)κ=w/σ,則頻率分辨率η可以表示為[11]:
式中:Δw=σΔwp為頻窗寬度;Δwp為頻率切片函數(shù)的窗寬;w為中心頻率。此時公式可表示為:
頻率切片函數(shù)有多種構(gòu)造方式,可以把它看作是時頻域上的帶通濾波器[11],其構(gòu)造方式需滿足以下4 個條件:
FSF 通常具有波動性、衰減性等特征[12],根據(jù)其性質(zhì)列出如下6 種函數(shù)以供選擇:
式(10)為高斯函數(shù),由于Heisenberg 不等式只在高斯函數(shù)處取等號,高斯函數(shù)也是短時傅里葉變換(Short-Time Fourier Transform,STFT)最優(yōu)時間局部化的窗函數(shù),因此式(10)相比其他的FSF 具有較好的時頻分辨率,FSWT 本質(zhì)上可以理解為STFT 的延伸發(fā)展。
FSWT 在進行逆變換時,可對任意時頻區(qū)間(t1,t2,w1,w2)內(nèi)的需求信號分量進行重構(gòu),重構(gòu)后的信號fx(t)為[13]:
SVM 是由Vapnic 和Cortes 引入的有監(jiān)督的機器學(xué)習(xí)方法,目前被廣泛應(yīng)用于分類和回歸中[14]。SVM 是一個二分類算法,圖1 所示,通過在正和負之間尋找一個超平面將它們區(qū)分開。假設(shè)給定一組帶有標(biāo)簽yi=±1 的訓(xùn)練集數(shù)據(jù)x1,x2,…,xn∈?d,SVM 尋找一個最合適的超平面使支持向量之間有最大的函數(shù)間隔,這個超平面被定義為:
圖1 SVM 數(shù)據(jù)分類
式中:w 是權(quán)重向量;x 是提取的信號特征,b是偏差。
SVM 通過解決以下最優(yōu)化問題進行二分類:
式中:n是樣本個數(shù),‖ ‖是范數(shù)矩陣。考慮到實際存在異常離群點,引入松弛變量ξ解決因離群點導(dǎo)致不滿足分類條件的問題,則SVM 數(shù)學(xué)模型可優(yōu)化為:
式中:C是離群點權(quán)重,C越大表示離群點對目標(biāo)函數(shù)影響越大,ξi是松弛變量。根據(jù)統(tǒng)計學(xué)方法和最優(yōu)化理論,最終的最優(yōu)解問題為:
式中:λi,yi是拉格朗日乘子[15]。
所提出的基于FSWT 和SVM 的氣體泄漏診斷主要包括3 個部分:①數(shù)據(jù)預(yù)處理,②特征提取,③泄漏分類,圖2 為泄漏檢測方法流程。
圖2 檢測流程
采集信號必然會存在干擾信號,進一步分析前要進行濾波處理,采用FSWT 方法對信號從時頻域進行濾波處理,其步驟如下:
(1)采用FSWT 對氣體泄漏信號進行分解,得到在全頻帶下的時頻分布;
(2)采用時頻域閾值濾波的方式對信號進行處理:
式中:κ為尺度參數(shù),tn=,σ為噪聲的標(biāo)準(zhǔn)差;N是信號長度[16];
(3)對濾波后的時頻域選擇性進行逆變換重構(gòu),分離出有效氣體泄漏聲信號進行分析;
(4)進一步對去噪后的信號進行特征提取。
特征提取的目的是從數(shù)據(jù)集中確定、量化和描述與待研究問題相關(guān)的對象特征。將不同嚴重程度的去噪信號分割成一系列長度相同的子信號,從中提取時域、頻域和時頻域特征來檢測是否存在泄漏以及泄漏的程度。傳統(tǒng)時域特征包含最大值、最小值、峰峰值、絕對平均值、方差、標(biāo)準(zhǔn)差、峭度、均方根、波形因子、峰值因子、峭度因子、裕度因子,頻域特征包括中心頻率、總諧波失真。利用FSWT 將信號擴展到時頻域分析,經(jīng)過分析觀察可以發(fā)現(xiàn)氣體泄漏產(chǎn)生的聲信號具有寬頻帶、分散性等特點,在超聲范圍內(nèi)的30 kHz 和50 kHz 內(nèi)擁有高于可聽聲范圍的能量,其能量集中程度隨著泄漏孔徑的變化而變化,因此可以用平均頻率表示能量集中程度的特征,可以表示為:
式中:W(t,f)是信號的FSWT 后每一個時頻點的值,f是信號頻率。提取30 kHz~50 kHz 之間的信號分成128 個時間間隔ti(i=1,2,…,128),選取均勻泄漏的時間段,求Ωf(ti)分別在觀測范圍為30k~40k、40k~50k、30k~50k 的平均值,獲取均勻泄漏時不同頻帶信號的能量集中程度用于后續(xù)的分析。
為了提高SVM 分類能力、減小運算量,采用Relief-F 算法[17],根據(jù)不同的特征區(qū)分它們對應(yīng)特征向量的能力進行權(quán)重估計。根據(jù)各個不同類別特征數(shù)據(jù)之間的相關(guān)性,其計算公式如下:
式中:diff(A,R1,R2)表示樣本R1和樣本R2在特征A上的差值,體現(xiàn)各樣本之間的特征距離的大小,可表示為:
式中:Ri表示從隨機信號中選取的一個特征向量;A表示某一特征;Hj表示和Ri同類樣本集中的k個鄰近樣本(nearest Hits);Mj表示和Ri不同類別樣本集中的k個鄰近樣本(nearest Misses);P(C)表示C類樣本占樣本總數(shù)比例;m表示抽樣次數(shù)。根據(jù)Relief-F 算法結(jié)果,將具有較大權(quán)重值的特征作為SVM 輸入。
在眾多的分類器中,SVM 能夠處理異常值求得全局最優(yōu)解,具備選取非線性邊界能力[18]。然而大多數(shù)情況下的特征空間是高維的,需要大量的計算工作,因此使用核函數(shù)(Kernal Function)能夠?qū)⑻卣饔成溆嬎戕D(zhuǎn)換成特征空間的點積運算:
所以式(20)變成:
通過以下決策規(guī)則可對x進行分類:
采用一對一法(one-versus-one)進行多分類,其核心思想是在任意兩類樣本之間插入SVM,因此對n類樣本需要設(shè)計n(n-1)/2 個SVM,對測試集數(shù)據(jù)分別進行二分類并投票計數(shù),將得票數(shù)多的類別歸為該測試數(shù)的類別。本文將氣體泄漏歸為4 個嚴重程度:無泄漏、輕微泄漏、中度泄漏和嚴重泄漏,通過模擬泄漏環(huán)境進行實驗論證。
所設(shè)計的氣體泄漏數(shù)據(jù)采集系統(tǒng)如圖3 所示。
圖3 數(shù)據(jù)采集方案
在這套實驗方案圖中,1 是產(chǎn)生氣體的氮氣瓶;2 是氮氣瓶的出氣部分為帶有壓強刻度的減壓閥;3 是有著不同尺寸孔徑的小帽,用于模擬不同嚴重程度的氣體泄漏故障;4 是寬頻帶的麥克風(fēng)傳感器,其性能指標(biāo)如表1 所示;5 是Analog Discovery 2-NI Edition 采集卡;6 是waveforms 軟件,用于記錄采集數(shù)據(jù)。
表1 麥克風(fēng)參數(shù)
考慮到氣體泄漏聲信號能量主要集中在超聲范圍,因此選取寬頻帶麥克分探頭觀測超聲信號,將采集卡采樣頻率設(shè)置為200 kHz 保證采樣信號質(zhì)量。結(jié)合實際,將0.5 mm、1.5 mm、3.0mm 泄漏孔徑定義為輕微泄漏、中度泄漏、嚴重泄漏,圖4 是對3 種不同泄漏孔徑下的聲信號從時域、頻域的分析,可以發(fā)現(xiàn)不論何種孔徑,泄漏聲信號能量都集中在超聲部分;隨著泄漏孔徑的增大,頻譜開始出現(xiàn)能量分散的趨勢,并且在超聲部分逐步地向50 kHz 集中。因此從超聲范圍內(nèi)對聲信號特征進行分析和提取是很有必要的。
圖4 不同孔徑泄漏信號頻譜圖
選取適當(dāng)?shù)某叨纫蜃尤≈的軌颢@取較好的時域分辨率和頻域分辨率,減少圖像端點處的邊界效應(yīng),根據(jù)文獻[5],選取Δw·Δt=0.5,η=0.05,κ=23.54以獲取較好的分辨率,圖7 分別為不同孔徑泄漏聲信號進行FSWT 變換和降噪后的結(jié)果,其中圖7 的第1 列a 和b 為0.5 mm 孔徑氣體泄漏聲信號時頻圖、c 為降噪后的時頻圖、d 為選取觀測頻率為30 kHz~50 kHz 進行重構(gòu)后的時域圖,同理第2 列、第3 列分別是1.5 mm 和3.0 mm 泄漏孔徑聲信號對應(yīng)的降噪前后的時頻圖和重構(gòu)后的時域圖。從圖7中可以發(fā)現(xiàn),在泄漏伊始最先產(chǎn)生超聲信號且超聲部分信號幅值較大,將重構(gòu)后的時域信號和原始信號進行比對,發(fā)現(xiàn)濾波后的信號更為平滑,減少了毛刺。按照前文的特征提取方法,對信號各類特征進行Relief-F 權(quán)重分析,其結(jié)果如表2所示。
表2 各特征權(quán)重值
圖5 是采集信號的三維散點圖,每一個點代表一次泄漏信息,將選取的3 個典型特征作為坐標(biāo)軸,錄入三維視圖中可以清晰的看出,這3 個特征有明顯的聚類行為,說明分析篩選后的特征具有較強的魯棒性,可以作為鑒別泄漏程度的泄漏特征使用。
圖5 前三個權(quán)重特征的散點圖
選取判別能力最強的前6 個特征作為SVM 的特征輸入,將70%的數(shù)據(jù)用于訓(xùn)練集,剩余的數(shù)據(jù)用于測試集,選取高斯核函數(shù)作為核函數(shù),采用十字交叉驗證對分類性能進行估計。由于此方法需要對懲罰系數(shù)c和高斯核函數(shù)自帶參數(shù)g進行確定,為了最大限度地提高驗證精度,使用網(wǎng)絡(luò)搜索的方法對參數(shù)進行優(yōu)化處理,將c、g變化范圍設(shè)置為-10~10 進行遍歷搜索[19]。
先建立二分類SVM 進行識別泄漏狀態(tài)和非泄漏狀態(tài),當(dāng)c=0.435 3,g=0.164 9 時的SVM 對泄漏狀態(tài)和無泄漏狀態(tài)判斷準(zhǔn)確率達到99.75%,表明該方法具有較強的泄漏有無的判準(zhǔn)能力。然后對泄漏狀態(tài)的嚴重程度進行分類,圖6 表明了按照權(quán)重排列的不同輸入特征數(shù)量和分類結(jié)果的關(guān)系,按照排序依次選取不同數(shù)量的特征送入SVM,結(jié)果表明輸入特征數(shù)隨著數(shù)量增加而增加,當(dāng)特征數(shù)為6 時,準(zhǔn)確率達到了最高94.68%,此時c=1.319 5,g=0.435 3,當(dāng)特征數(shù)繼續(xù)增加時,準(zhǔn)確率略微下降,結(jié)果與輸入6 個特征時相近,表明經(jīng)過Relief-F 算法篩選出的特征能夠較好地代表氣體泄漏聲信號。
圖6 SVM 輸入特征數(shù)量和準(zhǔn)確率關(guān)系
圖7 不同孔徑氣體泄漏聲信號分析
由此可知,在這項研究中提出的方法能夠保證泄漏檢測的精確度和泄漏程度識別的準(zhǔn)確性,這就意味著選擇的FSWT 算法分析信號、閾值濾波能夠?qū)υ夹盘栠M行有效的降噪,提出對重構(gòu)后的信號從時頻域不同的頻段、時間段求取平均頻率能夠有效地代表氣體泄漏聲音信號的明顯特征。
采用基于聲信號特征分析方法有助于提高SVM的預(yù)測性能。表3 給出了部分研究者的方法、特征選取和研究結(jié)果以及采用決策樹、BP 神經(jīng)網(wǎng)絡(luò)作為參照組的算法比對,可以看出所采用的基于FSWT 的去噪方法、提出平均頻率特征、基于Relief-F 的特征篩選能夠有效地提高SVM 的分類準(zhǔn)確度。
表3 部分方法、所選特征和準(zhǔn)確度的比較
本文提出了一種基于FSWT 和SVM 的氣體泄漏檢測方法,從聲音的角度去分析和判斷氣體泄漏。FSWT 能夠精確地呈現(xiàn)氣體泄漏聲信號的時頻能量分布特征,可用于研究氣體泄漏的時頻特征。對聲音信號進行閾值濾波和逆變換重構(gòu),有效地去除了噪聲信號的干擾。在此基礎(chǔ)上,通過時域、頻域和時頻域提取去噪后的聲信號特征,并進行權(quán)重排序,選取權(quán)重值較大的6 個特征輸入到SVM 進行分類,對泄漏與否判斷準(zhǔn)確率達到99.75%,對無泄漏、泄漏孔徑為0.5 mm 的輕微泄漏、1.5 mm 的中度泄漏、3 mm 的嚴重泄漏分類識別準(zhǔn)確率達到94.68%。結(jié)果表明該方法有良好的檢測泄漏的性能,不僅可以判斷是否存在泄漏事故,同時可以診斷出泄漏程度,因此本文提出的氣體泄漏診斷方案具有應(yīng)用價值,有助于檢測泄漏和泄漏孔定位研究。