孫哲華,孟慶浩,靳荔成
(天津大學(xué)機(jī)器人與自主系統(tǒng)研究所,天津市過程檢測(cè)與控制重點(diǎn)實(shí)驗(yàn)室,天津大學(xué)電氣自動(dòng)化與信息工程學(xué)院,天津 300072)
近年來(lái),電子鼻技術(shù)的研究和應(yīng)用逐步成為國(guó)內(nèi)外的研究熱點(diǎn),在汽車[1]、農(nóng)業(yè)[2]、食品[3]、醫(yī)藥[4]、環(huán)境保護(hù)[5]等領(lǐng)域都有較為廣泛的應(yīng)用,但是國(guó)內(nèi)的電子鼻技術(shù)大部分仍處于實(shí)驗(yàn)室階段,阻礙電子鼻技術(shù)發(fā)展的一個(gè)很重要的因素是電子鼻采用的金屬氧化物型氣敏傳感器精度較低,會(huì)受到許多形式的噪聲干擾,噪聲的來(lái)源主要有傳感器長(zhǎng)期使用產(chǎn)生的漂移噪聲以及環(huán)境對(duì)傳感器產(chǎn)生的噪聲[6],較大的噪聲會(huì)嚴(yán)重影響電子鼻的分類精度,因此,對(duì)于如何去除或降低電子鼻信號(hào)中的噪聲顯得十分重要。
為消除電子鼻中噪聲的影響,屈劍鋒[7]等提出了一種能夠自適應(yīng)調(diào)整測(cè)量方差以及去除非高斯噪聲的自適應(yīng)卡爾曼濾波算法,去除了電子鼻采樣過程中的傳感器噪聲信號(hào),提高了識(shí)別精度。袁桂玲[8]等人利用獨(dú)立分量分析的方法,對(duì)傳感器陣列信號(hào)進(jìn)行分解,去除了外界干擾噪聲,對(duì)氣體成分的識(shí)別達(dá)到了較好的效果。馬澤亮[9]等使用傳感器陣列獲得白酒“指紋數(shù)據(jù)”后,通過離散小波變換對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,采用波形相似系數(shù)作為指標(biāo),選擇出了最優(yōu)的小波系數(shù)和分解層數(shù),結(jié)合主成分分析實(shí)現(xiàn)對(duì)白酒真假的快速鑒別。J. Feng等人[10]以小鼠為實(shí)驗(yàn)對(duì)象研究基于電子鼻的傷口感染檢測(cè),采用小波分析對(duì)傳感器陣列的每個(gè)信號(hào)進(jìn)行分解,將受傷和健康小鼠的反應(yīng)信號(hào)在相應(yīng)尺度上的小波變換系數(shù)直接相乘,有效地消除了小鼠自身氣味的影響。S. Osowski等[11]分析了電子鼻識(shí)別汽油生物基添加劑時(shí)的畸變數(shù)據(jù),采用基于Haar小波的軟閾值函數(shù)離散小波去噪方法對(duì)畸變數(shù)據(jù)進(jìn)行了降噪處理,降低了識(shí)別的錯(cuò)誤率。
目前的研究中,小波變換常用于電子鼻數(shù)據(jù)的降噪,但小波降噪方法中常用的軟閾值函數(shù)和硬閾值函數(shù)存在著一定的缺點(diǎn):硬閾值函數(shù)降噪之后仍保留有尖刺和振蕩,降噪效果較差,而軟閾值降噪后雖然曲線較為平滑,但同時(shí)也對(duì)有效信號(hào)造成了一定的損傷,且閾值函數(shù)無(wú)法根據(jù)噪聲的不同進(jìn)行調(diào)整,為了解決這一問題,本文基于小波降噪中的軟、硬閾值函數(shù)提出了一種改進(jìn)的閾值函數(shù),通過仿真和實(shí)驗(yàn)驗(yàn)證了基于改進(jìn)的閾值函數(shù)的小波降噪方法的有效性,最后將其應(yīng)用于電子鼻采集的白酒數(shù)據(jù)中,通過主成分分析法[12]比較了4種不同的降噪算法的降噪效果,驗(yàn)證了基于改進(jìn)的閾值函數(shù)的小波降噪方法對(duì)白酒電子鼻數(shù)據(jù)降噪的可行性。
本文使用的由實(shí)驗(yàn)室自行研制的白酒檢測(cè)手持式電子鼻系統(tǒng)主要包括ARM(advanced RISC machines)系統(tǒng)板、氣室、氣路系統(tǒng)、LCD(liquid crystal display)觸摸屏等部件,該系統(tǒng)采用動(dòng)態(tài)頂空采樣方法,設(shè)計(jì)了泵吹式的氣路系統(tǒng)。系統(tǒng)所使用的傳感器陣列是由6種MOS(metal oxide semiconductor)型氣體傳感器構(gòu)成,分別是CCS801和CCS803,TGS8100,MiCS-5914、MiCS-5524和MiCS-4514,各型號(hào)傳感器對(duì)應(yīng)的典型敏感氣體如表1所示。另外還配有溫濕度傳感器SHT21用于測(cè)量環(huán)境溫濕度,在做實(shí)驗(yàn)時(shí)盡量保持環(huán)境溫濕度的一致,以防溫濕度變化對(duì)傳感器的響應(yīng)造成影響。
表1 氣體傳感器與典型敏感氣體
實(shí)驗(yàn)中使用了6種不同的白酒,所屬香型、酒精度數(shù)以及產(chǎn)地都各有不同,包括汾酒、國(guó)窖1573,劍南春,飛天茅臺(tái),五糧液和西鳳酒。實(shí)驗(yàn)時(shí)室內(nèi)溫度為28 ℃,相對(duì)濕度為30%RH,電子鼻采樣頻率為400 Hz,采樣時(shí)間為40 s。其中采集基線的時(shí)間為4 s,吸氣時(shí)間(向氣室中吹入待測(cè)氣體的時(shí)間)為1 s,吸氣等待時(shí)間為3 s,呼氣時(shí)間(從氣室中吹入潔凈空氣的時(shí)間)為32 s。測(cè)試結(jié)束后持續(xù)向氣室中通入潔凈的空氣30 s,使各傳感器回復(fù)到基值狀態(tài),以便于下一個(gè)樣本的測(cè)量。
離散小波變換(discrete wavelet transform,DWT)是一種基于多分辨率分析和多采樣率濾波器理論的算法。常用于非平穩(wěn)信號(hào)分析和局部特征提取[13],其原理如圖1所示。圖中,P[n]為帶有噪聲的原始信號(hào),g[n]為低通濾波器,h[n]為高通濾波器,帶有噪聲的原始信號(hào)通過2種濾波器進(jìn)行分解后,會(huì)得到2組分量,低頻分量部分Ai稱為近似分量,而高頻部分Di稱為細(xì)節(jié)分量,由于噪聲的頻率一般是高于有效信號(hào)的頻率,所以有效信號(hào)一般是位于近似分量中,再對(duì)近似分量進(jìn)行分解,可以進(jìn)一步地提取出有效信息。而由于信號(hào)在空間上(或者時(shí)間域)具有一定的連續(xù)性,因此在小波域,有效信號(hào)所產(chǎn)生的小波系數(shù)的模值一般較大;而高斯白噪聲在空間上(或者時(shí)間域)沒有連續(xù)性,因此噪聲經(jīng)過小波變換后對(duì)應(yīng)的系數(shù)很小[14]。需要通過一定的閾值選擇方法,比如無(wú)偏風(fēng)險(xiǎn)估計(jì)閾值、固定閾值、啟發(fā)式閾值等,將閾值以內(nèi)的系數(shù)看做是噪聲對(duì)應(yīng)的系數(shù),進(jìn)行置0處理,其他系數(shù)通過一定的閾值函數(shù)進(jìn)行處理,將經(jīng)過閾值處理后的小波系數(shù)進(jìn)行重構(gòu),就可以得到去噪后的信號(hào),這樣可以最大程度地抑制噪聲,同時(shí)只損失一部分有效信號(hào)。
圖1 DWT原理圖
較為常用的閾值處理辦法有硬閾值函數(shù)和軟閾值函數(shù)[15],硬閾值函數(shù)的基本思想是將閾值以內(nèi)系數(shù)置0,閾值范圍以外的系數(shù)不變,如式(1)所示:
(1)
該種閾值算法由于會(huì)在小波域產(chǎn)生突變,從而導(dǎo)致去噪后信號(hào)產(chǎn)生局部的振蕩,使得信號(hào)的光滑性變差,影響后續(xù)分析。而常用的軟閾值函數(shù)則是將大于λ的系數(shù)統(tǒng)一減去λ,而小于-λ的系數(shù)統(tǒng)一加λ,如式(2)所示:
(2)
式中:sgn()為符號(hào)函數(shù)。
經(jīng)過這種變換之后,去除了小波域中的突變,使得去噪之后的信號(hào)更為平滑,但缺點(diǎn)是需對(duì)小波系數(shù)進(jìn)行較大的改變,從而丟失更多的有效信號(hào),造成不可避免的誤差,有著較大的信號(hào)失真。
為了改善軟、硬閾值函數(shù)的缺點(diǎn),本文結(jié)合軟、硬閾值函數(shù)的思想,提出了一種改進(jìn)的閾值函數(shù),改進(jìn)的閾值函數(shù)如式(3)所示:
(3)
式中:a為調(diào)節(jié)因子,a>1。
將改進(jìn)的閾值函數(shù)和軟、硬閾值函數(shù)在同一坐標(biāo)系下表示(設(shè)閾值為2),其對(duì)比如圖2所示。從圖中可以看出,當(dāng)a值越大,改進(jìn)的閾值越接近硬閾值函數(shù),而當(dāng)a值減少時(shí),閾值函數(shù)的曲線變得更為平滑,更接近軟閾值函數(shù)。改進(jìn)的閾值函數(shù)融合了軟、硬閾值函數(shù)的優(yōu)點(diǎn),在去除閾值附近的突變、保證函數(shù)連續(xù)性的同時(shí),將不在[-λ,λ]之內(nèi)的小波系數(shù)變化盡可能地減小,并且可以通過調(diào)整a值取得最佳的平衡點(diǎn)。這樣就使得信號(hào)在經(jīng)過重構(gòu)之后既不會(huì)丟失太多的有效信息,同時(shí)也能減少振蕩,達(dá)到更好的降噪效果。
圖2 改進(jìn)閾值算法和軟、硬閾值算法的對(duì)比圖
為了對(duì)改進(jìn)閾值函數(shù)的有效性進(jìn)行驗(yàn)證,向1個(gè)原始信號(hào)中加入信噪比為10的高斯白噪聲,原始信號(hào)和加入高斯白噪聲的信號(hào)分別如圖3(a)和圖3(b)所示,原始信號(hào)中包含頻率較低且較為平滑的正弦曲線部分,也包括2個(gè)跳變,對(duì)應(yīng)白酒電子鼻檢測(cè)信號(hào)中頻率較低的有效信號(hào)曲線以及白酒電子鼻檢測(cè)到敏感氣體之后產(chǎn)生的響應(yīng)值上升過程。其跳變部分以及正弦曲線頂點(diǎn)部分都是較為重要的信息點(diǎn)。
(a)原始信號(hào)
(b)加入噪聲后的信號(hào)圖3 原始信號(hào)和含噪信號(hào)
首先對(duì)含噪信號(hào)進(jìn)行離散小波變換,采用較為常用的sym4小波基函數(shù)[9],分解層數(shù)選擇4,然后需要獲取每層小波系數(shù)的閾值,閾值的獲取方法為固定閾值法[16],其表達(dá)式如式(4)所示:
(4)
式中:λ為該層的閾值;N為該層小波系數(shù)的個(gè)數(shù);σ為該層小波系數(shù)的方差。
分別使用硬閾值函數(shù)、軟閾值函數(shù)和改進(jìn)閾值函數(shù)對(duì)系數(shù)進(jìn)行處理,并通過計(jì)算實(shí)驗(yàn)的方式選出最佳的a值:a=1.2,最后通過逆變換實(shí)現(xiàn)降噪后信號(hào)的重構(gòu)。3種不同閾值函數(shù)的降噪效果如圖4所示。
(a)改進(jìn)閾值函數(shù)降噪效果
(b)硬閾值函數(shù)降噪效果
(c)軟閾值函數(shù)降噪效果圖4 不同閾值函數(shù)的降噪效果對(duì)比圖
從圖4可以看出,硬閾值函數(shù)降噪雖然在原信號(hào)突變處的效果還原較好,但是在降噪后的部分信號(hào)中仍保留著較大的振蕩和尖刺,降噪后的信號(hào)平滑度較差,高斯白噪聲加入的尖刺和振蕩并沒有完全去除;軟閾值函數(shù)降噪后的信號(hào)平滑度得到了很大的提升,正弦信號(hào)的2個(gè)頂點(diǎn)的還原程度較高,但是2個(gè)突變處的信號(hào)還原程度較差,第1個(gè)突變部分已經(jīng)很難看出,且第2個(gè)突變部分的幅值差也大大減?。桓倪M(jìn)的閾值函數(shù)降噪后的信號(hào)則較為完整的保留了2個(gè)突變處的信息以及正弦曲線較為平滑的部分,基本保留了原始數(shù)據(jù)的曲線,只存在小部分的小幅振蕩,并且在兩處突變的信息盡可能保留的前提下,去除了大部分由于高斯白噪聲產(chǎn)生的尖刺和振蕩。
信號(hào)的降噪效果也可以通過信噪比(signal-noise ratio,SNR)和均方根誤差(root mean square error,RMSE)定量地評(píng)價(jià)[17],信噪比和均方根誤差的表達(dá)分別如式(5)和式(6)所示:
(5)
(6)
信噪比反映的是有效信息的“能量”和噪聲的“能量”之間的比例,信噪比越大,則表示有效信息占的比例越多,即降噪的效果越好;而均方根誤差則表示噪聲的平均“能量”,均方根誤差越小,噪聲越少,降噪效果越好?;谲?、硬閾值函數(shù)和a=1.2的改進(jìn)閾值函數(shù)的小波降噪方法降噪后的信噪比和均方根誤差如表2所示。
表2 3種不同閾值函數(shù)的降噪效果對(duì)比表
由表2可以看出,改進(jìn)閾值函數(shù)降噪后的信噪比最高,均方根誤差最小,說明不僅有效信號(hào)占比最高,并且噪聲的“能量”最小。軟閾值函數(shù)因?yàn)閷?duì)信號(hào)的平滑處理過于嚴(yán)重,導(dǎo)致有效信號(hào)的大量減少,信噪比最低。硬閾值函數(shù)處理過后的信號(hào)由于尖刺較多,導(dǎo)致噪聲的含量較高,信噪比也較低,并且均方根誤差較大,降噪效果較差。
針對(duì)白酒檢測(cè)電子鼻采集的六類白酒樣本,分別使用改進(jìn)的小波閾值函數(shù)降噪方法、軟閾值函數(shù)小波降噪方法、硬閾值函數(shù)小波降噪方法以及中值濾波加SG (savitzky-golay)濾波(先中值濾波再SG濾波)的方法[18]對(duì)其進(jìn)行降噪處理,以驗(yàn)證改進(jìn)的閾值函數(shù)降噪方法的有效性。其中小波降噪方法均以“sym11”作為小波基函數(shù),分解層數(shù)為7層,閾值的獲取方法仍為固定閾值法,改進(jìn)的閾值函數(shù)的a取5.2(以上各參數(shù)均由計(jì)算試驗(yàn)的方法獲得)。中值濾波函數(shù)的窗口長(zhǎng)度為51,SG濾波的窗口長(zhǎng)度為71,多項(xiàng)式階數(shù)為3[18]。數(shù)據(jù)處理軟件平臺(tái)采用MATLAB2017a。以CCS803的一次測(cè)量曲線為例,4種降噪方法的降噪效果如圖5所示,信號(hào)在5 s左右和8.75 s左右的峰值已標(biāo)出。
(a) 軟閾值函數(shù)降噪
(b) 硬閾值函數(shù)降噪
(c) 改進(jìn)的閾值函數(shù)降噪
(d) 中值加SG濾波降噪圖5 4種降噪方法的降噪效果圖
從圖5可以看出,硬閾值降噪后的信號(hào)中在15 s左右仍存在一些尖刺噪聲,降噪的效果較差;軟閾值函數(shù)降噪之后的信號(hào)較為平滑,但是在5 s左右的峰值要比其他的閾值函數(shù)降噪后的峰值要小,并且小于8 s左右的峰值,由于電子鼻系統(tǒng)采用先吸氣1 s后保持3 s的采集流程,所以傳感器響應(yīng)的最高值應(yīng)該出現(xiàn)在第一次峰值出現(xiàn)的時(shí)刻,對(duì)于CCS803即為5 s左右,8 s左右出現(xiàn)的尖峰可能是由于氣體流速增大導(dǎo)致的信號(hào)值上升[19],如果算作最大值,則會(huì)導(dǎo)致提取的特征不準(zhǔn)確;從6.25 s至8 s處的信號(hào)平滑程度來(lái)看,中值濾波加SG濾波降噪后的信號(hào)最為平滑,但是同樣出現(xiàn)了5 s左右的峰值小于8 s左右的峰值的問題;改進(jìn)的閾值函數(shù)降噪后的信號(hào)較為平滑,并且5 s左右的信號(hào)值大于8 s左右的信號(hào)值,不會(huì)造成提取特征不準(zhǔn)確的問題。
總體來(lái)看,硬閾值降噪的效果最差,其他3種降噪方式對(duì)于噪聲的去除效果較好,但是由于無(wú)法得知傳感器真實(shí)的響應(yīng),所以對(duì)于真實(shí)信號(hào)是否有損耗則無(wú)法看出,所以采用對(duì)降噪后的數(shù)據(jù)提取特征后進(jìn)行主成分分析(principal component analysis,PCA)的方法[12]對(duì)降噪效果進(jìn)行判別,具體操作步驟如下。
首先對(duì)降噪后的數(shù)據(jù)進(jìn)行特征提取,依據(jù)手持式電子鼻的采樣方式和數(shù)據(jù)曲線的形狀特點(diǎn),選取響應(yīng)差值Rr和一階微分最大值Maxder為特征,其提取方法如下式所示:
(7)
Rr=max(St)-St0
(8)
式中:t為采樣時(shí)間;St為傳感器輸出電壓信號(hào)對(duì)應(yīng)的數(shù)字量;St0為響應(yīng)起始點(diǎn)對(duì)應(yīng)的傳感器輸出電壓信號(hào)的數(shù)字量。
然后使用PCA對(duì)特征矩陣進(jìn)行分析,繪制PCA得到的前2個(gè)主成分PC1、PC2組成PCA得分圖,幾種不同降噪方法得到的PCA得分圖如圖6所示??梢钥闯觯瑤追N降噪方法對(duì)于茅臺(tái)、國(guó)窖以及西鳳酒的區(qū)分效果比較好,體現(xiàn)在圖中即為這3種酒樣本和其他酒的區(qū)分度比較高;軟、硬閾值函數(shù)降噪對(duì)于汾酒、五糧液、劍南春這3種白酒的區(qū)分程度較差,3類樣本群在圖中較為混亂,沒有明顯的邊界;而改進(jìn)的閾值函數(shù)降噪和中值濾波加SG濾波降噪對(duì)于這3種白酒的區(qū)分程度稍好,3類樣本群在圖中雖有重疊部分,但是重疊部分的面積相對(duì)較小。可以看出,軟、硬閾值降噪的方法有一定的缺陷,不利于不同種類白酒的分類。
(a)軟閾值函數(shù)
(b)硬閾值函數(shù)
(c)改進(jìn)的閾值函數(shù)
(d)中值濾波加SG濾波圖6 不同濾波方法的PCA得分圖
為了定量地描述不同降維方法的分類性能,本文引入了樣本特征的類間離散度Sb和類內(nèi)離散度Sw[20],其中Sb可以表示不同類別樣本之間的分離程度,Sw代表同一類別的樣本的分離程度,其定義如下:
(9)
(10)
式中:c為樣本類別數(shù);ni為第i類樣本的樣本數(shù);Mi為第i類樣本的均值;M為所有樣本的均值;Xij是第i類的第j個(gè)樣本的特征。
不同的降噪方法對(duì)應(yīng)的類間、類內(nèi)離散度以及二者比值如表3所示,從分類的角度來(lái)看,類間離散度應(yīng)該越大越好,而類內(nèi)離散度應(yīng)該越小越好,這樣有利于后續(xù)的模式識(shí)別,故比值越大的降噪方法對(duì)分類更為有利,從表3可以看出,改進(jìn)的閾值函數(shù)降噪方法降噪后的類間離散度最大,說明其對(duì)不同類別的樣本區(qū)分程度較好,其類內(nèi)離散度和軟閾值函數(shù)相近,且小于硬閾值函數(shù),說明軟閾值函數(shù)和改進(jìn)的閾值函數(shù)降噪對(duì)相同類別的樣本聚類的效果好。中值濾波加SG濾波降噪的類內(nèi)離散度最低,但是類間離散度較低,說明該降噪方法對(duì)于同類別的樣本的聚類效果較好,但是不同類別樣本之間的區(qū)分程度較差。從Sb與Sw的比值來(lái)看,改進(jìn)的閾值函數(shù)降噪的效果最好,中值濾波加SG濾波降噪方法次之。
表3 不同降噪方法對(duì)應(yīng)的類間、類內(nèi)離散度及其比值
為了去除白酒電子鼻檢測(cè)信號(hào)中存在的噪聲,本文在軟、硬閾值函數(shù)小波降噪方法的基礎(chǔ)上提出了一種改進(jìn)的小波閾值函數(shù),使之同時(shí)具備了軟、硬閾值函數(shù)的優(yōu)點(diǎn),并且其降噪的效果可以通過調(diào)整尺度因子進(jìn)行微調(diào)。通過仿真驗(yàn)證可知,改進(jìn)的閾值函數(shù)小波降噪算法可以在不損失有效信號(hào)的同時(shí)對(duì)噪聲進(jìn)行有效地過濾,相比軟、硬閾值函數(shù)小波降噪方法,改進(jìn)的閾值函數(shù)小波降噪方法降噪后得到的SNR更高,RMSE更低,降噪效果更好。將改進(jìn)的閾值函數(shù)降噪方法應(yīng)用到白酒電子鼻的實(shí)驗(yàn)數(shù)據(jù)中,結(jié)果表明,相比軟、硬閾值函數(shù)小波降噪方法以及中值濾波加SG濾波降噪方法,改進(jìn)的閾值函數(shù)小波降噪方法對(duì)于數(shù)據(jù)有較好的降噪效果,且降噪之后的數(shù)據(jù)集有著較大的類間離散度和較小的類內(nèi)離散度,利于不同類別的白酒之間的分類。以上仿真和實(shí)驗(yàn)結(jié)果可以說明,改進(jìn)的閾值函數(shù)有效地克服了軟、硬閾值函數(shù)的缺點(diǎn),且可以有效減少電子鼻中的噪聲,為電子鼻數(shù)據(jù)的降噪處理提供了一種可行的思路和方法。