張志剛,陳紅巖,曲 健
(1.浙江農(nóng)業(yè)商貿(mào)職業(yè)學(xué)院汽車技術(shù)系,浙江 紹興 312088;2.中國(guó)計(jì)量大學(xué)機(jī)電工程學(xué)院,杭州 310018)
多組分汽車尾氣定量檢測(cè)系統(tǒng)*
張志剛1,陳紅巖2*,曲 健2
(1.浙江農(nóng)業(yè)商貿(mào)職業(yè)學(xué)院汽車技術(shù)系,浙江 紹興 312088;2.中國(guó)計(jì)量大學(xué)機(jī)電工程學(xué)院,杭州 310018)
針對(duì)混合氣體濃度檢測(cè)中,氣體間交叉吸收干擾及紅外光譜數(shù)據(jù)計(jì)算量過(guò)大等問(wèn)題,提出了一種基于網(wǎng)格搜索的支持向量機(jī)方法,建立多組分混合氣體定量分析模型。運(yùn)用網(wǎng)格搜索法對(duì)支持向量機(jī)建模中的參數(shù)進(jìn)行優(yōu)化選擇,并與遺傳算法優(yōu)化的BP網(wǎng)絡(luò)建模效果作對(duì)比。實(shí)驗(yàn)表明:SVM建模所用時(shí)間為39.824 s,BP神經(jīng)網(wǎng)絡(luò)約為2 682 s;SVM建模預(yù)測(cè)結(jié)果均方差明顯低于BP網(wǎng)絡(luò)。SVM建模時(shí)間約為BP網(wǎng)絡(luò)的1/60,收斂速度更快,且預(yù)測(cè)精度更高。
氣體檢測(cè);定量分析;支持向量機(jī);BP神經(jīng)網(wǎng)絡(luò);交叉干擾
目前,氣體的定量分析技術(shù)已廣泛應(yīng)用于食品安全、環(huán)境監(jiān)測(cè)、生產(chǎn)安全等多個(gè)領(lǐng)域[1]。在進(jìn)行多組分氣體同時(shí)測(cè)量時(shí),待測(cè)氣體的吸收譜線存在嚴(yán)重的交叉重疊現(xiàn)象,如果不加以回歸分析修正,將嚴(yán)重影響測(cè)量的靈敏度和精度[2],需要后續(xù)的數(shù)據(jù)處理。
現(xiàn)代氣體檢測(cè)技術(shù)有人工神經(jīng)網(wǎng)絡(luò)ANN(Artificial Neural Network)方法和支持向量機(jī)SVM(Support Vector Machine)方法等。其中,耿志廣[3]等將神經(jīng)網(wǎng)絡(luò)與氣體傳感器陣列技術(shù)相結(jié)合,克服了傳感器陣列在混合氣體檢測(cè)中的交叉敏感現(xiàn)象;黃小燕[4[5]等利用粒子群優(yōu)化算法對(duì)支持向量機(jī)進(jìn)行參數(shù)優(yōu)化,用于混合氣體定量分析,進(jìn)一步提高了預(yù)測(cè)精度;李玉軍[6]等人將粒子群優(yōu)化與最小支持二乘向量機(jī)相結(jié)合,并與遍歷優(yōu)化算法相比較,尋優(yōu)時(shí)間節(jié)省40倍以上,預(yù)測(cè)結(jié)果誤差水平相當(dāng)。
本文以不分光紅外法[7](NDIR)氣體濃度傳感器為研究對(duì)象,對(duì)多組分混合氣體進(jìn)行建模仿真分析。
SVM回歸校正模型,就是利用SVM核函數(shù),將紅外光譜輸入數(shù)據(jù)利用線性映射函數(shù)Φ,映射到高維空間;在高維空間進(jìn)行回歸分析,建立紅外光譜數(shù)據(jù)與待測(cè)氣體濃度的回歸校正模型,其回歸函數(shù)f(xi)可表示為:
f(xi)=ω·φ(xi)+b
(1)
式中:ω·φ(xi)為向量ω與φ(xi)的內(nèi)積;ω為回歸系數(shù),b為閥值。
引入Lagrange函數(shù),得到的SVM回歸校正模型的回歸函數(shù)為:
(2)
高斯函數(shù)能較好的模擬光譜信號(hào),因此選用RBF核函數(shù)。其基本形式如下:
K(xi,xj)=exp(-g‖xi-xj‖2),g>0
(3)
式中:參數(shù)g為gamma參數(shù)函數(shù)設(shè)置(若k為屬性的數(shù)目,則g默認(rèn)為1/k)。
SVM的回歸模型的建立需要進(jìn)行參數(shù)的優(yōu)選,主要選擇核參數(shù)c和g。傳統(tǒng)的網(wǎng)格搜索法[8]的基本原理是:讓c和g在一定的范圍劃分網(wǎng)格并遍歷網(wǎng)格內(nèi)所有點(diǎn)進(jìn)行取值,最終取使驗(yàn)證分類準(zhǔn)確率最高的那組c和g作為最佳的參數(shù)。改進(jìn)的網(wǎng)格搜索法,首先,在較大范圍內(nèi)采用大步距進(jìn)行粗搜,在尋得了局部最優(yōu)參數(shù)之后,再在這組參數(shù)附近選擇一個(gè)小區(qū)間,采用小步距進(jìn)行二次精搜,找到最終的最優(yōu)參數(shù),在保證準(zhǔn)確率的前提下,縮短了尋優(yōu)時(shí)間。具體的尋優(yōu)過(guò)程如圖1所示。
圖1 改進(jìn)網(wǎng)格搜索尋優(yōu)流程圖
遺傳算法[9]是模擬自然界生物進(jìn)化論和遺傳機(jī)制而成的一種并行隨機(jī)搜索方法。遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)流程如圖2所示。
圖2 遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)算法流程圖
4.1 實(shí)驗(yàn)裝置與條件
測(cè)試系統(tǒng)利用不分光紅外法原理,經(jīng)過(guò)MCU調(diào)制的紅外光源通過(guò)一定長(zhǎng)度的氣室內(nèi),氣室中充有待測(cè)濃度的氣體。由于氣體對(duì)紅外線波段中特征波長(zhǎng)紅外線能量的吸收,特定波長(zhǎng)的光源通過(guò)氣體后,在相應(yīng)譜線處會(huì)發(fā)生光強(qiáng)的衰減,紅外線的能量將減少,探測(cè)器檢測(cè)剩余的光強(qiáng)度并轉(zhuǎn)化為電信號(hào),經(jīng)朗伯-比爾定律計(jì)算后,得到系統(tǒng)檢測(cè)的氣體濃度值,但受到電壓波動(dòng)、氣體脈沖、氣體間交叉干擾以及環(huán)境因素等影響,此時(shí)的濃度值并不準(zhǔn)確,需要后續(xù)的模型仿真分析。
本實(shí)驗(yàn)搭建的實(shí)驗(yàn)裝置的原理如圖3所示。
圖3 NDIR測(cè)試系統(tǒng)原理圖
圖3中,檢測(cè)系統(tǒng)的核心部件—傳感器,包括進(jìn)氣口、出氣口、紅外光源、氣室、探測(cè)器和信號(hào)處理電路等部分。
整個(gè)傳感器由MCU、光源、氣室、探測(cè)器、信號(hào)處理電路和LCD顯示屏組成。其中檢測(cè)的核心部件紅外光源和探測(cè)器的優(yōu)劣,影響整個(gè)系統(tǒng)的檢測(cè)精度。紅外光源要求輻射的光譜成分穩(wěn)定、輻射能量集中在待分析組分特征吸收波段范圍內(nèi)且紅外線應(yīng)平行于氣室的中心軸。紅外光源采用HawkEye公司生產(chǎn)的為快速電調(diào)制提供完美解決方案的IR55紅外光源,輸出光譜范圍為中紅外區(qū)2μm~20μm,而所需測(cè)量的CO、CO2、HC化合物的吸收光譜峰值主要在中紅外區(qū)3μm~5μm區(qū)域,所以IR55完全滿足紅外吸收法對(duì)混合氣體的測(cè)量要求,可以保證在3μm~5μm區(qū)域有足夠的光能量輸出。光源驅(qū)動(dòng)電路由兩級(jí)放大電路組成,通過(guò)MCU產(chǎn)生的脈沖信號(hào)對(duì)紅外光源進(jìn)行調(diào)制。探測(cè)器選用PerkinElmer公司生產(chǎn)的TPS4339熱電堆探測(cè)器,是基于熱電偶測(cè)溫原理,用于紅外光探測(cè)的2×2矩陣規(guī)則排列的4通道探測(cè)器,分別為CO檢測(cè)通道、CO2檢測(cè)通道、HC化合物檢測(cè)通道和參考通道。由許多熱電偶串聯(lián)而成,提高了探測(cè)器對(duì)紅外輻射產(chǎn)生溫度變化的響應(yīng)度;各個(gè)輸出的熱電勢(shì)疊加,因此熱電堆探測(cè)器所產(chǎn)生的熱電勢(shì)遠(yuǎn)遠(yuǎn)大于普通的熱電偶探測(cè)器;在探測(cè)節(jié)點(diǎn)處增加了光接收面的面積,可更加有效的吸收紅外光;4個(gè)熱電堆探測(cè)器分別擁有獨(dú)立的密封了不同紅外濾光片的透射窗口,相互之間沒(méi)有信號(hào)干擾,最多可同時(shí)測(cè)量4種氣體。這些特點(diǎn)使得探測(cè)器應(yīng)用于氣體檢測(cè)的信號(hào)處理能力明顯提高,分辨率和靈敏度顯著增強(qiáng),滿足氣體檢測(cè)的需要。信號(hào)調(diào)理電路包括輸入濾波電路、放大電路、穩(wěn)壓電路和輸出濾波電路。
4.2 網(wǎng)格搜索法優(yōu)化SVM及建模分析
為提高檢測(cè)精度,對(duì)不同氣體進(jìn)行獨(dú)立建模。以CO氣體為例,選擇其中的15組樣本為訓(xùn)練集,建立SVM模型并查看模型在訓(xùn)練集上的回歸效果;選擇剩余的5組樣本為測(cè)試集,用建立好的模型對(duì)測(cè)試集進(jìn)行回歸預(yù)測(cè),并驗(yàn)證SVM模型的預(yù)測(cè)精度和水平(詳情見(jiàn)表1)。模型的建立需要對(duì)懲罰參數(shù)c(選取范圍0~100)和RBF核參數(shù)g(選取范圍0~1 000)進(jìn)行合理的優(yōu)化選擇,本文采用改進(jìn)的網(wǎng)格搜索法進(jìn)行參數(shù)尋優(yōu),根據(jù)尋優(yōu)流程圖1,具體的步驟為:
(1)設(shè)定初始網(wǎng)格搜索的(c,g)范圍和步距。本實(shí)驗(yàn)設(shè)定的初始范圍c為-10~10(取以2為底的冪指數(shù)后),g為-10~10。步距設(shè)為2。
(2)采用交叉驗(yàn)證的方法,其中K取3,得到使分類準(zhǔn)確率最高的局部最優(yōu)參數(shù),c=1,g=1。
(3)在得到的局部最優(yōu)參數(shù)的附近,重新定義搜索范圍和步距,其中c為-4~4,g為-4~4,步距為0.5進(jìn)行精細(xì)化選擇。二次尋優(yōu)的結(jié)果如圖4所示。
圖4 參數(shù)選擇結(jié)果視圖
由圖4參數(shù)選擇結(jié)果圖可知,改進(jìn)的網(wǎng)格搜索法得到的最優(yōu)參數(shù)c=0.707,g=0.5,交叉驗(yàn)證的均方差為0.004 2。選定好最優(yōu)參數(shù)組合(c,g)后,便可以建立SVM回歸模型,對(duì)測(cè)試樣本進(jìn)行回歸分析,驗(yàn)證模型的準(zhǔn)確率。
圖6 CO測(cè)試集預(yù)測(cè)效果
為了驗(yàn)證模型回歸預(yù)測(cè)準(zhǔn)確度,用建立好的模型對(duì)訓(xùn)練集本身作預(yù)測(cè),如圖5所示。將模型應(yīng)用于測(cè)試集樣本的回歸分析,預(yù)測(cè)結(jié)果如圖6所示。
圖5 CO訓(xùn)練集回歸效果
由圖5可知,SVM模型對(duì)訓(xùn)練集本身做預(yù)測(cè)時(shí),預(yù)測(cè)曲線基本吻合實(shí)際濃度曲線;由圖6可以看出,將訓(xùn)練好的模型對(duì)測(cè)試集仿真預(yù)測(cè)時(shí),預(yù)測(cè)曲線能夠反映真實(shí)的濃度信息。
4.3 遺傳算法優(yōu)化BP網(wǎng)絡(luò)建模分析
按照如圖2所示的遺傳算法優(yōu)化BP網(wǎng)絡(luò)[10]的流程圖,具體的優(yōu)化步驟為:
(1)選取20組實(shí)驗(yàn)數(shù)據(jù)中的15組做訓(xùn)練樣本,剩余的5組做測(cè)試樣本,并將樣本數(shù)據(jù)進(jìn)行歸一化處理。
(2)確定BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)。本課題同時(shí)對(duì)3種組分的混合氣體進(jìn)行定量分析,針對(duì)不同氣體采用獨(dú)立建模的方法,所以設(shè)置BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)為4-7-1,即輸入層有4個(gè)節(jié)點(diǎn),隱含層有7個(gè)節(jié)點(diǎn),輸出層有1個(gè)節(jié)點(diǎn)。
(3)初始化網(wǎng)絡(luò),得到網(wǎng)絡(luò)的初始權(quán)值和閥值。
(4)設(shè)置適應(yīng)度函數(shù)為訓(xùn)練數(shù)據(jù)預(yù)測(cè)誤差絕對(duì)值的和。
(5)初始化種群,種群規(guī)模選取10~30為宜,本實(shí)驗(yàn)選擇20;迭代次數(shù)為100代;交叉概率選在0~1之間,本文選擇0.2;變異概率選擇0.1。
(6)根據(jù)兩個(gè)參數(shù)的優(yōu)化范圍對(duì)粒子群的初始位置和速度進(jìn)行初始化。個(gè)體被選擇的概率pi為:
(4)
交叉概率:例如第m個(gè)染色體am與第n個(gè)染色體an在l位進(jìn)行交叉,則
(5)
式中:b為(0~1)之間的隨機(jī)小數(shù)。
變異概率:以第m個(gè)個(gè)體的第i個(gè)染色體ami為例,則
(6)式中:amax為ami的上限,amin為ami的下限;f(g)=r2(1-g/G)2;r2為隨機(jī)數(shù),g為當(dāng)前的迭代次數(shù),G為設(shè)定的迭代次數(shù);r為(0~1)之間的隨機(jī)小數(shù)。
(7)優(yōu)化流程的結(jié)束條件為模型預(yù)測(cè)誤差和為0或者迭代次數(shù)達(dá)到設(shè)定值。未達(dá)到結(jié)束條件則轉(zhuǎn)第6步。
把遺傳算法得到的最優(yōu)個(gè)體賦給BP神經(jīng)網(wǎng)絡(luò),對(duì)訓(xùn)練集進(jìn)行訓(xùn)練,建立神經(jīng)網(wǎng)絡(luò)回歸模型,之后對(duì)測(cè)試集進(jìn)行回歸分析,得到測(cè)試集的模型預(yù)測(cè)結(jié)果。
根據(jù)圖2優(yōu)化流程計(jì)算,可得到如圖7所示的遺傳算法優(yōu)化過(guò)程最優(yōu)個(gè)體適應(yīng)度值變化曲線。橫軸為優(yōu)化代數(shù),縱軸為適應(yīng)度值。
由圖7看出,最優(yōu)個(gè)體的適應(yīng)度值從最高的0.682遞減至最低的0.131,大約在迭代60次之后便趨于穩(wěn)定狀態(tài)。將優(yōu)化得到的最優(yōu)個(gè)體賦給BP神經(jīng)網(wǎng)絡(luò),用訓(xùn)練數(shù)據(jù)訓(xùn)練100次之后,可以得到模型在訓(xùn)練樣本和測(cè)試樣本的預(yù)測(cè)結(jié)果,如圖8和圖9所示。
由圖8可以看出利用訓(xùn)練集建立的模型對(duì)CO訓(xùn)練集本身做預(yù)測(cè)時(shí),模型預(yù)測(cè)曲線和CO實(shí)際濃度值具有較大的偏差,誤差明顯;將模型應(yīng)用于CO測(cè)試集的預(yù)測(cè),如圖9所示,誤差很大,預(yù)測(cè)曲線不能準(zhǔn)確地逼近真實(shí)濃度。
圖7 最優(yōu)個(gè)體適應(yīng)度值變化圖
圖8 CO訓(xùn)練集回歸效果
圖9 CO測(cè)試集預(yù)測(cè)效果
圖10 CO預(yù)測(cè)誤差曲線
4.4 仿真分析
將SVM建模仿真誤差曲線與遺傳優(yōu)化的BP網(wǎng)絡(luò)建模仿真誤差曲線,繪制如圖10所示。
由圖10可以看出,兩條誤差曲線相比,SVM模型預(yù)測(cè)誤差明顯減小,說(shuō)明本實(shí)驗(yàn)建立的SVM模型預(yù)測(cè)精度較高。
同樣地,可以得到兩種分析模型對(duì)其他氣體的仿真預(yù)測(cè)結(jié)果及平均絕對(duì)誤差,見(jiàn)表1。兩種優(yōu)化方法的結(jié)果對(duì)比表,如表2所示。
表1 仿真結(jié)果對(duì)比
表2 尋優(yōu)結(jié)果對(duì)比
由表1、表2可以看出:兩種方法建立的氣體定量分析模型的測(cè)試誤差水平,SVM建模優(yōu)于遺傳算法優(yōu)化BP網(wǎng)絡(luò)。采用網(wǎng)格搜索法優(yōu)化的SVM,建模所需時(shí)間平均為39.824 s,而遺傳算法優(yōu)化BP網(wǎng)絡(luò)的建模時(shí)間為2 682 s,因此SVM建模方法在處理氣體定量分析問(wèn)題上,收斂速度更快,且精度水平更高。
本文將改進(jìn)的網(wǎng)格搜索法用于SVM建模的參數(shù)尋優(yōu),對(duì)濃度范圍在0.5%~8%的CO、3.6%~12.5%的CO2及200×10-6~3 270×10-6的C3H83種組分混合氣體進(jìn)行定量分析,選取其中15組樣本作為訓(xùn)練集,建立了SVM回歸模型,并對(duì)訓(xùn)練集進(jìn)行預(yù)測(cè)分析,以檢測(cè)模型的準(zhǔn)確度;選擇剩余的5組氣體樣本作為驗(yàn)證集,驗(yàn)證模型的預(yù)測(cè)精度和水平。在SVM參數(shù)的選取問(wèn)題上,提出了改進(jìn)的網(wǎng)格搜索參數(shù)尋優(yōu)法,與遺傳算法優(yōu)化BP網(wǎng)絡(luò)建模相比,SVM建模時(shí)間為39.824 s,BP網(wǎng)絡(luò)為2 682 s;SVM預(yù)測(cè)平均方差為0.020 1,BP網(wǎng)絡(luò)為0.035 2,SVM精度水平明顯高于BP網(wǎng)絡(luò)。因此,將網(wǎng)格搜索法與SVM相結(jié)合更適合處理混合氣體的定量分析,在智能檢測(cè)領(lǐng)域有一定的挖掘空間。
[1] 楊永杰,張?jiān)?楊賽程,等. 一種PM2.5檢測(cè)傳感器設(shè)計(jì)[J]. 傳感器與微系統(tǒng),2014,33(3):76-78,81.
[2] 曲健,陳紅巖,劉文貞,等. 基于改進(jìn)網(wǎng)格搜索法的支持向量機(jī)在氣體定量分析中的應(yīng)用[J]. 傳感技術(shù)學(xué)報(bào),2015,28(5):774-778.
[3] 耿志廣,王希武,王寅龍,等. 基于人工神經(jīng)網(wǎng)絡(luò)的電子鼻對(duì)混合氣體檢測(cè)研究[J]. 現(xiàn)代計(jì)算機(jī)(專業(yè)版),2010,(5):45-48.
[4] 黃小燕,趙向陽(yáng),方智勇. 電子鼻在氣體檢測(cè)中的應(yīng)用研究[J]. 傳感器與微系統(tǒng),2008,27(6):47-49,52.
[5] 曲健,陳紅巖,劉文貞,等. 基于自適應(yīng)變異粒子群優(yōu)化的SVM在混合氣體分析中的應(yīng)用[J]. 傳感技術(shù)學(xué)報(bào),2015,28(8):774-778.
[6] 李玉軍,湯曉君,劉君華. 基于粒子群優(yōu)化的最小二乘支持向量機(jī)在混合氣體定量分析中的應(yīng)用[J]. 光譜學(xué)與光譜分析,2010,30(3):774-778.
[7] 陳桄紅,徐科軍,陶波波,等. 不分光紅外氣體分析儀信號(hào)處理與控制系統(tǒng)研究與設(shè)計(jì)[J]. 電子測(cè)量與儀器學(xué)報(bào),2013,27(11):1040-1046.
[8] 王興玲,李占斌. 基于網(wǎng)格搜索的支持向量機(jī)核函數(shù)參數(shù)的確定[J]. 中國(guó)海洋大學(xué)學(xué)報(bào),2005,35(5):859-862.
[9] 馬永杰,云文霞. 遺傳算法研究進(jìn)展[J]. 計(jì)算機(jī)應(yīng)用研究,2012,29(4):1201-1206,1210.
[10] 袁力哲,楊憲江,王宇. 基于自適應(yīng)遺傳BP算法的混合氣體定量檢測(cè)研究[J]. 儀表技術(shù)與傳感器,2013,(6):118-120.
System of Quantitative Detecting Multi-Component Automotive Exhaust*
ZHANGZhigang1,CHENHongyan2*,QUJian2
(1.Department of Automobile Technology,Zhejiang Agricultural Business College,Shaoxing Zhejiang 312088,China;2.College of Mechanical and Electrical Engineering,China Jiliang University,Hangzhou 310018,China)
For the problems of the quantitative analysis of mixed gas,it is difficult to calculate excessive data in infrared spectroscopy,as well as crosstalk between gases and other issues. A solution of improved grid search optimized SVM was proposed. It was to establish the models of a multi-component mixture gases quantitative analysis based on infrared spectroscopy.Then the related parameters are optimized based on the method of improved grid search,and compared to the effects of BP neural network optimized by genetic algorithm. Experiments show that the time of modeling by SVM was about 39.824 s,and optimized BP network is 2 682 s;and the prediction MSE of SVM was significantly less than BP. The time of modeling by SVM was about 1/60 of BP,convergence is faster and forecasting accurate is higher.
gas detection;quantitative analysis;SVM;BP neural network;cross interference
項(xiàng)目來(lái)源:浙江農(nóng)業(yè)商貿(mào)職業(yè)學(xué)院2015年度科研項(xiàng)目(KY201533)
2016-05-03 修改日期:2016-07-19
TH744
A
1005-9490(2017)03-0773-06
C:7230;4145
10.3969/j.issn.1005-9490.2017.03.050