曲 健,陳紅巖,劉文貞,張 兵,李志彬
(中國(guó)計(jì)量學(xué)院機(jī)電工程學(xué)院,杭州310018)
基于自適應(yīng)變異粒子群優(yōu)化的SVM在混合氣體分析中的應(yīng)用
曲 健,陳紅巖*,劉文貞,張 兵,李志彬
(中國(guó)計(jì)量學(xué)院機(jī)電工程學(xué)院,杭州310018)
針對(duì)混合氣體定量分析中,支持向量機(jī)建模的參數(shù)難以確定、紅外光譜數(shù)據(jù)計(jì)算量過(guò)大以及氣體間交叉干擾等問(wèn)題。提出了一種自適應(yīng)變異粒子群優(yōu)化的支持向量機(jī)方法,用于建立基于紅外光譜的多組分混合氣體定量分析模型。混合氣體主要由濃度范圍在0.5%~8%的CO、3.6%~12.5%的CO2及200×10-6~3270×10-6的C3H8三種組分氣體組成。利用粒子群優(yōu)化算法對(duì)支持向量機(jī)建模中的參數(shù)進(jìn)行優(yōu)化選擇,并與遺傳算法優(yōu)化的支持向量機(jī)作對(duì)比。實(shí)驗(yàn)表明,采用此方法建模所用時(shí)間為39.524 s,遺傳算法為26.272 s;針對(duì)CO2獨(dú)立建模的預(yù)測(cè)結(jié)果,粒子群優(yōu)化算法均方差為0.000 123 758,遺傳算法均方差為2.14952。在建模時(shí)間略高的情況下,粒子群優(yōu)化算法預(yù)測(cè)結(jié)果均方差明顯低于遺傳算法。
傳感器應(yīng)用;支持向量機(jī);粒子群優(yōu)化;遺傳算法;定量分析
機(jī)動(dòng)車(chē)尾氣排放已經(jīng)成為污染環(huán)境的重要因素,尾氣排放的氣體主要有CO、NO、CO2、HC化合物等。在混合氣體定量分析方法中,主要采用紅外光譜吸收法。對(duì)光譜的分析方法主要有棱鏡和光柵光譜儀,但它屬于單通道測(cè)量,不能同時(shí)進(jìn)行多通道的測(cè)量;傅里葉變換紅外光譜儀,可進(jìn)行多通道的測(cè)量,光通量高,儀器靈敏度高,波數(shù)值的精確度高,但兩種光譜分析儀都不便于攜帶,不能進(jìn)行隨車(chē)式檢測(cè)。本實(shí)驗(yàn)采用的紅外吸收法,可以應(yīng)用于隨車(chē)式汽車(chē)尾氣傳感器中,對(duì)車(chē)輛尾氣排放進(jìn)行動(dòng)態(tài)實(shí)時(shí)檢測(cè)。由于組分氣體間交叉吸收干擾、傳感器選擇性能不一、溫度的變化以及供電電壓的波動(dòng)等因素,導(dǎo)致測(cè)量的精度很低,無(wú)法對(duì)汽車(chē)尾氣排放進(jìn)行有效的檢測(cè)和監(jiān)督,需要后續(xù)的數(shù)據(jù)處理。
提高混合氣體測(cè)量精度的方法主要有人工神經(jīng)網(wǎng)絡(luò)[1-2](Artificial Neural Network,ANN)方法和支持向量機(jī)[3-5](Support Vector Machine,SVM)方法等。其中,耿志廣[1]等人將人工神經(jīng)網(wǎng)絡(luò)與氣體傳感器陣列技術(shù)相結(jié)合,克服了傳感器陣列在混合氣體檢測(cè)中的交叉敏感現(xiàn)象;金翠云[6]等利用粒子群優(yōu)化算法對(duì)支持向量機(jī)進(jìn)行參數(shù)優(yōu)化,并應(yīng)用于電子鼻氣體定量分析中,得到了最優(yōu)參數(shù)組合,進(jìn)一步提高了預(yù)測(cè)精度;李玉軍[7]等人將粒子群優(yōu)化與最小支持二乘向量機(jī)相結(jié)合,建立混合氣體定量分析模型,并與遍歷優(yōu)化算法相比較,尋優(yōu)時(shí)間節(jié)省40倍以上,預(yù)測(cè)結(jié)果誤差水平相當(dāng);Manouchehrian Amin[8]等運(yùn)用基于遺傳算法尋優(yōu)方法的支持向量機(jī),建立回歸模型,預(yù)測(cè)巖石的強(qiáng)度和可變性屬性。神經(jīng)網(wǎng)絡(luò)算法的收斂性及預(yù)測(cè)的準(zhǔn)確度受初始權(quán)值和閥值的選擇影響很大,因此輸出具有不一致性,容易陷入局部極小值。而支持向量機(jī)算法可以有效地避免上述問(wèn)題。
本文針對(duì)紅外光譜特征吸收譜線重疊嚴(yán)重的多組分混合氣體,以SVM為基礎(chǔ)對(duì)濃度范圍在0.5%~8%的CO、3.6%~12.5%的CO2及200×10-6~3 270×10-6的C3H83種組分氣體組成的20組混合氣體樣本進(jìn)行獨(dú)立建模定量分析,選取其中15組樣本作為訓(xùn)練集,建立SVM回歸校正模型,并對(duì)訓(xùn)練集進(jìn)行預(yù)測(cè)分析,以檢測(cè)模型的準(zhǔn)確度;選擇剩余的5組氣體樣本作為驗(yàn)證集,驗(yàn)證模型的預(yù)測(cè)精度和水平。在SVM參數(shù)的優(yōu)選問(wèn)題上,提出了自適應(yīng)變異粒子群優(yōu)化算法。并與基于遺傳算法的參數(shù)優(yōu)選相比較。
SVM[9]算法是根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則[10]設(shè)計(jì)的一種統(tǒng)計(jì)學(xué)習(xí)理論,具有模型推廣性能好、小樣本學(xué)習(xí)能力強(qiáng)以及高維數(shù)據(jù)處理能力強(qiáng)等優(yōu)點(diǎn)。SVM回歸校正模型,就是利用SVM核函數(shù),將混合氣體紅外光譜輸入數(shù)據(jù)利用非線性映射Φ,映射到高維空間,然后在高維空間進(jìn)行回歸分析,建立紅外光譜數(shù)據(jù)與待測(cè)組分氣體濃度的回歸校正模型。
將已知組分濃度的混合氣體樣本紅外光譜數(shù)據(jù)作為訓(xùn)練集T={(x1,y1),…,(xN,yN)}∈(Rn×R)N,其中xi∈Rn為第i個(gè)數(shù)據(jù)樣本,xi=(x1,x2,…,xL)為在掃描波長(zhǎng)范圍內(nèi)L個(gè)光譜數(shù)據(jù),yi∈Rn為對(duì)應(yīng)的混合氣體的組分濃度值,i=1,2,…N。在高維空間需要求解的光譜數(shù)據(jù)樣本與混合氣體組分濃度的回歸函數(shù) f(xi)可表示為如下形式:
式中:ω·?(xi)為向量ω與?(xi)的內(nèi)積;ω為回歸系數(shù),b為閥值。
在此引入松弛變量ξ,ξ*≥0來(lái)求解ω與b,,根據(jù)SRM準(zhǔn)則,將式(1)轉(zhuǎn)換為凸二次規(guī)劃問(wèn)題:
式中,C為懲罰參數(shù),ε為回歸函數(shù)結(jié)果與待測(cè)氣體樣本的誤差精度。
引入Lagrange函數(shù)求解式(2),通過(guò)核函數(shù)k(xi,xj)將高維空間的內(nèi)積運(yùn)算轉(zhuǎn)換在原二維空間計(jì)算,有:
得到的SVM回歸校正模型的回歸函數(shù)為:
式中,若αi不為零或者αi*不為零,表示此樣本即為支持向量。
常用的核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)、徑向基(RBF)核函數(shù)、Sigmoid核函數(shù)。由于Gauss函數(shù)能較好的模擬光譜信號(hào),所以本文選用RBF核函數(shù)。其表達(dá)式如下:
式中,參數(shù)g為gamma參數(shù)函數(shù)設(shè)置(若k為屬性的數(shù)目,則g默認(rèn)為1/k)。
粒子群優(yōu)化算法[11-12](Particle Swarm Optimization,PSO)是計(jì)算智能領(lǐng)域,除蟻群算法、魚(yú)群算法之外的一種群體智能的優(yōu)化算法。其基本思想是通過(guò)群里中個(gè)體之間的信息傳遞及信息共享來(lái)尋找最優(yōu)解。
假設(shè)在一個(gè)D維的空間中,有n個(gè)粒子組成的種群X=(X1,X2,…,Xn),其中Xi=[xi1,xi2…,xiD]T為第i個(gè)粒子在D維搜索空間的位置,亦代表問(wèn)題的一個(gè)潛在解。根據(jù)目標(biāo)函數(shù)可以計(jì)算出每個(gè)粒子位置Xi對(duì)應(yīng)的適應(yīng)度值。第i個(gè)粒子的速度為Vi= [Vi1,Vi2…,ViD]T,其個(gè)體極值為 Pi=[Pi1,Pi2…,PiD]T,種群的全局極值為Pg=[Pg1,Pg2…,PgD]T。
在每一次迭代過(guò)程中,粒子通過(guò)個(gè)體極值和全局極值更新自己的速度和位置,更新公式為:
式中∶ω為慣性權(quán)重因子,其值非負(fù),值的大小影響整體的尋優(yōu)能力;i=1,2,…,n,n為群體中粒子總數(shù);d=1,2,…,D,表示維數(shù);k為當(dāng)前迭代次數(shù);Vid為粒子速度;Xid為粒子位置;c1和c2為加速度因子,通常在0~2之間取值,本實(shí)驗(yàn)中取c1=1.5,c2=1.7;r1和r2為分布在[0-1]之間的隨機(jī)數(shù)。
粒子群優(yōu)化算法收斂快,但存在著容易早熟收斂、搜索精度較低、后期迭代效率不高等缺點(diǎn)。因此,本文提出了自適應(yīng)變異[13-14]的粒子群優(yōu)化算法,指通過(guò)一定的準(zhǔn)則和判定條件對(duì)相應(yīng)的粒子采取變異操作,產(chǎn)生新的粒子,引導(dǎo)種群向最優(yōu)解方向收斂。自適應(yīng)變異操作拓展了在迭代中不斷縮小的種群搜索空間,使粒子可以跳出之前搜索到的最優(yōu)值位置,在更大的空間展開(kāi)搜索,同時(shí)保持了種群的多樣性,提高了算法尋找到最優(yōu)質(zhì)的可能性。其基本思想就是在粒子每次更新之后,以一定概率重新初始化粒子。
本實(shí)驗(yàn)采用不分光紅外法(NDIR)對(duì)含CO、CO2和C3H8化合物的混合氣體濃度進(jìn)行檢測(cè)。紅外光源采用HawkEye公司生產(chǎn)的為快速電調(diào)制提供完美解決方案的IR55紅外光源,輸出光譜范圍為中紅外區(qū)2 μm~20 μm,而所需測(cè)量的CO、CO2、HC化合物的吸收光譜峰值主要在中紅外區(qū)3 μm~5 μm區(qū)域,所以IR55完全滿足紅外吸收法對(duì)混合氣體的測(cè)量要求,可以保證在3 μm~5 μm區(qū)域有足夠的光能量輸出。通過(guò)MCU產(chǎn)生的脈沖信號(hào)對(duì)紅外光源進(jìn)行調(diào)制,使其產(chǎn)生3 μm~5 μm范圍的連續(xù)紅外光,通過(guò)一定長(zhǎng)度的氣室內(nèi),氣室中充有待測(cè)濃度的多組分混合氣體。由于混合氣體中各組分對(duì)紅外線波段中特征波長(zhǎng)紅外線能量的吸收,特定波長(zhǎng)范圍的光源通過(guò)氣體后,在相應(yīng)氣體的吸收譜線處會(huì)發(fā)生光強(qiáng)的衰減,紅外線的能量將減少。探測(cè)器的4個(gè)通道分別為CO檢測(cè)通道、CO2檢測(cè)通道、HC化合物檢測(cè)通道和參考通道。參考通道用來(lái)獲得其他波長(zhǎng)的光無(wú)吸收時(shí)的光能量,然后對(duì)各光路的輸出進(jìn)行作比運(yùn)算,減少由于光源的發(fā)射功率起伏和探測(cè)器靈敏度不穩(wěn)定引起的測(cè)量誤差,使得到的計(jì)算結(jié)果與光源發(fā)射和探測(cè)器無(wú)關(guān),只與氣體的濃度和氣室的長(zhǎng)度有關(guān)。每個(gè)通道檢測(cè)對(duì)應(yīng)氣體吸收后剩余光強(qiáng)度并轉(zhuǎn)化為3組不同的電信號(hào),與參考通道的輸出作比后,經(jīng)放大濾波作為模型的輸入。整個(gè)測(cè)試系統(tǒng)的原理如圖1所示。
圖1 NDIR測(cè)試系統(tǒng)原理圖
圖1中,所選探測(cè)器是PerkinElmer公司生產(chǎn)的TPS4339熱電堆探測(cè)器,是基于熱電偶測(cè)溫原理,用于紅外光探測(cè)的2×2矩陣規(guī)則排列的4通道探測(cè)器,如圖2所示。由許多熱電偶串聯(lián)而成,提高了探測(cè)器對(duì)紅外輻射產(chǎn)生溫度變化的響應(yīng)度;各個(gè)輸出的熱電勢(shì)疊加,因此熱電堆探測(cè)器所產(chǎn)生的熱電勢(shì)遠(yuǎn)遠(yuǎn)大于普通的熱電偶探測(cè)器;在探測(cè)節(jié)點(diǎn)處增加了光接收面的面積,可更加有效的吸收紅外光;4個(gè)熱電堆探測(cè)器分別擁有獨(dú)立的密封了不同紅外濾光片的透射窗口,相互之間沒(méi)有信號(hào)干擾,通過(guò)在每個(gè)熱電堆探測(cè)器前面的窗口處安裝不同的紅外濾光片,最多可同時(shí)測(cè)量四種氣體。要同時(shí)測(cè)量的3種氣體分別為:CO、CO2和HC化合物,通過(guò)氣體吸收光譜分析,選擇氣體通道的濾光片濾波范圍分別為:4.66 μm+0.015 nm、4.43 μm+40 nm、3.46 μm+50 nm;參考通道濾波范圍:3.93 μm+50 nm。這些特點(diǎn)使得探測(cè)器應(yīng)用于氣體檢測(cè)的信號(hào)處理能力明顯提高,分辨率顯著增強(qiáng),滿足氣體檢測(cè)的需要。
圖2 TPS4339頂部視圖
本實(shí)驗(yàn)以2×2探測(cè)器對(duì)含CO、CO2和C3H8的三種混合氣體進(jìn)行定量分析。所測(cè)混合氣體為0.5%~8%的CO,3.6%~12.5%的CO2,和200×10-6~3 270×10-6的C3H8。為了便于數(shù)據(jù)處理,對(duì)標(biāo)準(zhǔn)濃度進(jìn)行歸一化處理,便是模型的期望輸出。為提高檢測(cè)精度,針對(duì)不同氣體采用獨(dú)立建模的方法。選擇其中的15組樣本為訓(xùn)練集,建立SVM模型并查看模型在訓(xùn)練集上的回歸效果;選擇剩余的5組樣本為測(cè)試集,用建立好的模型對(duì)測(cè)試集進(jìn)行回歸預(yù)測(cè),并驗(yàn)證SVM模型的預(yù)測(cè)精度和水平(詳情見(jiàn)表3)。模型的建立需要對(duì)懲罰參數(shù)c(選取范圍0~100)和RBF核參數(shù)g(選取范圍0~1 000)進(jìn)行合理的優(yōu)化選擇,本文采用自適應(yīng)變異粒子群優(yōu)化算法進(jìn)行參數(shù)尋優(yōu),具體的優(yōu)化流程如圖3所示。
圖3 自適應(yīng)變異PSO參數(shù)優(yōu)化流程圖
優(yōu)化流程為:①選取20組實(shí)驗(yàn)數(shù)據(jù)中的15組做訓(xùn)練樣本,剩余的5組做測(cè)試樣本;②初始化參數(shù)c和g,建立SVM回歸模型;③由于每個(gè)粒子群只能優(yōu)化一個(gè)參數(shù),因此設(shè)置粒子群的維數(shù)為2,每維粒子群中粒子的數(shù)目選取10~30為宜,本實(shí)驗(yàn)選擇20。迭代次數(shù)為200代。根據(jù)兩個(gè)參數(shù)的優(yōu)化范圍對(duì)粒子群的初始位置和速度進(jìn)行初始化;④設(shè)置適應(yīng)度函數(shù)為模型預(yù)測(cè)結(jié)果的均方差;⑤將粒子適應(yīng)度值進(jìn)行橫向或縱向比較后獲得當(dāng)前群體的最優(yōu)位置。根據(jù)式(7)及式(8)更新粒子的速度和位置;⑥優(yōu)化流程的結(jié)束條件為模型預(yù)測(cè)結(jié)果均方差為0或者迭代次數(shù)達(dá)到設(shè)定值。未達(dá)到結(jié)束條件則轉(zhuǎn)第4步。
選定好最優(yōu)參數(shù)組合(c,g)后,對(duì)訓(xùn)練集進(jìn)行訓(xùn)練,建立SVM回歸模型,之后對(duì)測(cè)試集進(jìn)行回歸分析,得到測(cè)試集的模型預(yù)測(cè)結(jié)果。
為提高模型預(yù)測(cè)精度,本實(shí)驗(yàn)針對(duì)不同組分氣體采用獨(dú)立建模的方法,因此在應(yīng)用自適應(yīng)變異粒子群優(yōu)化算法對(duì)SVM的參數(shù)優(yōu)選的過(guò)程中,應(yīng)針對(duì)不同氣體分別優(yōu)化,在本實(shí)驗(yàn)中即分別優(yōu)化CO、CO2和C3H8化合物的模型參數(shù)。以CO氣體分析模型參數(shù)優(yōu)化為例,選取粒子群維數(shù)為2,種群數(shù)量20,粒子群優(yōu)化迭代次數(shù)200代,ω取初值為0.9,終止值為0.4,根據(jù)線性遞減慣性權(quán)重(Linear Decreasing Inertia Weight,LDIW)進(jìn)行調(diào)整,學(xué)習(xí)因子c1=1.5,c2=1.7。根據(jù)圖3參數(shù)優(yōu)化流程計(jì)算,可得到如圖4所示的粒子群優(yōu)化誤差曲線。橫軸為優(yōu)化代數(shù),縱軸為適應(yīng)度值,即模型測(cè)試樣本計(jì)算結(jié)果的均方誤差。
由圖4可以看出,粒子的適應(yīng)度值基本在0.01~0.05之間很小的范圍內(nèi),即模型預(yù)測(cè)結(jié)果的平均絕對(duì)誤差很小,在4%以下,滿足尾氣檢測(cè)標(biāo)準(zhǔn)的要求。優(yōu)化200代所用時(shí)間為10.859 8 s,最優(yōu)c為39.315 2,最優(yōu)g為0.178 55。將得到的最優(yōu)參數(shù)組合(c,g)代入支持向量機(jī)重建傳感器模型,可以得到模型在訓(xùn)練樣本和測(cè)試樣本的預(yù)測(cè)結(jié)果,如圖5、圖6所示。其中訓(xùn)練樣本的測(cè)試結(jié)果均方差為5.30263×10-5,測(cè)試樣本預(yù)測(cè)結(jié)果的均方差為0.000 107 812。
圖4 自適應(yīng)變異PSO參數(shù)尋優(yōu)結(jié)果圖(CO)
由圖5可以看出利用訓(xùn)練集建立的模型對(duì)CO訓(xùn)練集本身做預(yù)測(cè)時(shí),模型預(yù)測(cè)值和CO實(shí)際濃度值很好地吻合,誤差極?。粚⒛P蛻?yīng)用于CO測(cè)試集的預(yù)測(cè),如圖6所示,效果明顯,曲線很好地逼近真實(shí)濃度,說(shuō)明本實(shí)驗(yàn)建立的模型預(yù)測(cè)精度高,可應(yīng)用于混合氣體中CO氣體的回歸預(yù)測(cè)。
同樣的,可以得到經(jīng)過(guò)自適應(yīng)變異PSO優(yōu)化建立其他氣體模型所用時(shí)間、最優(yōu)參數(shù)和訓(xùn)練集、測(cè)試集預(yù)測(cè)結(jié)果均方誤差如表1所示。根據(jù)尋優(yōu)結(jié)果建立的混合氣體定量分析模型測(cè)試數(shù)據(jù)仿真結(jié)果如表3所示。若采用遺傳算法[15]對(duì)SVM進(jìn)行參數(shù)尋優(yōu),需要將解空間映射到編碼空間,每個(gè)編碼對(duì)應(yīng)問(wèn)題的一個(gè)潛在解。這里,將編碼長(zhǎng)度設(shè)置為3,每一位對(duì)應(yīng)一個(gè)輸入自變量(探測(cè)器檢測(cè)的CO、CO2、C3H8),每一位的基因取值只有1和0兩種情況。選取訓(xùn)練集樣本均方差作為遺傳算法的適應(yīng)度函數(shù),經(jīng)過(guò)不斷地迭代進(jìn)化,最終找到最優(yōu)解。本實(shí)驗(yàn)設(shè)定迭代次數(shù)200代,種群規(guī)模為20。尋優(yōu)的流程如圖7所示。以CO樣本為例,選擇同PSO優(yōu)化相同的訓(xùn)練集,最終尋優(yōu)結(jié)果曲線如圖8所示。
圖5 CO訓(xùn)練集實(shí)際濃度和預(yù)測(cè)對(duì)比圖
圖6 CO測(cè)試集實(shí)際濃度和預(yù)測(cè)對(duì)比圖
表1 PSO尋優(yōu)結(jié)果對(duì)比
圖7 遺傳算法尋優(yōu)流程圖
由圖8可以看到,CO訓(xùn)練集整個(gè)優(yōu)化過(guò)程,適應(yīng)度值變化比較大,平均適應(yīng)度值最高達(dá)到0.08,最低達(dá)到0;最佳適應(yīng)度值從0.03開(kāi)始陡降,在大約12代趨于穩(wěn)定,尋優(yōu)終止于100代,所需時(shí)間約為14.644 s,最優(yōu)c為1.470 3,最優(yōu)g為0.222 21。將得到的最優(yōu)參數(shù)組合(c,g)代入支持向量機(jī)重建傳感器模型,可以得到訓(xùn)練樣本的測(cè)試結(jié)果均方差為4.612 27×10-5,測(cè)試樣本預(yù)測(cè)結(jié)果的均方差為0.000 1627 08。
圖8 遺傳算法參數(shù)尋優(yōu)結(jié)果圖(CO)
同樣的,可以得到經(jīng)過(guò)遺傳算法優(yōu)化建立其他氣體模型所用時(shí)間、最優(yōu)參數(shù)和訓(xùn)練集、測(cè)試集預(yù)測(cè)結(jié)果均方誤差如表2所示。根據(jù)尋優(yōu)結(jié)果建立的混合氣體定量分析模型測(cè)試數(shù)據(jù)仿真結(jié)果如表3所示。
表2 遺傳算法尋優(yōu)結(jié)果對(duì)比
表3 仿真結(jié)果對(duì)比圖
由表1~表3中的數(shù)據(jù)可以看出:兩種方法建立的氣體定量分析模型的測(cè)試誤差水平是不相同的。遺傳算法優(yōu)化建立的CO2氣體定量分析模型的誤差很大,說(shuō)明在進(jìn)行混合氣體獨(dú)立建模的過(guò)程中,遺傳算法并不能準(zhǔn)確的預(yù)測(cè)出CO2組分。自適應(yīng)變異粒子群優(yōu)化建立的三組分混合氣體定量分析模型可以很好地預(yù)測(cè)混合氣體中各組分氣體的濃度,誤差很小,建模所需時(shí)間為39.524s。
因此將自適應(yīng)變異粒子群優(yōu)化算法結(jié)合SVM建立多組分混合氣體定量分析模型是有效可行的。粒子群優(yōu)化算法實(shí)現(xiàn)簡(jiǎn)單、優(yōu)化率高,通過(guò)信息共享縮短了尋優(yōu)時(shí)間,提高了收斂速度;通過(guò)自適應(yīng)變異,跳出局部最優(yōu),保證在全局范圍內(nèi)找到最優(yōu)解。
本文將自適應(yīng)變異粒子群優(yōu)化算法應(yīng)用于支持向量機(jī)的參數(shù)尋優(yōu),對(duì)濃度范圍在0.5%~8%的CO、3.6%~12.5%的CO2及200×10-6~3 270×10-6的C3H83種組分混合氣體進(jìn)行定量分析,選取其中15組樣本作為訓(xùn)練集,建立了SVM回歸模型,并對(duì)訓(xùn)練集進(jìn)行預(yù)測(cè)分析,以檢測(cè)模型的準(zhǔn)確度;選擇剩余的5組氣體樣本作為驗(yàn)證集,驗(yàn)證模型的預(yù)測(cè)精度和水平。在SVM參數(shù)的選取問(wèn)題上,提出了自適應(yīng)變異粒子群參數(shù)尋優(yōu)法,對(duì)各組分氣體采取獨(dú)立建模的方式。與啟發(fā)式遺傳算法相比,在尋優(yōu)時(shí)間相差不大的情況下,測(cè)試結(jié)果均方差明顯小于遺傳算法。其中,粒子群優(yōu)化建模所用時(shí)間為39.524 s,遺傳算法為26.272 s;粒子群優(yōu)化訓(xùn)練集預(yù)測(cè)結(jié)果均方差分別為:CO,5.302 63×10-5;CO2,0.000 123 758;C3H8,9.569 22×10-5。粒子群建模對(duì)測(cè)試集的預(yù)測(cè)結(jié)果均方差分別為:CO,0.000 107 812;CO2,0.000 221 996;C3H8,0.000 226 165。遺傳算法優(yōu)化訓(xùn)練集預(yù)測(cè)結(jié)果均方差分別為:CO,4.612 27×10-5;CO2,2.149 52;C3H8,3.719 87×10-5。遺傳算法建模對(duì)測(cè)試集的預(yù)測(cè)結(jié)果均方差分別為:CO,0.000 162 708;CO2,2.146 01;C3H8,3.970 9×10-5。可以看出,雖然PSO尋優(yōu)時(shí)間長(zhǎng)于遺傳算法,但是預(yù)測(cè)精度卻高于遺傳算法,特別是針對(duì)CO2獨(dú)立建模的預(yù)測(cè)結(jié)果,犧牲一點(diǎn)時(shí)間而提高測(cè)量精度在實(shí)驗(yàn)中是可以接受的。因此,將自適應(yīng)變異粒子群優(yōu)化與SVM相結(jié)合建立多組分混合氣體紅外光譜的定量分析模型具有一定的發(fā)展?jié)摿涂赏诰蚩臻g。
[1]余大洲.基于RBF神經(jīng)網(wǎng)絡(luò)的可燃?xì)怏w檢測(cè)系統(tǒng)的研究[D].長(zhǎng)安大學(xué),2014.
[2]耿志廣,王希武,王寅龍,等.基于人工神經(jīng)網(wǎng)絡(luò)的電子鼻對(duì)混合氣體檢測(cè)研究[J].現(xiàn)代計(jì)算機(jī):專業(yè)版,2010(5):45-48.
[3]喬聰明.PLS-SVR的三組分混合氣體定量分析[J].太原理工大學(xué)學(xué)報(bào),2014,45(1):120-122,127.
[4]張愉,童敏明,戴桂平.基于OBLPSO-LSSVM的一氧化碳濃度檢測(cè)[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(24):249-252,261.
[5]張其林.基于支持向量機(jī)的紅外光譜混合氣體組分分析[J].計(jì)算機(jī)時(shí)代,2010(1):9-11.
[6]金翠云,崔瑤,王穎.粒子群優(yōu)化的SVM算法在氣體分析中的應(yīng)用[J].電子測(cè)量與儀器學(xué)報(bào),2012,26(7):635-639.
[7]李玉軍,湯曉君,劉君華.基于粒子群優(yōu)化的最小二乘支持向量機(jī)在混合氣體定量分析中的應(yīng)用[J].光譜學(xué)與光譜分析,2010,30(3):774-778.
[8]Manouchehrian Amin,Sharifzadeh Mostafa,Hamidzadeh,et al.Selection of Regression Models for Predicting Strength and Deformability Properties of Rocks Using GA[J].International Journal of Mining Science and Technology,2013,23(4):492-498.
[9]宋召青,崔和,胡云安.支持向量機(jī)理論的研究與進(jìn)展[J].海軍航空工程學(xué)院學(xué)報(bào),2008,23(2):143-148,152.
[10]孫小慧,孫恒,吳濤.粗糙隨機(jī)樣本的結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則[J].周口師范學(xué)院學(xué)報(bào),2012,29(5):7-12,17.
[11]付華,王馨蕊,楊本臣,等.基于MPSO-CWLS-SVM的瓦斯涌出量預(yù)測(cè)[J].傳感技術(shù)學(xué)報(bào),2014,27(11):1568-1572.
[12]付華,王馨蕊,王志軍,等.基于PCA和PSO-ELM的煤與瓦斯突出軟測(cè)量研究[J].傳感技術(shù)學(xué)報(bào),2014,27(12):1710-1715.
[13]Andrews P S.An Investigation into Mvolutionary Operators for Particle Swarm Optimization[C]//IEEE Congress on Evolutionary Computation,Vancouver,2006:1029-1036.
[14]Parsopoulos E,Vrahatis M N.Parameter Selection and Adaption in Unified Particle Swarm Optimization[J].Mathmatical and Computer Modeling,2007,46(3):198-213.
[15]徐冰,王星,Dhaene Tom,等.基于遺傳算法的多目標(biāo)最小二乘支持向量機(jī)在近紅外多組分定量分析中的應(yīng)用[J].光譜學(xué)與光譜分析,2014,34(3):638-642.
曲 ?。?989-),男,山東青島人,在讀研究生,主要研究方向?yàn)闄z測(cè)技術(shù),13645712326@163.com;
陳紅巖(1965-),男,浙江杭州市,教授,研究生導(dǎo)師,浙江大學(xué)內(nèi)燃機(jī)工程專業(yè)碩士、博士學(xué)位;上海交通大學(xué)動(dòng)力與機(jī)械工程專業(yè)博士后。主要研究領(lǐng)域?yàn)槠?chē)電子、發(fā)動(dòng)機(jī)排放與控制等,bbchy@163.com。
Application of Support Vector Machine Based on Adaptive Mutation Particle Swarm Optimization in Analysis of Gas Mixture
QU Jian,CHEN Hongyan*,LIU Wenzhen,ZHANG Bing,LI Zhibin
(College of Mechanical and Electrical Engineering,China Jiliang University,Hangzhou 310018,China)
For the difficult in selecting parameter of SVM modeling,the data calculation excessive in infrared spectroscopy,as well as crosstalk between gases and other issues in the quantitative analysis of mixed gas.A solution of adaptive mutation particle swarm optimization support vector machine was proposed.It was to establish the models of a multi-component mixture gases quantitative analysis based on infrared spectroscopy.Multi-component mixture gases are composed of CO,with the concentration range from 0.5%to 8%;CO2,with the concentration range from 3.6%to 12.5%;C3H8,with the concentration range from 200×10-6to 3270×10-6.Use the Particle swarm optimization algorithm to optimize select the parameters in support vector machine modeling,and compare the support vector machine modeling parameters in genetic algorithm optimization.Experiments show that it takes 39.524 s for modeling and it takes 26.272 s with genetic algorithm;for the predict results of CO2in independent modeling,the variance of PSO algorithms is 0.000 123 758,the variance of genetic algorithms is 2.149 52.In the case of modeling time slightly higher,the predict results were significantly lower than the variance of the genetic algorithm.
sensor application;SVM;particle swarm optimization;genetic algorithms;quantitative analysis
TH744
A
1004-1699(2015)08-1262-07
??7230;4145
10.3969/j.issn.1004-1699.2015.08.027
2015-04-06 修改日期:2015-05-25