李國林,焦 月,馬 坤,鄢志丹,張雪娜,吳赟輝,張澤成
(中國石油大學(華東)控制科學與工程學院,山東青島266580)
煤、石油、天然氣等化石燃料的燃燒、動植物的呼吸作用都會造成大量CO2的排放,而CO2是溫室效應(yīng)的“罪魁禍首”之一[1],因此,檢測空氣中CO2的含量對于監(jiān)測世界氣候的變化具有重要意義。檢測呼吸氣體中CO2的含量是識別肺動脈栓塞的有效手段之一,中高檔監(jiān)護儀已將呼吸末CO2列為必備檢測功能[2]。此外,烯烴裂解爐會因為縮合反應(yīng)產(chǎn)生沉積的焦炭顆粒,影響裂解效率,需要定期停爐清焦,通過分析燒焦過程的CO2含量監(jiān)測清焦進展,可以快速反應(yīng)燒焦進度,從而精準地控制燒焦時間,提升工藝生產(chǎn)的經(jīng)濟效益[3]。
目前,檢測CO2的常用方法有電化學法[4-5,10]、非分光紅外光譜技術(shù)[5-6,10]以及可調(diào)諧半導體激光吸收光譜技術(shù)(Tunable Diode Laser Absorption Spectroscopy, TDLAS)[7-15]等 。Schwandt 等人用固態(tài)電化學傳感器檢測CO2,這種傳感器壽命短且響應(yīng)時間長[4-5,10]。Vincent 等用非分光紅外光譜技術(shù)檢測呼吸氣體中的CO2,系統(tǒng)分辨率約為10×10-6,該方法容易受到光源強度變化和背景漂移帶來的影響,需要時常校準頻率以及更換不同的濾光片[5-6,10]。TDLAS 方法常用空芯光纖和多反氣室,Xiong 等人用基于空芯光纖的CO2傳感器監(jiān)測呼吸過程中CO2濃度,相比于傳統(tǒng)的多反氣室,空芯光纖更容易產(chǎn)生干涉條紋及受到外界環(huán)境的干擾,Li 等用多反氣室和基于級聯(lián)積分器梳狀濾波器的檢測系統(tǒng)檢測CO2在1 580 nm 附近的濃度,靈敏度高、檢出限低、響應(yīng)速度快[7-15]。綜上可知,電化學傳感器通常含有有毒有害材料,壽命短,重復性差且響應(yīng)時間長;基于濾光片的非分光紅外光譜技術(shù)熱光源的光譜寬,容易涵蓋多種氣體,干擾多,容易受到光源強度變化和背景漂移帶來的影響,需要時常對頻率進行校準以及使用不同的濾光片,氣體吸收光程不夠長,檢測精度不如TDLAS 高,響應(yīng)速度慢,不適用于工業(yè)過程中的實時在線分析。TDLAS 不易受到外界環(huán)境干擾,不需要參比氣室,結(jié)構(gòu)簡單穩(wěn)定;響應(yīng)速度快,可實時在線分析;基于多反的長光程氣室光譜分辨率高,靈敏度高[4-15]。因此,TDLAS 在工業(yè)應(yīng)用中更具潛力。
機器學習算法被廣泛應(yīng)用于氣體濃度預測中。Chen 等用BP 神經(jīng)網(wǎng)絡(luò)建立了基于衛(wèi)星遙感數(shù)據(jù)的區(qū)域尺度污染物濃度預測模型,BP 神經(jīng)網(wǎng)絡(luò)具有良好的非線性擬合能力,但訓練速度慢,局部最優(yōu)下降,不能滿足實時性和高精度的要求[16]。遺傳算法(Genetic Algorithm,GA)是一種解決最優(yōu)化的搜索啟發(fā)式算法,Liu 等利用遺傳算法優(yōu)化后的BP 神經(jīng)網(wǎng)絡(luò)檢測瓦斯的主要成分甲烷,設(shè)計了燃氣泄漏預警系統(tǒng)[17],但是其相關(guān)系數(shù)最高僅為0.92。Sun 等將粒子群尋優(yōu)(Particle Swarm Optimization,PSO)算法與BP結(jié)合,對河北省二氧化碳排放的影響因素進行了研究,結(jié)構(gòu)簡單,但是計算速度慢[18]。Yang 等提出了一種基于LSSVM 的氮氧化物濃度實時動態(tài)預測模型,但是動態(tài)時間長[19]。Li 等用PSO 與支持向量回歸(Support Vector Regression,SVR)結(jié)合進行大氣污染物濃度的預測,其預測精度高于GA-SVR[20]。黃廣斌在極限學習機(Extreme Learning Machine,ELM)的基礎(chǔ)上引入核函數(shù),提出核極限學習機(Kernel Extreme Learning Machine,KELM),簡化了ELM 的參數(shù)。Su 等用KELM 預測臭氧濃度,KELM 學習速度快,方法優(yōu)于逐步回歸方法和反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)[21]。Ho 等提出一種基于PSO 算法的直覺模糊季節(jié)性回歸(IFSR)方法,提高了一氧化碳日濃度的預測性能[22]。KELM 具有結(jié)構(gòu)簡單、計算速度快、精度高及實時性好等優(yōu)勢,PSO 算法能快速找到最優(yōu)的模型參數(shù)。本文將PSO 算法與KELM 相結(jié)合,克服了BP 神經(jīng)網(wǎng)絡(luò)、ELM 等算法響應(yīng)速度慢、結(jié)構(gòu)復雜、模型相關(guān)系數(shù)低等缺陷。
本文采用基于比爾朗伯定律的TDLAS 技術(shù),設(shè)計了基于LabVIEW 的近紅外CO2濃度反演系統(tǒng),將EMD 作為預處理算法與PSO-KELM濃度反演算法嵌入LabVIEW 中,在此基礎(chǔ)上開展2%~20%的CO2濃度檢測實驗。數(shù)據(jù)采集卡采集到的二次諧波信號(2f信號)經(jīng)EMD 去噪后信噪比明顯提高,最后用PSO-KELM 算法進行濃度反演。該模型預測準確度高、響應(yīng)速度快,可精準測量清焦過程中的CO2含量。
設(shè)樣本(Xi,ti)的個數(shù)為N,Xi為采集的第i條CO2的二次諧波信號,ti為對應(yīng)的CO2濃度,則包含L個隱含層神經(jīng)元(本次實驗L=500)、激勵函數(shù)為g(x)的ELM 模型可以表示為:
其中:Wi為輸入權(quán)值,bi是隱含層神經(jīng)元的閾值,Wi和bi隨機產(chǎn)生,βi為輸出權(quán)重。ELM 網(wǎng)絡(luò)的目標是使得模型CO2的預測濃度oj盡可能地接近CO2的設(shè)定濃度tj,即存在βi,Wi和bi使得:
用矩陣表示為:
其中:H是隱含層神經(jīng)元的輸出,β為輸出權(quán)重,T為目標輸出濃度。
根據(jù)廣義逆的理論,其解為:
其中:H+是矩陣H的Moore-Penrose 廣義逆,且求得的的范數(shù)是最小并且唯一的。
ELM 的優(yōu)化目標是最小化訓練誤差和輸出權(quán)重的范數(shù),其優(yōu)化函數(shù)為:
可持續(xù)發(fā)展指標體系是一個由多方面指標組成的復雜體系,指標的選取應(yīng)該能夠適當反映各地區(qū)在經(jīng)濟、社會、人口、資源、環(huán)境生態(tài)和科技教育等方面的基本狀況,并能滿足不同時期和不同地區(qū)對比分析的需要。為了保證指標體系的合理性,在制定過程中遵循科學性、綜合性、代表性、可操作性、時間序列數(shù)據(jù)可比性等原則。
其中:ξi為訓練誤差,C為誤差懲罰因子,用來權(quán)衡模型的訓練誤差和輸出權(quán)重。
由KKT 條件,最終得到ELM 模型輸出權(quán)值:
在KELM 模型中,核矩陣Ω代替了ELM 中的隨機矩陣HHT,核矩陣可以表示為:
其中K(xi,xj)為Ωi,j的第i行、第j列光譜點。本次選取徑向基(Radial Basic Function,RBF)核函數(shù),RBF 核函數(shù)為:
其中σ是核函數(shù)寬度。
則KELM 預測的輸出濃度表達式為:
誤差懲罰因子C和核參數(shù)σ2是KELM 優(yōu)化的兩個關(guān)鍵參數(shù),本文采用PSO 算法對C和σ2進行優(yōu)化。PSO 算法是一種屬于群體智能的優(yōu)化算法,本次實驗粒子維數(shù)D為2,粒子數(shù)為20,進化次數(shù)設(shè)為30,xi為第i條光譜,根據(jù)目標濃度計算xi的最小適應(yīng)度值得到:
其中:f(xi)為預測濃度,yi為目標濃度。
樣本i的速度(即尋找最優(yōu)C和σ2的速度)為:
樣本第i個體經(jīng)歷過的最好的位置(最優(yōu)C和σ2的解)為:
群體經(jīng)歷過的最好位置(最優(yōu)C和σ2的解)為:
通常,在第d(1≤d≤D)維的位置變化限定在[xmin,d,xmax,d]內(nèi),本次實驗限定在[10,40 000];速度變化范圍限定在[vmin,d,vmax,d],本次實驗限定在[10,1013],即在迭代中若vid,xid超出了邊界,則該維的速度或位置被限制為該維的最大速度或邊界位置。第k次迭代后,第i個樣本的第d維帶有慣性權(quán)重因子和約束因子的速度和位置調(diào)整為:
其中:c1,c2為加速度常數(shù),調(diào)節(jié)學習最大步長,本次實驗取默認值2;r1,r2是兩個隨機函數(shù),取值為[0,1],以增加搜索隨機性;xk+1id,vk+1id為D維上第i個樣本進行k+1 次迭代的速度和位置;ω為慣性權(quán)重因子,本次實驗取默認值0.9,調(diào)節(jié)對解空間的搜索范圍。
燒焦過程中除了有CO2之外,還伴隨著CH4,H2O,CO 的干擾。據(jù)HIRTAN 數(shù)據(jù)庫,在濃度為0.000 1、溫度為300 K、壓力為1.01×105Pa、光程為20 m 時,CO2和CH4,H2O,CO 在1 579.4~1 580.4 nm 內(nèi)的吸收譜線如圖1 所示(彩圖見期刊電子版)。與CO2,CO 相比,CH4和H2O 在此波段的吸收很小,可以忽略不計,CO2在此波段內(nèi)有兩個很強的吸收峰,為了避免CO 氣體對CO2在1 579.75 nm 附近的強的吸收峰干擾,本次實驗選取CO2在1 579.9~1 580.3 nm內(nèi)的吸收譜線。使用武漢六九傳感器公司提供的中心波長為1 580 nm 的DFB 激光器(SN:19062063),用商用激光器驅(qū)動模塊(上海昕虹光電,PN:M-DFB-GP03)和波長計(HP 86120B)來檢測激光器的溫度調(diào)諧系數(shù)和電流調(diào)諧系數(shù)。首先,設(shè)定激光器的驅(qū)動電流為50 mA,將溫度從19.5 ℃調(diào)節(jié)到34 ℃,分別記錄激光器的發(fā)光波長,計算出溫度調(diào)諧系數(shù)為0.098 5 nm/℃;設(shè)定溫度為25 ℃,將驅(qū)動電流從10 mA 調(diào)到60 mA,分別記錄激光器的發(fā)光波長,計算出電流調(diào)諧系數(shù)為0.019 3 nm/mA。通過調(diào)節(jié)溫度和電流,激光器發(fā)光波長的范圍可以覆蓋CO2吸收峰,并保持穩(wěn)定。
圖1 HITRAN 數(shù)據(jù)庫中CO2,H2O,CH4,CO 在1 580 nm 附近濃度為0.000 1、溫度為300 K、壓力為1.01×105、光程為20 m 時的吸收譜Fig.1 Absorption spetra of CO2,H2O,CH4 and CO in HITRAN database in range of 1 580 nm with concentration of 0.000 1,temperature of 300 K,pressure of 1.01×105 and optical path of 20 m
如圖2 所示,實驗裝置主要包括自動化配氣站、TDLAS 二氧化碳氣體測試系統(tǒng)、LabVIEW數(shù)據(jù)采集與濃度反演部分。自動化配氣站對100%的純CO2和N2進行配比,并采用松下公司生產(chǎn)的DP-101 系列氣體壓力傳感器和七星華創(chuàng)公司生產(chǎn)的精度優(yōu)于1%的數(shù)字式質(zhì)量流量計對配比后的氣體進行控制,氣體送入長光程氣室(Herriott 氣室,由武漢旭海光電公司提供,光程20 m)后經(jīng)洗氣瓶排出。 通過溫控模塊WTC3293 控制激光器溫度,將激光器的中心波長調(diào)諧到1 580 nm 的波長掃描范圍附近,溫度調(diào)諧是粗調(diào)方法,一旦確定后無需更改。電流控制模塊產(chǎn)生驅(qū)動電流(5 Hz 的鋸齒信號疊加7.8 kHz 正弦信號)驅(qū)動激光器,調(diào)整起始掃描電流和掃描電流范圍可以精細調(diào)整激光器的掃描波長,使其發(fā)光波長的范圍覆蓋目標氣體的吸收峰。激光器輸出的近紅外光經(jīng)過聚焦準直進入氣室,在氣室中多次反射并被目標氣體吸收,最終到達探測器。探測器選用InGaAs 探測器,響應(yīng)波長為800~1 700 nm,將透射光信號轉(zhuǎn)換為電信號,探測器信號經(jīng)過鎖相放大器后被數(shù)據(jù)采集卡(美國國家儀器公司,SCB-68A)采集到自主開發(fā)的LabVIEW 上位機中,通過數(shù)字信號預處理算法EMD 和濃度反演算法PSO-KELM 對采集到的數(shù)據(jù)進行處理。
圖2 近紅外CO2濃度反演系統(tǒng)實驗裝置Fig.2 Experimental setup of near infrared CO2 concentration inversion system
利用LabVIEW 進行數(shù)據(jù)采集時,首先在NIDAQmx 生成數(shù)據(jù)采集任務(wù),選擇采集通道及觸發(fā)方式。本次實驗需采集TDLAS 測試系統(tǒng)傳出的光功率(DC)信號、二次諧波信號(2f信號)以及氣體壓力(P)信號(均為電壓信號),采樣點為1 k,采樣頻率為5 k,即光譜信號每個周期為200 ms;在STM32 微處理芯片的程序中,通過外部中斷處理函數(shù),每隔200 μs 觸發(fā)一次定時器中斷,在定時器中斷函數(shù)中調(diào)用數(shù)模轉(zhuǎn)換器(Digital to Analog Convertor,DAC)模擬信號輸出函數(shù),每200 μs 輸出一個模擬量,每1 000 個點為一個周期即完成了一個周期慢掃信號的輸出。當計數(shù)輸出了1 000 個模擬量時,向指定管腳發(fā)出一個高電平信號,該信號即LabVIEW 程序采集的外部觸發(fā)信號,所以本實驗選擇上升沿觸發(fā)方式。
由于經(jīng)數(shù)據(jù)線采集到的數(shù)據(jù)傳到LabVIEW后有很大的噪聲干擾,所以要對數(shù)據(jù)進行預處理。本文程序中利用MATLAB 程序生成的組件對象模型(Component Object Model,COM)以Win32 動態(tài)鏈接庫(DLL)的形式被LabVIEW 調(diào)用,實現(xiàn)對算法的跨平臺調(diào)用和對實時數(shù)據(jù)的分析。在軟件中嵌入了經(jīng)驗模態(tài)分解(Empirical Mode Decomposition,EMD)算法,EMD 算法是一種自適應(yīng)時頻分析方法,它將原始信號分解為有限個固有模態(tài)函數(shù)(Intrinsic Mode Function,IMF)和一個余項,所分解出來的各IMF 分量包含了原始信號的不同時間尺度的局部特征信號,每個IMF 必須要滿足在整個信號上極值點的個數(shù)和過零點的個數(shù)相差不大于1 且在任意點處上下包絡(luò)的均值為0 的條件。首先,找到原始2f信號x(t)的所有極大值點與所有極小值點,通過三次樣條函數(shù)擬合出極大值包絡(luò)線與極小值包絡(luò)線,上下包絡(luò)線的均值作為原始2f信號的均值包絡(luò)m(t),用原始2f信號x(t)減去均值包絡(luò)m(t)就得到一個去掉低頻的新信號xnew(t)。若新信號不滿足S≤a,則重復上述過程:
其中a為篩分門限,本次實驗取0.3;若新信號滿足S>a的條件,則用原始信號減去第一個IMF分量后再重復上述過程,直到余項r(t)是單調(diào)函數(shù)或常量時EMD 分解過程停止。通過EMD 算法分解系統(tǒng)噪聲和光學基線,將這幾項噪聲去除后重組有用的光譜信號,可提高光譜信噪比[27-28]。
LabVIEW 程序采用多次平均處理可事先去除一部分噪聲,利用while 循環(huán)框上的移位寄存器實現(xiàn)光功率信號(DC 信號)和二次諧波信號(2f信號)的累加,累加次數(shù)即為平均次數(shù),本次實驗的平均次數(shù)為10。因多次平均去噪效果有限,所以在2f信號后添加EMD 處理,并分別將原始信號raw2f與經(jīng)EMD 處理后的信號存儲到文件中。圖3(a)為單條raw2f信號,噪聲很強,信噪比為6.75 dB;圖3(b)為raw2f信號經(jīng)過EMD 分解后得到3 個噪聲分量和1 個res 分量,需要剔除掉;圖3(c)為raw2f信號去掉圖3(b)中分解出的信號后得到的重組信號,即2f信號,可以看出噪聲被有效去除,信號平滑了很多,信噪比為12.59 dB,比原始信號的信噪比提高了1.87 倍。
圖3 MATLAB 仿真結(jié)果Fig.3 MATLAB simulation result
為了進一步驗證EMD 算法的處理效果,用純氮氣與100%濃度的CO2進行混合配比,分別開展了0.03%~0.08%(步進為0.01%)的6 組低濃度實驗與2%~15%(步進為1%)、18%,20% 的16 組高濃度實驗,每條光譜是1 000 個點,去掉前后各250 個不穩(wěn)定的點,取中間500 個數(shù)據(jù)點進行分析。圖4(a)為經(jīng)EMD 處理后的16組高濃度CO2光譜數(shù)據(jù)。每個濃度采30 多條光譜,取每個濃度譜峰的峰峰值進行平均,并與CO2濃度進行線性擬合,得到的結(jié)果如圖4(b)所示,線性相關(guān)系數(shù)R2=0.997 6。圖4(c)為經(jīng)EMD 處理后的6 組低濃度CO2光譜數(shù)據(jù)及其峰峰值與濃度的線性相關(guān)性曲線,相關(guān)系數(shù)R2=0.998 2。
圖4 經(jīng)EMD 處理后的CO2光譜數(shù)據(jù)及其峰峰值與濃度的線性關(guān)系Fig.4 CO2 spectral data after EMD processing and linear relationship between peak-to-peak value and concentration
因本次主要是應(yīng)用于燒焦過程的CO2氣體濃度實時監(jiān)測,所以僅對高濃度(2%~20%)的CO2進行算法分析。16 組經(jīng)過EMD 處理的高濃度CO2光譜共527 條,采用5 折校驗法,422 條光譜作為訓練集,105 條光譜作為測試集,通過PSO算法對RBF 核函數(shù)的核參數(shù)即核半徑σ2以及懲罰系數(shù)C進行尋優(yōu),發(fā)現(xiàn)當C=4.397×103,σ2=4.947×1010時,對測試集105 個樣本的預測精度達到最高,此時精度為962×10-6。
將PSO-KELM(采用RBF 核函數(shù))算法的濃度反演結(jié)果與PLS、CLS、BP 神經(jīng)網(wǎng)絡(luò)(激活函數(shù)為ReLU)及ELM(激活函數(shù)為ReLU)進行對比,結(jié)果如表1 所示。PSO-KELM 反演結(jié)果的均方根誤差最小,線性相關(guān)系數(shù)最接近1。由此可知,PSO-KELM 的預測準確度最高,均方根誤差比PLS 小了1.22 倍,比CLS 小了15.10 倍,比ELM 小了4.08 倍,比BP 神經(jīng)網(wǎng)絡(luò)小了6.53 倍。
表1 步進測試CO2 氣體中BP 神經(jīng)網(wǎng)絡(luò)、ELM 和PSOKELM 算法的擬合精度對比Tab.1 Comparison of fitting accuracy of BP neural network,ELM and PSO-KELM algorithms for step test of CO2 gas
圖5 為BP 神經(jīng)網(wǎng)絡(luò)、ELM、PSO-KELM 3 種算法模型的擬合結(jié)果。
圖5 BP 神經(jīng)網(wǎng)絡(luò)、ELM 和PSO-KELM 算法的擬合結(jié)果對比Fig.5 Comparison of fitting results of BP neural network,ELM and PSO-KELM algorithms
為了測試檢測系統(tǒng)的穩(wěn)定性,在70 kPa 的壓力下通入10%的CO2,持續(xù)1.5 h,測得623 條光譜。如圖6(a)所示,測量濃度在9.940%~10.056%內(nèi)波動,標準差為196.6×10-6。如圖6(b)所示,對測量結(jié)果進行Allan 方差分析,積分時間為2 s 時,Allan 方差為90.9×10-6;隨著積分時間的增加,當積分時間為16 s 時,Allan 方差為44.8×10-6,此時TDLAS 測試系統(tǒng)的穩(wěn)定性最好,達到了極限標準差。由此可見,TDLAS 測試系統(tǒng)具有高度穩(wěn)定性。
圖6 穩(wěn)定性測試結(jié)果與分析Fig.6 Stability test results and analysis
本文基于TDLAS 技術(shù),以中心波長為1 580 nm 的DFB 激光器(SN:19062063)作為光源,光程為20 m 的Herriott 氣室作為光與CO2作用的場所,開展燒焦過程的CO2氣體檢測實驗。用數(shù)據(jù)采集卡采集原始二次諧波信號,提出了將EMD 作為預處理算法嵌入到LabVIEW 上位機中,經(jīng)EMD 處理后的2f信號的信噪比提高了近2倍。將PSO-KELM 算法模型應(yīng)用于CO2氣體濃度反演,與CLS,PLS,BP 神經(jīng)網(wǎng)絡(luò)和ELM 算法做比較,其均方根誤差最小,線性相關(guān)系數(shù)最接近1。最后,在氣室壓力在70 kPa,CO2濃度為10%的條件下進行1.5 h 的長期穩(wěn)定性測試,測量濃度在9.940%~10.056%內(nèi)波動,標準差為196.6×10-6。對測量結(jié)果進行Allan 方差分析,積分時間為2 s 時,Allan 方差為90.9×10-6;隨著積分時間的增加,當積分時間為16 s 時,Allan 方差為44.8×10-6,此時TDLAS 測試系統(tǒng)的穩(wěn)定性最好,達到了極限標準差。因此,該系統(tǒng)可以實現(xiàn)對燒焦過程中CO2氣體濃度的高靈敏度實時準確監(jiān)測,提升工藝生產(chǎn)的經(jīng)濟效益。