陳 揚(yáng) 賈麗萍 張?zhí)珜?郭 澎 王湘暉 常勝江(南開大學(xué)現(xiàn)代光學(xué)研究所,天津 30007(石家莊經(jīng)濟(jì)學(xué)院,石家莊 05003
用于光譜分類的光譜峰谷沿匹配算法*
陳 揚(yáng)1)?賈麗萍2)張?zhí)珜?)郭 澎1)王湘暉1)常勝江1)
1)(南開大學(xué)現(xiàn)代光學(xué)研究所,天津 300071)
2)(石家莊經(jīng)濟(jì)學(xué)院,石家莊 050031)
(2009年3月9日收到;2009年4月29日收到修改稿)
針對超短脈沖激光與氣體相互作用產(chǎn)生的非線性熒光光譜的特點(diǎn),提出了一種新的光譜去噪、特征提取、特征匹配的有效方法.通過對三種氣體不同濃度的熒光光譜進(jìn)行小波壓縮去噪,得到5層664個(gè)小波系數(shù),重構(gòu)后獲得除噪效果滿意而特征信息保持不變的光譜.對重構(gòu)后的光譜進(jìn)行光譜峰/谷沿相似度的分析,構(gòu)造了三種氣體的特征譜.在此基礎(chǔ)上,經(jīng)對三種氣體光譜進(jìn)行特征峰/谷沿的匹配分析,提出一種利用同種物質(zhì)不同濃度下的光譜總體相似度來構(gòu)造標(biāo)準(zhǔn)特征譜新方法,通過與標(biāo)準(zhǔn)特征譜的匹配分析得到分類結(jié)果.實(shí)驗(yàn)結(jié)果表明,該算法的分類結(jié)果受濃度變化影響小,對低至0.05%濃度條件下的全部27條光譜均獲得100%的分類識(shí)別結(jié)果.
非線性熒光光譜,特征匹配,光譜峰谷沿
PACC:4230S,3350D
隨著工業(yè)的發(fā)展,大氣污染問題已經(jīng)成為人們關(guān)注的焦點(diǎn),為更好地檢測和治理污染,有必要對大氣狀況進(jìn)行實(shí)時(shí)監(jiān)測.傳統(tǒng)的濕式化學(xué)技術(shù)以及后續(xù)發(fā)展起來的氣相色譜法[1]、質(zhì)譜和色譜聯(lián)合技術(shù)[2]等是以吸氣取樣后的實(shí)驗(yàn)分析為基礎(chǔ),不具備實(shí)時(shí)和連續(xù)監(jiān)測能力.近些年,基于差分光學(xué)吸收光譜技術(shù)、傅里葉變換紅外光譜技術(shù)以及差分吸收激光雷達(dá)技術(shù)[3,4]等光學(xué)和光譜學(xué)方法以其大范圍、高靈敏度、多組分的在線檢測能力而成為大氣環(huán)境監(jiān)測的主要技術(shù)手段.但由于這些技術(shù)需要瞄準(zhǔn)光源安裝探測系統(tǒng)或使用角反射器,因此只能在固定的場合使用.
近幾年,超短脈沖激光與大氣相互作用產(chǎn)生熒光光譜[5—7]現(xiàn)象引起了人們的重視.由于自聚焦效應(yīng),超短脈沖激光在空氣中傳輸時(shí)會(huì)形成等離子體通道,即成“絲”現(xiàn)象出現(xiàn),絲狀脈沖光場內(nèi)的高密度能量使生化污染物分子發(fā)生非線性電離和解離,產(chǎn)生具有分子光譜特性的熒光光譜[8—10],這些光譜可以作為分子指紋模式加以識(shí)別,從而得到大氣中污染氣體的成分和濃度.同已有的光學(xué)或光譜學(xué)環(huán)境監(jiān)測方法相比,超短脈沖激光技術(shù)具有三個(gè)明顯的優(yōu)勢:1)“絲”狀光場是一個(gè)穩(wěn)定的脈沖光場,污染氣體分子釋放的熒光光譜具有很好的穩(wěn)定性和可重復(fù)性;2)超連續(xù)譜分布(加上展寬的三次諧波光譜后光譜范圍為250 nm至幾個(gè)微米)的“絲”狀脈沖光場可同時(shí)滿足所有污染氣體激發(fā)熒光的需要,因此使用單個(gè)激光器就可滿足多種氣體監(jiān)測要求;3)可以把激光光源與遙感探測系統(tǒng)集成為一體形成車載、船載或機(jī)載系統(tǒng),可實(shí)現(xiàn)對任意地點(diǎn)的大氣環(huán)境進(jìn)行實(shí)時(shí)監(jiān)測,因此它的機(jī)動(dòng)性很強(qiáng),潛在的應(yīng)用領(lǐng)域更廣.目前,該方法在環(huán)境監(jiān)測中應(yīng)用的主要困難是缺乏光譜分析的有效方法,由于非線性熒光光譜的產(chǎn)生涉及的非線性效應(yīng)較多,且同時(shí)測量多種污染氣體,這些污染成分的熒光光譜相互影響,產(chǎn)生交疊,出現(xiàn)光譜強(qiáng)度與氣體濃度之間復(fù)雜的非線性關(guān)系,采用傳統(tǒng)的光譜分析方法分析上述光譜存在很大難度,解決這一問題的有效方法是研究和探索新型的光譜分析技術(shù).
傳統(tǒng)光譜分類方法,依據(jù)光譜形態(tài)可以有導(dǎo)數(shù)光譜分析、波峰/波谷總數(shù)、波峰/波谷寬度、波峰/波谷斜率等各種分析方法[11,12].由于受噪聲干擾,飛秒脈沖激光與大氣相互作用產(chǎn)生的熒光光譜存在一些不可忽略的尖峰噪聲,導(dǎo)致一些原本較平坦的區(qū)域由于噪聲干擾出現(xiàn)隨機(jī)波動(dòng)的偽特征;同時(shí),隨著濃度的變化,各個(gè)峰變化趨勢不盡相同,其疊加譜的變化規(guī)律更為復(fù)雜.傳統(tǒng)的光譜分析方法對以上因素較為敏感,例如對偶然出現(xiàn)的尖峰噪聲,導(dǎo)數(shù)光譜分析、波峰/波谷總數(shù)分析、波峰/波谷斜率分析等都將給出錯(cuò)誤的信息,采用傳統(tǒng)的光譜分析方法分析上述熒光光譜難度較大.
本課題組對復(fù)雜非線性熒光光譜數(shù)據(jù)已進(jìn)行了較為深入的研究[10,13—17].針對超短脈沖激光與大氣相互作用產(chǎn)生的熒光光譜的具體特點(diǎn),本文提出了一種新的光譜去噪、特征提取、特征匹配的有效方法.我們以空氣中混雜的各種濃度的乙烯、N-丁烷和1-丁烯氣體為分類對象,通過對三種氣體不同濃度的熒光光譜進(jìn)行小波壓縮去噪,得到5層664個(gè)小波系數(shù),重構(gòu)后可以獲得除噪效果滿意而特征信息保持不變的光譜.在此基礎(chǔ)上,經(jīng)對三種氣體光譜進(jìn)行特征峰/谷沿的匹配分析,我們提出一種利用同種物質(zhì)不同濃度下的光譜總體相似度來構(gòu)造標(biāo)準(zhǔn)特征譜的新方法,通過與標(biāo)準(zhǔn)特征譜的匹配分析得到分類結(jié)果.計(jì)算機(jī)模擬結(jié)果表明,該算法的分類結(jié)果受濃度變化影響小,在低至0.05%濃度條件的所有光譜均獲得100%的分類識(shí)別結(jié)果.
小波壓縮去噪的理論基礎(chǔ)是小波變換的多分辨率分析.含有噪聲的信號(hào)經(jīng)過小波變換的多分辨率逐級(jí)分解,得到其小波變換后的離散細(xì)節(jié)和離散逼近.Mallat等證明,噪聲的離散細(xì)節(jié)信號(hào)的幅度隨著小波變換尺度的增長而不斷減小,但信號(hào)的小波變換系數(shù)與尺度的關(guān)系則不同.利用光譜噪聲和小波變換的特點(diǎn),選擇一門限對小波變換后各尺度離散細(xì)節(jié)進(jìn)行門限處理,絕對值較小的點(diǎn)取為零,對非零值重新索引后數(shù)據(jù)點(diǎn)數(shù)即可大大壓縮.將離散逼近信號(hào)和處理后離散細(xì)節(jié)經(jīng)小波逆變換重構(gòu)信號(hào),即可以達(dá)到去噪的目的[18—20].
圖1 光譜匹配圖示例
在熒光光譜特征提取方面,考慮到飛秒脈沖激光與大氣相互作用產(chǎn)生的熒光光譜的特點(diǎn)后,我們提出一種基于特征峰/谷匹配算法的特征提取算法. 2.2.1.光譜峰谷沿的確定
采樣光譜是離散的,我們用其一階差分來確定光譜的極大值點(diǎn)和極小值點(diǎn).某一點(diǎn)處的差分由負(fù)值變?yōu)檎?則該點(diǎn)為極小值點(diǎn);同理可確定極大值點(diǎn).極小值到極大值之間的一段為上升沿,標(biāo)注為“+”;極大值到極小值之間的一段為下降沿,標(biāo)注為“-”.忽略光譜上升下降的具體數(shù)值,將其抽象為峰谷變化的趨勢,有利于克服各個(gè)峰谷絕對強(qiáng)度隨濃度變化不同帶來的分析問題.
2.2.2.光譜的匹配圖
將待比較的兩條光譜進(jìn)行如上處理之后,分別投影到直角坐標(biāo)系中的x-y平面內(nèi),根據(jù)已標(biāo)注的兩條譜線的“+”“-”區(qū)域,我們可以將坐標(biāo)平面分割成許多矩形塊,這些矩形塊依據(jù)兩個(gè)邊乘積的正負(fù)被賦予正負(fù)號(hào).矩形塊為“+”表示其對應(yīng)的兩段光譜同為上升沿或同為下降沿,如圖1所示的陰影部分.為“-”表示一段為上升沿另一段為下降沿.其中投影于x軸的光譜簡稱為x譜,也稱為標(biāo)準(zhǔn)譜.投影于y軸的光譜簡稱為y譜,也稱為待匹配譜.在匹配圖中,我們只關(guān)心y=x這條線附近的情況,因?yàn)檫@條線上的點(diǎn)對應(yīng)兩條譜線相同的波長位置.
2.2.3.峰谷沿的相似度
我們定義峰谷沿的相似度
其中x1,x2,y1,y2為圖1中矩形塊的四個(gè)頂點(diǎn)坐標(biāo).當(dāng)我們以x譜為標(biāo)準(zhǔn)譜,分析y譜與x譜的相似度時(shí)將上式左邊簡寫為sy(x1,x2).(1)式表示了x譜(x1,x2)段與y譜(y1,y2)段的相似度,從圖1中直觀的看,就是矩形塊(x1,x2,y1,y2)所夾y=x線段長度與矩形塊對角線長度之比.只有當(dāng)兩段光譜同為上升沿或下降沿時(shí)才有正值,否則相似度為0.
2.2.4.對尖峰噪聲的優(yōu)化
通常光譜中不可避免地包含著噪聲,導(dǎo)致光譜中存在不可忽略的較窄的噪聲尖峰,采用峰谷沿匹配算法能很好地解決噪聲對分類的影響.考慮圖1 (b)所示情形,y譜為x譜疊加尖峰后的光譜.在光譜的匹配圖上出現(xiàn)了x譜(x1,x2)段對應(yīng)y譜(y1, y2),(y3,y4)兩段的情況.我們通過定義一個(gè)整體相似度將這兩段譜的相似度合并,整體相似度定義為
此時(shí)(x1,x2)段的相似度會(huì)有一定程度的下降,但仍保持較大正值,不同于完全失配下相似度為0的情況.(2)式滿足加法結(jié)合律,如果出現(xiàn)一段x譜對應(yīng)多段y譜的情況,利用(2)式同樣能得到整體相似度.
2.2.5.平移系數(shù)與拉伸系數(shù)
由于光譜的采樣是離散的,采樣點(diǎn)的細(xì)微偏差可能引起采樣點(diǎn)幅度值較大的變化,在極值點(diǎn)附近還可能引起極值點(diǎn)定位的偏差.另外受儀器精度的影響,采樣所得的光譜可能會(huì)有整體細(xì)微的漂移或拉伸.為了把光譜本身的差別和儀器采樣誤差區(qū)分開,需要對光譜匹配情況進(jìn)行更細(xì)致地描述,我們定義
峰谷沿平移系數(shù)為峰谷沿平移系數(shù)表示兩段相似度大于0的譜沿相對的位移,取值范圍為[-1,1],當(dāng)譜沿沒有相對位移時(shí)平移系數(shù)為0;當(dāng)相對位移達(dá)到最大時(shí)平移系數(shù)為1或-1.平移系數(shù)為正值表示y譜相對x譜有向右的位移,負(fù)值表示有向左的位移.從匹配圖上直觀地看,平移系數(shù)表示矩形塊中心到y(tǒng)=x的距離與矩形塊對角線半長度的比值.
峰谷沿的拉伸系數(shù)定義為
峰谷沿的拉伸系數(shù)表示相似度大于0的兩段譜沿在坐標(biāo)軸投影的長度之比.當(dāng)拉伸系數(shù)大于1時(shí)y譜相對于x譜是拉伸的,當(dāng)系數(shù)小于1時(shí)y譜相對于x譜是壓縮的.從匹配圖上直觀地看,拉伸系數(shù)表示矩形塊y軸長度與x軸長度之比.
2.2.6.修正的峰谷沿相似度
當(dāng)峰谷沿相似度不為1時(shí),匹配的兩段譜有相對位移或拉伸.通常采樣過程會(huì)引起細(xì)微的漂移與拉伸,與有較大漂移與拉伸的不匹配有本質(zhì)的區(qū)別.為區(qū)分這種差別,我們修正峰谷沿的相似度公式使其與漂移、拉伸量的平方相關(guān).
其中tran,deform為(4),(5)式中x1x2所對應(yīng)矩形塊的平移系數(shù)與拉伸系數(shù),該矩形塊為完成(2)式所做尖峰噪聲優(yōu)化后的大矩形塊.通過(5)式的修正,當(dāng)平移、拉伸較小時(shí),相似度被修正的量很小,幾乎可以忽略;當(dāng)平移、拉伸較為嚴(yán)重時(shí),原本未修正時(shí)譜線的相似度就比較小,而修正后相似度被進(jìn)一步減小,使我們更加容易區(qū)分出不匹配的情況.當(dāng)待匹配光譜段僅出現(xiàn)尖峰噪聲時(shí),由于合并后整體峰谷沿的位置還是匹配的,大矩形塊對應(yīng)的平移系數(shù)和拉伸系數(shù)都與完全匹配時(shí)相近,修正后的相似度幾乎沒有改變而保持較大值.為了便于分析,我們將按峰谷沿分組表示的相似度改寫成按光譜點(diǎn)逐點(diǎn)表示的相似度,即
一個(gè)光譜點(diǎn)落在某段峰谷沿范圍內(nèi),則賦予該點(diǎn)相似度為對應(yīng)峰谷沿的相似度;如果一個(gè)光譜點(diǎn)為標(biāo)準(zhǔn)譜的極大值點(diǎn)或極小值點(diǎn),則該點(diǎn)同時(shí)落在前后兩段光譜沿范圍內(nèi),我們賦予該點(diǎn)相似度為前后兩段峰谷沿相似度的平均值.將(6)式求得的各個(gè)譜點(diǎn)的相似度值順序排列組成相似度矢量simsxy,矢量維數(shù)為光譜點(diǎn)的數(shù)量.
2.2.7.光譜特征峰的提取與標(biāo)準(zhǔn)特征峰譜的自適應(yīng)構(gòu)造法
為了有效提取光譜的特征,我們將同一物質(zhì)不同濃度的光譜進(jìn)行兩兩間的匹配分析,方法如下:不同濃度的譜z1,z2,…,zn,依次將各濃度下的光譜za作為標(biāo)準(zhǔn)譜,其余濃度作為待匹配譜分別與標(biāo)準(zhǔn)譜進(jìn)行(1)至(6)式的計(jì)算得到相似度矢量simszaz1…simszaza-1,simszaza+1…simszazn,將上述矢量取平均后得到平均相似度矢量
它表示了以za作為標(biāo)準(zhǔn)譜時(shí)與其他濃度譜的總體匹配情況,對平均相似度矢量sims′za進(jìn)行閾值處理
得到za作為標(biāo)準(zhǔn)譜與其他濃度譜的總體相似度矢量simsza.對于非特征峰的光譜部分,由于噪聲的隨機(jī)性,不同濃度光譜作為標(biāo)準(zhǔn)譜與其他譜進(jìn)行匹配時(shí)相似度都有大有小,但平均值較小,通過閾值作用將被置為0.對于特征峰的光譜部分,由于總體相似度值大于閾值,相似度被保留下來.
基于以上分析,我們提出一種利用同種物質(zhì)不同濃度下的光譜總體相似度來構(gòu)造標(biāo)準(zhǔn)特征譜新方法.具體方法如下.
每個(gè)特征峰/谷在simsz1…simszn中對應(yīng)一段相似度不為0光譜段,以不同譜z1,z2,…,zn為標(biāo)準(zhǔn)譜時(shí)這個(gè)峰谷沿的總體相似度不同,我們選取總體相似度最大的光譜段代表特征峰谷沿,特征峰谷沿的端點(diǎn)為該光譜段對應(yīng)沿的端點(diǎn),峰沿的上升(下降)趨勢標(biāo)注與譜線對應(yīng)沿一致.當(dāng)相鄰的特征峰谷沿對應(yīng)不同光譜段時(shí),邊界點(diǎn)可能會(huì)發(fā)生重疊或空白.我們處理的原則是:重疊部分劃歸為相似度高的峰谷沿,空白部分劃歸為相似度低的峰谷沿.
以三條譜線為例,圖2模擬了兩種不同情況下構(gòu)造的特征譜st.圖2(a)中光譜段2作為標(biāo)準(zhǔn)譜時(shí),其上升沿所對應(yīng)的總體相似度sims2(1)(sims2(1)代表譜2上升沿各個(gè)點(diǎn)的總體相似度,它們都是相等的,因此放在一起簡化表示)較其他兩條光譜作為標(biāo)準(zhǔn)譜時(shí)在該處的總體相似度sims1(1),sims3(1)大,因此我們將譜線2的上升沿作為標(biāo)準(zhǔn)譜的上升沿.同理我們將譜線1下降沿作為標(biāo)準(zhǔn)譜的下降沿.譜線2的上升沿與譜線1的下降沿有坐標(biāo)重合的部分,在這些重合點(diǎn)處sims2(1)>sims1(2),因此我們將這些點(diǎn)劃歸為上升沿部分.圖2(b)為構(gòu)造標(biāo)準(zhǔn)譜的另外一種情況,上升沿取為與光譜2相同,下降沿取為與光譜3相同,空白部分劃歸為下降沿.這樣的處理保證了標(biāo)準(zhǔn)譜中既能完整地包含高相似度的峰谷沿,也能對低相似度的峰谷沿進(jìn)行調(diào)整.實(shí)際操作中我們處理是相似度矢量,因此在構(gòu)造標(biāo)準(zhǔn)譜時(shí),除了標(biāo)記上升沿和下降沿外,我們在相似度矢量為0的點(diǎn)處將標(biāo)準(zhǔn)譜標(biāo)記為0,表示在這些點(diǎn)特征峰不明顯或無法肯定是否存在.經(jīng)過這些步驟后,我們可以得到維數(shù)為光譜點(diǎn)數(shù)的標(biāo)準(zhǔn)特征峰譜st,其各點(diǎn)值標(biāo)記為0,“+”或“-”.
圖2 構(gòu)造標(biāo)準(zhǔn)譜示例
當(dāng)對未知光譜z進(jìn)行分類時(shí),如何提取標(biāo)準(zhǔn)譜的特征點(diǎn)是很關(guān)鍵的.以兩種氣體為例:首先對兩種光譜按照2.2.7節(jié)的方法構(gòu)造標(biāo)準(zhǔn)譜stx和sty,將這兩種光譜的標(biāo)準(zhǔn)特征譜進(jìn)行一次相似度分析,此過程只需將(6)式的變量x,y用stx和sty代替,并將(1)式的結(jié)果代入即可得到相似度矢量simsstxsty.標(biāo)準(zhǔn)譜的特殊之處在于有許多點(diǎn)的值為“0”,處理時(shí)按照“-”來處理,因?yàn)樗鼈兺瑸椴黄ヅ涞那闆r.
對于多種氣體的光譜的情況,依次考慮各個(gè)譜的特征.以sts1為例,我們將sts1分別與剩下的n-1種氣體標(biāo)準(zhǔn)譜進(jìn)行相似度分析得到相似度simssts1sts2…simssts1stsn.sts1譜與stsn譜的相似度分析在特征點(diǎn)處有幾種情況:sts1有明顯的特征而stsn沒有明顯特征,即stsn譜在這些點(diǎn)為0,此時(shí)求得這些點(diǎn)的相似度為0;sts1與stsn都有明顯特征但特征相反,此時(shí)相似度很小;sts1與stsn都有明顯特征且特征相近,此時(shí)相似度較大.我們賦予不同特征點(diǎn)不同的權(quán)值,第一種情況0.5,第二種情況1,第三種情況0,用以區(qū)分它們對分類貢獻(xiàn)的大小.同樣方法,我們可以得到sts1與余下n-1種氣體譜的所有n-1組權(quán)值,將得到的權(quán)值相加作為特征點(diǎn)的權(quán)重.我們依次對sts1,…,stsn進(jìn)行這樣的運(yùn)算,得到n個(gè)氣體譜的特征點(diǎn)權(quán)重.
以三種氣體為例,表1和圖3顯示了各個(gè)光譜的標(biāo)準(zhǔn)譜示例和計(jì)算出的特征點(diǎn)權(quán)重.表格中的“-”表示該點(diǎn)不是該標(biāo)準(zhǔn)譜的特征點(diǎn),因?yàn)槠涮卣髯V在該點(diǎn)處為0.通過圖和表我們看到,大的權(quán)重對譜的分類是非常重要的,如st1譜中的1和2處,如果待分類譜在1處匹配該上升沿,2處匹配該下降沿,則為我們的分類提供相當(dāng)大的幫助,因?yàn)榇诸愖V與st2譜和st3譜中這兩處是不匹配的,我們相信該譜為st1類的可能性很大;而1,2兩處對于st2和st3的分類作用則沒有那么大,因?yàn)槿绻ヅ淞藄t2, st3的特征,我們僅能得出不是st1的結(jié)論,并不能判斷是st2或st3中的哪一類.
表1 標(biāo)準(zhǔn)譜示例中計(jì)算得到的分類特征點(diǎn)權(quán)值
圖3 三種氣體的標(biāo)準(zhǔn)譜示例
求得特征點(diǎn)權(quán)重后,我們將待分類譜z與各特征譜sts1,…,stsn分別進(jìn)行加權(quán)的相似度分析
式中d為光譜維數(shù),wni表示標(biāo)準(zhǔn)譜stsn第i點(diǎn)的權(quán)重,如果該點(diǎn)不是特征點(diǎn)則權(quán)重為0.simsstnz(i)表示z譜與stsn譜的相似度.在理想情況下,當(dāng)z譜與stsn在特征點(diǎn)處加權(quán)相似全匹配時(shí)為1,不匹配時(shí)較小.在分類過程中,考慮到特征點(diǎn)眾多,可以對權(quán)重取閾值操作,僅保留特征明顯對分類很有幫助的點(diǎn).權(quán)重小的點(diǎn)處與其他譜特征相似,代表性不強(qiáng)且容易受到干擾,可棄之不用.
基于構(gòu)造標(biāo)準(zhǔn)特征譜的分類方法,不但給出了分類結(jié)果,還給出了與各標(biāo)準(zhǔn)譜匹配的相似度,得出更加明確的結(jié)論.在與已知譜相似度都較低時(shí),該方法有助于發(fā)現(xiàn)新物質(zhì)和確定新物質(zhì)的特征.
獲取氣體熒光光譜的實(shí)驗(yàn)裝置參考我們前期的工作[7—12],飛秒激光脈沖入射到氣體中時(shí)由于自聚焦效應(yīng),在空氣中形成等離子體通道,即成“絲”現(xiàn)象出現(xiàn),絲狀脈沖光場內(nèi)的高密度能量使生化污染物分子發(fā)生非線性電離和解離,產(chǎn)生具有分子光譜特性的熒光光譜.經(jīng)透鏡會(huì)聚后被分光光度計(jì)(Acton Spect rapro2150)和CCD探測,得到混合氣體的非線性熒光光譜.實(shí)驗(yàn)中一個(gè)輸入脈沖激光能量為10 mJ、脈寬為50 fs,重復(fù)頻率為10 Hz.我們特別選取三種光譜十分接近的摻雜氣體,分別為乙烯(Ethylene),1-丁烯(1-Butene),N-丁烷(N-Butane).這三種氣體分別與空氣混合的體積比:乙烯為25%, 12.5%,6.25%,3.13%,1.56%,0.78%,0.39%, 0.20%,0.10%,0.049%(10個(gè)數(shù)據(jù));1-丁烯為25%,12.5%,6.25%,3.13%,1.56%,0.78%, 0.39%,0.20%,0.10%,0.05%(10個(gè)數(shù)據(jù));N-丁烷為12.5%,1.56%,0.78%,0.39%,0.20%,0.098%, 0.049%(7個(gè)數(shù)據(jù)),總共27條光譜數(shù)據(jù).
圖4 同種氣體的相似度與不同氣體的相似度 (a)0.78%乙烯光譜;(b)0.39%乙烯光譜;(c)0.78%與0.39%乙烯光譜相似度矢量;(d)0.78%乙烯光譜;(e)0.39%1-丁烯光譜;(f)0.78%乙烯光譜與0.39%1-丁烯光譜相似度矢量
原始光譜中含有大量噪聲,有必要進(jìn)行去噪處理.我們采用小波去噪的方法,將信號(hào)作五層分解,采用硬閾值函數(shù)對各層系數(shù)進(jìn)行處理,細(xì)節(jié)中絕對值較小的點(diǎn)置為零.我們前期的工作已經(jīng)驗(yàn)證了對于該類復(fù)雜熒光光譜,采用雙正交的bior3.9小波的濾波及重構(gòu)光譜均方誤差最小,且特征峰保留完好.本文依然采用bior3.9小波進(jìn)行壓縮去噪.最終光譜數(shù)據(jù)由3979個(gè)點(diǎn)壓縮為664個(gè)系數(shù),重構(gòu)后光譜的噪聲大大降低,信號(hào)特征更為明顯.
我們以乙烯氣體濃度為0.39%和0.78%的兩條譜為例分析一下它們的相似度.我們將0.78%乙烯光譜作為標(biāo)準(zhǔn)譜,0.39%乙烯光譜作為待匹配光譜進(jìn)行(1)至(6)式的運(yùn)算.圖4(a),(b),(c)顯示了采用小波去噪處理后兩氣體光譜和它們的相似度矢量.從圖中我們可以看出兩種濃度的氣體光譜在光譜強(qiáng)大的地方相似度很高,而在強(qiáng)度小的地方相似度則有高有低.
我們再以1-丁烯濃度為0.39%和乙烯濃度0.78%的兩條譜為例分析相似度.我們?nèi)匀粚?.78%乙烯光譜作為標(biāo)準(zhǔn)譜,將0.39%的1-丁烯光譜作為待匹配譜.圖4(d),(e),(f)顯示了兩氣體光譜和它們的相似度矢量.從圖中我們可以看出這兩種不同氣體的光譜在強(qiáng)度較大處特征峰處相似度依然很高,不論直接觀察或與圖4(a),(b),(c)的相似度進(jìn)行比較我們都難以明顯區(qū)分1-丁烯和乙烯兩種氣體譜的差別.因?yàn)橐蚁┡c1-丁烯兩種有機(jī)氣體的電離能很接近,主要化學(xué)鍵也接近,兩種氣體的主要官能團(tuán)也都為雙鍵,因此它們的譜很相似;且在很低濃度情況下,光譜中還包含大量空氣中各主要?dú)怏w成分的光譜,因此區(qū)分這兩種譜是有一定困難的.
根據(jù)2.2.7節(jié)的方法,我們利用同種物質(zhì)不同濃度的光譜構(gòu)造標(biāo)準(zhǔn)特征譜,平均相似度閾值ξ取0.5.圖5顯示了N-丁烷與1-丁烯氣體譜與構(gòu)造的標(biāo)準(zhǔn)特征譜.左圖為N-丁烷,我們只選取N-丁烷7條光譜中的2條為例.圖5(a),(b)光譜濃度為0.78%,0.05%.對應(yīng)的(c)圖為構(gòu)造的標(biāo)準(zhǔn)譜,忽略了幅度信息,構(gòu)造標(biāo)準(zhǔn)譜的“+”,“-”,“0”用斜率1,-1,0的線段來表示.(d),(e),(f)為1-丁烯各濃度光譜與構(gòu)造標(biāo)準(zhǔn)譜,其中的光譜選取3.13%, 0.05%為代表.
圖5 光譜與其構(gòu)造標(biāo)準(zhǔn)譜 (a)0.78%N-丁烷光譜;(b)0.05%N-丁烷光譜;(c)N-丁烷構(gòu)造標(biāo)準(zhǔn)譜;(d)3.13%1-丁烯光譜;(e)0.05%1-丁烯光譜;(f)1-丁烯構(gòu)造標(biāo)準(zhǔn)光譜
采用2.3節(jié)的方法計(jì)算三種氣體譜的分類特征點(diǎn)權(quán)重,圖6(a),(b),(c)顯示了三種氣體譜的分類特征點(diǎn)權(quán)重.我們以乙烯光譜權(quán)重為2的點(diǎn)3638—3653為例,直觀分析一下對應(yīng)光譜的特點(diǎn).圖6(d), (e),(f)顯示了濃度分別為1.56%與0.10%的N-丁烷、1-丁烯、乙烯氣體譜在點(diǎn)3638—3653附近的光譜.
圖6 氣體譜的分類特征點(diǎn)權(quán)重與三種譜在乙烯特征點(diǎn)3638—3653附近的光譜 (a)N-丁烷特征點(diǎn)權(quán)重;(b)1-丁烯特征點(diǎn)權(quán)重;(c)乙烯特征點(diǎn)權(quán)重;(d)N-丁烷示例光譜;(e)1-丁烯示例光譜;(f)乙烯示例光譜
從圖6中可以看出,在乙烯特征點(diǎn)權(quán)重為2的地方,乙烯譜與N-丁烷、1-丁烯譜有著明顯不同的特征,N-丁烷、1-丁烯譜在這些點(diǎn)處為明顯的峰而乙烯為明顯的谷,為我們區(qū)分乙烯與其他兩種譜提供了很大的幫助.從左圖中可以看出,乙烯有20多處特征權(quán)重為2的譜段,N-丁烷與1-丁烯也有10多處;特征權(quán)重1.5的地方更多.這些譜段都對應(yīng)明顯的特征峰,有助于我們鑒別污染氣體.
我們輪流用三種氣體27條光譜中的1條作為測試光譜,其余26條用來進(jìn)行2.2.7節(jié)與2.3節(jié)中標(biāo)準(zhǔn)譜的構(gòu)造與特征權(quán)重值的求解,用這條測試光譜與構(gòu)造的三種氣體標(biāo)準(zhǔn)譜進(jìn)行帶權(quán)重的匹配.權(quán)重只取2和1.5的部分,其余部分置為0.表2列出了27條光譜的相似程度.
表中編號(hào)1—7為N-丁烷濃度12.5%—0.05%,8—17為1-丁烯濃度25%—0.05%,18—27為乙烯濃度25%—0.05%.bta表示N-丁烷,bte表示1-丁烯,eth表示乙烯.加權(quán)相似度未進(jìn)行歸一化.
從表中我們可以看出,對27條光譜取相似度度最大匹配譜為分類結(jié)果,正確率為100%.這三種有機(jī)物光譜十分相似,特別是N-丁烷與1-丁烯這兩種物質(zhì),它們在化學(xué)結(jié)構(gòu)差別僅為一碳雙鍵與一個(gè)碳—碳鍵,在濃度很低的情況下,它們混合空氣譜的相似度更加接近.而本方法能很好地區(qū)分這兩種差別細(xì)微的物質(zhì),而且能計(jì)算物質(zhì)與物質(zhì)之間譜相似度的差異.在氣體濃度很低的時(shí)候,光譜淹沒在很大的噪聲中,而本實(shí)驗(yàn)中7,17,27號(hào)譜所對應(yīng)濃度分別為0.05%的N-丁烷、1-丁烯、乙烯譜,與其他濃度的譜相比,基于相似度分析的分類結(jié)果沒有顯著地變差,提示我們本方法有分析識(shí)別更低濃度氣體的能力.
表2 光譜的相似度分析
本文提出了一種新的光譜去噪、體征提取及分類的有效方法.研究了在空氣中混雜的各種濃度的乙烯、N-丁烷和1-丁烯氣體的分類算法,通過對三種氣體不同濃度的熒光光譜進(jìn)行小波壓縮去噪,得到5層664個(gè)小波系數(shù),重構(gòu)后可以獲得除噪效果滿意而特征信息保持不變的光譜.在此基礎(chǔ)上,經(jīng)對三種氣體光譜進(jìn)行特征峰/谷沿的匹配分析,我們提出一種利用同種物質(zhì)不同濃度下的光譜總體相似度來構(gòu)造標(biāo)準(zhǔn)特征譜新方法,通過與標(biāo)準(zhǔn)特征譜的匹配分析得到分類結(jié)果,該算法可用于解決其他類型復(fù)雜光譜的分類問題,特別對低濃度氣體的分類有很好的魯棒性.
[1]Shao GR,Jiao D M1996Zhejing Chemical27 37(in Chinese)[邵光榮、焦東苗1996浙江化工27 37]
[2]Zhao Z,Wang R Z,Sun T H1999Chin.Space Sci.and Tech.4 46 (in Chinese)[趙 忠、王榮宗、孫天輝1999中國空間科學(xué)技術(shù)4 46]
[3]Edner H,Fredriksson K,Sunesson A 1987Appl.Opt.26 4330
[4]Zhang GX,Zhao YF,Zhang YC,Zhao P T2008Acta Phys.Sin. 57 7390(in Chinese)[張改霞、趙曰峰、張寅超、趙培濤2008物理學(xué)報(bào)57 7390]
[5]Hu X Y,Zhong F C,Deng J 2001Acta Opt.Sin.21 641(in Chinese)[胡雪原、鐘方川、鄧 建2001光學(xué)學(xué)報(bào)21 641]
[6]Zhu S T,Zhang J L,Shen W D 1994Chinese Journal of Lasers21 678(in Chinese)[朱蒔通、章介倫、沈文達(dá)等1994中國激光21 678]
[7]Feng Z H,Fu XQ,ZhangL F,Xu H W,Wen S C2008Acta Phys. Sin.57 2253(in Chinese)[馮則胡、傅喜泉等2008物理學(xué)報(bào)57 2253]
[8]Cao S Y,Zhang Z G,Chai L,Wang Q Y,YangJ J,Zhu X N 2007 Acta Phys.Sin.56 2765(in Chinese)[曹士英、張志剛、柴路、王清月、楊建軍、朱曉農(nóng)2007物理學(xué)報(bào)56 2765]
[9]Yang S Z,Chen D Y2008Chin.Phys.B 17 817
[10]ShenJ Y,Han Y Z,Chang S J 2004Acta Opt.Sin.24 1000(in Chinese)[申金媛、韓應(yīng)哲、常勝江2004光學(xué)學(xué)報(bào)24 1000]
[11]Liu Y,Song C Y,Luo X S,Lu J,Ni X W 2007Chin.Phys.16 1300
[12]Su HJ,Du P J,Sheng Y H 2008Application Research of Computer 25 390(in Chinese)[蘇紅軍、杜培軍、盛業(yè)華2008計(jì)算機(jī)應(yīng)用研究25 390]
[13]Han Y Z,Li S M,Zhang Y X 2005J.Optoelectronics Laser16 710 (in Chinese)[韓應(yīng)哲、李素梅、張延2005光電子激光16 710]
[14]Han Y Z,Zhang Y X,Chang S J 2005J.Optoelectronics Laser16 718(in Chinese)[韓應(yīng)哲、張延、常勝江2005光電子激光16 718]
[15]Li S M,Han Y Z,Zhang Y X 2006Acta Opt.Sin.26 147(in Chinese)[李素梅、韓應(yīng)哲、張延2006光學(xué)學(xué)報(bào)26 147]
[16]Wang K,Zhang H,Chang S J,Shen J Y 2007Acta Phys.Sin.56 3613(in Chinese)[王 凱、張 會(huì)、常勝江、申金媛2007物理學(xué)報(bào)56 3613]
[17]WangJ H,Zheng Z,Zhang Y X 2007J.Optoelectronics Laser18 741(in Chinese)[王建華、鄭 震、張延2007光電子激光18 741]
[18]Yuan L 2008Chin.Phys.B 17 170
[19]Ding G,Zhong S S,Li Y2008Chin.Phys.B 17 1998
[20]Sun Y K 2005Wavelet Analysis and Application(Beijing:China Machine Press)p17(in Chinese)[孫延奎2005小波分析及其應(yīng)用(北京:機(jī)械工業(yè)出版社)第17頁](Received 9 March 2009;revised manuscript received 29 April 2009)
PACC:4230S,3350D
A classification method for nonlinear fluorescent spectra based on edges matching*
Chen Yang1)?Jia Li-Ping2)Zhang Tai-Ning1)Guo Peng1)Wang Xiang-Hui1)Chang Sheng-Jiang1)
1)(Institute Of Modern Optics,Key laboratory of Opto-electronic Information Science and Technology of Ministry of Education,Nankai University,Tianjin 300071,China)
2)(Shijiazhuang University of Economics,Shijiazhuang 050031,China)
A pre-process of feature extraction and classification approach based on spectrum edges matching is proposed to analyze the complicated nonlinear fluorescence spectra emitted by the interaction between femto-second(fs)laser and the impurities in air. The spectra data is denoised and compressedfrom3979 points to 664 points usingwavelet(WT)transform.By similarity analysis we create the characteristic spectra of 3 kinds of gases and the weights for classification.A new method of classification is proposed based on the edges matching and the comparison with characteristic spectra.Compared with existing methods,our method can not only get 100%classification accuracy,but also gives the characteristic position and the matching degree.The analysis of the matching degree shows that our method works well at low concentrations and has a potential application of identifying gases of lower concentration.
nonlinear fluorescence spectrum,feature matching,edges of spectrum
*國家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(973計(jì)劃)(批準(zhǔn)號(hào):2007CB310403);天津市自然科學(xué)基金重點(diǎn)項(xiàng)目(批準(zhǔn)號(hào):07JCZDJC05500);國家自然科學(xué)基金(批準(zhǔn)號(hào):60772105,10704043);河北省科技廳科技支撐項(xiàng)目(批準(zhǔn)號(hào):08213517D)資助的課題.
?通訊聯(lián)系人.E-mail:ych@mail.nankai.edu.cn
*Project supported by the National Basic Research Program of China(Grant No.2007CB310403),the Key Program of the Natural Science Foundation of Tianjin,China(Grant No.07JCZDJC05500),the National Natural Science Foundation of China(Grant Nos.60772105,10704043)and the Support Program of Science and Technology Department of Hebei Province(Grant No.08213517D).
?Corresponding author.E-mail:ych@mail.nankai.edu.cn