韓曉爽,劉德慶,欒曉寧,郭金家,劉永信,鄭榮兒*
1. 中國(guó)海洋大學(xué)光學(xué)光電子實(shí)驗(yàn)室,山東 青島 266100 2. 內(nèi)蒙古大學(xué)電子信息工程學(xué)院,內(nèi)蒙古 呼和浩特 010021
基于激光誘導(dǎo)時(shí)間分辨熒光的原油識(shí)別方法研究
韓曉爽1, 2,劉德慶1,欒曉寧1,郭金家1,劉永信2,鄭榮兒1*
1. 中國(guó)海洋大學(xué)光學(xué)光電子實(shí)驗(yàn)室,山東 青島 266100 2. 內(nèi)蒙古大學(xué)電子信息工程學(xué)院,內(nèi)蒙古 呼和浩特 010021
在柴油、汽油、重質(zhì)燃料油等成品油和原油等溢油油源的區(qū)分方面,熒光光譜結(jié)合模式識(shí)別手段得到了廣泛的應(yīng)用。傳統(tǒng)的三維熒光光譜分析方法雖然能夠獲得溢油樣品豐富的成分信息,但難以適應(yīng)現(xiàn)場(chǎng)應(yīng)用的要求,目前還停留在實(shí)驗(yàn)室檢測(cè)的階段。發(fā)展適用于現(xiàn)場(chǎng)應(yīng)用的原油識(shí)別方法,對(duì)于海洋溢油污染的快速響應(yīng)與處理意義重大。面向激光雷達(dá)的需要,發(fā)展了一種基于激光誘導(dǎo)時(shí)間分辨熒光手段、結(jié)合支持向量機(jī)(SVM)模型的原油識(shí)別方法,從時(shí)間和波長(zhǎng)兩個(gè)不同維度出發(fā),通過(guò)對(duì)時(shí)間窗口和波長(zhǎng)范圍的選取進(jìn)行優(yōu)化,獲得了理想的油種識(shí)別準(zhǔn)確率。實(shí)驗(yàn)結(jié)果表明通過(guò)選取ICCD探測(cè)延時(shí)為54~74 ns可以將分類正確率從全譜線數(shù)據(jù)的83.3%提高到88.1%。通過(guò)選取波長(zhǎng)范圍為387.00~608.87 nm的譜線數(shù)據(jù),可將疑似油種的分類正確率從全譜線數(shù)據(jù)的84%提高到100%。激光熒光雷達(dá)在實(shí)際工作中,受波浪、運(yùn)載平臺(tái)晃動(dòng)等因素的影響,探測(cè)延時(shí)會(huì)出現(xiàn)一定的波動(dòng)。本文介紹的分類識(shí)別方法通過(guò)時(shí)間和波長(zhǎng)兩個(gè)維度的篩選,更加適用于現(xiàn)場(chǎng)探測(cè)數(shù)據(jù)的識(shí)別,并進(jìn)一步凸顯了原油時(shí)間分辨熒光光譜特征,為疑似油種分類識(shí)別過(guò)程中數(shù)據(jù)量的壓縮提供了重要依據(jù)。
原油; 時(shí)間分辨熒光; 支持向量機(jī); 數(shù)據(jù)縮減
海上溢油污染是當(dāng)今全球海洋污染最嚴(yán)重的問(wèn)題之一,船舶漏油、水下油井井噴等方式都會(huì)造成嚴(yán)重的水域污染及財(cái)產(chǎn)損失、人體健康損害,近年來(lái)受到了越來(lái)越多的關(guān)注。針對(duì)日益嚴(yán)峻的海洋溢油問(wèn)題,準(zhǔn)確快速地鑒別溢油來(lái)源將為選擇適當(dāng)?shù)囊缬晚憫?yīng)措施提供重要科學(xué)依據(jù),也是解決溢油事故中各類責(zé)任糾紛的需要。
在目前眾多的海洋溢油探測(cè)手段中,激光熒光雷達(dá)是最有發(fā)展前途的技術(shù)手段之一。加拿大環(huán)境技術(shù)中心研制的SLEAF系統(tǒng),美國(guó)NASA與NOAA聯(lián)合研制的AOL系統(tǒng)[1]是目前成熟的面向海洋溢油檢測(cè)的系統(tǒng),中國(guó)海洋大學(xué)也研制了一套多通道激光雷達(dá)溢油檢測(cè)系統(tǒng)[2-3]。在不同油種的識(shí)別方面,激光熒光遙感手段具有明顯優(yōu)勢(shì)[4]。在柴油、汽油、重質(zhì)燃料油等成品油和原油等溢油油源的辨別方面,熒光光譜結(jié)合模式識(shí)別手段,如主成分分析(principal component analysis, PCA)[5-7]、人工神經(jīng)網(wǎng)絡(luò)[8]、平行因子分析(parallel factor analysis, PARAFAC)[9]、軟獨(dú)立建模分析(soft independent modelling of class analogy, SIMCA)[10]等得到了廣泛應(yīng)用。盡管上述模式識(shí)別手段與激發(fā)-發(fā)射光譜矩陣相互結(jié)合,獲得了比較理想的油種識(shí)別效果,但傳統(tǒng)熒光光譜探測(cè)方法難以適應(yīng)現(xiàn)場(chǎng)應(yīng)用對(duì)探測(cè)距離和效率的要求,目前還停留在實(shí)驗(yàn)室研究階段。此外,在現(xiàn)場(chǎng)探測(cè)中波浪、運(yùn)載平臺(tái)晃動(dòng)會(huì)導(dǎo)致激光雷達(dá)的探測(cè)延時(shí)出現(xiàn)波動(dòng),還有實(shí)驗(yàn)結(jié)果表明探測(cè)延時(shí)的變化還會(huì)導(dǎo)致熒光光譜峰位的移動(dòng),這使得區(qū)分原本輪廓相似的原油光譜更為困難。因此,發(fā)展適合于激光雷達(dá)的原油識(shí)別方法至關(guān)重要。
針對(duì)六種不同類型原油樣品的時(shí)間分辨熒光光譜,在結(jié)合支持向量機(jī)(support vector machines, SVM)模型的基礎(chǔ)上發(fā)展了一種面向激光雷達(dá)探測(cè)數(shù)據(jù)的油種識(shí)別方法,為激光誘導(dǎo)熒光技術(shù)應(yīng)用于海洋溢油現(xiàn)場(chǎng)探測(cè)提供支持。
1.1 儀器與樣品制備
采用實(shí)驗(yàn)室搭建的時(shí)間分辨熒光實(shí)驗(yàn)裝置[11],激發(fā)光源為Nd∶YAG脈沖激光器輸出的三倍頻激光(355 nm),光譜儀采用Andor公司的SR-303i型,光柵刻痕數(shù)150 l·mm-1,可實(shí)現(xiàn)的光譜分辨率為0.1 nm。ICCD采用Andor公司的DH720-18F-03型,其外觸發(fā)由激光器的調(diào)Q脈沖提供,用于觸發(fā)ICCD電子快門實(shí)現(xiàn)光譜數(shù)據(jù)采集。采集光譜的延時(shí)范圍為48~102 ns,步長(zhǎng)為1 ns。
實(shí)驗(yàn)所用樣品為勝利油田“渤601”、“埕北305”、“史138”、“坨167”、“鄭369”和“鄭氣3”六個(gè)井區(qū)的原油,樣品經(jīng)正己烷(色譜純)萃取后配制為0.5g·L-1的溶液并裝在比色皿中。
1.2 數(shù)據(jù)分析
SVM應(yīng)用核函數(shù)的展開定理,通過(guò)一定的非線性映射將樣本從低維的樣本空間映射到一個(gè)高維的特征空間(Hilbert空間),使得在特征空間中可以應(yīng)用線性方法解決樣本空間中高度非線性的回歸和分類問(wèn)題,即實(shí)現(xiàn)了數(shù)據(jù)的線性化,適用于本質(zhì)上是非線性的分類問(wèn)題以及樣本集較小的情況。由于樣品溶液中的熒光猝滅、原油復(fù)雜成分之間的相互作用、儀器的噪聲以及基線漂移等現(xiàn)象,光譜數(shù)據(jù)中帶有明顯的非線性特性,采用SVM可以獲得良好的分類結(jié)果。
考慮到樣本集較小,在模型的訓(xùn)練中均采用了交叉驗(yàn)證的方法,即選取訓(xùn)練集中某一個(gè)為測(cè)試樣本,其余為訓(xùn)練樣本進(jìn)行測(cè)試,再依次更換測(cè)試樣本直到所有的樣本都經(jīng)過(guò)循環(huán)。
本文選用LIBSVM工具箱實(shí)現(xiàn)SVM模型的建立,輸入未經(jīng)降維的原始光譜數(shù)據(jù),核函數(shù)選用徑向基函數(shù)(Radial Basis Function, RBF),懲罰系數(shù)c和gamma參數(shù)g的選取采用網(wǎng)格搜索法,即確定c和g的取值范圍與步進(jìn)間隔大小,然后依次取值,使得訓(xùn)練集識(shí)別率最高的參數(shù)設(shè)定為最佳參數(shù),再進(jìn)行檢測(cè)集的驗(yàn)證。
為了選取光譜特征明顯、便于區(qū)分的波長(zhǎng)范圍和延時(shí)區(qū)間,將時(shí)間分辨光譜數(shù)據(jù)分別降維為: 不同延時(shí)下的一系列發(fā)射光譜和不同波長(zhǎng)下熒光強(qiáng)度隨時(shí)間的演化,并分別對(duì)這兩組數(shù)據(jù)進(jìn)行分析。
2.1 光譜數(shù)據(jù)及預(yù)處理
六種原油的時(shí)間分辨光譜ICCD延時(shí)均設(shè)置為48~102 ns,間隔為1 ns,波長(zhǎng)范圍為275.54~843.17 nm。圖1為實(shí)驗(yàn)獲得的“渤601”原油樣品的典型時(shí)間分辨光譜,選取275.54~691.98 nm范圍內(nèi)的光譜進(jìn)行分析,以避免激發(fā)光(355 nm)的二級(jí)衍射對(duì)熒光光譜數(shù)據(jù)造成的干擾。對(duì)樣品熒光的時(shí)間分辨光譜進(jìn)行觀察時(shí),發(fā)現(xiàn)當(dāng)熒光從最大強(qiáng)度開始衰減時(shí),原油熒光光譜峰位存在紅移現(xiàn)象。這在一定程度上反映出原油中各熒光組分熒光衰減速率存在差異,或者存在熒光組分之間的能量傳遞[11]。實(shí)驗(yàn)所用所有樣品的時(shí)間分辨光譜信息如表1所示,其中熒光時(shí)域半高寬(FWHM)采用高斯線型擬合的方式獲得。
Fig.1 Time-resolved fluorescence spectra of Bo601 crude oil sample
Table 1 Characteristic parameters of crude oil samples
2.2 不同延時(shí)下的發(fā)射光譜(時(shí)間篩選)
根據(jù)ICCD延時(shí)不同,可以將時(shí)間分辨光譜降維為一系列355 nm波長(zhǎng)激發(fā)下的發(fā)射光譜,譜型隨延時(shí)的變化具有規(guī)律性。為取得具有代表性的分類結(jié)果,針對(duì)每種原油,從50 ns起每間隔3 ns選取一個(gè)譜線作為檢測(cè)集對(duì)分類模型進(jìn)行驗(yàn)證,其余時(shí)間點(diǎn)的譜線作為訓(xùn)練集對(duì)模型進(jìn)行訓(xùn)練。光譜譜線在進(jìn)行強(qiáng)度歸一化預(yù)處理后輸入分類模型。由于每種原油的延時(shí)為48~102 ns,共有55個(gè)譜線,因此訓(xùn)練集包含譜線樣本222個(gè),檢測(cè)集包含譜線108個(gè)。在分類識(shí)別問(wèn)題中,屬于樣本集較小的情況,同時(shí)考慮到在時(shí)間篩選的過(guò)程中需要不斷縮減樣本集中譜線的數(shù)量,樣本集中樣本個(gè)數(shù)進(jìn)一步縮小,同樣屬于樣本集較小的情況,適合采用SVM模型進(jìn)行訓(xùn)練與檢測(cè)。
由于六種原油樣品的輪廓相似且譜峰范圍相互重疊(見表1),分類模型受到了干擾。選取參數(shù)c和g分別為18 820.27和0.000 49時(shí),訓(xùn)練集交叉驗(yàn)證的正確率最高,為82.4%(如圖2所示)。此時(shí)檢測(cè)集的分類正確率為83.3%,全譜的識(shí)別結(jié)果如表2所示。
Fig.2 Grid search on c and g parameters for SVM model
Table 2 SVM classification results for different delays
觀察處理結(jié)果發(fā)現(xiàn)在不同的延時(shí)區(qū)間內(nèi)各油種的分類正確率差異很大,以正確率最低的“史138”和“鄭氣3”為例,ICCD延時(shí)為48~83 ns時(shí),正確率分別為83.3%和91.7%; ICCD延時(shí)為84~102 ns時(shí),正確率僅為50%和16.7%。因此,合理選擇延時(shí)區(qū)間可以提高分類準(zhǔn)確率。
經(jīng)過(guò)多次選擇最終確定取訓(xùn)練集與測(cè)試集樣本延時(shí)區(qū)間均為54~74 ns,經(jīng)過(guò)時(shí)間篩選后“渤601”原油樣品的時(shí)間分辨光譜如圖3所示,此時(shí)分類正確率提升為88.1%,具體的識(shí)別結(jié)果見表3所示。
Fig.3 Time-resolved fluorescence spectra of Bo601 crude oil sample after delay selection
Table 3 SVM classification results with delay selection
由于訓(xùn)練集譜線樣本數(shù)目的減少,SVM算法不能準(zhǔn)確提取出區(qū)分于其余種類的特征,“埕北305”和“鄭氣3”的分類正確率有所下降,但整體正確率有所提升。此外,當(dāng)ICCD延時(shí)為54~74 ns時(shí),對(duì)應(yīng)的是時(shí)間分辨光譜強(qiáng)度最高的時(shí)刻,這段時(shí)間內(nèi)各油種的光譜特征最為明顯,易于區(qū)分。
2.3 不同波長(zhǎng)下的熒光強(qiáng)度變化(波長(zhǎng)篩選)
將時(shí)間分辨熒光光譜降維為各發(fā)射波長(zhǎng)下強(qiáng)度隨時(shí)間變化的譜線。每種原油的波長(zhǎng)范圍為275.54~691.98 nm,從每10個(gè)譜線中選取一個(gè)作為檢測(cè)集,其余作為訓(xùn)練集,由于每種原油包含750個(gè)譜線,因此訓(xùn)練集包含譜線樣本4 050個(gè),檢測(cè)集包含譜線樣本450個(gè), 對(duì)全譜的分類結(jié)果見表4所示。
Table 4 SVM classification results for different wavelength
同樣,在不同的波長(zhǎng)范圍內(nèi)各油種的分類正確率差異很大,經(jīng)過(guò)多次選擇最終確定取訓(xùn)練集與測(cè)試集樣本波長(zhǎng)范圍為387.00~608.87 nm,經(jīng)過(guò)波長(zhǎng)篩選后的“渤601”原油樣品時(shí)間分辨光譜如圖4所示,該波長(zhǎng)范圍對(duì)應(yīng)的時(shí)間分辨光譜熒光信號(hào)較強(qiáng)。此時(shí)分類結(jié)果最好,識(shí)別率為100%。
Fig.4 Time-resolved fluorescence spectra of Bo601 crude oil sample after wavelength selection
將時(shí)間分辨熒光光譜從兩個(gè)不同的方向拆分為一系列二維光譜,針對(duì)這兩組不同的譜線數(shù)據(jù),分別采用SVM模型對(duì)勝利油田“渤601”、“埕北305”、“史138”、“坨167”、“鄭369”、“鄭氣3”六個(gè)井區(qū)的原油進(jìn)行識(shí)別,并通過(guò)時(shí)間篩選和波長(zhǎng)篩選方法提高了分類正確率。篩選后采用的ICCD延時(shí)和波長(zhǎng)范圍對(duì)應(yīng)的時(shí)間分辨光譜信號(hào)較強(qiáng),可作為原油時(shí)間分辨光譜的特征范圍,為今后時(shí)間分辨光譜的分類工作中原始數(shù)據(jù)的壓縮提供參考?;诩す饫走_(dá)的溢油探測(cè),包括現(xiàn)場(chǎng)波浪、平臺(tái)晃動(dòng)造成的延時(shí)波動(dòng)的證實(shí),以及激光熒光雷達(dá)數(shù)據(jù)的處理與油種識(shí)別,將是下一步工作的努力方向。
[1] Brown C E, Fingas M F. Marine Pollution Bulletin, 2003, 47(9): 477.
[2] LI Xiao-long, ZHAO Chao-fang, QI Min-jun, et al(李曉龍, 趙朝方, 齊敏珺, 等). Periodical of Ocean University of China(中國(guó)海洋大學(xué)學(xué)報(bào)), 2010, (8): 145.
[3] ZHAO Chao-fang, LI Xiao-long, MA You-jun(趙朝方, 李曉龍, 馬佑軍). Infrared and Laser Engineering(紅外與激光工程), 2011, 40(7): 1263.
[4] Leifer I, Lehr W J, Beatty D S, et al. Remote Sensing of Environment, 2012, 124: 185.
[5] Brown C E, Fingas M F. Marine Pollution Bulletin, 2003, 47(9): 477.
[6] Li J, Fuller S, Cattle J, et al. Analytica Chimica Acta, 2004, 514(1): 51.
[7] Brown C E, Marois R, Fingas, et al. International Oil Spill Conference, 2001. 917.
[8] LIN Bin, AN Ju-bai(林 彬,安居白). Marine Environmental Science(海洋環(huán)境科學(xué)), 2004, 23(1): 47.
[9] Christensen J H, Hansen A B, Mortensen J, et al. Analytical Chemistry, 2005, 77(7): 2210.
[10] Alostaz M, Biggar K, Donahue R, et al. Journal of Environmental Engineering and Science, 2008, 7(3): 183.
[11] LIU De-qing, LUAN Xiao-ning, HAN Xiao-shuang, et al (劉德慶, 欒曉寧, 韓曉爽, 等). Spectroscopy and Spectral Analysis(光譜學(xué)與光譜分析), 2015, 35(6): 1582.
*Corresponding author
Discrimination of Crude Oil Samples Using Laser-Induced Time-Resolved Fluorescence Spectroscopy
HAN Xiao-shuang1, 2, LIU De-qing1, LUAN Xiao-ning1, GUO Jin-jia1, LIU Yong-xin2, ZHENG Rong-er1*
1. Optics and Optoelectronics Laboratory, Ocean University of China, Qingdao 266100, China 2. College of Electronic Information Engineering, Inner Mongolia University, Huhhot 010021, China
The Laser-induced fluorescence spectra combined with pattern recognition method has been widely applied in discrimination of different spilled oil, such as diesel, gasoline, and crude oil. However, traditional three-dimension fluorescence analysis method, which is not adapted to requirement of field detection, is limited to laboratory investigatio ns. The development of oil identification method for field detection is significant to quick response and operation of oil spill. In this paper, a new method based on laser-induced time-resolved fluorescence combined with support vector machine (SVM) model was introduced to discriminate crude oil samples. In this method, time-resolved spectra data was descended into two dimensions with selecting appropriate range in time and wavelength domains respectively to form a SVM data base. It is found that the classification accurate rate increased with an appropriate selection. With a selected range from 54 to 74 ns in time domain, the classification accurate rate has been increased from 83.3% (without selection) to 88.1%. With a selected wavelength range of 387.00~608.87 nm, the classification accurate rate of suspect oil was improved from 84% (without selection) to 100%. Since the detection delay of fluorescence lidar fluctuates due to wave and platform swing, the identification method with optimizing in both time and wavelength domains could offer a better flexibility for field applications. It is hoped that the developed method could provide some useful reference with data reduction for classification of suspect crude oil in the future development.
Crude oil; Time-resolved fluorescence; Support vector machines; Data reduction
Oct. 31, 2014; accepted Feb. 25, 2015)
2014-10-31,
2015-02-25
國(guó)家自然科學(xué)基金項(xiàng)目(41406111)和國(guó)家海洋局海洋遙測(cè)工程技術(shù)研究中心創(chuàng)新青年基金項(xiàng)目(2013003)資助
韓曉爽,1990年生,內(nèi)蒙古大學(xué)信息科學(xué)與工程學(xué)院碩士研究生 e-mail: xiaoshuanghan@126.com *通訊聯(lián)系人 e-mail: rzheng@ouc.edu.cn
O433.4
A
10.3964/j.issn.1000-0593(2016)02-0445-04