李淥潔 劉航 王英鴻
摘 要:材料的紅外光譜包含大量信息,屬于高維度數(shù)據(jù)。從復(fù)雜的近紅外光譜樣本中消除無用信息、提取關(guān)鍵特征是近紅外光譜建模領(lǐng)域中不易攻克的關(guān)鍵技術(shù)。依據(jù)獲取的透射近紅外光譜信息建立小麥含水量模型,采用小波分析手段,選取最佳小波系數(shù),優(yōu)化了模型結(jié)構(gòu),提高了模型對(duì)含水量的預(yù)測精度。
關(guān)鍵詞:小波分析;近紅外光譜;小波系數(shù);特征提取
1 概述
物質(zhì)的光譜樣本蘊(yùn)含了大量信息。近紅外光譜與物質(zhì)的物理性質(zhì)、化學(xué)成分相關(guān),同時(shí)還會(huì)受到共線性、散射、照明光強(qiáng)等因素的影響。因此,在包含大量信息的近紅外光譜信號(hào)中發(fā)掘出有用的特征信息是光譜分析方法的重要技術(shù)難點(diǎn)。傅里葉分析在處理高維度近紅外光譜數(shù)據(jù)時(shí),出現(xiàn)了運(yùn)算量大、誤差大的問題。傳統(tǒng)的傅里葉分析方法無法滿足近紅外光譜建模的需求。相較于傅里葉變換,小波分析具有明顯的優(yōu)勢,能根據(jù)實(shí)際需求快速、準(zhǔn)確地提取信號(hào)中的特征信息。我們將小波分析引入到近紅外建模領(lǐng)域,開展了理論分析與實(shí)際應(yīng)用。
光譜特征信息提取是在復(fù)雜的多維光譜數(shù)據(jù)中獲得有用的分類信息。光譜特征提取要實(shí)現(xiàn)兩個(gè)目標(biāo):一減小內(nèi)類差異,二增大類間差異[1]。這兩個(gè)指標(biāo)是評(píng)價(jià)一種光譜特征提取方法優(yōu)劣的主要依據(jù)。光譜特征信息提取的目的是將材料光譜信號(hào)與環(huán)境噪聲相分離,獲取有用的光譜信號(hào),進(jìn)而分析出材料的化學(xué)特性。光譜分析技術(shù)中,對(duì)光譜特征信息提取是首要環(huán)節(jié),提取出的信息被用于物質(zhì)分類識(shí)別,并能得出物質(zhì)的量化數(shù)值。因此,光譜特征提取是光譜分析的先決因素。
從工程的角度分析,小波變換,與傅里葉變換一樣,都是集合時(shí)域、頻域等多種概念的信號(hào)特征提取方法[2]。小波理論是在多學(xué)科、多領(lǐng)域技術(shù)交叉融合的基礎(chǔ)上建立起來的[3]。
2 實(shí)驗(yàn)與數(shù)據(jù)
實(shí)驗(yàn)平臺(tái):分光器、探測器、漫反射信號(hào)收集器和近紅外光源構(gòu)成了光譜探測核心裝置,再配合光學(xué)耦合器件、計(jì)算機(jī)等輔助設(shè)備繼而能開展近紅外光譜建模實(shí)驗(yàn)。借助此套裝置,通過光譜信號(hào)采集、數(shù)據(jù)預(yù)處理、光譜模型建立等步驟實(shí)現(xiàn)對(duì)小麥樣品水分的定量分析。
小麥樣品放置于冰柜內(nèi),冷藏至4℃。光譜數(shù)據(jù)采樣之前,避免環(huán)境溫度對(duì)近紅外光譜的影響,環(huán)境溫度嚴(yán)格控制在20℃。儀器提前開機(jī)1小時(shí),確保采樣時(shí)儀器處于穩(wěn)定的工作狀態(tài)。光譜采樣前,測量標(biāo)準(zhǔn)白板光譜,修正光譜儀測量誤差。MCS611NIR光纖光譜儀對(duì)每個(gè)樣品進(jìn)行3次測試,取平均值。
圖2為小波變換光譜特征提取流程示意圖,光譜提取分為兩步:
小麥近紅外光譜建波及特稱提取過程:針對(duì)近紅外光譜采用PLS建模,求解出校正集和對(duì)應(yīng)驗(yàn)證集的R2與RMSE的數(shù)值,選取coif、db、sym三種基本函數(shù)對(duì)近紅外光譜進(jìn)行小波變換。根據(jù)計(jì)算結(jié)果,決定選擇的小波函數(shù)為db5,分解尺度為5。
整個(gè)小波系數(shù)19-55,58-72,96-114三個(gè)區(qū)間構(gòu)成一個(gè)大區(qū)間,內(nèi)部蘊(yùn)含了大量特征信息,分析大區(qū)間的光譜數(shù)據(jù)能獲得小麥水分含量的精準(zhǔn)數(shù)據(jù)數(shù)值。重新組合各類系數(shù),對(duì)光譜信號(hào)進(jìn)行重構(gòu),重構(gòu)光譜如圖3所示。再使用PLS方法校正模型,則校正集為R2=0.9812,RMSE=0.2523,對(duì)應(yīng)的驗(yàn)證集為R2=0.9758,RMSE=0.2910。根據(jù)此結(jié)果可以看出,選取19-55,58-72,96-114三個(gè)區(qū)間為小波系數(shù)時(shí),相對(duì)應(yīng)的校正集與驗(yàn)證集為最優(yōu)組合,所構(gòu)造的模型精準(zhǔn)度最高,對(duì)小麥水分的預(yù)測準(zhǔn)確度最高。
3 結(jié)束語
文章采用小波分析法對(duì)小麥透射光譜進(jìn)行光譜特征信息提取,預(yù)測小麥的含水量。選取小波系數(shù)(19-55,58-72,96-114),優(yōu)化模型,使校正集結(jié)果(R2=0.9812,RMSE=0.2523)和驗(yàn)證集結(jié)果(R2=0.9758,RMSE=0.2910)達(dá)到最佳狀態(tài)。以此對(duì)紅外光譜進(jìn)行重構(gòu),提高了對(duì)小麥含水量的預(yù)測精度。
參考文獻(xiàn)
[1]熊智新.基于小波變換的化學(xué)譜圖數(shù)據(jù)處理[D].浙江:浙江大學(xué),2004.
[2]葛哲學(xué),沙威.小波分析理論與MATLABR2007實(shí)現(xiàn)[M].電子工業(yè)出版社,2007,1.
[3]田高友,袁洪福,劉慧穎,等.小波變換在近紅外光譜分析中的應(yīng)用進(jìn)展[J].光譜學(xué)與光譜分析,2003,23(6):1111-1114.
作者簡介:李淥潔(1987-),女,吉林長春人,職稱:研究實(shí)習(xí)員,學(xué)歷:碩士,主要研究方向:光子學(xué)與光電子技術(shù)。