王鵬,趙潤,孟祥輝,付學(xué)周,辛悅,寧天陽,趙文雅,楊仁杰,通信作者
(1.天津農(nóng)學(xué)院 工程技術(shù)學(xué)院,天津 300384;2.農(nóng)業(yè)農(nóng)村部 環(huán)境保護科研監(jiān)測所,天津 300191)
近年來,隨著奶牛養(yǎng)殖業(yè)的規(guī)?;?,奶牛場糞便集中排放所引起的環(huán)境污染問題日趨嚴(yán)重,糞便的出路問題亟待解決?,F(xiàn)階段主要緩解糞便積壓的途徑是將固體糞便進行堆漚和風(fēng)干以制備墊料,進而儲存在儲糞設(shè)施中以備補充墊料或還田。其中氮素為糞肥還田的重要指標(biāo),因此快速、準(zhǔn)確預(yù)知還田時氮素含量是糞肥安全科學(xué)還田的重要保障。
相比傳統(tǒng)實驗室分析方法,近紅外技術(shù)具有快速測定、使用簡單、靈活性強、可實現(xiàn)現(xiàn)場檢測等優(yōu)越性[1],已被應(yīng)用于畜禽糞便成分的檢測。樊霞[2]、崔蘭英[3]、Reeves[4]、Takashi等[5]都以牛糞作為試驗樣品,利用近紅外光譜技術(shù)預(yù)測其中的成分含量,取得了較好的預(yù)測效果。從國內(nèi)外文獻來看,已發(fā)表的論文大多圍繞同一育齡奶?;虿煌g奶牛同一環(huán)節(jié)糞便樣品的組分和含量進行近紅外光譜定量化預(yù)測分析,未見面向規(guī)?;膛黾S污治理全過程糞便樣品中總氮含量變化研究的相關(guān)報道。本研究旨在利用近紅外漫反射光譜技術(shù),基于偏最小二乘法(PLS)利用不同變量選擇方法進行建模變量選擇,并進行對比分析,建立一種規(guī)?;膛黾S污治理全過程糞便中總氮含量的定量分析模型。該研究對后續(xù)開發(fā)便攜式近紅外光譜儀實時、快速、有效地對規(guī)?;膛黾S污治理全過程糞便中總氮進行跟蹤和監(jiān)控具有重要的意義。
試驗設(shè)備:XCA-80001電熱鼓風(fēng)干燥箱、FW100型高速萬能粉碎機、福斯 2300凱氏定氮儀、美國PerkinElmer公司的傅立葉變換近紅外光譜儀、InGaAs檢測器以及儀器自帶積分球附件。于2018年10月16—21日,連續(xù)6天采集天津濱海新區(qū)某規(guī)?;膛黾S便處理全過程環(huán)節(jié)中的固態(tài)糞便和墊料樣品共計111個,包括各牛群階段的鮮糞、刮糞道與集糞溝臨界點的混合糞、固液分離機正下方分離后的糞便以及堆放在儲糞設(shè)施中的糞便(即墊料)。
對采集的 111個糞污治理全過程環(huán)節(jié)糞便樣品,使用XCA-80001電熱鼓風(fēng)干燥箱在55 ℃環(huán)境下烘干48 h后,用FW100型高速萬能粉碎機進行粉碎并過18目篩。參照2012版《有機肥料標(biāo)準(zhǔn)》中的第5.3條,采用福斯2300凱氏定氮儀對樣品中的總氮含量進行測定。111個牛糞樣品的總氮含量為 0.20%~3.86%,平均含量為 1.62%。光譜掃描范圍為4 000~12 000 cm-1,光譜掃描參數(shù)為:分辨率為8 cm-1,掃描間隔為2 cm-1,掃描次數(shù)為64,將糞便樣品裝入樣品杯中,并放置在積分球旋轉(zhuǎn)樣品臺上,以積分球內(nèi)置參比為背景,分別采集每一個樣品的近紅外漫反射光譜。分析軟件為Matlab2014a、Origin2017以及The Unscrambler9.7,其中所有算法均在 Matlab2014a中實現(xiàn),The Unscrambler9.7進行光譜數(shù)據(jù)預(yù)處理,Origin2017進行作圖。111個糞便樣品在4 000~12 000 cm-1范圍的近紅外漫反射光譜如圖1所示。
圖1 111個糞便樣品的近紅外漫反射光譜
異常樣品的存在對光譜數(shù)據(jù)與實驗室化學(xué)值之間的相關(guān)性會有較大影響,在建模過程中會降低模型對未知樣品的預(yù)測精度,因此剔除異常樣品十分重要。本研究通過蒙特卡羅交叉驗證法對111個奶牛糞便樣品進行計算,其均值方差分布如圖2所示,將方差大于0.2和均值大于0.5的樣品進行剔除,共17個樣品。
圖2 牛糞中全氮占比的均值-方差分布圖
對剔除后剩下的 94個樣品,利用 KS法[6-10]進行樣品集劃分。校正集樣品要具有代表性,待測樣品的光譜特征與性質(zhì)范圍應(yīng)被建模樣品所涵蓋。以校正集占2/3,預(yù)測集占1/3的比例進行劃分,校正集樣品63個,預(yù)測集樣品31個,算法選擇結(jié)果如表1,可以看出校正集的最大值大于預(yù)測集的最大值,最小值小于預(yù)測集的最小值,可以達到預(yù)測集被校正集所涵蓋的要求。
表1 校正集和預(yù)測集樣品中總氮含量分布
為選擇最佳的預(yù)處理方法,對94個樣品的原始漫反射光譜進行不同的預(yù)處理,包括:MCS、SG一階導(dǎo)數(shù)、SG一階導(dǎo)數(shù)與去噪結(jié)合,針對預(yù)處理后的數(shù)據(jù)分別建立相應(yīng)的PLS模型,通過對比來確定哪種預(yù)處理方法的建模效果較好。表2給出了3種預(yù)處理方法下建模的結(jié)果,最終確定SG一階導(dǎo)數(shù)與去噪結(jié)合這一預(yù)處理方法。
表2 3種預(yù)處理方法模型交叉驗證結(jié)果
將 SG一階導(dǎo)數(shù)+去噪處理后的漫反射光譜數(shù)據(jù),利用PLS建立奶牛糞便中總氮含量的定量分析模型,并利用所建模型對預(yù)測集的31個樣品進行預(yù)測,預(yù)測含量與真實含量的線性擬合關(guān)系如圖3所示,其中相關(guān)系數(shù)(R)為0.928,預(yù)測均方根誤差(Root-Mean-Square Error of Prediction,RMSEP)為0.161 3%。
圖3 預(yù)測集樣品中全氮預(yù)測含量和實際含量之間的線性擬合(4 000~12 000 cm-1)
將整個光譜區(qū)間分別分為16、17、……、24、25個子區(qū)間,表3列出了不同子區(qū)間建立局部模型的結(jié)果。從表3中可以看出,在第17個子區(qū)間上建立的局部模型預(yù)測能力最強,因此,選用這一光譜區(qū)間進行建立iPLS模型。用模型對31個預(yù)測集樣品進行預(yù)測,預(yù)測結(jié)果如圖 4所示,R為0.926,RMSEP為0.151 4%。
表3 不同子區(qū)間最佳局部模型的性能
圖4 預(yù)測集樣品中全氮預(yù)測含量和實際含量之間的線性擬合(iPLS)
將整個光譜區(qū)間分別分為10、11、……、19、20個子區(qū)間,并在每個子區(qū)間內(nèi)分別選取2個和3個區(qū)間進行組合,結(jié)果如表4,從表中可以看出,將整個光譜區(qū)間分成18個子區(qū)間,選取7、8和17這3個子區(qū)間進行建模的效果最好,其對應(yīng)的光譜波數(shù)范圍為 4 444~4 886 cm-1、8 440~8 882 cm-1和8 882~9 326 cm-1。選取這個范圍進行建模,并對31個預(yù)測集樣品進行預(yù)測,預(yù)測結(jié)果如圖5所示,R為0.928,RMSEP為0.149 1%。
表4 不同子區(qū)間最佳局部模型的性能
CARS方法是一種模仿達爾文進化理論“適者生存”原則的變量選擇新方法[11]。通過自適應(yīng)重加權(quán)采樣技術(shù)篩選PLS模型中回歸系數(shù)絕對值大的波長,剔除回歸系數(shù)絕對值小的波長,采用交互驗證建模選擇最優(yōu)波長變量子集[12]。本研究采用 CARS方法對全波長進行變量優(yōu)選,最大因子數(shù)設(shè)為 9,蒙特卡羅采樣次數(shù)為50。篩選過程如圖6所示。
圖6 a表示隨著運行次數(shù)的增加,被選中的建模變量的數(shù)量逐漸下降,下降趨勢先快后慢,體現(xiàn)出變量篩選的粗選與精選,其中運行次數(shù)和保留的變量數(shù)之間為指數(shù)關(guān)系[13]。圖6 b為篩選過程中交互驗證錯誤率的變化趨勢,其中在20次時獲得最小值而后開始逐步上升,上升的原因可能是篩選過程中剔除了一些比較關(guān)鍵的建模變量,導(dǎo)致RMSECV的值增大。圖6 c“*”所對應(yīng)的點與圖6 b中RMSECV最小值的點相對應(yīng),圖中各條曲線表示隨著運行次數(shù)的增加每個建模變量回歸系數(shù)的變化趨勢。
利用所選波長建立PLS模型,并對預(yù)測集進行預(yù)測,預(yù)測含量與真實含量的線性擬合關(guān)系如圖7所示。R為0.981,RMSEP為0.084 1%。根據(jù)R和RMSEP指標(biāo),與上述 3個模型相比,CARS-PLS模型的預(yù)測能力有了顯著提高。
圖6 奶牛糞便光譜波長變量篩選圖
圖7 預(yù)測集樣品中全氮預(yù)測含量和實際含量之間的線性擬合(CARS-PLS)
研究表明,利用近紅外漫反射光譜技術(shù)對規(guī)?;膛黾S污治理全過程糞便中總氮含量的預(yù)測是可行的。利用不同的變量選擇方法對全部光譜變量進行選擇,分別建立iPLS模型、siPLS模型和CARS-PLS模型。可以看出,相對于全波長模型,利用3種選擇變量的方法進行變量選擇后RMSEP值都有不同程度的降低,說明在變量選擇的過程中剔除了一些無關(guān)變量,使得模型預(yù)測精度提升。在3種變量選擇方法中,CARS法效果最好,對預(yù)測集樣品的預(yù)測結(jié)果與實際結(jié)果更為接近,R可達0.981,RMSEP為0.084 1%,為日后開發(fā)現(xiàn)場便捷式近紅外光譜儀器提供了理論基礎(chǔ)。