鄭一航 宋 濤 張 順 郭麗君 張鳳枰
(四川威爾檢測(cè)技術(shù)股份有限公司1,成都 610041) (通威股份有限公司水產(chǎn)畜禽營(yíng)養(yǎng)與健康養(yǎng)殖農(nóng)業(yè)農(nóng)村部重點(diǎn)實(shí)驗(yàn)室2,成都 610093) (通威股份有限公司水產(chǎn)健康養(yǎng)殖四川省重點(diǎn)實(shí)驗(yàn)室3,成都 610093)
玉米干全酒糟(DDGS)是以玉米為原料,由酵母發(fā)酵蒸餾提取酒精后將剩余的殘液(含至少四分之三以上的可溶性固形物)濃縮干燥后所得的產(chǎn)品。玉米DDGS具有高能、高蛋白、營(yíng)養(yǎng)價(jià)值高等特點(diǎn),且產(chǎn)量大、質(zhì)優(yōu)價(jià)廉,已成為一種倍受關(guān)注的新型飼料原料。為了充分利用其價(jià)值,快速、準(zhǔn)確測(cè)定玉米DDGS主要營(yíng)養(yǎng)成分含量尤為重要。近年來,近紅外光譜分析技術(shù)日益成熟,已被廣泛應(yīng)用于動(dòng)物飼料營(yíng)養(yǎng)成分測(cè)定[1-6]。然而,實(shí)際應(yīng)用時(shí),近紅外光譜分析技術(shù)易受到如儀器類型、環(huán)境條件、樣品狀態(tài)和裝樣方式等因素影響,從而影響所建預(yù)測(cè)模型的效果和適用性[7]。因此,建立良好的玉米DDGS近紅外定量分析預(yù)測(cè)模型并實(shí)現(xiàn)在不同型號(hào)儀器間的共享,有利于降低建模成本、提高預(yù)測(cè)模型的利用效率。目前已在飼料[8-11]、糧油[12,13]、煙草[14]和模型轉(zhuǎn)移算法[15]等領(lǐng)域開展了模型轉(zhuǎn)移研究,取得了良好的效果,但鮮有關(guān)于玉米DDGS營(yíng)養(yǎng)成分NIRS預(yù)測(cè)模型轉(zhuǎn)移的報(bào)道。研究玉米DDGS營(yíng)養(yǎng)成分預(yù)測(cè)模型在近紅外儀器之間的轉(zhuǎn)移,旨在為飼料生產(chǎn)企業(yè)近紅外儀器升級(jí)換代提供預(yù)測(cè)模型轉(zhuǎn)移方法的參考,降低近紅外儀器運(yùn)行成本,提升近紅外儀器的使用效率。
采集2018—2019年國(guó)產(chǎn)玉米DDGS樣品215個(gè),樣品來自通威股份有限公司華東、華南、華西、華北、華中等地區(qū)飼料分公司。所有樣品采用FW100型高速萬能粉碎機(jī)粉碎,全部過40目篩,混合均勻,裝入密閉容器中,2~4 ℃保存。其中200個(gè)樣品為定標(biāo)集樣本,15個(gè)樣品為外部驗(yàn)證集樣本。
水分:GB/T 6435—2014直接干燥法,101-1AB型電熱鼓風(fēng)干燥箱;粗蛋白質(zhì):GB/T 6432—2018,Kjeltec 2300全自動(dòng)凱式定氮儀;粗脂肪:GB/T 6433—2006,Soxtec2055脂肪測(cè)定儀;氨基酸:GB/T 18246-2000酸水解法,L-8900全自動(dòng)氨基酸分析儀。每種成分測(cè)定時(shí)均做2次平行實(shí)驗(yàn)。
玉米DDGS樣品近紅外光譜數(shù)據(jù)采集分別采用DS2500F型近紅外分析儀(以下簡(jiǎn)稱2500F)、TR 3750-5000型近紅外分析儀(以下簡(jiǎn)稱5000),主要參數(shù)見表1。
光譜數(shù)據(jù)采集前,取出樣品于室溫下平衡24 h,分別使用兩種型號(hào)近紅外分析儀掃描以收集光譜數(shù)據(jù),每個(gè)樣品均掃描3次,取其平均光譜。
表1 近紅外分析儀主要參數(shù)
利用FOSS WinISI Ⅲ建模軟件,通過選擇全光譜范圍[16],為消除光譜信號(hào)的基線漂移、隨機(jī)噪音及顆粒度不均勻造成的影響,參考國(guó)內(nèi)外近紅外建模文獻(xiàn)[17-19],根據(jù)不同組分特性,采用標(biāo)準(zhǔn)正態(tài)化和散射處理(SNVD)、導(dǎo)數(shù)處理方法[20]、數(shù)據(jù)間隔點(diǎn)、平滑處理間隔點(diǎn)、二次平滑處理間隔點(diǎn)等方法進(jìn)行光譜預(yù)處理。根據(jù)主成分分析計(jì)算出馬氏距離(FOSS WinISI Ⅲ 軟件均以Global H表示,簡(jiǎn)稱GH),剔除GH≥3.0的異常光譜。采用改進(jìn)偏最小二乘法(MPLS),以內(nèi)部交互驗(yàn)證的方式建立定標(biāo)模型,再經(jīng)過定標(biāo)樣品集校正預(yù)測(cè)模型,剔除預(yù)測(cè)值與化學(xué)值的絕對(duì)差大于定標(biāo)平均誤差2倍的化學(xué)異常值,以最高交互驗(yàn)證決定系數(shù)1-VR和最低交互驗(yàn)證標(biāo)準(zhǔn)差(SECV)值確定最佳定標(biāo)模型。
2500F型和5000型近紅外分析儀由于波段范圍和分辨率的不同,必須對(duì)寬范圍光譜進(jìn)行裁剪,與窄范圍光譜波段保持一致(1 100~2 500 nm),分辨率轉(zhuǎn)換為2 nm。用2500F型儀器掃描定標(biāo)樣品集得到原始光譜建立預(yù)測(cè)模型(簡(jiǎn)稱2500F原始模型),將2500F原始模型直接轉(zhuǎn)移到5000型儀器使用。
本研究近紅外光譜轉(zhuǎn)移理論是采用多元校正轉(zhuǎn)移方法(direct standardization, DS),分別在源機(jī)和目標(biāo)機(jī)上采集標(biāo)準(zhǔn)光譜(Xm,Xs),建立兩者光譜之間的函數(shù)關(guān)系Xm=Xs*F,F(xiàn)為m×m轉(zhuǎn)換矩陣(m為波長(zhǎng)點(diǎn)數(shù)),利用最小二乘法原理求解轉(zhuǎn)換矩陣F,通過F轉(zhuǎn)換,實(shí)現(xiàn)建模光譜的轉(zhuǎn)移,即與目標(biāo)機(jī)光譜一致[21]。以2500F型近紅外分析儀為主儀器,5000型近紅外分析儀為從儀器,利用WinISI Ⅲ 軟件對(duì)近紅外光譜建立標(biāo)準(zhǔn)化文件的方法實(shí)現(xiàn)原始光譜的轉(zhuǎn)移[22]。取10個(gè)具有代表性的樣品分別在兩臺(tái)儀器掃描獲得光譜,分別求其平均光譜為標(biāo)準(zhǔn)光譜,以2500F光譜為Host文件,5000型儀器為Master文件建立標(biāo)準(zhǔn)化文件,通過軟件Apply single sample STD功能將2500F型主儀器原始光譜利用標(biāo)準(zhǔn)化文件轉(zhuǎn)移到5000型從儀器上,使轉(zhuǎn)移后的光譜與5000原始光譜基本保持一致,用轉(zhuǎn)移后的新光譜建立新的預(yù)測(cè)模型。
原始模型與轉(zhuǎn)移模型均采用交互驗(yàn)證標(biāo)準(zhǔn)差SECV、交互驗(yàn)證決定系數(shù)1-VR(1-VR)、系統(tǒng)偏差(Bias)來評(píng)價(jià)。分別用化學(xué)分析法和已建立的近紅外模型測(cè)定15個(gè)玉米DDGS樣品,根據(jù)樣品光譜的馬氏距離(GH)對(duì)模型光譜匹配度做判斷,GH≥3.0時(shí),光譜匹配度低模型不可用;GH<3.0時(shí),光譜匹配度高模型可用;同時(shí)通過濕化學(xué)檢測(cè)值與預(yù)測(cè)值成對(duì)樣本的t檢驗(yàn)[23],進(jìn)一步評(píng)判模型的預(yù)測(cè)性能和可靠性[24]。
定標(biāo)集、外部樣品驗(yàn)證集玉米DDGS樣品的營(yíng)養(yǎng)成分測(cè)定結(jié)果見表2。
由圖1可知,2500F原始光譜的吸光度明顯高于5000儀器原始光譜的吸光度,說明2500F與5000的原始光譜存在較大差異;2500F轉(zhuǎn)移到5000的光譜與5000原始光譜比較,相差較小,即相似度較高。通過研究直接轉(zhuǎn)移模型與通過光譜轉(zhuǎn)移模型的適用性,探討兩臺(tái)不同儀器之間的模型共享的最佳方法。通過定標(biāo)樣品集在兩種機(jī)型掃描所得原始光譜及2500F轉(zhuǎn)移到5000儀器上的轉(zhuǎn)移光譜分別建立預(yù)測(cè)模型,其中2500F原始光譜所建模型直接轉(zhuǎn)移到5000為模型A,5000原始光譜所建模型為模型B,2500F原始光譜轉(zhuǎn)移到5000后所建模型為模型C。
表2 玉米DDGS樣品營(yíng)養(yǎng)成分含量測(cè)定結(jié)果
圖1 近紅外掃描樣本平均光譜圖對(duì)比
2.3.1 原始預(yù)測(cè)模型建立
對(duì)5000原始光譜的水分、粗蛋白質(zhì)、粗脂肪進(jìn)行建模,不同的光譜預(yù)處理方法對(duì)應(yīng)的預(yù)測(cè)模型參數(shù)見表3。結(jié)果表明,參數(shù)為“2,4,4,1”的光譜預(yù)處理方法所得預(yù)測(cè)模型效果最佳;同理驗(yàn)證谷氨酸、甘氨酸、賴氨酸是參數(shù)為“1,4,4,1”的光譜預(yù)處理方法所得預(yù)測(cè)模型效果最佳。根據(jù)結(jié)論,采用改進(jìn)偏最小二乘法通過剔除化學(xué)值異常的樣品光譜建立5000原始預(yù)測(cè)模型(模型B),參數(shù)見表4。采用同樣的方法,建立2500F原始預(yù)測(cè)模型(模型A),參數(shù)見表5。
表3 5 000原始光譜不同光譜預(yù)處理方法對(duì)應(yīng)的預(yù)測(cè)模型參數(shù)
表4 5 000原始光譜建立預(yù)測(cè)模型參數(shù)
表5 2 500F原始光譜建立預(yù)測(cè)模型參數(shù)
2.3.2 光譜轉(zhuǎn)移后預(yù)測(cè)模型建立
根據(jù)DS方法將2500F原始光譜實(shí)現(xiàn)光譜轉(zhuǎn)移,轉(zhuǎn)移到5000儀器上后,采用與原始模型一致的光譜預(yù)處理方法,采用改進(jìn)偏最小二乘法經(jīng)過兩輪異常值剔除建立預(yù)測(cè)模型(模型C)并與模型B各參數(shù)對(duì)比如表6所示。
通過SECV和1-VR值來看,模型B與模型C無顯著差異;同時(shí)發(fā)現(xiàn)模型C的粗蛋白質(zhì)、粗脂肪、賴氨酸的SECV值比模型B更小,1-VR值比模型B更接近1。說明轉(zhuǎn)移后的水分、粗蛋白質(zhì)、粗脂肪預(yù)測(cè)模型具有良好的預(yù)期效果。
表6 光譜轉(zhuǎn)移后建立預(yù)測(cè)模型C與5000原始預(yù)測(cè)模型B各參數(shù)對(duì)比
2.3.3 外部樣品集驗(yàn)證光譜轉(zhuǎn)移建立的預(yù)測(cè)模型
衡量預(yù)測(cè)模型效果的統(tǒng)計(jì)參數(shù)除了SECV和1-VR外,還包括通過外部樣品集驗(yàn)證轉(zhuǎn)移后預(yù)測(cè)模型光譜匹配度、系統(tǒng)偏差(Bias)、濕化學(xué)檢測(cè)值與預(yù)測(cè)值的差異性。取15個(gè)驗(yàn)證集樣品,用5000掃描得到近紅外光譜,分別用2500F原始預(yù)測(cè)模型直接轉(zhuǎn)移到5000儀器上(模型A)、5000原始預(yù)測(cè)模型(模型B)和2500F光譜轉(zhuǎn)移5000所建預(yù)測(cè)模型(模型C)進(jìn)行模擬驗(yàn)證,各預(yù)測(cè)模型經(jīng)外部樣品驗(yàn)證各參數(shù)對(duì)比如表7所示。
表7 三種模型經(jīng)外部樣品驗(yàn)證各參數(shù)對(duì)比
外部驗(yàn)證樣品在5000儀器掃描所得光譜使用模型A均報(bào)警嚴(yán)重(GH≥3),是由于2500F和5000的檢測(cè)器、波數(shù)精度不一樣,2500F原始模型是根據(jù)2500F原始光譜進(jìn)行建立的,而通過圖1又知,2500F的原始光譜的吸光度明顯高于5000原始光譜,說明二者差異較大,2500F儀器原始模型直接轉(zhuǎn)移到5000儀器上應(yīng)用光譜匹配度低,不能適用于日常分析;使用模型B無報(bào)警樣品,使用模型C只有1個(gè)樣品報(bào)警(GH≥3),兩者差異不顯著,說明2500F(寬波段)轉(zhuǎn)移到5000(窄波段)后光譜與5000原始光譜基本一致,說明要想實(shí)現(xiàn)2500F儀器所建模型與5000儀器共享,不能將2500F原始模型直接轉(zhuǎn)移到5000儀器上,必須先進(jìn)行光譜轉(zhuǎn)移才能實(shí)現(xiàn)較好的模型傳遞。由于模型A不能應(yīng)用于日常分析,因此本研究中未統(tǒng)計(jì)模型A的系統(tǒng)偏差、t統(tǒng)計(jì)值。通過系統(tǒng)偏差(Bias)來看,模型B與模型C基本一致;對(duì)濕化學(xué)分析值與預(yù)測(cè)值進(jìn)行成對(duì)樣本t檢驗(yàn),如表7所示,經(jīng)查表t0.05(28)=2.048,t
本研究探討了玉米DDGS水分、粗蛋白質(zhì)、粗脂肪、谷氨酸、甘氨酸、賴氨酸等指標(biāo)近紅外光譜模型從2500F原始近紅外光譜轉(zhuǎn)移到5000上所建預(yù)測(cè)模型適用性和共享問題。從定標(biāo)模型交互驗(yàn)證標(biāo)準(zhǔn)差(SECV)、交互驗(yàn)證決定系數(shù)(1-VR)、光譜匹配度(GH)、系統(tǒng)偏差(Bias)以及濕化學(xué)分析值與預(yù)測(cè)值差異等參數(shù)來看,2500F原始光譜轉(zhuǎn)移到5000后所建預(yù)測(cè)模型與5000原始光譜所建預(yù)測(cè)模型效果基本一致。因此,從2500F原始光譜轉(zhuǎn)移到5000后所建玉米DDGS水分、粗蛋白質(zhì)、粗脂肪、谷氨酸、甘氨酸、賴氨酸等指標(biāo)的預(yù)測(cè)模型是可以替代5000原始預(yù)測(cè)模型的,能適用于日常分析。實(shí)現(xiàn)模型共享,可極大提高建模效率、模型利用率、降低運(yùn)行成本。另外,不同型號(hào)的近紅外分析儀的預(yù)測(cè)模型轉(zhuǎn)移方法略有不同,需多維度評(píng)價(jià)轉(zhuǎn)移模型的適用性來實(shí)現(xiàn)模型共享。