• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于CARS變量選擇方法的小麥硬度測定研究

      2021-01-29 04:55:52姜明偉王彩紅張慶輝
      關鍵詞:蒙特卡洛交叉校正

      姜明偉,王彩紅,張慶輝

      河南工業(yè)大學 信息科學與工程學院,河南 鄭州 450001

      小麥硬度的常用測定方法有顆粒度指數(shù)法(PSI)、單籽粒谷物特性測定儀法(SKCS)、近紅外光譜法(NIR)等。田素梅[1]對利用小麥硬度測定儀和NIR法測定小麥硬度的兩種方法進行比較,發(fā)現(xiàn)兩者具有極顯著的正相關。陳鋒等[2]利用NIR法對583種小麥樣品進行硬度測定,利用一階導數(shù)處理的光譜建立的最小二乘法模型效果最好,模型對硬、軟、混合麥的分級準確率分別為90%、83%、63%?;瘜W測定方法和近紅外光譜法都有較好的相關性,但建模的預測集標準誤差較大,不適用于直接檢測。袁翠平等[3]采用SKCS法和NIR法對54個小麥品種的籽粒硬度進行測定,兩種方法相關系數(shù)R為0.87?;輳V艷等[4]基于可見近紅外光譜的SPA-RBF神經(jīng)網(wǎng)絡模型能夠準確地預測小麥的硬度,具有快速、方便、無損等優(yōu)點。

      利用偏最小二乘法查找自變量小麥硬度光譜矩陣X和因變量小麥實際硬度矩陣Y的線性關系。作者采用小麥指數(shù)硬度儀測定小麥硬度實際值,利用近紅外分析儀對小麥硬度光譜數(shù)據(jù)進行采集,再用一階導數(shù)進行預處理,在不降低預測性的基礎上提取有效光譜數(shù)據(jù),建立小麥樣品硬度的PLS預測模型,旨在為快速檢測小麥硬度提供理論方法。

      1 原料與儀器

      1.1 原料

      65種豫麥:河南鄭州中原國家糧食儲備庫。

      1.2 儀器

      JYDB 100×40型小麥指數(shù)硬度儀:鄭州中谷機械設備有限公司;DA 7250近紅外分析儀:瑞典波通公司。

      2 數(shù)據(jù)采集

      2.1 小麥近紅外光譜數(shù)據(jù)采集

      將65種豫麥置于水分含量為12%的干燥環(huán)境中,以供光譜數(shù)據(jù)的采集[5-7]。采用近紅外分析儀采集小麥光譜數(shù)據(jù),分析儀采用銦鎵砷光電二極管陣列技術,固定全息光柵分光,進行連續(xù)光柵光譜檢測,光源為鹵鎢燈,光譜波段為950~1 650 nm,采用固定式杯裝小麥樣本進行光譜測量。使用的光譜采集軟件為Results Plus,光譜分辨率為0.5 nm。儀器開機預熱0.5 h,穩(wěn)定紅外光源,以保證小麥光譜數(shù)據(jù)更準確。光譜數(shù)據(jù)處理軟件為Matlab R2016a、The Unscrambler X10.4。小麥硬度光譜數(shù)據(jù)采集結(jié)果如圖1所示。

      注:R為反射率。圖1 小麥硬度光譜數(shù)據(jù)采集結(jié)果Fig.1 Spectral data acquisition

      2.2 小麥實際硬度數(shù)據(jù)采集

      為建立小麥近紅外光譜數(shù)據(jù)和小麥實際硬度值之間的預測分析模型,對小麥實際硬度值進行測定。小麥實際硬度值按照GB/T 21304方法,利用小麥硬度指數(shù)儀測量。最終測得65種豫麥硬度指數(shù)(HI)結(jié)果如表1所示。

      3 數(shù)據(jù)預處理

      測定小麥實際硬度會產(chǎn)生誤差,采用蒙特卡洛交叉驗證法[8]對誤差硬度值進行剔除。為保證預測模型具有代表性和外推能力,采用光譜理化值共生距離(set partitioning based on joint X-Y distances,SPXY)[9]做進一步優(yōu)選,劃分模型的校正集和預測集,最大限度的降低樣本的共線性。為削弱各種目標因素對目標光譜的影響,保留有效信息,提高光譜分辨率和模型的穩(wěn)健性,降低模型的復雜度,對校正集樣本進行一階導數(shù)預處理[10-11],在此基礎上建立偏最小二乘法的小麥硬度預測模型(CARS-PLS模型)。

      3.1 蒙特卡洛交叉驗證法剔除異常小麥實際硬度值

      小麥硬度值在化學測定時會不可避免地產(chǎn)生誤差,所得的硬度值會影響模型的預測精度,導致模型誤差大,因此采用蒙特卡洛交叉驗證法剔除異常的硬度值。蒙特卡洛交叉驗證法共建立1 000個PLS模型,每個模型隨機選取52種小麥作為校正集樣本,建立校正集小麥光譜數(shù)據(jù)和實際硬度值的偏最小二乘法模型[12-13],對剩下的13種預測集小麥樣本進行硬度值預測,得到小麥硬度的預測殘差標準差(STD)與均值(MEAN),結(jié)果如圖 2所示。

      表1 65種豫麥樣本實際硬度值Table 1 Actual hardness values of wheat samples

      圖2 蒙特卡洛交叉驗證法剔除結(jié)果Fig.2 Elimination results of Monte Carlo cross-validation method

      最終剔除STD>0.4,MEAN>1的異常數(shù)據(jù),由圖2可知,小麥編號13、22、47、49、55、56、58共7個為異常值,對剩下的58個小麥樣本進行建模分析。

      3.2 樣品集合劃分

      建模需要將樣本劃分為校正集和預測集,校正集用來建立模型,預測集用來檢驗建立的模型。常見的樣本集合劃分方法有隨機抽樣法、常規(guī)選擇法、Kennard-Stone(K-S)法等,為保證預測模型的代表性和外推能力,采用光譜理化值共生距離(SPXY)劃分模型的校正集和預測集,最大限度的降低樣本的共線性。

      式中:p和q表示任意兩個樣品的編號;N是總的樣品數(shù);j為光譜波點;dx(p,q)表示兩條光譜數(shù)據(jù)的空間距離;dy(p,q)表示對應小麥樣品p,q實際硬度之間的距離。

      SPXY法選擇樣本時,確保了x空間和y空間的樣本分布,計算兩種樣本的聯(lián)合空間距離dxy。

      采用SPXY法將剔除異常小麥硬度值后的58個樣本分為校正集和預測集,其中校正集46個,預測集12個。樣本統(tǒng)計結(jié)果如表2所示。從表2可看出,校正集樣本的硬度最大值為68.5%,最小值與整體樣本相同,為57.2%,平均值(65.2%)小于整體樣本,標準差(2.07)大于整體樣本,說明校正集分布均勻,具有足夠的代表性。校正集樣本硬度值范圍在57.2%~68.5%之間,涵蓋了預測集樣本最大值和最小值,符合建模標準。

      表2 小麥SPXY集合劃分結(jié)果Table 2 Wheat SPXY set division results

      3.3 CARS變量優(yōu)選

      CARS算法[14-15]是以達爾文進化論的“適者生存”為指導理論的變量方法。通過蒙特卡洛采樣法篩選PLS模型中回歸系數(shù)絕對值大的變量,應用衰減指數(shù)法剔除回歸系數(shù)絕對值小的波長,基于自適應加權算法 (adaptive reweighted sampling, ARS)選取交叉驗證的均方根誤差 (root mean square error of cross validation, RMSECV) 最小的模型所對應的波長變量子集。本研究中蒙特卡洛采樣次數(shù)設置為50次。

      4 模型建立及預測結(jié)果

      4.1 模型評價參數(shù)

      建立近紅外光譜模型后對預測集樣本進行預測,最終通過得到的參數(shù)來評價模型。本研究選取3個模型評價參數(shù):預測相關系數(shù)(R)、交叉驗證均方根誤差(RMSECV)、預測均方根誤差(RMSEP)。R反映模型實際值與預測值之間的擬合程度,R越接近1,表明預測值和實際值的擬合度正相關,模型的準確度越高。RMSECV用來驗證模型的可行性,計算預測模型的誤差,RMSECV越小,表明所建模型的預測能力越強。RMSEP表示預測集樣本經(jīng)模型預測所得的預測值與實際值之間的誤差,RMSEP越小,表明模型預測效果越佳。

      4.2 CARS-PLS模型建立及結(jié)果

      采用CARS方法對校正集全光譜進行變量篩選,最終篩選出110個特征波點,占原波點數(shù)(1 401)的7.85%,隨著采樣次數(shù)增加,變量數(shù)、RMSECV和每個變量回歸系數(shù)路徑如圖3所示。

      注:*表示RMSECV最小時的采樣次數(shù)。圖3 CARS變量選擇Fig.3 CARS variable selection

      由圖3a可知,隨著采樣次數(shù)的增加,采樣次數(shù)小于20時,采樣變量數(shù)快速遞減,采樣次數(shù)大于20時,采樣變量數(shù)慢速遞減,說明算法在篩選變量有精選和粗選過程。

      圖 3b是十折交叉驗證RMSECV變化趨勢,隨著采樣次數(shù)的增加,PLS交叉驗證RMSECV值先遞減又遞增的變化,其中采樣次數(shù)在20時達到最小值,為0.158 5。表明在1~19次,近紅外光譜中與小麥硬度值大量的無關信息被剔除,31次后,RMSECV明顯遞增,表明剔除了光譜中有效數(shù)據(jù)導致模型性能變差。

      圖 3c表示1 401個變量隨著采樣次數(shù)的增加回歸系數(shù)的路徑變化,采樣次數(shù)為20所得的變量子集定為與小麥硬度相關的關鍵變量子集,包含110個變量。

      利用CARS方法篩選出的特征變量作為PLS模型的輸入變量,采用留一交叉法確定最優(yōu)因子數(shù),采用最優(yōu)因子數(shù)建立CARS-PLS預測模型,并對預測集進行性能比較。由表2可知, CARS-PLS模型中預測集R和RMSEP分別為0.884 3、0.543 6,F(xiàn)ull-PLS全變量模型預測集R和RMSEP分別為0.863 1、0.574 9,兩個模型都可以較好地對小麥硬度進行預測,前者模型對小麥硬度的預測能力略低于后者,但是CARS-PLS模型僅僅使用了全變量的7.85%的變量,這有助于建模的簡單、穩(wěn)定,在不降低預測性的基礎上很大幅度降低了計算量。綜上,CARS-PLS能夠有效測定小麥硬度,CARS對波長選擇能力很強,能夠有效剔除無關變量。

      表3 偏最小二乘法回歸模型性能Table 3 Performance of partial least squares regression model

      5 結(jié)論

      小麥硬度近紅外光譜經(jīng)過CARS進行特征變量選擇,最終在1 401個特征變量中選取了110個進行分析比較。結(jié)果表明,通過CARS進行變量選擇建立的PLS模型性能略低于全光譜建立的PLS模型性能,但是CARS-PLS模型僅僅使用了全變量的7.85%的變量,這有助于建模的簡單、穩(wěn)定,在不降低預測性的基礎上很大幅度降低了計算量。CARS-PLS模型的校正集R和RMSEP分別為0.931 7和0.570 8,預測集R和RMSEP分別為0.884 3和0.543 6,該模型對快速無損檢測小麥硬度具有使用推廣價值。

      猜你喜歡
      蒙特卡洛交叉校正
      劉光第《南旋記》校正
      國學(2020年1期)2020-06-29 15:15:30
      征服蒙特卡洛賽道
      “六法”巧解分式方程
      一類具有校正隔離率隨機SIQS模型的絕滅性與分布
      機內(nèi)校正
      利用控制變量方法縮減蒙特卡洛方差
      連一連
      蒙特卡洛模擬法計算電動汽車充電負荷
      基于蒙特卡洛的非線性約束條件下的優(yōu)化算法研究
      基于Fast-ICA的Wigner-Ville分布交叉項消除方法
      計算機工程(2015年8期)2015-07-03 12:19:54
      溧水县| 什邡市| 利辛县| 全南县| 衡南县| 洱源县| 剑阁县| 九龙县| 昭通市| 和田县| 静宁县| 丰都县| 辽宁省| 嘉荫县| 京山县| 八宿县| 万宁市| 普定县| 林周县| 吴堡县| 涪陵区| 从江县| 松阳县| 灵川县| 高平市| 乐清市| 桐城市| 河北省| 马山县| 隆安县| 胶南市| 涞源县| 隆林| 定兴县| 广汉市| 梓潼县| 加查县| 塔城市| 买车| 海盐县| 辽宁省|