周 菲 王文軍 劉 巖 馬 軍 王 靜 吳立仁 關洪江 黃緒堂
(1黑龍江省農業(yè)科學院博士后科研工作站,150086,黑龍江哈爾濱;2黑龍江省農業(yè)科學院經濟作物研究所,150086,黑龍江哈爾濱)
向日葵(HelianthusannuusL.)是世界上最重要的油料作物之一。向日葵具有耐鹽堿、耐瘠薄和抗干旱等適應性強的特性,近年來,向日葵生產發(fā)展很快,現已成為僅次于大豆、油菜和花生的第四大油料作物[1]。我國栽培向日葵已有近400年的歷史[2],2018年全國向日葵年栽種面積92.135萬hm2,總產量249.42萬t[3],主要集中在東北、華北及西北“三北”地區(qū)。向日葵油是一種營養(yǎng)價值很高的食用油,向日葵種子脂肪含量很高,不飽和脂肪酸含量比大豆和花生等主要油料作物高,其中亞油酸含量為69%左右,為胡麻的4倍、油菜籽的3倍、花生的2倍以及大豆的1.8倍[4]。
油料作物種子脂肪含量影響食用油的產量,而脂肪酸組成決定了食用油的品質,因此研發(fā)精確、快速和無損檢測脂肪和各種脂肪酸含量的方法對于向日葵品質育種十分重要。目前測定種子脂肪和各脂肪酸含量的方法有索氏抽提法和氣相色譜法,化學方法雖然精確度較高,但存在測定之前需要甲酯化,預處理過程繁瑣,長鏈碳的酯較難氣化等問題[5],且待測的籽粒樣品要粉碎,無法再產生后代,不利于育種材料篩選。近紅外光譜(nearinfrared reflectance spectroscopy,NIRS)技術是利用有機化學物質內包含的各類含氫基團(CH、OH、NH和SH等)在近紅外光譜區(qū)差異特征的吸收光譜,是快速檢測樣品成分含量的一項技術[6]。對于NIRS這種方法,建立高質量的數據模型是確保檢測結果準確的必要條件。相比于傳統(tǒng)的檢測方法,NIRS方法具有分析快速、操作簡便、可多組分同時測定、籽實能在無污染和無損傷條件下進行分析等優(yōu)點,保證種子能正常繁殖接代,目前已廣泛應用于油菜、大豆、花生和亞麻等油料作物[7]。
本研究選取50份具有代表性的油用向日葵材料,構建定量分析向日葵籽仁脂肪和4種主要脂肪酸含量的近紅外光譜模型,可快速無損檢測油用向日葵種子的品質,對于油用向日葵種質資源快速篩選以及品質育種具有重要意義。
于2016年在黑龍江省農業(yè)科學院經濟作物研究所種質資源庫根據種子粒型和來源等,選取50份差異較大且具有代表性的油用向日葵材料,其中包括本單位選育的材料及國內外引進的資源(包括保持系、恢復系、雜交種和常規(guī)種)。
1.2.1 光譜采集 利用瑞典波通(Perten)公司型號為DA7200的二極管陣列近紅外光譜儀,首先設置儀器工作參數,譜區(qū)掃描范圍是950~1650nm,采樣間隔為1nm,掃描次數是32,SPC文件分辨率是5nm。利用Simplicity TM軟件采集光譜,利用The Unscrambler 9.8軟件進行數據分析和模型構建。對向日葵種子進行脫殼處理,儀器提前預熱30min,每個樣品掃描3次,重復裝樣3次,取平均光譜,保存后待分析。
1.2.2 脂肪和脂肪酸含量的測定 脂肪和主要脂肪酸(亞油酸、油酸、硬脂酸和棕櫚酸)含量的測定委托農業(yè)部谷物及制品質量監(jiān)督檢驗測試中心(哈爾濱)完成,將烘干后的樣品粉碎至粉末后,采用索氏提取法測定脂肪含量(干基),檢測方法按照NY/T 4-1982;利用氣相色譜儀YLSB076測定脂肪酸含量,檢測方法按照GB/T 17376-2008,每個樣品重復測定3次,最后取平均值為樣品成分含量的標準值。
1.2.3 近紅外光譜模型的建立 采用偏最小二乘法(partial least squares,PLS)進行模型的構建。為消除背景噪聲影響,使用各種光譜預處理方法優(yōu)化模型,包括多元信號矯正(MSC)、標準正則變換(SNV)、一階導數(1st)以及多種方法結合。模型的預測精度和穩(wěn)健性采用校正相關系數R2、預測相關系數R2、校正均方根誤差(RMSEC)和預測均方根誤差(RMSEP)這4個參數來評價。
由50份油用向日葵籽仁脂肪和4種脂肪酸含量結果(表1)可以看出,脂肪、亞油酸和油酸含量的標準差均≥4.31,標準差較大,表明用于建模的樣品這幾種成分含量分布合理,范圍較大,樣品具有代表性。硬脂酸和棕櫚酸含量的標準差分別為0.85和0.49,其標準差偏低,可能是由于向日葵籽仁自身硬脂酸和棕櫚酸含量較低,導致樣本間差異較小。
表1 向日葵籽仁脂肪和脂肪酸化學測定值的統(tǒng)計分析Table 1 Statistical analysis of fat and fatty acids by chemical determination in sunflower seed kernels
對50份向日葵籽仁樣品進行光譜采集,得到各樣品的原始光譜圖(圖1),各樣品吸光度均在0.5以下,不同波長下各樣品近紅外光譜的波峰、波谷和走勢相似,說明各樣品成分較為相似,油用向日葵種子中含有較多脂肪和蛋白質等有機物質。相同波長下樣品間的吸光度不完全重合,表明向日葵籽仁樣品間各組分含量具有差異性。
圖1 向日葵籽仁原始近紅外光譜Fig.1 Original near-infrared spectroscopy of sunflower seed kernels
為減小向日葵籽仁樣品不均勻產生的影響,消除光譜信號中的基線漂移、光散射和背景這些干擾信息及噪聲,提高模型的穩(wěn)健度,利用一階導數(1st)、標準正則變換(SNV)、一階導數結合標準正則變換(1st+SNV)以及多元信號矯正結合一階導數(MSC+1st)4種光譜處理方式,對原始光譜進行處理,比較并篩選向日葵籽仁各組分模型的最優(yōu)光譜處理方法。圖2為4種方法處理后的光譜,修正了光譜峰的偏移和漂移,光譜更緊密,輪廓更清晰。
圖2 4種方法預處理后的光譜Fig.2 Spectrum after pretreatment by four methods
定量模型的校正和預測相關系數R2越高,校正和預測均方根誤差(RMSEC和RMSEP)值越低,表明模型預測精準度越好。從不同光譜預處理方法所建近紅外模型的參數(表2)可以看出,經MSC+1st處理后的脂肪含量模型為最佳模型,校正和驗證相關系數R2分別為0.98和0.97,RMSEC和RMSEP分別為0.70和0.88;經MSC+1st處理后的亞油酸含量模型為最佳模型,校正和驗證相關系數R2分別為0.98和0.97,RMSEC和RMSEP分別為0.49和0.71;經過1st+SNV處理后的油酸含量模型為最佳模型,校正和驗證相關系數R2分別為0.98和 0.96,RMSEC和RMSEP分別為0.68和0.99;經過1st處理后的硬脂酸含量模型為最佳模型,校正和驗證相關系數R2分別為0.92和0.83,RMSEC和RMSEP分別為0.25和0.37;經過SNV處理后的棕櫚酸含量模型為最佳模型,校正和驗證相關系數R2分別為0.82和0.74,RMSEC和RMSEP分別為0.18和0.23。上述結果顯示脂肪、亞油酸和油酸所建最佳模型相關系數均大于0.96,且具有較低的均方根誤差,說明籽仁脂肪、亞油酸和油酸含量與近紅外光譜具有極強的相關性,而硬脂酸和棕櫚酸所建最佳模型相關系數相對較低,但也均大于0.74(圖 3)。
表2 不同預處理方法的籽仁脂肪及4種主要脂肪酸含量模型結果Table 2 Results of the models of fat content and four main fatty acids of seed kernels by using different pretreatment methods
圖3 向日葵籽仁脂肪和4種脂肪酸含量最佳模型校正(左)和預測(右)相關圖Fig.3 Correlation diagrams of calibration (left) and prediction (right) for the optimum model of fat and four fatty acids in sunflower seed kernels
隨機選取10份未參與建模的油用向日葵材料,利用相同方法對籽仁脂肪和脂肪酸含量進行測定,并利用所建模型進行成分含量的預測,通過比較樣本的化學值和近紅外預測值(表3),結果發(fā)現,脂肪、亞油酸和油酸近紅外預測值與化學值之間相對誤差在1.25%~8.15%之間,均在10%以下,表明模型預測準確度較高,能夠滿足樣品成分含量的快速測定,硬脂酸和棕櫚酸近紅外預測值與化學值之間相對誤差在4.66%~17.99%之間,可用于樣品成分含量的初步預測。
表3 10份材料化學值與近紅外預測值比較Table 3 Comparison of the chemical values and the predicted values of near-infrared of ten materials %
構建模型所用樣品的成分含量范圍決定了模型適應性,成分含量范圍必須要盡可能廣泛,才可以保證未來利用模型測定樣品的數值不會發(fā)生異?;虺霈F較大偏差[8],本研究構建的硬脂酸和棕櫚酸的模型相關系數偏低,可能是由于向日葵種子中本身這2種成分含量較低,且變異幅度小,致使建模挑選樣品的代表性不夠好,同時由于其含量低,在利用化學方法測定中容易造成誤差,導致化學值準確性低,進而影響了模型的質量[9]。向日葵種子脂肪酸組成除品種之間差異外,還受到多種因素的影響,如溫度[10-11]、土壤含鹽量[12]、播種期和播種密度[13],本研究中硬脂酸和棕櫚酸含量分布范圍較小,除由于材料自身特性外,也可能是由于環(huán)境因素影響所導致。本研究沒有將脂肪和脂肪酸含量表現為極值的向日葵材料作為建模樣品,主要因為這種類型樣品量太少,與其他樣品之間成分差異太大,只有積累較多此類樣品后才能加入到定標集中,未來我們將通過增加樣品的數量從而擴大樣品的變異幅度,對其進行進一步的優(yōu)化及完善。
不同光譜預處理方法會影響近紅外分析模型的精準度,所以選擇最佳的預處理方法十分重要。一般使用的光譜預處理方法包括SNV、MSC、1st、二階導數和標準化處理法(normalization)等以及各種預處理方法的組合[14]。單?;ㄉN子近紅外模型建立發(fā)現一階導數結合多元信號矯正是棕櫚酸和亞油酸光譜的最優(yōu)預處理方法,一階導數結合矢量歸一化是油酸光譜的最優(yōu)預處理方法[15]。茶油脂肪酸組分近紅外模型構建發(fā)現油酸和α-亞麻酸采用SNV預處理,十七烷酸和硬脂酸采用SNV和1st預處理,棕櫚酸和不飽和脂肪酸采用1st和趨近歸一化(normalization by closure)預處理所構建模型較好[16]。油用牡丹種仁脂肪酸近紅外模型建立發(fā)現,油酸最優(yōu)光譜預處理方法是SNV+1st,亞油酸是MSC+1st,亞麻酸是MSC,棕櫚酸是SNV[17],這與本研究中油酸、亞油酸和棕櫚酸最佳光譜預處理方法是一致的。
NIRS在向日葵中的研究很早就有報道。我們之前分別對向日葵完整種子、籽仁和粉末構建向日葵粗蛋白含量的近紅外光譜模型,發(fā)現相比于完整種子,籽仁和粉末模型預測的精確度更高[18],因此為保證操作簡便和結果準確,本研究選擇了脫殼后的籽仁進行模型構建。關于向日葵脂肪酸含量近紅外模型的研究已有一些報道,Sato等[19]發(fā)現NIRS定量分析的準確性較高,利用向日葵籽仁建立的脂肪酸近紅外模型相關系數R2達到0.993。Velasco等[20]建立了向日葵籽仁可靠的脂肪酸測定模型,采用交叉驗證評估硬脂酸、油酸和亞油酸建模效果,R2在0.83~0.93之間,這個研究實現了向日葵籽仁脂肪酸含量的無損單粒檢測。Fassio等[21]構建向日葵種子水分、脂肪和蛋白NIRS模型,其R2在0.90~0.96之間。Pérez-Vich等[22]構建向日葵完整種子、籽仁、粉末和葵花油的NIRS模型,其中籽仁、粉末和葵花油預測結果較好,籽仁模型R2在0.90~0.97之間。汪磊等[23]建立向日葵籽仁粗蛋白、粗脂肪、油酸和亞油酸等重要品質性狀的近紅外模型,其R2在0.913~0.975之間。本研究利用最佳光譜預處理方法構建的脂肪、亞油酸和油酸含量的近紅外模型相關系數R2在0.96~0.98之間,相比于前人的研究,該模型的相關系數較高,說明模型具有較好的預測能力。盡管研究者已經構建了一些向日葵品質預測的近紅外模型,但近紅外技術模型在不同作物、不同設備及同一設備不同環(huán)境下,都不具有通用性[23],而且模型的應用性還與建模樣品生長氣候、生長條件和收獲季節(jié)等有關[8],因此,本研究構建的NIRS模型,更適用于本地區(qū)氣候條件下進行油用向日葵種質資源品質鑒定和快速篩選,可加快品質育種進程。
采用無處理及4種光譜預處理方法構建向日葵種子脂肪及4種脂肪酸含量的近紅外模型,其中近紅外掃描光譜與脂肪、亞油酸和油酸含量化學測定結果的相關性較高,采用最佳光譜預處理方法,校正和驗證相關系數都大于0.96,且RMSEC和RMSEP都較低,近紅外預測值與化學值間相對誤差均在10%以下,能夠滿足樣品成分含量的快速測定。而硬脂酸和棕櫚酸模型近紅外掃描光譜與化學測定結果的相關性相對偏低,校正相關系數分別為0.92和0.82,驗證相關系數分別為0.83和0.74,但RMSEC和RMSEP值均較低,近紅外預測值與化學值間相對誤差在4.66%~17.99%之間,可用于樣品成分的初步預測。