劉 飛,楊春艷,謝建新
1.玉溪師范學(xué)院物理系,云南 玉溪 653100 2.玉溪師范學(xué)院化學(xué)系,云南 玉溪 653100
紅外光譜和逐步判別分析法應(yīng)用于油菜籽的研究
劉 飛1,楊春艷1,謝建新2
1.玉溪師范學(xué)院物理系,云南 玉溪 653100 2.玉溪師范學(xué)院化學(xué)系,云南 玉溪 653100
用傅里葉變換紅外光譜(FTIR)和逐步判別分析法對油菜籽的品種和產(chǎn)地進(jìn)行鑒別研究。測試了來自5個(gè)產(chǎn)地17個(gè)油菜籽品種188份油菜籽皮樣品的紅外光譜,按產(chǎn)地和品種選擇訓(xùn)練樣本,每個(gè)品種選擇5份為訓(xùn)練樣本,剩下的作為測試樣本,選擇1 800~950 cm-1范圍的光譜信息,在SPSS20.0的判別分析模塊中采用逐步法,F(xiàn)isher線性判別準(zhǔn)則,分別建立油菜籽品種和產(chǎn)地的鑒別模型來判別樣品的品種和產(chǎn)地; 比較了逐步判別分析中五種篩選建模信息的算法所建立的模型對實(shí)驗(yàn)樣品品種和產(chǎn)地的鑒別效果。基于油菜籽皮紅外光譜信息的品種判別分析,五種篩選變量的算法所建立的模型都能較好的識別油菜籽的品種,“Wilks’ Lambda”法所建模型的識別效果最好,判別正確率為97.9%?;谟筒俗哑ぜt外光譜信息的產(chǎn)地判別分析,五種篩選變量的算法所建立的產(chǎn)地判別模型也都能較好的識別油菜籽的產(chǎn)地,“Unexplained variance”法所建模型的識別效果最好,判別正確率為98.4%。研究結(jié)果表明,基于油菜籽皮中紅外光譜信息的品種和產(chǎn)地判別分析,有望成為油菜籽品種和產(chǎn)地鑒別的方法。
紅外光譜; 逐步判別分析; 油菜籽; 研究
油菜籽是我國最重要的食用油料來源,富含蛋白質(zhì)、脂肪、維生素、礦物質(zhì)等營養(yǎng)物質(zhì)。蛋白質(zhì)含量為21%~30%,粗脂肪含量為30%~50%; 含有的維生素包括維生素E、維生素B1、維生素B2、煙酸、葉酸、泛酸等; 含有的氨基酸組成平衡合理,人體必需的氨基酸如賴氨酸和含硫氨基酸等含量高; 另外還含有鈣、鎂、磷、硒、錳、鋅、鐵、銅、碘等營養(yǎng)元素。我國是世界油菜生產(chǎn)的第一大國,年均種植面積1.1億~1.2億畝,總產(chǎn)1 050萬噸左右[1]。油菜產(chǎn)業(yè)的發(fā)展,不僅能保障我國13億人口的食用植物油來源,也可為養(yǎng)殖業(yè)提供優(yōu)質(zhì)的蛋白飼料來源,同時(shí)由于和水稻等主要糧食作物輪作,有利于培肥土壤。另外,油菜產(chǎn)業(yè)的發(fā)展對現(xiàn)代工業(yè)、食品、醫(yī)藥保健、生物能源以及生態(tài)景觀等方面也有重要意義。油菜籽的品質(zhì)受品種、產(chǎn)地、種植技術(shù)等因素的影響,美國和歐盟等都要求食品能夠進(jìn)行跟蹤和溯源[2-3],我國也要求進(jìn)口的食品需載明原產(chǎn)地[4]。因此,對油菜籽的品種及產(chǎn)地進(jìn)行鑒別研究具有實(shí)際意義。
油菜籽品種和產(chǎn)地的傳統(tǒng)鑒別方法主要是形態(tài)法和化學(xué)成分分析法。形態(tài)法主要根據(jù)油菜籽外形和油菜生長過程中的形態(tài)變化來進(jìn)行判別,耗時(shí)長且主觀性強(qiáng); 化學(xué)成分分析法需對樣品分離提取,復(fù)雜和繁瑣,耗時(shí)長,不適合大批量快速鑒別。通過現(xiàn)代分子技術(shù)進(jìn)行鑒別,也要分離提取,而且專業(yè)性強(qiáng),費(fèi)用昂貴[5]; 通過近紅外光譜技術(shù)進(jìn)行鑒別,需要建模,模型對儀器的專屬性強(qiáng),不穩(wěn)定[5]。傅里葉變換紅外光譜(FTIR)技術(shù)具有靈敏度高、重復(fù)性好,樣品用量少、無需提取分離,儀器操作簡便、快速等優(yōu)點(diǎn)。樣品的光譜信息中能反映樣品的品種、產(chǎn)地、種植和加工等方面的綜合信息,已廣泛應(yīng)用于真菌和細(xì)菌菌株[6-7]、中藥[8]、農(nóng)副產(chǎn)品[9]等多方面的鑒別與分析,但紅外光譜對油菜籽產(chǎn)地的鑒別研究尚未見報(bào)道。油菜籽包含皮和仁兩部分,以往雖然用仁的紅外光譜結(jié)合光譜檢索方法直觀的鑒別了油菜籽的不同品種[10],但該方法還不夠直接,且由于仁的光譜中脂類物質(zhì)和蛋白質(zhì)類物質(zhì)的光譜信息較強(qiáng),可能掩蓋了能較好反映油菜籽產(chǎn)地和品種的一些弱信息,因此需要用皮的光譜來繼續(xù)研究鑒別油菜籽的方法。判別分析是一種實(shí)用、有監(jiān)督的分類方法[11],已廣泛應(yīng)用于經(jīng)濟(jì)、醫(yī)學(xué)、煙草等方面[12-14],基于紅外光譜信息的判別分析應(yīng)用于油菜籽品種和產(chǎn)地的研究尚未發(fā)現(xiàn)。本實(shí)驗(yàn)以油菜籽皮的紅外光譜為觀測量,采用逐步判別分析法分別建立模型對油菜籽品種和產(chǎn)地進(jìn)行鑒別研究,以期能為油菜籽的品種和產(chǎn)地鑒別提供實(shí)用方法。
1.1 儀器與測試條件
傅里葉變換紅外光譜儀,由美國PE公司生產(chǎn)、Frontier型,裝備DTGS檢測器; 選擇4 cm-1的光譜分辨率,4 000~400 cm-1為光譜掃描范圍,重復(fù)掃描16次。在Omnic8.0軟件中進(jìn)行光譜數(shù)據(jù)處理,在SPSS20.0軟件的判別分析模塊中進(jìn)行逐步判別分析。
1.2 樣品制備
實(shí)驗(yàn)油菜籽樣品來自5個(gè)產(chǎn)地,涉及17個(gè)品種,其中9個(gè)品種產(chǎn)自云南玉溪,由玉溪市農(nóng)業(yè)科學(xué)研究院提供; 有5個(gè)品種產(chǎn)自云南羅平,由羅平縣的種業(yè)部門提供; 浙江紹興品種有3個(gè),在紹興的種業(yè)部門購得; 四川成都品種有2個(gè),在成都的種業(yè)部門購得; 湖南長沙品種有2個(gè),在長沙的種業(yè)部門購得。分離各產(chǎn)地各品種油菜籽樣品的皮和仁,按每份樣品由約20粒油菜籽的皮組成,每個(gè)品種制作5到15份樣品,共制作188份樣品。將每份樣品放入瑪瑙研缽磨為細(xì)粉,并加入溴化鉀粉末研磨均勻,然后壓片測定光譜。表1為各實(shí)驗(yàn)樣品的品種名稱、產(chǎn)地及其編號。
表1 實(shí)驗(yàn)樣品的品種名稱、產(chǎn)地及編號
2.1 油菜籽皮的紅外光譜
圖1 各品種油菜籽第1份皮樣品的紅外光譜
2.2 紅外光譜與逐步判別分析法對油菜籽品種和產(chǎn)地的研究
紅外光譜能夠反映油菜籽皮中所有組分的整體信息,這些信息中隱含著油菜籽的品種、產(chǎn)地和種植技術(shù)等信息,光譜的每一個(gè)數(shù)據(jù)點(diǎn)代表一個(gè)信息變量, 通過基于油菜籽皮紅外光譜的模式識別分析,可建立能夠?qū)τ筒俗训钠贩N和產(chǎn)地進(jìn)行鑒別的快速方法。判別分析是一種有監(jiān)督的分類識別方法,先通過已知分類情況的樣本及其特征信息來建立分類模型,再用未知分類樣本的同種信息來進(jìn)行分類預(yù)測[11]。逐步判別法是判別分析中的一種,能夠按照規(guī)定算法對提供的樣本信息進(jìn)行計(jì)算判斷,篩選對分類影響大的信息來建立分類判別模型。在SPSS20.0的逐步判別分析中,篩選樣本信息來建立分類模型的算法共設(shè)置有五種,即“Wilks’ Lambda”,“Unexplained variance”,“Mahalanobis distance”,“Smallest F ratio”和“Rao’s V”。實(shí)驗(yàn)以油菜籽皮的紅外光譜信息為樣本特征,采用逐步判別分析法來對油菜籽的品種和產(chǎn)地進(jìn)行鑒別研究,同時(shí)比較了篩選信息變量采用不同方法所建判別模型的鑒別效果。
2.2.1 基于油菜籽皮紅外光譜信息的品種判別分析
以油菜籽皮在1 800~950 cm-1范圍的425個(gè)光譜變量為樣本特征,對全部188個(gè)樣品17個(gè)品種按產(chǎn)地和品種選擇訓(xùn)練樣本,每個(gè)品種選擇5份為訓(xùn)練樣本,其余的作為測試樣本,依據(jù)Fisher線性判別準(zhǔn)則,用逐步判別分析中的不同算法來篩選樣本信息變量分別建立分類模型,進(jìn)行油菜籽品種的鑒別比較。表2為挑選信息變量的不同算法所挑選的變量情況。由表2知,逐步判別分析中挑選樣本信息的不同算法從425個(gè)信息變量中挑選的變量和變量個(gè)數(shù)存在明顯差異,說明不同算法所建立的品種判別模型不相同。表3為不同算法所建立的判別分析模型對油菜籽樣本進(jìn)行品種鑒別的情況。表3反映,五種不同算法所建立的判別分類模型,對實(shí)驗(yàn)油菜籽樣品的品種判別分類結(jié)果都比較好。分類正確率最高的是“Wilks’ Lambda”法所建立的模型,訓(xùn)練樣本回判全部正確,測試樣本預(yù)測95.2%的正確,總的判別正確率為97.9%; 分類正確率最低的是“Smallest F ratio”法所建立的模型,訓(xùn)練樣本回判有98.1%的正確,測試樣本預(yù)測有84.3%的正確,總的判別正確率為92.0%。說明基于油菜籽皮紅外光譜信息的逐步判別分析能很好的識別油菜籽的品種,采用“Wilks’ Lambda”法來挑選信息變量,建立油菜籽品種判別分類模型的鑒別效果最好。
表2 品種鑒別中不同算法選擇的變量情況
表3 品種鑒別中不同算法的模型對樣品的鑒別情況
2.2.2 基于油菜籽皮紅外光譜信息的產(chǎn)地判別分析
按照2.2.1中的方法,用逐步判別分析中篩選變量的不同算法來篩選樣本信息,分別建立產(chǎn)地的鑒別模型對樣品的產(chǎn)地進(jìn)行鑒別研究。表4和表5為逐步判別分析中不同算法的模型對樣本進(jìn)行產(chǎn)地鑒別的情況。圖2為逐步判別分析的不同算法對訓(xùn)練樣本的分類圖,圖中橫坐標(biāo)是各訓(xùn)練樣本在分類函數(shù)1中的得分,縱坐標(biāo)是各訓(xùn)練樣本在分類函數(shù)2中的得分。由表4知,產(chǎn)地判別分析中,篩選樣本信息的不同算法從425個(gè)信息變量中篩選的變量是不同的,各種算法建立的判別分類模型也是不同的。圖2直觀地反映了各種算法所建立的分類模型對訓(xùn)練樣本的匯聚情況,也反映了在不同算法下各類樣本間的關(guān)系。由圖2知,各類訓(xùn)練樣本在不同算法的分類模型下,整體分類效果都較好,說明油菜籽皮中含有比較明顯的產(chǎn)地信息; 羅平產(chǎn)的油菜籽與其他4個(gè)類別的界限相對更清晰,說明羅平產(chǎn)的油菜籽皮中產(chǎn)地特征最強(qiáng)。表4和圖2還表明,油菜籽皮的紅外光譜中有一系列變量含有產(chǎn)地信息,逐步判別分析法能按不同的算法挑選出合適的信息變量,來建立分類效果較好的產(chǎn)地識別模型。由表5知,五種算法所建立的產(chǎn)地判別分類模型,正確率最高的是“Unexplained variance”法建立的模型,總的判別正確率達(dá)到了98.4%; 正確率最低的是“Rao’s V”法建立的模型,總的判別正確率為89.4%。上述實(shí)驗(yàn)結(jié)果表明,基于油菜籽皮紅外光譜信息的逐步判別分析同樣也能很好的識別油菜籽的產(chǎn)地,采用“Unexplained variance”法來篩挑建模信息變量,建立油菜籽產(chǎn)地判別分類模型的鑒別效果最好。
表4 產(chǎn)地鑒別中不同算法選擇的變量情況
表5 產(chǎn)地鑒別中不同算法的模型對樣品的鑒別情況
油菜籽皮是一種天然產(chǎn)物,樣品的紅外光譜是所有組成成分紅外光譜的疊加光譜,不同品種、不同產(chǎn)地油菜籽皮的組成成分及含量雖然有差異,但由于差異不大,使得不同油菜籽皮中不同的成分及含量差異的光譜信息被主要成分的光譜所掩蓋,因此不同品種及產(chǎn)地油菜籽皮的紅外光譜外觀很相似,通過光譜來直接鑒別不同品種或不同產(chǎn)地的油菜籽很困難??墒遣煌筒俗哑さ某煞植町愋畔吘拱诠庾V中,這些信息受遺傳因素的影響,也受生長環(huán)境和種植技術(shù)的影響,通過模式識別的統(tǒng)計(jì)方法能把這些信息挖掘出來,用于品種、產(chǎn)地、栽培方式等的鑒別。判別分析是一種模式識別的統(tǒng)計(jì)分類方法,需要先掌握一批已知分類情況的樣本及樣本信息來建立判別分類模型,用未知分類情況樣本的同種信息來進(jìn)行分類判別。紅外光譜技術(shù)具有儀器通用,操作簡單,重復(fù)性好等優(yōu)點(diǎn),本實(shí)驗(yàn)的研究結(jié)果說明,基于油菜籽皮紅外光譜信息的判別分析對品種和產(chǎn)地的判別,鑒別效果好,具有方便快捷的優(yōu)點(diǎn)。
在本實(shí)驗(yàn)的研究中,表2和表4以及圖2反映了樣品的品種及產(chǎn)地等信息,在紅外光譜中都是由一系列的信息變量來體現(xiàn); 篩選變量的不同算法按不同規(guī)則來選擇特征較強(qiáng)的光譜信息,建立判別模型來鑒別樣品的品種及產(chǎn)地,由于篩選的變量不同,建立的模型也不同,但鑒別結(jié)果差異不太顯著,都能較好的識別樣本的品種或產(chǎn)地,表明紅外光譜中品種或產(chǎn)地等信息具有統(tǒng)計(jì)規(guī)律。因此,以紅外光譜為信息變量,采用逐步判別法建立模型,鑒別樣本的品種或產(chǎn)地時(shí),建立模型的樣本要有足夠的數(shù)量及覆蓋面。本實(shí)驗(yàn)的樣本,用在品種鑒別方面,同一品種的油菜籽產(chǎn)地還比較單一,還需增加不同產(chǎn)地的同一品種樣本進(jìn)行研究; 用在產(chǎn)地鑒別方面,同一產(chǎn)地不同品種的油菜籽樣本也較少,同樣也需要增加樣本進(jìn)行研究。另外,種內(nèi)不同生長年份對油菜籽皮的成分含量也有影響,不同生長年份的光照、溫度、降水等因素不同,會(huì)導(dǎo)致同一產(chǎn)地同一品種的油菜籽皮樣品的成分及含量有差異,本實(shí)驗(yàn)的樣本在種內(nèi)生長年份都相同,因此也需要增加不同生長年份的樣品進(jìn)行研究。盡管如此,本實(shí)驗(yàn)的結(jié)果仍能初步說明,以油菜籽皮的紅外光譜為樣本信息的逐步判別分析,有望成為油菜籽品種和產(chǎn)地鑒別的一種實(shí)用方法。
圖2 產(chǎn)地鑒別中不同算法的模型對訓(xùn)練樣本的分類情況
利用傅里葉變換紅外光譜(FTIR)技術(shù)測試了來自5個(gè)不同產(chǎn)地、17個(gè)油菜籽品種,188份油菜籽皮樣品的光譜。選擇1 800~950 cm-1范圍的425個(gè)光譜變量來反映各樣品的特征,按產(chǎn)地及品種劃分樣品,每個(gè)品種選擇5份樣品為訓(xùn)練樣本,其余為測試樣本,在統(tǒng)計(jì)分析軟件SPSS20.0的判別分析模塊中,采用逐步法、Fisher線性判別準(zhǔn)則,分別建立油菜籽品種和產(chǎn)地的鑒別模型,對油菜籽品種和產(chǎn)地進(jìn)行鑒別分析。結(jié)果表明,以油菜籽皮的紅外光譜為樣品信息,通過逐步判別分析法來鑒別油菜籽的品種和產(chǎn)地,有望成為油菜籽品種和產(chǎn)地鑒別的一種實(shí)用方法,具有方便快捷的優(yōu)點(diǎn)。
[1] LIU Jian(劉 建).Cultivation Technique for High Yield and Benefit of Quality Rapes(優(yōu)質(zhì)油菜高產(chǎn)高效栽培技術(shù)).Beijing: China Agricultural Science and Technology Press(北京: 中國農(nóng)業(yè)科學(xué)技術(shù)出版社), 2011.
[2] 32002R0178(EC 178/2002),Regulation(Ec) No 178/2002 of the European Parliament and of the Council of 28 January 2002 Laying Down the General Principles and Requirements of Food Law, Establishing the European Food Safety Authority and Laying Down Procedures in Matters of Food Safety.
[3] H.R.2749 RFS,F(xiàn)ood Safety Enhancement Act of 2009.
[4] Article 9 of a Presidential Order of the People’s Republic of China(中華人民共和國主席令第 9號).Food safety of the People’S Republic of China(中華人民共和國食品安全法).
[5] CHEN Shi-lin, GUO Bao-lin, ZHANG Gui-qun, et al(陳士林,郭寶林,張貴群,等).Advances of Studies on New Technology and Method for Identifying Traditional Chinese Medicinal Materials(中藥鑒定學(xué)新技術(shù)新方法研究進(jìn)展).China Journal of Chinese Material Medica(中國中藥雜志), 2012, 37(8): 1043.
[6] Al-Qadiri H M, Lin M, Cavinato A G, et al.International Journal of Food Microbiology, 2006, 111(1): 73.
[7] Erukhimovitch V, Tsror L Lahkim, Hazanovsky M, et al.Applied Spectroscopy, 2007, 61(10): 1052.
[8] SUN Su-qin, ZHOU Qun, CHEN Jian-bo(孫素琴,周 群,陳建波).Analysis of Traditional Chinese Medicine by Infrared Spectroscopy(中藥紅外光譜分析與鑒定).Beijing: Chemical Industry Press(北京:化學(xué)工業(yè)出版社), 2010.
[9] Duarte I F, Barros A, Delgadillo I, et al.J.Agric.Food Chem., 2002, 50(11): 3104.
[10] LIU Fei, YANG Chun-yan, LIU Gang(劉 飛, 楊春艷, 劉 剛).Spectroscopy and Spectral Analysis(光譜學(xué)與光譜分析), 2013, 33 (11): 3036.
[11] WANG Dong-hua(汪冬華).Multivariate Statistical Analysis and SPSS Application(多元統(tǒng)計(jì)分析與SPSS應(yīng)用).Shanghai: East China University of Science and Technology Press(上海: 華東理工大學(xué)出版社),2010.
[12] ZHANG Xin-xin, LI Yu, JI Yu-jia, et al(張新新,李 雨,紀(jì)玉佳,等).Journal of Shandong University(Health Sciences)(山東大學(xué)學(xué)報(bào)·醫(yī)學(xué)版), 2012, 50(1): 143.
[13] ZHU Li-jun, WANG Peng, SHI Feng-cheng, et al(朱立軍,王 鵬,施豐成,等).Journal of Southwest University·Natural Science Edition(西南大學(xué)學(xué)報(bào)·自然科學(xué)版), 2012, 34(3): 9.
[14] ZHAO Hai-yan, GUO Bo-li, WEI Yi-min, et al(趙海燕,郭波莉,魏益民, 等).Scientia Agricultura Sinica(中國農(nóng)業(yè)科學(xué)), 2011, 44(7): 1451.
(Received Sep.25, 2014; accepted Jan.21, 2015)
Identification of Planting Area and Varieties of Rapeseeds by Infrared Spectroscopy Combing with Stepwise Discriminatory Analysis
LIU Fei1, YANG Chun-yan1, XIE Jian-xin2
1.Department of Physics, Yuxi Normal University, Yuxi 653100, 2.Department of Chemistry, Yuxi Normal University, Yuxi 653100, China
The planting area and varieties of rapeseeds were studied based on Fourier transform infrared spectroscopy (FTIR) combining with stepwise discriminatory analysis.The FTIR of 188 rapeseed skin samples of 17 varieties from 5 planting areas was obtained and processed by OMINC 8.0 software.In order to distinguish their planting area and variety, 5 spectra in the range of 1 800~950 cm-1for each variety from each producing area were selected as training samples arbitrarily with Fisher linear discriminatory criterion which was used to build model by means of stepwise discriminatory analysis by SPSS20.0 software.All the five discriminatory models based on Wilks’Lambda, Unexplained variance, Mahalanobis distance, Smallest F value and Rao’s v can distinguish variety and planting area well, and the best one for identifying variety was on the base of Wilks’Lambda, which yielded correct rate of 97.9%, and the best one for distinguishing planting area was on the base of Unexplained variance with a correct rate of 98.4%.The results showed that discriminatory analysis based on the infrared spectrum of rapeseed skin is an efficient method for identification of rapeseed variety and planting area.
Infrared spectroscopy; Stepwise discriminatory analysis; Rapeseed; Study
2014-09-25,
2015-01-21
國家自然科學(xué)基金項(xiàng)目(21465024)資助
劉 飛, 1974年生, 玉溪師范學(xué)院物理系副教授 e-mail: yxtclf@163.com
O657.3
A
10.3964/j.issn.1000-0593(2016)05-1363-06