陳明明,符麗雪,李殿威,左 鋒,2,錢麗麗,2,3
(黑龍江八一農(nóng)墾大學(xué)食品學(xué)院1,大慶 163319 ) (國(guó)家雜糧工程技術(shù)研究中心2,大慶 163319) (黑龍江省農(nóng)產(chǎn)品加工與質(zhì)量安全重點(diǎn)實(shí)驗(yàn)室3,大慶 163319)
黑龍江土質(zhì)肥沃,土壤類型豐富,盛產(chǎn)優(yōu)質(zhì)水稻。水稻自身不能合成礦物元素,其礦物元素含量和組成主要受產(chǎn)地環(huán)境和人類活動(dòng)兩方面的影響[1,2],不同的土壤類型礦物元素種類和含量不同,影響著水稻礦物元素含量和種類[3]。近年來(lái)國(guó)內(nèi)外外學(xué)者通過探究已形成礦物元素分析技術(shù)用于產(chǎn)地判別是可行的統(tǒng)一共識(shí)。目前礦物元素分析技術(shù)已普遍運(yùn)用于西洋參[4]、大豆[5,6]、蜂蜜[7,8]、葡萄酒[9-11]、茶[12,13]、枸杞[14]、松茸[15]等的產(chǎn)地判別。礦物元素分析技術(shù)因具有靈敏度高、線性范圍寬、穩(wěn)定性強(qiáng)等優(yōu)點(diǎn)被認(rèn)為是產(chǎn)地判別有效的方法[16-19],在植源性食品的產(chǎn)地判別中廣泛應(yīng)用[20],但驗(yàn)證篩選到的礦物元素指標(biāo)的有效性是利用該技術(shù)進(jìn)行產(chǎn)地判別成功的關(guān)鍵??蒲泄ぷ髡弑M可能以多年連續(xù)采集多個(gè)樣本數(shù)量為對(duì)象構(gòu)建大米產(chǎn)地判別模型,并比較不同模型的適用性,進(jìn)而驗(yàn)證篩選礦物元素判別指標(biāo)的有效性。Butikofer等[21]利用判別分析和人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型對(duì)歐洲地區(qū)奶酪進(jìn)行了分類,2種方法分別正確區(qū)分了95%和91%的樣本。Francisco等[22]基于線性判別分析和人工神經(jīng)網(wǎng)絡(luò)對(duì)西班牙礦泉水進(jìn)行地理分類,神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型判別能力達(dá)到94%。黎永樂等[23]利用Ca、Cu、Fe、K、Mg、Mn、Zn、Ni、As、Sr、Cd、Ba、Mo和Se對(duì)五常和非五常大米進(jìn)行Fisher線性判別和人工神經(jīng)網(wǎng)絡(luò)判別,結(jié)果表明通過人工神經(jīng)網(wǎng)絡(luò)法建立的判別模型具有更優(yōu)的判別能力,判別準(zhǔn)確率為96.4%。夏立婭等[24]運(yùn)用近紅外光譜技術(shù)結(jié)合BP-人工神經(jīng)網(wǎng)絡(luò)對(duì)響水和非響水大米進(jìn)行網(wǎng)絡(luò)訓(xùn)練,建立了理想的網(wǎng)絡(luò)誤差收斂曲線,分類正確率可達(dá)100%。因此,利用線性判別分析和人工神經(jīng)網(wǎng)絡(luò)進(jìn)行產(chǎn)地判別是可行的。產(chǎn)地溯源模型所采用的分析方法不同,建立產(chǎn)地判別模型的判別效果也不同。目前基于線性判別分析和人工神經(jīng)網(wǎng)絡(luò)的產(chǎn)地溯源建立過程所用到的僅為單一樣本年份,以連續(xù)采集多年份的大米樣本產(chǎn)地溯源判別研究具有重要的意義。
本實(shí)驗(yàn)以前期篩選得到的與產(chǎn)地和母質(zhì)土壤直接相關(guān)的23 種特征礦物元素為依據(jù),并以連續(xù)3 年的隨機(jī)采集的查哈陽(yáng)、五常和建三江274 份樣本作建模對(duì)象,分別建立Fisher模型和人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型進(jìn)行產(chǎn)地判別,驗(yàn)證產(chǎn)地鑒別效果并比較2種建模方法的適用性。
選擇2016—2018 年水稻隨機(jī)采集樣本。樣品來(lái)自于黑龍江省建三江地理標(biāo)志大米保護(hù)區(qū)、五常大米地理標(biāo)志保護(hù)區(qū)和查哈陽(yáng)大米地理標(biāo)志大米保護(hù)區(qū)。所用樣本具體信息如表1所示。
表1 2016—2018年樣本信息表
7700a電感耦合等離子體光質(zhì)譜儀,F(xiàn)C2K礱谷機(jī),VP-32碾米機(jī),Mara 240/50微波消解儀,DV4000精確控溫電熱消解儀,Milli-Q超純水機(jī),LM-3100旋風(fēng)磨,DHG-9123A型電熱恒溫鼓風(fēng)干燥箱,X68 GPS。
濃硝酸(65%)、過氧化氫:優(yōu)級(jí)純;多元素標(biāo)準(zhǔn)溶液5183-4688、多元素標(biāo)準(zhǔn)溶液、8500-6944多元素標(biāo)準(zhǔn)溶液、8500-6948內(nèi)標(biāo)(Bi、Ge、In)、粳米加工精度標(biāo)準(zhǔn)樣品(二級(jí)):ZW001;生物成分分析標(biāo)準(zhǔn)物質(zhì)-大米:GBW10010(GSB-1);無(wú)水乙醇溶液;蘇丹-Ⅲ:分析純。
1.3.1 樣品采集
在水稻成熟期,依據(jù)代表性采樣原則,采用棋盤式采樣法,每塊地隨機(jī)設(shè)置5 個(gè)重復(fù)點(diǎn),每個(gè)采集點(diǎn)沿植株中部割取稻穗1 m2左右,每個(gè)區(qū)收集1~2 kg稻穗,并記錄樣品信息。
1.3.2 樣品預(yù)處理
將采集回來(lái)稻谷樣品在通風(fēng)處晾曬至含水量14%以下,要求晾曬場(chǎng)地?zé)o揚(yáng)塵、整潔、透光。對(duì)稻穗進(jìn)行脫粒、礱谷、碾米獲得二級(jí)精米,二級(jí)精米參照GB/T 5502—2018染色法判定大米加工精度。并對(duì)精米旋風(fēng)磨粉碎處理,重復(fù)過100 目尼龍篩,得到米粉樣本。所有樣本采用統(tǒng)一處理方式。
1.3.3 樣品元素測(cè)定
參考GB 5009.94—2012《植物性食品中稀土元素的測(cè)定》和GB 5009.268—2016《食品中多元素的測(cè)定》[25,26]和相關(guān)文獻(xiàn)[27-30]采用電感耦合等離子質(zhì)譜儀對(duì)大米樣品和標(biāo)準(zhǔn)物質(zhì)中元素測(cè)定,準(zhǔn)確稱取0.25 g的大米粉樣品,置于消化管中加入6 mL濃硝酸(70%,BV3級(jí))和2 mL雙氧水(30%,BV3級(jí)),放入MARS微波消解儀中進(jìn)行消解。微波設(shè)置程序?yàn)? min內(nèi)從0 W增到1 600 W,溫度升到120 ℃,保持2 min;在5 min內(nèi)從溫度120 ℃升到了160 ℃,保持5 min;在5 min內(nèi)再?gòu)?60 ℃升到180 ℃,并在此溫度下消解15 min;然后冷卻20 min,將微波消化管取出,于通風(fēng)櫥內(nèi)打開塞子將微波消化管置于精確控溫電熱消解器中進(jìn)行趕酸。超純水(>18.2 MΩ·cm)洗滌樣品,定容至100 mL,采用同樣方法進(jìn)行空白樣品和大米標(biāo)準(zhǔn)物樣品消解。
ICP-MS工作參數(shù)為射頻功率1 280 W,霧化室溫度2 ℃,冷卻水流量1.47 L/min,載氣流量1.0L/min,補(bǔ)償氣體流量1.0 L/min,儀器測(cè)定3 年樣品和大米標(biāo)準(zhǔn)物中Mg、Ca、Cr、Mn、Zn、As、Rb、Sr、Ag、Cd、Sb、Te、Ba、La、Nd、Sm、Gd、Dy、Ho、Er、Yb、Pb、U 23 種元素。實(shí)驗(yàn)過程中每個(gè)樣品重復(fù)測(cè)定3 次,選用Ge、In和Bi作為內(nèi)標(biāo)元素,保證儀器的穩(wěn)定性。當(dāng)內(nèi)標(biāo)元素的RSD>5%重新測(cè)定樣品。
元素的檢出限和定量限見表2。
表2 ICP-MS儀器測(cè)定多種礦物元素的檢出限和定量限
采用SPSS26.0軟件對(duì)數(shù)據(jù)進(jìn)行方差分析、相關(guān)性分析和判別分析(Fisher判別分析)。采用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱進(jìn)行建模仿真。
1.4.1 基于前饋神經(jīng)網(wǎng)絡(luò)的產(chǎn)地判別分類結(jié)構(gòu)
利用3年隨機(jī)采集樣本,分別建立4層神經(jīng)網(wǎng)絡(luò)并進(jìn)行組合模型,考慮到影響大米礦物元素含量因素較多,屬于難以解決的精確數(shù)學(xué)建模問題,利用神經(jīng)網(wǎng)絡(luò)的歸納推理機(jī)制和自適應(yīng)學(xué)習(xí)能力,能夠以任意精度逼近一個(gè)非線性函數(shù)的優(yōu)勢(shì),將其作為一種解決大米礦物元素產(chǎn)地判別分類模型,實(shí)現(xiàn)采集樣本產(chǎn)地分類識(shí)別。建立4層前饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),如圖1所示。
從拓?fù)浣Y(jié)構(gòu)上可以看出,前饋神經(jīng)網(wǎng)絡(luò)是典型的分層網(wǎng)絡(luò)結(jié)構(gòu)。包括輸入層、隱含層和輸出層,層與層之間為互連方式,同層單元之間不存在相互連接,網(wǎng)絡(luò)各層分別有nI,nh和no節(jié)點(diǎn)數(shù)。
圖1 網(wǎng)絡(luò)結(jié)構(gòu)示意圖
本研究建立了一種前饋神經(jīng)網(wǎng)絡(luò),利用其自適應(yīng)性和穩(wěn)定快速收斂特性,作為礦物元素大米產(chǎn)地分類的智能識(shí)別模型。在實(shí)際應(yīng)用中,可以通過改變各層連接方式和激勵(lì)函數(shù),獲得新的網(wǎng)絡(luò)結(jié)構(gòu),實(shí)現(xiàn)不同的非線性映射關(guān)系?;诤Y選的大米產(chǎn)地特征元素,應(yīng)用到3 年隨機(jī)采集樣本數(shù)據(jù)中進(jìn)行大米產(chǎn)地分類驗(yàn)證依據(jù)。
1.4.2 基于前饋神經(jīng)網(wǎng)絡(luò)的產(chǎn)地判別分類學(xué)習(xí)方法
設(shè)共有M樣本,第p個(gè)樣本,對(duì)應(yīng)的期望實(shí)際輸出為dp,計(jì)算網(wǎng)絡(luò)輸出為yp,網(wǎng)絡(luò)各個(gè)輸出總誤差為
若記wjk數(shù),即連接權(quán)值和閾值(θ和φ),則學(xué)習(xí)規(guī)則為:
式中:η為學(xué)習(xí)速度;α為慣性系數(shù);t為學(xué)習(xí)次數(shù)。
為了驗(yàn)證篩選的產(chǎn)地特征礦物元素的判別效果,將與產(chǎn)地直接相關(guān)的元素Mg、Ca、Cr、Mn、Zn、As、Rb、Sr、Ag、Cd、Sb、Ba、La、Sm、Dy、Ho、Er、Pb、U和與母質(zhì)土壤直接相關(guān)的元素Mg、Sr、Te、Nd、Gd、Yb、U(見表3)結(jié)合一起引入模型,建立Fisher判別模型。274 份樣品分成訓(xùn)練集和測(cè)試集,選擇2/3的樣本用于作為訓(xùn)練集建立模型,選擇1/3的樣本作為測(cè)試集建立模型,得到判別結(jié)果見表4。
利用此判別模型對(duì)訓(xùn)練集內(nèi)部判別結(jié)果表明,建三江、五常和查哈陽(yáng)大米樣品得正確判別率分別為62%、97%和86%,整體正確判別率為82%,交叉判別率79%。對(duì)測(cè)試集建三江、五常和查哈陽(yáng)大米樣品得正確判別率分別為83%、100%和80%,總體正確判別率為86%。
表3 2016—2018年不同產(chǎn)地大米樣本中礦物元素含量
表4 不同產(chǎn)地Fisher判別函數(shù)分類結(jié)果
利用判別函數(shù)得分進(jìn)行作圖,由圖2可以看出,五常大米分布區(qū)域比較清晰,查哈陽(yáng)和建三江大米產(chǎn)地分布區(qū)域較為接近,有交叉現(xiàn)象。可能是由于SPSS判別分析屬于有監(jiān)督模式的線性分類算法,不能夠準(zhǔn)確有效的反映本研究檢測(cè)的元素與大米產(chǎn)地之間存在的非線性映射關(guān)系,同時(shí)影響大米中元素含量因素多且復(fù)雜,與產(chǎn)地相關(guān)的因素還包括降水、氣溫、光照等因素。因此,僅從產(chǎn)地與元素之間的線性關(guān)系判別不能很好的體現(xiàn)因果關(guān)系和信息間的相互影響,為了更有效處理這些特征元素,采用更為具有非線性映射能力的人工神經(jīng)網(wǎng)絡(luò)建立預(yù)測(cè)模型進(jìn)行產(chǎn)地判別。
本研究選取實(shí)驗(yàn)得到的3類大米產(chǎn)地,其中1~93為建三江大米樣本,94~177為五常大米樣本,178~274為查哈陽(yáng)大米樣本,共計(jì)274 組實(shí)驗(yàn)樣本,如表5所示。其中274用于該方法的訓(xùn)練,274 組用于測(cè)試。
表5 樣本信號(hào)(歸一化)
2.2.1 確定網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)
對(duì)3類大米產(chǎn)地樣本中礦物元素?cái)?shù)據(jù)采集,由于提取了23 個(gè)有效特征空間的維數(shù),即網(wǎng)絡(luò)輸入層節(jié)點(diǎn)數(shù)為23;輸出層的節(jié)點(diǎn)數(shù)由分類類型空間的維數(shù)決定,研究中將類型分類的編碼為100、010和001,分別表示查哈陽(yáng)大米、五常大米和建三江大米,因此,輸出節(jié)點(diǎn)數(shù)為3;根據(jù)Kolmogorov定理和大量實(shí)際訓(xùn)練經(jīng)驗(yàn),確定第一隱含層神經(jīng)元節(jié)點(diǎn)為36 個(gè),第二隱含層神經(jīng)元節(jié)點(diǎn)為28 個(gè);所以基于神經(jīng)網(wǎng)絡(luò)的大米產(chǎn)地識(shí)別分類的神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)為23-36-28-3 型。
2.2.2 網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)過程
利用梯度下降算法求解最優(yōu)解,選定274 組樣本,定義訓(xùn)練目標(biāo)迭代精度為0.01,學(xué)習(xí)速度0.8,慣性系數(shù)0.5,最大學(xué)習(xí)次數(shù)4 000 000,收斂情況如圖3所示。
圖3 大米產(chǎn)地分類網(wǎng)絡(luò)收斂曲線
從訓(xùn)練效果上看,前饋神經(jīng)網(wǎng)絡(luò)迭代次數(shù)為201 412次,滿足精度誤差為0.01。在網(wǎng)絡(luò)學(xué)習(xí)過程中,學(xué)習(xí)算法都是使網(wǎng)絡(luò)達(dá)到設(shè)定精度,網(wǎng)絡(luò)收斂比較穩(wěn)定,并且符合誤差限制要求。
2.2.3 仿真實(shí)例與結(jié)果分析
利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)的大米產(chǎn)地自動(dòng)分類方法,將274 組待測(cè)數(shù)據(jù)的篩選23 種礦物元素含量輸入網(wǎng)絡(luò),并進(jìn)行大米產(chǎn)地識(shí)別結(jié)果如表6所示。
從表6識(shí)別結(jié)果上看,274組數(shù)據(jù)的相對(duì)誤差平均值為17.14%,網(wǎng)絡(luò)的計(jì)算輸出值和期望輸出值的誤差較??;3個(gè)產(chǎn)地的整體識(shí)別準(zhǔn)確率為100%。實(shí)驗(yàn)表明:網(wǎng)絡(luò)相對(duì)檢測(cè)誤差分散性較小,具有較好的泛化性和穩(wěn)定性,是一種有效的大米產(chǎn)地識(shí)別方法。
表6 大米產(chǎn)地識(shí)別結(jié)果
研究通過連續(xù)3 年隨機(jī)采集的五常、查哈陽(yáng)和建三江地理保護(hù)區(qū)274 份樣本,基于前期實(shí)驗(yàn)篩選到的與產(chǎn)地和母質(zhì)土壤直接相關(guān)的23 種特征礦物元素分別建立了Fisher線性判別模型和前饋神經(jīng)網(wǎng)絡(luò)模型。
利用Fisher判別模型對(duì)訓(xùn)練集檢驗(yàn)正確判別率為82%,交叉檢驗(yàn)正確判別率為79%,測(cè)試集總體正確判別率為88%。前饋神經(jīng)網(wǎng)絡(luò)模型具有自適應(yīng)性和穩(wěn)定快速收斂特性。通過四層網(wǎng)絡(luò)訓(xùn)練,得到拓?fù)浣Y(jié)構(gòu)為23-36-28-3 型前饋神經(jīng)網(wǎng)絡(luò)模型。該前饋神經(jīng)網(wǎng)絡(luò)對(duì)3個(gè)產(chǎn)地大米樣本識(shí)別效果較好,解決了小距離相似自然環(huán)境產(chǎn)地樣本難以識(shí)別的問題。
通過對(duì)比2種模型的判別效果得出,以篩選的23 種元素為依據(jù),前饋神經(jīng)網(wǎng)絡(luò)模型較Fisher判別模型更具有適用性,可作為大米產(chǎn)地的智能識(shí)別模型。在下一步的研究中,將通過增加每一年的數(shù)據(jù)信息,修正模型參數(shù),獲得新的模型,驗(yàn)證大米不同產(chǎn)地的識(shí)別應(yīng)用穩(wěn)定性。