張 強
(山西師范大學(xué)生命科學(xué)學(xué)院,臨汾 041004)
苦蕎亦稱韃靼苦蕎(F.tartaricum),為蓼科(Polygonaceae)苦蕎屬(Fagopyrum Gaerth)藥食兼用的作物。隨著苦蕎營養(yǎng)和功能成分研究的深入[1],苦蕎的開發(fā)利用也得到了迅速的發(fā)展,目前中國已是苦蕎生產(chǎn)大國,種植面積及產(chǎn)量均居世界第一。
種子的真實性和品種純度鑒定在種子質(zhì)量管理、種子生產(chǎn)與營銷實踐中有重要意義[2]?;诜N子數(shù)字圖像處理的機器視覺檢測方法具有無損、高效、快捷和低成本的特點。近年來,國內(nèi)外學(xué)者在小麥[3-7]、玉米[2,8]、花生[9]等大宗作物、經(jīng)濟作物的品種、等級和產(chǎn)地判別中進(jìn)行了探索和應(yīng)用。不同農(nóng)作物的種子特征在識別中作用會有所不同,傳統(tǒng)的苦蕎種子品種分類鑒別還依賴于肉眼觀察為主,而對苦蕎種子品種進(jìn)行圖像識別的相關(guān)研究還未見報道。為了解決品種混雜、充偽等問題,探尋新的苦蕎品種判別方法,對于苦蕎品種鑒別、產(chǎn)品質(zhì)量控制、健全質(zhì)量管理、保證苦蕎產(chǎn)業(yè)的持續(xù)健康發(fā)展具有重要意義。
本試驗基于圖像處理的研究方法對不同品種的苦蕎種子(果實,下同)進(jìn)行形態(tài)特征方面的分類比較,首先使用圖像掃描儀獲得不同品種苦蕎種子的彩色圖像,再采用圖像處理軟件從圖像中提取顏色和形態(tài)特征的基礎(chǔ)數(shù)據(jù),然后利用統(tǒng)計軟件對這些基礎(chǔ)數(shù)據(jù)進(jìn)行分析,篩選判別變量,建立有效的判別模型,并對模型進(jìn)行驗證,為苦蕎品種分類提供有效鑒定依據(jù)。
采用全國8個省區(qū)的11個品種苦蕎種子作為試驗材料,分別為:1威寧苦蕎、2九江苦蕎、3晉蕎2號苦蕎、4固原苦蕎、5海原苦蕎、6通化苦蕎、7苦刺蕎、8黑豐1號苦蕎、9湖南7-2苦蕎、10云南苦蕎、11黔黑苦蕎,均由山西省農(nóng)科院農(nóng)產(chǎn)品加工研究所提供。種子過篩去雜,每個品種隨機選取40粒種子,共440粒種子。
1.2.1 種子圖像的采集及信息提取
采用EPSON Perfection V700掃描儀獲取苦蕎種子的數(shù)字圖像,掃描儀的分辨率設(shè)置為600 dpi,背景設(shè)置為白色。圖像處理與分析在臺式電腦(Lenovo,Pentium 4,2.8 GHz)上進(jìn)行,操作系統(tǒng)為 Windows XP SP3。以圖像處理軟件Adobe Photoshop CS4作為樣本特征參數(shù)提取的主要工具。
1.2.2 圖像分析方法
通過USB接線將樣本的原始圖像轉(zhuǎn)入計算機進(jìn)行處理。為了進(jìn)一步消減圖像在掃描及傳輸過程中的噪聲干擾,利用Adobe Photoshop CS4軟件中的調(diào)整邊緣工具,將調(diào)整半徑設(shè)置為1.00像素,平滑力度設(shè)置為3以去除圖像邊緣的鋸齒狀干擾,并且利用羽化工具以1.00像素單位平均模糊柔化選取邊緣[10],獲取更精細(xì)的結(jié)果。通過邊緣的調(diào)整,干擾及圖像噪聲得到消減,較好地保持了圖像的邊緣。利用快速選擇工具,設(shè)置選定直徑為10 px,間距為25%,對單個種子進(jìn)行選定,提取單個種子的特征數(shù)據(jù)。
1.2.3 顏色特征提取
對于顏色識別通常采用紅綠藍(lán)(RGB)和HSI顏色分析,使用RGB顏色模式時,自然的色彩與顯示器上的色彩是以完全相同的方法創(chuàng)建的,有利于對圖像進(jìn)行客觀、準(zhǔn)確地分析和研究,因苦蕎籽粒主色調(diào)為灰白及黑色,并且考慮到Adobe Photoshop CS4軟件中顏色數(shù)據(jù)提取的方便性,采用RGB顏色作為苦蕎種子顏色特征的提取通道。利用快速選擇工具將籽粒選定后,在直方圖里會顯示選定區(qū)域的RGB各顏色特征均值。
1.2.4 形態(tài)特征的提取
利用快速選定工具對每個種子進(jìn)行選定提取,并記錄測量。形態(tài)特征如下:
面積=以單個苦蕎種子圖像所包含的所有像素總數(shù)計算。
周長=苦蕎種子圖像邊界像素總和。
長度=苦蕎種子縱向圖像上距離最長的2個端點之間的像素距離。
寬度=苦蕎種子橫向圖像上垂直于縱軸的最大2個端點之間的像素距離。
長寬比=長度/寬度。圓形度=(周長)2/(4π×面積)。矩形度=面積/外接矩形面積。
1.2.5 其他特征變量的提取
根據(jù)苦蕎種子的性狀特點,將一些較明顯的籽粒外觀特征也進(jìn)行了提取,比如腹溝及棱翅的有無。經(jīng)觀察發(fā)現(xiàn),11個樣本的苦蕎品種均具有腹溝,除苦刺蕎具有明顯的棱翅分布之外,其他品種均沒有明顯的棱翅特征。
1.2.6 判別模型的構(gòu)建與驗證
采用SPSS 17.0統(tǒng)計軟件進(jìn)行方差分析和判別分析。方差分析的多重比較采用Duncan法;判別分析,采用Wilks',λ法和逐步法,構(gòu)建貝葉斯(Bayes)判別函數(shù)。聚類分析采用DPS14.10軟件進(jìn)行因子聚類。驗證方法采用回判驗證和交互驗證法。交互驗證是近年來逐漸發(fā)展起來的一種非常重要的判別效果驗證技術(shù),是在建立判別準(zhǔn)則時逐一去掉一例,再用建立的判別準(zhǔn)則對該例進(jìn)行判別,交互驗證與回判驗證相比錯分率可能會增加,但結(jié)果更真實、客觀,是評價判別準(zhǔn)則效能的可靠指標(biāo)[11-12]。
提取的苦蕎種子特征參數(shù)為28個。其中9個形態(tài)特征包括面積、周長、長度、寬度、矩形度、長寬比、圓度、棱翅和腹溝;顏色特征包括RGB、R、G、B和明度的平均值、標(biāo)準(zhǔn)差、中間值以及灰度的最小值、最大值、平均值、中間值等19個特征指標(biāo)。方差分析結(jié)果顯示不同品種間的全部指標(biāo)均存在顯著差異(P<0.05),圖1顯示的是部分形態(tài)特征的多重比較結(jié)果,圖2顯示的是部分顏色特征的多重比較結(jié)果(不同字母表示在0.05水平,差異存在統(tǒng)計學(xué)意義)。
圖1 不同品種苦蕎種子的長度、寬度及長寬比
圖2 不同品種苦蕎種子的R、G、B中間值
11個品種之間28個特征變量均存在顯著差異(P<0.05),于是將全部變量納入進(jìn)行逐步篩選,根據(jù)規(guī)則標(biāo)準(zhǔn)F>3.84的納入,F(xiàn)<2.71的篩除,從中篩選出特征變量,剔除影響不顯著變量的干擾。經(jīng)20步的篩選,獲得18個有效特征變量列于表1。
表1 篩選出的特征變量
將這18個變量采用標(biāo)準(zhǔn)化處理,進(jìn)行因子聚類分析,結(jié)果如圖3所示,在距離為1處可分為2類,一類為顏色特征變量共13個,另一類為形態(tài)特征變量共5個。分別使用篩選出的形態(tài)因子和顏色因子進(jìn)行品種判別分析,5個形態(tài)因子的判別正確率為55.7%,交互驗證正確率為53.6%;13個顏色因子的判別正確率為76.4%,交互驗證正確率為73.4%。
圖3 判別變量的聚類結(jié)果
苦蕎種子的顏色是苦蕎的重要特征,基于顏色特征因子的判別正確率為76.4%,亦顯示顏色特征是重要的分類特征。顏色特征中的灰度(平均值)為最重要的判別變量,這與Manickavasagan等[13]利用圖像處理對加拿大8個小麥品種進(jìn)行判別時的首要變量有相似之處。顏色特征也較為穩(wěn)健,對于物體的大小和方向均不敏感,有較強的的魯棒性。通過人眼得到顏色知覺,這是一種復(fù)雜的主觀過程,不可避免地受到諸如人的視覺、疲勞程度、個人傾向性、光源等因素的干擾[14]。利用計算機圖像分析技術(shù)對不同苦蕎品種種子的顏色特征和形狀特征進(jìn)行采集、提取,通過圖象處理技術(shù)與現(xiàn)代統(tǒng)計技術(shù)相結(jié)合進(jìn)行分析建模判別,相比傳統(tǒng)肉眼識別而言,精確量化、客觀準(zhǔn)確有效。
基于形態(tài)特征因子的判別正確率為55.7%,表明長度、寬度、長寬比、矩形度和垂直投影的面積5個形態(tài)特征在品種分類中亦發(fā)揮著比較重要的作用。雖然研究顯示不同品種形態(tài)特征上存在較明顯的可區(qū)分差異,但這種形態(tài)特征差異的顯著性僅通過肉眼判別是比較困難的,通過數(shù)字圖像處理和統(tǒng)計學(xué)分析有效克服了這個困難,可以利用這些特征對種子的形狀進(jìn)行較為精確的區(qū)分判斷。在有效特征的篩選中,腹溝及棱翅2個變量未被加入有效特征中,但這2個特征對于其他品種的區(qū)分可能仍具有一定意義。
顏色和形狀為多基因遺傳特征,受環(huán)境因素影響較小,可視為品種的屬性特征[15]。顏色特征與形態(tài)特征結(jié)合使用,能有效提高判別的正確率。本研究方法對品種的判別正確率達(dá)到了96.8%,交互驗證的正確率達(dá)到了94.7%。判別效果一般用誤判率來衡量,并要求誤判率小于10%或20%才有應(yīng)用價值[16]。因此根據(jù)苦蕎的數(shù)字圖像特點建立的Bayes模型,具有一定的應(yīng)用價值。另外,研究采用的圖像處理軟件和統(tǒng)計分析軟件普及性高,易于掌握和使用。
使用篩選出的18個形態(tài)因子和顏色因子一起進(jìn)行Bayes判別分析,得到判別函數(shù)為:
式中:y1,y2,…,y11,為對應(yīng)的品種 1,2,…,11的Bayes判別函數(shù),將未知品種特征變量分別代入函數(shù)式,哪個函數(shù)值大,則應(yīng)歸入相應(yīng)的品種類別。
表2 判別分析結(jié)果
表2結(jié)果表明,對11個品種的回判驗證(根據(jù)判別準(zhǔn)則將原樣本逐一代入,評價判別效果),正確率為96.8%。其中威寧苦蕎、苦刺蕎、云南苦蕎的回判正確率都達(dá)到了100%,固原、海原、通化、黑豐1號及黔黑苦蕎的回判正確率達(dá)到了97.5%,晉蕎2號、九江苦蕎的回判正確率分別為95%和92.5%,僅湖南7-2苦蕎回判正確率較低,為87.5%。對11個品種的交互驗證(即在建立判別準(zhǔn)則時逐一去掉一例,再用建立的判別準(zhǔn)則對該例進(jìn)行判別),正確率為 94.7%。
影響苦蕎品種判別的因素可能與品種內(nèi)種子的一致性差有關(guān)??嗍w是總狀花序,花期長,成熟時間極不一致,因為苦蕎的最適宜的收獲時間為全株2/3籽粒成熟,過早收獲,大部分籽粒尚未成熟,過遲收獲,籽粒將大量脫落,影響產(chǎn)量[17]。另外,品種數(shù)目越多,在籽粒形態(tài)諸特征上的交疊現(xiàn)象就越嚴(yán)重,可區(qū)分性變差,也影響到識別效果[8]。今后選擇成熟度盡可能一致的籽粒,探索適宜種子樣品數(shù)量規(guī)模、嘗試引入新的特征因子,如紋理特征等,優(yōu)化分類方法和模型,可能有助于提高判別的正確率。本研究使用了11個苦蕎品種,而通常某一區(qū)域的主要栽培品種不會很多,建立針對某一地域幾個主要品種的,基于數(shù)字圖像處理的判別模型,將使得應(yīng)用數(shù)字圖像技術(shù)進(jìn)行苦蕎品種判別具有更廣泛的應(yīng)用價值。
對來自8個省區(qū)的11個品種苦蕎種子,通過掃描儀獲取其彩色數(shù)字圖像,并從中提取了顏色和形態(tài)2類共28個變量進(jìn)行統(tǒng)計分析,發(fā)現(xiàn)苦蕎種子不同品種間的顏色特征和形狀特征存在著顯著差異。通過逐步法篩選從中獲得18個變量,作為苦蕎種子品種識別的重要指標(biāo),經(jīng)R型聚類分析可聚成2類:13個顏色變量聚為一類;5個形態(tài)變量聚為一類。13個顏色類變量的判別正確率為74.6%,5個形態(tài)類變量的判別正確率為53.6%,顏色類變量在苦蕎品種預(yù)測中發(fā)揮著主要作用。
將顏色類變量和形態(tài)類變量相結(jié)合,獲得的Bayes判別模型回判正確率為96.8%,交互驗證判別正確率為94.7%。表明利用圖像分析系統(tǒng)和現(xiàn)代統(tǒng)計方法,能有效地對苦蕎種子的顏色與形態(tài)特征進(jìn)行精確量化提取和快速分析,比肉眼識別更具優(yōu)勢,可為苦蕎品種分類鑒別和質(zhì)量控制提供一種客觀性,準(zhǔn)確性、有效性的方法。
[1]周小理,李宗杰,周一鳴.蕎麥治療糖尿病化學(xué)成分的研究進(jìn)展[J].中國糧油學(xué)報,2011,26(5):119-121
[2]楊錦忠,郝建平,杜天慶,等.基于種子圖像處理的大數(shù)目玉米品種形態(tài)識別[J].作物學(xué)報.2008,34(6):1069-1073
[3]Shouche SP,Rastogi R,Bhagwat SG,et al.Shape analysis of grains of Indian wheat varieties[J].Computers and Electronics in Agriculture,2001,33(1):55 -76
[4]何勝美,李仲來,何中虎.基于圖像識別的小麥品種分類研究[J].中國農(nóng)業(yè)科學(xué).2005,38(9):1869-1875
[5]Zapotoczny P.Discrimination of wheat grain varieties using image analysis and neural networks.Part I.Single kernel texture[J].Journal of Cereal Science,2011,54:60 -68
[6]Pourreza A,Pourreza H,Abbaspour-Fard M H,et al.I-dentification of nine Iranian wheat seed varieties by textural analysis with image processing[J].Computers and Electronics in Agriculture,2012,83:102 -108
[7]Delwiche SR,Yang I C,Graybosch R A.Multiple view image analysis of freefalling U.S.wheat grains for damage assessment[J].Computers and Electronics in Agriculture,2013,98:62-73
[8]郝建平,楊錦忠,杜天慶,等.基于圖像處理的玉米品種的種子形態(tài)分析及其分類研究[J].中國農(nóng)業(yè)科學(xué),2008,41(4):994-1002
[9]韓仲志,趙友剛.基于外觀特征識別的花生品質(zhì)與品種檢測方法[J].中國糧油學(xué)報,2009,24(5):123-126
[10]程軼波.Photoshop圖像處理技巧[J].中國科技信息,2009,(1):328-354
[11]黃曉韻,曹波,楊躍.基于 SAS的多元統(tǒng)計方法實現(xiàn)芯片數(shù)據(jù)挖掘[J].生物信息學(xué),2010,8(2):147-149
[12]劉娟,崔樹起,呂曼,等.基于非參數(shù)交互證實判別分析法建社區(qū)腦膜炎診斷模型[J].數(shù)理醫(yī)藥學(xué)雜志,2010:23(1):8-10
[13]Manickavasagan A,Sathya G,Jayas D S,et al.Wheat class identification using monochrome images[J].Journal of Cereal Science,2008,47(3):518-527
[14]劉光蓉,管庶安,周紅.基于圖象處理技術(shù)的大米色澤檢測[J].糧食和飼料,2006(1):8-9
[15]Wiwart M,Suchowilska E,Lajszner W,et al.Identification of hybrids of spelt and wheat and their parental forms using shape and color descriptors[J].Computers and Electronics in Agriculture,2012,83:68-76
[16]孫振球.醫(yī)學(xué)統(tǒng)計學(xué)(第三版)[M].北京:人民衛(wèi)生出版社,2010
[17]趙鋼,陜方.中國苦蕎[M].北京:科學(xué)出版社,2009.