盧澤如,蔣舜堯,熊勤學,邱先進,周子堯,楊 權
(長江大學農學院,湖北 荊州 434025)
目前國內外對稻谷品種檢測方法主要包括苯酚染色法、幼苗鑒別法和分子標記法等[1],這些方法檢測成本高、鑒定周期長、檢測效果差、檢測結果一致性不好。隨著計算機技術和圖像處理技術的迅速發(fā)展,特別是人工智能、大數(shù)據(jù)和云計算的出現(xiàn)為機器視覺技術對稻谷品種進行快速、高效分類識別提供了技術條件。Macalalad 等[2]運用圖像識別技術提取稻谷的面積、周長、扁率等形態(tài)學差異特征值后,運用最小距離法準確從圖像中識別3 種稻谷品種;黃星奕等[3]介紹了一種把圖像的顏色特征和形狀特征結合起來進行稻谷品種識別的新方法;熊利榮等[4]利用Bayes 判別法建立了秈稻、糯稻、粳稻3 大類的類別模型和9 個稻谷種子的品種模型,模型判別效果顯著;呂一波等[5]在對955 個玉米顆粒圖像研究的基礎上,探討了用自然光和白熾燈照射下獲取的彩色模型來識別、分割玉米圖像的可行性,提出用直徑和圓形度參數(shù)來表征玉米的幾何特征;宋韜等[6]以表示玉米子粒輪廓的個體特征參數(shù)作為輸入信號,用神經網(wǎng)絡方法進行玉米形態(tài)識別研究,對粒完整及粒破損的玉米子粒識別試驗顯示,正確率為93%。盡管相關研究對農作物品種和方法進行了探究,但面對全國5 萬多個稻谷品種[7],只有建立稻谷品種特征庫,才能運用云技術和圖像識別技術開展稻谷品種快速區(qū)分工作,稻谷品種形態(tài)學差異特征值的確立是建立稻谷品種特征庫的前提[8]。本研究運用圖像識別技術提取31 個水稻品種的41 種形態(tài)學特征值,再利用統(tǒng)計分析方法,尋找出能區(qū)分稻谷品種差異的形態(tài)學特征值,以期為稻谷品種形態(tài)學檢測打下基礎。
供分析的稻谷品種有31 個,每個品種有稻粒20~50 粒,品種間的形狀與顏色有一定差異,其名稱及圖片見表1。
表1 供分析的稻谷品種及圖片
1)掃描圖像。將稻谷連同調色板放在掃描儀上,設定掃描分辨率為180 dpi,掃描成jpg 格式的圖像。
2)圖像校正。將圖像在Image Pro Plus 軟件中打開,根據(jù)掃描分辨率和calibration->spatial 功能設置圖像空間分辨率;運用calibration->intensity 結合調色板中RGB 值進行色彩校正。
3)圖像識別。運用measure->count/size 功能對圖像中稻谷進行識別,識別方式選擇Automatic Dark Objects,如果稻谷有相連現(xiàn)象,用auot split 功能將它們分開。
4)稻谷特征量提取。在軟件中選取所有測定內容,點擊measure 鍵,并選取提取41 種形態(tài)學特征值參數(shù)[9](表2),其中31 個表征幾何特征參數(shù),10 個表征顏色特征參數(shù),沒有選取表征位置特征的參數(shù)。
表2 特征量及釋義
5)稻谷特征量導出。選擇軟件中的導出功能,將提取的41 種形態(tài)學特征值導至Excel 軟件中供統(tǒng)計分析。
采用判別分析方法對稻谷形態(tài)學特征值進行篩選。31 個品種按0~30 編號,然后在SPSS 軟件中打開,在判別分析方法中選取因子逐步引入剔除方法,總樣本數(shù)為1 290。
采用聚類方法對稻谷形態(tài)學特征值統(tǒng)計分析。將每個稻谷品種所有特征值進行平均,然后在SPSS軟件中打開,選取系統(tǒng)聚類分析方法,引入因子為前面選定的特征值,輸出中要求輸出分類圖。
設不同的引入最小偏F值和剔除最大偏F值,觀察分類結果的準確率,隨著引入最小偏F值和剔除最大偏F值的增加(每次增加0.5),其入選的因子減少,回代準確率開始為73.0%,逐步下降。當引入最小偏F值為8 和剔除最大偏F值為6 時,入選因子為9 個,其回代準確率為62.8%;以后再增加F值,入選因子為和回代準確率不變,至引入最小偏F值為23 和剔除最大偏F值為21 時,入選因子為6 個,其回代準確率為43.3%。綜合上述分析,以入選因子少、回代準確率損失不大為原則,選取引入最小偏F值為8 和剔除最大偏F值為6 作為判別分析引入因子的原則,確定了9 個因子為表征稻谷品種差異的形態(tài)學特征值,分別是Aspect(最長軸與最短軸比率)、Density(max)(最 大強度)、Area(面積)、Density(green)(綠光強度)、Axis(minor)(短軸長度)、Density(mean)(強度均值)、Density(blue)(藍光強度)、Axis(major)(長軸長度)、Density(std.dev。)(強度標準差)。這9 個因子中表示幾何形狀的有4 個,分別為Aspect、Area、Axis(minor)和Axis(major);表示顏色的有5 個,分別為Density(max)、Density(green)、Density(mean)、Density(blue)和Density(std.dev.)。說明稻谷品種的差異主要表現(xiàn)在幾何形狀上,如稻谷有短圓、細長、雙尖等特征,在顏色上有淡黃色、深黃色等。
分別用稻谷品種形態(tài)學41 個特征值和選取的9個差異特征值,采用SPSS 軟件的系統(tǒng)聚類分析方法,分別對31 個稻谷品種進行分類,其分類結果一致(圖1),說明這9 個差異特征值能代表41 個特征值,能反映稻谷品種之間的差異。由圖1 可知,把31種水稻品種分為5 類,分別是淡黃色短圓型、淡黃色長扁型、深黃色長扁型、深黃色短圓型和深黃色雙尖型,由于沒有這31 個品種的分類信息,不清楚分類結果與其品種屬性是否存在內存聯(lián)系。
圖1 31 個稻谷品種的聚類分布
本研究成功提取了能反映稻谷品種差異的9 個特征值,分別為表示幾何形狀的Aspect、Area、Axis(minor)、Axis(major)4 個特征值和表示顏色的Density(max)、Density(green)、Density(mean)、Density(blue)、Density(std.dev)5 個特征值,對31 個稻谷品種進行了聚類分析。
由于沒有稻谷品種的其他信息,沒有對特征值與稻谷生物學性狀進行分析,作物表型是作物品種內在特征的表現(xiàn),這也是需要進一步研究的方向。