張金敏,楊添璽
蘭州交通大學(xué),甘肅 蘭州 730070
馬鈴薯具有營(yíng)養(yǎng)價(jià)值高、適應(yīng)力強(qiáng)、產(chǎn)量大等優(yōu)點(diǎn),是全球第三大重要的糧食作物。農(nóng)業(yè)生產(chǎn)中使用種薯塊莖進(jìn)行種植,根據(jù)芽眼對(duì)塊莖切塊,促進(jìn)塊莖內(nèi)外氧氣交換,破除休眠,經(jīng)過(guò)切塊催芽使植株發(fā)芽率大大提高。通過(guò)查閱資料及實(shí)地勘察發(fā)現(xiàn),目前馬鈴薯種植機(jī)械化生產(chǎn)水平有了明顯的提高,走“機(jī)械殘膜撿拾—機(jī)械深松、旋耕整地—機(jī)械鋪膜半膜壟作植物—機(jī)械培土中耕—機(jī)械統(tǒng)防統(tǒng)治—機(jī)械開(kāi)挖收獲(連同地膜一同回收)”的馬鈴薯機(jī)械化生產(chǎn)路子[1]。在種植過(guò)程中,往往為了節(jié)省成本及高出苗率,種薯需要根據(jù)芽眼進(jìn)行切塊,這一環(huán)節(jié)由人工進(jìn)行。
芽眼識(shí)別是種薯智能切塊的先決條件,現(xiàn)有研究多是基于機(jī)器視覺(jué)對(duì)馬鈴薯進(jìn)行質(zhì)量檢測(cè),NOORDAM[2]設(shè)計(jì)了馬鈴薯檢測(cè)分級(jí)的機(jī)器視覺(jué)系統(tǒng),每秒可以處理50 張圖像;汪成龍[3]等研究了優(yōu)于傳統(tǒng)算法的在復(fù)雜圖像背景中分割出馬鈴薯區(qū)域的分割算法;孔彥龍[4]等提取馬鈴薯俯視圖面積和側(cè)視圖周長(zhǎng)參數(shù),通過(guò)線性回歸分析建立了馬鈴薯的質(zhì)量監(jiān)測(cè)模型,實(shí)現(xiàn)了馬鈴薯質(zhì)量分選;周竹[5]等提出最小外接柱體對(duì)馬鈴薯立體信息進(jìn)行描述;赫敏[6]將馬鈴薯自然放置后從頂部拍攝俯視圖像,再旋轉(zhuǎn)90°拍攝側(cè)面圖像,根據(jù)這兩張圖像建立了馬鈴薯單薯質(zhì)量線性回歸分析預(yù)測(cè)模型;ZHOU[7]等將普通平面鏡之間的夾角設(shè)置為65°的V 型置于馬鈴薯兩邊,攝像頭可以一次獲得馬鈴薯的三面投影,進(jìn)而對(duì)馬鈴薯質(zhì)量進(jìn)行估計(jì),給出質(zhì)量預(yù)測(cè)模型。當(dāng)前對(duì)于芽眼識(shí)別的研究較少,邢作常[8]等提出根據(jù)種薯質(zhì)心和薯芽質(zhì)心的質(zhì)心連線對(duì)種薯切塊,對(duì)基于機(jī)器視覺(jué)的種薯自動(dòng)切塊機(jī)進(jìn)行設(shè)計(jì)。田海韜[9]結(jié)合彩色空間及灰度空間對(duì)馬鈴薯芽眼進(jìn)行了識(shí)別,得到了較好地效果。
基于上文分析,本文提出使用局部二值模式(Local Binary Patterns,LBP)結(jié)合支持向量機(jī)(Support Vector Machine,SVM)對(duì)馬鈴薯芽眼進(jìn)行識(shí)別。具體操作如下:首先應(yīng)用攝像頭采集不同種薯圖像,接著將預(yù)先采集的圖像預(yù)處理后,使用LBP 提取特征,最終由SVM 訓(xùn)練、測(cè)試,對(duì)種薯芽眼進(jìn)行識(shí)別,經(jīng)實(shí)驗(yàn)分析可得,識(shí)別率達(dá)到了預(yù)期水平,為后續(xù)種薯智能切塊機(jī)的設(shè)計(jì)提供了先決條件。
實(shí)驗(yàn)采用32 W,6500 K 色溫環(huán)形燈管作為補(bǔ)償光源,選取工業(yè)相機(jī)(WP-UC500)進(jìn)行圖像采集,當(dāng)前基于機(jī)器視覺(jué)對(duì)馬鈴薯質(zhì)量的識(shí)別多是針對(duì)如圖1(a)、1(b)較為新鮮種薯進(jìn)行識(shí)別,本實(shí)驗(yàn)增加對(duì)如圖1(c)、1(d)較為陳舊種薯的識(shí)別工作。
圖1 部分種薯采集圖像Fig.1 Image of partial potato collection
獲取圖1 所示的四張圖像,圖(a)、圖(b)是新鮮種薯,圖(c)、圖(d)是時(shí)間較長(zhǎng)的種薯。
研究前對(duì)種薯芽眼進(jìn)行觀察及分析。如圖1 所示,不同時(shí)期的種薯芽眼大小、深淺、顏色是有顯著差異的;非芽眼區(qū)域的顏色紋理特征也有很大的不同,基于此擬采用LBP 與SVM 對(duì)種薯芽眼進(jìn)行識(shí)別;芽眼識(shí)別分為訓(xùn)練階段和識(shí)別階段,訓(xùn)練階段進(jìn)行樣本收集、特征提取、訓(xùn)練分類等步驟,最終得到訓(xùn)練參數(shù)。樣本收集包含了對(duì)種薯芽眼部位及非芽眼部位的收集;定位階段主要包括加載參數(shù)、灰度圖像預(yù)處理、多尺度滑動(dòng)窗口掃描、候選窗口合并等步驟。種薯芽眼識(shí)別流程如圖2 所示,在進(jìn)行圖像分割后需要分別對(duì)種薯芽眼和非芽眼區(qū)域進(jìn)行LBP 特征提取。
圖2 馬鈴薯芽眼識(shí)別流程圖Fig.2 Flowchart of potato bud eye recognition
在圖像采集過(guò)程中難免有噪聲干擾,需要進(jìn)行去噪處理。常見(jiàn)的去噪方法有均值濾波、中值濾波和高斯濾波,因?yàn)橹兄禐V波較其他兩種濾波方法能夠?qū)D像邊界進(jìn)行更很好地保護(hù),保持圖像的清晰度,因此本實(shí)驗(yàn)選取中值濾波對(duì)種薯圖像進(jìn)行預(yù)處理。
在對(duì)圖像進(jìn)行濾波處理后把種薯從背景中分離出來(lái),本文采用大津法(OTSU 法)基本原理:所選取的分割閾值使得目標(biāo)及背景的灰度分布方差越大,就會(huì)得到越好分割效果。目標(biāo)與背景灰度分布方差公式如下:g=θ1(μ1-μ)2+θ2(μ2-μ)2(1)
式(1)中θ1表示目標(biāo)區(qū)域與整個(gè)圖像面積的比例,μ1則表示目標(biāo)區(qū)域平均灰度值,θ2表示背景區(qū)域與整個(gè)圖像面積的比例,μ2則為背景區(qū)域平均灰度值。分割閾值設(shè)為e,從最小灰度值0 到最大灰度值255,使得g取最大值,e則為最佳閾值。
LBP 最早是作為一種有效的紋理描述算子提出的,因其對(duì)圖像局部紋理特征的卓越描繪能力而獲得了十分廣泛的應(yīng)用。LBP 特征具有很強(qiáng)的分類能力(Highly Discriminative)、較高的計(jì)算效率并且對(duì)于單調(diào)的灰度變化具有不變性[9]。
LBP 基本原理是將一個(gè)像素視為中心點(diǎn),它的值以該點(diǎn)與其鄰域3×3 像素的相對(duì)灰度值作為響應(yīng),通過(guò)比對(duì)周圍鄰域的像素點(diǎn)值計(jì)算得到。最原始的LBP 計(jì)算公式描述如下:
其中,gc表示該中心點(diǎn)像素的灰度值,gi表示該點(diǎn)鄰域像素點(diǎn)的灰度值。P代表總的鄰域像素點(diǎn)的個(gè)數(shù),R表示鄰域的半徑。通過(guò)該中心像素點(diǎn)和其鄰域像素的歐氏距離計(jì)算得到。
SVM 是在統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)上發(fā)展起來(lái)的新一代學(xué)習(xí)算法,它在文本分類、手寫(xiě)識(shí)別、圖像分類、生物信息學(xué)等領(lǐng)域中獲得較好的應(yīng)用。相比于容易過(guò)度擬合訓(xùn)練樣本的人工神經(jīng)網(wǎng)絡(luò),支持向量機(jī)對(duì)于未見(jiàn)過(guò)的測(cè)試樣本具有更好的推廣能力(Generalization Ability)[11]。其基本原理是將低維空間的數(shù)據(jù)樣本映射到高維空間中,使得數(shù)據(jù)樣本線性可分,進(jìn)而對(duì)邊界進(jìn)行線性劃分,圖4 為SVM 線性劃分的基本原理。
圖3 基本LBP 算子Fig.3 Basic LBP operator
圖4 SVM 分類原理圖Fig.4 SVM classification schematic diagram
通過(guò)對(duì)(4)中的每一個(gè)約束條件乘上一個(gè)拉格朗日乘數(shù)αi,可將此條件極值問(wèn)題轉(zhuǎn)化為下面的
通過(guò)數(shù)學(xué)方法可得:
此時(shí)的約束條件為:αi≥ 0并且
通過(guò)優(yōu)化技術(shù)對(duì)α求解之后,最大余地地分割超平面的參數(shù)。
根據(jù)優(yōu)化解的性質(zhì),解α必須滿足
求出各個(gè)系數(shù)對(duì)應(yīng)的最優(yōu)解后,得到如下最優(yōu)分類函數(shù):
首先選取中值濾波,對(duì)圖像進(jìn)行處理,處理結(jié)果如圖5-a-d,可以看出中值濾波對(duì)種薯的邊界有很好的保護(hù);OTSU 分割結(jié)果如圖5-e-h,再分別對(duì)圖像做“或”運(yùn)算,得出如圖5-i-l 所示的種薯區(qū)域。
圖5 種薯圖像的分割Fig.5 Segmentation of seed potato image
實(shí)驗(yàn)對(duì)新種薯及舊種薯進(jìn)行芽眼識(shí)別,分別對(duì)兩種種薯的芽眼和非芽眼部位LBP 特征進(jìn)行提取。
圖6 種薯表面圖像樣本的LBP 頻譜Fig.6 LBP spectrum of seed potato surface image sample
在種植過(guò)程中,規(guī)?;N植所采用的種薯都是專門培育,而普通小規(guī)模種植都是由前一年收獲的馬鈴薯作為種薯,因此分別對(duì)新舊種薯芽眼進(jìn)行識(shí)別。圖6 是新舊種薯芽眼、非芽眼表面圖像以及LBP 頻譜,通過(guò)對(duì)比圖6 當(dāng)中的(a)、(b)、(c)及(d),芽眼的頻譜幅值普遍較高,分布不均勻;而非芽眼部位的頻譜幅值較低,分布較為均勻;在對(duì)新舊種薯芽眼頻譜進(jìn)行比較時(shí)會(huì)發(fā)現(xiàn)有一定差異,新種薯芽眼頻譜分布不均勻而舊種薯的芽眼頻譜較為均勻;新舊種薯非芽眼部位頻譜則都比較均勻,相比之下,舊種薯非芽眼部位的幅值較高。
為了驗(yàn)證LBP 結(jié)合SVM 對(duì)種薯芽眼識(shí)別的可靠性,通過(guò)采集大量種薯圖片進(jìn)行試驗(yàn)。實(shí)驗(yàn)環(huán)境為:Windows 操作系統(tǒng)和Matlab2014a 操作平臺(tái)。
圖7 檢測(cè)結(jié)果圖Fig.7 Test result diagram
表1 種薯芽眼識(shí)別率Table 1 Eye recognition rate of seed potato bud
當(dāng)下基于機(jī)器視覺(jué)的馬鈴薯檢測(cè)多是對(duì)馬鈴薯質(zhì)量進(jìn)行分級(jí),而本文則是對(duì)種薯芽眼進(jìn)行識(shí)別,相較于前文優(yōu)點(diǎn)在于:一方面所用方法使得新種薯芽眼識(shí)別率達(dá)到97.61%,舊種薯芽眼識(shí)別率達(dá)到97.05%,綜合識(shí)別率97.33%,相比于田海韜[9]96%的識(shí)別率,提高1.33 個(gè)百分點(diǎn);另一方面增加對(duì)不同時(shí)間段的新舊種薯進(jìn)行研究,拓寬了可識(shí)別種薯的范圍,使得應(yīng)用更為廣泛,為種薯智能切塊機(jī)的設(shè)計(jì)奠定基礎(chǔ)。