趙學(xué)觀,王 秀,*,李翠玲,高原源,3,王松林,馮青春
(1.北京農(nóng)業(yè)智能裝備技術(shù)研究中心,北京 100097; 2.國(guó)家農(nóng)業(yè)智能裝備技術(shù)研究中心,北京 100097; 3.中國(guó)農(nóng)業(yè)大學(xué) 信電學(xué)院,北京 100083)
基于主成分分析及LVQ神經(jīng)網(wǎng)絡(luò)的番茄種子品種識(shí)別
趙學(xué)觀1,2,王 秀1,2,*,李翠玲1,2,高原源1,2,3,王松林1,2,馮青春1,2
(1.北京農(nóng)業(yè)智能裝備技術(shù)研究中心,北京 100097; 2.國(guó)家農(nóng)業(yè)智能裝備技術(shù)研究中心,北京 100097; 3.中國(guó)農(nóng)業(yè)大學(xué) 信電學(xué)院,北京 100083)
提出了一種基于主成分分析優(yōu)化(PCA)及競(jìng)爭(zhēng)性神經(jīng)網(wǎng)絡(luò)(LVQ)的番茄種子品種識(shí)別方法,對(duì)番茄品種識(shí)別技術(shù)與算法進(jìn)行了研究,提取了番茄種子的幾何特征、紋理特征和7個(gè)不變矩特征,通過(guò)主成分分析選取了4個(gè)主成分作為人工神經(jīng)網(wǎng)絡(luò)的輸入,對(duì)黑迪、紅迪、佳粉十八、金迪、丘比特5個(gè)品種進(jìn)行了LVQ神經(jīng)網(wǎng)絡(luò)品種識(shí)別試驗(yàn)。試驗(yàn)結(jié)果表明,競(jìng)爭(zhēng)層節(jié)點(diǎn)數(shù)目為20,訓(xùn)練次數(shù)為96時(shí)每粒種子識(shí)別的平均耗時(shí)最短,識(shí)別準(zhǔn)確率最高,分別為0.2 s、90.5%,基于機(jī)器視覺的番茄種子品種識(shí)別與檢測(cè)方法是可行的。
番茄種子;品種識(shí)別;計(jì)算機(jī)視覺;神經(jīng)網(wǎng)絡(luò)
在中國(guó),種子加工粗放,生產(chǎn)用種純度不高是種業(yè)的突出問(wèn)題。因種子質(zhì)量造成的損失往往是其自身價(jià)值的幾十倍,番茄種子較小,在市場(chǎng)中以次充好的現(xiàn)象時(shí)有發(fā)生[1-2]。種子純度的鑒定過(guò)程費(fèi)時(shí)費(fèi)工,隨著種子鑒定精度要求的日益提高,靠人工感官進(jìn)行識(shí)別判斷已經(jīng)很難滿足現(xiàn)代農(nóng)業(yè)的生產(chǎn)要求。機(jī)器視覺技術(shù)代替人工視覺不僅可以提高工作效率和自動(dòng)化程度,而且適應(yīng)一些復(fù)雜環(huán)境,可以減少人工作業(yè)中由于主觀因素影響出現(xiàn)的誤差。因此,隨著機(jī)器視覺檢測(cè)技術(shù)的不斷發(fā)展,其在農(nóng)產(chǎn)品品種純度自動(dòng)化檢測(cè)方面的應(yīng)用越來(lái)越廣泛[3-8]。計(jì)算機(jī)自動(dòng)識(shí)別技術(shù)是通過(guò)對(duì)種子圖像進(jìn)行計(jì)算與分析,提取可區(qū)分于其他番茄種類的穩(wěn)定特征,借助神經(jīng)網(wǎng)絡(luò)技術(shù)達(dá)到品種分類和識(shí)別的目的。國(guó)內(nèi)外基于神經(jīng)網(wǎng)絡(luò)的種子品種識(shí)別方面進(jìn)行了大量研究,并取得了一定的成果。
德黑蘭大學(xué)Tabrizi等[9]應(yīng)用特征選擇和神經(jīng)網(wǎng)絡(luò)分類器相結(jié)合的方法識(shí)別外周血中的5種白細(xì)胞。通過(guò)主成分分析法對(duì)白細(xì)胞特征進(jìn)行了選擇,建立競(jìng)爭(zhēng)性神經(jīng)網(wǎng)絡(luò)對(duì)5種白細(xì)胞進(jìn)行了分類。研究中根據(jù)白細(xì)胞的特點(diǎn)將顏色、紋理作為細(xì)胞分類特征,而沒有考慮細(xì)胞Hu不變矩。阿根廷羅薩里奧物理研究所利用樸素貝葉斯分類器評(píng)估57種雜草種子,確定了一個(gè)接近最優(yōu)的12(6個(gè)形態(tài)+4個(gè)顏色+2個(gè)紋理)種子特性作為分類參數(shù),然而該方法在分類器參數(shù)選擇上存在困難[10]。土耳其烏魯達(dá)大學(xué)Kurtulmu等[11]提出了一種基于神經(jīng)網(wǎng)絡(luò)和計(jì)算機(jī)視覺的辣椒種子鑒別方法,首先采集用于辣椒種子分類的顏色、形狀和紋理的圖像特征,然后利用順序特征選擇法將特征數(shù)目從257減少到10,但順序特征選擇效率和訓(xùn)練算法識(shí)別辣椒準(zhǔn)確率不高。
王路等[12]提出一種基于學(xué)習(xí)矢量量化 (LVQ)神經(jīng)網(wǎng)絡(luò)的計(jì)算機(jī)植物種類識(shí)別新方法,分別提取了葉片的幾何特征和紋理特征。應(yīng)用LVQ神經(jīng)網(wǎng)絡(luò)識(shí)別植物種類,該方法對(duì)植物種類的識(shí)別效率較高。武小紅等[13]提出一種將無(wú)監(jiān)督可能模糊聚類同模糊學(xué)習(xí)矢量量化相結(jié)合的無(wú)監(jiān)督可能模糊學(xué)習(xí)矢量量化(UPFLVQ) 算法,該算法適用于無(wú)學(xué)習(xí)樣本情況下的樣本分類,首先采用主成分分析(PCA) 得到近紅外光譜前三個(gè)主成分,并進(jìn)行了近紅外光譜的生菜品種鑒別。
雖然國(guó)內(nèi)外已經(jīng)進(jìn)行了一些基于機(jī)器視覺的種類識(shí)別研究,但不同目標(biāo)的特征存在較大差異,在基于計(jì)算機(jī)視覺和神經(jīng)網(wǎng)絡(luò)的番茄種子品種識(shí)別方面尚未報(bào)道。本研究的目的是開發(fā)一個(gè)基于主成分分析—神經(jīng)網(wǎng)絡(luò)的品種分類系統(tǒng),并確定神經(jīng)網(wǎng)絡(luò)最佳特征模型以達(dá)到快速、準(zhǔn)確分類識(shí)別的目的。為種子生產(chǎn)加工企業(yè)進(jìn)行小粒種子的分選、精揀以及種子推廣站進(jìn)行種子純度的監(jiān)督提供技術(shù)基礎(chǔ)。
供試的番茄品種共有5個(gè),由國(guó)家蔬菜工程技術(shù)研究中心及北京卓生農(nóng)業(yè)科技有限公司提供,分別為黑迪、紅迪、金迪、佳粉十八、丘比特,并剔除了有明顯損傷的種子,挑選形態(tài)特征相對(duì)標(biāo)準(zhǔn)的種子進(jìn)行研究。番茄種子品種識(shí)別系統(tǒng)主要由硬件系統(tǒng)和軟件系統(tǒng)組成,硬件系統(tǒng)由圖像采集系統(tǒng)、圖像信息存儲(chǔ)設(shè)備、圖像處理及結(jié)果輸出設(shè)備等組成,相機(jī)選用大恒圖像MER-1520-7G系列數(shù)字?jǐn)z像機(jī),分辨率4608 (H) ×3288 (V)。光源采用大恒圖像HPR-150SW/B型環(huán)形光源,光源外徑166 mm,為系統(tǒng)提供均勻照明;光箱內(nèi)側(cè)涂有反射性好的白漆;載物臺(tái)表面為黑色絨布,以使背景反射接近漫反射,使得番茄種子圖像光線均勻,番茄種子隨機(jī)的彼此互不接觸地置于載物臺(tái)上。種子分類識(shí)別系統(tǒng)控制界面采用Microsoft Visual Studio 2012 開發(fā),通過(guò)相機(jī)獲取的番茄種子圖像及處理圖像實(shí)時(shí)顯示在控制界面上,如圖1所示。
2.1 幾何特征提取
在圖像識(shí)別的過(guò)程中,形狀特征往往能夠提供種子識(shí)別的一些重要信息。圖像采集時(shí)分別將5個(gè)品種的種子隨機(jī)鋪散在載物臺(tái)上,種子之間保持一定的間距,所采集的整幅粒群圖像如圖2所示。
然后再對(duì)種子圖像進(jìn)行灰度化、中值濾波、形態(tài)學(xué)處理等預(yù)處理,最后得到所需圖像。中值濾波方法選取模板尺寸為 3×3,閾值分割選用自適應(yīng)閾值分割法,利用opencv中histogram函數(shù)計(jì)算直方圖并歸一化,計(jì)算圖像灰度均值avgV,計(jì)算直方圖的零階矩u[i]和一階矩w[i],根據(jù)公式1,計(jì)算并找到最大的類間方差,對(duì)應(yīng)此最大方差的灰度值即為要找的閾值。該閾值以最佳門限將圖像分割為前景和背景,實(shí)現(xiàn)了圖像的二值化并據(jù)前景圖像輪廓尋找種子的中心。
variance[i]=(avgV*w[i]-u[i])*(avgV*w[i]-u[i])/(w[i]*(1-w[i]))。
(1)
在整幅圖像獲取基礎(chǔ)上,先定位番茄種子的中心,采用設(shè)定ROI(感興趣區(qū)域)的方式截取每個(gè)種子的單獨(dú)圖像,以種子中心為中心,在X、Y正負(fù)方向110個(gè)像素值處,截取每個(gè)大小為220×220像素的單獨(dú)圖像,以獲得統(tǒng)一大小的種子圖像。剔除黏連圖像,提取的5種番茄種子圖像如圖3所示。
圖像閾值化后進(jìn)行邊界跟蹤以獲得番茄種子的外輪廓,首先對(duì)平滑后的圖像進(jìn)行sobel邊緣檢測(cè),對(duì)聯(lián)合的sobel檢測(cè)圖像進(jìn)行非極大抑制,連接邊緣點(diǎn)并進(jìn)行滯后閾值處理。在此基礎(chǔ)上,對(duì)番茄種子的幾何特征進(jìn)行了特征提取,實(shí)際提取的番茄種子的主要幾何特征參數(shù)分別為:最小外接圓半徑、最大內(nèi)切圓半徑、面積、周長(zhǎng)、當(dāng)量直徑、圓度、灰度均值。其中面積為目標(biāo)物番茄種子的像素點(diǎn)總數(shù),周長(zhǎng)為番茄種子邊界的輪廓長(zhǎng)度,當(dāng)量直徑為 4 倍面積與π比值的平方根,圓度為種子輪廓的最小外接圓半徑與最大內(nèi)切圓半徑的比值,灰度均值為圖像轉(zhuǎn)換為灰度圖像后每個(gè)種子輪廓內(nèi)部像素值的平均。番茄種子特征提取過(guò)程如圖4所示[15-16],提取的各品種番茄種子的特征均值如表1所示。
2.2 顏色特征提取
圖3 五個(gè)品種種子隨機(jī)位置采集圖像Fig.3 Random position images of five varieties of seeds
圖4 番茄種子特征提取步驟Fig.4 Tomato seeds feature extraction step
表1 七個(gè)幾何特征數(shù)值
Table 1 Hu moment invariant characteristic value
品種Variety面積Area周長(zhǎng)Perimeter當(dāng)量直徑Diameter圓度Radiusratio灰度均值Graymean最小外接圓半徑Circumradius最大內(nèi)切圓半徑Inradius黑迪Heidi9622386.375288.645361.790108165138.220888.64536紅迪Hongdi7021320.597892.745161.741705145117.957676.05919佳粉十八Jiafenshiba14456531.60132.46021.955927121175.4109103.1746金迪Jindi7621323.529596.825551.558191174115.104382.07923丘比特Cupid10356428.0378111.99142.148421132145.499186.26703
考慮到番茄種子顏色特征向量可以作為品種純度識(shí)別的特征,本試驗(yàn)首先進(jìn)行了番茄種子HSV 顏色特征向量的提取,根據(jù)獲取的H-S直方圖結(jié)果發(fā)現(xiàn),基于HSV空間的顏色特征很難區(qū)分不同品種,其中金迪和丘比特H-S直方圖如圖5所示,兩個(gè)品種種子圖像只存在H分量的微小區(qū)別。通過(guò)在RGB顏色空間的顏色特征提取發(fā)現(xiàn),同樣存在著該問(wèn)題。因此,顏色特征并不能作為番茄種子分類的特征。
2.3 紋理特征提取
灰度共生矩陣算法(GLCM)不僅反映了圖像的亮度分布特性,也反映了具有相似亮度和同樣亮度的兩個(gè)像素點(diǎn)在位置上的分布情況。通常可以用一些標(biāo)量來(lái)表征灰度共生矩陣的特征,本文選取灰度共生矩陣常用的特征。ASM 能量(angular second moment)反映灰度共生矩陣值的分布情況和紋理粗細(xì)度,令P表示灰度共生矩陣,則
(2)
ASM值越大,灰度共生矩陣值分布越均勻?;叶染底鳛檎w反映種子表面感光的特征,不能反映某個(gè)像素值及其領(lǐng)域像素值的亮度的對(duì)比情況,本文進(jìn)一步選取對(duì)比度作為識(shí)別特征,以更好的表達(dá)了圖像的清晰度和紋理溝紋深淺的程度,對(duì)比度為式(3):
(3)
式中:i為圖像的寬度;j為圖像的高度。
2.4 Hu矩特征提取
圖5 金迪和丘比特H-S直方圖Fig.5 H-S histogram of Jindi and Cupid
1962年Hu首先提出了不變矩的概念,矩是一種非常重要的表示目標(biāo)總體形狀的特征量。它對(duì)圖像的旋轉(zhuǎn)、縮放、平移均不敏感。因此,本文通過(guò)計(jì)算番茄種子輪廓的7個(gè)不變矩可得到7個(gè)矩不變量。二維灰度圖像f(x+y)的(p+q)階規(guī)則矩的一般表達(dá)式為[5,15]:
(4)
定義歸一化中心距為:
(5)
式中:r=(p+q)/2+1,p、q=0,1,2…
Hu不變矩中前3個(gè)不變矩為:
(6)
由于不變矩的變化范圍很大,為了便于比較,可利用取對(duì)數(shù)的方法進(jìn)行數(shù)據(jù)壓縮;因此先取絕對(duì)值,再對(duì)其取對(duì)數(shù),故實(shí)際采用的不變距為
φi=log|φi|。
(7)
其中,i=1,2,3…
全部300幅圖像被分為兩部分,240幅圖像作為網(wǎng)絡(luò)的訓(xùn)練集,其余60張作為測(cè)試集,訓(xùn)練集中每種種子圖像48張,計(jì)算每幅圖像的 7 個(gè) Hu 氏不變距特征參數(shù),并取其平均值,結(jié)果見表2。
根據(jù)模式識(shí)別的知識(shí),神經(jīng)網(wǎng)絡(luò)的每一個(gè)輸入節(jié)點(diǎn)對(duì)應(yīng)著一個(gè)特征值,如果把番茄種子的所有特征直接作為神經(jīng)網(wǎng)絡(luò)的輸入,存在著神經(jīng)網(wǎng)絡(luò)規(guī)模比較龐大的問(wèn)題。使用主成分分析的方法把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo),利用主成分綜合原始變量的信息,達(dá)到降維的目的。因此,本文提出了PCA-LVQ番茄品種識(shí)別模型,該模型包括3個(gè)步驟[17-19]。
(1)選取各品種數(shù)據(jù)樣本集并進(jìn)行標(biāo)準(zhǔn)化處理。將樣本集分為2部分,即訓(xùn)練集和測(cè)試集。
這里采用標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化方法,其公式為
(8)
(2)對(duì)訓(xùn)練集和測(cè)試集數(shù)據(jù)進(jìn)行主成分分析,按照累計(jì)貢獻(xiàn)率大于90%選擇主成分。
(3)把訓(xùn)練集選取的主成分輸入LVQ神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,建立PCA-LVQ番茄種子識(shí)別模型,進(jìn)行測(cè)試樣本的分類。
建立16項(xiàng)特征因子的矩陣,通過(guò)Matlab自帶函數(shù)princomp進(jìn)行主成分分析。主成分分析的結(jié)果如表 3(截取了番茄種子主成分分析的16項(xiàng)特征因子中的前 4 項(xiàng)),結(jié)果表明,該種子的前4 項(xiàng)特征因子代表了91.58%以上的信息,因此,取變換后的4個(gè)特征向量就可以代表16個(gè)原始特征向量,并且第一主成分的方差是4.697,第二主成分的方差是4.221。
雖然BP網(wǎng)絡(luò)是一種應(yīng)用最為普遍的網(wǎng)絡(luò),但其采用了基于梯度下降的非線性優(yōu)化策略,不能保證求出全局最小值。這里嘗試?yán)肔VQ網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)模式識(shí)別,LVQ網(wǎng)絡(luò)的優(yōu)點(diǎn)是只需要直接計(jì)算輸入向量與競(jìng)爭(zhēng)層之間的距離,從而實(shí)現(xiàn)模式識(shí)別,因此簡(jiǎn)單易行[14,19]。
表2 七個(gè)Hu氏不變矩特征數(shù)值
Table 2 Hu moment invariant characteristic value
品種VarietyHu(1)Hu(2)Hu(3)Hu(4)Hu(5)Hu(6)Hu(7)黑迪Heidi5.922815.832421.646523.513352.349832.427246.2146紅迪Hongdi5.578015.682920.754324.098746.879732.676646.9642佳粉十八Jiafenshiba5.970815.091423.001224.233248.073234.339749.0709金迪Jindi5.580618.148120.355621.863444.128632.747543.1317丘比特Cupid6.017815.132722.54124.198847.870332.220350.4719
表3 主成分分析結(jié)果
Table 3 Results of principal component analysis
主成分Principalcomponent初始特征根Initialcharacteristicroot總值Totalvalue方差百分比Percentageofvariance/%累計(jì)Cumulativesum/%未經(jīng)旋轉(zhuǎn)提取的因子載荷平方和Squaresumofthefactorloadwithoutrotation總值Totalvalue方差百分比Percentageofvariance/%累計(jì)Cumulativesum/%14.69730.2331.294.69730.2331.2924.22127.1657.394.22127.1657.3932.88318.5575.942.88318.5575.9442.43015.6491.582.43015.6491.5850.3242.0993.6760.2731.7595.4270.2371.5396.9580.1961.2698.2190.1170.7598.96100.0730.4799.43110.0290.1999.62120.0200.1399.75130.0160.1099.85140.0140.0999.94150.0080.0599.99160.0010.01100.00
LVQ網(wǎng)絡(luò)結(jié)構(gòu)如圖6所示,一個(gè)學(xué)習(xí)矢量量化(LVQ)網(wǎng)絡(luò)由三層神經(jīng)元組成,即輸入層、隱含層和輸出層。
在進(jìn)行了上述主成分分析之后,采用4個(gè)主特征作為人工神經(jīng)網(wǎng)絡(luò)的輸入。本試驗(yàn)只以5個(gè)番茄品種作為類別數(shù),共有5個(gè)輸出可能,因此人工神經(jīng)網(wǎng)絡(luò)的輸出節(jié)點(diǎn)數(shù)是5個(gè),對(duì)5種目標(biāo)進(jìn)行編碼聚類,網(wǎng)絡(luò)的期望輸出為[0 0 1]、[0 1 0]、[0 1 1]、[1 0 0]、[1 0 1]。競(jìng)爭(zhēng)層節(jié)點(diǎn)數(shù)應(yīng)在綜合考慮網(wǎng)絡(luò)訓(xùn)練耗時(shí)和誤差大小的情況下確定,通過(guò)試驗(yàn)確定競(jìng)爭(zhēng)層節(jié)點(diǎn)數(shù),試驗(yàn)中選取不同競(jìng)爭(zhēng)層節(jié)點(diǎn)個(gè)數(shù)分別進(jìn)行訓(xùn)練。通過(guò)對(duì)不同競(jìng)爭(zhēng)層節(jié)點(diǎn)數(shù)進(jìn)行仿真試驗(yàn)發(fā)現(xiàn),競(jìng)爭(zhēng)層節(jié)點(diǎn)數(shù)選擇得太少就不能建立很好的判斷界面,從而導(dǎo)致一系列的誤判現(xiàn)象發(fā)生。而競(jìng)爭(zhēng)層節(jié)點(diǎn)數(shù)太多,不僅增加了訓(xùn)練和識(shí)別的時(shí)間,而且番茄品種的識(shí)別率并沒有得到明顯地提高,如圖7-A所示,識(shí)別準(zhǔn)確率隨著網(wǎng)絡(luò)訓(xùn)練次數(shù)的增大不斷提高,競(jìng)爭(zhēng)層節(jié)點(diǎn)數(shù)目越大識(shí)別準(zhǔn)確率增長(zhǎng)越快,當(dāng)節(jié)點(diǎn)數(shù)量大于20時(shí),識(shí)別準(zhǔn)確率不再隨著節(jié)點(diǎn)數(shù)目的增加而顯著提高,在此條件下,網(wǎng)絡(luò)訓(xùn)練次數(shù)達(dá)到100時(shí),識(shí)別準(zhǔn)確率不再隨著網(wǎng)絡(luò)訓(xùn)練次數(shù)的增大而顯著提高。為保證識(shí)別準(zhǔn)確率應(yīng)選擇競(jìng)爭(zhēng)層節(jié)點(diǎn)數(shù)量大于20,但競(jìng)爭(zhēng)層節(jié)點(diǎn)數(shù)目越大網(wǎng)絡(luò)訓(xùn)練耗時(shí)越大,如圖7-B,競(jìng)爭(zhēng)層節(jié)點(diǎn)數(shù)目25時(shí)比數(shù)目為20時(shí)耗時(shí)增加19 s,綜合以上分析,最終確定競(jìng)爭(zhēng)層節(jié)點(diǎn)數(shù)目為20,訓(xùn)練次數(shù)為96次,在此條件下進(jìn)行網(wǎng)絡(luò)訓(xùn)練監(jiān)測(cè)曲線如圖8所示。
圖6 LVQ 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.6 Structure of LVQ network
本系統(tǒng)經(jīng)過(guò)試驗(yàn)對(duì)比后決定使用0.02的學(xué)習(xí)速率。雖然用這個(gè)學(xué)習(xí)速率訓(xùn)練時(shí)間還是比較長(zhǎng),但是它能保證識(shí)別準(zhǔn)確率,學(xué)習(xí)函數(shù)采用leranlvl,期望誤差設(shè)為 0.1。為了作對(duì)比,本試驗(yàn)分別對(duì)LVQ網(wǎng)絡(luò)和傳統(tǒng)的BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練識(shí)別,對(duì)60張測(cè)試圖片進(jìn)行識(shí)別,識(shí)別結(jié)果如表4所示。
圖7 識(shí)別準(zhǔn)確率和耗時(shí)時(shí)間與網(wǎng)絡(luò)訓(xùn)練次數(shù)關(guān)系曲線Fig.7 Relationship curves between recognition accuracy, time consuming and the numbers of network training
圖8 網(wǎng)絡(luò)訓(xùn)練監(jiān)測(cè)曲線Fig.8 Monitoring curve of neural network training
本試驗(yàn)結(jié)果可以得出,LVQ神經(jīng)網(wǎng)絡(luò)識(shí)別速度明顯比BP神經(jīng)網(wǎng)絡(luò)識(shí)別要快,基于4個(gè)主成分的LVQ神經(jīng)網(wǎng)絡(luò)識(shí)別準(zhǔn)確率與全特征識(shí)別準(zhǔn)確率近似,可達(dá)到90.5%。總體來(lái)看,BP神經(jīng)網(wǎng)絡(luò)和LVQ神經(jīng)網(wǎng)絡(luò)兩種方法對(duì)番茄種子識(shí)別準(zhǔn)確率差異不大。相對(duì)于 BP 神經(jīng)網(wǎng)絡(luò)識(shí)別分類,PCA-LVQ識(shí)別模型大大提高了識(shí)別速度,為番茄種子分類識(shí)別提供了一條行之有效的途徑。
表4 番茄種子識(shí)別結(jié)果
Table 4 Tomato seed identification results
序號(hào)Serialnumber特征向量Featurevector測(cè)試數(shù)量Testquantity識(shí)別準(zhǔn)確率Recognitionaccuracyrate/%BPLVQ識(shí)別時(shí)間Recognitiontime/sBPLVQ每粒種子識(shí)別時(shí)間Identificationtimeperseed/sBPLVQ14個(gè)主成分 4Principalcomponents6091.2090.5017120.280.2027個(gè)Hu矩不變量 7Humomentinvariants6072.2070.8036320.600.5337個(gè)幾何特征+2紋理特征7Geometricfeatures+2texturefeatures6080.583.730240.500.40416特征(7個(gè)Hu矩不變量+7個(gè)幾何特征+2紋理特征) 16Features(7Humomentinvariants+7geometricfeatures+2texturefeature)6093.492.818140.300.23
為了驗(yàn)證圖像處理算法的準(zhǔn)確性,本試驗(yàn)初步搭建了分選系統(tǒng)硬件結(jié)構(gòu),如圖9所示,系統(tǒng)控制單元由計(jì)算機(jī)、西門子PLC及驅(qū)動(dòng)器組成。圖像采集處理單元采集圖像,計(jì)算機(jī)圖像處理后將處理結(jié)果動(dòng)態(tài)發(fā)送至控制系統(tǒng),控制系統(tǒng)根據(jù)所接收的數(shù)據(jù),驅(qū)動(dòng)直角坐標(biāo)分揀機(jī)械臂移動(dòng),到達(dá)需揀出的品種位置打開相應(yīng)電磁閥,準(zhǔn)確快速實(shí)現(xiàn)分揀過(guò)程。
試驗(yàn)在國(guó)家精準(zhǔn)農(nóng)業(yè)研究示范基地進(jìn)行,分別取5個(gè)品種的種子各200粒,試驗(yàn)時(shí)將5種不同種子等數(shù)量的共200粒種子隨機(jī)鋪散在工作臺(tái)上,每次設(shè)定按照順序分揀其中一個(gè)品種種子,試驗(yàn)共分5次進(jìn)行。工作時(shí),控制器控制步進(jìn)電機(jī)帶動(dòng)負(fù)壓吸口移動(dòng)到相應(yīng)位置,進(jìn)行吸種,設(shè)定分揀的種子在氣流的作用下進(jìn)入種子收集裝置,以便于種子的統(tǒng)計(jì),分揀統(tǒng)計(jì)結(jié)果如表5所示。佳粉十八的分揀正確率最高,為98.5%,黑迪與金迪的分揀正確率較低,為85%左右,試驗(yàn)中發(fā)現(xiàn)兩者之間的誤揀率較高??傮w分揀正確率為89.8%,基本與算法的正確率保持一致。系統(tǒng)平均分揀一粒種子的時(shí)間為3.2 s,種子識(shí)別算法的速度很難再有較大的提升,優(yōu)化分揀運(yùn)動(dòng)路徑是減少分揀執(zhí)行機(jī)構(gòu)耗時(shí)的重點(diǎn)。由總體提高種子品質(zhì)的角度出發(fā),提高種子純度及種子質(zhì)量應(yīng)作為共同考慮的目標(biāo),結(jié)合種子外觀及內(nèi)部品質(zhì)的分揀、檢測(cè)應(yīng)作為下一步的重點(diǎn),如本研究中黑迪與金迪之間誤揀的現(xiàn)象,可借助內(nèi)部檢測(cè)手段,如X射線檢測(cè)。
1, 直角坐標(biāo)臺(tái);2, 攝像頭;3, 步進(jìn)電機(jī);4, 收集裝置;5, 負(fù)壓吸口;6, 種子區(qū);7, 真空發(fā)生器;8, 控制器;9, 驅(qū)動(dòng)器1, Rectangular coordinate system; 2, Camera; 3, Step-motor; 4, Gathering unit; 5, Negative pressure suction; 6, Seed; 7, Vacuum generator; 8,Controller; 9,Driver圖9 番茄種子分揀系統(tǒng)圖Fig.9 Diagram of tomato seed sorting system
對(duì)于人眼很難分辨的番茄種子,提出了用機(jī)器視覺代替人眼對(duì)品種進(jìn)行有效識(shí)別的方法,運(yùn)用圖像處理技術(shù)提取番茄種子的形狀特征參數(shù),并利用主成分分析法,得出一組新的主特征。
表5 分揀試驗(yàn)結(jié)果
Table 5 Sorting test results
試驗(yàn)test黑迪Heidi紅迪Hongdi佳粉十八Jiafanshiba金迪Jindi丘比特Cupid正確數(shù)Correctnumber正確率Correctrate/%1323639333717788.52343540363918492.03353540343618090.04323838333517688.05353540353618190.5正確數(shù)CorrectNo.168179197171183——正確率Correctrate/%8489.598.585.591.5——
通過(guò)LVQ神經(jīng)網(wǎng)絡(luò)識(shí)別試驗(yàn),綜合考慮識(shí)別準(zhǔn)確率和網(wǎng)絡(luò)訓(xùn)練耗時(shí),確定競(jìng)爭(zhēng)層節(jié)點(diǎn)數(shù)目為20,訓(xùn)練次數(shù)為96次,此時(shí)LVQ神經(jīng)網(wǎng)絡(luò)的識(shí)別準(zhǔn)確率為90.5%。
通過(guò)LVQ和BP神經(jīng)網(wǎng)絡(luò)識(shí)別對(duì)比試驗(yàn),4個(gè)主成分的LVQ神經(jīng)網(wǎng)絡(luò)識(shí)別準(zhǔn)確率與全特征識(shí)別準(zhǔn)確率近似,總體來(lái)看基于BP神經(jīng)網(wǎng)絡(luò)和LVQ神經(jīng)網(wǎng)絡(luò)對(duì)番茄種子的識(shí)別準(zhǔn)確率差異不大,但LVQ神經(jīng)網(wǎng)絡(luò)識(shí)別速度明顯加快。
[1] 朱明,陳海軍,李永磊.中國(guó)種業(yè)機(jī)械化現(xiàn)狀調(diào)研與發(fā)展分析[J].農(nóng)業(yè)工程學(xué)報(bào),2015,31(14):1-7. ZHU M, CHEN H J, LI Y L. Investigation and development analysis of seed industry mechanization in China[J].TransactionsoftheChineseSocietyofAgriculturalEngineering, 2015,31(14):1-7. (in Chinese with English abstract)
[2] 蔡衛(wèi)國(guó),李偉,荀一.種子精選分級(jí)裝置自動(dòng)控制方法研究[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2005,36( 8) : 90-92. CAI W G, LI W, XUN Y. Study on automatic control method of seeds grading device[J].TransactionsoftheChineseSocietyforAgriculturalMachinery, 2005,36(8) : 90-92.(in Chinese with English abstract)
[4] 史智興,程洪,李江濤,等. 圖像處理識(shí)別玉米品種的特征參數(shù)研究[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2008, 24 (6) : 193-195. SHI Z X, CHENG H, LI J T, et al. Characteristic parameters to identify varieties of corn seeds by image processing[J].TransactionsoftheChineseSocietyofAgriculturalEngineering, 2008, 24 (6) :193-195. (in Chinese with English abstract)
[5] 趙文倉(cāng), 王軍欣. 雜草種子視覺不變特征提取及其種類識(shí)別[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2011, 27(3):158-161. ZHAO W C, WANG J X. Feature extraction based on visual invariance and species identification of weed seeds[J].TransactionsoftheChineseSocietyofAgriculturalEngineering, 2011, 27(3):158-161. (in Chinese with English abstract)
[6] 鄭宇.基于機(jī)器視覺的稻谷種子特征提取與品種識(shí)別方法研究[D].武漢:華中農(nóng)業(yè)大學(xué), 2009. ZHENG Y. Research on features extraction and varieties identification of rice seeds based on machine vision[D].Wuhan: Huazhong Agricultural University, 2009. (in Chinese with English abstract)
[7] 萬(wàn)鵬,孫瑜,孫永海.基于計(jì)算機(jī)視覺的大米粒形識(shí)別方法[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2008,38(2):489-492. WAN P, SUN Y, SUN Y H. Recognition method of rice kernel shape based on computer vision[J].JournalofJilinUniversity(EngineeringandTechnologyEdition), 2008, 38(2): 489-492. (in Chinese with English abstract)
[8] KHATCHATOURIAN O, PADILHA F R R. Soybean varieties recognition through the digital image processing using artificial neural network[J].EngenhariaAgricola, 2008,28(4): 759-769.
[9] TABRIZI P R, REZATOFIGHI S H, YAZDANPANAH M J. Using PCA and LVQ neural network for automatic recognition of five types of white blood cells[C]// Engineering in Medicine and Biology Society (EMBC), 2010 Annual International Conference of the IEEE, Aug. 31-Sept. 4, 2010, Buenos Aires, Argentina: IEEE :5593-5596.
[10] GRANITTO P M, NAVONE H D, VERDES P F, et al. Weed seeds identification by machine vision[J].ComputersandElectronicsinAgriculture, 2002, 33(2) : 91-103.
[12] 王路,張蕾,周彥軍,等.基于 LVQ神經(jīng)網(wǎng)絡(luò)的植物種類識(shí)別[J].吉林大學(xué)學(xué)報(bào)(理學(xué)版), 2007,45(3):421-426. WANG L, ZHANG L, ZHOU Y J, et al. Computer-aided plant species identification based on LVQ neural network[J].JournalofJilinUniversity(ScienceEdition), 2007, 45(3):421-426. (in Chinese with English abstract)
[13] 武小紅,蔡培強(qiáng),武斌,等.基于無(wú)監(jiān)督可能模糊學(xué)習(xí)矢量量化的近紅外光譜生菜品種鑒別研究[J]. 光譜學(xué)與光譜分析,2016,36(3):711-715. WU X H, CAI P Q, WU B, et al. The identification of lettuce varieties fuzzy learning vector quantization a using unsupervised possibilistic near infrared spectroscopy[J].SpectroscopyandSpectralAnalysis, 2016, 6(3): 711-715. (in Chinese with English abstract)
[14] LI J B, CHEN B Q, SHAO L H, et al. Variety identification of delinted cotton seeds based on BP neural network[J].TransactionsoftheChineseSocietyofAgriculturalEngineering, 2012, 28(S2): 265-269.
[15] 王玉亮,劉賢喜,蘇慶堂,等. 多對(duì)象特征提取和優(yōu)化神經(jīng)網(wǎng)絡(luò)的玉米種子品種識(shí)別[J]. 農(nóng)業(yè)工程學(xué)報(bào),2010,26 (6):199-204. WANG Y l,LIU X X, SU Q T, et al. Maize seeds varieties identification based on multi-object feature extraction and optimized neural network[J].TransactionsoftheChineseSocietyofAgriculturalEngineering, 2010, 26 (6):199-204. (in Chinese with English abstract)
[16] 陳兵旗,孫旭東,韓旭,等.基于機(jī)器視覺的水稻種子精選技術(shù)[J].農(nóng)業(yè)機(jī)械學(xué)報(bào), 2010, 41(7):168-173. CHEN B Q, SUN X D, HAN X, et al. Rice seeds selection based on machine vision[J].TransactionsoftheChineseSocietyforAgriculturalMachinery, 2010, 41(7):168-173. (in Chinese with English abstract)
[17] CUEVAS E, ZALDIVAR D, PEREZ M, et al. LVQ neural networks applied to face segmentation[J].IntelligentAutomation&SoftComputing, 2009, 15 (3):439-450.
[18] 包晗,康泉?jiǎng)?,周? 一種基于 LVQ 神經(jīng)網(wǎng)絡(luò)與圖像處理的火焰識(shí)別算法[J].中國(guó)安全科學(xué)學(xué)報(bào), 2011, 21:(6)60-64. BAO H, KANG Q S, ZHOU M. A flame recognition algorithm based on LVQ neural network and image processing[J].ChinaSafetyScienceJournal, 2011, 21 (6):60-64. (in Chinese with English abstract)
[19] 張建華,祁力鈞,冀榮華,等. 基于粗糙集和BP神經(jīng)網(wǎng)絡(luò)的棉花病害識(shí)別[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2012, 28(7): 161-167. ZHANG J H, QI L J, JI R H, et al. Cotton diseases identification based on rough sets and BP neural network[J].TransactionsoftheChineseSocietyofAgriculturalEngineering, 2012, 28(7): 161-167. (in Chinese with English abstract)
(責(zé)任編輯 張 韻)
Tomato seed varieties recognition based on principal component analysis and LVQ neural network
ZHAO Xueguan1,2, WANG Xiu1,2,*, LI Cuiling1,2, GAO Yuanyuan1,2,3, WANG Songlin1,2, FENG Qingchun1,2
(1.BeijingResearchCenterofIntelligentEquipmentforAgriculture,Beijing100097,China; 2.NationalResearchCenterofIntelligentEquipmentforAgriculture,BeijingAcademyofAgricultureandForestryScience,Beijing100097,China; 3.CollegeofElectricalandElectronicEngineering,ChinaAgriculturalUniversity,Beijing100083,China)
In order to realize the real-time, accurate and no-damage mechanization identification of tomato seed varieties, according to the characteristics of tomato seeds and its image, the tomato varieties identification technology and algorithm were studied. This paper proposed a tomato seed varieties identification method, which is a kind of optimization by LVQ neural network based on principal components analysis, extracting the shape characteristics, texture feature and seven moment invariants of the tomato seeds. Four principal components as the input of artificial neural network were chosen through the principal components analysis. The identification test was conducted on five varieties of Heidi, Hongdi, Jiafen18, Jindi and Cupid. The number of competitive layer neurons and training trials were determined according to the test, which were 20 and 96. Under the condition, the average time of each seed identification was the shortest, and the recognition accuracy was the highest, which were 0.2 s and 90.5% respectively. The research showed that the method of identification and detection of tomato seed varieties based on machine vision is feasible.
tomato seed; variety recognition; computer vision; neural networks
10.3969/j.issn.1004-1524.2017.08.20
2016-12-12
國(guó)家高技術(shù)研究發(fā)展計(jì)劃(2013AA102406);北京市農(nóng)林科學(xué)院青年基金項(xiàng)目(QNJJ2017)
趙學(xué)觀(1988—),男,山東聊城人,博士,助理研究員,主要從事農(nóng)業(yè)智能裝備的研究。E-mail: zhaoxg@nercita.org.cn
*通信作者,王秀,E-mail: wangx1@nercita.org.cn
S126
A
1004-1524(2017)08-1375-09
趙學(xué)觀,王秀,李翠玲,等. 基于主成分分析及LVQ神經(jīng)網(wǎng)絡(luò)的番茄種子品種識(shí)別[J].浙江農(nóng)業(yè)學(xué)報(bào),2017,29(8): 1375-1383.
浙江農(nóng)業(yè)學(xué)報(bào)2017年8期