摘要:針對(duì)花生種子人工篩選存在工作量大、效率低等的問(wèn)題,提出一種基于顏色分割和改進(jìn)ELM的花生種子篩選算法。根據(jù)花生圖像的聚類特性,采用限定RGB和HSV顏色空間中顏色范圍的方法對(duì)花生圖像進(jìn)行顏色分割,獲取花生種子圖像目標(biāo)區(qū)域。采用顏色、形狀、改進(jìn)HU矩特征對(duì)花生圖像進(jìn)行描述,結(jié)合改進(jìn)HU矩平移、旋轉(zhuǎn)和縮放不變性,對(duì)提取到的花生圖像特征進(jìn)行數(shù)量擴(kuò)充,獲得花生圖像數(shù)據(jù)集。采用黃金分割法,確定隱含層神經(jīng)元個(gè)數(shù)。引入正則化參數(shù),提高ELM算法隱含層神經(jīng)元與輸出層之間連接權(quán)值矩陣的穩(wěn)定性;采用PSO算法,獲取最優(yōu)輸入權(quán)值和隱含層神經(jīng)元閾值,構(gòu)建PSO-RELM算法模型,并與BP、ELM、RELM算法進(jìn)行比較。試驗(yàn)結(jié)果表明,PSO-RELM算法不僅對(duì)完好花生有很高的識(shí)別準(zhǔn)確率(100%),還對(duì)破損花生也有很高的識(shí)別準(zhǔn)確率(96.71%),平均測(cè)試時(shí)間為0.006 8 s,均方根誤差為0.052 0,決定系數(shù)達(dá)0.987 4,能夠滿足花生種子篩選的實(shí)時(shí)性要求。
關(guān)鍵詞:花生種子篩選;顏色分割;極限學(xué)習(xí)機(jī);正則化參數(shù);粒子群算法
中圖分類號(hào):S643.9; S604.1" " " 文獻(xiàn)標(biāo)識(shí)碼:A" " " 文章編號(hào):2095?5553 (2024) 09?0089?08
Research on peanut seeds selection based on color segmentation and
PSO-RELM algorithm
Yang Li, Xue Yaxu, Li Pengfei, Peng Xinjie
(School of Electrical and Mechanical Engineering, Pingdingshan University, Pingdingshan, 467000, China)
Abstract: Aiming at the problems of large workload and low efficiency in the process of peanut seeds manual selection, a peanut seed selection algorithm based on color segmentation and improved ELM was put forward. Based on clustering characteristics of peanut image, peanut image was segmented by limiting the color range in RGB and HSV color space, to obtain the peanut seeds of image target area. The feature of peanut image was described by using color, shape, improvement of HU moment, based on improved HU moment translation, rotation and scaling invariance, to expand the image characteristics of quantity and get the peanut image data sets. Golden section method was used to select number of hidden layer neurons quickly. Introducing the regularization parameter, the weights matrix stability was improved of the ELM algorithm between neurons in hidden layer and output layer connection. Using PSO algorithm to obtain the optimal input weights and threshold of the hidden layer neurons, on the basis, the PSO-RELM algorithm model was set up, and comparing with BP, ELM, RELM algorithm. Experimental results showed that PSO-RELM had a high recognition accuracy, not only for the intact peanut (100%), but also for the damage peanut (96.71%), average test time was 0.006 8 s, root mean square error was 0.052 0, determination coefficient was 0.987 4, which can meet the real?time requirements for peanut seeds.
Keywords: peanut seeds selection; color segmentation; extreme learning machine; regularization parameter; particle swarm optimization
0 引言
在花生選種時(shí),需要對(duì)表皮破損、果仁破損、顏色異常等不合格的種子進(jìn)行篩選。作為經(jīng)濟(jì)作物和油料作物,花生種子人工篩選存在工作量大、效率低等問(wèn)題,為了快速、準(zhǔn)確地篩選出合格花生種子,有必要對(duì)花生種子的智能篩選算法進(jìn)行研究。
神經(jīng)網(wǎng)絡(luò)在容錯(cuò)性、自學(xué)習(xí)和自適應(yīng)等方面,具有很強(qiáng)的優(yōu)勢(shì),已經(jīng)廣泛應(yīng)用于圖像處理和模式識(shí)別等領(lǐng)域。申志超等[1]利用花生圖像HOG特征提出基于遺傳算法優(yōu)化的SVM進(jìn)行花生表皮破損識(shí)別,準(zhǔn)確率達(dá)100%,平均測(cè)試時(shí)間為5.6 ms/張;韓仲志等[2]采用主分量進(jìn)行特征優(yōu)化,構(gòu)建SVM品質(zhì)檢測(cè)模型,規(guī)格和等級(jí)檢測(cè)準(zhǔn)確率達(dá)92%;但是BP、SVM這兩種算法在訓(xùn)練過(guò)程中容易陷入局部最小。張永超等[3]通過(guò)提取花生顏色特征和紋理特征,采用優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行花生種子篩選,準(zhǔn)確率為98.21%,時(shí)間為16.4 ms/張;趙志衡等[4]采用L2范數(shù)正則化、指數(shù)衰減化和滑動(dòng)平均模型優(yōu)化卷積神經(jīng)網(wǎng)絡(luò),進(jìn)行花生顆粒完整性識(shí)別,測(cè)試準(zhǔn)確率為98.18%,平均檢測(cè)時(shí)間為18 ms/張;Yang等[5]采用改進(jìn)的VGG16應(yīng)用于12種花生的識(shí)別和分類任務(wù),其中在花生豆莢試驗(yàn)集上的平均準(zhǔn)確率為96.7%;但是卷積神經(jīng)網(wǎng)絡(luò)沒(méi)有記憶功能,運(yùn)行時(shí)間長(zhǎng),對(duì)硬件設(shè)備要求高。對(duì)于花生種子篩選,也有學(xué)者[6?8]利用花生圖像光譜結(jié)合機(jī)器學(xué)習(xí)進(jìn)行分類和識(shí)別,且達(dá)到較好的效果。
本文基于花生圖像的RGB和HSV顏色特征,提出ELM算法的花生種子篩選方法[9, 10]。采用ELM算法,引入正則化參數(shù),并結(jié)合PSO優(yōu)化算法,實(shí)現(xiàn)對(duì)花生種子快速、準(zhǔn)確地篩選。
1 試驗(yàn)材料與方法
1.1 試驗(yàn)材料
針對(duì)大白沙花生進(jìn)行研究,圖像采集均在光線充足且沒(méi)有遮擋的環(huán)境下進(jìn)行,采集系統(tǒng)如圖1所示。在采集過(guò)程中,鏡頭與工作臺(tái)平行,兩者的距離為10 cm。采集圖像的分辨率為1 920像素×1 080像素。
根據(jù)花生外衣的情況,可將采集的花生圖像分為外衣完好和外衣破損兩種類型,如圖2所示。為提高圖像處理效率,將采集的花生圖像分辨率均調(diào)為300像素×300像素。
1.2 試驗(yàn)準(zhǔn)備
1.2.1 圖像預(yù)處理
花生外衣顏色在不同光照下具有典型的聚類特征,為獲取其顏色分布特征,選取若干外衣完好的花生圖像,從中選擇60份外衣完好、大小均為10像素×10像素的圖像塊。分別對(duì)其R、G、B各分量的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),結(jié)果如圖3所示??芍猂、G、B三個(gè)分量的大小為Rgt;Ggt;B,且R/G基本維持在橫軸附近,與橫軸基本持平。
通過(guò)對(duì)R、G、B各分量及它們的關(guān)系進(jìn)行分析,可得式(1),能限定花生RGB圖像顏色空間范圍。
HSV圖像較接近人類對(duì)顏色的感知,為分析圖像塊在HSV空間的像素分布特點(diǎn),將其轉(zhuǎn)換為HSV圖像[11, 12]。根據(jù)式(1),可得出RGB到HSV的轉(zhuǎn)換關(guān)系,如式(2)所示。
當(dāng)自然光照發(fā)生變化時(shí),對(duì)應(yīng)的R、G、B變化量近似相等,由式(2)可知,H和S×V幾乎保持不變,故對(duì)H、S×V、V進(jìn)行分析,結(jié)果如圖4所示,其中S0=S×V,max和min分別表示H、S0、V分量的最大值和最小值。由此可知,H、S0、V各分量均在較小的范圍變化,且三者之間界限較為明顯,沒(méi)有重疊現(xiàn)象,故可根據(jù)完好花生外衣三者像素所在的分布范圍對(duì)其進(jìn)行HSV圖像分割。根據(jù)各分量的像素分布區(qū)域,在進(jìn)行花生HSV圖像分割時(shí)選取的范圍如式(3)所示。
花生圖像的預(yù)處理流程和效果圖,如圖5所示。分別對(duì)采集到的花生圖像進(jìn)行HSV分割和RGB分割,將分割后的圖像進(jìn)行邏輯“或”運(yùn)算,使得分割后的花生圖像既包含輪廓特征,又包含內(nèi)部特征,提高了花生圖像特征信息的完整性。通過(guò)填充空洞運(yùn)算、中值濾波和形態(tài)學(xué)運(yùn)算,獲得了花生分割圖像,為花生圖像特征提取提供依據(jù)。
1.2.2 試驗(yàn)數(shù)據(jù)提取
花生種子在外觀和形狀特征方面與其他種子有很明顯的區(qū)別,根據(jù)顏色特征、形狀特征及HU不變矩特征,對(duì)花生種子數(shù)據(jù)進(jìn)行提取。
1) 花生顏色特征提取。由花生RGB圖像各分量的分析可知,完好外衣花生的R/G值比較固定,均分布在(1.4, 2.8)范圍內(nèi),故可選取R/G值對(duì)花生圖像進(jìn)行提取,以區(qū)分外衣破損花生。
2) 花生形狀特征。在描述花生形狀特征時(shí),采用旋轉(zhuǎn)卡殼法獲取其形狀參數(shù)。首先將分割后的花生輪廓旋轉(zhuǎn)到豎直狀態(tài),然后根據(jù)其上下左右邊界點(diǎn)確定花生輪廓最小外接矩形,如圖6所示。矩形度用J=W/L表示,其中,L、W分別為最小外接矩形的長(zhǎng)和寬。
為進(jìn)一步描述花生的形狀,附加圓度C去表征,如式(4)所示,其中,S為輪廓區(qū)域的面積,P為輪廓邊界的周長(zhǎng)。
3) 花生HU矩特征。對(duì)于花生形狀、大小較固定的特點(diǎn),而HU矩具有平移、旋轉(zhuǎn)不變性特點(diǎn),故可對(duì)多種角度的花生圖像進(jìn)行表征。在離散狀態(tài)下,原HU矩不具有縮放不變性,圖像縮放之后的歸一化中心距會(huì)受矩階數(shù)和比例因數(shù)影響。為消除比例因數(shù)的影響,采用改進(jìn)HU矩[13, 14]對(duì)花生特征進(jìn)行提取,改進(jìn)后的HU矩有6個(gè)不變矩,分別為M1、M2、M3、M4、M5和M6,如式(5)所示,其中φ1、φ2、φ3、φ4、φ5、φ6和φ7為原HU矩的7個(gè)不變矩。
本文選取的花生特征分為顏色、面積和形狀、HU不變矩三方面,如表1所示,共包含9個(gè)特征。
1.3 試驗(yàn)方法
1.3.1 ELM算法
ELM算法是在前饋神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上提出的網(wǎng)絡(luò)算法,是典型的單隱層前饋神經(jīng)網(wǎng)絡(luò),結(jié)構(gòu)如圖7所示。
ELM算法結(jié)構(gòu)包含輸入層、隱含層和輸出層三層神經(jīng)元結(jié)構(gòu),各層之間神經(jīng)元均為全連接。輸入層神經(jīng)元個(gè)數(shù)為n,隱含層神經(jīng)元個(gè)數(shù)為l,輸出層神經(jīng)元個(gè)數(shù)為m。aij為輸入層與隱含層的連接權(quán),oj為每個(gè)隱含層神經(jīng)元的閾值,βij為隱含層與輸出層的連接權(quán)值。
ELM算法輸入層與隱含層的連接權(quán)值隨機(jī)產(chǎn)生,隱含層神經(jīng)元的閾值隨機(jī)產(chǎn)生。在訓(xùn)練時(shí),選定激活函數(shù)之后,僅需確定隱含層神經(jīng)元個(gè)數(shù),即可對(duì)隱含層與輸出層的連接權(quán)值矩陣βij進(jìn)行計(jì)算。通過(guò)權(quán)值矩陣βij可進(jìn)一步對(duì)未經(jīng)訓(xùn)練的數(shù)據(jù)進(jìn)行測(cè)試,具有學(xué)習(xí)速度快和泛化性能強(qiáng)等優(yōu)點(diǎn)。同時(shí)也存在著一定的問(wèn)題,輸入層與隱含層的連接權(quán)值和隱含層神經(jīng)元的閾值隨機(jī)產(chǎn)生會(huì)影響ELM算法每次的訓(xùn)練結(jié)果,反過(guò)來(lái)影響其泛化性能。
1.3.2 改進(jìn)ELM算法
當(dāng)訓(xùn)練樣本中的離群點(diǎn)較多時(shí),隱含層與輸出層的權(quán)值矩陣β具有不確定性,可能會(huì)影響模型的魯棒性和泛化性,故對(duì)式(8)進(jìn)行變換,可得式(9)。在式(9)中引入正則化參數(shù)[15, 16],可得式(10),通過(guò)修改正則化參數(shù),能提高模型的穩(wěn)定性。引入正則化參數(shù)λ的ELM算法稱為RELM算法。
輸入層與隱含層的連接權(quán)值和隱含層神經(jīng)元閾值的隨機(jī)產(chǎn)生會(huì)導(dǎo)致運(yùn)算結(jié)果不確定,僅僅通過(guò)一次或幾次運(yùn)算很難達(dá)到預(yù)期結(jié)果。為減小隨機(jī)數(shù)據(jù)所引起的誤差,采用PSO算法[17, 18]對(duì)引入正則化參數(shù)的ELM算法的輸入連接權(quán)值和閾值進(jìn)行迭代尋優(yōu),具體步驟如下。
1) 對(duì)于提取到的花生圖像特征建立訓(xùn)練樣本和測(cè)試樣本。
2) 引入正則化參數(shù),進(jìn)行最優(yōu)參數(shù)設(shè)置。
3) 將RELM算法的輸入連接權(quán)值和隱含層神經(jīng)元閾值設(shè)置為粒子,并確定粒子長(zhǎng)度。
4) 設(shè)置PSO算法的相關(guān)參數(shù),即速度更新參數(shù)、迭代次數(shù)、種群規(guī)模、速度最大最小值等參數(shù)。
5) 把訓(xùn)練樣本中初始化粒子的均方根誤差值作為每個(gè)粒子的適應(yīng)度值,不斷迭代,選擇較大的適應(yīng)度值作為新的個(gè)體極值和群體極值。
6) 當(dāng)均方根誤差值滿足條件或達(dá)到最大迭代次數(shù)時(shí),停止迭代,此時(shí)對(duì)應(yīng)的粒子即為所要尋找的最優(yōu)輸入連接權(quán)值和隱含層神經(jīng)元閾值。
7) 利用最優(yōu)參數(shù)對(duì)RELM算法進(jìn)行輸入層和隱含層賦值,以此獲得最優(yōu)RELM算法參數(shù)模型,即可對(duì)花生種子進(jìn)行完好和破損篩選。
1.3.3 隱含層神經(jīng)元個(gè)數(shù)的選取
對(duì)于ELM算法,隱含層神經(jīng)元個(gè)數(shù)選取過(guò)少會(huì)降低訓(xùn)練和測(cè)試準(zhǔn)確率,選取過(guò)多會(huì)延長(zhǎng)計(jì)算時(shí)間。為選擇合適的隱含層神經(jīng)元個(gè)數(shù),本文采用黃金分割法[19]進(jìn)行數(shù)確定。黃金分割法是通過(guò)不斷更改縮小最值范圍去尋找最優(yōu)解,選取最優(yōu)隱含層神經(jīng)元個(gè)數(shù)的具體迭代流程,如圖8所示。
1.3.4 評(píng)價(jià)指標(biāo)
采用ELM算法進(jìn)行花生種子篩選的評(píng)價(jià)指標(biāo)有訓(xùn)練準(zhǔn)確率、訓(xùn)練時(shí)間、測(cè)試準(zhǔn)確率、測(cè)試時(shí)間、均方根誤差RMSE和決定系數(shù)D,其中均方誤差,如式(11)所示,決定系數(shù)也稱擬合優(yōu)度,如式(12)所示,其中,m為樣本數(shù)量,[yi]為實(shí)際類別,[yi′]為測(cè)試類別,[yi]為實(shí)際類別均值。
2 試驗(yàn)結(jié)果與分析
2.1 仿真模型
2.1.1 樣本庫(kù)的搭建
通過(guò)圖像采集裝置共獲取花生圖像270張,其中外衣完好的數(shù)量為200張,外衣破損的數(shù)量為70張,分別對(duì)其進(jìn)行向右向下平移5個(gè)像素、順時(shí)針旋轉(zhuǎn)90°和放大原圖的2倍,再對(duì)其進(jìn)行顏色、形狀和HU矩描述,共獲取數(shù)據(jù)1 080組。
根據(jù)訓(xùn)練樣本占比80%原則,確定訓(xùn)練樣本和測(cè)試樣本數(shù)量分別為864張和216張,同時(shí),分別選取完好花生總數(shù)的81.75%和破損花生總數(shù)的75%作為訓(xùn)練樣本數(shù)據(jù),剩下的完好花生和破損花生作為測(cè)試樣本。為篩選花生種子類別,將外衣完好的花生種子編號(hào)為1,外衣破損的花生種子編號(hào)為2,表2為采集到的部分訓(xùn)練樣本數(shù)據(jù)??梢钥闯鐾旰没ㄉc破損花生在顏色、形狀和改進(jìn)HU矩方面有著較明顯的區(qū)別。
2.1.2 網(wǎng)絡(luò)模型結(jié)構(gòu)
輸入輸出神經(jīng)元個(gè)數(shù)的確定。由表2可知,提取到的花生特征有顏色、形狀和HU矩共9個(gè)特征,故選取的輸入神經(jīng)元個(gè)數(shù)為9。在進(jìn)行花生種子篩選時(shí),分完好和破損兩種,故輸出神經(jīng)元個(gè)數(shù)為2。
圖9顯示了隱含層神經(jīng)元個(gè)數(shù)與訓(xùn)練精度、測(cè)試精度以及訓(xùn)練時(shí)間之間的關(guān)系。隨著隱含層神經(jīng)元個(gè)數(shù)的增加,訓(xùn)練精度不斷提高,達(dá)到1以后基本不再變化,而測(cè)試精度剛開(kāi)始會(huì)不斷的接近于1,但隨著隱含層神經(jīng)元個(gè)數(shù)的增加,會(huì)出現(xiàn)降低現(xiàn)象,另一方面,隨著隱含層神經(jīng)元個(gè)數(shù)的增加,訓(xùn)練時(shí)間會(huì)不斷增大。綜合訓(xùn)練精度、測(cè)試精度和訓(xùn)練時(shí)間三方面因素,采用黃金分割法確定隱含層神經(jīng)元個(gè)數(shù)。通過(guò)多次迭代計(jì)算,確定隱含層神經(jīng)元個(gè)數(shù)為219,因此,搭建的網(wǎng)絡(luò)模型結(jié)構(gòu)為9-219-2。
2.1.3 激活函數(shù)的選取
基于ELM算法,分別對(duì)四種不同的激活函數(shù)“sigmoid”“sin”“hardlim”和“radbas”進(jìn)行10次訓(xùn)練和測(cè)試試驗(yàn),測(cè)試精度如圖10所示。可以看出相比于其他三種激活函數(shù),“radbas”的平均測(cè)試精度最高,故選取“radbas”作為激活函數(shù)。
2.1.4 優(yōu)化算法參數(shù)選擇
引入正則化參數(shù),結(jié)合PSO迭代尋優(yōu)對(duì)ELM算法進(jìn)行改進(jìn)。通過(guò)多次試驗(yàn),選取的最優(yōu)參數(shù)如表3所示。
2.2 試驗(yàn)結(jié)果
2.2.1 ELM算法花生種子篩選的可行性驗(yàn)證
通過(guò)前述搭建的網(wǎng)絡(luò)模型,結(jié)合ELM算法對(duì)花生種子樣本數(shù)據(jù)分別進(jìn)行訓(xùn)練和測(cè)試。測(cè)試的部分結(jié)果如表4所示,可以看出測(cè)試結(jié)果與實(shí)際類別一致,且誤差較小。試驗(yàn)結(jié)果表明,采用ELM算法進(jìn)行花生種子篩選具有一定的可行性。
2.2.2 改進(jìn)ELM算法的優(yōu)化效果
分別采用ELM算法、RELM算法和PSO-RELM算法對(duì)花生種子樣本數(shù)據(jù)各進(jìn)行10次訓(xùn)練和測(cè)試試驗(yàn),其中10次測(cè)試試驗(yàn)的精度如圖11所示,可以看出RELM算法的平均精度高于ELM算法,而PSO-RELM算法的平均精度高于RELM算法。
試驗(yàn)表明,通過(guò)引入正則化參數(shù),采用PSO進(jìn)行輸入連接權(quán)值和隱含層神經(jīng)元閾值迭代尋優(yōu),改進(jìn)后的ELM算法在測(cè)試精度方面有了較大的提高。
2.2.3 改進(jìn)ELM算法的性能對(duì)比
為分析改進(jìn)ELM算法的測(cè)試結(jié)果,分別將PSO-RELM、RELM、ELM和BP的測(cè)試結(jié)果與實(shí)際的花生種子類別進(jìn)行對(duì)比,對(duì)比的部分結(jié)果如圖12所示??梢钥闯鯞P算法測(cè)試結(jié)果偏離實(shí)際值較遠(yuǎn),其次是ELM算法,然后是RELM算法,PSO-RELM算法的測(cè)試結(jié)果較接近實(shí)際值。
為分析PSO-RELM、RELM、ELM和BP四種算法測(cè)試結(jié)果的偏離程度,分別對(duì)其測(cè)試結(jié)果進(jìn)行絕對(duì)誤差計(jì)算,得到的部分測(cè)試誤差結(jié)果如圖13所示??梢钥闯?,BP算法的絕對(duì)誤差最大接近0.15,ELM算法的絕對(duì)誤差最大接近0.2,RELM算法的絕對(duì)誤差最大接近0.1,PSO-RELM算法的絕對(duì)誤差最大接近0.1。試驗(yàn)結(jié)果表明,在花生種子篩選的準(zhǔn)確率方面,PSO-RELM算法的平均準(zhǔn)確率最高,BP算法的平均準(zhǔn)確率最低。
為進(jìn)一步分析PSO-RELM算法的效果,分別從訓(xùn)練時(shí)間、測(cè)試時(shí)間、均方根誤差和決定系數(shù)四個(gè)方面與RELM、ELM和BP進(jìn)行對(duì)比。對(duì)四種算法各試驗(yàn)10次取平均值,結(jié)果如表5所示。
由表5可知,在訓(xùn)練時(shí)間方面,與BP算法對(duì)比,RELM算法具有明顯快速訓(xùn)練的特性,其次是ELM,再次是PSO-RELM;在測(cè)試時(shí)間方面,ELM算法及其改進(jìn)算法均具有較快的測(cè)試速度,PSO-RELM的平均測(cè)試時(shí)間為0.006 8 s;在均方根誤差RMSE方面,PSO-RELM算法表現(xiàn)出較明顯優(yōu)勢(shì),RMSE最小,為0.052 0,D為0.987 4,ELM算法和RELM算法較為接近,BP算法RMSE最大;在決定系數(shù)方面,PSO-RELM算法最接近于1,其次是RELM算法,然后是ELM算法,BP算法決定系數(shù)最低。
由試驗(yàn)結(jié)果可知,盡管PSO-RELM訓(xùn)練時(shí)間較長(zhǎng),但是在RMSE和D方面,該算法均具有較明顯優(yōu)勢(shì),在測(cè)試時(shí)間與ELM算法較接近時(shí),具有較快的測(cè)試速度。在進(jìn)行花生種子篩選時(shí),不是每次都需要訓(xùn)練,可知PSO-RELM的性能指標(biāo)為最佳。
2.3 試驗(yàn)分析
2.3.1 不同特征對(duì)花生識(shí)別率的影響
為分析單個(gè)特征對(duì)花生種子篩選的影響,分別采用提取到的花生顏色、形狀和改進(jìn)HU矩?cái)?shù)據(jù)進(jìn)行訓(xùn)練和測(cè)試,測(cè)試結(jié)果如圖14所示。
試驗(yàn)結(jié)果表明,單獨(dú)采用顏色特征進(jìn)行花生種子篩選時(shí),當(dāng)隱含層神經(jīng)元個(gè)數(shù)達(dá)到一定數(shù)目后,測(cè)試正確率較為穩(wěn)定,維持在90%~95%之間;單獨(dú)采用形狀特征進(jìn)行花生種子篩選時(shí),隨著隱含層神經(jīng)元個(gè)數(shù)的增加,會(huì)有較小的波動(dòng),但最大正確率可以達(dá)到100%;單獨(dú)采用改進(jìn)HU矩特征進(jìn)行花生種子篩選時(shí),隨著隱含層神經(jīng)元個(gè)數(shù)的增加,測(cè)試正確率會(huì)呈現(xiàn)先增后減變化趨勢(shì),且最大測(cè)試正確率在85%左右。綜上分析,形狀特征對(duì)于花生種子篩選影響最大,其次是顏色特征,HU不變矩對(duì)于花生種子篩選影響最小。
2.3.2 完好花生和破損花生的識(shí)別情況
為進(jìn)一步分析改進(jìn)ELM算法的篩選效果,分別對(duì)基于ELM、RELM和PSO-RELM算法的花生篩選結(jié)果進(jìn)行統(tǒng)計(jì)。每種算法各運(yùn)行10次,取其平均值作為試驗(yàn)結(jié)果,如表6所示,其中,測(cè)試樣本中完好花生數(shù)量為146,破損花生數(shù)量為70。試驗(yàn)結(jié)果表明,對(duì)于完好花生來(lái)說(shuō),準(zhǔn)確率都比較高,甚至能完全測(cè)試正確;對(duì)于破損花生來(lái)說(shuō),采用ELM算法進(jìn)行測(cè)試,準(zhǔn)確率最低,其次是RELM,采用PSO-RELM算法進(jìn)行測(cè)試,準(zhǔn)確率最高。因此,相對(duì)于ELM算法,PSO-RELM算法對(duì)于破損花生的準(zhǔn)確識(shí)別有著較明顯的改善,其準(zhǔn)確率高達(dá)96.71%。
3 結(jié)論
以花生種子篩選為研究?jī)?nèi)容,以篩選出外衣完好的花生和外衣破損的花生。
1) 采用限定花生種子圖像在RGB和HSV顏色空間中顏色范圍的方法對(duì)花生圖像進(jìn)行顏色分割,并通過(guò)邏輯運(yùn)算、形態(tài)學(xué)處理等獲取花生種子圖像的目標(biāo)區(qū)域,能對(duì)花生輪廓信息進(jìn)行較完整的表達(dá),有利于特征提取。
2) 采用黃金分割法選取隱含層神經(jīng)元個(gè)數(shù),通過(guò)迭代逼近運(yùn)算能夠快速地確定最優(yōu)神經(jīng)元個(gè)數(shù),大大縮短隱含層神經(jīng)元選取的時(shí)間。
3) 引入正則化參數(shù),提高ELM算法隱含層神經(jīng)元與輸出層之間連接權(quán)值矩陣的穩(wěn)定性。采用PSO算法迭代尋優(yōu),計(jì)算最優(yōu)的輸入權(quán)值和隱含層神經(jīng)元閾值,有效地解決ELM算法在運(yùn)算過(guò)程中隨機(jī)產(chǎn)生輸入權(quán)值和閾值導(dǎo)致的訓(xùn)練測(cè)試結(jié)果變化較大這一問(wèn)題。通過(guò)對(duì)完好花生和破損花生的識(shí)別分析,PSO-RELM算法不僅對(duì)完好花生有很高的識(shí)別準(zhǔn)確率(100%),對(duì)破損花生也有著很高的識(shí)別準(zhǔn)確率(96.71%)。該研究算法結(jié)構(gòu)較為簡(jiǎn)單,學(xué)習(xí)速度快,平均測(cè)試時(shí)間為0.006 8 s,均方根誤差為0.052 0,決定系數(shù)達(dá)0.987 4,能夠滿足花生種子實(shí)時(shí)篩選要求。
參 考 文 獻(xiàn)
[ 1 ] 申志超, 趙志衡, 盧雷, 等. 基于顏色分割與GA-SVM的花生表皮破損識(shí)別[J]. 中國(guó)糧油學(xué)報(bào), 2021, 36(3): 140-147.
Shen Zhichao, Zhao Zhiheng, Lu Lei, et al. Peanut's cuticle damage recognition based on color segmentation and GA-SVM [J]. Journal of the Chinese Cereals and Oils Association, 2021, 36(3): 140-147.
[ 2 ] 韓仲志, 趙友剛. 基于計(jì)算機(jī)視覺(jué)的花生品質(zhì)分級(jí)檢測(cè)研究[J]. 中國(guó)農(nóng)業(yè)科學(xué), 2010, 43(18): 3882-3891.
Han Zhongzhi, Zhao Yougang. Quality grade detection in peanut using computer vision [J]. Scientia Agricultura Sinica, 2010, 43(18): 3882-3891.
[ 3 ] 張永超, 趙錄懷, 卜光蘋(píng). 基于卷積神經(jīng)網(wǎng)絡(luò)的花生種子篩選識(shí)別算法[J]. 江西農(nóng)業(yè)學(xué)報(bào), 2020, 32(1): 77-82.
Zhang Yongchao, Zhao Luhuai, Bu Guangping. Screening and recognition algorithm of peanut seed based on convolutional neural network [J]. Acta Agriculturae Jiangxi, 2020, 32(1): 77-82.
[ 4 ] 趙志衡, 宋歡, 朱江波, 等. 基于卷積神經(jīng)網(wǎng)絡(luò)的花生籽粒完整性識(shí)別算法及應(yīng)用[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2018, 34(21): 195-201.
Zhao Zhiheng, Song Huan, Zhu Jiangbo, et al. Identification algorithm and application of peanut kernel integrity based on convolution neural network [J]. Transactions of the Chinese Society of Agricultural Engineering, 2018, 34(21): 195-201.
[ 5 ] Yang H, Ni J, Gao J, et al. A novel method for peanut variety identification and classification by improved VGG16 [J]. Scientific Reports, 2021, 11(1): 1-17.
[ 6 ] Zou Z, Wang L, Chen J, et al. Research on peanut variety classification based on hyperspectral image [J]. Food Science and Technology, 2022, 42.
[ 7 ] Yu H, Erasmus S W, Wang Q, et al. Rapid classification of peanut varieties for their processing into peanut butters based on near?infrared spectroscopy combined with machine learning [J]. Journal of Food Composition and Analysis, 2023: 105348.
[ 8 ] Balasubramaniyan M, Navaneethan C. Color contour texture based peanut classification using deep spread spectral features classification model for assortment identification [J]. Sustainable Energy Technologies and Assessments, 2022, 54: 102524.
[ 9 ] Huang G B, Zhu Q Y, Siew C K. Extreme learning machine: A new learning scheme of feedforward neural networks [C]. 2004 IEEE International Joint Conference On Neural Networks. IEEE, 2004, 2: 985-990.
[10] Huang G B, Zhu Q Y, Siew C K. Extreme learning machine: Theory and applications [J]. Neurocomputing, 2006, 70(1): 489-501.
[11] 梁秀滿, 姚珊珊, 牛福生, 等. 基于HSV顏色空間的礦物識(shí)別研究[J]. 有色金屬(選礦部分), 2022(6): 1-8.
Liang Xiuman, Yao Shanshan, Niu Fusheng, et al. Study on color mineral recognition in HSV color space [J]. Nonferrous Metals(Mineral Processing Section), 2022(6): 1-8.
[12] 李祥光, 趙偉, 趙雷雷. 缺株玉米行中心線提取算法研究[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2021, 37(18): 203-210.
Li Xiangguang, Zhao Wei, Zhao Leilei. Extraction algorithm of the center line of maize row in case of plants lacking [J]. Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(18): 203-210.
[13] 曹鵬輝, 呂書(shū)強(qiáng), 汪萬(wàn)福, 等. 基于光譜降維與Hu矩的壁畫(huà)顏料層脫落區(qū)域提取方法[J]. 圖學(xué)學(xué)報(bào), 2020, 41(6): 930-938.
Cao Penghui, Lü Shuqiang, Wang Wanfu, et al. Extraction of mural paint loss regions based on spectral dimensionality reduction and Hu moment [J]. Journal of Graphics, 2020, 41(6): 930-938.
[14] 蒲興成, 王濤, 張毅. 基于改進(jìn)Hu矩算法的Kinect手勢(shì)識(shí)別[J]. 計(jì)算機(jī)工程, 2016, 42(7): 165-172, 180.
Pu Xingcheng, Wang Tao, Zhang Yi. Kinect gesture recognition based on improved Hu moment algorithm [J]. Computer Engineering, 2016, 42(7): 165-172, 180.
[15] 樊宇星, 任妮, 田港陸, 等. 基于DeepAR?RELM的池塘溶解氧時(shí)空預(yù)測(cè)方法研究[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2020, 51(S1): 405-412.
Fan Yuxing, Ren Ni, Tian Ganglu, et al. Spatio?temporal prediction method of dissolved oxygen in ponds based on DeepAR-RELM [J]. Transactions of the Chinese Society for Agricultural Machinery, 2020, 51(S1): 405-412.
[16] 趙林鎖, 陳澤, 丁琳琳, 等. 基于RELM的時(shí)間序列數(shù)據(jù)加權(quán)集成分類方法[J]. 計(jì)算機(jī)工程與科學(xué), 2022, 44(3): 545-553.
Zhao Linsuo, Chen Ze, Ding Linlin, et al. A weighted ensemble classification method for time series data based on regularized extreme learning machine [J]. Computer Engineering amp; Science, 2022, 44(3): 545-553.
[17] 陳聰聰, 李程. 基于PSO?ELM算法的民航客運(yùn)量預(yù)測(cè)[J]. 控制工程, 2022, 29(11): 2042-2047.
Chen Congcong, Li Cheng. Passenger traffic forecast of civil aviation based on PSO?ELM algorithm [J]. Control Engineering of China, 2022, 29(11): 2042-2047.
[18] 周彥, 王山亮, 楊威, 等. 基于PSO-ELM的衛(wèi)星導(dǎo)航欺騙式干擾檢測(cè)[J]. 導(dǎo)航定位與授時(shí), 2022, 9(5): 153-161.
Zhou Yan, Wang Shanliang, Yang Wei, et al. Deceptive jamming detection of satellite navigation based on PSO-ELM [J]. Navigation Positioning and Timing, 2022, 9(5): 153-161.
[19] 洪艷, 潘東方, 姚海峰, 等. 基于黃金分割搜索的光伏陣列最大功率點(diǎn)跟蹤方法[J]. 合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版), 2014, 37(4): 416-419, 443.
Hong Yan, Pan Dongfang, Yao Haifeng, et al. Method of photovoltaic array maximum power point tracking based on golden section search [J]. Journal of Hefei University of Technology (Natural Science), 2014, 37(4): 416-419, 443.
中國(guó)農(nóng)機(jī)化學(xué)報(bào)2024年9期