范澤華, 張楠楠, 喻彩麗, 白鐵成
(1.塔里木大學(xué)信息工程學(xué)院,新疆阿拉爾 843300; 2.塔里木大學(xué)現(xiàn)代農(nóng)業(yè)工程重點(diǎn)實(shí)驗(yàn)室,新疆阿拉爾 843300; 3.新疆南疆農(nóng)業(yè)信息化研究中心,新疆阿拉爾 843300)
駿棗是新疆大棗領(lǐng)域中一個(gè)極為重要的農(nóng)產(chǎn)品,為新疆帶來(lái)了巨大的經(jīng)濟(jì)效益[1]。新疆南疆地區(qū)的風(fēng)沙較大,對(duì)農(nóng)業(yè)種植具有巨大的影響,駿棗生長(zhǎng)過(guò)程中也會(huì)受到風(fēng)沙的影響,導(dǎo)致駿棗果實(shí)受到損傷[2]。
黑鐵頭病與潰瘍病是駿棗主要的2種病害[3],這2種病害會(huì)導(dǎo)致駿棗果皮上產(chǎn)生直徑2 mm左右的病斑,這種病害的病斑極小,通過(guò)人工檢測(cè)或者圖像識(shí)別技術(shù)難以保證較高的檢測(cè)準(zhǔn)確率。桃小食心蟲(chóng)是駿棗的一種蟲(chóng)害[4],會(huì)導(dǎo)致駿棗表面產(chǎn)生1個(gè)直徑1~2 mm的重口,顏色為暗色,病蟲(chóng)害具有極強(qiáng)的傳播性,所以必須盡早準(zhǔn)確地檢測(cè)出蟲(chóng)害,避免造成重大的蟲(chóng)害災(zāi)情與經(jīng)濟(jì)損失,蟲(chóng)害的蟲(chóng)口極小,通過(guò)人工檢測(cè)或者圖像識(shí)別技術(shù)難以保證較高的檢測(cè)準(zhǔn)確率。
隨著計(jì)算機(jī)技術(shù)的廣泛應(yīng)用,許多研究人員將計(jì)算機(jī)技術(shù)引入農(nóng)業(yè)工程技術(shù)中[5],其中在病蟲(chóng)害檢測(cè)方面應(yīng)用較為廣泛且有效的技術(shù)為圖像處理與機(jī)器視覺(jué)方案[6]。例如,結(jié)合原彩色圖像與補(bǔ)償模糊神經(jīng)網(wǎng)絡(luò)的臍橙病蟲(chóng)害識(shí)別技術(shù)[7],基于圖像規(guī)則推理的玉米病蟲(chóng)草害診斷系統(tǒng)[8],基于圖像分析的玉米病蟲(chóng)害智能化識(shí)別方法[9]?;趫D像處理的技術(shù)可以減少參與的人工,提高病蟲(chóng)害檢測(cè)的效率,但是對(duì)于病蟲(chóng)害癥狀不明顯的情況檢測(cè)準(zhǔn)確率較差。駿棗的病蟲(chóng)害癥狀一般僅有2 mm左右的病癥,南疆風(fēng)沙對(duì)駿棗的損壞一般也是顆粒形的損傷,所以,使用圖像技術(shù)來(lái)檢測(cè)駿棗的病蟲(chóng)害與風(fēng)沙損傷難以獲得理想的效果。
此外,許多研究人員采用光譜技術(shù)檢測(cè)果實(shí)的病蟲(chóng)害。例如,基于高光譜成像的蘋(píng)果蟲(chóng)害檢測(cè)[10],基于太赫茲光譜技術(shù)的山核桃內(nèi)部蟲(chóng)害檢測(cè)[11]。受益于諸多研究人員的成果,光譜技術(shù)是果實(shí)無(wú)損病蟲(chóng)害檢測(cè)問(wèn)題的理想解決方案。病蟲(chóng)害對(duì)駿棗種植的影響巨大,應(yīng)當(dāng)盡早地識(shí)別并摘除。本研究將近紅外光譜應(yīng)用于南疆地區(qū)駿棗的病蟲(chóng)害與風(fēng)沙損傷檢測(cè)。首先,采集大量駿棗的近紅外光譜,采用遺傳算法從全部近紅外光譜中選擇一部分最優(yōu)的光譜特征;然后,使用二次判別分析模型對(duì)選擇的光譜特征進(jìn)行訓(xùn)練;最終,通過(guò)支持向量機(jī)對(duì)駿棗進(jìn)行病蟲(chóng)害分析。
試驗(yàn)地點(diǎn)為南疆第一師阿拉爾市十四團(tuán)-數(shù)字棗園示范基地。駿棗生長(zhǎng)過(guò)程中并未進(jìn)行防蟲(chóng)害處理,并且受到南疆地區(qū)的風(fēng)沙影響,有些駿棗易被風(fēng)沙損傷。從駿棗樹(shù)上采摘2 kg駿棗,人工挑選出病蟲(chóng)害與風(fēng)沙損壞的駿棗。
采摘的駿棗全部放置于實(shí)驗(yàn)室的熱箱中,將駿棗保持在(25±0.5)℃,從而使得駿棗的溫度與濕度平衡,為近紅外光譜數(shù)據(jù)的采集做準(zhǔn)備。
使用Luminar 5030型便攜式近紅外光譜儀采集駿棗的光譜,光譜儀裝備了反射后分光的光配置、1個(gè)預(yù)校準(zhǔn)的雙光束燈與1個(gè)近紅外探測(cè)器(indium gallium arsenide,InGaAs)陣列,光譜采集的持續(xù)時(shí)間為60 ms。對(duì)每個(gè)駿棗樣本采集3次近紅外光譜數(shù)據(jù),將平均值作為最終的試驗(yàn)數(shù)據(jù),進(jìn)行進(jìn)一步分析。通過(guò)文獻(xiàn)[12]所述的方法采用近紅外光譜儀自動(dòng)測(cè)量參考光譜,使用SNAP!2.03光譜采集處理軟件采集漫反射光譜。在采集近紅外光譜之前,人工選出受損駿棗與完好的駿棗,最終將每個(gè)駿棗的光譜分類為有損光譜類與無(wú)損光譜類。
將每個(gè)駿棗的光譜數(shù)據(jù)建模為數(shù)據(jù)向量,近紅外光譜反射率作為數(shù)據(jù)向量的每個(gè)元素,即駿棗的特征值。隨機(jī)選擇50%樣本組成定標(biāo)集,剩下的50%樣本分別組成預(yù)測(cè)集。從定標(biāo)集的全部光譜提取光譜特征,作為分類處理階段的特征集合。圖1所示為本研究基于近紅外光譜分析的無(wú)損病蟲(chóng)害與風(fēng)沙損傷檢測(cè)技術(shù)的主要流程。
因?yàn)楣庾V數(shù)據(jù)之間存在高相關(guān)性,所以使用遺傳算法來(lái)選擇分類算法的輸入特征集,遺傳算法的優(yōu)化目標(biāo)是選擇描述預(yù)測(cè)器變量與響應(yīng)變量關(guān)聯(lián)性的最優(yōu)波段集合,即選出具有生物學(xué)意義的光譜波段。本研究使用遺傳算法獲得n個(gè)特征子集,根據(jù)文獻(xiàn)[13]n的范圍應(yīng)為2~6,此時(shí)的特征子集是全部數(shù)據(jù)集的最優(yōu)表征,為了最小化過(guò)度擬合問(wèn)題,最終選擇6個(gè)特征。
本研究考慮了3個(gè)分類器,即線性判別分析(LDA)、二次判別分析(QDA)、k-近鄰算法。線性判別分析與二次判別分析分類器均基于貝葉斯規(guī)則,而k-近鄰算法使用歐氏距離作為相似性度量。將所有情況的臨界值設(shè)為標(biāo)準(zhǔn)值0.5,因此,將預(yù)測(cè)結(jié)果的概率高于0.5的輸出分類為一類,其他的輸出分為另一類。線性判別分析的線性判別函數(shù)數(shù)量應(yīng)當(dāng)?shù)扔陬悇e的數(shù)量減1,因此對(duì)于2個(gè)類別的情況,應(yīng)當(dāng)生成1個(gè)線性判別函數(shù)。二次判別分析與線性判別分析的使用場(chǎng)景較為接近,一般用于類內(nèi)協(xié)方差矩陣不理想的情況,對(duì)于大數(shù)據(jù)集,各類的協(xié)方差矩陣差異較大,二次判別分析的性能優(yōu)于線性判別分析。線性判別分析與二次判別分析2個(gè)算法的時(shí)間復(fù)雜度與分類數(shù)量成比例關(guān)系,但是k-近鄰算法的時(shí)間復(fù)雜度對(duì)類別數(shù)量則不敏感。kNN分類器通過(guò)計(jì)算訓(xùn)練集中每個(gè)樣本的距離,如果1個(gè)樣本在特征空間中的k個(gè)最近鄰樣本中的大多數(shù)屬于某一個(gè)類別,則該樣本也屬于這個(gè)類別,并具有這個(gè)類別上樣本的特性。通過(guò)交叉檢驗(yàn)方法選出最優(yōu)的k個(gè)近鄰,選出的最小k個(gè)近鄰具有最小的平均誤差。本研究最終選擇二次判別分析分類器對(duì)遺傳算法選出的最優(yōu)特征進(jìn)行分類處理。
每個(gè)判別模型的分類結(jié)果定義為誤報(bào)率、漏報(bào)率與總誤差,使用接受者操作特征分析(receiver operating characteristics,簡(jiǎn)稱ROC))對(duì)每個(gè)模型進(jìn)行分析,繪制每個(gè)模型的ROC曲線。ROC曲線包含誤報(bào)率與漏報(bào)率:
誤報(bào)率=FP/(FP+TN);
(1)
漏報(bào)率=FN/(TP+FN);
(2)
總誤差率=(FP+FN)/(TP+FN);
(3)
敏感性=TP/(TP+FN)。
(4)
式中:FP表示被模型預(yù)測(cè)為正的負(fù)樣本;TN表示被模型預(yù)測(cè)為負(fù)的負(fù)樣本;FN表示被模型預(yù)測(cè)為負(fù)的正樣本;TP表示被模型預(yù)測(cè)為正的正樣本。
圖2-a所示是有損駿棗與完好駿棗的平均二階導(dǎo)數(shù)反射光譜,圖2-b、2-c、2-d是95%置信度定標(biāo)集中2個(gè)類別的光譜變化曲線。光譜的變化情況說(shuō)明,駿棗質(zhì)量主要與 1 300~1 420 nm、1 650~2 300 nm波段區(qū)域的光譜特征有關(guān),這2個(gè)光譜范圍內(nèi)的光譜反射率一般與蛋白質(zhì)、脂肪、水分相關(guān),這些成分是駿棗的主要成分。
使用遺傳算法主要在1 320、1 460、1 650、1 920 nm與 2 000~2 220 nm附近選擇特征,1 150~1 750 nm范圍的特征代表O—H鍵對(duì)與—CH(CH3—、—CH2—等)鍵對(duì)的近紅外光譜泛頻。上述頻帶反射率的變化一般與酚(~1 320 nm)、過(guò)氧化氫化物(~1 460 nm)有關(guān),而酚與過(guò)氧化氫化物2個(gè)化學(xué)成分與駿棗的破損、蟲(chóng)害有關(guān),一般認(rèn)為駿棗具有愈傷作用,收到撞擊以及害蟲(chóng)破壞等會(huì)使總氧化值提高,導(dǎo)致駿棗的酚含量下降。
水分、酚、蛋白質(zhì)、氨基酸之間近紅外光譜反射率的差異則與水分流失、氧化反應(yīng)、微生物腐蝕等有關(guān)。風(fēng)沙與病蟲(chóng)害對(duì)駿棗的內(nèi)部組織產(chǎn)生損壞,影響了駿棗的水分、密度與硬度。而這些影響可以通過(guò)近紅外光譜觀察出來(lái)。
選擇2組特征(近紅外光譜的波長(zhǎng))進(jìn)行2組獨(dú)立的試驗(yàn),結(jié)果見(jiàn)表1。試驗(yàn)1的誤報(bào)率、漏報(bào)率、總誤差分別為 1.72%、5.97%、4.00%,試驗(yàn)2的誤報(bào)率、漏報(bào)率、總誤差分別為5.17%、2.99%、4.00%。
圖3所示是二次判別分析模型的試驗(yàn)1分類結(jié)果,其中僅有1個(gè)有損駿棗與4個(gè)完好駿棗的分類發(fā)生了錯(cuò)誤,總的分類準(zhǔn)確率為96%。
圖4所示是二次判別分析模型的試驗(yàn)2分類結(jié)果,其中僅有3個(gè)有損駿棗與2個(gè)完好駿棗的分類發(fā)生了錯(cuò)誤,總的分類準(zhǔn)確率為96%。
光譜數(shù)據(jù)中一般包含一些干擾因素、室內(nèi)噪聲以及化學(xué)物質(zhì)的影響,從原數(shù)據(jù)集提取出最優(yōu)的特征光譜可以降低分類模型的冗余信息,并提高分類的準(zhǔn)確率。
本研究探討了近紅外光譜 (1 100~2 300 nm) 檢測(cè)病蟲(chóng)害與風(fēng)沙導(dǎo)致的損壞南疆駿棗,通過(guò)2組近紅外光譜特征子集的試驗(yàn)結(jié)果可看出,本模型的檢測(cè)總誤差小于5%,具有較好的檢測(cè)準(zhǔn)確率。
表1 二次判別分析模型對(duì)預(yù)定義光譜5個(gè)、 6個(gè)特征子集的判別性能
病蟲(chóng)害與風(fēng)沙受損駿棗檢測(cè)的最優(yōu)近紅外光譜特征包含1 320、1 400~1 550、1 650、2 000~2 220 nm,這些光譜波段一般與酚、過(guò)氧化氫、烷基等關(guān)聯(lián),實(shí)時(shí)的駿棗檢測(cè)系統(tǒng)應(yīng)當(dāng)從這些光譜波段選擇特征。
本技術(shù)是一種自動(dòng)化、高準(zhǔn)確率、無(wú)損的駿棗病蟲(chóng)害損傷檢測(cè)系統(tǒng)。未來(lái)將引入大數(shù)據(jù)集處理技術(shù),增加近紅外光譜光波特征的數(shù)量,從而提高檢測(cè)的準(zhǔn)確率與處理速度。
[1]宋鋒惠,哈地爾·依沙克,史彥江,等. 新疆塔里木盆地駿棗果實(shí)營(yíng)養(yǎng)與土壤養(yǎng)分相關(guān)性分析[J]. 果樹(shù)學(xué)報(bào),2010,27(4):626-630.
[2]鄭素慧,葛清華,車?guó)P斌,等. 氣調(diào)貯藏不同溫度對(duì)新疆駿棗干棗貯期品質(zhì)及生理活性的影響[J]. 新疆農(nóng)業(yè)科學(xué),2014,51(4):620-626.
[3]韓夫云,崔大鵬,黃喜宇. 朝陽(yáng)地區(qū)大棗主要病蟲(chóng)害的發(fā)生特點(diǎn)及防治技術(shù)[J]. 現(xiàn)代農(nóng)業(yè)科技,2015(8):144.
[4]王燕平,王文平. 關(guān)于棗樹(shù)病蟲(chóng)害防治技術(shù)的幾點(diǎn)思考[J]. 黑龍江科技信息,2016(34):254.
[5]汪京京,張 武,劉連忠,等. 農(nóng)作物病蟲(chóng)害圖像識(shí)別技術(shù)的研究綜述[J]. 計(jì)算機(jī)工程與科學(xué),2014,36(7):1363-1370.
[6]姚 青,張 超,王 正,等. 分布式移動(dòng)農(nóng)業(yè)病蟲(chóng)害圖像采集與診斷系統(tǒng)設(shè)計(jì)與試驗(yàn)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2017,33(增刊1):184-191.
[7]溫芝元,曹樂(lè)平. 基于補(bǔ)償模糊神經(jīng)網(wǎng)絡(luò)的臍橙不同病蟲(chóng)害圖像識(shí)別[J]. 農(nóng)業(yè)工程學(xué)報(bào),2012,28(11):152-157.
[8]劉同海,黃斌博,李少昆,等. 基于圖像規(guī)則推理的玉米病蟲(chóng)草害診斷系統(tǒng)的設(shè)計(jì)[J]. 中國(guó)農(nóng)業(yè)大學(xué)學(xué)報(bào),2012,17(4):154-158.
[9]楊 青. 一種基于圖像分析的玉米病蟲(chóng)害智能化識(shí)別方法[J]. 江蘇農(nóng)業(yè)科學(xué),2014,42(7):128-130.
[10]田有文,程 怡,王小奇,等. 基于高光譜成像的蘋(píng)果蟲(chóng)害檢測(cè)特征向量的選取[J]. 農(nóng)業(yè)工程學(xué)報(bào),2014,30(12):132-139.
[11]李 斌,張偉立,趙春江,等. 基于太赫茲光譜技術(shù)的山核桃內(nèi)部蟲(chóng)害檢測(cè)初步研究[J]. 光譜學(xué)與光譜分析,2014,34(5):1196-1200.
[12]Cayuela J A,Weiland C. Intact orange quality prediction with two portable NIR spectrometers[J]. Postharvest Biology & Technology,2010,58(2):113-120.
[13]Brusco M J,Singh R,Steinley D. Variable neighborhood search heuristics for selecting a subset of variables in principal component analysis[J]. Psyhemetrika,2009,74(4):705-726.