王鑫野 李欣庭 李紅梅 馮潔
摘要:針對馬鈴薯晚疫病,提出了將病害葉片和健康葉片聯(lián)合測試并提取有效特征波長的檢測方法。對健康和病害葉片的光譜圖像進行主成分分析,并從主成分圖像的權(quán)重系數(shù)曲線中提取出6個健康葉片特征波長和病害葉片特征波長?;诮】等~片與病害葉片的6個特征波長做第二次主成分分析,將特征波長優(yōu)化至712、19nm、749.70 nm和841.47 nm,再基于這3個特征波長做主成分分析,選用主成分中對比度最明顯的圖像來識別病害區(qū)域。研究表明,采用健康葉片與病害葉片聯(lián)合使用并結(jié)合二次主成分分析可實現(xiàn)馬鈴薯葉片病害的設別,且識別率可達100%。
關(guān)鍵詞:高光譜成像技術(shù);馬鈴薯晚疫病;健康病害結(jié)合;二次主成分分析;特征波長
中圖分類號:0433.4 文獻標志碼:A
引言
馬鈴薯作為一種糧食作物在世界上占據(jù)重要的地位,尤其在中國,馬鈴薯的種植越來越廣泛,晚疫病作為馬鈴薯種植過程中常見且高發(fā)的病害之一始終威脅著馬鈴薯的生長。目前針對馬鈴薯晚疫病的診斷大都是采用傳統(tǒng)的經(jīng)驗定性診斷方法,但該方法的精確度有待提高且受多種因素影響。有效診斷、預防、治療晚疫病不僅能保證馬鈴薯的產(chǎn)量,而且能確保經(jīng)濟效益和社會效益。
近些年,高光譜成像技術(shù)飛速發(fā)展,該技術(shù)在許多方面得到應用,尤其是在農(nóng)作物的檢測方面。相比其他技術(shù),高光譜成像(hyper-spectralimaging)技術(shù)具有圖譜合一優(yōu)勢,能夠?qū)Υ郎y樣品的內(nèi)外部數(shù)據(jù)信息進行可視化的表達,可以采集大量數(shù)據(jù),并對多個指標進行同時采集。但是高光譜的數(shù)據(jù)量巨大,其中包含了大量與被測樣品無關(guān)的信息,這些信息會對數(shù)據(jù)的處理產(chǎn)生干擾,削弱模型的預測能力,甚至會造成大量誤判。為了避免這種誤差的產(chǎn)生,需剔除不相干的數(shù)據(jù),簡化模型,使模型具有穩(wěn)定準確的預測能力,因此特征波長的提取就顯得尤為重要??蒲腥藛T在農(nóng)產(chǎn)品的特征波長選取方面已做了許多研究:馮潔等采用波段指數(shù)對水稻的特征波長進行提取,提取的10個波長能有效地反映出水稻的特征光譜信息;孫靜濤等對哈密瓜的可溶性固形物和硬度的波長進行篩選,根據(jù)特征波長對成熟度進行識別,設別的準確率達94%;王海龍等使用相關(guān)系數(shù)法和競爭性自適應重加權(quán)算法對番茄葉片真菌的特征波長進行提取,分別得到4個和5個特征波長,并對葉片的真菌進行了預測;董明等用ABS算法提取了小白菜的8個特征波長,這些波段可作為小白菜的有效特征波段,反映其光譜信息;尤笛等利用一階微分曲線選取了9個特征波長,并對4種不同蘋果的損傷區(qū)域進行了識別;古文君等采用連續(xù)投影法選取了藍莓的6個特征波段,并對藍莓的內(nèi)部品質(zhì)進行了檢測。以上研究均以傷病樣本為特征提取對象。在實際分類中,分類對象多為病害與健康樣本的合集,但把健康與病害樣本合用來提取馬鈴薯晚疫病特征波段的報道較少。主成分分析在數(shù)據(jù)降維方面具有顯著的效果,尤其是在特征波長選取方面。所以本文提出將健康樣本與典型病害樣本合用作為研究對象,結(jié)合主成分分析對采集的高光譜數(shù)據(jù)進行特征波長的選取。
1材料與方法
1.1實驗材料
實驗材料選用云南師范大學生命與科學學院馬鈴薯種植基地種植的馬鈴薯葉片,生長時間為80 d,其中健康葉片18片、病害葉片(感染晚疫病的葉片)18片(發(fā)病時間為7 d),共36片。用高光譜成像系統(tǒng)快速采集這36片馬鈴薯葉片的高光譜圖像。
1.2高光譜成像系統(tǒng)與數(shù)據(jù)采集
高光譜成像系統(tǒng)如圖1所示。光譜儀為北京卓立漢光公司出產(chǎn)的GaiasSorter-Image-V10E,可以采集520個波段,波長范圍為400nm至1 000nm。系統(tǒng)兩側(cè)的線光源為4個50 w的鹵素燈,在步進電機驅(qū)動的載物臺上放置待測樣本,采集樣本圖像的CCD相機為Lumenera Infi-nity,垂直放置在平臺上方。為避免在樣本采集過程中受到其他光源干擾,將整個系統(tǒng)封裝在密閉的暗箱內(nèi)。
為避免采集的圖像出現(xiàn)失真,根據(jù)光源的照度調(diào)整好系統(tǒng)的參數(shù)。通過反復測試優(yōu)化,最終CCD相機的曝光時間確定為9.732 ms,步進電機的速度為0.6 mm·s-1,相機到載物臺的垂直高度為23 cm。為了減少采集工作的重復性,對多個病害樣本同時進行采集,在載物臺上放置2排樣本,每排有3個,總共6個。采集健康樣本時,載物臺上每次只放1個作為參照。CCD相機對載物臺上的樣本進行線掃描,載物臺在與CCD相機垂直的被掃平面內(nèi)移動。
1.3高光譜圖像校正
為了減少因光源造成的圖像顏色失真,需對采集的高光譜圖像進行黑白校正。在相同環(huán)境下分別采集白幀圖像數(shù)據(jù)Pw和黑幀圖像數(shù)據(jù)Pd,對采集得到高光譜圖像數(shù)據(jù)進行校正,設PS為初始圖像數(shù)據(jù),則R為校正后的高光譜圖像數(shù)據(jù),可表示為
所有高光譜圖像數(shù)據(jù)的采集采用Specview軟件,數(shù)據(jù)處理采用ENVI 5.1、MATLAB R2010a軟件。
2結(jié)果與分析
2.1光譜反射率曲線
采集36個樣本的光譜反射率曲線,此過程在Specview軟件中實現(xiàn)。如圖3所示。
從圖3中可以看到:健康和病害葉片的光譜反射率的走勢相似,兩者在550 nin附近都存在一個反射峰,在680nm附近存在一個吸收峰,在680~750 nm范圍內(nèi)光譜反射率急劇升高,表明近紅外范圍內(nèi)的光譜反射率明顯比可見光范圍的高;在600~690nm范圍內(nèi)健康葉片光譜反射率比患病葉片的光譜反射率稍低,在720~900 nm范圍內(nèi)健康葉片的光譜反射率卻遠高于病害葉片的光譜反射率。在可見光范圍內(nèi)產(chǎn)生這種差異的原因是:在發(fā)病初期葉片本身存在自我保護機能,致使某種元素活性提升從而使得病害葉片的反射率數(shù)值略高;在近紅外范圍內(nèi),病害逐漸侵染,葉片組織破損,水分喪失,使其光譜反射率數(shù)值比健康葉片低。
2.2特征波長選取
主成分分析(principal component analysis,PCA)是一種去除波段之間多余信息,且將多波段的圖像信息壓縮到比原波段更有效的少數(shù)幾個轉(zhuǎn)換波段的方法。該方法既能避免信息間的互相重疊,還能通過簡化數(shù)據(jù)得到最具代表性且互不相關(guān)的變量子集。
首先對馬鈴薯晚疫病樣本的全波段高光譜數(shù)據(jù)進行降維,并對全波段進行主成分分析,得到分析后的前6個主成分圖像PC-1~PC-6,如圖4所示。
圖4中PC-1、PC-3、PC-5的主成分圖像保留了大部分的圖像信息,而其中第3主成分(PC-3)和第5主成分(PC-5)包含的病害區(qū)域最明顯,PC-1病害與健康部位對比不是很明顯,不利于后期處理,故選擇PC-3和PC-5進行處理。
權(quán)重系數(shù)曲線的波峰處或波谷處被認為是顯著特征波長,對區(qū)別感興趣特征波段貢獻最大。圖5為PC-3、PC-5主成分圖像的權(quán)重系數(shù)曲線,對PC-3、PC-5分別選取2個特征波長,即PC-3為563.32nm、749.70nm,PC-5為719.03nm、841.47 nm。
同樣,對健康馬鈴薯葉片進行主成分分析,得到前3個主成分圖像。如圖6所示,PC-3圖像特點明顯,葉脈清晰,其他主成分圖像噪聲過大,因此選取PC-3進行分析。
健康馬鈴薯葉片PC-3圖像權(quán)重系數(shù)曲線,如圖7所示。通過分析可選取2個特征波段,即712.19nm、958.48nm。
2.3基于特征波長的二次主成分分析
經(jīng)過主成分分析,對病害葉片選取4個特征波長,即563.32nm、719.03nm、749.70nm、841.47nm,對健康葉片選取2個特征波長,即712.19nm、958.48nm。為使檢測結(jié)果更具實效性,將病害葉片的4個特征波段與健康葉片的2個特征波段聯(lián)合使用,用選取出來的6個特征波長對病害葉片進行二次主成分分析,主成分圖像如圖8所示。由主成分圖像可以看出,PC-1、PC-2和PC-6因噪聲較大或?qū)Ρ榷容^低不利于觀察病害區(qū),PC-3、PC-4和PC-5可明顯觀察到病害區(qū)域。
為了得到更少更優(yōu)的波段,我們通過PC-3、PC-4和PC-5的權(quán)重系數(shù)曲線進一步將6個特征波長最終縮減為3個,即712.19 nm、749.70 nm和841.47nm。
對優(yōu)化提取的3個特征波長進行主成分分析,得到的灰度圖像如圖9所示,圖中的PC-3能明顯地區(qū)分病害區(qū)域。
2.4病害葉片二值化
采用ENVI軟件對最終提取的PC-3灰度圖像進行二值化處理,經(jīng)過二值化處理后的圖像的病害部位更加明顯,更利于我們進行區(qū)分,如圖10所示。對其余的病害葉片和健康葉片進行同樣的處理,經(jīng)實驗可以發(fā)現(xiàn),該方法對所有實驗樣本的識別率達100%。
3結(jié)論
二次主成分分析對馬鈴薯晚疫病特征波長的選取具有顯著的實效。健康葉片與病害葉片聯(lián)合使用效果佳,二值化處理更加利于病害的區(qū)分。此方法為馬鈴薯葉片病害分級和缺陷檢測提供了參考,也為其他植物的病害檢測提供了可行性方法。