張飛云
摘要:針對不同小麥病害有不同的形狀特征,利用多重分形分析提取小麥病害圖像的8個(gè)多重分形譜值作為小麥病害的形狀特征參數(shù),并利用這8個(gè)特征參數(shù)來索引圖像數(shù)據(jù)庫作為學(xué)習(xí)向量量化(LVQ)神經(jīng)網(wǎng)絡(luò)的輸入,進(jìn)行樣本訓(xùn)練、分類識別。試驗(yàn)結(jié)果表明,該算法對小麥病害的識別率可達(dá)90.0%以上。
關(guān)鍵詞:小麥病害; 多重分形譜; 智能識別; LVQ神經(jīng)網(wǎng)絡(luò)
中圖分類號:TP391.41;S435.12 文獻(xiàn)標(biāo)識碼:A 文章編號:0439-8114(2013)07-1669-03
小麥?zhǔn)俏覈鴥H次于水稻的第二大糧食作物,在滿足人們的生活需求和保證糧食安全方面具有非常重要的作用。而小麥病害每年都有大面積發(fā)生,嚴(yán)重影響了小麥的產(chǎn)量和質(zhì)量。傳統(tǒng)小麥病害主要依靠農(nóng)業(yè)生產(chǎn)者或科研人員的視覺判斷識別病害的種類、嚴(yán)重程度及受害區(qū)域,這種識別方法主觀性強(qiáng),診斷結(jié)果容易出現(xiàn)偏差。因此,研究小麥病害的智能識別具有重要的社會和經(jīng)濟(jì)意義。
目前,國內(nèi)外很多學(xué)者對農(nóng)作物病害圖像的識別方法進(jìn)行了研究,Pydipati等[1,2]使用顏色共生矩陣獲取紋理特征,并分別用神經(jīng)網(wǎng)絡(luò)分類器和廣義二乘矩判別式分類器進(jìn)行柑橘病害的判別分析,達(dá)到了很好的識別效果; 田有文等[3-5]將支持向量機(jī)方法應(yīng)用于黃瓜、葡萄、玉米、番茄等病害的識別中;陳兵旗等[6]提取小麥的顏色特征進(jìn)行小麥病害識別,提高了病害識別的準(zhǔn)確率。現(xiàn)有的研究當(dāng)中大多數(shù)是基于紋理特征和顏色特征在可見光范圍內(nèi)進(jìn)行病害識別研究,這些方法算法比較復(fù)雜,運(yùn)行時(shí)間較長,并且達(dá)不到理想的識別效果。試驗(yàn)引入多重分形理論,提取小麥病害圖像的8個(gè)多重分形譜值作為小麥病害的形狀特征,然后采用學(xué)習(xí)向量量化(Learning Vector Quantization,LVQ)神經(jīng)網(wǎng)絡(luò)對小麥病害進(jìn)行識別,算法簡單,速度快,并且可以達(dá)到很高的識別率。
1 小麥病害圖像的獲取
試驗(yàn)圖像主要來自數(shù)碼相機(jī)拍攝的靜態(tài)圖片、小麥病蟲害及防治原色圖冊[7]上的圖片以及網(wǎng)絡(luò)圖片庫等。共收集小麥不同病害部位、不同生長階段的200多張病害圖片,每種病害樣本70個(gè)。主要研究的小麥病害是條銹病、葉銹病和白粉病。
所采集到的小麥葉部病害圖片都是彩色圖像,其計(jì)算量大,影響圖像處理的速度,為了提高圖像處理的速度,需要將彩色圖像轉(zhuǎn)換為灰度圖像。根據(jù)人眼對R、G、B三色的敏感程度,可以使用加權(quán)平均值法將彩色圖像灰度化,轉(zhuǎn)換公式為:
Gray=0.30×R+0.59×G+0.11×B (1)
然后,將灰度圖像轉(zhuǎn)換為二值圖像,便于計(jì)算機(jī)做進(jìn)一步的處理。小麥條銹病病害原圖及轉(zhuǎn)換后的灰度圖像如圖1。
2 基于多重分形理論的小麥病害圖像局部邊緣分割和多重分形特征譜的提取
2.1 多重分形
分形理論作為非線性科學(xué)的一個(gè)分支,它研究的對象是由非線性系統(tǒng)產(chǎn)生的不可微和不光滑的復(fù)雜幾何形體。僅用一個(gè)分形維數(shù)不能完整刻畫自然界中復(fù)雜的幾何形體,必須同時(shí)使用多個(gè)維數(shù)才能刻畫其全面的特征。多重分形就是用多個(gè)維數(shù)從全局和局部兩個(gè)方面來描述自然界中復(fù)雜幾何形體的整體特征。而分形維數(shù)不僅可以度量圖像表面的復(fù)雜程度和不規(guī)則程度,它還具有小波變換的多尺度、多分辨率的變換不變性。由于對多重分形理論研究的角度不同,處理不同問題時(shí)的描述不同,導(dǎo)致多重分形理論在數(shù)學(xué)上沒有嚴(yán)格的定義。
根據(jù)圖像特征及圖像處理的需要來調(diào)整多重分形參數(shù)是多重分形分析的重點(diǎn),可以用基于測度理論的α~f(α)語言來描述多重分形,其中α稱為Holder指數(shù),因?yàn)楦怕拭芏鹊钠娈愋杂伤刂?,分形體小區(qū)域的局部分形維數(shù)也是由它反映出來的,所以通稱α為奇異性指數(shù)。f(α)稱為多重分形的奇異譜,一般稱為多重分形譜,它反映復(fù)雜分形體圖像的全局信息。不同信息的奇異性不同,則(α~ f(α))的分布規(guī)律不同[8]。
2.2 基于多重分形理論的圖像局部邊緣分割
圖像分割的目的是把小麥葉部病害圖像與背景分開,便于提取小麥葉部病害的輪廓特征?;诙嘀胤中卫碚搱D像分割的實(shí)現(xiàn)步驟如下。
1)計(jì)算圖像的奇異性指數(shù)α。奇異性指數(shù)α代表圖像的局部信息,定義V(i)為i×i的一個(gè)方形區(qū)域,定義I(x,y)為V(i)的中心點(diǎn),則該點(diǎn)的奇異性指數(shù)α(x,y)=■(其中i=2n+1,n取0和正整數(shù))。i的取值反映圖像的奇異性范圍;經(jīng)過試驗(yàn)證實(shí),i的取值越小越能反映圖像的局部奇異性,i的取值越大則更能反映圖像廣泛的奇異性。選取i≤2,并且經(jīng)過試驗(yàn)選用效果比較好的Min測度修改方法計(jì)算奇異性指數(shù)α。
2)計(jì)算圖像的多重分形譜f(α)。f(α)代表圖像的全局信息,根據(jù)上一步計(jì)算出的奇異性指數(shù)計(jì)算α的最大值和最小值,即αmax=max(α(i,j))和αmin=min(α(i,j))。然后將[αmin,αmax]劃分為N個(gè)區(qū)域,得到每個(gè)區(qū)域的中心點(diǎn)奇異值,用該值代替區(qū)域中其他點(diǎn)的值,然后采用豪斯道夫維數(shù)求出f(α)。
3)根據(jù)前兩步得到的結(jié)果,選取合適的最大值和最小值以及相應(yīng)的capacity,利用多重分形理論進(jìn)行小麥病害圖像局部邊緣分割。分割后的圖像如圖2。
2.3 小麥病害圖像多重分形特征譜的提取
根據(jù)多重分形譜的算法,通過Matlab編程完成多重分形譜的計(jì)算[9],繪出關(guān)于α~f(α)的多重分形譜曲線,并且計(jì)算曲線上多重分形譜的一些重要特征值,即奇異性指數(shù)α的最大值αmax和最小值αmin以及相對應(yīng)的f(αmax)和f(αmin);譜寬Δα=αmax-αmin;譜差Δf=f(αmax)-f(αmin);αd:使f(α)取極大值時(shí)的α值;m:擬合曲線的一次冪系數(shù),在αd處用最小二乘法進(jìn)行曲線擬合,擬合的二次函數(shù)為f′(α)=l(α-αd)2+m(α-αd)+n。參數(shù)B表示譜線f(α)的不對稱性。
圖3為部分小麥葉部病害圖像對應(yīng)的多重分形譜曲線。表1給出了數(shù)據(jù)庫中6幅小麥葉部病害圖像樣本的8個(gè)多重分形譜特征值。
通過以上試驗(yàn)可知,小麥不同病害圖像的形狀特征值具有很大差異性,同類小麥病害圖像的形狀特征值具有一定的規(guī)律性。
3 學(xué)習(xí)向量量化神經(jīng)網(wǎng)絡(luò)
3.1 學(xué)習(xí)向量量化神經(jīng)網(wǎng)絡(luò)原理及算法
小麥葉部病害識別問題是一個(gè)模式分類的問題,在模式分類中首選的神經(jīng)網(wǎng)絡(luò)是自組織神經(jīng)網(wǎng)絡(luò)、競爭型神經(jīng)網(wǎng)絡(luò)和學(xué)習(xí)向量量化(LVQ)神經(jīng)網(wǎng)絡(luò),這些類型的神經(jīng)網(wǎng)絡(luò)通過檢測輸入樣本的規(guī)律性,然后根據(jù)輸入樣本信息自適應(yīng)地調(diào)整網(wǎng)絡(luò),使網(wǎng)絡(luò)的響應(yīng)越來越適應(yīng)輸入樣本。然而自組織和競爭型神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本數(shù)據(jù)的方式采用的是無監(jiān)督學(xué)習(xí)方式,輸入向量之間的距離決定了分類原則的類型,因此對于兩個(gè)非常接近的輸入向量不能嚴(yán)格地區(qū)分它們的類別。LVQ神經(jīng)網(wǎng)絡(luò)采用監(jiān)督狀態(tài)下的競爭學(xué)習(xí)方法,在學(xué)習(xí)的過程中通過期望的輸出值規(guī)定輸入樣本的分配類別,從而克服了無監(jiān)督學(xué)習(xí)算法的弱點(diǎn)[10]。因此在對小麥的葉部病害進(jìn)行識別時(shí)采用LVQ神經(jīng)網(wǎng)絡(luò)。
LVQ神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)由3層組成,第1層為輸入層,第2層為競爭層,第3層為輸出層,網(wǎng)絡(luò)結(jié)構(gòu)圖如圖4。
LVQ神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法如下:
1)初始化權(quán)值向量(聚類中心),W={w1,w2,…,wn},可隨機(jī)給權(quán)值向量賦初值,初始化學(xué)習(xí)速率β(0),確定訓(xùn)練次數(shù)tn。
2)輸入第p個(gè)訓(xùn)練模式的樣本向量xp。
3)通過公式(2)尋找聚類中心k,即獲勝節(jié)點(diǎn)神經(jīng)元。
||wk-xp||<||wj-xp|| j=1,2,…,n (2)
4)根據(jù)分類正確與否,修正獲勝神經(jīng)元的權(quán)值。
5)調(diào)整學(xué)習(xí)速率β,β作為迭代函數(shù)逐漸減小。
6)檢查訓(xùn)練終止條件,如果t 3.2 分類試驗(yàn) 隨機(jī)為每種病害選擇30個(gè)樣本作為訓(xùn)練樣本,每個(gè)樣本由8個(gè)特征值組成,所以網(wǎng)絡(luò)有8個(gè)輸入神經(jīng)元,設(shè)有16個(gè)競爭層神經(jīng)元,根據(jù)需要識別的小麥病害種類,需要3個(gè)輸出層神經(jīng)元,輸出層神經(jīng)元可表示為:條銹病[1 0 0],葉銹病[0 1 0],白粉病[0 0 1]。根據(jù)要求對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,確定權(quán)值。另外每種病害選擇40個(gè)樣本,提取特征值送入LVQ神經(jīng)網(wǎng)絡(luò)進(jìn)行測試,試驗(yàn)結(jié)果如表2。將提取的多重分形譜值送入量子神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行識別,識別率低于LVQ神經(jīng)網(wǎng)絡(luò)分類器。 4 小結(jié) 利用多重分形分析提取小麥病害的8個(gè)多重分形譜值,將提取的小麥病害圖像的形狀特征值送入LVQ神經(jīng)網(wǎng)絡(luò)進(jìn)行識別,識別率可達(dá)90.0%以上,證明LVQ神經(jīng)網(wǎng)絡(luò)能根據(jù)小麥病害的的形狀特征有效識別小麥條銹病、葉銹病和白粉病。 參考文獻(xiàn): [1] PYDIPATI R, BURKS T F, LEE W S. Statistical and neural network classifiers for citrus disease detection using machine vision[J]. Transactions of the ASAE,2005,48(5):2007-2014. [2] PYDIPATI R, BURKS T F, LEE W S. Identification of citrus disease using color texture features and discriminant analysis[J]. Computers and Electronics in Agriculture,2006,52(1-2):49-59. [3] 田有文,張長水,李成華. 支持向量機(jī)在植物病斑形狀識別中的應(yīng)用研究[J]. 農(nóng)業(yè)工程學(xué)報(bào),2004,20(3):134-136. [4] 田有文,李天來,李成華,等. 基于支持向量機(jī)的葡萄病害圖像識別方法[J]. 農(nóng)業(yè)工程學(xué)報(bào),2007,23(6):175-180. [5] 田有文,牛 妍. 支持向量機(jī)在黃瓜病害識別中的應(yīng)用研究[J]. 農(nóng)機(jī)化研究,2009(3):36-39. [6] 陳兵旗,郭學(xué)梅,李曉華.基于圖像處理的小麥病害診斷算法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2009,40(12):190-195. [7] 商鴻生,王風(fēng)葵,李修煉,等.小麥病蟲害及防治原色圖冊[M]. 北京:金盾出版社,2007. [8] 蒲小勤. 基于多重分形的圖像識別研究[D].西安:西北大學(xué),2009. [9] 傅薈璇. MATLAB神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計(jì)[M].北京:機(jī)械工業(yè)出版社,2010. [10] 杜攀峰,廖立堅(jiān),楊新安.鐵路路基病害的智能識別[J].鐵道學(xué)報(bào),2010,32(3):142-146.