楊昕薇,譚峰
(黑龍江八一農墾大學信息技術學院,大慶163319)
隨著計算機的出現(xiàn),人們的生活變得更依賴它的發(fā)展,隨著計算機的發(fā)展,它的智能化為人們的日常生活帶來了很多方便,人工智能成了計算機的主要發(fā)展方向。它是誕生于20世紀的模式識別技術[1],在60年代初期得到了重視并迅速發(fā)展的一門學科。它是多個學科領域中都應用到的重要技術,這樣進一步擴大了人工智能的發(fā)展,同時推動了計算機的發(fā)展和應用領域,圖像識別技術在模式識別中占重要地位,是圖像處理與模式技術的綜合產物,各自取長補短,擴大應用領域。目前,用于醫(yī)學、工業(yè)和生物認證的多個領域,已成功實現(xiàn)了其價值,隨著中國農業(yè)邁向精準化的發(fā)展趨勢,人工智能在農業(yè)生產上得到了充分的應用,利用圖像識別技術對作物病蟲草害的應用研究日益增多,將作物的反觀特征,如:顏色、皺紋和形態(tài)與病斑對比進行區(qū)分,用于病害的研究方法很多,可以利用統(tǒng)計的線性分類器,人工神經網絡、貝葉斯理論[2]、模糊識別技術和支持向量機等模式識別技術,對病蟲害進行分類識別,減輕了人工勞作,更有效的利用了時間且錯誤率低,推進了向精準農業(yè)邁進的步伐。
由于是針對寒地水稻的戶外檢測系統(tǒng),所以,在圖像采集時使用的是滿足戶外需求的田間作業(yè)設備。設備不僅保證便攜性還保證要采集圖像的清晰度。在采集圖像時用兩種方式進行,最終確定使用工業(yè)攝像頭所采集的圖片,因為要保持采集圖像的真實性,所以選擇在早上(在早晨的病害癥狀最為明顯)自然光的條件下,不采取任何人工照明措施下,進行采集工作,同時在不同的天氣情況如陰天和多云的光照區(qū)別明顯的條件下進行寒地水稻病害圖像的采集。研究中所采集的圖像來自中國建三江墾區(qū)勝利農場的種植園區(qū)試驗田進行試驗。在試驗田共采集4種水稻病害,其中一種是使用農藥對水稻葉片造成損傷所形成的斑點圖像,共954幅圖像,采用于JPG格式存放,最終選擇病斑明顯且代表性強的108幅圖像作為研究樣本。研究中的識別部分是整個處理系統(tǒng)的核心,前期采集是為了識別做準備,其分類器的選擇和構造對整個識別過程起重要作用[3]。
圖1 識別處理技術路線Fig.1 Identify treatment technology route
統(tǒng)計決策理論是模式識別問題中最基礎的理論,對模式的分析各分類器設計都有實際的指導意義。在使用貝葉斯分類器時要滿足兩個最基本的條件:①要求各種分類占總體概率的具體分布情況;②決策分類的分類數(shù)量關系是固定的。貝葉斯分類器是按已知對象的先驗概率,再利用其計算出后驗概率,來判斷已知對象是屬于某一類別的概率,再選擇最大的后驗概率作為該已知對象的所屬分類。
貝葉斯分類器有很多種,研究中使用的是貝葉斯決策中的最小錯誤率,它能夠有效地減少錯誤的分類,降低錯誤率。它的基本原理中:將代表模式的特征向量x分到c個類別(w1,w2,…,wc)中某一類的基礎的方法。是計算x的條件下,此分類模式屬于各類的概率,用符號p(w1/x);p(w2/x);…p(wc/x)進行表示。比較各分類的概率,最大數(shù)值對應的類別是wi,那么它就是該模式所屬的分類。例如表示某個待查分類的特征向量x,它屬于正常分類的概率是0.2,屬于不正常分類概率是0.8,就把它歸類為不正常的概率分類。上述定義的條件概率稱為后驗概率。在特征向量為一維的情況時,一般都具有圖2中的變化關系。當x=x*時,p(w1/c)=p(w2/c)對用于x>x*的區(qū)域,由于因此x屬w2類,對用于x<x*的區(qū)域,由于x屬w1類p(w2/x)>p(w1/x),x*就相當于區(qū)域的分界點。圖2中的陰影面積就演示了這種方法錯誤分類概率,對于以任何其他的x值作為區(qū)域分界點的分類方法都對應了一個更大的陰影面積,因此貝葉斯分類器是一種錯誤概率最小的分類器[4]。
圖2 錯誤分類概率示意圖Fig.2 Misclassification probability schematic diagram
后驗概率是要通過貝葉斯公式
進行計算。x是在p(x/wi)為模式屬于wi類的條件下出現(xiàn)的概率密度,稱為x的分類條件的概率密度;p(wi)是在所研究的識別問題中出現(xiàn)的wi類的概率,又稱先驗概率;x特征向量p(x)的概率密度。分類器在比較后驗概率時,對于確定的輸入x,p(x)為常數(shù),在實際應用中,通常不是直接用后驗概率作為分類器的判決函數(shù)gi(x)采用下面兩種形式:對所有的c個類計算gi(x)(i=1,2,…,c)。與gi(x)中最大值相對應的類別就是x的所屬類別。
研究中,定義水稻的三種病害類分別為Ω={ω1,ω2,ω3},識別樣本向量分別為x=[x1,x2,…,xd]T。每次一種病害類別的判別函數(shù)分別定義成gi(x)=p(x/ωi)P(ωi),i=1,2,3;其中p(x/ωi)條件概率密度函數(shù),P(ωi)為先驗概率。如果對任意j≠i都有g(xi)>gj(x),則將x歸類為ωi類,此時滿足貝葉斯差別準則。貝葉斯分類器設計如圖3所示[5]。
圖3 貝葉斯分類器Fig.2 The Bayes Classifier
研究中將216個病斑進行提取特征值并優(yōu)化,優(yōu)化后的病斑分為兩組:一組用于訓練使用;一組用于檢驗。
使用DPS中的逐步判別分析方法,分析訓練樣本,設定臨界值Fa,對4個不用參數(shù)值使用逐步判別分析法,得出結果中發(fā)現(xiàn),對于紋理特征值D3和所有特征集合中被剔除了大量冗余的參數(shù)。
表1 利用逐步判別分析對4個參數(shù)集進行篩選情況Table1 Results of selecting paramaters for four parameter sets by stepwise discriminantanalysis
D3(紋理參數(shù))中所保留下來的是飽和度和色度紋理參數(shù),分別占了42.1%和36.8%,在D4中色度和亮度紋理保留下來了19.2%,而飽和度占43.2%。因此,可以看出飽和度在分類相關性中占了更大的比例,色度第二,而亮度占的比例最少。D1在分析后,只在最后的綜合參數(shù)中被剔除了2個參數(shù),由此可見,形態(tài)參數(shù)比較穩(wěn)定,可顏色參數(shù)在單獨使用時,識別相關性得到了很好的保持,但在綜合參數(shù)時僅剩了1個參數(shù),識別相關性降低的最為明顯。
分類器在制造方法中分很多種,但每一種分類器都必須包含輸入和輸出。因為待需要識別的種類為3種病斑,所以設計的分類器輸出的參數(shù)包括了3個分類值,根據(jù)表1中總結的識別參數(shù)的特點,建立分類器,利用訓練的樣本進行學習試驗,使用檢驗樣本考察分類器的識別效果,結果如表2。
表2 利用Bayes判別法識別樣本的分類結果Table2 The classification results of using Bayes discriminant method to identify the sample
以水稻常見的3種病害為識別目標,使用逐步判別分析法進行判別分析,對所采集參數(shù)進行刪減,精化數(shù)據(jù)的存儲和運行。在使用逐步判別分析法時,發(fā)現(xiàn)了識別準確率與病斑的飽和度紋理參數(shù)的識別相關性較大,顏色參數(shù)則相對較低,在剔除相關性較小的參數(shù)后和平均識別的準確率都得到了提高。之后利用貝葉斯判別法進行分類識別,識別效果最好的是3種參數(shù)的集合,平均的識別準確率達到97.5%,其他3種集合在單獨使用時,都不同程度地反映了識別參數(shù)的相應問題,由于稻瘟病和紋枯病的病斑形態(tài)和顏色上的差異較小,所以在區(qū)分時產生誤差的大,對綜合使用后能準確的識別。
研究可以實現(xiàn)稻瘟病,紋枯病和白葉枯病的計算機自動識別,但對于水稻的整個生長周期來說,還需要增加病害和受害種類進行研究,另外,要研究提取更快更準確的識別分類特征參數(shù),優(yōu)化分類器,達到多種水稻病害高效率高準確率的識別。
[1]譚峰,馬曉丹.基于神經網絡的植物圖像分割算法的研究[J].黑龍江八一農墾大學學報,2009,21(1):63-65.
[2]管澤鑫,唐健,楊保軍,等.基于圖像的水稻病害識別方法研究[J].中國水稻科學,2010,24(5):497-502.
[3]管澤鑫,姚青,楊保軍,等.數(shù)字圖像處理技術在農作物病蟲害識別中的應用[J].中國農業(yè)科學,2009,42(7):2349-2358.
[4]崔艷麗,程鵬飛,董曉志,等.溫室植物病害的圖像處理及特征值提取方法的研究—基于色度的特征值提取研究[J].農業(yè)工程學報,2005,21(增):32-35.
[5]邊肇祺,張學工.模式識別[M].北京:清華大學出版社,2000.