馬 超,袁 濤,姚鑫鋒,籍延寶,李琳一
(上海市農(nóng)業(yè)科學院農(nóng)業(yè)科技信息研究所,上海201403)
水稻是我國重要的糧食作物之一,對農(nóng)業(yè)經(jīng)濟有著較大影響。病蟲害是威脅水稻產(chǎn)量和品質(zhì)的主要因素[1],及時發(fā)現(xiàn)、準確判斷病蟲害并采取適當?shù)姆乐未胧┦菧p少病蟲為害損失的有效途徑。非植保專業(yè)人員缺乏準確識別病蟲害經(jīng)驗,常因病蟲害誤診導致防治不當造成經(jīng)濟損失或農(nóng)藥殘留超標。隨著信息技術(shù)的發(fā)展,基于機器視覺的病蟲害診斷為該問題提供了解決方案,即采集作物病蟲害圖片,利用機器視覺技術(shù)對作物病蟲害進行識別和診斷,為病蟲害防治提供輔助決策依據(jù)。
以大田水稻為試驗對象,分兩種方式獲取病斑識別原始訓練素材:第一種方式是用iPhone6s和Sumsung Note3手機拍攝,圖像以jpg格式儲存,采集時以能夠清晰拍攝水稻病斑為主要原則,可輔助白色背景板方便后續(xù)處理;第二種方式是使用網(wǎng)絡(luò)爬蟲抓取常見水稻病害圖片。兩種方式累計獲得條紋葉枯病、紋枯病、稻瘟病、霜霉病與赤枯病的5種病害圖片1 000張,圖像預處理后,每種病害隨機抽取50張,合計250張作為識別樣本,其余750張作為訓練樣本。其中病斑切割為訓練正樣本,5種病害樣本圖片共計3 311張,非病斑部分作為負樣本,即正常葉片以及背景共計1 000張。實際訓練過程中,會將目標病害以外的4種病害圖片也作為負樣本,以達到場景全覆蓋的目的。
本研究病害照片皆來源于開放的拍攝環(huán)境,對存在亮斑、噪點以及曝光不足等問題的照片,良好的預處理可以保證輸入照片的規(guī)格統(tǒng)一。適當提高原始圖像的質(zhì)量不僅可以降低計算機的運算負擔,還有利于最終的圖像分割以及病害識別。
1.2.1 亮度均衡
把原始圖像的直方圖變換為均衡分布的形式,可以增加像素的灰度值的動態(tài)范圍,從而增強圖像整體的對比度。使用的方法是灰度級變換:s=T(r),0≤r≤1。
T(r)滿足下列兩個條件:
(1)當0≤r≤1時,T(r)為單值且單調(diào)遞增[保證原圖各灰度級在變換后仍保持從黑到白(或從白到黑)的排列次序];
(2)當0≤r≤1時,0≤T(r)≤1(保證變換前后灰度值動態(tài)范圍的一致性),則有:
GMZ07膨潤土及其摻砂混合物試樣的初始干密度(ρd0)為1.5 g/cm3.將砂與混合物的干土質(zhì)量之比定義為摻砂率(Rs).將膨潤土與砂按照Rs為0%,30%,50%的比例混合配制成不同摻砂率試樣.根據(jù)北山地區(qū)地下水溶解固體含量范圍[3],配制NaCl溶液摩爾濃度(以下簡稱濃度)分別為0,0.5,1.0 mol/L.利用不同濃度NaCl溶液將GMZ07膨潤土及其摻砂混合物試樣進行飽和.對每種NaCl濃度的飽和試樣各施加200,400,800 kPa豎向荷載,固結(jié)完成后進行慢剪試驗.
Pr()r是r的概率密度函數(shù),Ps()s是s的概率密度函數(shù),Pr()r和 ()Tr已知,且T-1()s滿足上述條件(1),有Ps()s=,已知一種重要變換函數(shù),關(guān)于上限的定積分的導數(shù)即為該上限的積分值(萊布尼茨準則)。,對于離散值,其中rk是第k個灰度級(k=0,1,2,…,L-1);nk是圖像中灰度級為rk的像素個數(shù),n是圖像中像素的總數(shù)。已知變換函數(shù)的離散形式為:sk=Tr()k(k=0,1,2,…,L-1),sk稱作直方圖均衡化,由輸入圖像中灰度級rk(橫坐標)的像素映射到輸出圖像中灰度級sk(橫坐標)的對應(yīng)像素得到。
1.2.2 中值濾波
中值濾波法是一種非線性平滑技術(shù),它將每一像素點的灰度值設(shè)置為該點某鄰域窗口內(nèi)的所有像素點灰度值的中值。本文目標判定的主要特征是形狀,而中值濾波有較好保護邊緣的作用。處理效果如圖1所示。
HOG(Histogram of Oriented Gradient,方向梯度直方圖)特征是一種在計算機視覺和圖像處理中用來進行物體檢測的特征描述子,通過計算和統(tǒng)計圖像局部區(qū)域的梯度方向直方圖來構(gòu)成特征。SVM(Support Vector Machine,支持向量機)是一類按監(jiān)督學習方式對數(shù)據(jù)進行二元分類的廣義線性分類器。HOG特征結(jié)合SVM分類器已經(jīng)被廣泛用于圖像識別中[15-17]。
HOG特征是一種底層的視覺特征,主要描述圖像內(nèi)容的邊界。用于提取HOG特征的訓練圖像必須能完整地描述病斑,即每張訓練圖內(nèi)需要包含有一個能夠完整識別的病斑。原始病斑素材圖像一般采用手動裁剪配合批量尺寸修改獲得。
為區(qū)分不同的水稻病斑,準備訓練樣本時,將目標識別病害圖像作為正樣本,其他非目標識別病害圖像作為負樣本。如檢測稻瘟病時,系統(tǒng)將稻瘟病作為訓練正樣本,條紋葉枯病等其他病斑圖片及正常葉片作為訓練負樣本。完整的HOG特征獲取流程如圖2所示。
SVM使?jié)M足分類要求的最優(yōu)線性分類超平面在保證分類精度的同時,能夠使超平面兩側(cè)的空白區(qū)域最大化。
SVM的學習過程如下:
1)對樣本集合測試集進行特征提??;
2)選用合適的核函數(shù)進行變換,將輸入的樣本空間轉(zhuǎn)換到一個高維的RKHS(Reproducing Kernel Hilbert Space,RKHS);
圖2 HOG特征提取Fig.2 HOG feature extraction
3)在RKHS空間構(gòu)造最優(yōu)分離超平面,即搜索SVM,由得到的SVM構(gòu)造學習機,完成樣本的訓練;
4)經(jīng)過同樣預處理的未知類別數(shù)據(jù)輸入學習機進行分類判別,得到學習結(jié)果,學習過程結(jié)束。
本試驗采用Emgucv自帶機器學習類中的SVM進行處理,且采用交叉驗證后得到的準確度最高的懲罰參數(shù)c和核函數(shù)參數(shù)g,再對整個訓練集進行訓練得到SVM模型參數(shù)。試驗選擇的核函數(shù)為徑向基核函數(shù),即,r>0其中,懲罰參數(shù)c=13.93,核函數(shù)參數(shù)g=2.64。
完整的訓練及識別流程如圖3所示。
圖3 病斑檢測流程Fig.3 Cell detection process
用于病害識別的圖片所含信息通常比較復雜,如一張圖片內(nèi)包含多張植物葉片,病葉和健康葉混雜,病斑大小、數(shù)量差異大,病斑顏色有偏差,形狀有畸變等等(圖4),另外不同病害種類之間病斑特征也存在很大的差異,病斑診斷效果難以用單一指標做出全面的評價。本試驗用病害識別準確率、病葉檢出率和病斑定位正確率3個遞進指標分別對條紋葉枯病、紋枯病、稻瘟病、霜霉病以及赤枯病5種水稻病害識別結(jié)果進行評價。檢測結(jié)果如表1所示。
圖4 病斑檢測結(jié)果Fig.4 Cell detection results
表1 基于HOG+SVM的病斑識別結(jié)果Table 1 Classification result of diseases based on HOG+SVM
(1)病害識別準確率
5種病害的識別率平均達到98.4%,其中條紋葉枯病、霜霉病以及赤枯病三種病害診斷正確率為100%,條紋葉枯病正確率為98%,病害識別正確率最低的為稻瘟病,識別準確率為94%。由此可見,該方法可以較好地用于水稻病害的田間識別。
(2)病葉檢出率
病葉檢出率最高的為條紋葉枯病98.7%,最低的為霜霉病94.3%,累計5種病害的平均病葉檢出率為96.1%,該指標可較好地用于病害程度的評估。
(3)病斑定位正確率評價
條紋葉枯病病斑定位正確率為98.2%,表現(xiàn)最好;其次為稻瘟病與霜霉病,病斑定位正確率分別為95.1%與96.0%;誤報率較高的為紋枯病與水稻赤枯病,病斑定位正確率分別為91.8%與91.7%。
綜上,該方法可較好的用于一些形態(tài)特征較明顯的病斑,對于特征不明顯病斑識別誤差略高。
(1)本方法對病害圖片的拍攝光源、拍攝角度和拍攝質(zhì)量有較好的包容性,照片可以由不同設(shè)備拍攝,也可通過網(wǎng)絡(luò)和其他渠道獲得,降低了訓練和識別素材的獲取難度,整體需要用戶介入的步驟很少,水稻病害識別均值仍可達98.4%,此方法適合田間病害識別應(yīng)用,能夠滿足實際生產(chǎn)中病害診斷的需求。
(2)圖像處理過程簡便,對樣本數(shù)量要求不高,無需先驗知識。在預處理上,僅需對圖像進行簡單的亮度均衡以及中值濾波,對于成像質(zhì)量較好的設(shè)備所拍攝的照片甚至可以跳過此步驟,過程簡便;在訓練樣本獲取上具有可操作性,訓練樣本需求數(shù)量遠遠小于深度學習方法。病葉漏報率平均僅為3.9%,適合水稻葉部常見病害識別。
(3)不同病害識別效果因病害特征不同存在差異?;贖OG+SVM的識別方式更適合斑塊明顯、邊緣清晰的病斑識別,以水稻條紋葉枯病為例,準確率98%,漏報率1.315%,誤報率1.818%。不適合斑塊顏色較淺或形狀較為不規(guī)則的病斑識別,如水稻赤枯病的誤報率達到了8.333%,主要原因是測試圖片背景復雜及圖像中除病葉外的非病葉圖像元素干擾所致。