欒興
摘要 人工智能在林業(yè)中的應(yīng)用場景很多,如何精準(zhǔn)測報(bào)是一大難題。通過建立病蟲基本信息庫、樹木基本信息庫、蟲害基本信息庫,再通過病蟲與樹木寄主的關(guān)系和蟲害特征進(jìn)行層層篩選比對,以達(dá)到精準(zhǔn)識別。
關(guān)鍵詞 人工智能;林業(yè)病蟲害;精準(zhǔn)測報(bào)
中圖分類號:F307.2 文獻(xiàn)標(biāo)識碼:B 文章編號:2095–3305(2021)03–0154–02
林業(yè)有害生物對患區(qū)當(dāng)?shù)丶爸苓叺貐^(qū)林業(yè)生態(tài)造成的傷害往往是災(zāi)難性的、不可逆的、永久性的,并且其危害也嚴(yán)重阻礙了林業(yè)生態(tài)健康、可持續(xù)發(fā)展。如何進(jìn)行科學(xué)有效地防控,將林業(yè)有害生物災(zāi)害控制在可控范圍內(nèi),不至于遏制或阻礙林業(yè)生態(tài)建設(shè)的進(jìn)程,是當(dāng)前林業(yè)有害生物防控工作亟需解決的重點(diǎn)和難點(diǎn)問題。
江蘇省林業(yè)有害生物2 003種,病害355種,蟲害1 467種,有害植物52種,其他類129種。其中,外來林業(yè)有害生物20種,國家公布的14種檢疫性林業(yè)有害生物,江蘇省就有2種在全省大面積發(fā)生,全國重點(diǎn)治理的六大林業(yè)有害生物,在江蘇省發(fā)生危害的有4種。當(dāng)前,江蘇省監(jiān)測預(yù)警、檢疫御災(zāi)、災(zāi)害應(yīng)急難以滿足防控實(shí)際需要,林業(yè)有害生物聯(lián)防聯(lián)治、統(tǒng)一調(diào)度是防控工作的關(guān)鍵。隨著云計(jì)算、大數(shù)據(jù)、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等新技術(shù)的發(fā)展,將有助于林業(yè)有害生物防控的科學(xué)化管理[1]。構(gòu)建自動化、智能化的林業(yè)有害生物管理平臺十分必要,而林業(yè)病蟲害精準(zhǔn)測報(bào)是關(guān)鍵,因此,研究人工智能助力林業(yè)病蟲害精準(zhǔn)測報(bào)對社會和經(jīng)濟(jì)的發(fā)展有重要的現(xiàn)實(shí)意義。
1 圖像采集
害蟲識別首先要求獲取圖像,系統(tǒng)支持兩種圖像獲取方式:機(jī)器采集和人工獲取。
(1)機(jī)器采集:預(yù)置圖像采集點(diǎn),按照林區(qū)的面積均勻分布圖像采集點(diǎn),設(shè)置設(shè)備的焦距、采集時間、周期以及一周期內(nèi)的快門響應(yīng)次數(shù),從而獲取圖片。隨后圖像將通過物聯(lián)網(wǎng)設(shè)備每隔一段時間(比如10 min)自動上傳至服務(wù)器,通過人工智能的算法識別出圖片內(nèi)的昆蟲種類及數(shù)量,分析其中害蟲的數(shù)目變化,從而推斷出整個林區(qū)內(nèi)大致的昆蟲分布情況以及蟲害情況[2]。當(dāng)林區(qū)發(fā)生蟲害時,可以調(diào)取該區(qū)域機(jī)器采集的昆蟲數(shù)據(jù),通過分析數(shù)量較多、占比較大的害蟲確定蟲害類型與發(fā)生原因,幫助操作人員更好地判斷蟲害發(fā)生的原因,若識別度不足可使用樹木識別輔助修正幫助判斷。采集識別流程見圖1。
(2)人工采集:操作人員在實(shí)地檢查時,可以通過便攜式圖像采集設(shè)備比如手機(jī),拍攝昆蟲圖片,再通過手機(jī)或通訊網(wǎng)絡(luò)傳輸至服務(wù)器用以識別昆蟲種類。
2 圖像識別分析(核心算法)
獲取昆蟲圖像之后,使用人工智能的算法識別昆蟲。在圖像識別領(lǐng)域中,卷積神經(jīng)網(wǎng)絡(luò)相較于其他模型有其獨(dú)特優(yōu)勢,算法可以自行提取對象特征進(jìn)行識別,從而使得圖像識別對于光線、強(qiáng)度等圖像質(zhì)量要求并不需要太高。通過CNN發(fā)展而出的,如Faster R-CNN識別框架不僅能夠識別對象,而且可以劃定對象范圍,為計(jì)數(shù)功能提供方便。圖像識別算法主要包括以下3個步驟:
(1)圖像預(yù)處理:圖像處理技術(shù),銳化去噪等;
(2)目標(biāo)定位:定位圖片中所有昆蟲的bounding box,生成ROIs(Region of Interests);
(3)細(xì)粒度分類:構(gòu)建并訓(xùn)練深度學(xué)習(xí)分類模型,基于ROIs進(jìn)行昆蟲識別。
其中,對于昆蟲識別,由于拍攝圖像時存在拍攝目標(biāo)之間相互重疊的問題,使用Faster R-CNN進(jìn)行目標(biāo)識別時,對于目標(biāo)定位始終存在一定的偏差。為了解決這一問題,可以使用Mask R-CNN進(jìn)行目標(biāo)識別。 Mask R-CNN是在Faster R-CNN的基礎(chǔ)上添加了一個預(yù)測分割mask的分支,將RoI Pooling層替換成了RoIAlign層,同時添加了并列的FCN層(mask層),因此可以有效彌補(bǔ)Faster R-CNN的不足。
構(gòu)建好模型框架后,通過在大量標(biāo)注數(shù)據(jù)上進(jìn)行訓(xùn)練,可以得到準(zhǔn)確率較高的圖像識別模型。
3 樹木識別
操作人員通過使用便攜式圖像采集裝置拍攝樹木的樹葉以及樹木的整體照片,通過手機(jī)或通訊網(wǎng)絡(luò)上傳至服務(wù)器識別樹木的樹種,幫助操作員明確樹種,從而更加容易找出蟲害原因,并以此為依據(jù)修正識別結(jié)果,提高結(jié)果準(zhǔn)確度。若識別度不足可使用蟲害識別輔助,修正幫助判斷。樹木識別算法與昆蟲識別算法相同。
4 蟲害識別
如果通過害蟲識別和樹木識別相結(jié)合,識別度仍然達(dá)不到設(shè)定的需求,需要通過蟲害識別進(jìn)一步提高準(zhǔn)確度。操作人員通過便攜式圖像獲取設(shè)備拍攝蟲害處照片,通過算法分析該蟲害產(chǎn)生的原因,結(jié)合害蟲識別結(jié)果與樹種識別結(jié)果推斷出結(jié)果。
蟲害識別算法與昆蟲識別算法相同。由于蟲害特征不存在非常明顯的關(guān)聯(lián)性,即同樣形態(tài)的蟲害可能是由不同昆蟲或不同原因引起的,僅僅識別蟲害圖片會存在多種可能的結(jié)果,因此,蟲害識別僅作為害蟲識別以及樹種識別的輔助修正識別,幫助提高害蟲測報(bào)的精確度,而難以單獨(dú)使用進(jìn)行蟲害判斷。
5 推理流程
推理流程如圖2。
步驟一:首先取得并識別昆蟲圖片,獲得初步識別結(jié)論與識別度,若識別度小于90%,則進(jìn)入步驟二。
步驟二:若圖片由操作人員拍攝,則繼續(xù)獲取樹木圖片,進(jìn)入步驟三;否則交由專家人工判斷。
步驟三:獲取并識別樹種圖片,經(jīng)由規(guī)則庫比對,該昆蟲是否習(xí)慣于生活在該種植物上,通過樹種識別度與規(guī)則庫匹配度加權(quán)修正昆蟲識別度,若識別度小于90%,進(jìn)入步驟四。
步驟四:獲取并識別蟲害圖片,識別出可能產(chǎn)生該蟲害特征的害蟲種類、樹種種類,與步驟一、步驟三中的識別結(jié)果進(jìn)行比對,修正識別度,若識別度小于90%,交由專家進(jìn)行人工識別。
6 基礎(chǔ)庫建設(shè)
6.1 昆蟲庫
昆蟲庫主要包括:(1)昆蟲的基本信息:中文名、拉丁學(xué)名、別稱、界、門、亞門、綱、亞綱、目、亞目、科、屬、種、英文名、命名者及年代;(2)形態(tài)特征:成蟲、卵、幼蟲、蛹、鑒別特征;(3)棲地分布:生物學(xué)特性、原產(chǎn)地、中國分布現(xiàn)狀、引入擴(kuò)散原因和危害;(4)寄生植物:寄主;(5)生長繁殖、擴(kuò)展途徑、發(fā)生特點(diǎn)、昆蟲危害、相關(guān)法規(guī)、防治方法等相關(guān)信息。
其中,害蟲代碼采用中華人民共和國國家標(biāo)準(zhǔn)(GB/T 15775—2011)關(guān)于林業(yè)害蟲的林木資源分類與代碼的編碼規(guī)范。該規(guī)范選擇害蟲最穩(wěn)定的本質(zhì)屬性做為分類的基礎(chǔ)和依據(jù),按照科-目-種3個層次分類將該標(biāo)準(zhǔn)的代碼分為3個層次,由七位數(shù)字構(gòu)成。第一、二位代表害蟲分類中的“目”,第三、四位代表“科”,第五、六、七位代表“種”。
6.2 害蟲圖像庫
通過人工選取相應(yīng)的害蟲圖像,每種昆蟲選取不同角度、不同背景、不同狀態(tài)的圖片,定位到具體的種,打上標(biāo)簽并制作相應(yīng)文件夾,同時也要選取同種昆蟲在不同生長時期的圖片并打上標(biāo)簽。在算法訓(xùn)練模型時,為防止過擬合現(xiàn)象,每張圖片需要進(jìn)行旋轉(zhuǎn)、移動等操作,幫助提高識別準(zhǔn)確率。
6.3 樹種庫
樹種庫主要由樹種信息表構(gòu)成,信息表存儲了樹種的主要信息,包括種名、學(xué)名、科名屬名、生長類型、生態(tài)適應(yīng)性、形態(tài)、形態(tài)圖像、物候、分布區(qū)域、病蟲害等信息。其中,樹種代碼依照樹木通用代碼。
6.4 樹種圖像庫
目前,網(wǎng)絡(luò)上開放的樹木數(shù)據(jù)庫包括PlantNet、Leafsnap以及Flavia,這些數(shù)據(jù)庫包含的數(shù)據(jù)主要是各樹種的樹葉信息,因此需要另外自行搭建包含各樹種整體圖片的圖像庫??梢詫⒘謪^(qū)內(nèi)的每種樹種拍攝不同角度的圖片,同時在不同季節(jié)、一天之內(nèi)不同的時間、光線條件不同時拍攝,同時,加入樹葉與樹皮紋理的圖片以提高準(zhǔn)確率。在算法訓(xùn)練模型時為防止過擬合現(xiàn)象,每張圖片需要進(jìn)行旋轉(zhuǎn)、移動等操作,幫助提高識別準(zhǔn)確率。
6.5 蟲害庫
通過人工選取每種昆蟲造成不同蟲害的圖片,打上標(biāo)簽并制作相應(yīng)文件夾。
6.6 規(guī)則庫
對于森林中的常見多發(fā)病,森林病蟲害專家根據(jù)國內(nèi)外資料和實(shí)踐觀察編寫了大量的病害檢索表。其中比較全面且權(quán)威的有周仲銘先生的《林木病理學(xué)》著作中的林木病害檢索表。
根據(jù)病害檢索表中的信息,構(gòu)建病蟲害規(guī)則庫。記錄每種害蟲在不同時期對于不同的樹種造成的蟲害特征,不同昆蟲在不同時期寄生的樹種種類,將昆蟲庫、樹種庫與蟲害相互關(guān)聯(lián)。
參考文獻(xiàn)
[1] 李成贊.森林病蟲害診斷及害蟲預(yù)報(bào)專家系統(tǒng)的研建[D].北京:北京林業(yè)大學(xué),2009.
[2] 姜紅花,張傳銀,張昭,等.基于Mask R-CNN的玉米田間雜草檢測方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2020(6):227-235,254.
責(zé)任編輯:黃艷飛