荊偉斌 胡海棠 程成 李存軍 競霞 郭治軍
摘要: 在農(nóng)業(yè)保險中,蘋果園受災(zāi)理賠需要通過快速準(zhǔn)確的落果計數(shù)進(jìn)行定損,然而自然場景的復(fù)雜性、落果的分布狀態(tài)、采集員的身高、拍照習(xí)慣等環(huán)境因素和人為因素影響了基于影像的落果識別與計數(shù)的準(zhǔn)確性和可靠性。通過獲取不同落果背景、光照度、落果分布密集度、拍攝高度和拍攝距離等條件下地面的蘋果影像,采用基于深度學(xué)習(xí)的更快速的區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(faster region convolutional neural networks,F(xiàn)aster-RCNN)模型進(jìn)行地面蘋果檢測的方法,與傳統(tǒng)方法Hough變換和分水嶺算法進(jìn)行對比。結(jié)果表明,F(xiàn)aster-RCNN模型的平均識別精度達(dá)到95.53%,明顯優(yōu)于傳統(tǒng)的地面蘋果提取方法;在弱光、落果分布密集、拍攝距離較遠(yuǎn)等不理想的條件下,識別精度也達(dá)到90%以上,有較好的穩(wěn)定性?;谏疃葘W(xué)習(xí)的地面蘋果識別與計數(shù)方法,有望為提高農(nóng)業(yè)果品保險定損的精度與效率提供重要的技術(shù)參考。
關(guān)鍵詞: 深度學(xué)習(xí);蘋果;識別;地面蘋果數(shù)量;農(nóng)業(yè)保險
中圖分類號:TP391.41? 文獻(xiàn)標(biāo)志碼: A
文章編號:1002-1302(2020)05-0210-09
我國蘋果的總產(chǎn)量在2017年已經(jīng)達(dá)到4 139萬t,并且目前我國是世界上蘋果種植面積最大、產(chǎn)量最高的國家[1-2]。以室外種植為主的蘋果易受大風(fēng)、冰雹、大雨等各種不可抗拒的天氣影響而受災(zāi),且災(zāi)害存在區(qū)域性,同一地區(qū)、同一時間、同一災(zāi)種會造成多個果園受災(zāi)的現(xiàn)象,其受災(zāi)的嚴(yán)重度直接關(guān)系到蘋果的產(chǎn)量和農(nóng)民的收入。蘋果損失承保是農(nóng)業(yè)保險的重要內(nèi)容之一,如果受損后果農(nóng)報案,保險公司保險員須在2~3 d內(nèi)對多家受災(zāi)果園進(jìn)行受災(zāi)狀況分析。保險人員在保險理賠時需要及時、快速、準(zhǔn)確地監(jiān)測蘋果損失并對落果進(jìn)行計數(shù),由于時間緊、工作量大、工作強(qiáng)度高,通常沒有足夠的時間對果園的受災(zāi)狀況作出詳細(xì)統(tǒng)計,導(dǎo)致果農(nóng)的預(yù)期與保險公司估算后的定損理賠意見不統(tǒng)一。目前,通常只能通過談判進(jìn)行定損,往往存在損失虛高的問題。用相機(jī)、手機(jī)拍攝落果影像結(jié)合落果自動計數(shù)技術(shù),有望提高保險人員的調(diào)查速度,并提供評判與核實(shí)損失的依據(jù)。在用影像進(jìn)行果實(shí)識別與數(shù)量統(tǒng)計的過程中,顏色、紋理、輪廓等特征被用以區(qū)別果實(shí)、樹葉、土壤背景等。李莎等使用了單個或多個特征進(jìn)行果實(shí)的自動提取[3-13],盡可能利用顏色、紋理、形狀等特征及支持向量機(jī)等高級分類方法,但是由于背景環(huán)境的復(fù)雜性和多樣性、果實(shí)的成熟狀態(tài)不同、拍攝的時間、拍攝位置及高度等多種因素的影響,使得用模型學(xué)習(xí)的果實(shí)特征應(yīng)用條件嚴(yán)格,在新的場景中應(yīng)用的擴(kuò)展性和識別精度不高,從而造成人工地面采集影像的落果檢測成為重要難題。
近年來,隨著人工智能的發(fā)展,深度學(xué)習(xí)在各個領(lǐng)域的深入應(yīng)用成為重要的發(fā)展趨勢[14-26]。卷積神經(jīng)網(wǎng)絡(luò)具有高級的語義表達(dá)能力,能自學(xué)習(xí)顏色、紋理、形狀等淺層特征和深層特征,圖像的特征表達(dá)能力強(qiáng),并且具有良好的魯棒性和泛化性。在深度學(xué)習(xí)研究中,目標(biāo)檢測的應(yīng)用較為廣泛,以快速的區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(faster region convolutional neural networks,簡稱Faster-RCNN)[14]和YOLO(you only look once)[15]為主。研究發(fā)現(xiàn),F(xiàn)aster-RCNN更適用于中小目標(biāo)物的檢測。Ren等在 Fast-RCNN的基礎(chǔ)上加以改進(jìn),研究出更優(yōu)的目標(biāo)檢測模型Faster-RCNN[16]。熊俊濤等基于 Faster-RCNN 對樹上的綠色柑橘進(jìn)行檢測,在測試數(shù)據(jù)集上的平均檢測精度達(dá)到了85.5%[20]。Bargoti等利用地面車輛對蘋果樹進(jìn)行側(cè)面影像采集,并采用卷積神經(jīng)網(wǎng)絡(luò)對蘋果樹進(jìn)行檢測,檢測精度達(dá)到了86.1%[24]。國內(nèi)外研究者基于深度學(xué)習(xí)在果實(shí)檢測中的應(yīng)用[20-26],以及Faster-RCNN在目標(biāo)檢測任務(wù)中快速高效的特點(diǎn)和小目標(biāo)檢測中的優(yōu)勢[14-16],為地面蘋果的識別與計數(shù)提供了理論依據(jù)和技術(shù)支撐。然而,目前由于不同光照、背景等環(huán)境的影響與拍攝高度、拍攝距離等人為因素的影響,對基于深度學(xué)習(xí)的地面蘋果識別的精度和穩(wěn)定性帶來挑戰(zhàn)。
本研究面向蘋果農(nóng)業(yè)保險中地面蘋果理賠的快速識別和計數(shù)的需求,針對不同光照度、多種土壤背景、果實(shí)表面顏色分布不均勻、影像果實(shí)相對尺寸較小等問題,獲取復(fù)雜自然場景下的地面蘋果影像,引入深度學(xué)習(xí)的方法學(xué)習(xí)不同地面蘋果的特征,提取圖片中目標(biāo)物的一些隱藏像元信息進(jìn)行果實(shí)識別,旨在提出1種基于Faster-RCNN對原始影像中的地面蘋果進(jìn)行提取計數(shù)的方法,并與傳統(tǒng)的果實(shí)識別方法進(jìn)行對比分析。
1 材料與方法
1.1 試驗(yàn)設(shè)計與地面蘋果影像的獲取
在本試驗(yàn)中,為了確保所獲得的影像數(shù)據(jù)信息豐富,涵蓋人為因素及環(huán)境因素等影響因素,主要針對以下5種因素進(jìn)行地面蘋果影像的收集:地面果實(shí)背景、光照度、地面蘋果分布密集程度、拍攝高度、拍攝距離。設(shè)置這些因素的原因是農(nóng)業(yè)保險公司在蘋果園受災(zāi)并接到報案后需要勘察和定損理賠,通常會安排保險員在果園進(jìn)行實(shí)地拍照。拍攝地面蘋果會受到地面蘋果環(huán)境的多樣性、地面蘋果的分布密集程度差異、不同保險員的身高、多個保險員的拍照習(xí)慣差異以及拍照時的光照度變化等影響,這些都對落果影像的自動計數(shù)提出了挑戰(zhàn)。本研究通過模擬試驗(yàn)獲取如下多種復(fù)雜場景下的蘋果落果圖片:
(1)地面果實(shí)背景。在地面蘋果的分布環(huán)境中,由于不同地區(qū)的施肥環(huán)境、除草劑噴灑強(qiáng)度及灌溉條件等多種因素的影響,果園內(nèi)會出現(xiàn)青草、枯草及雜草比較茂密的情況,導(dǎo)致果實(shí)與背景之間的對比度存在多樣性特征。
(2)光照度。在保險員拍照時,由于樹木陰影等因素的影響,果實(shí)的受光環(huán)境會有所不同,光照因素的影響會導(dǎo)致果實(shí)表面顏色分布不均勻,造成照片中果實(shí)的色調(diào)、飽和度和對比度不同。
(3)落果分布的密集程度。在果園受災(zāi)后,由于不同區(qū)域果樹的受災(zāi)程度不同,會出現(xiàn)不同程度的落果現(xiàn)象,地面會出現(xiàn)多個果實(shí)聚集成簇的現(xiàn)象,果實(shí)呈現(xiàn)點(diǎn)狀、面狀等多種分布方式,導(dǎo)致果實(shí)輪廓邊緣出現(xiàn)粘連及遮擋等現(xiàn)象。
(4)拍攝高度。由于保險員之間的身高有一定的差異,且拍照習(xí)慣有所不同,會導(dǎo)致所拍攝影像的角度多樣化,影像中果實(shí)之間存在不同程度的遮擋,輪廓信息會出現(xiàn)不同程度的缺失。
(5)拍攝距離。在地面蘋果影像中,由于保險員的拍攝距離不同,不同的影像景深導(dǎo)致果實(shí)在影像中的比例不同,景深嚴(yán)重的區(qū)域會出現(xiàn)果實(shí)輪廓虛化和果實(shí)顏色不豐富等現(xiàn)象。
在模擬果園落果環(huán)境的試驗(yàn)中,本研究針對上述5種場景,采用智能手機(jī)拍攝的方式進(jìn)行試驗(yàn)數(shù)據(jù)的采集(圖1)。圖1-a為在不同光照環(huán)境下,影像采集員在同一天的不同時間段內(nèi)(13:00—14:00為強(qiáng)光照,16:00—17:00為弱光照)采集的不同光照條件下的地面蘋果影像。圖1-b中,影像采集員選取枯草、青草、茂密的雜草作為落果背景環(huán)境。圖1-c在模擬果園受災(zāi)后不同程度的落果現(xiàn)象試驗(yàn)中,影像采集員對不同密集程度的地面蘋果進(jìn)行拍照(當(dāng)出現(xiàn)3個以上果實(shí)聚集為多個簇時,將其定義為落果密集;當(dāng)出現(xiàn)3個或者3個以下果實(shí)聚集為單個簇時,將其定義為落果稀疏)。圖1-d中,在模擬不同拍攝高度的影響時,影像采集員選取不同的拍攝角度進(jìn)行拍攝,主要選取站立拍攝、蹲伏拍攝2種拍攝手段。圖1-e表示在多種環(huán)境下,拍攝者采用不同的拍攝距離采集得到的影像。
1.2 地面蘋果影像的提取方法
本研究主要采用分水嶺算法、Hough變換圓檢測和深度學(xué)習(xí)模型3種方法對地面蘋果影像進(jìn)行提取,并進(jìn)行對比研究,具體流程如圖2所示。
1.2.1 Faster-RCNN深度學(xué)習(xí)網(wǎng)絡(luò)模型 深度學(xué)習(xí)訓(xùn)練樣本庫主要參考VOC 2007數(shù)據(jù)集建立,將單張影像大小固定為500×375像素,圖片格式為JPG。數(shù)據(jù)集分為訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集,共有 1 140 張影像。其中,訓(xùn)練數(shù)據(jù)集影像共計920張,包括多種環(huán)境因素影響下的果實(shí)數(shù)據(jù)。在制作標(biāo)簽的過程中,用LabelImg軟件對地面果實(shí)進(jìn)行人工標(biāo)注。
本研究采用Faster-RCNN對地面蘋果進(jìn)行提取。Faster-RCNN是基于RCNN和Fast-RCNN模型改進(jìn)的1種目標(biāo)檢測模型,舍棄了Selective Search(選擇性搜索)方法的提取建議框,采用共享卷積網(wǎng)絡(luò)生成建議區(qū)域(region proposalnetwork,簡稱RPN)。Faster-RCNN模型共有5個部分構(gòu)成,分別是特征提取層、RPN建議層、Proposal層、Roi Pooling層、Softmax分類層(圖3)。其中,RPN網(wǎng)絡(luò)是在卷積神經(jīng)網(wǎng)絡(luò)提取的feature maps(特征圖層)上進(jìn)行操作的,通過獲取目標(biāo)物特征圖片中的地面位置,并在每張圖片上生成300個建議框,映射到卷積神經(jīng)網(wǎng)絡(luò)最后1層輸出的feature maps上,其生成的建議框質(zhì)量高、數(shù)量少,并且借助于GPU(圖形處理器)強(qiáng)大的圖片計算能力,極大地提高了目標(biāo)檢測的速度。
在深度學(xué)習(xí)模型訓(xùn)練中,筆者將采集的地面蘋果訓(xùn)練數(shù)據(jù)集輸入到Faster-RCNN模型中,先經(jīng)過卷積網(wǎng)絡(luò)進(jìn)行特征圖片的提取,再由RPN網(wǎng)絡(luò)產(chǎn)生建議區(qū)域,用于果實(shí)特征的學(xué)習(xí),然后由Roi Pooling層根據(jù)多個果實(shí)大小固定所需的建議框尺寸,最后由Faster-RCNN有選擇性地對建議區(qū)域進(jìn)行學(xué)習(xí)并完成目標(biāo)分類檢測工作。
在本試驗(yàn)中,電腦硬件配置Intel酷睿i7處理器,搭載NVIDIA GeForce GTX1080ti顯卡,內(nèi)存為12 Gb,并在Ubuntu 14.04系統(tǒng)環(huán)境下,搭建Caffe框架。在模型訓(xùn)練過程中,選用大型的VGG16作為特征圖片提取網(wǎng)絡(luò),VGG16相比于ZFNet和VGG_1024具有更深的網(wǎng)絡(luò),提取目標(biāo)的顯著特征更具有優(yōu)勢[27]。VGG16是由13層卷積層、13層Relu激活函數(shù)和4層池化層組成的深度網(wǎng)絡(luò),網(wǎng)絡(luò)的深度決定了它能夠?qū)W習(xí)圖片中的多種深層次信息。本試驗(yàn)中的部分網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)見表1。
1.2.2 分水嶺算法和Hough(霍夫)變換方法 傳統(tǒng)的果實(shí)檢測方法主要是基于顏色空間和輪廓信息進(jìn)行果實(shí)提取[2-6]。顏色空間是人的視覺系統(tǒng)直觀判斷目標(biāo)物類型的基礎(chǔ),輪廓信息是我們對顏色空間篩選出的目標(biāo)物大小、種類的更加準(zhǔn)確的判斷,兩者相輔相成。
基于顏色空間的檢測,果實(shí)顏色和紋理與背景環(huán)境具有較大差異,而分水嶺算法[28]在分割目標(biāo)物與背景中具有一定優(yōu)勢,因此本研究基于顏色空間,選用分水嶺算法對地面果實(shí)進(jìn)行分割提取。由于果實(shí)主要以近圓形形態(tài)為主,明顯區(qū)別于地面的其他物體,而Hough變換在幾何特征突出的物體檢測中具有一定優(yōu)勢[29],所以本研究采用基于輪廓信息的Hough變換圓提取的方法進(jìn)行地面果實(shí)的提取。
1.3 地面蘋果識別精度的評價
本試驗(yàn)共選取220個測試數(shù)據(jù)集,分為5大類,共計11組數(shù)據(jù),涵蓋多種落果背景信息、不同光照度、果實(shí)分布密集與否、拍攝高度和拍攝距離等信息。其中單個測試數(shù)據(jù)中的蘋果數(shù)量分別為10、12、20、35個,落果數(shù)量共計5 065個。
在地面蘋果提取試驗(yàn)中,為了評估深度學(xué)習(xí)對原始影像中地面蘋果檢測的優(yōu)勢和有效性,統(tǒng)一采用原始影像進(jìn)行地面果實(shí)的提取,并通過目視解譯的方式判斷影像中果實(shí)的實(shí)際數(shù)量,以識別精度(P)、實(shí)際識別精度(Pτ)、均方誤差(MSE)作為評判依據(jù),計算公式如下:
P=∑Ni=1 Di Ti ;? ?(1)
Pt= 1 N? ∑Ni=1 Di-FDi Ti? ;? (2)
MSE= 1 N? ∑Ni=1 FDi+LDi Ti 。? (3)
式中:N為圖片數(shù)量;FDi(falsedetection)為第i張圖片中將其他目標(biāo)錯誤識別為蘋果的數(shù)量,個;LDi(leak detection)為第i張圖片中未檢測到的落果數(shù)量(個);Di(detection)為第i張圖片中模型識別的落果數(shù)(個);Ti為第i張圖片中實(shí)際的落果數(shù)量(個)。
2 結(jié)果與分析
2.1 3種方法對落果的識別結(jié)果
在本試驗(yàn)中,針對落果背景、光照度、落果分布密集與否、拍攝高度和拍攝距離等5種因素,采用Faster-RCNN法、分水嶺法、Hough變換法等3種方法對地面蘋果的落果進(jìn)行提取。結(jié)合表2、圖4的數(shù)據(jù),對3種方法的識別結(jié)果進(jìn)行對比可知,在多種復(fù)雜環(huán)境因素和人為因素影響下,深度學(xué)習(xí)Faster-RCNN模型在地面蘋果數(shù)量提取中的識別精度達(dá)到95%,識別精度明顯高于分水嶺算法和Hough變換圓提取法;在單張影像的識別時間上,深度學(xué)習(xí)所需時間約為0.95 s,而用傳統(tǒng)方法識別則需要 2~3 s,識別效率得到明顯提升。
由表2、圖4還可以看出,F(xiàn)aster-RCNN模型具有較大的優(yōu)勢,并且識別誤差較小。其中,在用分水嶺算法和Hough變換方法識別果實(shí)的過程中,原始影像未經(jīng)過預(yù)處理(如去除果實(shí)表面陰影[30]、削減果實(shí)粘連[31]等),提取結(jié)果精度較低,而Faster-RCNN模型的圖像同樣沒有經(jīng)過預(yù)處理,但精度較高。已有研究表明,在經(jīng)過預(yù)處理后的影像中,分水嶺算法對桃的識別精度可達(dá)88.3%[8];Hough變換方法對番茄的識別精度可達(dá)77.6%[32]。
可以看出,傳統(tǒng)的地面蘋果檢測結(jié)果與深度學(xué)習(xí)的識別結(jié)果差異較大。當(dāng)拍攝高度較高、近景拍攝、果實(shí)分布稀疏且果實(shí)顏色信息突出時,傳統(tǒng)方法能夠準(zhǔn)確地分割果實(shí)與背景,并進(jìn)行果實(shí)標(biāo)注,識別速度快、精度高,與深度學(xué)習(xí)的識別結(jié)果相當(dāng)。但在多個果實(shí)聚集、光照分布不均勻、處于樹木陰影區(qū)及遠(yuǎn)景拍攝的情況下,傳統(tǒng)的果實(shí)識別方法存在部分果實(shí)無法識別、精度較低的現(xiàn)象,然而深度學(xué)習(xí)法在這些情況下都能夠準(zhǔn)確地識別各個果實(shí),并進(jìn)行果實(shí)標(biāo)注,單個果實(shí)的識別率均高于80%,穩(wěn)定性高。試驗(yàn)結(jié)果表明,在未經(jīng)預(yù)處理的原始圖像中,在背景因素、人為因素等多種因素的影響下,深度學(xué)習(xí)的識別結(jié)果均明顯優(yōu)于傳統(tǒng)的識別結(jié)果(圖5)。
在多個果實(shí)聚集區(qū)域,由于果實(shí)之間出現(xiàn)粘連,果實(shí)之間的顏色信息出現(xiàn)混合,分水嶺算法難以對多個果實(shí)進(jìn)行分割,導(dǎo)致出現(xiàn)漏判的現(xiàn)象;在影像中落果分布較遠(yuǎn)的區(qū)域以及多個果實(shí)密集分布的區(qū)域,由于果實(shí)輪廓虛化、果實(shí)輪廓信息交錯及背景因素的影響,導(dǎo)致Hough變換圓檢測方法的識別結(jié)果較差。在光照分布不均勻的區(qū)域和樹木陰影區(qū)域,果實(shí)表面的顏色亮度出現(xiàn)變化,部分果實(shí)的輪廓出現(xiàn)虛化現(xiàn)象,并且傳統(tǒng)的影像處理方法難以有效去除光照、陰影等因素的影響,導(dǎo)致果實(shí)的識別精度較低。
2.2 Faster-RCNN復(fù)雜場景下地面蘋果的計數(shù)
本研究通過調(diào)整參數(shù),選出最合適的參數(shù)對模型進(jìn)行訓(xùn)練,并用訓(xùn)練后的模型對測試數(shù)據(jù)集進(jìn)行檢驗(yàn)。圖6包括強(qiáng)光照射條件下、雜草背景下、裸土背景下及不同拍攝高度和距離條件下果實(shí)的檢測結(jié)果。Faster -RCNN可以精準(zhǔn)地提取出圖片中每個蘋果的影像,并且每張圖片被判斷為蘋果的概率均在95%以上,具有較高的識別率。
由表3可以看出, 不同條件下深度學(xué)習(xí)模型對地面蘋果識別精度的排序如下:青草>茂密雜草>枯草;強(qiáng)光照>弱光照;落果分散>落果集中;拍攝高度低<拍攝高度高;拍攝距離近>拍攝距離遠(yuǎn)。其中,青草背景下強(qiáng)光照、近距離拍攝、拍攝高度較高的落果較為分散時的識別和計數(shù)精度最高。
具體分析得出:(1)在青草背景環(huán)境中,由于果實(shí)與背景的顏色、紋理差異比較明顯,所以蘋果的識別精度明顯高于枯草背景、茂密雜草背景,并且漏判數(shù)也最低。(2)在強(qiáng)光照條件下,由于光照度的影響,果實(shí)顏色、表面紋理信息與背景相比具有明顯的差異,果實(shí)信息突出,所以識別率高于弱光條件下的識別率,并且識別誤差也低于弱光條件下的識別誤差。(3)落果分布密集會造成果實(shí)之間的距離近,并且具有不同程度的遮擋,從而增加了落果的識別難度,所以分布稀疏的落果識別精度比分布密集的識別精度高3.4%。(4)拍攝高度較低導(dǎo)致地面蘋果之間產(chǎn)生不同程度的遮擋,由于拍攝高度高時,蘋果之間的遮擋小,并且多數(shù)落果具有完整的輪廓信息,所以識別精度比蹲伏拍攝的識別精度高4.1%;當(dāng)拍攝距離較低時,果實(shí)的漏判率相對較高,達(dá)到7.7%。(5)由于拍攝距離的影響,蘋果在影像中的大小也發(fā)生明顯變化,當(dāng)拍攝距離較近時,果實(shí)的顏色、紋理、輪廓等信息比較完整,并且果實(shí)影像占像元的比例相對較高;當(dāng)拍攝距離較遠(yuǎn)時,果實(shí)影像占像元的比例較低,并且由于背景信息和圖片本身像素信息等因素的影響,增加了地面蘋果的識別難度,易發(fā)生漏判、誤判的情況,當(dāng)拍攝距離較遠(yuǎn)時,漏判、誤判的數(shù)量最多,總占比達(dá)到9.6%。
3 討論
通過對比3種方法在復(fù)雜場景下對蘋果影像的提取過程與結(jié)果發(fā)現(xiàn),在復(fù)雜背景環(huán)境中,傳統(tǒng)的方法識別精度低,主要原因一方面是未對原始影像進(jìn)行預(yù)處理,另一方面可能是場景較復(fù)雜,難以滿足地面蘋果識別任務(wù)的需求,并且在識別過程中需要不斷調(diào)整參數(shù),影像處理過程比較繁瑣。由于環(huán)境的復(fù)雜性和多樣性影響,在批量識別測試樣本中的落果時,傳統(tǒng)方法難以滿足各個影像所需的處理需求(去光、去噪等),導(dǎo)致識別困難、精度低。而傳統(tǒng)的識別檢測方法對原始圖像處理較多,可能引起影像中的像素信息丟失,對落果識別也有一定程度的影響。深度學(xué)習(xí)Faster-RCNN模型,在人工建立的訓(xùn)練樣本基礎(chǔ)上進(jìn)行背景與果實(shí)特征學(xué)習(xí),能夠得到不同姿態(tài)下的果實(shí)信息及不同的背景信息。利用卷積核滑動的方式處理單張影像,能夠得到果實(shí)與背景之間的關(guān)聯(lián)信息及果實(shí)與背景之間像元信息的差異,具有良好的泛化能力,檢測結(jié)果的平均精度達(dá)到95%,單張影像對地面蘋果的檢測速度達(dá)到0.95 s/張,能夠滿足及時反饋處理結(jié)果的需求。通過對比Faster-RCNN在不同背景環(huán)境下的識別結(jié)果可以發(fā)現(xiàn),果實(shí)輪廓信息的完整性和顏色的豐富性是使識別結(jié)果發(fā)生浮動的重要原因。在拍攝高度低、拍攝距離遠(yuǎn)及落果分布密集的條件下,由于枝葉遮擋、果實(shí)間互相遮擋、目標(biāo)物相對較小等因素的影響,導(dǎo)致果實(shí)輪廓信息不完整,因此果實(shí)的識別精度較低;在弱光背景和拍攝距離遠(yuǎn)的環(huán)境下,由于果實(shí)的顏色信息不突出,使得識別結(jié)果的精度低于平均識別精度。
綜上所述,深度學(xué)習(xí)的檢測精度優(yōu)于傳統(tǒng)方法的檢測精度,適用于地面蘋果的單果檢測、多果檢測及數(shù)量統(tǒng)計,但是深度學(xué)習(xí)模型的檢測精度也受到多種環(huán)境因素和人為因素的影響。深度學(xué)習(xí)模型的精度受限于人為拍攝單張影像的質(zhì)量及樣本庫的數(shù)量,由于訓(xùn)練樣本集以單一類別的樣本庫為主,地物類別信息匱乏,導(dǎo)致模型訓(xùn)練所得先驗(yàn)知識不足,因此在部分環(huán)境下存在漏判、誤判的現(xiàn)象。在今后的研究工作中,影像采集員應(yīng)在拍攝環(huán)境光照充足、拍攝角度高等條件下采集影像,并將人工補(bǔ)光及拍攝支架作為重要的輔助手段,確保樣本庫影像的質(zhì)量;在建立數(shù)據(jù)庫樣本時,應(yīng)豐富果園地物類別信息,建立地物類別多樣性、環(huán)境多樣性、果實(shí)姿態(tài)多樣性樣本庫;將完善的樣本庫應(yīng)用于深度學(xué)習(xí)網(wǎng)絡(luò)模型中,并將網(wǎng)絡(luò)模型訓(xùn)練所得結(jié)果應(yīng)用于真實(shí)果園的落果檢測中,有望為提高農(nóng)業(yè)果品定損、地面落果數(shù)量統(tǒng)計提供一定的技術(shù)參考,增強(qiáng)農(nóng)業(yè)果品定損的公正性和科學(xué)性。
4 結(jié)論
在蘋果災(zāi)損評估工作中,地面蘋果是否得到準(zhǔn)確識別與統(tǒng)計是確保保險理賠是否合理的重要依據(jù)。本研究對比了深度學(xué)習(xí)Faster-RCNN模型和傳統(tǒng)方法對地面蘋果進(jìn)行檢測計數(shù)的效果,得出以下結(jié)論:(1)在多種落果環(huán)境中,在多種復(fù)雜場景下地面蘋果檢測任務(wù)中,F(xiàn)aster-RCNN對地面蘋果的平均識別精度達(dá)到95%以上,精度高于傳統(tǒng)方法,更適合復(fù)雜場景地面蘋果的提取;(2)在大樣本數(shù)據(jù)處理中,深度學(xué)習(xí)批量處理影像的能力優(yōu)于傳統(tǒng)方法,具有較強(qiáng)的魯棒性和泛化性,多個場景下的識別精度均高于90%,深度學(xué)習(xí)模型對單張影像的處理速度優(yōu)于傳統(tǒng)的地面蘋果提取方法,從而為農(nóng)業(yè)果品保險中地面蘋果的數(shù)量統(tǒng)計提供了一定的技術(shù)參考。
參考文獻(xiàn):
[1]國家統(tǒng)計局.中國統(tǒng)計年鑒[M]. 北京:中國統(tǒng)計出版社,2017.
[2]李云國,蔡兆翔,馬 靜,等. 昭通高原蘋果產(chǎn)業(yè)發(fā)展現(xiàn)狀及可持續(xù)發(fā)展對策研究[J]. 云南農(nóng)業(yè)大學(xué)學(xué)報(社會科學(xué)版),2015,9(5):69-73.
[3]李 莎,錢建平,趙春江,等. 不同顏色模型識別成熟蘋果圖像的比較分析[J]. 計算機(jī)工程與設(shè)計,2015,36(6):1545-1550.
[4]Guo A X,Zou X J,Zhu M S,et al. Color feature analysis and recognition for litchi fruits and their main fruit bearing branch based on exploratory analysis[J]. Transactions of the Chinese Society of Agricultural Engineering,2013,29(4):191-198.
[5]馬正華,呂小俊,徐黎明,等. 近色背景果實(shí)識別的多源圖像配準(zhǔn)[J]. 計算機(jī)工程與設(shè)計,2018,39 (11):3494-3499.
[6]許 凱. 基于圖像識別的蘋果果實(shí)檢測技術(shù)[J]. 實(shí)驗(yàn)室研究與探索,2016,35(10):36-39.
[7]陳禮鵬,穆龍濤,劉浩洲,等. 基于獼猴桃果萼圖像的多目標(biāo)果實(shí)識別方法[J]. 計算機(jī)工程與設(shè)計,2018,39(6):1738-1744.
[8]黃小玉,李光林,馬 馳,等. 基于改進(jìn)判別區(qū)域特征融合算法的近色背景綠色桃子識別[J]. 農(nóng)業(yè)工程學(xué)報,2018,34(23):142-148.
[9]Jun L,Suk L W,Hao G,et al. Immature citrus fruit detection based on local binary pattern feature and hierarchical contour analysis[J]. Biosystems Engineering,2018,171:78-90.
[10]Thendral R,Suhasini A,Senthil N. A comparative analysis of edge and color based segmentation for orange fruit recognition[C]//IEEE. International Conference on Communications & Signal Processing,2014:463-466.
[11]Zawbaa H M,Abbass M,Hazman M,et al. Automatic fruit image recognition system based on shape and color features[C]// International Conference on Advanced Machine Learning Technologies and Applications. Springer,Cham,2014:278-290.
[12]García-Lamont F,Cervantes J,Ruiz S,et al. Color characterization comparison for machine vision-based fruit recognition[C]//International Conference on Intelligent Computing. Springer,Cham,2015:258-270.
[13]Jana S,Basak S,Parekh R. Automatic fruit recognition from natural images using color and texture features[C]// IEEE. 2017 Devices for Integrated Circuit,2017:620-624.