關(guān)鍵詞: 深度學(xué)習(xí);PCA;多元線性回歸;多模態(tài);土壤顏色;農(nóng)作物的選擇
0 引言
土壤是種植過程中極其重要的因素之一,對農(nóng)作物或農(nóng)副產(chǎn)品的生產(chǎn)具有至關(guān)重要的作用。其成分和類型具有一定的地域性,不同的地區(qū)土壤類別不同,不同的農(nóng)作物要求的土壤也不同。因此,它對植物的營養(yǎng)供應(yīng)、植物根系的發(fā)育和生長、農(nóng)作物品質(zhì)影響甚至農(nóng)業(yè)生產(chǎn)的可持續(xù)影響都是不同的。為了保證土壤質(zhì)量可持續(xù),傳統(tǒng)的土壤檢測技術(shù)操作復(fù)雜,成本高,難以適應(yīng)現(xiàn)代農(nóng)業(yè)的發(fā)展趨勢[1]。近年來,智慧農(nóng)業(yè)不斷興起,神經(jīng)網(wǎng)絡(luò)在農(nóng)業(yè)領(lǐng)域也在不斷應(yīng)用和實(shí)施,可以解決土壤出現(xiàn)的一系列通病。
深度學(xué)習(xí)技術(shù)是一種具有巨大潛力的現(xiàn)代圖像處理技術(shù)[2]。在各個(gè)領(lǐng)域,神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的代表,作為人工智能算法的一種實(shí)用工具,對神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,提取大數(shù)據(jù)中隱藏的數(shù)據(jù)來解決實(shí)際問題。本文通過卷積神經(jīng)網(wǎng)絡(luò)(CNN),構(gòu)成一種特定的深度學(xué)習(xí)類別,針對土壤顏色進(jìn)行土壤識(shí)別分類。由于不同的土壤顏色,所包含的土壤成分不同,土壤適種的農(nóng)作物也不一樣。因此,借助CNN模型,可近似地通過顏色來識(shí)別土壤成分,與此同時(shí),也能通過CNN模型分辨土壤是否可用,例如土壤板結(jié)[3]、土壤鹽堿化[4]、水土流失[5]等問題。
1 數(shù)據(jù)來源
本文使用青藏高原科學(xué)數(shù)據(jù)中心、聯(lián)合國糧農(nóng)組織(FAO)和維也納國際應(yīng)用系統(tǒng)研究所(IIASA)所構(gòu)建的世界土壤數(shù)據(jù)庫(HWSD)的中國土壤數(shù)據(jù)集(v1.1)(2009)[6]的土壤數(shù)據(jù)信息。從數(shù)據(jù)庫中,我們根據(jù)土壤沙含量、淤泥含量、黏土含量、土壤容重、參考堆積密度、有機(jī)碳含量、酸堿度、碳酸鹽(CaCO3)、硫酸鹽(CaSO4)和電導(dǎo)率對某地區(qū)土壤進(jìn)行數(shù)據(jù)分析,并與該地區(qū)土壤圖像信息進(jìn)行多模態(tài)融合。同時(shí),采用智能手機(jī)、無人機(jī)等設(shè)備對各個(gè)地區(qū)的土壤進(jìn)行拍攝,采集相應(yīng)土壤圖像信息。
根據(jù)土壤的顏色,我們分別拍攝約總共5 000張圖片,分別包括黑色土地、黃色土地、紅色土地、紫色土地和荒漠土地,并通過這五種土壤類型進(jìn)行圖像分類,以便于通過深度學(xué)習(xí)算法進(jìn)行訓(xùn)練。
2 土壤圖像處理
為了便于圖像數(shù)據(jù)的分析,本文將得到的各地區(qū)土壤圖片進(jìn)行整理劃分,分別劃分到五種土壤類型中。本文將土壤根據(jù)顏色和類型依次設(shè)置標(biāo)簽,分別為黑色土地、紫色土地、黃色土地、紅色土地和荒漠土地共5 000張圖片,并將圖像大小轉(zhuǎn)化為224像素。同時(shí),將圖像的像素值統(tǒng)一在0~1之間,對每一張土壤圖片進(jìn)行Z-score標(biāo)準(zhǔn)化操作,通過計(jì)算其圖片的均值和標(biāo)準(zhǔn)差進(jìn)行線性變換。由于設(shè)備和復(fù)雜環(huán)境受限,數(shù)據(jù)集種類單一,本文通過幾何變換、伽馬變換和高斯濾波來去模糊、降噪來豐富土壤數(shù)據(jù)集。
2.1 幾何變換
本文通過裁剪或反轉(zhuǎn)的方式來增加土壤圖像數(shù)據(jù)。在裁剪中,對部分圖片裁剪約30%~40%。那么作為位圖,裁剪后,會(huì)使得圖像像素值集中在一定的范圍內(nèi),使得圖片整體很亮,像素值會(huì)增高,如圖1所示。
如圖2所示,對于無人機(jī)拍攝的遙感圖像,可以通過規(guī)格網(wǎng)格、滑動(dòng)窗口和隨機(jī)窗口三種方法進(jìn)行處理和采集,把圖像的某一區(qū)域放大并作為土壤樣本的訓(xùn)練集和測試集。
2.2 伽馬變換
根據(jù)伽馬變換s = c ? rγ 調(diào)整土壤圖像的灰度,以此來加強(qiáng)數(shù)據(jù)規(guī)模。其中,s 為輸出圖像的像素值,r為輸入圖像的像素值,c 為伽馬變換的常數(shù)值,一般用于像素值在圖像進(jìn)行標(biāo)準(zhǔn)化后輸出其灰度的范圍,具體情況依據(jù)實(shí)際應(yīng)用為準(zhǔn)。γ 為伽馬值,本文取γ =0.5,γ = 1.0,γ = 1.5,γ = 2.0四個(gè)伽馬值進(jìn)行對比,加強(qiáng)數(shù)據(jù),如圖3所示。
2.3 高斯濾波
本文通過高斯濾波來消除圖片噪聲點(diǎn),由于某地區(qū)可能出現(xiàn)背景噪聲,主要包括從地球、太陽、大地和云霧等輻射源照射,通過遙感設(shè)備獲取的土壤圖像,可能會(huì)出現(xiàn)白噪聲。因此,采用高斯濾波來去除噪聲,也因此在網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)時(shí),增強(qiáng)土壤數(shù)據(jù),保證模型訓(xùn)練的準(zhǔn)確性更高,也能夠處理更加復(fù)雜的問題,更能適應(yīng)非線性條件下的神經(jīng)網(wǎng)絡(luò)模型,如式(1)所示。
其中,Ai 為第i 個(gè)高斯分布的脈沖振幅,μi 為第i個(gè)分布的中心位置,ωi為第i個(gè)分布的半寬。
3 模型設(shè)計(jì)
基于深度學(xué)習(xí)框架,采用主成分分析(PrincipalComponent Analysis, PCA)和多元線性回歸進(jìn)行土壤的多模態(tài)數(shù)據(jù)分析,構(gòu)建如圖4所示的一種多模態(tài)土壤信息模型(Multimodal Soil Information Model, MSI)。
首先,先對通過深度學(xué)習(xí)將土壤圖像輸入模型中進(jìn)行訓(xùn)練,通過卷積核進(jìn)行上下文特征提取,經(jīng)過池化層,對卷積核處理的結(jié)果進(jìn)行降維,最后通過訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)對該土壤圖像推理為哪種顏色。例如Persson等人[7],評(píng)估了使用圖像分析從土壤顏色估計(jì)表層土壤濕度。使用了四種天然土壤和均勻的細(xì)沙并且研究了土壤顏色關(guān)于土壤濕度的變化。
其次,將該地區(qū)的土壤可使用傳感器對土壤數(shù)據(jù)進(jìn)行測量,使用PCA得到土壤的主成分后,再將其作為輸入多元線性回歸模型得到土壤主成分?jǐn)?shù)據(jù)。針對土壤的元素狀況對植物生長中的作用,采用PCA方法分析了16種元素的濃度數(shù)據(jù),將土壤中的復(fù)雜數(shù)據(jù)進(jìn)一步簡化,從而達(dá)到數(shù)據(jù)降維的作用。
最后,通過獲取的土壤主成分訓(xùn)練多元線性回歸模型,得到其土壤某成分的目標(biāo)值,再結(jié)合農(nóng)作物的習(xí)性選擇播種,例如茶葉喜酸、大米在黑土地質(zhì)量更佳等。
4 實(shí)驗(yàn)仿真
由于土壤圖像數(shù)據(jù)量較大,以及土壤所在環(huán)境下的一些客觀因素影響,不能通過人工手段去判斷土壤質(zhì)地。本文在數(shù)據(jù)預(yù)處理中說明的數(shù)據(jù)來源以及數(shù)據(jù)的歸一化,并且將圖像數(shù)據(jù)的訓(xùn)練集和測試集分別劃分為8∶2,然后通過分別設(shè)置為0.001、0.000 1、0.000 01 的學(xué)習(xí)率,采用AlexNet、ResNet-18 以及VGG16進(jìn)行比較和訓(xùn)練。
4.1 AlexNet 模型
AlexNet是由Alex Krizhevsky在2012年提出的一種深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)模型[8],主要應(yīng)用于圖像分類。本文將模型訓(xùn)練輪數(shù)設(shè)置為110、批量數(shù)為32,通過實(shí)驗(yàn)得到該模型在學(xué)習(xí)率分別為0.001、0.000 1和0.000 01時(shí)的準(zhǔn)確率與損失值,其效果如圖5所示。
當(dāng)學(xué)習(xí)率為0.001時(shí),AlexNet網(wǎng)絡(luò)準(zhǔn)確率與損失值如圖5(a,d)所示,訓(xùn)練集最高準(zhǔn)確率為46.89%,測試集準(zhǔn)確率為43.3%。一開始,模型的損失值急劇下降。但后期訓(xùn)練至15輪之后,模型準(zhǔn)確率一直穩(wěn)定于約21.3%,損失函數(shù)一直呈水平狀態(tài)。說明該模型在此參數(shù)下,模型準(zhǔn)確率不高,損失值收斂于1.6左右,顯然模型的效果不佳,模型欠擬合。
將學(xué)習(xí)率設(shè)置為0.000 1時(shí),AlexNet網(wǎng)絡(luò)準(zhǔn)確率與損失值如圖5(b,c)所示,不難發(fā)現(xiàn),此時(shí)的網(wǎng)絡(luò)模型訓(xùn)練最高準(zhǔn)確率為100%,測試集準(zhǔn)確率為99.8%,模型的精度提高。同時(shí),模型損失值也相比學(xué)習(xí)率0.001時(shí)穩(wěn)定。但損失值在后期收斂效果較差,可能出現(xiàn)模型不穩(wěn)定的情況。因此,再投入土壤檢測實(shí)際應(yīng)用中,可能無法達(dá)到如此高的精度。又可能出現(xiàn)一系列的故障,加大技術(shù)人員工作量。
將學(xué)習(xí)率設(shè)置為0.000 01時(shí),重新訓(xùn)練該模型后,如圖5(c,f)可見模型訓(xùn)練最高準(zhǔn)確率為100%,但是在進(jìn)行測試集中模型準(zhǔn)確率僅達(dá)到21%。間接從圖5(c)看出模型前20輪前,準(zhǔn)確率具有較大的波動(dòng),不穩(wěn)定,則可能出現(xiàn)的模型過擬合的現(xiàn)象,因此該模型效果不穩(wěn)定。
綜上所述,模型雖然出現(xiàn)了前幾輪損失值急劇下降的現(xiàn)象,但該現(xiàn)象并不會(huì)使得模型精度發(fā)生改變,因此,這是一種合理現(xiàn)象。但在3個(gè)學(xué)習(xí)率測試情況下,AlexNet模型可能不適合土壤圖像檢測。
4.2 ResNet-18模型
引入了殘差塊的ResNet-18模型[9],使得在訓(xùn)練模型時(shí)加快模型訓(xùn)練精度與模型訓(xùn)練速度。訓(xùn)練輪數(shù)設(shè)置為110輪,批量數(shù)為32。
當(dāng)學(xué)習(xí)率設(shè)置為0.001時(shí),ResNet-18網(wǎng)絡(luò)準(zhǔn)確率與損失值如圖6(a)(d)所示,訓(xùn)練集最高準(zhǔn)確率為98.84%,測試集準(zhǔn)確率為98.11%。然而ResNet-18模型在訓(xùn)練過程中,模型的訓(xùn)練準(zhǔn)確率與真實(shí)值的準(zhǔn)確率的誤差較小,相比于AlexNet模型,其模型的訓(xùn)練損失值與真實(shí)損失值誤差較大,可能模型不在輪數(shù)限制的情況下,模型準(zhǔn)確率可能會(huì)一直呈現(xiàn)水平形態(tài),也可能在實(shí)際應(yīng)用中模型的效果不是很好。而ResNet-18模型訓(xùn)練集的損失值波動(dòng)較大,比較不穩(wěn)定。另外訓(xùn)練集與測試集的損失值誤差逐漸增大,其模型若在110輪之后可能模型會(huì)出現(xiàn)過擬合的現(xiàn)象。
當(dāng)學(xué)習(xí)率設(shè)置為0.000 1時(shí),ResNet-18網(wǎng)絡(luò)準(zhǔn)確率與損失值如圖6(b)(c)所示,訓(xùn)練集最高準(zhǔn)確率為100%,測試集準(zhǔn)確率為98.96%。其情況與學(xué)習(xí)率0.001的ResNet-18模型相比,模型的穩(wěn)定性有了一定的提高,其準(zhǔn)確率誤差遠(yuǎn)比0.001模型小,模型訓(xùn)練穩(wěn)定。在損失值上也有了一定的收斂。
當(dāng)學(xué)習(xí)率為0.000 01時(shí),ResNet-18網(wǎng)絡(luò)準(zhǔn)確率與損失值如圖6(c)(f)所示,訓(xùn)練集最高準(zhǔn)確率為100%,測試集準(zhǔn)確率為98.96%。該模型損失函數(shù)在剛開始訓(xùn)練的時(shí)候就具有明顯的誤差,真實(shí)值損失函數(shù)與測試集損失函數(shù)較大,模型訓(xùn)練的準(zhǔn)確率與測試準(zhǔn)確率與學(xué)習(xí)率0.000 1和0.001相比誤差較大,模型具有明顯過擬合現(xiàn)象,無法應(yīng)用。
綜上所述,當(dāng)輪數(shù)為110,學(xué)習(xí)率為0.000 1時(shí),模型具有較強(qiáng)的穩(wěn)定性和魯棒性,并且相比AlexNet模型而言,ResNet-18模型性能更強(qiáng),模型識(shí)別率越高。
4.3 VGG-16模型
本研究訓(xùn)練模型的VGG-16模型,在學(xué)習(xí)率0.001 時(shí),出現(xiàn)欠擬合現(xiàn)象,模型準(zhǔn)確率為19.48%。根據(jù)Aya 所研究的VGG-16 模型對土壤檢測效果得出VGG-16的準(zhǔn)確率為82%。損失值達(dá)到0.66。又根據(jù)Chetan等人[10]的研究發(fā)現(xiàn)VGG-16在不同優(yōu)化器下的模型準(zhǔn)確率達(dá)到96%、97.3% 和98.94%。表明了VGG-16在特征提取上表現(xiàn)出其優(yōu)異的性能。
本文對土壤含水量、黏土含量、沙含量、酸堿度、碳酸鹽和硫酸鹽等分別進(jìn)行歸一化后再進(jìn)行主成分分析降維簡化數(shù)據(jù)。根據(jù)累計(jì)貢獻(xiàn)率80%得知,最終得到7個(gè)主成分,以此保留土壤成分的特征,作為自變量表示土壤成分特征,如表2所示。
根據(jù)前7個(gè)主成分的特征向量,可以得到如圖7 所示的主成分表達(dá)式。
如圖8 所示,對于95% 置信區(qū)間橢圓范圍內(nèi)的點(diǎn),降維后的數(shù)據(jù)均為有效值,而超出橢圓區(qū)間范圍的數(shù)值并予以剔除。
通過求出的PCA數(shù)值,根據(jù)電導(dǎo)率、CaCO3、頂土交換鈉百分比、pH值、有機(jī)質(zhì)含量以及CaS04進(jìn)行預(yù)測,借助多元線性回歸模型進(jìn)行了土壤成分預(yù)測,訓(xùn)練出如圖9所示的權(quán)重和偏置值。
其中:y1 為電導(dǎo)率,y2 為CaCO3含量,y3 為頂土交換鈉百分比,y4 為土壤酸堿度pH值,y5 為有機(jī)質(zhì)含量,y6 為CaSO4含量。再根據(jù)表3的結(jié)果與多元線性回歸求出的結(jié)果進(jìn)行比對,若該結(jié)果與土壤某幾種屬性的適種范圍內(nèi),就可以種植對應(yīng)的農(nóng)作物。
5 結(jié)論
本文構(gòu)建了多模態(tài)土壤信息模型,通過ResNet-18、VGG-16和AlexNet網(wǎng)絡(luò)建立土壤顏色識(shí)別與土壤檢測模型。分別訓(xùn)練3個(gè)模型進(jìn)行比較后,ResNet-18 模型更好。在訓(xùn)練模型過程中,最優(yōu)模型準(zhǔn)確率達(dá)到100%,損失值保持在0.004 左右。擁有殘差塊ResNet-18模型,既解決了土壤訓(xùn)練時(shí)VGG-16訓(xùn)練時(shí)間太長的問題,同時(shí)引入ResNet-18殘差塊也有助于防止梯度消失的現(xiàn)象出現(xiàn),相比應(yīng)用于土壤檢測的工作中,ResNet-18具有非常大的潛力。