薛 原,吳 愛
(江蘇省徐州環(huán)境監(jiān)測中心,江蘇 徐州 221000)
農(nóng)業(yè)在國民經(jīng)濟(jì)中占有舉足輕重的地位,但由于小農(nóng)化和肥料的不合理,使得農(nóng)業(yè)的發(fā)展受到多種因素的制約。在發(fā)達(dá)國家,精準(zhǔn)農(nóng)業(yè)施肥是一種以農(nóng)業(yè)生產(chǎn)為特征的,以信息技術(shù)和知識管理為基礎(chǔ)的現(xiàn)代農(nóng)業(yè)生產(chǎn)方式。通過對土地和作物的實(shí)時(shí)動態(tài)進(jìn)行分析,從而達(dá)到降低成本獲得更高效益的目的,使農(nóng)業(yè)資源和農(nóng)業(yè)生產(chǎn)力得到最大限度的提高,以達(dá)到減少浪費(fèi)、增加產(chǎn)量、避免農(nóng)業(yè)生態(tài)風(fēng)險(xiǎn)的目的。
土壤是作物生長的基礎(chǔ),土壤屬性信息是作物生產(chǎn)過程中不可忽略的一項(xiàng)重要內(nèi)容。它包含了土壤有機(jī)質(zhì)、有機(jī)碳、氮、鐵、錳、團(tuán)聚體、礦物等特征,能夠快速、高效地提取和反饋土壤各階段的土壤信息,為區(qū)域作物針對性的施肥提供依據(jù)。氮是植物的重要組成部分,其影響了蛋白質(zhì)、核酸、葉綠素、酵素等的合成,對植物的光合作用發(fā)揮著重要作用。通過對土壤全氮快速、精確地檢測,可以為農(nóng)業(yè)生產(chǎn)提供技術(shù)支撐,并能有效地促進(jìn)農(nóng)田土壤的有效管理,提高氮素的利用率。
利用高光譜遙感技術(shù)可以快速、反復(fù)地獲取相同區(qū)域的土壤信息,是一種準(zhǔn)確、快速獲取農(nóng)田土壤屬性信息的有效方法。實(shí)驗(yàn)室高分光光度法是一種非破壞性的測量技術(shù),它可以通過對土壤的反射性和土壤的物理特性對土壤進(jìn)行分析,并對土壤進(jìn)行化學(xué)成分分析和掃描,從而得出土壤有機(jī)質(zhì)、N、P、K、水分等各種指標(biāo)。該技術(shù)的快速、無破壞性,為進(jìn)一步闡明光譜數(shù)據(jù)的數(shù)學(xué)方法和對土壤中TN含量的快速監(jiān)控,提供了一種有效的手段。
高光譜遙感技術(shù)是二十世紀(jì)八十年代發(fā)展起來的。隨著遙感技術(shù)、傳感器技術(shù)、空間技術(shù)和計(jì)算機(jī)技術(shù)的飛速發(fā)展,遙感技術(shù)逐漸進(jìn)入了以高光譜遙感技術(shù)為主導(dǎo)的時(shí)代。尼加提卡斯木等人利用兩頻譜指標(biāo)和偏最小二乘回歸理論,通過對光譜數(shù)據(jù)的頻譜分析,提出了一種新的土壤有機(jī)質(zhì)高光譜估計(jì)模型;國外學(xué)者通過兩頻段優(yōu)化算法對新的土壤有機(jī)質(zhì)進(jìn)行了頻譜參數(shù)的優(yōu)化,從而得到了一個(gè)更精確的高光譜估計(jì)模式;國內(nèi)學(xué)者張瑤[1]等根據(jù)標(biāo)準(zhǔn)化頻譜指標(biāo)和偏最小二乘回歸,建立了土壤有機(jī)質(zhì)二維關(guān)聯(lián)分析和估計(jì)模式;學(xué)者崔玉露[2]等通過556 nm、1 642 nm和2 491 nm的頻譜信息,通過標(biāo)準(zhǔn)化頻譜指數(shù)轉(zhuǎn)換,得到了R2=0.829的最優(yōu)預(yù)測模式。
目前,許多學(xué)者對其進(jìn)行了深入探討,但大多數(shù)的模型都有一定的時(shí)間和空間上的限制,而且由于土壤類型和地理位置的不同,采用的模型也有很大的差別。用離散小波方法對876個(gè)澳大利亞的土壤樣品進(jìn)行了頻譜分析,建立了隨機(jī)樹(RF)、支持向量機(jī)(SVM)、神經(jīng)網(wǎng)絡(luò)(BPNN)等,其中SVM模型的預(yù)測準(zhǔn)確率最高;學(xué)者方臣[3]等采用 PLSR方法和SMLR方法,對美國的165個(gè)玉米表面樣品和697個(gè)樣品進(jìn)行了PLSR和 SMLR模型,對亞熱帶紅壤中的全 N進(jìn)行了分析,得到了較好的結(jié)果。過去,高光譜技術(shù)主要是以點(diǎn)對面為主,而對地塊地力的長期監(jiān)測則少有研究。
光譜數(shù)據(jù)的預(yù)處理方法分為兩個(gè)部分,分別是去噪和數(shù)據(jù)轉(zhuǎn)換。各種本源的反射率有很大的差別,并且有基線平移、傾斜等現(xiàn)象,這是由于土體的粒徑和裝填密度的不同而引起的。利用高光譜預(yù)處理技術(shù)可以有效地對高光譜中的噪聲進(jìn)行篩選,避免了數(shù)據(jù)的冗余,增強(qiáng)了模型的魯棒性。利用一次差分轉(zhuǎn)換技術(shù),可以有效地減弱土壤背景的干擾,增強(qiáng)波段之間的差別,增加了土壤中的某些波段反射率和土壤中營養(yǎng)成分之間的關(guān)系。采用11點(diǎn)光順法對測量環(huán)境、樣品研磨、篩選等因素進(jìn)行了平滑處理[2]。
為驗(yàn)證本文所建立的土壤全 N含量預(yù)測模型的準(zhǔn)確性,將15種預(yù)處理技術(shù)與頻譜指標(biāo)相結(jié)合,對土壤鹽分反演進(jìn)行了優(yōu)化。利用相關(guān)分析方法,對不同頻段的反射和土壤中的總氮含量進(jìn)行了分析,選擇420~444 nm、480~537 nm的相關(guān)系數(shù)為420~444 nm,480~537 nm。計(jì)算后的反射率與全氮含量之間的相關(guān)關(guān)系表明,MSASI的平均、極大值比其他三個(gè)指標(biāo)都要高。在此基礎(chǔ)上,選取了平均與極大值相結(jié)合的方法,選取了最終82個(gè)波長,并將其應(yīng)用于不同的頻譜參數(shù)。利用該模型建立了土壤全 N和特征波段的線性模型,并將其進(jìn)行了預(yù)處理,將測量結(jié)果作為參數(shù),利用IBM SPSS統(tǒng)計(jì)方法進(jìn)行了回歸分析。
反向傳播神經(jīng)網(wǎng)絡(luò)是一種分布式的處理數(shù)學(xué)模型,它能夠模擬大腦神經(jīng)的神經(jīng)活動,通常包含輸入層、隱含層和輸出層。將每個(gè)波長的響應(yīng)值輸入到輸入層,然后用神經(jīng)網(wǎng)絡(luò)求取其加權(quán)和,利用非線性函數(shù)求出被測濃度的估計(jì)值,然后輸出到輸出層。具體的,研究者可以通過反向神經(jīng)網(wǎng)絡(luò)模型對大量樣本進(jìn)行學(xué)習(xí),提取所有學(xué)習(xí)樣本關(guān)于氮含量的特征值,并建立相應(yīng)神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)。而后,當(dāng)輸入檢測樣本時(shí),通過預(yù)處理及歸一化等運(yùn)算操作,對其氮含量特征值進(jìn)行統(tǒng)計(jì)與比對。如果該特征值在神經(jīng)網(wǎng)絡(luò)置信區(qū)間內(nèi),將賦予該樣本約定的較高權(quán)重;若特征值不在置信區(qū)間,將賦予樣本較低權(quán)重。通過對多組樣本進(jìn)行運(yùn)算后,對測試樣本進(jìn)行加權(quán)和運(yùn)算,最后對估算值進(jìn)行估算,可利用模糊算法提升結(jié)果的魯棒性和準(zhǔn)確性。
偏最小二乘法(PLSR)是一種將多元線性回歸與最小二乘回歸相結(jié)合的方法。通過對所抽取的主分量進(jìn)行判定,判定自變量是否能夠顯著地改善估計(jì)性能,能夠解釋多個(gè)高光譜特征之間的相互關(guān)系,在剔除多余數(shù)據(jù)的情況下,保持最大貢獻(xiàn)率的數(shù)據(jù),有效地使用簡化信息構(gòu)建了預(yù)測模型。在進(jìn)行最小二乘分析前,將資料進(jìn)行主分量分解,以求出對因變量解釋力最大的綜合變項(xiàng),以改善主成分與因變量之間的關(guān)聯(lián)度,并克服多元相關(guān)所帶來的負(fù)面效應(yīng)。在主成分選擇1,2,3,6時(shí),R2值為0.22,0.32,0.37,0.69,最后用最大的6個(gè)主成分進(jìn)行最小二乘分析。
有國內(nèi)學(xué)者采用多元線性回歸模型、神經(jīng)網(wǎng)絡(luò)回歸模型、偏最小二乘法對62份樣品進(jìn)行了統(tǒng)計(jì),對其中31份樣品進(jìn)行了檢驗(yàn),并對82個(gè)特征頻帶進(jìn)行了檢驗(yàn)。選取確定系數(shù)R2、均方根誤差 RMSE(Root Mean SQUARE Error)、相對平均偏差 RPD(Relative Percent Deviation)以進(jìn)行最優(yōu)模型的篩選。R2愈大,RMSE愈小,則表示模式估計(jì)的準(zhǔn)確度越高,RPD>2則說明該模式的估計(jì)能力好,1.4< RPD<2時(shí),該模式的估計(jì)能力為中等,若 RPD<1.4,則說明該模式的估計(jì)能力及一致性都不 佳。
多變量線性回歸也稱為最小二乘,它利用最小二乘法來估算系數(shù)矩陣。在62個(gè)模型樣本中,使用多變量線性回歸(2)神經(jīng)網(wǎng)絡(luò)后向擴(kuò)散神經(jīng)網(wǎng)絡(luò)(BPNN)是一種分布式的處理數(shù)學(xué)模型,其主要內(nèi)容有輸入層、隱含層和輸出層。將每個(gè)波長的響應(yīng)值輸入到輸入層,然后用神經(jīng)網(wǎng)絡(luò)求取其加權(quán)和,然后利用非線性函數(shù)求出被測濃度的估計(jì)值,最后輸出到輸出層??蛇x擇Logsig函數(shù)作為神經(jīng)網(wǎng)絡(luò)模型的非線性函數(shù)。光譜數(shù)據(jù)集是輸入層,在滿足訓(xùn)練精度的條件下,網(wǎng)絡(luò)將會持續(xù)地進(jìn)行網(wǎng)絡(luò)測試,直到網(wǎng)絡(luò)達(dá)到一定的測試精度才能被確定為一個(gè)模型。
由于色譜中包含C-H、N-H、O-H等基團(tuán)的有機(jī)物質(zhì),故常被用在有機(jī)物質(zhì)中。由于土壤中的 N元素以有機(jī)結(jié)合態(tài)為主,與有機(jī)質(zhì)的關(guān)系非常密切,因此,它的靈敏波段分布范圍與上述規(guī)律相符,可以利用高光譜技術(shù)對其進(jìn)行快速分析。通過對350~540 nm、670~920 nm范圍內(nèi)的光譜反射率進(jìn)行了初步的模擬,一階差分譜與土壤總氮有良好的相關(guān)性。本研究采用420~444,480~537,618~626,801~804,1 248~1 249,1 322,1 410~1 412,1 566~1 568 nm等,從數(shù)理統(tǒng)計(jì)的觀點(diǎn)來看,相關(guān)系數(shù)越高,這個(gè)波段選擇的價(jià)值就越大,對后續(xù)的建模工作也就越有利。選擇了相關(guān)系數(shù)大于0.4的連續(xù)頻段,與崔玉露等人的結(jié)論類似。土壤中的全 N含量反射率受區(qū)域和土壤類型的顯著影響,而太湖桃園黃棕壤的土壤中鐵錳含量高、錳含量高。崔玉露等人的研究發(fā)現(xiàn),在可見光頻段,大部分的土壤吸收特性都與鐵氧化物有關(guān)。學(xué)者方臣等的結(jié)果也表明,在300~580 nm的區(qū)域,鐵譜響應(yīng)較高,鐵譜帶的近紅外區(qū)可以達(dá)到1 300 nm。
高光譜數(shù)據(jù)的光譜信噪比低,光譜信息與被測特征之間的線性不相關(guān),且光譜間的多重相關(guān)性很強(qiáng),光譜易受外界環(huán)境的影響。所以,必須進(jìn)行特征波長的選取,也就是最好的建模參數(shù)組合,以獲得最小誤差和最精確的估計(jì)模式。本論文在選擇敏感頻段的基礎(chǔ)上,對復(fù)雜數(shù)據(jù)進(jìn)行有效剔除,并對其進(jìn)行有效提取,以最大程度地保持特征頻帶,避免了冗余數(shù)據(jù)對操作的負(fù)擔(dān)。通過對土壤全 N的頻譜響應(yīng)特性和相關(guān)關(guān)系,對不同類型的土壤全N進(jìn)行了頻譜轉(zhuǎn)換,利用三種模型建立了相應(yīng)的數(shù)學(xué)模型。
5.2.1 模式法的缺點(diǎn)和優(yōu)點(diǎn)
利用最小二乘法進(jìn)行多因素線性回歸,可以有效地減少有效信息的丟失。偏最小二乘法是將主分量分析引入最小二乘回歸,以便于數(shù)據(jù)的降維,但二者都存在著不能處理非線性關(guān)系的缺點(diǎn),而神經(jīng)網(wǎng)絡(luò)模型可以通過三個(gè)層次的訓(xùn)練來提高數(shù)據(jù)的準(zhǔn)確率。在本論文中,樣本的數(shù)量很少,使得模型的處理能力和冗余度不能得到很好地利用。
5.2.2 模型的精度和有效性
在偏最小二乘法回歸中,RMSE值仍需進(jìn)一步改善。因此,雖然這些模型的估計(jì)結(jié)果都很好,但是仍有一些不足之處需要在以后的研究中加以修正。在建立BPNN模型的過程中,輸入神經(jīng)元的數(shù)量越多,模型的性能越好,網(wǎng)絡(luò)神經(jīng)算法就越復(fù)雜。在玉米生長季,R2值較大,RMSE值偏小,這與選擇的敏感性頻段相關(guān)。玉米季的9個(gè)敏感頻帶比小麥的季節(jié)敏感區(qū)要多,因此在分析時(shí)可以獲得更多的資料。雖然BPNN的樣本數(shù)目很小,但是BPNN的模型準(zhǔn)確率與張瑤等人的結(jié)果是一樣的。
這三種模型在不同地區(qū)的應(yīng)用效果都比較理想,可以為土壤全 N的快速、準(zhǔn)確診斷提供依據(jù),為精確的農(nóng)業(yè)生產(chǎn)和有效的土地利用提供技術(shù)支撐。另外,可利用衛(wèi)星遙感圖像等資料,對土壤營養(yǎng)狀況進(jìn)行動態(tài)監(jiān)控和反饋。
5.3.1 影響高光譜反射率的幾個(gè)因素
在實(shí)際建模過程中會出現(xiàn)大量的異常樣品,大致可以劃分為高光譜測定的異常和化學(xué)測試的異常。導(dǎo)致這些異常的原因有:由環(huán)境造成的異常光譜,例如儀器檢測器的背景變化、樣品的溫度、濕度的大幅變化,儀器本身的不穩(wěn)定以及個(gè)別零件的老化;還有樣品本身造成的光譜異常,例如質(zhì)地不均勻,水分控制不嚴(yán)格;由于基本數(shù)據(jù)造成的樣品異常,如當(dāng)使用錯(cuò)誤的參考方法或樣品混雜時(shí),則會造成樣品與樣品的近紅外光譜不相符。
5.3.2 高光譜和反應(yīng)的研究
有研究結(jié)果表明,同齡夏玉米與冬小麥的光譜反射率存在較大的差異,在236天的生長期內(nèi),玉米秸稈的腐化程度已趨于穩(wěn)定,脂肪性降低,羧基含量升高。由于秸稈不斷分解,殘?jiān)惺O碌拇蟛糠质菃螌?、木素,具有較好的穩(wěn)定性,不易降解,腐爛的時(shí)間也較長。但玉米生長期為90天,在收獲期間,麥稈分解速率達(dá)到48.88%-59.95%,且秸稈中易于降解的物質(zhì)如淀粉、蔗糖、有機(jī)酸等具有豐富的碳源和能量。
作物秸稈與玉米不同季節(jié)土壤樣品之間的高光譜反射率有一定的差別,通過對其機(jī)制的探討,結(jié)果表明:玉米季節(jié)的土壤樣品之間的 IR譜也有很大的差別。因?yàn)樵诟倪^程中,各基質(zhì)成分和含量會有一定的損失。因此,小麥秸稈的活性會對土壤的紅外反應(yīng)產(chǎn)生一定的影響。土壤顯微組織學(xué)的研究表明,小麥生長季節(jié)的土壤中存在著大量不均勻的、破碎的顆粒,這是由于玉米秸稈的腐朽程度比較高,已經(jīng)完全分解,只剩下木質(zhì)素、纖維素、單寧等造成的。就農(nóng)作物秸稈自身來說,其易降解的水溶性物質(zhì)、粗蛋白含量高,但不易降解的纖維素、木質(zhì)素含量低;在1 969、2 377、2 215 nm的高光譜范圍內(nèi),不同作物的土壤表現(xiàn)出了明顯的差異。有研究表明,在1 710 nm、2 100 nm和2 350 nm處反射率與半纖維素、纖維素、木質(zhì)素含量有很大關(guān)系。學(xué)者方臣發(fā)現(xiàn),在2 100-2 300 nm的農(nóng)作物殘?jiān)?,木質(zhì)素和纖維素含量顯著,而在2 100~2 300 nm時(shí),玉米秸稈的反射比在2 100~2 300 nm時(shí)表現(xiàn)得更好,表明小麥秸稈中纖維素和木質(zhì)素含量更高。
另外,小麥、玉米期土壤高光譜反射率存在較大差異的原因之一是作物的生長時(shí)期。小麥在每年的五月收割,玉米一般在九月末到十月上旬收割,而本地的雨水則以六月到九月(一年中75%)為主。土壤濕度較高,對小麥和稻草的分解效果較好,所以九月的土壤的反射性與六月份不同。土壤成分和水文資源的整體差異很有可能是導(dǎo)致小麥、玉米不同季節(jié)土壤高光譜反射率存在差異的一個(gè)重要原因,這也為季節(jié)性資料的建立奠定了基礎(chǔ)。長期固定施肥方式對土壤的總氮水平無明顯影響,但在收獲階段,其反射譜反應(yīng)存在差異。試驗(yàn)區(qū)采用了稻草還田,前一季的秸稈直接用于土壤。由于不同作物的秸稈成分和腐熟期的氣候存在很大的差別,因此,在討論的輪作系統(tǒng)中需要按作物類型對資料進(jìn)行分類。