馮 凱,劉昌華,彭詞清
(1.河南理工大學(xué) 測繪工程學(xué)院,河南 焦作 454150;2.廣東省嶺南綜合勘察設(shè)計院,廣東 廣州 510000)
森林作為林業(yè)產(chǎn)業(yè)基礎(chǔ)與生態(tài)系統(tǒng)主體,是地球上最大、最重要的陸地生態(tài)系統(tǒng)。它是地球上的碳儲庫、能源庫、蓄水庫和基因庫,在全球生態(tài)系統(tǒng)平衡中發(fā)揮著重要作用,是人類和多種物種賴以生存和發(fā)展的基礎(chǔ),其數(shù)量與質(zhì)量是決定森林經(jīng)濟效益與生態(tài)系統(tǒng)服務(wù)功能的關(guān)鍵[1]。為了及時準確地掌握國家森林資源狀況,我國通過系統(tǒng)抽樣方法進行了每5年一次的森林資源連續(xù)清查(一類調(diào)查)、每10年1次的森林資源規(guī)劃設(shè)計調(diào)查(二類調(diào)查)以及作業(yè)設(shè)計調(diào)查(三類調(diào)查)等獲取森林資源數(shù)量現(xiàn)狀。[2]森林資源檢測不管是從生態(tài)角度考慮還是從林產(chǎn)品的角度看,傳統(tǒng)的檢測周期過長已經(jīng)無法滿足實際需求,為此,許多國家如美國,奧地利、芬蘭、法國、瑞典等從二十世紀90年代開始實施森林資源年度監(jiān)測(annual forest invenotyr)項目[3]。國外對于森林蓄積量的研究更傾向于應(yīng)用雷達數(shù)據(jù)進行反演建模,這種方法很有針對性,但是反演回歸的普適性不高[4]。隨著遙感技術(shù)的發(fā)展,基于遙感影像與少量樣地數(shù)據(jù)的森林蓄積量估測方法得到國內(nèi)外學(xué)者的廣泛研究如何提高森林蓄積量估測模型的準確度已經(jīng)成為林業(yè)遙感新的研究熱點[5]。在神經(jīng)網(wǎng)絡(luò)模型中,閾值和權(quán)值對于網(wǎng)絡(luò)的的準確性有重要的影響,基于此,選擇POS算法與神經(jīng)網(wǎng)絡(luò)結(jié)合的模型,粒子群算法(簡稱POS)主要是通過粒子的不斷迭代來找到粒子的最優(yōu)速度和位置,從而最后找到粒子的最優(yōu)解[6]。在POS算法中,每一個粒子代表神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,通過粒子尋優(yōu)找到網(wǎng)絡(luò)最佳的權(quán)值和閾值。POS算法和神經(jīng)網(wǎng)絡(luò)相結(jié)合可以實現(xiàn)對一個復(fù)雜問題的擬合,得到更加精確的模型。經(jīng)過POS算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)優(yōu)化初始權(quán)值和閾值,使神經(jīng)網(wǎng)絡(luò)得到的模型更加精確,通過神經(jīng)網(wǎng)絡(luò)得出的網(wǎng)絡(luò)參數(shù),為研究區(qū)的蓄積量調(diào)查提供參考,倘若擬合度達到要求精度則可以減少外業(yè)調(diào)查工作量。經(jīng)過查閱相關(guān)資料,選擇landset8系列數(shù)據(jù)進行神經(jīng)網(wǎng)絡(luò)反演的相關(guān)內(nèi)容相對較少,因此,通過將光譜指數(shù)和立地因子作為特征變量,一優(yōu)化的神經(jīng)網(wǎng)絡(luò)模型為建模方式,建立特征變量和森林蓄積量的反演模型,對南雄市森林蓄積量的研究提供幫助,為林區(qū)經(jīng)營活動提供理論依據(jù)。
數(shù)據(jù)來源于第四次森林資源二類調(diào)查數(shù)據(jù),研究區(qū)為廣東省韶關(guān)市南雄市,調(diào)查內(nèi)容涉及面積,公頃蓄積,胸徑等。因為二類調(diào)查持續(xù)時間長,因此本研究選擇的遙感數(shù)據(jù)是在地理空間數(shù)據(jù)云下載的2016年的landset 8 OLI數(shù)據(jù)。landset 8 OLI共有11個波段,1~7、9波段為多光譜波段(30 m分辨率),8為全色波段(15 m分辨率),10和11為熱紅外傳感器波段(30 m分辨率)。30 m×30 m的DEM用于提取高程,坡度等信息。
南雄市位于廣東省東部,1996年撤縣設(shè)市,市境位于東經(jīng)113°55′3″~114°44′38″,北緯24°56′59″~25°25′20″,南北兩面群山連綿,中部丘陵沿湞江伸展,形成一狹長盆地,全省面積2 361.4 km2,17個鎮(zhèn),1個街道,24個居委會,208個村委會,人口46萬。亞熱帶季風(fēng)濕潤氣候,森林覆蓋率達63.4%,活立木蓄積量580萬m3。
選取2016年12月份的Landset 8 OLI影像數(shù)據(jù),選取Landset 8 OLI的原因有兩方面:其一landset系列衛(wèi)星的所有數(shù)據(jù)都可以非常方便地免費從網(wǎng)上獲取,對于可用經(jīng)費較少的林業(yè)調(diào)查而言非常合適;其二是光譜分辨率較高,特別是在植被探測的紅外波段具有大量的數(shù)據(jù),非常適合森林的各種分析[7]。為了避免因為云量過多造成不必要的影響,在數(shù)據(jù)下載中篩選出云量低于0.5的影像,從中篩選出連續(xù)的覆蓋研究區(qū)的影像,影像由四幅組成,得到的原始圖像經(jīng)過輻射定標,大氣校正,幾何校正。
輻射定標:是用戶需要計算地物的光譜反射率或光譜輻射亮度時,或者需要對不同時間、不同傳感器獲取的圖像進行比較時,都必須將圖像的亮度灰度值轉(zhuǎn)換為絕對的輻射亮度,這個過程就是輻射定標。國際地球觀測衛(wèi)星委員會將定標定義為:定量的確定系統(tǒng)對已知的、可控制的信號輸入響應(yīng)的過程[8]。遙感系統(tǒng)需要定標的主要內(nèi)容是對其電磁輻射的響應(yīng)與光譜響應(yīng),輻射響應(yīng)等的函數(shù)關(guān)系。對Landsat OLI 的輻射定標可以通過 ENVI 5.2 中輻射定標功能完成。
大氣校正:為了消除或減弱大氣中氣溶膠,云層及其陰影等的影響得到精確的地表反射率,需要進行大氣校正。
幾何校正由行政矢量邊界為矯正依據(jù)。
表1是大氣校正基本參數(shù)。
表1 大氣校正基本參數(shù)
下面為矯正前后植物波譜的變化以及校正后影像全貌:
圖1 大氣校正前后植被波譜曲線
從圖中可看出,校正后在1.5 μm處的走向更加符合植物波譜曲線的走勢,且總體走勢也符合植物波普曲線的走勢,因此可以認為,校正后的影像是正確的。最終得到的南雄市的影像如圖2所示。
圖2 南雄市遙感影像
林業(yè)二類調(diào)查將調(diào)查區(qū)分為若干個小的區(qū)域,區(qū)域劃分一般按相同樹種,同一行政區(qū),同一類地貌等原則劃分,因此劃分的區(qū)域都有相同的地類地貌,相同的優(yōu)勢樹種便于調(diào)查記錄,劃分的區(qū)域稱為小班,小班為調(diào)查的基本單位。
2.2.1 要素處理
基于預(yù)處理得到的影像,需要提取其中所需的變量因子用于模型建立,提取的依據(jù)是森林二類調(diào)查得到的小班shape文件,小班數(shù)據(jù)布設(shè)滿足受干擾少,遠離林緣等原則,分別用GPS記錄樣地點的樣本點,樣本點滿足具有代表性原則。蓄積量分布圖如圖3所示。
圖3 蓄積量分布圖
2.2.2 數(shù)據(jù)規(guī)范化
因為數(shù)量級的關(guān)系,影響模型的擬合效果和結(jié)果分析。因此對特征變量和蓄積量進行規(guī)范化處理,規(guī)范化在matlab2016年中進行,歸一化用mapminmax函數(shù)。
2.2.3 數(shù)據(jù)完整性
外業(yè)調(diào)查中,有些幼林以及某些地類由森林用地變?yōu)槠渌仡?,所以蓄積量為空或者0,為了滿足數(shù)據(jù)的完整性要求,應(yīng)用excel中對數(shù)據(jù)的篩選操作,對于一些數(shù)據(jù)缺失的值進行篩選淘汰。
3.1 光譜指數(shù)是通過特定的波段進行線性或非線性組合得到的一種光譜參數(shù),建立時考慮了部分植物內(nèi)部的理化機制[9]。對于圖像的處理在Arcgis和ENVI中進行,獲得了校正后的南雄遙感圖像,對應(yīng)小班的NDVI,以及波段信息等,同時經(jīng)過計算,得到比值指數(shù)以及差值指數(shù)。從調(diào)查表獲得坡度,坡向,海拔,樹齡,郁閉度,地貌,A層土壤層厚度(當有AB層時應(yīng)為(A+AB)/2),腐殖質(zhì)厚度,影響因分為立地因子,遙感因子。對于數(shù)據(jù)的分析相關(guān)性分析在SPSS中實現(xiàn),POS算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)模型在Matlab2016a中實現(xiàn)。DEM如圖4所示。
圖4 DEM圖
為充分模擬地表情況,可在DEM的表面覆蓋上遙感影像[10]。通過將得到的數(shù)據(jù)的高程信息疊加在landset8影像上進行皮膚覆蓋,將波段組合設(shè)置為真彩色,為了處理單位的影響,設(shè)置拉伸比例系數(shù),最終得到原始影像的3D表現(xiàn)形式。下圖為得到的DEM影像的高程通過ArcSense處理與原始遙感影像結(jié)合并且三維顯示的圖像如圖5所示。
圖5 研究區(qū)三維顯示
3.2 首先通過相關(guān)性分析各因子與蓄積量關(guān)系的置信程度,選取置信度為‘*’及以上的因子參與建模:通過雙變量相關(guān)性皮爾森雙尾檢驗,變量因子與公頃蓄積之間線性相關(guān)關(guān)系不強說明自變量與因變量之間具有強非線性關(guān)系。
3.3 為了解決自變量因子之間的相關(guān)性影響分析結(jié)果,對自變量因子進行逐步回歸法剔除具有顯著相關(guān)性的因子。最終指標選擇腐殖質(zhì)厚度,齡組,郁閉度,平均年齡,NDVI,b4,坡度7個自變量構(gòu)建線性回歸模型。
最后得到的反演模型如下:
V=0.263X1+0.048X2-0.266X3+0.419X4-0.206X5-1.654X6-0.05X7+0.095
(1)
式中,X1,X2,X3,X4,X5分別代表腐殖質(zhì)厚度,齡組,郁閉度,平均年齡,NDVI,b4,坡度7個自變量,V為蓄積量,表2是相關(guān)系數(shù),從中可以得到模型的擬合度信息。
表2 反演結(jié)果
為了直觀看出模型的擬合度,使用未歸一化的數(shù)據(jù)制作的蓄積量的預(yù)測值和原始蓄積量之間的差值圖像如圖6所示。
圖6 預(yù)測值實際值差值
從線性回歸結(jié)果來看,預(yù)測值與真實值之間還有一定的差距且兩者之間的差值沒有明顯的規(guī)律,但是基本上穩(wěn)定在15左右,誤差在蓄積量很大的森林中影響不大,但在年份不高,蓄積量偏低的地區(qū)模型還需要優(yōu)化。
神經(jīng)網(wǎng)絡(luò)的構(gòu)建:首先將樣本分為兩部分,一部分用于模型的訓(xùn)練,另一部分精度驗證,訓(xùn)練樣本的容量越大,訓(xùn)練的精度越高。訓(xùn)練以及擬合得到的散點圖,如圖7所示。
圖中training對相應(yīng)的表為訓(xùn)練樣本得到的散點圖,test為驗證精度得到的散點圖,從圖中可看出,訓(xùn)練精度高于驗證精度,對于原始樣本的擬合精度達到0.812,應(yīng)用訓(xùn)練后的模型,得到驗證樣本的擬合度,精度達到0.700,總體精度達到0.785。
圖7 (BP神經(jīng)網(wǎng)絡(luò)結(jié)果)
從精度上來看。神經(jīng)網(wǎng)絡(luò)的擬合精度高于逐步回歸模型精度,但逐步回歸分析剔除了很多有相關(guān)性的因子,而神經(jīng)網(wǎng)絡(luò)是對原始樣本的擬合。
(1)對蓄積量的反演圖像預(yù)處理,外業(yè)數(shù)據(jù)的獲取精度以及反演模型的選擇是提升建模精度的關(guān)鍵手段,不同建模方法的建模精度有所差異。對比本文兩種反演方法整體上相關(guān)性基本趨于一致。由于這些森林參數(shù)受氣候,地形,種植密度等因素的影響對蓄積量的估計產(chǎn)生偏差,研究中使用的各項指數(shù)對于該地區(qū)蓄積量的估測可給予指導(dǎo),對外業(yè)工作也有指導(dǎo)作用。
(2)對比相關(guān)系數(shù)來看,多元線性回歸相關(guān)系數(shù)為0.714,神經(jīng)網(wǎng)絡(luò)的相關(guān)系數(shù)為0.785,因此相關(guān)系數(shù)關(guān)系為神經(jīng)網(wǎng)絡(luò)>多元線性回歸,其次,神經(jīng)網(wǎng)絡(luò)對于數(shù)據(jù)量的要求很大,這正好滿足森林調(diào)查數(shù)據(jù)的特性,綜合考慮,機器學(xué)系中的神經(jīng)網(wǎng)絡(luò)對于蓄積量的反演有更好的效果。兩種建模方法對比,神經(jīng)網(wǎng)絡(luò)優(yōu)于逐步回歸。多元線性的逐步回歸建模方法雖然可以快速建模,特別適用于所要建模的關(guān)系不是特別復(fù)雜并且數(shù)據(jù)量不大,易于解決數(shù)據(jù)變量之間的重相關(guān)性等問題,但也會損失部分有效信息,對于非線性數(shù)據(jù)進行回歸設(shè)計可能比較困難,在建立線性回歸模型解決非線性問題時表現(xiàn)能力較弱。神經(jīng)網(wǎng)絡(luò)建模方法需要大量數(shù)據(jù)樣本的支持,但是從訓(xùn)練精度上來看其精度R可達到0.812,且林業(yè)數(shù)據(jù)的樣本容量很大,很適合神經(jīng)網(wǎng)絡(luò)的反演要求,因此在大面積多樣本的蓄積量反演中,神經(jīng)網(wǎng)絡(luò)有明顯的優(yōu)勢,因此實際應(yīng)用中可更好的為未來蓄積量的精確估計提供實時高效的技術(shù)服務(wù)。
(3)經(jīng)過后期分析發(fā)現(xiàn),平均蓄積量在70~80之間的樣地信息對于模型的擬合度更高。
(4)對于特定林場的蓄積量估計可以結(jié)合準確的樹木類型以及年齡信息建立樹木生長模型同時結(jié)合神經(jīng)網(wǎng)絡(luò)反演模型可以得到更加準確的蓄積量信息。