陳哲華 楊超裕 鄧冬旺 李志華
(1.廣東省林業(yè)調(diào)查規(guī)劃院,廣東 廣州 510520;2.湖南省農(nóng)林工業(yè)勘察設(shè)計研究總院,湖南 長沙 410007)
廣東省森林覆蓋率的影響因素分析和模型預(yù)測
——基于灰色關(guān)聯(lián)分析和GM(1,1)模型*
陳哲華1楊超裕1鄧冬旺1李志華2
(1.廣東省林業(yè)調(diào)查規(guī)劃院,廣東 廣州 510520;2.湖南省農(nóng)林工業(yè)勘察設(shè)計研究總院,湖南 長沙 410007)
基于2005—2015年廣東省森林覆蓋率的原始數(shù)據(jù),選取年平均氣溫、降水量、年日照時數(shù)、有林地面積、活立木蓄積量、林業(yè)產(chǎn)值、造林面積及育苗面積8個指標(biāo)對森林覆蓋率的影響要素進行灰色關(guān)聯(lián)度分析。分析結(jié)果顯示,關(guān)聯(lián)度最大的3項因素依次是:有林地面積0.993 4、年平均氣溫0.992 1、年降水量0.973 2。為驗證森林覆蓋率灰色系統(tǒng)預(yù)測模型的適用性性,根據(jù)2005—2010年的森林覆蓋率數(shù)據(jù),分別建立GM(1,1)模型、多項式回歸模型和Logistic回歸模型,對2011—2016年的森林覆蓋率進行預(yù)測,并與實際值進行比較,3個模型的預(yù)測相對誤差平均值依次是0.69%、1.08%、1.28%。結(jié)果表明在獲取的年份數(shù)據(jù)較少時,采用灰色系統(tǒng)森林覆蓋率預(yù)測模型精度高于多項式回歸模型和Logistic回歸模型,預(yù)測適用性更優(yōu)。
森林覆蓋率;灰色關(guān)聯(lián)度;灰色系統(tǒng);GM(1,1)模型;多項式回歸模型;Logistic回歸模型
森林資源是生態(tài)文明建設(shè)的物質(zhì)基礎(chǔ),是社會經(jīng)濟持續(xù)發(fā)展的前提和保證。保護和管理好森林資源,對于發(fā)展現(xiàn)代林業(yè)、推進生態(tài)文明建設(shè)、促進經(jīng)濟社會可持續(xù)發(fā)展和構(gòu)建和諧社會均具有十分重要的意義。《廣東省林業(yè)廳關(guān)于2015年度全省森林資源情況的通報》顯示,至2015年底,廣東省林業(yè)用地面積1 095.89萬hm2,森林蓄積量達5.61億m3,森林覆蓋率達58.88%。森林覆蓋率是森林資源豐富程度及實現(xiàn)綠化程度的重要指標(biāo),還是確定森林經(jīng)營規(guī)劃和實施開發(fā)利用政策的重要依據(jù)。森林覆蓋率的消長變化與年平均氣溫、年降水量、年日照時數(shù)、有林地面積、活立木蓄積量、林業(yè)產(chǎn)值、造林面積及育苗面積等因素有關(guān)。這些因素對森林覆蓋率變化影響大小不同,在系統(tǒng)分析時需要確定各因素的“貢獻率”大小。
當(dāng)前我國對森林資源趨勢的灰色預(yù)測取得了一定的成果,研究區(qū)域主要集中在東北三省[1-3]及華南地區(qū)的幾個省份[4-7]。然而,運用灰色關(guān)聯(lián)度分析及GM(1,1)模型對廣東省的森林覆蓋率進行影響因素分析和預(yù)測的文獻卻很少。本文運用灰色系統(tǒng)理論中灰色關(guān)聯(lián)度分析得出森林覆蓋率的主要影響因素,比較不同影響因素與森林覆蓋率之間的關(guān)聯(lián)程度;并建立森林覆蓋率灰色系統(tǒng)的預(yù)測模型,與多項式擬合模型和Logistic回歸模型的預(yù)測適用性進行比較,為森林資源的科學(xué)預(yù)測提供參考。
廣東省地處中國大陸最南部,東鄰福建省,北接江西省、湖南省,西連廣西壯族自治區(qū),南臨南海,珠江口東西兩側(cè)分別與香港特別行政區(qū)、澳門特別行政區(qū)接壤,西南部雷州半島隔瓊州海峽與海南省相望。全境位于 20°09′~25°31′ N 和109°45′~117°20′ E 之間。根據(jù) 2015 年度土地變更調(diào)查,全省陸地面積為1 797萬hm2,約占全國陸地面積的1.87%,在各省陸地面積排名第15位。
廣東省光、熱、水資源豐富,四季常青,植物種類繁多,全省有維管束植物289科、2 051屬、7 717種,其中野生植物 6 135種,栽培植物 1 582種。植被類型中,有屬于地帶性植被的北熱帶季雨林、南亞熱帶季風(fēng)常綠闊葉林、中亞熱帶典型常綠闊葉林和沿海的熱帶紅樹林,還有非緯度地帶性的常綠—落葉闊葉混交林、常綠針—闊葉混交林、常綠針葉林、竹林、灌叢和草坡[8]。
1.2.1 灰色關(guān)聯(lián)度分析模型 關(guān)聯(lián)度是表征兩個事物的關(guān)聯(lián)程度,關(guān)聯(lián)度分析是灰色系統(tǒng)分析、評價和決策的基礎(chǔ)?;疑P(guān)聯(lián)度分析是多因素統(tǒng)計分析方法,用灰色關(guān)聯(lián)度來描述因素間關(guān)系的強弱、大小和次序[9]。如果兩種要素變化的態(tài)勢基本一致,則他們之間的關(guān)聯(lián)度較大,反之,關(guān)聯(lián)度較小。分析步驟如下。
(1)確定參考序列 本文選取森林覆蓋率為參考數(shù)列,其他要素為比較數(shù)列。參考數(shù)列常記為X0,一般表示為:
(2)對于一個參考數(shù)列X0和比較數(shù)列Xi,可用下述關(guān)系表示各比較曲線與參考曲線各點的差:
式中,ζi(k)為比較數(shù)列Xi對參考數(shù)列X0在k時刻的關(guān)聯(lián)系數(shù),其中ρ∈[0,+∞)為分辨系數(shù),引入分辨系數(shù)的目的在于減少極值對計算的影響。一般ρ的取值區(qū)間為[0,1],具體取值可視情況而定,ρ越小,分辨力越大,本文取ρ=0.5。
(3)原始數(shù)據(jù)處理 各因素原始數(shù)據(jù)存在量綱和數(shù)量級的差距,通過無量綱化處理,便于不同要素序列的比較。
(4)關(guān)聯(lián)度的計算和比較 關(guān)聯(lián)系數(shù)只表示各時刻數(shù)據(jù)間的關(guān)聯(lián)程度,為了便于比較,取各個時刻關(guān)聯(lián)系數(shù)的平均作為關(guān)聯(lián)度,對問題進行因素分析和比較。
1.2.2 灰色系統(tǒng)GM(1,1)模型 灰色系統(tǒng)理論以部分信息已知、信息未知的小數(shù)據(jù)、貧信息不確定性系統(tǒng)為研究對象,通過對部分已知信息的生成、開發(fā),提取有價值的信息,實現(xiàn)對系統(tǒng)運行行為、演化規(guī)律的正確描述,進而實現(xiàn)對其變化的定量預(yù)測[10]?;诨疑到y(tǒng)對原始數(shù)據(jù)連續(xù)度和規(guī)律性要求不高,適合森林覆蓋率數(shù)據(jù)量較少時用來建立預(yù)測模型。其中灰色系統(tǒng)GM(1,1)模型反映的是一個變量對時間的一階微分函數(shù),其相應(yīng)的微分方程為:
式中x(1)為經(jīng)過一次累加生成的數(shù)列;t為時間;a,u為待估參數(shù),分別稱為發(fā)展灰數(shù)和內(nèi)生控制灰數(shù)。
(1)建立一次累加生成數(shù)列 設(shè)原始數(shù)列為:
按下述方法做一次累加,得到生成數(shù)列(n為樣本空間):
(2)利用最小二乘法求參數(shù)a、u。設(shè)
參數(shù)辨識a、u:
(3)求出GM(1,1)的模型:
1.2.3 多項式回歸模型和Logistic回歸模型 為了體現(xiàn)GM(1,1)模型在預(yù)測森林覆蓋率時的適用性,考慮加入多項式回歸模型和Logistic回歸模型進行比較分析。
(1)多項式回歸模型 當(dāng)兩個變量呈曲線關(guān)系式,需用曲線來擬合確定變量間的數(shù)學(xué)關(guān)系[11]。采用多項式回歸模型預(yù)測時,就是建立森林覆蓋率與年度的函數(shù)關(guān)系:
式中x、y為變量;a、b為參數(shù);p為多項式階次。根據(jù)2005—2010年的森林覆蓋率數(shù)據(jù),利用最小二乘法求出上式中的各項參數(shù),從而建立多項式回歸方程,對2011—2016年的森林覆蓋率進行預(yù)測。
(2)Logistic回歸模型 Logistic回歸模型是廣義線性回歸模型中的一種,因此與多重線性回歸分析有很多相同之處,它們的原理相同,模型形式基本相同,因此設(shè)置Logistic函數(shù):
yi=a×exp{[ln(xi)-b]2/c},i=1,2,…,n ,式中x、y為變量;a、b、c為參數(shù)。
基于數(shù)據(jù)的可獲得性和完整性,遵循設(shè)計指標(biāo)的科學(xué)性原則、可操作性原則,結(jié)合廣東省實際,本文選取年平均氣溫、年降水量、年日照時數(shù)、有林地面積、活立木蓄積量、林業(yè)產(chǎn)值、造林面積及育苗面積作為灰色分析指標(biāo)。指標(biāo)數(shù)據(jù)來自2006—2016年的《廣東省農(nóng)村統(tǒng)計年鑒》[12]、《廣東統(tǒng)計年鑒》[13]的相關(guān)數(shù)據(jù),統(tǒng)計數(shù)據(jù)見表1。
表1 2005-2015年廣東省森林覆蓋率的灰色分析原始數(shù)據(jù)
續(xù)表1
經(jīng)過計算得到森林覆蓋率和8個因素的關(guān)聯(lián)結(jié)果(表2),從關(guān)聯(lián)度大小可知,8個因素中對廣東省2005—2015年森林覆蓋率影響關(guān)系最大的是有林地面積,其次是年平均氣溫、年降水量、年日照時數(shù)。
表2 2005-2015年廣東省森林覆蓋率與影響要素的關(guān)聯(lián)度
林地資源是森林賴以生存和發(fā)展的基礎(chǔ),森林覆蓋率反映一個國家或地區(qū)森林面積占有情況或森林資源豐富程度及實現(xiàn)綠化程度的指標(biāo)。有林地面積即森林面積,森林覆蓋率是森林面積占土地面積的百分比,因此在土地面積不變的情況下,有林地面積直接決定了森林覆蓋率的大小。其次,廣東省地處我國南部,屬亞熱帶季風(fēng)氣候區(qū),陸地自南至北橫跨北熱帶,南亞熱帶和中亞熱帶。熱量資源豐富,氣候溫暖,各地年平均溫度在20.4~23.1 ℃之間;全年日照為 1 500~2 100 h;雨量充沛,年降水量在 1 500~2 500 mm 之間。廣東省的氣候特點使這里成為全國光、熱、水資源最豐富的地區(qū),涵養(yǎng)了森林資源,有利于林木的生長。因此,年平均氣溫、年降水量、年日照時數(shù)也是影響森林覆蓋率的主要因素,水熱條件的綜合作用,使得境內(nèi)植被呈典型的水平地帶性分布:北部南嶺地區(qū)的典型植被為亞熱帶山地常綠闊葉林,中部為亞熱帶常綠季雨林,南部為熱帶常綠季雨林。另一方面,當(dāng)年的林業(yè)產(chǎn)值、造林面積與森林覆蓋率的關(guān)聯(lián)度則相對較小,從實際分析,由于早年對林業(yè)產(chǎn)業(yè)的投入不足以及對植樹造林的意識薄弱,導(dǎo)致這兩個指標(biāo)值在2005—2009年間較低,與2011年后的指標(biāo)值有較大的差異;從理論上分析,統(tǒng)計森林覆蓋率是指郁閉度0.2以上的喬木林地面積和竹林地面積,一般情況下當(dāng)年造林尚未成林,不計入森林覆蓋率計算,因此造林面積對森林覆蓋率影響較小。
為了進一步驗證森林覆蓋率灰色系統(tǒng)預(yù)測模型的可行性,本文取2005—2010年的森林覆蓋率數(shù)據(jù)作為樣本,預(yù)測2011—2016年的森林覆蓋率,并與實測值進行比較,評價預(yù)測模型效果。建立GM(1,1)模型,根據(jù)前面公式計算得到模型中的發(fā)展灰數(shù)a=-0.0046,內(nèi)生控制灰數(shù)u=55.5364。-a<0.3,模型可用于中長期預(yù)測。計算得到模擬還原值,分別計算其與實際森林覆蓋率的殘差,計算結(jié)果見表3。相對誤差取絕對值后計算得到平均相對誤差為0.11%,精度較高。
表3 森林覆蓋率實際值與模擬值殘差
對GM(1,1)模型進行后驗差精度檢驗。在檢驗過程中,要求后驗差比值越小越好,一般要求≤0.45,最大不超過0.65;小誤差頻率要大,一般不得小于0.7[14],標(biāo)準(zhǔn)參照表4。
表4 后驗差精度標(biāo)準(zhǔn)
根據(jù)公式:
可知GM(1,1)建模的殘差較小,預(yù)測精度較高并通過均方差比值檢驗和小誤差頻率檢驗,模型可用于預(yù)測。采用GM(1,1)模型對2011—2016年的森林覆蓋率進行預(yù)測,并與實際值進行比較,評價預(yù)測模型效果。此外,對同樣的樣本數(shù)據(jù)分別采取多項式回歸模型預(yù)測和Logistic回歸模型預(yù)測,結(jié)果見表5。其中多項式回歸模型公式為:
Logistic回歸模型公式為:
表5 廣東省森林覆蓋率灰色系統(tǒng)預(yù)測模型比較分析
圖1 廣東省森林覆蓋率3種模型預(yù)測結(jié)果對比
本文經(jīng)過關(guān)聯(lián)度計算結(jié)果表明,影響森林覆蓋率的8個因素中,對廣東省2005—2015年森林覆蓋率影響起最主要作用的是有林地面積,其次是年平均氣溫、年降水量、年日照時數(shù);影響作用最小的因素是造林面積。
用GM(1,1)建模,結(jié)果顯示殘差較小,預(yù)測精度較高并通過后驗差精度檢驗,模型可用于中長期預(yù)測。根據(jù)2005—2010年的森林覆蓋率數(shù)據(jù),分別建立GM(1,1)模型、多項式回歸模型和Logistic回歸模型,對2011—2016年的森林覆蓋率進行預(yù)測,并與實際值進行比較,3個模型的預(yù)測相對誤差平均值依次是0.69%、1.08%、1.28%。結(jié)果表明在獲取的年份數(shù)據(jù)較少時,灰色系統(tǒng)森林覆蓋率預(yù)測模型精度高于多項式回歸模型和Logistic回歸模型,預(yù)測適用性更優(yōu)。但GM(1,1)模型和任何其它數(shù)學(xué)模型一樣,也有一定的適用范圍,超出了適用范圍則難以得到理想的結(jié)果。當(dāng)發(fā)展灰數(shù)-a≤0.3時,GM(1,1)模型可用于中長期預(yù)測;當(dāng)0.3<-a≤0.5時,GM(1,1)模型可用于短期預(yù)測,中長期預(yù)測慎用;當(dāng)0.5<-a≤0.8時,GM(1,1)模型作短期預(yù)測應(yīng)十分謹慎;當(dāng)0.8<-a≤1時,應(yīng)采用殘差修正GM(1,1)模型;當(dāng) -a>1時,不宜采用GM(1,1)模型[15]。在實際運用中,應(yīng)根據(jù)實際情況隨著觀測點的增加不斷修正預(yù)測模型,及時提高預(yù)測精度。
[1] 邱微, 李崧, 趙慶良, 等. 黑龍江省森林覆蓋率的灰色評價和模型預(yù)測[J]. 哈爾濱工業(yè)大學(xué)學(xué)報, 2007, 39(10):1649-1651.
[2] 黃妍妍, 關(guān)鳳麗. 基于灰色關(guān)聯(lián)分析的黑龍江省國有林區(qū)小城鎮(zhèn)建設(shè)影響因素實證分析[J]. 東北林業(yè)大學(xué)學(xué)報, 2015, 43(10): 130-134.
[3] 蔣玉超. 遼寧省未來森林覆蓋率預(yù)測[J]. 山東林業(yè)科技,2013, 43(6): 54-56.
[4] 高兆蔚. 福建森林資源發(fā)展趨勢的灰色預(yù)測[J]. 福建林學(xué)院學(xué)報, 1990, 10(1): 15-22.
[5] 葉紹明, 張麗君. 廣西森林資源動態(tài)灰色數(shù)列預(yù)測[J].中南林業(yè)調(diào)查規(guī)劃, 1993(2): 9-12.
[6] 徐天蜀. 云南省森林資源發(fā)展趨勢預(yù)測[J]. 林業(yè)資源管理, 1999(5): 8-12.
[7] 陳秀龍, 陳磊夫, 莫杏興, 等. 海南省森林資源發(fā)展趨勢的灰色預(yù)測[J]. 林業(yè)調(diào)查規(guī)劃, 2007, 32(3): 35-39.
[8] 廣東省人民政府地方志辦公室. 廣東年鑒[M]. 廣州: 廣東年鑒社, 2016.
[9] 杜棟, 龐慶華, 吳炎. 現(xiàn)代綜合評價方法與案例精選[M].2版. 北京: 清華大學(xué)出版社, 2014: 112-113.
[10] 劉思峰, 楊英杰, 吳利豐, 等. 灰色系統(tǒng)理論及其應(yīng)用[M]. 北京: 科學(xué)出版社, 2014: 140-146.
[11] 何振奇, 喬光建. 基于多項式回歸模型的枯季徑流預(yù)報與分析[J]. 南水北調(diào)與水利科技, 2010, 8(5): 85-88.
[12] 廣東農(nóng)村統(tǒng)計年鑒編輯委員會. 廣東農(nóng)村統(tǒng)計年鑒[M]. 北京: 中國統(tǒng)計出版社, 2006-2016.
[13] 廣東省統(tǒng)計局國家統(tǒng)計局廣東調(diào)查總隊. 廣東統(tǒng)計年鑒[M]. 北京: 中國統(tǒng)計出版社, 2006-2016.
[14] 寧宣熙, 劉思峰. 管理預(yù)測與決策方法[M]. 北京: 科學(xué)出版社, 2009: 113-145.
[15] 劉思峰, 鄧聚龍. GM(1,1)模型的適用范圍[J]. 系統(tǒng)工程理論與實踐, 2000, 20(5): 121-124.
Analysis of Influencing Factors and Model Prediction of Forest Coverage in Guangdong Province: Based on Grey Correlation Analysis and GM (1,1)Model
CHEN Zhehua1YANG Chaoyu1DENG Dongwang1LI Zhihua2
(1.Guangdong Forestry Survey and Planning Institute,Guangzhou,Guangdong 510520,China;2.Hunan Prospecting Designing and Research Institute for Agriculture Forestry and Industry,Changsha,Hunan 410007,China)
Based on the original data of the forest coverage in Guangdong province from 2005 to 2015, eight indicators were selected to analysis the influencing factors on forest coverage through the gray correlation analysis.The indicators were annual average temperature, amount of precipitation, annual sunshine duration, forest land area,standing forest stock, output value of forestry, afforestation area and seedling area. The results showed that the three factors with the highest degree of correlation were: the forest land area (0.993 4), the annual average temperature(0.992 1) and the annual precipitation (0.973 2). In order to verify the adaptability of the gray system forecast model of forest coverage, three models (GM (1,1) model, polynomial regression model, and Logistic regression model)were established based on the original data of forest coverage from 2005 to 2015. The prediction of forest coverage from 2011 to 2016 was compared with the actual value, and the average relative error of the three models was 0.69%,1.08% and 1.28%, respectively. The results showed that, when the annual data was less, the accuracy of the gray system forecast model was higher than that of the polynomial regression model and the Logistic regression model,and its adaptability is more excellent.
forest coverage;grey correlation;grey system;GM(1,1)model; Polynomial regression model;Logistic regression model
S711
A
2096-2053(2017)05-0101-06
*第一作者:陳哲華(1987— ),女,工程師,主要從事林業(yè)調(diào)查規(guī)劃,E-mail:walafa@163.com。