鄭利林 ,徐金英,王曉龍,劉寶貴
(1 中國(guó)科學(xué)院流域地理學(xué)重點(diǎn)實(shí)驗(yàn)室,中國(guó)科學(xué)院南京地理與湖泊研究所,南京 210008;2 中國(guó)科學(xué)院大學(xué),北京 100049)
濕地土壤、水文、植被與氣候等因素在不同的時(shí)空尺度上相互作用,共同影響濕地生態(tài)系統(tǒng)過(guò)程與功能[1]。濕地水文過(guò)程主導(dǎo)著濕地生態(tài)系統(tǒng)的格局和過(guò)程[2],是制約濕地植被生長(zhǎng)和繁殖的關(guān)鍵因素[3-4]。濕地土壤是長(zhǎng)期以來(lái)濕地生態(tài)系統(tǒng)各因素相互作用的產(chǎn)物[5-6]。土壤因子與濕地植被的相關(guān)作用關(guān)系一直是濕地研究的熱點(diǎn)問(wèn)題。已有的研究表明土壤養(yǎng)分與植被類型、植被發(fā)育年限、群落演替階段等相關(guān)。張?zhí)煊甑萚7]研究表明長(zhǎng)江口典型濱海濕地鹽沼植被類型顯著影響土壤各層次總有機(jī)碳和全氮儲(chǔ)量的分布。張文敏等[8]的研究表明杭州灣濕地互花米草的入侵增強(qiáng)了灘涂濕地的固碳能力。張騫等[9]的研究表明隨長(zhǎng)江口典型潮灘濕地崇明東灘植被發(fā)育年限增加,土壤有機(jī)碳含量逐年增加,植被發(fā)育14 a 的土壤有機(jī)碳含量約為發(fā)育1 a 的1.3 倍。羅琰等[10]研究了輝河濕地不同演替階段的草甸植物群落中同種元素含量的差異,認(rèn)為過(guò)渡草甸對(duì)土壤碳、氮、磷的吸收和滯留能力最強(qiáng)。其中植被類型與土壤養(yǎng)分的關(guān)系是研究的熱點(diǎn),已有的研究多基于不同的土壤類型[11]、土地利用類型[12-13]、高程梯度[14]等選擇代表性的植被類型研究植被與土壤因子的關(guān)系?,F(xiàn)有的研究較少涉及濕地不同高程代表性植被與土壤的作用關(guān)系。
判別植被在特定生境下是否存在的經(jīng)典方法是邏輯斯蒂回歸。邏輯斯蒂回歸不能很好地處理大量特征變量;對(duì)自變量多重共線性敏感,不能很好地處理缺失值[15]。2001 年,Breiman[16]和Cutler 等[17]借鑒Ho[18]提出的隨機(jī)決策森林方法,把分類樹(shù)組合成隨機(jī)森林,生成很多分類樹(shù),再匯總分類樹(shù)的結(jié)果。隨機(jī)森林可以處理復(fù)雜的較多變量間的非線性關(guān)系,對(duì)缺失值、變量多元共線性、異常值不敏感。機(jī)器學(xué)習(xí)方法不能給出預(yù)測(cè)變量與響應(yīng)變量的簡(jiǎn)單表達(dá)式,導(dǎo)致生態(tài)學(xué)解釋上的困難性。但不同于一般的“黑箱”模型,隨機(jī)森林可以給出變量的重要性排序以及變量間的偏依賴關(guān)系,從而能識(shí)別重要的生態(tài)因子并進(jìn)行解釋。Prasad 等[19]認(rèn)為最好把隨機(jī)森林稱為“灰箱”模型。近年來(lái),隨機(jī)森林算法在生態(tài)學(xué)方面的應(yīng)用逐漸增長(zhǎng)[20],然而在處理物種分布數(shù)據(jù)時(shí),隨機(jī)森林通常在少數(shù)類物種的預(yù)測(cè)中表現(xiàn)不佳[21]??梢曰诔闃拥姆椒ㄐ薷挠?xùn)練數(shù)據(jù)集增加少數(shù)類的比重以解決這一問(wèn)題。2002 年Chawla 等[22]提出的SMOTE(Synthetic Minority Over-sampling Technique)算法是較為成熟的小樣本重采樣技術(shù),SMOTE 算法的基本思想是對(duì)少數(shù)類樣本進(jìn)行分析并根據(jù)少數(shù)類樣本人工合成新樣本添加到數(shù)據(jù)集中,增加少數(shù)樣本在抽樣過(guò)程中的比重。SOMTE 和隨機(jī)森林相結(jié)合在植被分布預(yù)測(cè)中鮮少有相關(guān)研究。但已有的研究表明,二者的結(jié)合可以有效地處理和分析非平衡數(shù)據(jù)[21,23]。
鄱陽(yáng)湖位于江西省北部,是我國(guó)最大的淡水湖泊。鄱陽(yáng)湖濕地是中國(guó)首批公布的國(guó)家重點(diǎn)濕地保護(hù)地之一,1992 年被列入《國(guó)際重要濕地名錄》[24]。鄱陽(yáng)湖承接上游贛、撫、信、饒、修五河之水,由湖口北注長(zhǎng)江。由于受到五河流域水系和長(zhǎng)江水位的共同影響,鄱陽(yáng)湖水位年內(nèi)差異極大,周期性的水位高程變化使鄱陽(yáng)湖洲灘形成了特定的生境梯度[25]。鄱陽(yáng)湖年內(nèi)水位的劇烈波動(dòng)使鄱陽(yáng)湖洲灘植被經(jīng)歷著出露–淹沒(méi)–出露的過(guò)程[26]。不同高程洲灘出露時(shí)間的差異,使得鄱陽(yáng)湖濕地洲灘植被呈現(xiàn)明顯的帶狀、弧狀或環(huán)帶狀分布[27]。不同的植物群落帶對(duì)土壤養(yǎng)分的累積差異進(jìn)一步加劇了植被生境異質(zhì)性和梯度性。南荻(Triarrhena lutarioriparia L. Liu)和虉草(Phalaris arundinacea Linn)是鄱陽(yáng)湖洲灘濕地的主要建群種。其中南荻是多年生竹狀草本,具十分發(fā)達(dá)的根狀莖,分布高程相對(duì)較高,多與蘆葦混生,為典型高灘植物;虉草則分布高程相對(duì)較低,多靠近湖心分布,為典型低灘植被。已有的研究主要基于排序或相關(guān)性分析研究鄱陽(yáng)湖濕地植被生長(zhǎng)繁殖及其與土壤因子的相關(guān)關(guān)系[1,25,28-31],較少涉及鄱陽(yáng)湖高灘植被和低灘植被與土壤因子的耦合關(guān)系研究。比較以南荻為代表的高灘植被和以虉草為代表的低灘植被與土壤因子的相互作用對(duì)探究鄱陽(yáng)湖濕地生態(tài)系統(tǒng)格局具有重要意義。
本文將土壤環(huán)境因子作為預(yù)測(cè)變量,利用優(yōu)化的隨機(jī)森林分類模型對(duì)鄱陽(yáng)湖濕地以南荻為代表的高灘植被和以虉草為代表的低灘植被在樣方中是否存在進(jìn)行判別?;诖苏业竭@兩種植被分布下累積的土壤養(yǎng)分差異,分析這兩種植被與各土壤因子相互作用的程度和方向。以期為鄱陽(yáng)湖生態(tài)系統(tǒng)的管理、保護(hù)以及可持續(xù)發(fā)展提供一定的數(shù)據(jù)支持。
本研究選取的洲灘位于鄱陽(yáng)湖主湖北部(圖),屬于亞熱帶季風(fēng)氣候區(qū),年平均氣溫在17 ℃左右,年降水量平均為1 500 mm。降水年內(nèi)分配極不均勻,4—6 月降水約占全年的48%,6 月最大占全年17%,12 月最小只占3%。豐水期(4—9 月)洲灘幾乎全部淹沒(méi),10 月至次年3 月為枯水期,進(jìn)入枯水期后,不同高程的洲灘相繼出露。鄱陽(yáng)湖植被分布主要受到水文情勢(shì)的影響,沿泥灘到階地,主要的植物群落分別為狗牙根群落、蘆葦–南荻群落、薹草群落、剛毛荸薺群落、虉草–蓼子草–水田碎米薺群落、莕菜–竹葉眼子菜–輪葉黑藻–苦草群落[31]。
圖1 鄱陽(yáng)湖典型濕地植被調(diào)查樣方分布示意圖Fig.1 Distribution vegetation survey quadrats in typical wetlands of Poyang Lake
于2017 年春季,選取了研究區(qū)域5 個(gè)樣地,按照垂直于湖岸線的地形梯度進(jìn)行樣帶設(shè)置。在每個(gè)樣地中確定2 條3 m 寬的樣帶,樣帶之間間距為200 m。根據(jù)湖岸到湖心水文梯度的變化,在每條樣帶上等距離布設(shè)6 個(gè)1 m × 1 m 的樣方(圖1),共布設(shè)60 個(gè)樣方。記錄各樣方的主要建群種和伴生種。其中虉草群落和南荻群落的建群種和伴生種如下表(表1)所示。
表1 鄱陽(yáng)湖典型洲灘虉草群落和南荻群落的建群種和伴生種Table 1 Dominant and companion species of Phalaris arundinacea Linn and Triarrhena lutarioriparia L. Liu communities in typical beaches in Poyang Lake area
對(duì)植被樣方進(jìn)行調(diào)查的同時(shí),對(duì)樣方內(nèi)土壤進(jìn)行采樣。取土樣時(shí)先去除土壤表層凋落物,用土鉆(內(nèi)徑5 cm)對(duì)表層(0 ~ 15 cm)土壤進(jìn)行取樣,將同個(gè)樣方隨機(jī)選取的3 ~ 5 個(gè)土樣混合(約500 g),裝入無(wú)菌塑料袋中并封口,共采集土樣60 份,置于有冰袋的保鮮盒中運(yùn)回實(shí)驗(yàn)室。測(cè)定土壤養(yǎng)分含量,包括土壤pH、全氮、氨氮、硝態(tài)氮、全磷、有效磷、全鉀、有機(jī)質(zhì)、含水率。pH 采用無(wú) CO2水浸提,酸度計(jì)測(cè)定,土︰水為 1︰2.5;土壤全氮含量測(cè)定采用凱氏定氮法測(cè)定;土壤氨氮、硝態(tài)氮含量采用KCl 溶液浸提,流動(dòng)注射分析儀測(cè)定;土壤全磷含量采用硫酸–高氯酸消煮,鉬銻抗比色法測(cè)定;土壤有效磷采用氟化銨–鹽酸浸提法測(cè)定;土壤全鉀含量采用碳酸鈉熔融法測(cè)定;有機(jī)質(zhì)采用稀釋熱法測(cè)定;含水率采用105 ℃ 烘干法測(cè)定[32]。
本文將植被南荻和虉草在某樣方中是否存在作為因變量(二分變量),把土壤養(yǎng)分狀況(全氮、氨氮、硝態(tài)氮、全磷、有效磷、全鉀、有機(jī)質(zhì))、pH、含水率、洲灘類型和植被樣方的經(jīng)緯度作為自變量,建立了隨機(jī)森林判分類模型。在自變量和樣本量確定的情況下,可以通過(guò)改變分類節(jié)點(diǎn)m 和迭代次數(shù)k 減小袋外誤差(OOB)。袋外誤差是分類誤差的無(wú)偏估計(jì)[16]。Beriman[16]和Cutler 等[17]認(rèn)為時(shí)分類效果達(dá)到最優(yōu)。隨機(jī)森林基于分類的結(jié)果,給出自變量重要性排序[16]。重要性的衡量方法為:將一個(gè)變量的取值變?yōu)殡S機(jī)數(shù),隨機(jī)森林預(yù)測(cè)準(zhǔn)確性降低的程度(mean decrease accuracy)[16]。
本研究中存在虉草的樣方占總樣方比例大致為43%,而存在南荻的樣方占總樣方的比例僅為18%左右,是典型的非平衡數(shù)據(jù)集。隨機(jī)森林在處理非平衡數(shù)據(jù)時(shí),由于抽樣的隨機(jī)性使其對(duì)少數(shù)類樣本往往不能很好地區(qū)分[21]。為了提高分類精度,更精確地分析土壤因子與植被分布的關(guān)系,本研究利用SMOTE 算法對(duì)原始樣本進(jìn)行重新采樣,使新的數(shù)據(jù)重新達(dá)到平衡。重采樣是對(duì)少數(shù)類樣本進(jìn)行分析并根據(jù)少數(shù)類樣本人工合成新樣本添加到數(shù)據(jù)集中,合成的策略是對(duì)每個(gè)少數(shù)類樣本a,從它的最近鄰中隨機(jī)選一個(gè)樣本b,然后基于a、b 之間的距離選擇合適的點(diǎn)作為新合成的少數(shù)類樣本[22]。然后基于新的數(shù)據(jù)集建立隨機(jī)森林預(yù)測(cè)模型。
利用Excel 2016 軟件進(jìn)行數(shù)據(jù)整理;利用SPSS 22 軟件方差分析(ANOVA)模塊進(jìn)行差異顯著性檢驗(yàn);對(duì)非平衡數(shù)據(jù)的預(yù)處理利用R 語(yǔ)言中的caret 軟件包和DMwR 軟件包;基于土壤因子的植被分布預(yù)測(cè)利用R 語(yǔ)言中的random Forest 軟件包。
虉草和南荻分布區(qū)土壤pH 均值分別為5.53 和4.32(表2),其中虉草分布區(qū)pH 顯著高于南荻分布區(qū)(P<0.05)。虉草分布區(qū)土壤全氮、氨氮與硝態(tài)氮含量分別為3 080.17、139.46 和14.83 mg/kg;南荻分布區(qū)土壤全氮、氨氮與硝態(tài)氮含量分別為3 155.35、121.61和22.48 mg/kg。全氮和氨氮在這兩種植被分布區(qū)上的差別不顯著,而南荻分布區(qū)土壤硝態(tài)氮略高于虉草分布區(qū)(P<0.1)。虉草分布區(qū)土壤全磷和有效磷分別為534.01、4.60 mg/kg,南荻分布區(qū)為449.71和4.81 mg/kg。兩種植被分布區(qū)全磷和有效磷含量沒(méi)有顯著差別。虉草分布區(qū)土壤中全鉀含量為26.47 mg/kg,顯著低于南荻分布區(qū)的35.41 mg/kg(P<0.05)。虉草分布區(qū)和南荻分布區(qū)有機(jī)質(zhì)含量沒(méi)有顯著差別,但虉草分布區(qū)土壤含水率顯著高于南荻分布區(qū)(P<0.05)。
表 2 虉草分布區(qū)和南荻分布區(qū)土壤養(yǎng)分含量特征Table 2 Soil nutrient contents under Phalaris arundinacea Linn and Triarrhena lutarioriparia L. Liu
本研究中自變量的數(shù)量為12 個(gè),設(shè)置隨機(jī)森林模型樹(shù)的數(shù)量為1 000,每棵樹(shù)分類節(jié)點(diǎn)數(shù)m= 3?;?2 個(gè)自變量和60 個(gè)樣本建立的隨機(jī)森林模型對(duì)虉草和南荻是否存在的判別精度分別為 89.58% 和89.29%,為準(zhǔn)確分析植被分布概率與土壤因子相互作用的關(guān)系做了準(zhǔn)備。隨機(jī)森林模型給出了每個(gè)土壤因子對(duì)植被出現(xiàn)概率預(yù)測(cè)的重要性程度(圖2)。重要性體現(xiàn)為將一個(gè)變量的取值變?yōu)殡S機(jī)數(shù)后隨機(jī)森林預(yù)測(cè)準(zhǔn)確性降低的程度。重要性程度高的土壤因子能顯著區(qū)分出該植被存在或不存在,體現(xiàn)了植被與土壤高的相互作用程度和密切相關(guān)程度。與虉草分布密切相關(guān)的土壤因子重要性依次為全鉀、氨氮、有機(jī)質(zhì)、含水率、全氮、有效磷、全磷、pH 和硝態(tài)氮;與南荻分布密切相關(guān)的土壤因子的重要性依次為全鉀、pH、有機(jī)質(zhì)、全氮、全磷、硝態(tài)氮、氨氮、含水率和有效磷。
圖 2 土壤因子與虉草(左)和南荻(右)分布預(yù)測(cè)中的重要性排序Fig.2 Importance ranking of soil factors for distribution prediction of Phalaris arundinacea Linn and Triarrhena lutarioriparia L. Liu
鄱陽(yáng)湖屬于洪泛型濕地,淹水歷時(shí)、淹沒(méi)深度和淹水頻率等關(guān)鍵水情因子的時(shí)空變化對(duì)濕地植物的生長(zhǎng)和繁殖有重要的影響[33-35]。鄱陽(yáng)湖低灘和高灘受到顯著不同的水文情勢(shì)的作用,植被的類型與分布有很大差異[36]。不同高程植物和土壤通過(guò)長(zhǎng)期的物質(zhì)和能量的交換,加劇高低灘生境的空間異質(zhì)性。因此,隨機(jī)森林模型可以基于土壤環(huán)境因子能對(duì)低灘植被虉草和高灘植被南荻進(jìn)行精準(zhǔn)判別。基于隨機(jī)森林分類的結(jié)果,模型自動(dòng)計(jì)算了每個(gè)土壤因子作為預(yù)測(cè)變量對(duì)虉草和南荻判別能力的大小,以及植被與土壤因子的作用關(guān)系。圖3 中給出了植被分布與土壤因子的偏依賴圖(partial dependent plot)及其解釋。偏依賴圖描述了某一預(yù)測(cè)變量在排除其他預(yù)測(cè)變量的情況下,對(duì)被預(yù)測(cè)變量出現(xiàn)概率在統(tǒng)計(jì)結(jié)果上的影響,在本研究中實(shí)質(zhì)上體現(xiàn)了低灘植被和高灘植被對(duì)土壤養(yǎng)分的累積差異。偏依賴圖縱坐標(biāo)表示植被出現(xiàn)的可能性大小,橫坐標(biāo)表示調(diào)查的60 個(gè)樣方中土壤因子分布。
如圖 3 所示,各土壤因子與虉草和南荻的相互作用不同。虉草分布區(qū)土壤pH 呈弱酸性或中性;而南荻分布區(qū)土壤酸性較強(qiáng)。虉草在樣方中出現(xiàn)的概率與土壤全氮含量呈負(fù)相關(guān),虉草分布區(qū)土壤全氮含量低;南荻在樣方中出現(xiàn)的概率與土壤全氮含量有較弱的正相關(guān),其分布區(qū)土壤全氮含量適中。虉草和南荻分布區(qū)氨氮含量都較低。虉草和南荻在樣方中出現(xiàn)的概率與土壤中硝態(tài)氮含量呈正相關(guān)關(guān)系,分布區(qū)硝態(tài)氮含量都較高。虉草在樣方中出現(xiàn)的概率與土壤全磷含量正相關(guān),其分布區(qū)全磷含量較高;南荻出現(xiàn)的概率則與全磷含量負(fù)相關(guān),其分布區(qū)全磷含量較低。虉草分布和南荻分布區(qū)與土壤有效磷關(guān)系不顯著。虉草出現(xiàn)的概率與土壤全鉀含量負(fù)相關(guān),其分布區(qū)鉀含量較低;南荻出現(xiàn)的概率則與土壤全鉀含量正相關(guān),其分布區(qū)鉀的含量高。虉草分布區(qū)和南荻分布區(qū)有機(jī)質(zhì)含量都比較低。虉草出現(xiàn)的概率與土壤含水率正相關(guān),因此其分布區(qū)含水率高;南荻出現(xiàn)的概率則與土壤含水率負(fù)相關(guān),因而其分布區(qū)含水率較低。
鄱陽(yáng)湖水位周期性波動(dòng)形成的水陸交替過(guò)渡帶具有復(fù)雜多樣的生境以及沿水位高程變化的濕地物質(zhì)和能量結(jié)構(gòu)[25,31,37]。從濕地中心到濕地邊緣,淹水時(shí)間變短,淹水頻率降低,植被由低灘植被逐漸演變?yōu)楦邽┲脖?。不同植被類型通過(guò)對(duì)土壤養(yǎng)分和水分的吸收、根系分泌物的釋放、殘?bào)w降解等過(guò)程對(duì)土壤養(yǎng)分的組成產(chǎn)生重要作用。本文基于隨機(jī)森林模型找到了低灘植被虉草和高灘植被南荻分布下土壤養(yǎng)分的累積差異。虉草分布區(qū)土壤偏中性或軟酸性,這與虉草自身生理特性、虉草與土壤的相互作用有關(guān)。徐高峰等[38]認(rèn)為虉草在pH 為6.0 時(shí)萌發(fā)率最高。張永亮和駱秀梅[39]的研究也表明,虉草耐pH 范圍在4.9 ~8.2;南荻分布區(qū)土壤酸性較強(qiáng),與2010 年劉芳鵬等[40]在鄱陽(yáng)湖南磯山濕地的調(diào)查(4.83 ~ 5.72)相比,本研究顯示南荻分布區(qū)土壤酸性程度更強(qiáng)(pH<4.50)。虉草分布區(qū)土壤全氮和氨氮較低,硝態(tài)氮含量稍高。但虉草與硝態(tài)氮的關(guān)系不顯著。相應(yīng)的,硝態(tài)氮在預(yù)測(cè)變量重要性排序中最不重要。賈有余等[41]則認(rèn)為在控制實(shí)驗(yàn)中,施氮肥會(huì)提高虉草的產(chǎn)量,這可能與鄱陽(yáng)湖虉草長(zhǎng)期適應(yīng)低灘區(qū)域低氮環(huán)境[42],從而改變了自身的生理生態(tài)特性有關(guān);南荻分布區(qū)土壤全氮和硝態(tài)氮較高,與氨氮作用不顯著。張全軍等[28]認(rèn)為鄱陽(yáng)湖代表性群落植株重量與土壤氮素含量存在顯著的負(fù)相關(guān)關(guān)系,但未能揭示出每種植被分別與土壤氮素的相關(guān)關(guān)系。虉草分布區(qū)土壤全磷和有效磷含量高,而南荻則與土壤磷的作用不顯著。郝建朝等[43]的研究也表明不同類型的濕地群落中只有虉草與有效磷分布和全磷分布有顯著的正相關(guān),且虉草具有極強(qiáng)的脫磷能力。虉草和南荻與土壤中鉀的作用極為顯著。虉草分布與鉀的含量呈負(fù)相關(guān)關(guān)系,虉草分布區(qū)土壤含量低;南荻分布與鉀的含量有顯著的正相關(guān)關(guān)系,南荻分布區(qū)土壤鉀的含量高。董磊等[1]、張全軍等[28]也認(rèn)為鄱陽(yáng)湖南荻分布區(qū)土壤鉀的含量高于虉草分布區(qū),但沒(méi)有揭示出具體的相關(guān)關(guān)系。虉草和南荻與有機(jī)質(zhì)的作用顯著,兩者分布區(qū)有機(jī)質(zhì)含量低。張全軍等[28]的研究也表明有機(jī)質(zhì)含量與鄱陽(yáng)湖濕地群落植株重量有非常顯著的負(fù)相關(guān)關(guān)系,但沒(méi)有闡明不同植被與有機(jī)質(zhì)的相關(guān)關(guān)系。虉草分布區(qū)含水率高;南荻分布區(qū)含水率低。這與這兩種植被分布的區(qū)域密切相關(guān),虉草靠近湖心分布,南荻分布的區(qū)域海拔稍高。董磊等[1]認(rèn)為含水率是影響鄱陽(yáng)湖植被帶狀分異的最重要因素。
生態(tài)學(xué)問(wèn)題通常涉及多維變量間的復(fù)雜關(guān)系,傳統(tǒng)的統(tǒng)計(jì)學(xué)方法例如邏輯斯蒂回歸難以揭示復(fù)雜過(guò)程中透露的格局和關(guān)系[44]。隨機(jī)森林能很好地處理非線性關(guān)系、高維數(shù)據(jù)以及缺失值,并能對(duì)分類結(jié)果進(jìn)行可視化,給出合理的生態(tài)學(xué)解釋,在處理生態(tài)學(xué)問(wèn)題中有極大的應(yīng)用價(jià)值。Peters 等[45]使用多重邏輯斯蒂回歸模型和隨機(jī)森林模型找到了桑松低洼濕地地區(qū)沿環(huán)境梯度下的植被分布的主要限制性要素,研究表明隨機(jī)森林的綜合表現(xiàn)更好。Long 等[46]基于隨機(jī)森林模型找到了美國(guó)西部大鹽湖蘆葦分布的主要限制性環(huán)境因子。張雷等[47]以云南松分布模擬為例,突出了隨機(jī)森林算法與傳統(tǒng)的統(tǒng)計(jì)方法以及其他機(jī)器學(xué)習(xí)方法相比,在解決生態(tài)學(xué)問(wèn)題上的優(yōu)勢(shì)。本研究表明隨機(jī)森林方法適用于植被分布的預(yù)測(cè),清晰地展示了植被分布與土壤因子的依賴關(guān)系,進(jìn)而結(jié)合研究區(qū)域的特點(diǎn)進(jìn)行合理的生態(tài)學(xué)解釋。
圖 3 土壤因子與植被分布的偏依賴圖(A:虉草;B:南荻)Fig. 3 Partial dependent plots for soil factors and vegetation distribution (A: Phalaris arundinacea Linn; B: Triarrhena lutarioriparia L. Liu)
1)隨機(jī)森林基于土壤環(huán)境因子對(duì)虉草和南荻在樣方中存在與否進(jìn)行了準(zhǔn)確的判別(預(yù)測(cè)精度分別為89.6% 和89.3%),較好辨識(shí)了以虉草為代表的低灘植被和以南荻為代表的高灘植被對(duì)土壤養(yǎng)分的累積差異。
2)虉草與土壤中的全鉀、氨氮、有機(jī)質(zhì)密切相關(guān);南荻與土壤全鉀、pH、有機(jī)質(zhì)密切相關(guān)(將自變量按重要性排序后,選取前3 個(gè)土壤因子)。虉草分布與鉀、氨氮和有機(jī)質(zhì)都呈負(fù)相關(guān)關(guān)系,且分布區(qū)這幾種土壤因子含量都比較低;南荻分布與全鉀正相關(guān),而與有機(jī)質(zhì)和pH 負(fù)相關(guān)。南荻分布區(qū)全鉀含量較高,土壤酸性強(qiáng)且有機(jī)質(zhì)含量較低。
3)隨機(jī)森林算法在處理生態(tài)學(xué)高維數(shù)據(jù)中具有顯著的優(yōu)越性,能克服傳統(tǒng)統(tǒng)計(jì)學(xué)方法在處理復(fù)雜數(shù)據(jù)方面的不足,對(duì)大量相互作用的數(shù)據(jù)進(jìn)行挖掘,并得到簡(jiǎn)單易于解釋的可視化結(jié)果,在解決生態(tài)學(xué)問(wèn)題中具有顯著的優(yōu)越性。