• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      植物空間分布格局中鄰體距離的概率分布模型及參數(shù)估計

      2016-09-21 02:13:48
      生態(tài)學報 2016年14期
      關鍵詞:概率分布參數(shù)估計格局

      高 猛

      中國科學院煙臺海岸帶研究所,海岸帶環(huán)境過程與生態(tài)修復重點實驗室,煙臺 264003

      ?

      植物空間分布格局中鄰體距離的概率分布模型及參數(shù)估計

      高猛*

      中國科學院煙臺海岸帶研究所,海岸帶環(huán)境過程與生態(tài)修復重點實驗室,煙臺264003

      最近鄰體法是一類有效的植物空間分布格局分析方法,鄰體距離的概率分布模型用于描述鄰體距離的統(tǒng)計特征,屬于常用的最近鄰體法之一。然而,聚集分布格局中鄰體距離(個體到個體)的概率分布模型表達式復雜,參數(shù)估計的計算量大。根據(jù)該模型期望和方差的特性,提出了一種簡化的參數(shù)估計方法,并利用遺傳算法來實現(xiàn)參數(shù)優(yōu)化,結果表明遺傳算法可以有效地估計的該模型的兩個參數(shù)。同時,利用該模型擬合了加拿大南溫哥華島3個寒溫帶樹種的空間分布數(shù)據(jù),結果顯示:該概率分布模型可以很好地擬合美國花旗松(P.menziesii)和西部鐵杉(T.heterophylla)的鄰體距離分布,但由于西北紅柏(T.plicata)存在高度聚集的團簇分布,擬合結果不理想;美國花旗松在樣地中近似隨機分布,空間聚集參數(shù)對空間尺度的依賴性不強,但西北紅柏和西部鐵杉空間聚集參數(shù)具有尺度依賴性,隨鄰體距離階數(shù)增加而變大。最后,討論了該模型以及參數(shù)估計方法的優(yōu)勢和限制。

      空間點格局;聚集分布;參數(shù)優(yōu)化;遺傳算法

      植物種群空間分布格局是指特定時間內, 植物群落中某一種群的個體在空間的分布狀況[1-3]。空間分布格局分析對于確定種群特征、種群間相互關系以及種群與環(huán)境之間的關系具有非常重要的作用, 對于了解種群空間分布規(guī)律以及種內與種間關系具有重要的意義[4-7]。按照種群內個體的聚集程度和方式, 種群分布格局一般可分為隨機分布、均勻分布和聚集分布3種類型[8]。以頻度/密度為基礎的樣方法和以距離為基礎的無樣地法屬于兩大類確定植物空間分布格局的研究方法[3-5,9]。植物群落調查實踐表明無樣地法比于樣方法在成本和可操作性兩方面均有一定的優(yōu)勢[10]。

      最近鄰體法(nearest neighbor method, NN)屬于無樣地法之一,它最早由Clark 和Evans[11]提出,以觀測點與個體之間的距離(或者個體與個體之間的距離)為原始數(shù)據(jù)獲取分析指標,用統(tǒng)計檢驗的方法考察實際值與理論期望值之間的差異顯著性,進而判斷種群的空間分布類型。Stoyan和Penttinen[12]指出最近鄰體距離特別是高階鄰體距離的概率分布比一般的分析指標可以更好地量化空間分布格局。Thompson[13]早在1956年便推導出了隨機分布格局中鄰體距離的概率分布模型,Eberhardt[14]則給出了聚集分布格局中隨機觀測點到相鄰個體距離的概率分布模型,Magnussen[15-16]等基于Eberhardt的概率分布模型提出了植物空間密度的點估計方法。在隨機分布格局中,任意選擇的觀測點到其相鄰個體距離與任意選擇的個體到其相鄰個體距離在統(tǒng)計學意義上是一致的,因此二者的概率分布模型也是一樣的[6]。聚集分布格局中,任意選擇的觀測點到相鄰個體距離和個體到個體距離并不一致,二者的概率分布模型也不相同。Gao[5]利用條件概率的極限法推導出聚集分布格局下的個體到相鄰個體的概率分布模型,并以巴拿馬Barro Colorado島(Barro Colorado Island, BCI)樣地183個熱帶雨林樹種的空間分布數(shù)據(jù)進行了驗證,結果表明該概率分布模型可以較好地擬合大多數(shù)樹種的鄰體距離分布。Gao[6]等利用該模型研究了BCI樣地中樹種分布多尺度特征,并總結出5類空間聚集指數(shù)-鄰體距離階數(shù)曲線。BCI樣地屬于熱帶雨林,物種豐富且大多數(shù)樹種被證實在空間中聚集分布[17],這與Gao[5]模型的基本條件一致。本文的第一個研究目標是利用Gao[5]的鄰體距離概率分布模型擬合加拿大西海岸南溫哥華島3個寒溫帶樹種的空間分布數(shù)據(jù),以檢驗該模型在北方森林的適用性。

      Eberhardt概率分布模型含兩個參數(shù),概率密度函數(shù)的表達式較復雜。Magnussen[15-16]等在利用Eberhardt模型進行密度估計時采用了極大似然法(maximum likelihood),參數(shù)優(yōu)化則基于Nealder-Mead算法。Gao模型與Eberhardt模型的概率密度函數(shù)的表達式相似,并通過求解極大似然數(shù)值方程來完成參數(shù)估計[5-6]。以上兩種參數(shù)估計方法均屬于極大似然法的范疇,當模型樣本較少時,其求解過程可能只得到局部最優(yōu)解而非全局最優(yōu)解[16]。遺傳算法(genetic algorithm)是一種通過模擬自然進化過程搜索最優(yōu)解的方法,其主要特點是:直接對結構對象進行操作,不存在求導和函數(shù)連續(xù)性的限定,具有更好的全局尋優(yōu)能力;采用概率化的尋優(yōu)方法,能自動獲取和指導優(yōu)化的搜索空間,自適應地調整搜索方向,不需要確定的規(guī)則。遺傳算法的這些性質,使其成為現(xiàn)代智能計算中的關鍵技術。本文的第二個研究目標是采用遺傳算法估計Gao模型的兩個參數(shù),解決極大似然法數(shù)值優(yōu)化不能得到全局最優(yōu)解的問題。

      1 模型

      植物空間分布格局分析中,將個體的空間位置映射到二維空間上的點,形成空間點格局??臻g點格局在統(tǒng)計學中被認為是空間點過程的一個實現(xiàn)[18]??臻g點過程最基本的屬性是過程強度λ(s),即位置s單位面積內的期望點數(shù)。隨機分布的空間點格局,λ(s)為常量,對應一個Poisson過程。定義隨機采樣點到其第n個相鄰個體的距離為隨機變量rn,其概率分布模型的密度函數(shù)為[13]:

      (1)

      式中,n記為鄰體距離的階數(shù)。如果假設λ(s)服從均值為λ的Gamma分布h(λ|α,β),則面積A的樣地內點的個數(shù)服從期望為λA的負二項分布[19]。負二項分布是聚集分布格局分析中最普遍的概率分布模型[4]。將Gamma分布h(λ|α,β)帶入模型(1),通過計算卷積可以得到聚集空間分布格局中rn的概率密度函數(shù)[15]:

      (2)

      式中,α>0,β>0,且滿足λ=α×β,Γ()為Gamma函數(shù)。需要估計的兩個模型參數(shù)為α和β。定義任意個體到其第n個相鄰個體的距離定義為隨機變量sn,聚集分布點格局中,sn的概率密度函數(shù)為[5]:

      (3)

      模型(3)與模型(2)的表達式相似,利用鄰體距離的樣本數(shù)據(jù)可以估計α和β的值。

      2 數(shù)據(jù)與方法

      2.1數(shù)據(jù)

      本文以加拿大西海岸3個寒溫帶樹種的空間分布數(shù)據(jù)驗證概率分布模型(3)。研究區(qū)位于不列顛哥倫比亞省的南溫哥華島(48°38′ N,123°43′W),樣地大小為102m×87m(0.8874hm2),平均海拔382m[20](圖1)。3個樹種分別為西部紅柏(Western red cedar,Thujaplicata),美國花旗松(Douglas-fir,Pseudotsugamenziesii),以及西部鐵杉(Western hemlock,Tsugaheterophylla)。在統(tǒng)計個體到個體的鄰體距離時,為避免邊緣效應,在樣地邊界設置5m的緩沖區(qū),即靠近樣地邊界5m內的個體不作統(tǒng)計,共計西部紅柏337棵,美國花旗松508棵,西部鐵杉767棵。

      圖1 3個樹種的空間分布點格局Fig.1 Spatial distribution point patterns of three tree species

      2.2遺傳算法

      遺傳算法是人工智能領域中用于解決最優(yōu)化的一種啟發(fā)式算法,這種算法借鑒了進化生物學中的一些現(xiàn)象,包括遺傳、突變、自然選擇以及雜交等[21]。圖2展示了8位編碼的遺傳算法計算流程圖。選取適當?shù)哪繕撕瘮?shù),便可以利用遺傳算法估計模型(3)的參數(shù)。本研究中遺傳算法是在數(shù)學軟件MATLAB2008[22]環(huán)境下實現(xiàn)的,并編寫遺傳、突變、自然選擇以及雜交4個計算過程的通用函數(shù)。

      圖2 遺傳算法的計算流程圖Fig.2 Computation flowchart of Genetic Algorithm

      2.3參數(shù)估計

      根據(jù)模型(3)概率密度的表達式,可以分別計算隨機變量sn的期望和方差:

      (4)

      (5)

      (6)

      為驗證參數(shù)估計結果,概率分布模型(3)的擬合優(yōu)度采用Kolmogorov-Smirnov(KS)檢驗,檢驗統(tǒng)計量KS定義為:

      (7)

      式中,T(sn)和O(sn)分別為n階鄰體距離不大于sn的擬合及實際概率。

      3 結果

      表1 西部紅柏(T. plicata)的鄰體距離概率分布模型的參數(shù)估計和檢驗結果

      圖3 西部紅柏(T. plicata)的鄰體距離概率密度函數(shù)(左側縱坐標)及概率分布函數(shù)(右側縱坐標)Fig.3  Probability density (left y-axis) /distribution functions (right y-axis) of nearest neighbor distance of Western red cedar (T. plicata)

      表2 美國花旗松(P. menziesii)的鄰體距離概率分布模型的參數(shù)估計和檢驗結果

      圖4 美國花旗松(P. menziesii)的鄰體距離概率密度函數(shù)(左側縱坐標)及概率分布函數(shù)(右側縱坐標)Fig.4  Probability density (left y-axis)/distribution functions (right y-axis) of nearest neighbor distance of Douglas-fir (P. menziesii)

      表3 西部鐵杉(T. heterophylla)的鄰體距離概率分布模型的參數(shù)估計和檢驗結果

      圖5 西部鐵杉(T. heterophylla)的鄰體距離概率密度函數(shù)(左側縱坐標)及概率分布函數(shù)(右側縱坐標)Fig.5 Probability density (left y-axis) /distribution functions (right y-axis) of nearest neighbor distance of Western hemlock (T. heterophylla)

      4 結論與討論

      本文根據(jù)聚集分布格局中鄰體距離(個體到個體)的概率分布模型期望和方差的特性,提出了一種簡化的參數(shù)估計方法,利用遺傳算法實現(xiàn)參數(shù)優(yōu)化,并以加拿大南溫哥華島3個寒溫帶樹種的空間分布數(shù)據(jù)進行了實例驗證,得到的主要結論如下:

      (1)通過定義合適的目標函數(shù),可以簡化模型參數(shù)估計的計算量,遺傳算法可以有效地估計鄰體距離概率模型的參數(shù);

      (2)西部紅柏(T.plicata)和西部鐵杉(T.heterophylla)的空間聚集度比較高,美國花旗松(P.menziesii)在樣地中近似隨機分布,Gao[5]的鄰體距離概率分布模型可以很好地擬合西部鐵杉(T.heterophylla)和美國花旗松(P.menziesii)的鄰體距離概率分布。

      鄰體距離概率分布模型(3)的表達式較為復雜,Gao[5]在利用極大似然估計的方法估計模型參數(shù)時,定義了一個帶有絕對值的目標函數(shù)。因此,參數(shù)估計問題轉化為二維參數(shù)空間上的數(shù)值最優(yōu)化問題。在計算過程中,樣本的選擇會影響數(shù)值優(yōu)化算法的結果,特別是當鄰體距離的樣本較少時,會得到局部最優(yōu)解而非全局最優(yōu)解。本文提出利用遺傳算法估計模型(3)的參數(shù)α和β,在定義目標函數(shù)(6)之后將參數(shù)估計問題轉化為一維參數(shù)空間上的數(shù)值最優(yōu)化問題。遺傳算法在的作用是作為一種數(shù)值最優(yōu)化技術解決一維參數(shù)空間上的數(shù)值最優(yōu)化問題。然而,該方法仍然不能有效解決當樣本少的時候估計不準確的問題。首先,本文提出的參數(shù)方法實質上是一種矩估計方法。矩法估計方法的優(yōu)點是原理簡單、使用方便,使用時可以不知總體的分布。理論上講,矩法估計是以大樣本為應用對象的,只有在樣本容量較大時,才能保障它的優(yōu)良性。因此,準確估計參數(shù)的關鍵是獲得足夠的鄰體距離樣本,這對兩種估計方法都很重要。遺傳算法本身對參數(shù)估計的精度不具有決定性作用。

      鄰體距離概率分布模型(3)是從聚集空間點格局的負二項分布模型推導而來的,參數(shù)α與負二項分布模型中的聚集指數(shù)k等價,其本身就與空間尺度相關[23-24]。植物空間分布格局分析中空間尺度概念涉及3個方面:研究區(qū)域的尺度、生態(tài)過程尺度和取樣尺度[2,25]。利用鄰體距離分析空間分布格局也受到尺度的影響,在實際應用中需要關注取樣尺度,即鄰體距離的階數(shù)。選取比較小的階數(shù)會忽略掉較多的空間信息,選取較大的階數(shù)會增加群落調查的工作量,并且還會受到邊際效應的影響[5],所以建議采用的階數(shù)是2到6。然而,模型(3)本身也有一定的局限性,因此在擬合聚集度較高的空間點格局的鄰體距離時的,擬合效果并不理想[5-6],以及本文中的西部紅柏的鄰體距離分布。擬合效果不理想的原因有兩個:1)實際的概率分布會出現(xiàn)多峰值的現(xiàn)象;2)實際概率向左傾斜的較多。針對以上兩個問題,可以從以下2個方面進行改進:1)改進概率分布模型,例如采用混合型概率分布;2)采用高階的鄰體距離,使得概率分布右移。下一步的研究可以嘗試采用人工智能方法對極大似然估計的目標函數(shù)進行優(yōu)化,可以避免在樣本較少的情況下不能得到全局最優(yōu)解。

      [1]Gaston Kevin J. Rarity. London: Chapman and Hall, 1994.

      [2]Fortin Marie Josee, Dale Mark R T. Spatial analysis: a guide for ecologists. Cambridge: Cambridge University Press, 2005.

      [3]王本洋, 余世孝. 種群分布格局的多尺度分析. 植物生態(tài)學報, 2005, 29(2): 235-241.

      [4]蘭國玉, 雷瑞德. 植物種群空間分布格局研究方法概述. 西北林學院學報, 2003, 18(2): 17-21.

      [5]Gao M. Detecting spatial aggregation from distance sampling: a probability distribution model of nearest neighbor distance. Ecological Research, 2013, 28: 397-405.

      [6]Gao M, Wang X X, Wang D. Species spatial distribution analysis using nearest neighbor methods: aggregation and self-similarity. Ecological Research, 2014, 29: 341-349.

      [7]Wiegand Thorsten, Moloney Kirk A. Rings, circles, and null models for point pattern analysis in ecology. Oikos, 2004, 104(2): 209-229.

      [8]Pielou E C. A single mechanism to account for regular, random and aggregated populations. Journal of Ecology, 1960, 48:575-584.

      [9]戴小華, 余世孝. GIS支持下的種群分布格局分析. 中山大學學報(自然科學版), 2003, 42: 75-78.

      [10]Picard Nicolas, Kouyaté Amadou M, Dessard Hélène. Tree density estimations using a distance method in Mali Savanna. Forest Science, 2005, 51(1):7-18.

      [11]Clark Philip J, Evans Francis C. Distance to nearest neighbor as a measure of spatial relationships in populations. Ecology, 1954, 35(4):445-453.

      [12]Stoyan Dietrich, Penttinen Antti. Recent applications of point process methods in forestry statistics. Statistics Science, 2000, 15:61-78.

      [13]Thompson H R. Distribution of distance to n-th nearest neighbor in a population of randomly distributed individuals. Ecology, 1956, 37(2):391-394.

      [14]Eberhardt L L. Some developments in distance sampling. Biometrics, 1967, 23:207-216.

      [15]Magnussen Steen, Kleinn C, Picard N. Two new density estimator for distance sampling. European Journal of Forest Research, 2008., 127(3):213-224.

      [16]Magnussen Steen, Fehrman Lutz, Platt William J. An adaptive composite density estimator for k-tree sampling, European Journal of Forest Research, 2012, 131(2): 307-320.

      [17]Richard Condit, Peter S Ashton, Patrik Baker, Sarayudh Bunyavejchewin, Savithri Gunatilleke, Nimal Gunatilleke, Stephen P Hubbell, Roin B Foster, Akira Itoh, James V Lafrankie, Hua Sen Lee, Elizabeth Losos, N Manokaran, R Sukumar, Tauo Yamakura. Spatial patterns in the distribution of tropical tree species. Science, 2000, 288(5470):1414-1418.

      [18]Diggle Peter J. Statistical analysis of spatial point patterns,2nd ed. London: Arnold, 2003.

      [19]Magnussen S, Picard N, Kleinn C. A Gamma-Poisson distribution of point to k nearest event distance, Forest Science, 2008, 54(4):429-441.

      [20]He F L, Duncan R P. Density-dependent effects on tree survival in an old-growth Douglas fir forest. Journal of Ecology, 2000, 88(4): 676-688.

      [21]周明, 孫樹棟. 遺傳算法原理與應用. 北京:國防工業(yè)出版社, 1999.

      [22]MATLAB Tutorial, The MathWorks http://www.mathworks.cn.

      [23]He F L, Gaston K J. Estimating species abundance from occurrence. American Naturalist, 2000, 156(5):553-559.

      [24]Hui C, Veldtman Ruan, McGeoch Melode A. Measures, perceptions and scaling patterns of aggregated species distributions. Ecography, 2010, 33(1):95-102.

      [25]Dungan J L, Perry J N, Dale M R T, Legendre P, Citron-Pousty S, Fortin M J, Jakomulska A, Miriti M, Rosenberg M S. A balanced view of scale in spatial statistical analysis. Ecography, 2002, 25(5):626-640.

      Nearest neighbor distance in spatial point patterns of plant species-probability distribution model and parameter estimation

      GAO Meng*

      KeyLaboratoryofCoastalEnvironmentalProcessesandEcologicalRemediation,YantaiInstituteofCoastalZoneResearch,ChineseAcademyofSciences,Yantai264003,China

      In ecology, the spatial point pattern, which is obtained by mapping the locations of each individual as points in space, is a very important tool for describing the spatial distribution of species. There are three generally accepted types of spatial point patterns: regular, random, and aggregated. To detect spatial patterns, quadrat sampling is commonly applied, where quadrats are randomly thrown on the space and then the number of individuals in quadrats is used to fit Poisson model or NBD model, respectively. Distance sampling is an alternative method for spatial point pattern analysis, which is flexible and efficient, especially in highly dense plant communities, and in difficult terrain. Nearest neighbor method is one effective distance sampling method in spatial distribution pattern analysis. There are two kinds of nearest neighbor distances (NND): point-to-tree NND, distances from randomly selected points (sampling points) to the nearest individuals; and tree-to-tree NND, distances from selected individuals to their nearest neighbors. In this paper, we show a probability distribution model of higher order nearest neighbor distance (tree-to-tree). As we see the expression of this model is complicated; therefore, parameter estimation using conventional method is not a trivial task. In statistics, there are many numerical methods for estimating the parameters of complicated probability distribution model such as moment method, empirical method, graphical method, and maximum likelihood method. In previous literature, maximum likelihood method has been applied for parameter estimation and the optimized estimates on the log-likelihood surface were searched by Nelder-Mead algorithm. However, maximum likelihood estimation was fraught with nontrivial numerical issues when the samples of tree-to-tree distance were rare. In this paper, we use an alternative method, genetic algorithm, to estimate the two model parameters. The computation can be further simplified by defining a suitable objective function based on the expectation and variance. The probability distribution model is then used to fit spatial distribution data of three tree species on southern Vancouver Island, western coast of Canada. It is found that the proposed probability distribution model can fit nearest neighbor distance samples well for Douglas-fir (Pseudotsugamenziesii) and western hemlock (Tsugaheterophylla). For tree species western red cedar (Thujaplicata), the fitting is not so satisfied because individuals of western red cedar are usually distributed as small clusters. As Douglas-fir is almost randomly distributed in space, the estimated parameter representing spatial aggregation nearly does not change. However, the estimated parameter increases when spatial scale increases for the other two tree species, western hemlock and western red cedar. A short discussion about the advantages and limitations of the probability model and its parameter estimation methods is also presented. Theoretically, the probability distribution model presented in this study is applicable to all kinds of spatial point patterns ranging from highly aggregated to complete random. However, as the actual point patterns of tree species usually deviate from theoretical assumptions, the probability distribution model has a few shortcomings such as scale dependence. To gain a better fitting, higher orders of nearest neighbor distances are needed. A balance between field work burden and performance of model fitting should be considered. We suggest that ideal orders of nearest neighbor distances are from 2 to 6. Another potential that can improve the fitting performance is using mixed probability distributions.

      spatial point pattern; aggregated distribution; parameter optimization; genetic algorithm

      國家自然科學基金項目(31000197, 31570423);中國科學院知識創(chuàng)新工程項目(KZCX2-EW-QN209)

      2014-12-18; 網(wǎng)絡出版日期:2015-10-30

      Corresponding author.E-mail: mgao@yic.ac.cn

      10.5846/stxb201412182517

      高猛.植物空間分布格局中鄰體距離的概率分布模型及參數(shù)估計.生態(tài)學報,2016,36(14):4406-4414.

      Gao M.Nearest neighbor distance in spatial point patterns of plant species-probability distribution model and parameter estimation.Acta Ecologica Sinica,2016,36(14):4406-4414.

      猜你喜歡
      概率分布參數(shù)估計格局
      基于新型DFrFT的LFM信號參數(shù)估計算法
      離散型概率分布的ORB圖像特征點誤匹配剔除算法
      格局
      聯(lián)手共建 努力打造大調解工作格局
      人民調解(2019年5期)2019-03-17 06:55:16
      關于概率分布函數(shù)定義的辨析
      科技視界(2016年19期)2017-05-18 10:18:46
      Logistic回歸模型的幾乎無偏兩參數(shù)估計
      基于概率分布的PPP項目風險承擔支出測算
      基于向前方程的平穩(wěn)分布參數(shù)估計
      基于競爭失效數(shù)據(jù)的Lindley分布參數(shù)估計
      小人物的大格局
      小說月刊(2015年12期)2015-04-23 08:51:10
      朝阳区| 八宿县| 库车县| 沙坪坝区| 泰和县| 襄城县| 阿尔山市| 永仁县| 马公市| 泊头市| 新巴尔虎左旗| 太仓市| 青河县| 五原县| 阿荣旗| 尚义县| 林甸县| 怀宁县| 汽车| 新野县| 江门市| 唐河县| 平武县| 萝北县| 新余市| 长治市| 石城县| 平和县| 甘德县| 三原县| 定南县| 灵川县| 巴南区| 错那县| 汝州市| 鄯善县| 柏乡县| 凤城市| 黄浦区| 内丘县| 阳高县|