蘇錦河, 樸英超, 羅 澤, 閻保平
1(中國科學(xué)院 計(jì)算機(jī)網(wǎng)絡(luò)信息中心, 北京 100190)
2(中國科學(xué)院大學(xué), 北京 100049)
人口規(guī)模的增長和全球氣候的不斷變化對野生動物的生存環(huán)境產(chǎn)生極大的負(fù)面影響[1].了解動物的潛在棲息地是生態(tài)學(xué)、自然資源管理和保護(hù)的中心主題之一[2].物種分布模型利用動物出現(xiàn)的數(shù)據(jù)并結(jié)合出現(xiàn)點(diǎn)所在位置的多種生態(tài)位因子, 例如溫度、降雨、土壤、斜坡、植被指數(shù)等因子, 對物種分布進(jìn)行建模, 進(jìn)而預(yù)測物種在其它特定地區(qū)或者在相同區(qū)域不同時(shí)間出現(xiàn)的概率值, 概率值的大小反應(yīng)了物種對該地區(qū)環(huán)境的偏好程度.因此物種分布模型可以用來分析物種與環(huán)境變量之間的關(guān)系, 尤其是氣候變化條件下對物種潛在棲息地分布的影響[3], 還有助于研究入侵物種潛在的棲息地?cái)U(kuò)張范圍[4,5]或者瀕危物種潛在棲息地的萎縮[6].在動物出現(xiàn)數(shù)據(jù)獲取方式上, 傳統(tǒng)的方式是通過野外調(diào)查、各標(biāo)本館的標(biāo)本數(shù)據(jù)、各類公開的文獻(xiàn)記載等方式獲取有用的數(shù)據(jù), 這種方式獲取的單個(gè)物種尤其是稀有物種的有效樣本非常少且容易存在誤差,尤其是地理位置精度不高, 例如有些較早記錄沒有經(jīng)緯度信息, 只存儲所在位置的縣名, 甚至是所在的省市.近年來隨著各種先進(jìn)數(shù)據(jù)采集設(shè)備的廣泛應(yīng)用, 例如Argos, GPS和無線追蹤器等, 使得我們可以對單一物種獲得大量的有效的動物出現(xiàn)數(shù)據(jù), 有利于我們提取更多的有效訓(xùn)練樣本從而使用更加復(fù)雜的模型對其進(jìn)行建模和預(yù)測.
最大熵模型(MaxEnt)[7]自從提出來以來就被廣泛應(yīng)用來預(yù)測各種動植物的潛在分布或者分析入侵物種的適合生長區(qū).Gibson[8]等人利用MaxEnt模型來預(yù)測稀有物種鸚鵡在澳大利亞西南部的潛在分布, 通過模型得到鸚鵡喜歡海拔相對較高, 遠(yuǎn)離河流, 有植被覆蓋的地形相對平緩的棲息地.吳慶明[9]等人利用丹頂鶴2012-2013年?duì)I巢分布點(diǎn)和環(huán)境特征變量, 通過MaxEnt分析丹頂鶴在扎龍保護(hù)區(qū)的潛在棲息地分布情況.Hu[3]等人利用 MaxEnt對地形, 氣候, 生境 (土地覆蓋)和人為影響這些變量進(jìn)行建模, 預(yù)測瀕危候鳥在五個(gè)不同地區(qū)的潛在越冬棲息地以及在不考慮物種傳播的基礎(chǔ)上分析將來氣候變化對越冬棲息地的影響.MaxEnt模型的最大好處是只需要物種在研究區(qū)域明確出現(xiàn)的數(shù)據(jù)以及出現(xiàn)位置的環(huán)境信息就可以有效的進(jìn)行建模分析, 尤其在小樣本集的情況下比其它物種模型取得更好的效果.近年來隨著機(jī)器學(xué)習(xí)應(yīng)用面的日益擴(kuò)展, 越來越多的方法利用有/無物種出現(xiàn)數(shù)據(jù)建立機(jī)器學(xué)習(xí)模型來預(yù)測物種分布[6,10–14], 包括人工智能網(wǎng)絡(luò)(ANN)[12], 分類回歸(CART)[13], 隨機(jī)森林算法[14]等.Yoo[12]等人通過ANN對50個(gè)地點(diǎn)收集的13個(gè)生態(tài)位變量數(shù)據(jù)進(jìn)行建模, 預(yù)測潮汐灘地的物種多樣性.基于生態(tài)位的方法來分析物種的潛在分布主要存在以下三個(gè)問題:1)將原始遙感數(shù)據(jù)聚合成離散的土地覆蓋類型或者植被覆蓋指數(shù)會導(dǎo)致新的分類誤差, 而且在轉(zhuǎn)換過程中大量其它可用的信息可能會丟失以及導(dǎo)致時(shí)間粒度和空間分辨率變大.2)對原始遙感影像進(jìn)行分類從而獲得相應(yīng)的生態(tài)位因子, 這個(gè)過程本身就需要花費(fèi)大量的計(jì)算和人力成本.盡管中尺度的遙感影像是免費(fèi)公開的, 但是對影像進(jìn)行分類需要有一定的相關(guān)領(lǐng)域知識以及相關(guān)的計(jì)算過程.3)傳統(tǒng)方法在樣本選擇上往往局限于少數(shù)一些觀察點(diǎn), 在時(shí)間跨度和空間范圍上都有一定的限制, 適合于棲息地范圍分布地比較集中的物種.斑頭雁夏季繁殖在高原湖泊, 越冬則在低地湖泊、河流和沼澤地等, 主要以禾本科和莎草科植物的葉、莖、青草和豆科植物種子等植物性食物為食.因此影響斑頭雁潛在分布的主要因素有植被情況, 湖泊河流分布和溫度等.我們可以從遙感影像中提取植被情況和湖泊河流分布情況, 以及從氣象站中獲取溫度數(shù)據(jù), 因此本文直接以遙感圖像作為卷積神經(jīng)網(wǎng)絡(luò)模型的輸入, 避免了傳統(tǒng)生態(tài)位模型中提取特征的過程, 然后結(jié)合溫度對斑頭雁的出現(xiàn)數(shù)據(jù)進(jìn)行建模.
本文首先利用斑頭雁的軌跡數(shù)據(jù), 結(jié)合Landsat遙感影像來獲得空間和時(shí)間都跨度大的有效訓(xùn)練樣本,從而解決傳統(tǒng)數(shù)據(jù)樣本少的問題.由于斑頭雁每年都會在越冬區(qū)和繁殖區(qū)之間進(jìn)行來回遷徙, 我們通過DBSCAN聚類算法對軌跡數(shù)據(jù)進(jìn)行聚類來發(fā)現(xiàn)其在整個(gè)年度活動過程中的停留區(qū), 從停留區(qū)提取的數(shù)據(jù)來標(biāo)記遙感影像數(shù)據(jù)的正(出現(xiàn))樣本, 避免遷徙飛行過程中的數(shù)據(jù)產(chǎn)生的干擾, 能更加符合斑頭雁的實(shí)際棲息地環(huán)境;其次, 設(shè)計(jì)一種多維卷積神經(jīng)網(wǎng)絡(luò)(MCNN)結(jié)構(gòu), 利用1-D卷積和2-D卷積操作來分別從溫度序列數(shù)據(jù)和遙感影像圖片提取特征從而進(jìn)行訓(xùn)練并預(yù)測斑頭雁在青海湖地區(qū)的潛在棲息地.
本文的系統(tǒng)主要分為兩步(如圖1所示):1)正/負(fù)樣本提取, 斑頭雁是遷徙物種, 每年都會進(jìn)行春季和秋季遷徙, 越冬區(qū)和夏季活動區(qū)距離很遠(yuǎn), 相差一兩千公里, 導(dǎo)致采集到的原始GPS數(shù)據(jù)覆蓋范圍很廣(如圖2),直接將所有GPS點(diǎn)所在的位置都劃為正樣本顯然不符合斑頭雁實(shí)際情況.2)模型訓(xùn)練和預(yù)測.
圖1 基于 CNN 的棲息地預(yù)測算法
圖2 藍(lán)色點(diǎn)為采集的斑頭雁GPS數(shù)據(jù)點(diǎn);綠色點(diǎn)為基于DBSCAN的斑頭雁軌跡數(shù)據(jù)聚類結(jié)果, 表示斑頭雁的棲息地;紅色為NOOA上離這些棲息地最近的10個(gè)氣象站.
DBSCAN[15]是一種典型的基于密度的聚類算法,它將在給定半徑的鄰域中包含的點(diǎn)大于給定的最小值的點(diǎn)作為核心點(diǎn), 通過迭代查找的方法找到各個(gè)類簇所包含的所有密度可達(dá)的點(diǎn).斑頭雁的運(yùn)動軌跡無法連續(xù)記錄下來, 而是由一系列離散的采樣點(diǎn)組成,traj=(p1,p2,···,pn).每個(gè)采樣點(diǎn)用一個(gè)三元組表示,即:pi= (xi,yi,ti), 其中xi,yi分別表示采集點(diǎn)所處的經(jīng)度和維度,ti表示該采樣點(diǎn)的采集時(shí)間(如表1).我們首先利用DBSCAN對斑頭雁的軌跡數(shù)據(jù)點(diǎn)進(jìn)行聚類, 將每一個(gè)類簇作為斑頭雁的一個(gè)棲息地(如圖2綠色點(diǎn));然后我們下載斑頭雁在每個(gè)棲息地內(nèi)的停留時(shí)間對應(yīng)的 Landsat 5 TM 遙感影像, 并將每張遙感影像按照16×16像素的大小分成二維的圖片, 將和停留區(qū)有重疊的圖片作為正樣本, 否則為負(fù)樣本.
表1 lon 和 lat表示經(jīng)緯度, animal表示采集的動物的編號, time采集時(shí)間
CNN是一種主要由卷積層、池化層、全連接層和激活函數(shù)組成的多層深度神經(jīng)網(wǎng)絡(luò)模型, 采用卷積核共享參數(shù), 減少了訓(xùn)練的參數(shù).圖3為本文的M-CNN網(wǎng)絡(luò)結(jié)構(gòu).2-D卷積的輸入數(shù)據(jù)為6通道的16×16像素塊大小的Landsat 5 TM影像和1-D的卷積輸入為15×3大小的溫度序列數(shù)據(jù), 隨后圖片數(shù)據(jù)通過三層卷積, 兩層最大池化層, 溫度數(shù)據(jù)經(jīng)過兩層卷積層, 然后將兩個(gè)卷積過程獲得的特征拼接起來輸出到兩層全連接層和兩層Dropout層, 最后輸出到softmax分類器.卷積神經(jīng)網(wǎng)絡(luò)的第一層卷積層的濾波器主要用來檢測低階特征, 比如邊、角、曲線等, 越往后的卷積層檢測更高階的特征.我們在第一層分別使用多個(gè)不同尺寸的卷積核, 以獲得不同尺度的特征, 再把這些特征結(jié)合起來作為第一層卷積層的輸出來以獲得更好的低階特征.為了減少訓(xùn)練過程中的內(nèi)部協(xié)變量偏移(internal covariate shift), 我們在執(zhí)行激活函數(shù)前加入了批量規(guī)范化 (batch normalization)操作[16], 使得輸出的各個(gè)維度的均值為0, 方差為1, 這也有助于提高模型的收斂速度和減少對Dropout的要求.
卷積層可以看成是輸入圖像/前一層特征圖與一個(gè)可訓(xùn)練的卷積核進(jìn)行卷積運(yùn)算得到的結(jié)果, 例如第一個(gè)1×1的卷積成可以用如下表示:
批量規(guī)范化操作如果將前一層的數(shù)據(jù)做規(guī)范化后直接進(jìn)入下一層會改變前一層網(wǎng)絡(luò)所學(xué)到的特征, 因此作者引入了一對可學(xué)習(xí)參數(shù)γ和β, 使得整個(gè)批量規(guī)范操作如下[16]:
其中,m為批量訓(xùn)練樣本的大小,ε是加入的噪聲.
圖3 棲息地預(yù)測系統(tǒng)的 M-CNN 網(wǎng)絡(luò)結(jié)構(gòu), 其中 Conv 為卷積層, BN 表示 Batch Normalization, FC 為全連接層
池化層經(jīng)常在卷積層后面, 能夠?qū)矸e所輸出的圖像特征進(jìn)行聚合統(tǒng)計(jì).將上一層輸出的卷積特征劃分到若干個(gè)不重疊的大小為m×n的區(qū)域上, 最大池化就是用這m×n個(gè)位置上的最大值作為池化后的卷積特征而舍棄其它位置的值.這樣CNN不關(guān)注池化窗口內(nèi)到底是在哪一個(gè)位置匹配上了, 只關(guān)心是不是有匹配上.池化層在一定程度上還能降低網(wǎng)絡(luò)的復(fù)雜度, 減少計(jì)算量和降低過擬合.
Dropout指在每次批量訓(xùn)練模型時(shí)以一定的概率隨機(jī)讓網(wǎng)絡(luò)中某些隱含層節(jié)點(diǎn)的權(quán)重暫時(shí)不工作, 在下一輪訓(xùn)練時(shí)這些神經(jīng)元又會恢復(fù), 然后再次以一定的概率隨機(jī)選擇部分神經(jīng)元暫時(shí)不工作.由于每次輸入的批量樣本進(jìn)行權(quán)值更新時(shí), 隱含節(jié)點(diǎn)都是以一定概率隨機(jī)出現(xiàn), 從而使得權(quán)值的更新不再依賴于有固定關(guān)系隱含節(jié)點(diǎn)的共同作用, 相當(dāng)于網(wǎng)絡(luò)結(jié)構(gòu)在每次訓(xùn)練過程中都發(fā)生變化, 避免了對某一局部特征的過擬合.
本文實(shí)驗(yàn)數(shù)據(jù)來主要來自青海湖地區(qū)的29只斑頭雁, 它們從2007年到2010年的在青海湖區(qū)域和錯愕湖區(qū)域之間來回遷徙, 每只斑頭雁攜帶有一個(gè)便攜式遙感設(shè)備, 能夠通過Argos衛(wèi)星和GPS接收器進(jìn)行定位和發(fā)送數(shù)據(jù), 采集間隔時(shí)間設(shè)為2小時(shí), 采集數(shù)據(jù)的存儲格式如表1所示, 總共采集到60 161個(gè)GPS點(diǎn)(如圖2藍(lán)色的點(diǎn)).斑頭雁的棲息地主要分布在從青海湖地區(qū)到斑頭雁越冬區(qū)沿途經(jīng)過的地方, 通過DBSCAN聚類結(jié)果(如圖2)我們可以看到主要包括哈拉湖, 青海湖, 冬給措納湖, 扎陵湖, 鄂陵湖, 曲麻萊縣, 隆寶灘自然保護(hù)區(qū), 扎木措濕地, 納木錯湖, 羊卓雍錯, 拉薩河, 雅魯藏布江等區(qū)域, 其中青海湖和扎鄂陵陵湖是主要的繁殖區(qū)和換羽區(qū), 羊卓雍錯, 拉薩河,雅魯藏布江是主要的越冬區(qū).
本文使用的Landsat 5 TM的遙感影像從USGS(https://earthexplorer.usgs.gov/)官網(wǎng)下載.我們下載所有研究區(qū)域內(nèi)從2007年到2009年的遙感影像, 通過分析其自帶的元數(shù)據(jù)文件, 移除云層覆蓋率大于20%或者影像時(shí)間前后十天內(nèi)沒有出現(xiàn)過斑頭雁的遙感影像, 剩下的影像用來提取訓(xùn)練數(shù)據(jù), 然后下載2010年8月和2011年2月青海湖及其周圍區(qū)域的4幅云層覆蓋率小于20%的遙感影像.每幅遙感影像有 7個(gè)波段, 我們使用其中的 B1, B2, B3, B4, B5和B7六個(gè)波段的值, 每個(gè)像素點(diǎn)的分辨率為30 m, 我們樣本的大小為 16×16×6, 對應(yīng)的分辨率為 480 m, 基本上和GPS設(shè)備定位的最大誤差相接近.本文使用了從青海湖到西藏越冬區(qū)沿途的10個(gè)包含有2007年到2010年溫度數(shù)據(jù)的氣象站(如圖2所示), 所有溫度數(shù)據(jù)從NOOA(http://gis.ncdc.noaa.gov)網(wǎng)站上下載, 每個(gè)氣象站每天都保存最高溫度、最低溫度和平均溫度.針對每幅遙感影像, 我們將離它最近的氣象站的當(dāng)前遙感影像時(shí)間的前后7天(包括遙感影像當(dāng)天, 共15天)的平均溫度、最低溫度和最高溫度作為遙感影像的溫度特征.
經(jīng)過2.1部分的正/負(fù)樣本提取后, 我們總共得到26 023張 16×16×6大小的圖片, 其中正樣本 8696張,負(fù)樣本 17 327張.為了使正負(fù)樣本的數(shù)量更加平衡, 我們對每張正樣本分別進(jìn)行左旋轉(zhuǎn)90度和又旋轉(zhuǎn)90度的數(shù)據(jù), 并隨機(jī)抽取2000張加入樣本集中, 并按9:1比例分成訓(xùn)練樣本和測試樣本.因此, 最后我們共得到28 023張圖片, 正樣本 10 696張, 負(fù)樣本 17 327張, 對應(yīng)的訓(xùn)練樣本和測試樣本分別是25 221張和2802張.
卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練主要采用梯度下降法, 包括批量梯度下降(BGD)、隨機(jī)梯度下降(SGD)和小批量梯度下降(MGD).其中, 批量梯度下降法每次迭代需要所有樣本參與運(yùn)算, 能夠?qū)ふ业饺肿顑?yōu)解, 但是收斂速度比較慢.隨機(jī)梯度下降法則每次迭代利用一個(gè)樣本來更新參數(shù), 計(jì)算成本低, 收斂速度快, 缺點(diǎn)是單個(gè)樣本可能會帶來很多噪聲, 使得每次更新不一定朝著全局最優(yōu)的方向, 容易造成收斂到局部最優(yōu)解.
本文采用的小批量梯度下降法可以看成是前兩種方法的一種折中, 每次迭代計(jì)算一小批樣本的梯度來更新參數(shù)的權(quán)值, 這樣能夠在盡可能尋找到全局最優(yōu)解的同時(shí)加快模型的收斂速度.為了防止過擬合, 利用L2正則化對網(wǎng)絡(luò)參數(shù)進(jìn)行約束, 并在全連接層的訓(xùn)練過程中引入了Dropout策略, 即每次迭代中隨機(jī)放棄一部分訓(xùn)練好的參數(shù)[17].在模型訓(xùn)練初期, 可以使用較大的學(xué)習(xí)率來加速收斂, 當(dāng)訓(xùn)練集的損失下降到一定程度后就不再下降, 容易在一個(gè)局部范圍內(nèi)震蕩.為了解決這個(gè)問題, 我們采用學(xué)習(xí)率衰減的方法, 學(xué)習(xí)率隨著訓(xùn)練的進(jìn)行逐漸衰減.整個(gè)模型的訓(xùn)練參數(shù)如表2所示.
表2 CNN 模型訓(xùn)練參數(shù)
我們設(shè)置了兩組實(shí)驗(yàn), 每組實(shí)驗(yàn)都和傳統(tǒng)的兩個(gè)方法進(jìn)行對比:基于灰度共生矩陣的特征提取的SVM分類(GLCM+SVM)和本文采用的網(wǎng)絡(luò)結(jié)構(gòu)中去掉1-D卷積部分的CNN網(wǎng)絡(luò)(CNN).
對于GLCM+SVM模型, 我們將圖片的灰度級別設(shè)為64, 每個(gè)點(diǎn)選取8組不同的偏移量來計(jì)算灰度共生矩陣.由于灰度共生矩陣的數(shù)據(jù)量較大, 一般不直接作為區(qū)分紋理的特征, 本文選取常見的基于灰度共生矩陣計(jì)算出來的統(tǒng)計(jì)量來作為SVM模型的輸入特征,包括均值、相關(guān)性、對比度、能量、均勻性和最大相關(guān)系數(shù)等.
第一組實(shí)驗(yàn), 我們分別訓(xùn)練各個(gè)模型, 然后利用二分類常見的三個(gè)指標(biāo):總體準(zhǔn)確率、F1值和曲線下面積 (Area Under the Curve of ROC, AUC)[3]來評價(jià)各個(gè)模型的性能.在第二個(gè)實(shí)驗(yàn)中, 我們利用訓(xùn)練好的模型來預(yù)測青海湖周圍斑頭雁潛在的棲息地情況.青海湖夏天是斑頭雁重要的繁殖地, 而冬天都往南遷徙, 很少有斑頭雁停留[13], 因此我們分別選取夏季(8月)和冬季(2月)兩個(gè)不同時(shí)期的遙感影像來分析各個(gè)模型的預(yù)測結(jié)果.
本文實(shí)驗(yàn)環(huán)境為 12核 Intel(R) Xeon(R) CPU E5-2620, 無 GPU, 內(nèi)存 64 GB, 編程語言 python2.7, 采用Tensorflow-0.9.0深度學(xué)習(xí)框架[18]進(jìn)行CNN神經(jīng)網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí).表3顯示了各個(gè)模型在訓(xùn)練數(shù)據(jù)集上的結(jié)果, 可以看出我們設(shè)計(jì)的網(wǎng)絡(luò)結(jié)構(gòu)在各個(gè)指標(biāo)上都取得比較好的成績.和卷積神經(jīng)網(wǎng)絡(luò)相比, 傳統(tǒng)的GLCM+SVM在提取特征上沒有優(yōu)勢.
表3 3個(gè)模型在訓(xùn)練數(shù)據(jù)集上的分類結(jié)果
我們選取2010年8月份和2011年2月份的青海湖及其周圍的遙感影像進(jìn)行預(yù)測, 預(yù)測的斑頭雁潛在棲息地分布如圖4所示.對于8月份(圖4第一列)的預(yù)測結(jié)果, GLCM+SVM模型在沿湖區(qū)域基本上沒有概率特別高的區(qū)域, 預(yù)測的潛在分布都是在湖面上;CNN和M-CNN模型都會將沿著湖邊的部分或者大部分區(qū)域標(biāo)記為概率非常高的區(qū)域, 標(biāo)記面積MCNN模型會略大于CNN模型;各個(gè)模型在湖面的處理表現(xiàn)差異比較大, 基本上都將湖面標(biāo)記為潛在分布區(qū), 其中CNN模型會將部分標(biāo)記為低概率(顏色更深),其它兩個(gè)模型基本都是標(biāo)記為高概率.8月份, 在青海湖地區(qū)對于繁殖成功的斑頭雁主要活動是帶領(lǐng)幼鳥覓食, 其它斑頭雁則進(jìn)行換羽或者在儲備食物做秋季遷徙前的準(zhǔn)備.這些任務(wù)都要求斑頭雁在食物更豐富、外界因素干擾更小的河口和支流濕地去活動, 這些地方都在離湖面一段距離的地方.因此M-CNN模型將青海湖離湖較近及其離湖面一段距離內(nèi)的地方都標(biāo)記為高概率區(qū)域, 更加符合實(shí)際情況.
圖4 從上到下三行分別是GLCM+SVM、CNN和M-CNN模型;第一列是2010年8月份的預(yù)測結(jié)果, 第二列是2011年2月的預(yù)測結(jié)果.很低、低、高、很高表示斑頭雁出現(xiàn)的概率, 其中很低用透明色表示, 即顯示背景.
2月份斑頭雁基本上還在西藏或者其它越冬區(qū), 或者在往青海湖遷徙的前期, 青海湖上還基本上沒有適合斑頭雁的地方.從圖4第2列中可以看出來三個(gè)模型都錯誤的將少部分區(qū)域標(biāo)記為潛在分布區(qū), 錯誤標(biāo)記的面積大小GLCM+SVM>CNN>M-CNN, 也可以看出我們模型準(zhǔn)確度更高.
本文利用斑頭雁的軌跡數(shù)據(jù), 結(jié)合Landsat遙感影像, 提出一種基于M-CNN模型的候鳥棲息地預(yù)測方法, 利用1-D卷積和2-D卷積分別從溫度序列和遙感影像中提取特征.有別于傳統(tǒng)的方法從遙感影像中計(jì)算生態(tài)位值作為分類器的特征, 卷積神經(jīng)網(wǎng)絡(luò)能夠自動從圖片中進(jìn)行學(xué)習(xí), 直接處理原始遙感影像來實(shí)現(xiàn)對斑頭雁潛在棲息地的預(yù)測.基于生態(tài)位因子模型一般都是研究大范圍區(qū)域內(nèi)適合某個(gè)物種的區(qū)域分布,基于遙感影像建模能夠比它提供更高空間分辨率和更細(xì)時(shí)間粒度的潛在分布結(jié)果, 有助于更好的了解物種的分布和更好的進(jìn)行保護(hù).由于遙感影像數(shù)據(jù)容易受到云層的影響, 當(dāng)研究區(qū)域被云覆蓋住時(shí), 就無法提取有效數(shù)據(jù), 而遙感影像周期又比較長, 因此如何減少云覆蓋的影響是今后研究的重點(diǎn).