王帥,覃馭楚,楊富坤
(1 中國科學(xué)院遙感與數(shù)字地球研究所 遙感科學(xué)國家重點實驗室, 北京 100101; 2 中國科學(xué)院大學(xué)資源與環(huán)境學(xué)院, 北京 100049)
土地覆蓋是開展地表生態(tài)環(huán)境研究的重要內(nèi)容,在土地覆蓋/土地利用變化、環(huán)境污染、土地退化、生物多樣性喪失等問題日趨嚴重的情況下,及時可靠的全球土地覆蓋制圖產(chǎn)品是地表生態(tài)環(huán)境研究的基礎(chǔ)數(shù)據(jù)[1]。城市化是人類影響地表土地覆蓋最顯著的因素,目前全世界超過50%的人口居住在城市地區(qū),而這一比例在1950年僅為30%,預(yù)計到2050年,城市人口會達到世界人口總數(shù)的66%[2]。雖然城市僅僅覆蓋地球表面相對較小的部分,但城市區(qū)域的研究對人類住房需求、氣候變化研究與應(yīng)對、災(zāi)害風(fēng)險防范以及城市發(fā)展等可持續(xù)發(fā)展目標有著至關(guān)重要的作用[3-4]。然而,目前并沒有經(jīng)過嚴格數(shù)據(jù)質(zhì)量檢驗的全球尺度居民地制圖產(chǎn)品來支撐地表生態(tài)環(huán)境變化的研究[5-6],因此研發(fā)大尺度建成區(qū)建筑密度遙感估算模型與算法,形成大尺度、長時間序列的建設(shè)區(qū)遙感制圖產(chǎn)品就成為亟待解決的問題。
全球人類居住區(qū)層(global human settlement layer,簡稱GHSL)是由歐盟聯(lián)合研究中心(Joint Research Centre,簡稱JRC)負責(zé)的大面積人居環(huán)境制圖項目。全球人類居住區(qū)層為過去40年(1975—2015年)建筑和人口的增長提供了詳細的數(shù)據(jù),該資料中包含關(guān)于城市化評估、土地覆蓋變化、城市規(guī)劃和管理等[4,7-9]較為全面的數(shù)據(jù)資料。GHSL是利用陸地衛(wèi)星遙感影像提取的一套全球人類居住區(qū)制圖產(chǎn)品。研究人員提出一種基于符號機器學(xué)習(xí)的新分類方法[10-11],利用盡可能長時間序列的遙感數(shù)據(jù)提取人居環(huán)境信息。GHSL嘗試采用全球MSS(multispectral scanner sensor)數(shù)據(jù)進行人類居住地信息提取,這也是已知的首次探索使用數(shù)字高程模型數(shù)據(jù)輔助生成全球居民地制圖產(chǎn)品的嘗試。GHSL建成區(qū)建筑密度遙感制圖產(chǎn)品作為實驗性的產(chǎn)品,目前在歐洲和美國地區(qū)完成驗證[5],該驗證主要采用歐洲聯(lián)盟統(tǒng)計辦公室(EUROSTAT)發(fā)布的大面積實地調(diào)查數(shù)據(jù)和高于1∶10 000比例尺的建筑足跡數(shù)字制圖產(chǎn)品作為驗證數(shù)據(jù)集。其中GHSL在歐美的驗證中使用LUCAS(land use/cover area frame survey)調(diào)查收集的土地覆蓋類別[12],研究人員將人工土地類別(也稱建筑類)劃分為3個子類,即低建筑、高建筑和溫室。低建筑指的是1~3層或者10 m以下的建筑;高建筑指的是3層或者10 m以上的房屋類建筑;溫室指的是玻璃、塑料或者其他半透明但不透水的材料建造的建筑物。研究人員將LUCAS調(diào)查的高建筑、低建筑、溫室等3種土地類別數(shù)據(jù)重分類為一個單獨的建筑類,通過像元聚合構(gòu)建與GHSL建成區(qū)建筑密度遙感制圖產(chǎn)品相同空間分辨率的驗證數(shù)據(jù)集,最后通過相關(guān)分析評價產(chǎn)品精度。從驗證結(jié)果看,GHSL建成區(qū)建筑密度遙感制圖產(chǎn)品與建筑物密度具有較好的相關(guān)性,GHSL在歐美區(qū)域是一個很好的建成區(qū)面積數(shù)據(jù)產(chǎn)品。然而,目前GHSL建成區(qū)建筑密度遙感制圖產(chǎn)品在亞洲地區(qū)尤其是中國的高密度城市地區(qū)缺乏相應(yīng)的精度信息。由于亞洲地區(qū)和歐洲地區(qū)人口分布密度、生態(tài)及建筑構(gòu)造等因素存在很多方面的不同,GHSL在亞洲特別是中國區(qū)域的驗證也就成為數(shù)據(jù)產(chǎn)品進一步應(yīng)用的關(guān)鍵問題。本文主要致力于對GHSL的建成區(qū)建筑密度遙感制圖產(chǎn)品在中國典型城市的精度進行驗證與分析,以便于為GHSL數(shù)據(jù)在中國乃至于亞洲地區(qū)的應(yīng)用提供可參考的精度信息。
本文主要以上海、西安、長春、昆明及烏魯木齊5個城市單體建筑物分布圖為基礎(chǔ)數(shù)據(jù),通過對單體建筑矢量數(shù)據(jù)的聚合,得出與JRC發(fā)布的建成區(qū)建筑密度遙感制圖產(chǎn)品同等分辨率(250與1 000 m)的中國建成區(qū)面積密度柵格圖像產(chǎn)品作為驗證數(shù)據(jù)評估GHSL建成區(qū)建筑密度遙感制圖產(chǎn)品在中國地區(qū)的精度,以期為GHSL建成區(qū)建筑密度遙感制圖產(chǎn)品在中國地區(qū)的應(yīng)用提供可參考的精度信息。
本研究選取中國不同地域的5個城市作為研究區(qū)域,東北地區(qū)選取長春,華東地區(qū)選取上海,西南地區(qū)選取昆明,西北地區(qū)選取烏魯木齊和西安。由于5個城市的發(fā)展?fàn)顟B(tài)和人口數(shù)量不同,建筑物形態(tài)和分布也會存在差別,因此,本文選擇的5個城市可作為中國大部分地區(qū)城市建成區(qū)建筑密度的代表。選取的5個城市的地理位置如圖1所示。
圖1 研究區(qū)示意圖Fig.1 Study areas
建成區(qū)建筑密度通常用單位面積中單體建筑面積占用比例表示。本文從百度地圖中提取的單體建筑物數(shù)據(jù),處理得到250與1 000 m分辨率的建筑物密度數(shù)據(jù)作為驗證數(shù)據(jù),對GHSL建筑物密度產(chǎn)品數(shù)據(jù)進行驗證。
1.2.1 GHSL產(chǎn)品數(shù)據(jù)
建成區(qū)產(chǎn)品使用的統(tǒng)計數(shù)據(jù)是隨時間變化的衛(wèi)星影像中提取的建筑信息,以1975、1990、2000和2014年4個時間節(jié)點為中心形成時間序列,統(tǒng)計建筑面積的變化。每個時間序列又分為38、250和1 000 m分辨率建成區(qū)產(chǎn)品。本文選取GHSL最新產(chǎn)品數(shù)據(jù),即2014年250與1 000 m分辨率的建成區(qū)遙感制圖產(chǎn)品在中國地區(qū)進行驗證。GHSL建成區(qū)建筑物密度遙感制圖在上海地區(qū)的示例如圖2所示。
圖2 GHSL建成區(qū)建筑物密度遙感制圖(上海)Fig.2 GHSL BDM of built-up areas (Shanghai)
1.2.2 單體建筑數(shù)據(jù)
在本次驗證中所需的驗證數(shù)據(jù)以地面真實建筑輪廓為依據(jù),由于手工繪制單體建筑分布圖耗時耗力,因此從百度地圖(https:∥map.baidu.com/)最高縮放等級19級,根據(jù)房屋特征獲取建筑物輪廓二值圖(2017年獲取),然后經(jīng)過拼接、濾波、矢量化和配準等操作得到單體建筑輪廓的矢量數(shù)據(jù)。利用此方法獲取烏魯木齊、長春、上海、昆明和西安5個中國省會城市單體建筑物分布圖。選取覆蓋市中心的18 km×18 km的正方形研究區(qū)域。每個城市獲取的建筑輪廓數(shù)據(jù)范圍如圖3所示。
GHSL建成區(qū)建筑密度遙感制圖產(chǎn)品的驗證,需要將百度(BD)地圖中提取處理的單體建筑矢量數(shù)據(jù)聚合成與GHSL建成區(qū)建筑密度產(chǎn)品同等分辨率的影像。處理過程如圖4所示。
具體處理可分為以下4個步驟:
1) 生成格網(wǎng):將單體建筑矢量數(shù)據(jù)轉(zhuǎn)換成與GHSL建成區(qū)建筑密度遙感制圖產(chǎn)品空間分辨率一致的柵格數(shù)據(jù),需要有與GHSL建成區(qū)建筑密度遙感制圖產(chǎn)品柵格位置一致的矢量格網(wǎng)數(shù)據(jù)。因此,利用GHSL建成區(qū)建筑密度遙感制圖產(chǎn)品的柵格數(shù)據(jù)生成1 000 m分辨率的本文所需的格網(wǎng)。
2) 交集運算:將格網(wǎng)與單體建筑矢量數(shù)據(jù)進行交集運算,以將單體建筑矢量數(shù)據(jù)的屬性疊加到每個網(wǎng)格中。
圖3 5個城市內(nèi)研究范圍的單體建筑分布圖Fig.3 Individual building distributions in the study scopes of the five cities
圖4 數(shù)據(jù)聚合流程圖Fig.4 Flow chart of data aggregation
3) 建筑面積密度計算:建筑面積密度的計算公式為
Pi,j=Si,j/S,
(1)
式中:Pi,j是每個網(wǎng)格中的建筑密度,Si,j是第(i,j)個網(wǎng)格中單體建筑的面積,S是網(wǎng)格面積。
4) 矢量轉(zhuǎn)柵格:將帶有建筑密度屬性的網(wǎng)格數(shù)據(jù)轉(zhuǎn)換成柵格數(shù)據(jù),得到本文需要的建筑密度驗證數(shù)據(jù)。
由于GHSL建筑物密度產(chǎn)品為2014年數(shù)據(jù)產(chǎn)品,而獲取的BD建筑物密度數(shù)據(jù)為2017年更新數(shù)據(jù),因此在谷歌地圖上選擇2014年12月影像數(shù)據(jù)與2016年12月影像數(shù)據(jù)進行目視對比(如圖5所示),發(fā)現(xiàn)5個城市在研究區(qū)域內(nèi)地物變化不大,并且所選區(qū)域為城市主城區(qū),城區(qū)內(nèi)拆建對研究影響并不明顯,因此可以保證兩個時期建筑物密度對比結(jié)果有一定的指示意義。
將BD建筑物密度數(shù)據(jù)處理得到與GHSL建
筑物密度產(chǎn)品同一分辨率下,并且在同一色度范圍(0~1)內(nèi)進行對比。如圖6所示,GHSL建筑物密度數(shù)據(jù)相比BD建筑物密度數(shù)據(jù)在整體上要偏高,但是數(shù)據(jù)高值區(qū)與低值區(qū)分布相似,1 000 m分辨率的影像對比中更加明顯。由于GHSL建筑密度數(shù)據(jù)是由Landsat 30 m分辨率數(shù)據(jù)得到,在建筑分類時受到混合像元的影響[5, 13],部分道路(尤其是瀝青混凝土道路)、綠化等會混入像元中,因此對于單一像元會產(chǎn)生較大的誤差,這種誤差會造成整體建筑物密度偏高;并且對于大部分為綠化或者道路的像元中,如果混入建筑物,單棟建筑和被植被包圍的小型聚落形態(tài)的建筑難以識別,會使得建筑物密度偏低。
為了更加直觀地對GHSL建筑物密度數(shù)據(jù)與BD建筑物密度數(shù)據(jù)進行對比,本文對上海、長春、西安、烏魯木齊和昆明5個城市研究區(qū)域內(nèi)的像元進行統(tǒng)計,在250與1 000 m分辨率下對不同密度等級下的像元數(shù)進行柱狀圖統(tǒng)計(圖7),并得到不同城市在不同密度等級下像元占比,如表1所示。除昆明外,其他4個城市GHSL建筑密度主要集中于0.8以上,占比超過50%,尤其是上海和長春建筑相對密集的城市,其占比超過70%;BD建筑密度主要集中于0~0.3,由于是對單體建筑物進行提取,在進行柵格處理時不會受到混合像元的影響,因此可以認為BD建筑密度數(shù)據(jù)為城市建筑密度真實值。結(jié)合圖5、圖6可以看出,昆明城市區(qū)域建筑相對稀疏,在建筑密度上主要集中于0.4以下。
圖5 5個城市研究區(qū)域2個時期(2014年12月與2016年12月)谷歌地圖對比Fig.5 Comparison between Google maps in December 2014 and in December 2016 for the five urban research areas
圖6 250與1 000 m分辨率下5個城市研究區(qū)域BD建筑密度分布圖與GHSL建筑密度圖Fig.6 BD built-up areas map and GHSL built-up areas products in the five urban research areas at the 250 and 1 000 m resolutions
表1 250與1 000 m分辨率下5個城市研究區(qū)域內(nèi)建筑密度各等級像元數(shù)占比Table 1 Proportions of building density in the five urban research areas at the 250 and 1 000 m resolutions%
圖7 250與1 000 m分辨率下5個城市研究區(qū)域內(nèi)建筑密度各等級像元數(shù)柱狀圖統(tǒng)計Fig.7 Histogram statistics of building density in the five urban research areas at the 250 and 1 000 m resolutions
為了定量驗證GHSL建筑物密度產(chǎn)品,對GHSL建筑物密度數(shù)據(jù)與BD建筑物密度數(shù)據(jù)進行逐像元對比。如圖8、圖9所示,相比BD建筑密度,GHSL建筑密度數(shù)據(jù)存在較多的高值,尤其是在250 m分辨率下。1 000 m分辨率下各個城市研究區(qū)像元對比得到的R整體高于250 m分辨率。并且相比于250 m分辨率對比結(jié)果,5個城市在1 000 m分辨率下對比驗證的均方根誤差(RMSE)整體偏低,RMSE均小于0.1,因此在實際應(yīng)用中,GHSL建筑物密度產(chǎn)品數(shù)據(jù)在較低分辨率時,有更高的應(yīng)用價值。
本研究主要開展JRC研發(fā)的GHSL建成區(qū)建筑密度遙感制圖產(chǎn)品在中國區(qū)域的驗證對比工作,選取5個代表性城市劃定研究區(qū)域,提供GHSL建成區(qū)建筑密度遙感制圖產(chǎn)品定量化的質(zhì)量評價信息,為該數(shù)據(jù)產(chǎn)品在中國地區(qū)的應(yīng)用提供參考依據(jù)。根據(jù)分析結(jié)果得到的主要結(jié)論如下:
BD建成區(qū)建筑密度數(shù)據(jù)與GHSL建成區(qū)建筑密度遙感制圖產(chǎn)品數(shù)據(jù)存在良好的線性關(guān)系,特別是在1 000 m分辨率下,GHSL建成區(qū)建筑密度遙感制圖產(chǎn)品可以基本反映中國地區(qū)建成區(qū)建筑密度。
在GHSL中,建筑物類被定義為特定傳感器收集的所有空間單元的聯(lián)合,包含建筑或它周圍的一部分[11]。由于混合像元的影響,單一像元內(nèi)會包含單體建筑物、道路、植被以及建筑物本身陰影等信息[5, 13],在建筑較密集地區(qū),道路 (尤其是瀝青混凝土道路)和建筑區(qū)域的混淆都可能被誤分為建筑區(qū)域,因此GHSL建筑密度產(chǎn)品會呈現(xiàn)明顯的高估現(xiàn)象;由于所使用的Landsat圖像分辨率為30 m,在這種分辨率下,單體建筑和被植被包圍的較小建筑聚落可能難以識別,因此在相對較低的建筑聚集區(qū)建筑密度呈現(xiàn)低估的現(xiàn)象。
圖8 GHSL建筑密度數(shù)據(jù)與BD建筑密度數(shù)據(jù)回歸分析結(jié)果(250 m)Fig.8 Regression analysis results of GHSL built-up areas product and BD built-up areas map (250 m resolution)
圖9 GHSL建筑密度數(shù)據(jù)與BD建筑密度數(shù)據(jù)回歸分析結(jié)果(1 000 m)Fig.9 Regression analysis results of GHSL built-up areas product and BD built-up areas map (1 000 m resolution)
本研究只在5個城市開展了產(chǎn)品驗證與精度評價的探索研究,未來將繼續(xù)收集覆蓋全中國的地面單體建筑分布圖,在開展GHSL建筑密度產(chǎn)品精度驗證的基礎(chǔ)上,研發(fā)中國全境范圍內(nèi)的建成區(qū)建筑密度遙感制圖產(chǎn)品。
中國科學(xué)院大學(xué)學(xué)報2020年1期