薛倩,宋偉,朱會義
1.中國科學(xué)院地理科學(xué)與資源研究所,陸地表層格局與模擬院重點實驗室,北京100101
2.重慶交通大學(xué)建筑與城市規(guī)劃學(xué)院,重慶 400074
數(shù)據(jù)庫(集)基本信息簡介
數(shù)據(jù)庫(集)名稱 2010年中國工業(yè)產(chǎn)值公里格網(wǎng)數(shù)據(jù)集數(shù)據(jù)作者 薛倩、宋偉、朱會義數(shù)據(jù)通信作者 宋偉(songw@igsnrr.ac.cn)數(shù)據(jù)時間范圍 2010年地理區(qū)域 中國大陸地區(qū)空間分辨率 1000 m數(shù)據(jù)量 15.1 MB數(shù)據(jù)格式 *.tif ,*.shp, *.mxd, *.xlsx數(shù)據(jù)服務(wù)系統(tǒng)網(wǎng)址 http://www.sciencedb.cn/dataSet/handle/482基金項目 國家重點研發(fā)計劃,全球變化人口與經(jīng)濟系統(tǒng)風(fēng)險形成機制及評估研究(2016YFA0602402)
數(shù)據(jù)庫(集)組成數(shù)據(jù)集由3部分數(shù)據(jù)組成,其中:1 2010年中國工業(yè)產(chǎn)值公里格網(wǎng)數(shù)據(jù)集.gdb.zip是包含行政邊界信息以及柵格格式的中國2010年每公里工業(yè)產(chǎn)值數(shù)據(jù)(13.8 MB)。2.精度驗證.xls是全國90個城市工業(yè)產(chǎn)值統(tǒng)計數(shù)據(jù)和驗證精度說明(23 KB)。3.2010年中國工業(yè)產(chǎn)值公里格網(wǎng)數(shù)據(jù)集.mxd是可編寫的ArcGIS數(shù)據(jù)文件(730 KB)。
辨析氣候變化下的社會經(jīng)濟系統(tǒng)風(fēng)險是目前氣候變化研究的重點內(nèi)容之一[1]。就工業(yè)系統(tǒng)而言,氣候變化一方面通過均值波動間接對工業(yè)行業(yè)的原料存儲、加工以及運輸過程產(chǎn)生影響[2],另一方面通過極端氣候事件對工業(yè)生產(chǎn)的各個環(huán)節(jié)及工作人員產(chǎn)生破壞性的影響(例如工廠基礎(chǔ)設(shè)施破壞、人員傷亡等)[3-4]。準確評估氣候變化帶來的工業(yè)經(jīng)濟系統(tǒng)風(fēng)險與損失,依賴于較高精度的工業(yè)經(jīng)濟系統(tǒng)暴露分析[5],工業(yè)產(chǎn)值的空間分布制圖則是工業(yè)經(jīng)濟系統(tǒng)暴露分析的重要基礎(chǔ)數(shù)據(jù)之一。
近年來,國內(nèi)外在國內(nèi)生產(chǎn)總值(GDP,Gross domestic product)空間分布制圖方面已經(jīng)取得了比較多的進展[6]。但是,由于常規(guī)的遙感手段很難在空間上實現(xiàn)第二、三產(chǎn)業(yè)產(chǎn)值的準確識別,全球以及中國工業(yè)產(chǎn)值格網(wǎng)數(shù)據(jù)仍然相對缺乏。目前,已有的一些工業(yè)經(jīng)濟系統(tǒng)產(chǎn)值數(shù)據(jù)空間化制圖,多為省、市、縣級尺度[7],且空間分辨率多以行政區(qū)為最小單元,無法表征省或者城市內(nèi)部工業(yè)產(chǎn)值的差異及空間分布,在風(fēng)險評估中很難與氣候格網(wǎng)數(shù)據(jù)等開展疊加分析;基于此,也有一些針對工業(yè)某一具體行業(yè)產(chǎn)值的空間化研究數(shù)據(jù)[8-9],但是總體上缺少大尺度(中國)、高分辨率、綜合性的工業(yè)產(chǎn)值空間化數(shù)據(jù)。所以,本數(shù)據(jù)集結(jié)合DMSP/OLS夜間燈光數(shù)據(jù)、中國各省工業(yè)產(chǎn)值統(tǒng)計數(shù)據(jù)以及MODIS中的植被指數(shù)產(chǎn)品,對中國 2010年工業(yè)產(chǎn)值進行遙感反演,并利用工業(yè)用地空間分布數(shù)據(jù)對其進行修正,形成中國1 km分辨率的工業(yè)產(chǎn)值格網(wǎng)數(shù)據(jù)集。本數(shù)據(jù)集可以為全球變化中工業(yè)經(jīng)濟系統(tǒng)的風(fēng)險與災(zāi)害評估等提供基礎(chǔ)數(shù)據(jù)支撐。
本數(shù)據(jù)集構(gòu)建過程包括數(shù)據(jù)收集、夜間燈光數(shù)據(jù)和植被指數(shù)數(shù)據(jù)預(yù)處理、構(gòu)建基于增強型植被指數(shù)的夜間燈光調(diào)整指數(shù)(EANTLI)及利用工業(yè)用地空間分布數(shù)據(jù)進行燈光修正、構(gòu)建分配模型、數(shù)據(jù)質(zhì)量精度驗證幾個步驟(圖1)。
圖1 數(shù)據(jù)集構(gòu)建及處理流程
本數(shù)據(jù)集對工業(yè)的定義以世界銀行數(shù)據(jù)統(tǒng)計標準為主,包含采礦、制造、建筑、電力、水和天然氣生產(chǎn)和供應(yīng)業(yè),與中國統(tǒng)計局差別在于將建筑業(yè)納入了工業(yè)。所以,本數(shù)據(jù)集中所采用的 2010年全國各省份工業(yè)產(chǎn)值和市級工業(yè)產(chǎn)值數(shù)據(jù)為工業(yè)產(chǎn)值和建筑業(yè)產(chǎn)值之和。數(shù)據(jù)均來自于國家統(tǒng)計局發(fā)布的《中國統(tǒng)計年鑒》和各省統(tǒng)計年鑒(http://www.stats.gov.cn/tjsj/ndsj/)。
夜間燈光數(shù)據(jù)選取美國氣象衛(wèi)星DMSP/OLS成像得到的非輻射定標夜間平均燈光產(chǎn)品。其優(yōu)勢在于能通過燈光強度變化反應(yīng)地理實體信息,特別地,該產(chǎn)品中的穩(wěn)定燈光數(shù)據(jù)通常被用于提取城市區(qū)域[10-11]、反演社會經(jīng)濟數(shù)據(jù)[12-13]等研究中。本數(shù)據(jù)集所選取的夜間燈光數(shù)據(jù)為穩(wěn)定燈光數(shù)據(jù)(https://ngdc.noaa.gov),其空間分辨率為1 km,像元灰度值(DN,Digital number)范圍為0~63,數(shù)據(jù)時間為2010年。由于DMSP/OLS數(shù)據(jù)存在的飽和與溢出現(xiàn)象會削弱燈光數(shù)據(jù)和社會經(jīng)濟數(shù)據(jù)的相關(guān)性[14],并影響反演精度。而且有研究表明,植被指數(shù)和燈光強度值變化存在較好相關(guān)關(guān)系[15],因此可以通過植被指數(shù)來消除夜間燈光數(shù)據(jù)的飽和與溢出現(xiàn)象對社會經(jīng)濟數(shù)據(jù)反演的影響。所以本數(shù)據(jù)集選取空間分辨率為1 km的MODIS月合成植被指數(shù)產(chǎn)品(MOD13A3)中的增強型植被指數(shù)(EVI,Enhanced vegetation index)(http://ladsweb.nascom.nasa.gov/data)對燈光飽和與溢出現(xiàn)象進行預(yù)處理。
此外,選取中國科學(xué)院資源環(huán)境科學(xué)數(shù)據(jù)中心 2010年工業(yè)用地空間分布數(shù)據(jù)(http://www.resdc.cn)對EANTLI指數(shù)進行精度修正。
利用夜間燈光數(shù)據(jù)與植被指數(shù)之間關(guān)系消除燈光數(shù)據(jù)飽和與溢出現(xiàn)象,并構(gòu)建最佳燈光指數(shù),同時利用工業(yè)用地空間分布數(shù)據(jù)對其進行修正,得到工業(yè)用地上的最佳燈光數(shù)據(jù),并與工業(yè)產(chǎn)值數(shù)據(jù)構(gòu)建分配模型。此外,針對西部地區(qū)工業(yè)產(chǎn)值較低且工業(yè)用地分布較為離散造成的較大低估現(xiàn)象問題,利用城市化率對新疆、西藏等四個燈光值較弱的省份進行修正,最終形成2010年中國工業(yè)產(chǎn)值公里格網(wǎng)數(shù)據(jù)集。具體流程如下:
(1)對夜間燈光數(shù)據(jù)進行預(yù)處理,包括按行政邊界剪裁、二值化、歸一化等,提取燈光強度值,并計算歸一化的燈光強度值;
(2)對MODIS植被指數(shù)數(shù)據(jù)進行處理,從MOD13A3產(chǎn)品中提取出中國2010年1-12月的EVI,然后進行初步的剪裁、鑲嵌、投影等工作;
(3)EVI數(shù)據(jù)處理,計算EVI的均值,為去除月份不同對夜光數(shù)據(jù)造成的敏感性,所以本數(shù)據(jù)集選取EVI全年12個月的均值數(shù)據(jù),并剔除EVI小于0.01的區(qū)域,此區(qū)域包括水體、裸巖等無人區(qū)域;
(4)構(gòu)建最佳燈光指數(shù),其計算公式如式(1)[14]:
其中,EANTLI為最佳燈光指數(shù),NTLn為歸一化燈光強度,EVIi指處理過后的EVI數(shù)據(jù),NTL為原始燈光強度。
EANTLI能夠較大程度上削減燈光飽和與溢出現(xiàn)象,以凸顯城市內(nèi)部燈光強度差異,更好地對經(jīng)濟數(shù)據(jù)進行反演。
(5)通過工業(yè)用地空間分布數(shù)據(jù)對第4步得到的EANTLI指數(shù)結(jié)果進行修正,本數(shù)據(jù)集認為僅工業(yè)用地上存在工業(yè)產(chǎn)值,通過工業(yè)用地數(shù)據(jù)對EANTLI指數(shù)進行工業(yè)工地上的燈光值提取,得到工業(yè)用地最佳燈光指數(shù)EI。
(6)利用國家統(tǒng)計局《中國統(tǒng)計年鑒》[16]中計算得到的全國各省 2010年工業(yè)產(chǎn)值數(shù)據(jù)與工業(yè)用地最佳燈光指數(shù)進行回歸分析,構(gòu)建分配模型:
其中,I代表每個柵格上的工業(yè)產(chǎn)值,Ii代表每個各省的工業(yè)產(chǎn)值,EIi代表每個省的工業(yè)用地最佳燈光指數(shù)。
經(jīng)過該步驟,初步獲得到工業(yè)產(chǎn)值公里格網(wǎng)數(shù)據(jù)。
(7)通過對第6步獲得的數(shù)據(jù)驗證發(fā)現(xiàn),由于新疆、青海、西藏、云南四個省份的工業(yè)產(chǎn)值較低、工業(yè)用地較少且分布較為離散,導(dǎo)致存在較大的產(chǎn)值低估現(xiàn)象。針對這個問題,本數(shù)據(jù)集利用與工業(yè)產(chǎn)值在市級尺度上存在顯著相關(guān)(0.01置信度水平下)的輔助數(shù)據(jù)——四個省份的土地城市化率進行構(gòu)建多元線性回歸模型進行數(shù)據(jù)修正,模型如下:
其中Ig代表修正后的工業(yè)產(chǎn)值,In代表第(6)步中得到第n個柵格的工業(yè)產(chǎn)值,Un代表第n個柵格的城市化率,a、b分別為In、Un的參數(shù),c為常量。
(8)利用市級統(tǒng)計年鑒驗證各城市工業(yè)產(chǎn)值數(shù)據(jù)精度,滿足則得到最終 2010年中國工業(yè)產(chǎn)值公里格網(wǎng)數(shù)據(jù)集,否則重新構(gòu)建分配模型。
經(jīng)過數(shù)據(jù)處理,得到2010年中國工業(yè)產(chǎn)值公里格網(wǎng)數(shù)據(jù)集。本數(shù)據(jù)集可以比較清晰地反映每公里工業(yè)產(chǎn)值的空間分布特征。由于地理位置及政策優(yōu)勢,我國工業(yè)產(chǎn)值的高值區(qū)域主要分布在我國沿海區(qū)域,特別是長三角、珠三角、環(huán)渤海等幾個典型地區(qū)(圖 2);而西北地區(qū)由于地處內(nèi)陸,交通運輸條件較差,工業(yè)產(chǎn)值普遍較低,且呈點狀零星分布,且相較于沿海區(qū)域數(shù)值明顯較低。
圖2 2010年中國工業(yè)產(chǎn)值公里格網(wǎng)數(shù)據(jù)(審圖號:GS(2018)2341號)
數(shù)據(jù)驗證時,開展了省級工業(yè)用地最佳燈光數(shù)據(jù)與工業(yè)產(chǎn)值的相關(guān)性分析,結(jié)果顯示兩者顯著相關(guān)(在0.01置信度水平下),且相關(guān)系數(shù)達到0.72。同時,隨機選取了全國105個不同市級行政單位(圖3),利用ArcGIS的統(tǒng)計工具,將工業(yè)產(chǎn)值公里格網(wǎng)數(shù)據(jù)進行統(tǒng)計,并與市級統(tǒng)計年鑒中計算得到的工業(yè)產(chǎn)值數(shù)據(jù)進行對比。整體而言,平均精度達到81.40%(圖4)。為了使數(shù)據(jù)能夠給其他行業(yè)深度分析帶來參考,我們又按照城市主導(dǎo)功能的不同,從 105個驗證樣本中挑選了不同產(chǎn)業(yè)類型城市進行了精度驗證比較。按照全國資源型城市可持續(xù)發(fā)展規(guī)劃(2013-2020年)的分類標準和相關(guān)文獻[17-18],選取了11個資源型城市、10個綜合型城市和17個工業(yè)型城市(表1)進行驗證比較,結(jié)果表明資源型城市整體平均精度為82.27%,其中7個煤炭型城市平均精度為82.75%,1個有色金屬城市精度為94.08%,3個石油城市平均精度77.22%;總體而言,綜合型城市整體平均精度為82.34%;工業(yè)型城市整體平均精度為 77.25%。不過,部分西部欠發(fā)達區(qū)域精度略低,環(huán)渤海區(qū)域、長三角、珠三角等工業(yè)較發(fā)達區(qū)域工業(yè)產(chǎn)值反演精度較高。西部地區(qū)精度偏低的主要原因在于經(jīng)濟發(fā)展水平偏低導(dǎo)致區(qū)域燈光強度較弱,且內(nèi)部差異較小,使得反演精度偏低。為了解決這個問題,我們利用與工業(yè)產(chǎn)值有較好相關(guān)性的城市化率數(shù)據(jù)對新疆、西藏、青海、云南四個省份進行了數(shù)據(jù)校正,校正后精度有較大的提升,提高了 12.1個百分點(由 62.4%提高到74.5%)。
圖3 精度驗證選擇的105個樣本城市的位置(審圖號:GS(2018)2341號)
圖4 數(shù)據(jù)集中數(shù)據(jù)與統(tǒng)計年鑒數(shù)據(jù)對比及精度
表1 分類型城市精度驗證
本數(shù)據(jù)處理過程在地理信息系統(tǒng)軟件ArcGIS平臺下進行,數(shù)據(jù)處理過程科學(xué)合理規(guī)范,保證了數(shù)據(jù)空間分辨率的準確性和可靠性。
工業(yè)產(chǎn)值公里格網(wǎng)數(shù)據(jù)打破了行政邊界的限制,通過夜間燈光數(shù)據(jù)對工業(yè)產(chǎn)值數(shù)據(jù)進行大尺度反演,得到高精度、高分辨率空間化的柵格數(shù)據(jù),從而可以直觀地分析工業(yè)產(chǎn)值區(qū)域間數(shù)量差異以及時空分布特征,為劃分中國工業(yè)重點區(qū)域、厘清工業(yè)產(chǎn)業(yè)變化趨勢、評估工業(yè)用地效率等提供了數(shù)據(jù)支撐,特別是為氣候變化下工業(yè)產(chǎn)業(yè)暴露及脆弱性評估提供了基礎(chǔ)數(shù)據(jù),從而為工業(yè)布局規(guī)劃及極端災(zāi)害條件下工業(yè)產(chǎn)業(yè)受災(zāi)預(yù)警及災(zāi)害評估提供參考。
此外,本數(shù)據(jù)集中工業(yè)定義以世界銀行中工業(yè)定義為準,可用于全球尺度的工業(yè)產(chǎn)值變化評估研究。特別地,雖然全球或者區(qū)域空間化產(chǎn)品較多,但大都是 GDP、人口的空間化產(chǎn)品,特別是現(xiàn)有GDP空間化數(shù)據(jù)集大多是對二三產(chǎn)業(yè)合并處理,鮮有單獨的二產(chǎn)或三產(chǎn)空間化數(shù)據(jù)集產(chǎn)品。本數(shù)據(jù)集提出的遙感反演、工業(yè)用地修正、城市化率修正等方法,能夠有效在空間上區(qū)分第二與第三產(chǎn)業(yè)產(chǎn)值,豐富了社會經(jīng)濟數(shù)據(jù)的空間化方法,為以后的類似研究提供了借鑒。在精度上,本數(shù)據(jù)集的平均精度達到了81.40%,相較于以往類似研究有了明顯提升。
本數(shù)據(jù)集中包含工業(yè)產(chǎn)值公里格網(wǎng)文件(.tif)和檢驗數(shù)據(jù)文件(.xls)以及處理過程數(shù)據(jù)庫(.gdb),可用ArcGIS軟件對數(shù)據(jù)進行讀寫,也可用 Python 等主流編程語言調(diào)用相關(guān)函數(shù)庫讀寫,實現(xiàn)數(shù)據(jù)批處理。
對于全球氣候變化的相關(guān)研究工作,1km的全國工業(yè)產(chǎn)值數(shù)據(jù)集可以滿足目前研究的精度。同時,1km也是夜間燈光影像數(shù)據(jù)、MODIS 植被指數(shù)數(shù)據(jù)、土地利用柵格數(shù)據(jù)(全國尺度)常用的空間分辨率,這個分辨率能夠最好地匹配制作工業(yè)產(chǎn)值所需的空間基礎(chǔ)數(shù)據(jù)。鑒于制作工業(yè)產(chǎn)值空間化反演的基礎(chǔ)數(shù)據(jù)在空間分辨率均為 1km,數(shù)據(jù)集的分辨率已達到最高。如果后期需要匹配大尺度低分辨的氣象數(shù)據(jù)(如0.1°,0.25°等),可以借助于百分比柵格的方法對數(shù)據(jù)集進行升尺度,這個方法不會影響降低分辨率之后的數(shù)據(jù)集精度。
此外,在數(shù)據(jù)集更新方面,我們在此數(shù)據(jù)集的基礎(chǔ)上會根據(jù)基礎(chǔ)數(shù)據(jù)——土地利用(更新周期:5年)、夜間燈光影像數(shù)據(jù)(更新周期:1年)、MODIS植被指數(shù)數(shù)據(jù)(更新周期:1年)、統(tǒng)計年鑒數(shù)據(jù)(更新周期:1年)的更新周期進行數(shù)據(jù)更新,擬依據(jù)更新周期最長的土地利用數(shù)據(jù)的更新周期(5年)進行數(shù)據(jù)集更新。同時,對未來工業(yè)產(chǎn)值格網(wǎng)格化數(shù)據(jù),我們會通過動力降尺度的方法進行多源數(shù)據(jù)融合模擬,制作未來不同氣候變化情景下的工業(yè)產(chǎn)值空間數(shù)據(jù)。
中國科學(xué)數(shù)據(jù)(中英文網(wǎng)絡(luò)版)2018年2期