康敏捷,曹 可,王 輝,趙冰茹,張 旭
(大連海事大學(xué)交通運(yùn)輸管理學(xué)院,遼寧大連116026)
基于作息空間思想的人口統(tǒng)計(jì)數(shù)據(jù)空間化方法
康敏捷,曹 可,王 輝,趙冰茹,張 旭
(大連海事大學(xué)交通運(yùn)輸管理學(xué)院,遼寧大連116026)
探討了基于作息空間思想的人口統(tǒng)計(jì)數(shù)據(jù)空間化方法。定義居住和工作的活動(dòng)空間范圍為作息空間,并結(jié)合土地利用類型數(shù)據(jù)和泰森多邊形構(gòu)建了作息空間,以作息空間人口密度作為人口空間分布的表達(dá)方式。對遼寧省2005年人口統(tǒng)計(jì)數(shù)據(jù)進(jìn)行了實(shí)例分析,精度優(yōu)于傳統(tǒng)的面積權(quán)重內(nèi)插法,結(jié)果的地圖渲染能夠表現(xiàn)受自然因素和社會(huì)經(jīng)濟(jì)因素影響的人口分布特征。該方法不涉及復(fù)雜的權(quán)重計(jì)算過程,也可以避免主觀因素的干擾,簡單易行,有較強(qiáng)的實(shí)用性。
遼寧省;作息空間;人口空間分布;統(tǒng)計(jì)數(shù)據(jù)空間化
人口數(shù)據(jù)是以行政單元為基礎(chǔ),通過普查、統(tǒng)計(jì)、逐級(jí)匯總得到的典型的統(tǒng)計(jì)型數(shù)據(jù)[1,2],通??梢詽M足人口、資源環(huán)境與社會(huì)經(jīng)濟(jì)發(fā)展宏觀分析的需求;而當(dāng)進(jìn)行中小尺度的空間分析或跨學(xué)科研究時(shí),存在分區(qū)界線不一致和精度不足的問題[1]。首先,承載人口數(shù)據(jù)的行政單元與其它自然地理環(huán)境要素(如流域)的界線不一致,無法實(shí)現(xiàn)多源數(shù)據(jù)融合和綜合分析;其次,人口數(shù)據(jù)在行政單元內(nèi)只能當(dāng)做均勻分布來處理,顯然與實(shí)際不符,并且很多情況下無法滿足分析精度要求。人口統(tǒng)計(jì)數(shù)據(jù)空間化通過定性描述與定量分析相結(jié)合的方法,表達(dá)人口在一定時(shí)間和一定地理空間中的分布狀態(tài)[3],是實(shí)現(xiàn)人口數(shù)據(jù)與土地利用、生態(tài)環(huán)境和氣候等數(shù)據(jù)進(jìn)行多源數(shù)據(jù)融合與綜合分析的重要基礎(chǔ),對于跨學(xué)科研究具有重要價(jià)值[1,3,4]。
現(xiàn)有研究主要采用多源數(shù)據(jù)融合的思想,圍繞影響人口分布的多個(gè)自然和人文要素建立人口統(tǒng)計(jì)數(shù)據(jù)空間化計(jì)算模型[2,5-9],需要多個(gè)影響因素的空間數(shù)據(jù)作支撐,對研究區(qū)域的數(shù)據(jù)完整性要求較高,模型構(gòu)建過程較復(fù)雜,需統(tǒng)計(jì)分析軟件支持,不能單獨(dú)在GIS環(huán)境下完成,且構(gòu)建的模型只適用于特定的研究區(qū)域。本文提出作息空間的思想,以遼寧省為例,探討一種基于作息空間實(shí)現(xiàn)人口統(tǒng)計(jì)數(shù)據(jù)空間化的方法,該方法只用到土地利用數(shù)據(jù),整個(gè)分析過程在GIS軟件中實(shí)現(xiàn),空間化結(jié)果可以表現(xiàn)出自然因素和社會(huì)經(jīng)濟(jì)因素綜合影響的人口分布特征。
人口有很強(qiáng)的流動(dòng)性,不同時(shí)刻其空間分布不同。日出而作、日落而息是人類主要生活規(guī)律,大多數(shù)人類活動(dòng)會(huì)穩(wěn)定的分布在居所和工作地。本文只關(guān)注相對穩(wěn)定的人口分布,忽略人口流動(dòng)的瞬時(shí)狀態(tài)。定義居住和工作的活動(dòng)空間范圍為作息空間,作息空間范圍內(nèi)單位面積上的人口數(shù)為作息空間人口密度,以作息空間人口密度作為人口空間分布的表現(xiàn)形式。
影響人口分布的主要因素包括:土地利用類型、城鄉(xiāng)居民點(diǎn)、地形、交通、河流、氣候等自然和社會(huì)經(jīng)濟(jì)因素[2,5-9],土地利用類型是這些影響因素綜合作用的結(jié)果,如耕地一定分布在氣候和水文條件適宜的地方;居民地分布與地形密切相關(guān)(圖1),隨著海拔的升高,居民地面積遞減,200 m以上城鎮(zhèn)消失,400 m以上農(nóng)村居民地已經(jīng)很稀少。以土地利用數(shù)據(jù)作為計(jì)算作息空間人口密度的基礎(chǔ),簡化了人口數(shù)據(jù)空間化模型,避免重復(fù)考慮一些存在相關(guān)性的影響因素,同時(shí)也實(shí)現(xiàn)了人口數(shù)據(jù)與自然地理要素的融合。
圖1 遼寧省各高程帶居民地面積統(tǒng)計(jì)Fig.1 Statistics of settlement place area based on altitude bands in Liaoning Province
根據(jù)作息空間的定義及人口分布與土地利用類型的關(guān)系,將人口空間化過程分為兩步:首先,根據(jù)居住地不同將城鎮(zhèn)人口和農(nóng)村人口區(qū)分開。然后,根據(jù)工作地不同進(jìn)一步劃分,城鎮(zhèn)人口的工作地主要集中于城鎮(zhèn)建設(shè)用地,作息空間即城鎮(zhèn)建設(shè)用地,不做進(jìn)一步劃分;農(nóng)村人口主要從事農(nóng)業(yè)以及在附近的廠礦工作,其作息空間包含了農(nóng)村居民地、附近的耕地和其它建設(shè)用地。
人口居住地的空間化以城鎮(zhèn)居民地人口密度和農(nóng)村居民地人口密度進(jìn)行表達(dá)。通過條件查詢從土地利用類型數(shù)據(jù)提取城鎮(zhèn)居民地和農(nóng)村居民地,并將其與行政單元數(shù)據(jù)進(jìn)行疊加分析,計(jì)算各地區(qū)的城鎮(zhèn)居民地和農(nóng)村居民地面積;用各行政單元的城鎮(zhèn)人口和農(nóng)村人口分別除以對應(yīng)的城鎮(zhèn)居民地和農(nóng)村居民地面積,即計(jì)算出各地區(qū)城鎮(zhèn)居民地人口密度和農(nóng)村居民地人口密度。
農(nóng)村人口作息空間的空間化以農(nóng)村作息空間人口密度表達(dá)。根據(jù)工作地鄰近居住地的原則,用泰森多邊形確定作息空間范圍。根據(jù)泰森多邊形的特點(diǎn):每個(gè)泰森多邊形內(nèi)僅含有一個(gè)離散點(diǎn)數(shù)據(jù),可以保證居民地與其作息空間范圍一一對應(yīng);泰森多邊形內(nèi)的點(diǎn)到相應(yīng)離散點(diǎn)的距離最近,保證了作息空間是每個(gè)居民地距離最近的空間范圍。通過條件查詢從土地利用類型數(shù)據(jù)提取農(nóng)村居民地、耕地和其它建設(shè)用地作為作息空間范圍內(nèi)農(nóng)村人口主要分布的用地類型;將作息空間范圍與用地類型進(jìn)行疊加分析,確定各農(nóng)村居民點(diǎn)的作息空間,即各泰森多邊形內(nèi)的農(nóng)村居民地、耕地和其它建設(shè)用地(圖2,見封3)。農(nóng)村作息空間人口密度是單位作息空間面積內(nèi)農(nóng)村居民地人口數(shù),等于農(nóng)村居民地人口密度與作息空間范圍內(nèi)農(nóng)村居民地面積的乘積,可表示為:
最終通過城鎮(zhèn)居民地人口密度、農(nóng)村作息空間人口密度實(shí)現(xiàn)人口的空間化表達(dá)。
本文以遼寧省為研究區(qū)域進(jìn)行省級(jí)人口統(tǒng)計(jì)數(shù)據(jù)空間化試驗(yàn)。遼寧省位于中國東北地區(qū)的南部,東經(jīng)118°53′~125°46′,北緯38°43′~43°26′。陸地面積14.8萬km2,約占全國陸地總面積1.5%[10]。地勢大致為自北向南、自東西兩側(cè)向中部傾斜。東部山地丘陵區(qū)為遼寧省主要林區(qū);西部山地丘陵區(qū)東緣的臨海狹長平原,習(xí)慣上稱為“遼西走廊”,是中國東北地區(qū)溝通華北地區(qū)的主要陸上通道;中部遼河平原是東北平原的一部分,由遼河及其支流沖積而成,是遼寧省主要農(nóng)業(yè)區(qū)和商品糧基地;南部瀕臨渤海與黃海,大陸海岸線全長2 178 km,占中國大陸海岸線總長的12%[10]。2005年末全省總?cè)丝? 189.2萬人,約占中國內(nèi)地人口總數(shù)的3.4%[11]。本文所需數(shù)據(jù)包括遼寧省2005年土地利用類型圖,從2006年遼寧統(tǒng)計(jì)年鑒獲得2005年遼寧省各地級(jí)市的人口統(tǒng)計(jì)數(shù)據(jù),從遼寧省1∶25萬地形圖獲得行政單元、交通線及地形數(shù)據(jù),從1∶400萬地形圖獲得主要河流數(shù)據(jù),從沈陽市2006年統(tǒng)計(jì)年鑒獲得2005年沈陽市各縣區(qū)的人口統(tǒng)計(jì)數(shù)據(jù)。
數(shù)據(jù)處理與分析在ArcGIS中進(jìn)行,空間分析工具包括Identity疊加分析、Summary Statistics統(tǒng)計(jì)分析和Create Thiessen Polygons創(chuàng)建泰森多邊形,分析內(nèi)容包括行政單元內(nèi)各土地利用類型面積計(jì)算以及農(nóng)村作息空間人口密度計(jì)算。
行政單元內(nèi)各土地利用類型面積計(jì)算如下:1)通過Identity疊加分析確定各行政單元的用地類型;2)通過條件查詢創(chuàng)建各種用地類型的圖層;3)對各種用地類型圖層中行政單元字段進(jìn)行Summarize匯總,得到各行政單元內(nèi)該用地類型總面積;4)用各行政單元統(tǒng)計(jì)的城鎮(zhèn)人口數(shù)和農(nóng)村人口數(shù)分別除以對應(yīng)的城鎮(zhèn)建設(shè)用地面積和農(nóng)村居民地面積,可得各自的城鎮(zhèn)人口密度和農(nóng)村居民地人口密度,完成了人口數(shù)據(jù)空間化的第一步。
農(nóng)村作息空間人口密度計(jì)算如下:1)將農(nóng)村居民地的多邊形數(shù)據(jù)轉(zhuǎn)換為點(diǎn)狀農(nóng)村居民點(diǎn);2)通過Create Thiessen Polygons分析工具使用農(nóng)村居民點(diǎn)創(chuàng)建泰森多邊形;3)通過條件查詢提取農(nóng)村居民地、耕地和其它建設(shè)用地作為農(nóng)村作息空間用地圖層;4)將泰森多邊形與農(nóng)村作息空間用地圖層進(jìn)行Identity疊加分析,得到各農(nóng)村居民點(diǎn)的作息空間;5)通過Summary Statistics分析工具,以農(nóng)村居民點(diǎn)作息空間圖層的農(nóng)村居民點(diǎn)Id字段和土地利用類型為分類字段,對各農(nóng)村居民點(diǎn)作息空間內(nèi)各種土地利用類型面積進(jìn)行統(tǒng)計(jì)分析,然后計(jì)算作息空間內(nèi)農(nóng)村居民地占作息空間用地面積的比例,再乘以農(nóng)村居民地人口密度即得農(nóng)村作息空間人口密度。
以面積權(quán)重內(nèi)插法[12]為對照,以市級(jí)統(tǒng)計(jì)資料的統(tǒng)計(jì)值作為實(shí)際值,分別計(jì)算縣區(qū)級(jí)行政單元人口數(shù)的估計(jì)值,比較兩種方法的誤差百分比(表1)。因?yàn)槭屑?jí)統(tǒng)計(jì)資料只有沈陽市統(tǒng)計(jì)年鑒對縣級(jí)行政單元的城市人口和農(nóng)村人口做了統(tǒng)計(jì),所以只能以沈陽市為驗(yàn)證范圍進(jìn)行比較。但沈陽市統(tǒng)計(jì)年鑒對城市人口和農(nóng)村人口的統(tǒng)計(jì)值與本文通過遼寧省統(tǒng)計(jì)年鑒估算的城市人口與農(nóng)村人口(第一產(chǎn)業(yè)從業(yè)人口為農(nóng)村人口,其它為城鎮(zhèn)人口)的統(tǒng)計(jì)值有偏差,為了比較,計(jì)算誤差時(shí)分別乘以一個(gè)比例系數(shù)。結(jié)果顯示,在估計(jì)城鎮(zhèn)人口數(shù)時(shí),面積權(quán)重插值法的誤差在65.54%~398.64%之間,平均誤差為225.58%,標(biāo)準(zhǔn)差為127.39,說明其平均誤差都超過真實(shí)值的2倍多,誤差的變幅很大,是真實(shí)值的1倍多;本文方法計(jì)算的誤差在0.5%~56.74%之間,平均誤差為31.32%,標(biāo)準(zhǔn)差只有18.34%,相比面積權(quán)重插值法精度有很大的提高,且誤差的變化比較平穩(wěn)。在估計(jì)農(nóng)村人口數(shù)時(shí),面積權(quán)重插值法的誤差在1.33%~28.38%之間,平均誤差為14.25%,標(biāo)準(zhǔn)差為8.78%;本文方法計(jì)算的誤差在3.03%~20.7%之間,平均誤差為13.08%,標(biāo)準(zhǔn)差為6.03%,結(jié)果也優(yōu)于面積權(quán)重法。綜合比較可以看出,本文方法的估計(jì)結(jié)果較好。
表1 本文方法與面積權(quán)重插值法的誤差比較Table 1 The error comparison of the method in this paper and area weighting interpolation method
從結(jié)果的地圖渲染看,面積權(quán)重內(nèi)插法的結(jié)果通過行政單元進(jìn)行地圖渲染,人口在整個(gè)行政單元范圍內(nèi)均勻分布,無法顯示人口分布的特征。本文方法地圖渲染結(jié)果(圖3,見封3)顯示:遼寧省西部和東部地勢高的山區(qū)人口密度低,中部地勢平緩的地區(qū)人口密度高;沿海岸帶地區(qū)的人口密度整體較高;河流沿線、鐵路/國道沿線人口密度較高。本文人口統(tǒng)計(jì)數(shù)據(jù)空間化結(jié)果與遼寧省人口分布實(shí)際情況相符,而且在人口空間化過程中并沒有考慮距海岸線、河流、交通線距離及地形等因素,但結(jié)果仍能夠體現(xiàn)這些自然因素和社會(huì)經(jīng)濟(jì)因素所影響的人口分布特征??梢?,基于本文方法簡化的人口空間化模型是可行的。
本文探討了一種簡單可行的人口統(tǒng)計(jì)數(shù)據(jù)空間化方法,提出了“作息空間人口密度”作為表現(xiàn)人口空間分布的表現(xiàn)形式,圍繞作息空間的基本思想,實(shí)現(xiàn)了城市與農(nóng)村人口的空間分布表達(dá);方法不涉及復(fù)雜的權(quán)重計(jì)算或參數(shù)計(jì)算過程,也避免了主觀因素的干擾,簡單易行,有較強(qiáng)的實(shí)用性。
通過遼寧省人口統(tǒng)計(jì)數(shù)據(jù)空間化結(jié)果可以看出,本文方法在精度上優(yōu)于面積權(quán)重內(nèi)插法,在表現(xiàn)形式上,實(shí)現(xiàn)了作息空間范圍內(nèi)人口的不均勻分布表達(dá),能夠體現(xiàn)出自然因素和社會(huì)經(jīng)濟(jì)因素綜合影響的人口分布特征。以土地利用數(shù)據(jù)為空間基礎(chǔ),提高了人口數(shù)據(jù)的空間分辨率,并且可以方便地實(shí)現(xiàn)與各種自然要素分區(qū)下的統(tǒng)計(jì)分析。
[1] 林麗潔,林廣發(fā),顏小霞,等.人口統(tǒng)計(jì)數(shù)據(jù)空間化模型綜述[J].亞熱帶資源與環(huán)境學(xué)報(bào),2010,5(4):10-16.
[2] 廖順寶,李澤輝.基于人口分布與土地利用關(guān)系的人口數(shù)據(jù)空間化研究——以西藏自治區(qū)為例[J].自然資源學(xué)報(bào),2003,18(6):659-665.
[3] 呂安民,李成名,林宗堅(jiān),等.基于遙感影像的城市人口密度模型[J].地理學(xué)報(bào),2004,59(6):283-292.
[4] 葉宇,劉高煥,馮險(xiǎn)峰.人口數(shù)據(jù)空間化表達(dá)與應(yīng)用[J].地理科學(xué)進(jìn)展,2006,8(2):59-65.
[5] 廖順寶,孫九林.青藏高原人口分布與環(huán)境關(guān)系的定量研究[J].中國人口·資源與環(huán)境,2003,13(3):62-67.
[6] 廖順寶,孫九林.基于GIS的青藏高原人口統(tǒng)計(jì)數(shù)據(jù)空間化[J].地理學(xué)報(bào),2003,58(1):25-33.
[7] 劉紀(jì)遠(yuǎn),岳天祥,史培軍,等.中國人口密度數(shù)字模擬[J].地理學(xué)報(bào),2003,58(1):266-276.
[8] 田永中,陳述彭,岳天祥,等.基于土地利用的中國人口密度模擬[J].地理學(xué)報(bào),2004,59(2):283-292.
[9] 江東,楊小喚,王乃斌,等.基于RS、GIS的人口空間分布研究[J].地理科學(xué)進(jìn)展,2002,17(5):734-738.
[10] 遼寧省統(tǒng)計(jì)局.輝煌的歲月——遼寧60年回眸[M].北京:中國統(tǒng)計(jì)出版社,2009.
[11] 遼寧省統(tǒng)計(jì)局.遼寧統(tǒng)計(jì)年鑒(2006)[M].北京:中國統(tǒng)計(jì)出版社,2006.
[12] GOODCHILD M F,LAM N S N.Areal Interpolation:A Variant of Traditional Spatial Problem[M].Geoprocessing,1980.297-331.
Abstract:The spatialization method of demographic data based on work and residence space conception is discussed in this paper.Work and residence space is defined by the extent of work and residence places,and it is created by land use data and Thiessen polygons,then population space distribution can be expressed by the population density in work and residence space.The empirical analysis is done using demographic data of Liaoning Province in 2005,result accuracy is better then area weighting interpolation method,and the result map can present the demographic characteristics affected by natural factors and socio-economic factors.This method does not include complex weights calculation procedure,it is not interfered by subjective factors,and it is simple and practicable.
Key words:Liaoning Province;work and residence space;population space distribution;spatialization of statistical data
Spatialization Method of Demographic Data Based on Work and Residence Space Conception
KANG Min-jie,CAO Ke,WANG Hui,ZHAO Bing-ru,ZHANG Xu
(Transportation Management School of Dalian Maritime University,Dalian 116026,China)
K901.3
A
1672-0504(2012)04-0060-03
2012-02-17;
2012-04-12
國家自然科學(xué)基金項(xiàng)目(41071079);國家海洋公益性行業(yè)科研專項(xiàng)(201005008)
康敏捷(1982-),男,博士研究生,主要研究方向?yàn)榻?jīng)濟(jì)系統(tǒng)分析。E-mail:kangminjie@sina.com