胡 大 國,張 嘉
(1.廣州市房地產(chǎn)測繪院,廣東 廣州 510030;2.中國土地勘測規(guī)劃院,北京 100035)
?
基于地址匹配的城市行業(yè)用地調(diào)查研究與實踐
胡 大 國1,張 嘉2
(1.廣州市房地產(chǎn)測繪院,廣東 廣州 510030;2.中國土地勘測規(guī)劃院,北京 100035)
選取廣州市越秀區(qū)作為試點區(qū)域,利用數(shù)據(jù)庫規(guī)范地名地址數(shù)據(jù),以地址匹配為核心實現(xiàn)宗地數(shù)據(jù)與經(jīng)濟統(tǒng)計數(shù)據(jù)的融合,調(diào)查行業(yè)用地利用狀況、用地類型、面積與分布,形成顧及地名地址數(shù)據(jù)特點的越秀區(qū)行業(yè)用地調(diào)查數(shù)據(jù)庫,開展行業(yè)經(jīng)濟、用地、從業(yè)人員情況統(tǒng)計與分析。研究與實踐表明:利用行業(yè)基本單位詳細地址與地名地址數(shù)據(jù)匹配開展城市行業(yè)用地調(diào)查是一有效方法;持續(xù)性開展城市行業(yè)用地調(diào)查有助于政府的經(jīng)濟、用地宏觀決策。
土地利用;城市行業(yè)用地調(diào)查;地址匹配;SQL;空間分析;越秀區(qū)
行業(yè)用地是指用于產(chǎn)業(yè)活動的土地,是開展產(chǎn)業(yè)經(jīng)濟活動的空間載體。以城鎮(zhèn)地籍調(diào)查數(shù)據(jù)為基礎(chǔ),開展城市行業(yè)用地利用狀況調(diào)查,掛接宗地內(nèi)的行業(yè)用地類型以及相關(guān)經(jīng)濟指標,形成包含各類行業(yè)信息的城鎮(zhèn)地籍調(diào)查數(shù)據(jù)成果,對于摸清不同行業(yè)用地類型、面積、強度等情況,掌握重點行業(yè)用地的利用水平、潛力規(guī)模與分布,為產(chǎn)業(yè)結(jié)構(gòu)調(diào)整提供基礎(chǔ)支撐,為經(jīng)濟社會全面協(xié)調(diào)和可持續(xù)發(fā)展提供保障[1],具有重要意義。為此,國土資源部在全國范圍內(nèi)開展了批次城市行業(yè)用地調(diào)查試點工作,第一批試點城市包括吉林省通化市、山東省德州市、福建省龍巖市、陜西省渭南市、江蘇省鎮(zhèn)江市和廣東省廣州市越秀區(qū),力圖探索并形成適應(yīng)不同地域、不同經(jīng)濟社會發(fā)展水平的行業(yè)用地調(diào)查技術(shù)體系。
廣州市越秀區(qū)作為首批6個行業(yè)用地調(diào)查試點城市之一,是廣州市最繁華的中心城區(qū),下轄22條行政街道,面積約33.8 km2,地籍區(qū)22個,法人單位和產(chǎn)業(yè)活動單位3.4萬多個,戶籍人口為115萬人,在土地利用現(xiàn)狀調(diào)查及年度土地利用變更調(diào)查中均為城市建設(shè)用地,地類代碼為201[2]。
1.1 數(shù)據(jù)分析及技術(shù)流程
行業(yè)用地調(diào)查的核心是建立行業(yè)基本單位(法人單位、產(chǎn)業(yè)活動單位)與宗地空間數(shù)據(jù)的關(guān)聯(lián),解決行業(yè)經(jīng)濟信息“落地”即空間化問題,從而實現(xiàn)經(jīng)濟統(tǒng)計數(shù)據(jù)與地籍調(diào)查數(shù)據(jù)兩種異構(gòu)數(shù)據(jù)的有效融合。結(jié)合廣州市試點區(qū)情況,行業(yè)用地調(diào)查基礎(chǔ)數(shù)據(jù)主要從國土、統(tǒng)計、公安等相關(guān)部門收集,包括1∶500地形地籍圖、地籍區(qū)數(shù)據(jù)、行業(yè)基本單位、行業(yè)經(jīng)濟匯總數(shù)據(jù)、行業(yè)從業(yè)人口匯總數(shù)據(jù)等信息。上述數(shù)據(jù)存儲介質(zhì)各異,格式不一,空間數(shù)據(jù)的坐標參考也不盡一致,雖然行業(yè)基本單位和宗地數(shù)據(jù)都具有空間坐落的表達,但兩者對同一對象的表達方式和語義描述存在較大差異,導(dǎo)致行業(yè)基本單位與其所坐落的宗地實體難以直接關(guān)聯(lián)。
行業(yè)基本單位數(shù)據(jù)和地名地址數(shù)據(jù)中均有地址信息,利用行業(yè)基本單位的詳細地址與地名地址數(shù)據(jù)進行地址匹配,可使行業(yè)基本單位具有空間坐標[3,4],然后與宗地進行空間疊加分析,即可實現(xiàn)行業(yè)基本單位經(jīng)濟數(shù)據(jù)與宗地的用地范圍、用地面積等情況的關(guān)聯(lián)。對于地名地址數(shù)據(jù)無法查找到的行業(yè)基本單位,實地調(diào)查測繪該行業(yè)基本單位,并在1∶500地形地籍圖上采集地名地址點,補充完善地名地址數(shù)據(jù)庫,再進行地址匹配。主要技術(shù)流程如圖1所示。
圖1 行業(yè)用地調(diào)查技術(shù)流程
行業(yè)基本單位與地名地址數(shù)據(jù)中的地址信息有如下特點:1)地名地址數(shù)據(jù)為結(jié)構(gòu)化數(shù)據(jù),由街道、街坊、街路巷、門牌前綴、門牌號、門牌后綴6個字段組合表示,定義明確、統(tǒng)一,可以利用結(jié)構(gòu)化查詢語言(SQL)批量處理。2)行業(yè)基本單位的詳細地址呈現(xiàn)半結(jié)構(gòu)化特征,以唯一文本信息記錄,內(nèi)容龐雜,描述不規(guī)范,存在錯別字、中文數(shù)字與阿拉伯數(shù)字混用、信息冗余等情況,難以進行批量處理。為實現(xiàn)兩類數(shù)據(jù)的高效管理與快速語義匹配,需對其進行數(shù)據(jù)建庫與規(guī)范化。
1.2 數(shù)據(jù)處理
1.2.1 數(shù)據(jù)庫設(shè)計 利用實體(Entity)-聯(lián)系(Relationship)模型設(shè)計行業(yè)用地調(diào)查數(shù)據(jù)庫,實體主要有行業(yè)基本單位(點)、宗地(面)、門樓牌(點)和房屋(面);聯(lián)系主要有多棟“房屋”坐落在一個“宗地”,一棟“房屋”擁有多個“門樓牌”,多個“行業(yè)基本單位”具有一個“門樓牌”,其比例關(guān)系為1∶N,利用空間關(guān)系關(guān)聯(lián),無需設(shè)計單獨的聯(lián)系表。
1.2.2 數(shù)據(jù)規(guī)范化處理
(1)地名地址數(shù)據(jù)規(guī)范化。以實施行業(yè)用地調(diào)查試點項目為目標,與文獻[3,4]所述的地址標準化類似,但不進行地址解析處理,只對核心地址要素的含義、字段類型、長度及其組合進行統(tǒng)一規(guī)定,要求簡潔明了且易于操作。地名地址數(shù)據(jù)是具有地理坐標信息的矢量數(shù)據(jù),其屬性由行政區(qū)、街道、街坊、街路巷、門牌前綴、門牌號、門牌后綴、X、Y字段組成。為便于與行業(yè)基本單位的詳細地址含義相匹配,綜合相關(guān)屬性設(shè)計“組合地址(ZHDZ)”字段,組合地址由“街路巷”、“門牌前綴”、“門牌號”、“門牌后綴”組成。
(2)行業(yè)基本單位詳細地址規(guī)范化。主要通過人機交互手工或半手工方式實現(xiàn),以原始詳細地址為基礎(chǔ),新增“提取地址(TQDZ)”字段作為“詳細地址”字段的派生字段,以期與“組合地址”進行匹配。派生“提取地址”的主要方法有:1)舍棄詳細地址的“廣東省、廣州市、越秀區(qū)”等冗余信息;2)修改詳細地址中的錯別字;3)將詳細地址中的中文數(shù)字改為阿拉伯數(shù)字;4)刪除詳細地址中多余的字;5)補充大地名或刪除多余的街路巷、樓宇名稱、房號。
地址匹配以數(shù)據(jù)規(guī)范和含義一致為基礎(chǔ),在Access數(shù)據(jù)庫中利用SQL語句匹配,主要步驟如下:1)查詢符合條件的記錄數(shù),將行業(yè)基本單位的 “提取地址(TQDZ)”與地名地址數(shù)據(jù)庫中的“組合地址(ZHDZ)”匹配,查詢相匹配的數(shù)據(jù);2)更新行業(yè)基本單位數(shù)據(jù),將“提取地址”與地名地址數(shù)據(jù)庫中的“組合地址”匹配,并將X、Y坐標信息賦值給行業(yè)基本單位;3)核查數(shù)據(jù)更新情況,保證數(shù)據(jù)更新的內(nèi)容和數(shù)量無差錯。
地址匹配完成后,行業(yè)基本單位具有X、Y坐標信息,通過ArcGIS的“增加X、Y數(shù)據(jù)”功能[5],將行業(yè)基本單位轉(zhuǎn)換為點狀空間數(shù)據(jù)。在ArcGIS中,行業(yè)基本單位、宗地分別為點和面兩層數(shù)據(jù),利用空間疊加分析[6]實現(xiàn)行業(yè)基本單位與宗地1∶N的關(guān)聯(lián),然后導(dǎo)入Access中進行統(tǒng)計分析。
3.1 行業(yè)用地分類
在開展城鎮(zhèn)地籍調(diào)查時,土地分類通常按土地的批準用途、主要實際用途劃分和歸類,即一宗地只調(diào)查一個主要的利用類別,忽略了同一宗地的多種用地類型。《地籍調(diào)查規(guī)程》中雖顧及國民經(jīng)濟行業(yè)分類調(diào)查,但是只填寫到大類名稱及編碼[7],不能反映同一宗地多種經(jīng)濟活動的情況。為解決上述問題,行業(yè)用地調(diào)查試點依據(jù)國民經(jīng)濟行業(yè)分類進行用地劃分,采用經(jīng)濟活動的同質(zhì)性原則定義行業(yè)用地類型,調(diào)查同一宗地的多種經(jīng)濟活動及多種用地類型。國民經(jīng)濟行業(yè)分類分為4個層次,即門類20個、大類96個、中類432個、小類1 094個。行業(yè)用地調(diào)查以小類為基礎(chǔ),統(tǒng)計分析以門類為主。
3.2 行業(yè)用地分析
越秀區(qū)行業(yè)經(jīng)濟數(shù)據(jù)[8]與用地信息關(guān)聯(lián),形成空間經(jīng)濟用地信息,可以進行三大產(chǎn)業(yè)用地分析、行業(yè)用地面積比重分析、單位面積營業(yè)收入分析、人均營業(yè)收入分析等。
(1)產(chǎn)業(yè)用地分析。越秀區(qū)無第一產(chǎn)業(yè),第二產(chǎn)業(yè)地區(qū)生產(chǎn)總值為57.8億元,用地面積為0.9 km2,用地面積比例為5.3%;第三產(chǎn)業(yè)地區(qū)生產(chǎn)總值為1 839.3億元,用地面積為16.0 km2,用地面積比例為94.7%,第二、三產(chǎn)業(yè)單位面積地區(qū)生產(chǎn)總值分別為64.6億元/km2、115.1億元/km2,比例為1∶1.8(表1)。從經(jīng)濟總量、單位用地面積產(chǎn)出量可以看出,第三產(chǎn)業(yè)對越秀區(qū)經(jīng)濟的貢獻最大,居經(jīng)濟行業(yè)的核心地位。
表1 產(chǎn)業(yè)用地情況統(tǒng)計
(2)按產(chǎn)業(yè)營業(yè)收入、從業(yè)人數(shù)統(tǒng)計分析。從門類單位面積營業(yè)收入看,每平方米營業(yè)收入最高行業(yè)為金融業(yè)(J門類,40.9萬元/m2),其次為建筑業(yè)(E門類,12.1萬元/m2)、交通運輸、倉儲和郵政業(yè)(G門類,8.4萬元/m2)、批發(fā)和零售業(yè)(F門類,8.2萬元/m2)等。結(jié)合整個產(chǎn)業(yè)的營業(yè)收入、從業(yè)人員數(shù)和用地面積比例看,越秀區(qū)第二、三產(chǎn)業(yè)營業(yè)收入比例分別為10.5%、89.5%,從業(yè)人員數(shù)比例分別為12.5%、87.5%,用地面積比例分別為5.3%、94.7%,作為廣州市的行政、商貿(mào)、金融、文化中心,越秀區(qū)第三產(chǎn)業(yè)用地所占比例相當高,其營業(yè)收入、從業(yè)人員所占比例均超過85%,用地面積近95%,可見越秀區(qū)第三產(chǎn)業(yè)發(fā)展水平很高(表2)。
表2 產(chǎn)業(yè)營業(yè)收入及從業(yè)人員數(shù)現(xiàn)狀
城市行業(yè)用地調(diào)查試點中,采用行業(yè)基本單位詳細地址與地名地址數(shù)據(jù)匹配,具有準確性高、速度快的特點。精心設(shè)計城市行業(yè)用地調(diào)查試點項目數(shù)據(jù)庫,組合運用Access數(shù)據(jù)庫的查詢統(tǒng)計功能和ArcGIS的空間分析功能,有助于行業(yè)用地調(diào)查試點工作的完成。持續(xù)性開展城市行業(yè)用地調(diào)查[1],與統(tǒng)計部門年度經(jīng)濟普查保持同步,有助于政府的經(jīng)濟、用地宏觀決策支撐。
[1] 路曉明,付治河,張高,等.行業(yè)用地調(diào)查成果應(yīng)用研究[J].河南科技,2011,10(上):20-21.
[2] TD/T 1014-2007,第二次全國土地調(diào)查技術(shù)規(guī)程[S].北京:中國標準出版社,2007.
[3] 宋子輝.自然語言理解的中文地址匹配算法[J].遙感學(xué)報,2013,17(4):795-801.
[4] 胡青,徐建華,王志海.GIS數(shù)據(jù)庫中地址自動匹配方法研究[J].測繪與空間地理信息,2008,31(6):50-52.
[5] 黨安榮,賈海峰.ArcGIS 8地理信息系統(tǒng)應(yīng)用指南[M].北京:清華大學(xué)出版社,2003.54-55,291-293.
[6] 陳述彭,魯學(xué)軍,周成虎.地理信息系統(tǒng)導(dǎo)論[M].北京:科學(xué)出版社,2001.125-126.
[7] TD/T 1001-2012,地籍調(diào)查規(guī)程[S].北京:中國標準出版社,2012.
[8] 廣州市越秀區(qū)統(tǒng)計局.2011越秀區(qū)國民經(jīng)濟和社會發(fā)展統(tǒng)計資料[EB/OL].http://#yuexiu.gov.cn/inc/op_win.jsp?id=12509.2013-12-31.
2014-08-06;
2014-11-05
國土資源部試點地區(qū)行業(yè)用地調(diào)查項目(DCPJ121702-02)
胡大國(1972-),男,高級工程師,注冊測繪師,主要從事土地調(diào)查和測繪技術(shù)管理工作。E-mail:daguoh@21cn.com