關(guān) 麗,魏 科,顏 涯,孔 令 彥,馮 學(xué) 兵
(1.北京市測(cè)繪設(shè)計(jì)研究院,北京 100038;2.北京市規(guī)劃委員會(huì),北京 100045)
基于多維數(shù)據(jù)模型的城市建設(shè)用地?cái)?shù)據(jù)挖掘研究
——以北京市為例
關(guān) 麗1,魏 科2,顏 涯2,孔 令 彥1,馮 學(xué) 兵1
(1.北京市測(cè)繪設(shè)計(jì)研究院,北京 100038;2.北京市規(guī)劃委員會(huì),北京 100045)
針對(duì)城市建設(shè)用地?cái)?shù)據(jù)的多源異構(gòu)、多維、復(fù)雜度高等特點(diǎn),探討基于空間數(shù)據(jù)倉(cāng)庫(kù)理論挖掘城市建設(shè)用地潛在的空間信息,提出了面向城市建設(shè)用地利用的多維數(shù)據(jù)模型,并基于該模型構(gòu)建了以城市建設(shè)用地利用為主題的空間數(shù)據(jù)倉(cāng)庫(kù),實(shí)現(xiàn)空間數(shù)據(jù)挖掘過(guò)程。以北京市中心城區(qū)的建設(shè)用地?cái)U(kuò)展為例,研究了城市建設(shè)用地的空間格局及其演變特征,為城市建設(shè)用地管理提供決策依據(jù),同時(shí)也為城市建設(shè)用地?cái)?shù)據(jù)的集成、分析和高層決策支持提供了方法論。
城市建設(shè)用地;多維數(shù)據(jù)模型;空間數(shù)據(jù)倉(cāng)庫(kù);數(shù)據(jù)挖掘
城市建設(shè)用地是城市發(fā)展的動(dòng)力和載體,也是公共利益和可持續(xù)發(fā)展的關(guān)鍵保障。城市建設(shè)用地的管理是一個(gè)復(fù)雜的系統(tǒng)控制與決策過(guò)程,它必須充分利用現(xiàn)有的大量歷史業(yè)務(wù)數(shù)據(jù)和空間數(shù)據(jù),挖掘信息潛力,提供政府決策??臻g數(shù)據(jù)挖掘(Spatial Data Mining,SDM)是挖掘信息潛力有效解決方案之一[1-3]。其中,空間數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)集成能力以及對(duì)復(fù)雜數(shù)據(jù)分析、高層決策的支持為城市建設(shè)用地管理提供了方法論。通過(guò)城市建設(shè)用地的數(shù)據(jù)挖掘能夠?qū)崿F(xiàn)對(duì)城市建設(shè)用地對(duì)象的空間分析,用以支持城市建設(shè)用地管理業(yè)務(wù)控制、決策分析及策略制定。本文基于空間數(shù)據(jù)倉(cāng)庫(kù)的空間聚類和統(tǒng)計(jì)挖掘方法對(duì)北京市城市建設(shè)用地的空間格局及其演變特征進(jìn)行了研究,探討實(shí)現(xiàn)空間數(shù)據(jù)挖掘多維分析的方法,提出了適用于城市建設(shè)用地管理的多維數(shù)據(jù)模型。通過(guò)對(duì)北京市城市建設(shè)用地空間格局的時(shí)空定量分析,為城市建設(shè)和規(guī)劃提供科學(xué)決策依據(jù),引導(dǎo)城市土地空間合理、有序發(fā)展。
多維數(shù)據(jù)模型是空間數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行空間在線分析處理 (Spatial Online Analysis Processing,SOLAP)或多維分析的基礎(chǔ)[4-6],是空間數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用的重要手段?;诔鞘薪ㄔO(shè)用地的多維數(shù)據(jù)模型包括7個(gè)維度:建設(shè)用地類型維、建筑高度維、區(qū)域維、面積維、方位維、環(huán)線方位維、時(shí)間維。其中,區(qū)域維為空間維,其他均為非空間維。事實(shí)表中包括3個(gè)度量:容積率、建筑量為數(shù)值度量,建設(shè)用地分布圖為空間度量。空間度量是指向空間對(duì)象集合的一組指針,進(jìn)行空間OLAP操作時(shí),需要計(jì)算空間對(duì)象的合并、疊加和連接等;數(shù)值度量涉及分布式聚集(如總數(shù)、總量或最大值等)、代數(shù)聚集(如平均值、標(biāo)準(zhǔn)差等),最終形成的多維數(shù)據(jù)模型如圖1所示。
圖1 城市建設(shè)用地利用的多維數(shù)據(jù)模型Fig.1 Multi-dimensional data models of urban construction land use
為了從不同的角度層次觀察數(shù)據(jù),在每一維上定義了概念層次[7];概念層次定義了從低到高的一系列映射,允許數(shù)據(jù)在不同的抽象層次上進(jìn)行操作。非空間維的概念分層是對(duì)非空間維的細(xì)節(jié)描述,按維的實(shí)際意義分層??臻g維可按地理要素的幾何特征進(jìn)行概念分層,在城市建設(shè)用地多維數(shù)據(jù)模型中,其概念層次為:
空間數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)(圖2)由數(shù)據(jù)獲取、空間數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建和客戶端應(yīng)用3部分構(gòu)成。1)數(shù)據(jù)獲?。簲?shù)據(jù)源是空間數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ),位于空間數(shù)據(jù)倉(cāng)庫(kù)構(gòu)架的最底層,由空間數(shù)據(jù)和非空間數(shù)據(jù)構(gòu)成[8,9]。按照元數(shù)據(jù)驅(qū)動(dòng)機(jī)制,異質(zhì)異構(gòu)的非空間數(shù)據(jù)通過(guò)ETL(Extraction Transformation Loading)技術(shù),實(shí)現(xiàn)數(shù)據(jù)提取、轉(zhuǎn)換、轉(zhuǎn)載等操作,完成按照主題管理數(shù)據(jù),存儲(chǔ)于空間數(shù)據(jù)倉(cāng)庫(kù)中,這也是構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)的重要環(huán)節(jié)。從數(shù)據(jù)源中抽取出所需要的數(shù)據(jù),經(jīng)過(guò)清洗后,最終按照預(yù)先定義好的多維數(shù)據(jù)模型將數(shù)據(jù)加載到空間數(shù)據(jù)倉(cāng)庫(kù)中,完成數(shù)據(jù)從數(shù)據(jù)源向目標(biāo)空間數(shù)據(jù)倉(cāng)庫(kù)轉(zhuǎn)化的過(guò)程。異構(gòu)的空間數(shù)據(jù)經(jīng)過(guò)數(shù)據(jù)預(yù)處理后,通過(guò)SDE存入空間數(shù)據(jù)庫(kù)。非空間數(shù)據(jù)倉(cāng)庫(kù)和空間數(shù)據(jù)庫(kù)之間通過(guò)空間數(shù)據(jù)的ID號(hào)建立連接,方便空間OLAP服務(wù)同時(shí)處理非空間和空間數(shù)據(jù)。2)空間數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建:在空間數(shù)據(jù)倉(cāng)庫(kù)中,搭建多個(gè)面向主題的空間數(shù)據(jù)集市和空間OLAP服務(wù)器??臻g數(shù)據(jù)集市是根據(jù)不同的功能劃分空間數(shù)據(jù)倉(cāng)庫(kù)的子集[10,11],而空間OLAP服務(wù)器協(xié)助用戶為分析查詢報(bào)表和數(shù)據(jù)挖掘進(jìn)行數(shù)據(jù)準(zhǔn)備。3)客戶端應(yīng)用:用戶訪問(wèn)空間數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的工具,并利用空間數(shù)據(jù)挖掘、空間OLAP分析、報(bào)表分析和可視化等技術(shù)進(jìn)行數(shù)據(jù)分析,最終實(shí)現(xiàn)向用戶提供決策級(jí)空間數(shù)據(jù)服務(wù)。
圖2 空間數(shù)據(jù)倉(cāng)庫(kù)的架構(gòu)Fig.2 Architecture of spatial data warehouse
根據(jù)城市建設(shè)用地空間數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)與主題,將其劃分為4個(gè)數(shù)據(jù)集:建設(shè)用地?cái)U(kuò)展數(shù)據(jù)集、建筑高度數(shù)據(jù)集、建設(shè)用地利用強(qiáng)度數(shù)據(jù)集、空間數(shù)據(jù)集。每個(gè)數(shù)據(jù)集市需要的指標(biāo)都可在多維數(shù)據(jù)模型的支持下從空間數(shù)據(jù)倉(cāng)庫(kù)中挖掘獲得。
(1)建設(shè)用地?cái)U(kuò)展數(shù)據(jù)集。用地?cái)U(kuò)展速度(Mue)和擴(kuò)展強(qiáng)度指數(shù)(Iue)可用于分析和描述各方位城市建成區(qū)用地的擴(kuò)展?fàn)顟B(tài),比較不同時(shí)段各研究單元建成區(qū)面積擴(kuò)展的強(qiáng)弱、快慢和擴(kuò)展趨勢(shì)。
式中:Mue為城市用地?cái)U(kuò)展速度,Iue為城市用地?cái)U(kuò)展強(qiáng)度指數(shù),ΔUij為j時(shí)間段第i個(gè)研究單元(如方位或某格網(wǎng))建成區(qū)擴(kuò)展數(shù)量,Δtj為j時(shí)間段的時(shí)間跨度,ULAij為j時(shí)間段初期第i個(gè)單元建成區(qū)總面積,TLAij為j時(shí)間段第i個(gè)單元土地總面積。
(2)建筑高度數(shù)據(jù)集。根據(jù)建筑的樓層數(shù)*100的數(shù)量,按照方位、環(huán)路、區(qū)縣等范圍比較研究低層(3層及以下)、多層(3~6層)、高層(7層以上)建筑的分布變化。
(3)建設(shè)用地利用強(qiáng)度數(shù)據(jù)集。通過(guò)容積率、建筑量在時(shí)間的變化率上,按照方位、環(huán)路、區(qū)縣、規(guī)劃界研究建設(shè)用地利用強(qiáng)度的變化規(guī)律。
(4)空間數(shù)據(jù)集。主要為其他數(shù)據(jù)集提供空間數(shù)據(jù)支持。
本項(xiàng)目從實(shí)際出發(fā)選擇k-mean空間聚類方法和點(diǎn)分布的空間統(tǒng)計(jì)方法,空間數(shù)據(jù)挖掘步驟如圖3所示。
圖3 空間數(shù)據(jù)挖掘步驟Fig.3 Steps of spatial data mining
以北京市中心城區(qū)的建設(shè)用地?cái)U(kuò)展為例,研究城市建設(shè)用地的空間格局及其演變特征,對(duì)建設(shè)用地的空間擴(kuò)展和發(fā)展特征完成數(shù)據(jù)挖掘過(guò)程,并對(duì)結(jié)果進(jìn)行評(píng)價(jià)。建設(shè)用地?cái)U(kuò)展主題中利用的數(shù)據(jù)有面積維(包括建成區(qū)面積和土地總面積)、建設(shè)用地類型維(居住用地)、方位維(全部方位)、時(shí)間維(十年間隔)。
利用用地?cái)U(kuò)展速度(Mue)和擴(kuò)展強(qiáng)度指數(shù)(Iue)的計(jì)算方法,對(duì)中心城的建設(shè)用地?cái)U(kuò)展情況從時(shí)間和空間角度進(jìn)行分析。城市用地?cái)U(kuò)展速度表示各城市用地類型在整個(gè)研究期內(nèi)不同階段用地?cái)U(kuò)展面積的年增長(zhǎng)速率,用以表征各階段不同類型城市用地?cái)U(kuò)展的總體規(guī)模和趨勢(shì);而城市用地?cái)U(kuò)展強(qiáng)度指的是用各空間單元的土地面積對(duì)其年均擴(kuò)展速度進(jìn)行標(biāo)準(zhǔn)化處理,使不同時(shí)期城市用地?cái)U(kuò)展的速度具有可比性。
根據(jù)數(shù)據(jù)倉(cāng)庫(kù)的建設(shè)用地?cái)U(kuò)展數(shù)據(jù)集中的數(shù)據(jù),按照點(diǎn)分布的空間統(tǒng)計(jì)方法,計(jì)算出1934-2009年北京中心城區(qū)城市建成區(qū)面積,利用GIS模塊制作完成建成區(qū)的面積擴(kuò)展圖(圖4、圖5)。
圖4 北京中心城區(qū)建成區(qū)面積變化Fig.4 Area change of built-up range in Beijing central city
圖5 北京中心城區(qū)建設(shè)用地?cái)U(kuò)展速度與擴(kuò)展強(qiáng)度曲線Fig.5 Expansion speed and extension strength curves of urban construction land in Beijing central city
從數(shù)據(jù)挖掘的結(jié)果可以看出,北京中心城區(qū)建設(shè)用地面積在不斷擴(kuò)張。根據(jù)建設(shè)用地面積和速度、強(qiáng)度的階段性差異,可以分為以下階段:1)20世紀(jì)80年代前緩慢增長(zhǎng)階段。在民國(guó)時(shí)期與新中國(guó)成立初期,北京作為一個(gè)消費(fèi)性城市,城市增長(zhǎng)速度緩慢;之后,北京重新確立為全國(guó)政治中心的地位,并實(shí)行“變消費(fèi)性城市為生產(chǎn)性城市”的城市建設(shè)方針,城市擴(kuò)張進(jìn)程相對(duì)加快。2)80年代至90年代中期快速增長(zhǎng)階段。改革開(kāi)放后,受市場(chǎng)經(jīng)濟(jì)、亞運(yùn)場(chǎng)館建設(shè)、二三四環(huán)路相繼建成等影響,城市快速發(fā)展。3)90年代中期至21世紀(jì)初中期高速增長(zhǎng)階段。受全球經(jīng)濟(jì)一體化、大北京城市建設(shè)規(guī)劃、2008年奧運(yùn)會(huì)場(chǎng)館建設(shè)、軌道交通建設(shè)的影響,北京城市進(jìn)入有史以來(lái)最快的擴(kuò)張階段。4)21世紀(jì)緩慢增長(zhǎng)階段。中心城進(jìn)入調(diào)整優(yōu)化的階段,中心城擴(kuò)張速度放緩。
中心城建設(shè)用地?cái)U(kuò)展的各向異性分析通過(guò)各方位的面積增長(zhǎng)、擴(kuò)展速度和擴(kuò)展強(qiáng)度的差異,揭示城市用地空間擴(kuò)展方向與規(guī)模的差異。本研究統(tǒng)計(jì)了以天安門(mén)為中心,16個(gè)方位的建設(shè)用地?cái)U(kuò)展強(qiáng)度指標(biāo)(%),建設(shè)用地?cái)U(kuò)展強(qiáng)度如圖6所示,四大方向的建設(shè)用地?cái)U(kuò)展強(qiáng)度堆積曲線如圖7所示。
從結(jié)果可以看出,不同階段北京城市的發(fā)展方向如下:1934-1956年,城區(qū)范圍突破了內(nèi)外城墻,擴(kuò)張方向主要在西部;1956-1965年,城市空間主要擴(kuò)張方向仍然在西部與西北部,南邊的擴(kuò)張主要是由于將南苑機(jī)場(chǎng)也納入了城市建設(shè)用地;1956-1975年,城市空間主要擴(kuò)張方向呈“三葉草”型,主要沿長(zhǎng)安街東西方向以及城市西北部擴(kuò)張;1975-2003年,城市空間主要在北部以較高強(qiáng)度擴(kuò)展;2003-2007年,西北面由于天通苑等大型社區(qū)建設(shè)擴(kuò)展強(qiáng)度較大;2007-2009年,東面和東北面由于靠近通州和望京地區(qū)的發(fā)展,擴(kuò)展強(qiáng)度較大。
總之,北京城市擴(kuò)展模式可概括為1975年以前,沿?cái)U(kuò)展翼緩慢擴(kuò)展;1975-2003年,呈現(xiàn)出高強(qiáng)度圈層漸進(jìn)式擴(kuò)展,發(fā)展方向偏北;2003年后擴(kuò)展強(qiáng)度放緩,主要由一些重點(diǎn)地區(qū)帶動(dòng)了西北和東北方向的發(fā)展,就目前來(lái)看,南部擴(kuò)展遠(yuǎn)不如北部。
本文面向城市建設(shè)用地利用主題建立了多維數(shù)據(jù)模型,并以該模型為基礎(chǔ)構(gòu)建了空間數(shù)據(jù)倉(cāng)庫(kù),為城市建設(shè)用地的集成、分析和決策提供了方法。對(duì)建設(shè)用地主題的事實(shí)、維度、維層次及維層次關(guān)系進(jìn)行識(shí)別。針對(duì)時(shí)空維的復(fù)雜度,以星型數(shù)據(jù)模型結(jié)構(gòu)構(gòu)建城市建設(shè)用地多維數(shù)據(jù)倉(cāng)庫(kù)。本文以北京市城市建設(shè)用地空間格局為主題,構(gòu)建北京市城市建設(shè)用地空間數(shù)據(jù)倉(cāng)庫(kù),提供北京市城市建設(shè)用地的空間分布模型,為城市建設(shè)用地管理提供決策依據(jù)。
[1]AH MAD I,AZHAR S.Development of a decision support system using data warehousing to assist builders developers in site selection[J].Automation in Construction,2004(13):525-542.
[2]石磊,石云.空間數(shù)據(jù)倉(cāng)庫(kù)中維和度量的建模[J].計(jì)算機(jī)應(yīng)用,2000,20(10):19-20.
[3]李一軍,樊博.空間 OLAP技術(shù)研究[J].管理科學(xué)學(xué)報(bào),2003,6(4):9-16.
[4]DATTA A,THOMAS H.The cube data model:A conceptual model and algebra for on 1ine analytical processing in data warehouses[J].Decision Support Systems,1999,27:289-301.
[5]鄒逸江.多維空間分析的關(guān)鍵技術(shù)——空間數(shù)據(jù)立方體[J].地理與地理信息科學(xué),2006,22(1):12-16.
[6]STEFANOVIC N,HAN J W.Object-based selective materialization for efficient implementation of spatial datacubes[J].IEEE Transactions on Knowledge Data Engineering,2000,12(6):938-958.
[7]HAN J W.范明,孟小峰(譯).數(shù)據(jù)挖掘:概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2001.
[8]陳崇成,肖桂榮,孫颯梅,等.空間決策支持系統(tǒng)的集成體系結(jié)構(gòu)及其實(shí)現(xiàn)途徑[J].計(jì)算機(jī)工程與應(yīng)用,2001,37(15):55-57.
[9]遲忠先,李艷紅,張春濤,等.OLAP核心技術(shù)——數(shù)據(jù)立方體的研究現(xiàn)狀與展望[J].計(jì)算機(jī)工程,2002,28(10):316-318.
[10]王曉明,高勇.面向水環(huán)境管理的空間數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建[J].計(jì)算機(jī)應(yīng)用研究,2005(11):165-167.
[11]余達(dá)太,藍(lán)榮欽,張世濤,等.空間數(shù)據(jù)挖掘的方法和實(shí)施[J].測(cè)繪學(xué)院學(xué)報(bào),2003,20(2):132-134.
Research on Data Mining of Urban Construction Land Based on Multidimensional Data Model:A Case Study of Beijing
GUAN Li1,WEI Ke2,YAN Ya2,KONG Ling-yan1,F(xiàn)ENG Xue-bing1
(1.BeijingInstituteofSurveyingandMapping,Beijing100038;2.BeijingMunicipalCommissionofUrbanPlanning,Beijing100045,China)
For the characteristics of urban construction land data,such as multi-source,heterogeneous,multi-dimensional and high complexity,to mine the potential spatial information of urban construction land based on spatial data warehouse theory is discussed in this paper.Multi-dimensional data model-oriented urban construction land use is put forward and designed to build spatial data warehouses in the theme of urban construction land use and to achieve spatial data mining process.Taking construction land in Beijing central city for example,the spatial structure and evolution features of urban construction land are researched to provide methodology and basis for management,integration,analysis,and high-level decision-making of urban construction land.
urban construction land;multidimensional data model;spatial data warehouse;data mining
P 208;F293.2
A
1672-0504(2012)06-0049-04
2012-03- 06;
2012-06-01
關(guān)麗(1980-),女,博士,從事空間數(shù)據(jù)組織理論與應(yīng)用方法研究,發(fā)表論文30余篇。E-mail:binger02600@163.com