劉美春,張 力,肖劍平
(1. 武漢市測(cè)繪研究院,湖北 武漢 430022; 2. 長(zhǎng)江水利委員會(huì),湖北 武漢 430010)
Study of Data Processing Technology of City Comprehensive
Atlas Compilation
LIU Meichun,ZHANG Li,XIAO Jianping
?
城市綜合性地圖集編制中數(shù)據(jù)處理技巧研究
劉美春1,張力2,肖劍平1
(1. 武漢市測(cè)繪研究院,湖北 武漢 430022; 2. 長(zhǎng)江水利委員會(huì),湖北 武漢 430010)
Study of Data Processing Technology of City Comprehensive
Atlas Compilation
LIU Meichun,ZHANG Li,XIAO Jianping
摘要:城市綜合性地圖集是綜合反映一個(gè)城市自然、經(jīng)濟(jì)、文化、歷史、發(fā)展?fàn)顩r的信息載體,是人們?nèi)媪私庠摮鞘凶钪庇^、最全面的信息工具,需要通過(guò)方方面面的信息進(jìn)行綜合與融合。本文以《武漢城市地圖集》為例,從城市綜合性地圖集的內(nèi)容、資料和數(shù)據(jù)情況分析和處理、數(shù)據(jù)挖掘技術(shù)應(yīng)用和知識(shí)表示效果等方面進(jìn)行展開(kāi),充分體現(xiàn)了數(shù)據(jù)處理技術(shù)在綜合性圖集編制中的重要性。
關(guān)鍵詞:資料收集;資料分析與評(píng)價(jià);數(shù)據(jù)倉(cāng)庫(kù);數(shù)據(jù)挖掘;知識(shí)表示
隨著地理信息技術(shù)和計(jì)算機(jī)、網(wǎng)絡(luò)等技術(shù)的趨向成熟,所有文字、圖片、數(shù)據(jù)等有形和無(wú)形的信息都能與地圖掛鉤,都能通過(guò)圖文形式進(jìn)行有效表達(dá),可以說(shuō)人類活動(dòng)、自然界所發(fā)生的所有信息都可以在圖集中充分體現(xiàn)。城市綜合性地圖集是一定時(shí)期內(nèi)城市市容市貌及生產(chǎn)、生活信息的綜合體。資料的全面性、現(xiàn)勢(shì)性、權(quán)威性是地圖集實(shí)用性和綜合性的前提,圍繞圖集所要表達(dá)的內(nèi)容進(jìn)行資料分析和數(shù)據(jù)挖掘是關(guān)鍵所在,針對(duì)所挖掘的信息進(jìn)行知識(shí)的表達(dá),以及應(yīng)該如何表達(dá)、表達(dá)到什么程度是圖集研究的最終目的。
一、城市綜合性地圖集內(nèi)容構(gòu)成
1. 城市綜合性地圖集常見(jiàn)內(nèi)容形式
城市綜合性地圖集一般要反映城市的自然狀態(tài)、市政建設(shè)、人類活動(dòng)、精神文化與城市管理等幾個(gè)基本方面,不僅包含資源環(huán)境地圖、人文地圖、經(jīng)濟(jì)地圖和歷史地圖等內(nèi)容,同時(shí)包含環(huán)境評(píng)價(jià)、區(qū)域規(guī)劃、預(yù)測(cè)預(yù)報(bào)等與經(jīng)濟(jì)建設(shè)和人類生活直接相關(guān)的選題。如《重慶市地圖集》內(nèi)容包含城市歷史、政區(qū)、地勢(shì)、交通、人口、資源、環(huán)境、經(jīng)濟(jì)與社會(huì)、區(qū)縣圖和規(guī)劃等;《北京城市地圖集》包含北京區(qū)位、地勢(shì)、政區(qū)、交通機(jī)中心城區(qū)詳圖等信息。
2. 《武漢城市地圖集》內(nèi)容情況介紹
《武漢城市地圖集》以武漢市主城區(qū)地圖數(shù)據(jù)為主,從區(qū)位、環(huán)境、資源、交通、地質(zhì)結(jié)構(gòu)、行政區(qū)劃6個(gè)方面著手,將武漢的地理位置、氣候、人口、行政區(qū)劃、面積、交通、人文、環(huán)境、歷史、發(fā)展、規(guī)劃等方面信息通過(guò)時(shí)間軸連接在一起,從時(shí)間和空間兩個(gè)方面,詳細(xì)反映一定時(shí)期城市的發(fā)展變化和人文、經(jīng)濟(jì)、管理狀況;通過(guò)歷史與現(xiàn)狀、現(xiàn)狀與規(guī)劃、地圖與文字、圖片與圖表、符號(hào)與數(shù)字等相結(jié)合的方式細(xì)細(xì)描繪,共同表示武漢的歷史久、城市大、發(fā)展速、規(guī)劃全等特點(diǎn),突出武漢市城市的特色及區(qū)位優(yōu)勢(shì)。內(nèi)容分以下4個(gè)圖組:
1) “極目楚天”圖組:突出武漢區(qū)位優(yōu)勢(shì),表示武漢在全國(guó)的位置圖、武漢在湖北省的位置圖、武漢城市圈地圖、武漢市政區(qū)圖、武漢市中心城區(qū)圖和武漢市影像圖,從地理定位方面讓讀者對(duì)武漢有一個(gè)框架性的了解。
2) “巍巍江城”圖組:從環(huán)境、資源、交通及發(fā)展現(xiàn)狀4個(gè)方面詳細(xì)表示城市面貌。這是圖集的主體內(nèi)容,采取先整體后局部的形式,首先采用DEM與矢量相疊加的形式,突出武漢總的地貌特色;在此基礎(chǔ)上,結(jié)合歷年相關(guān)統(tǒng)計(jì)資料,用圖表、文字、專題圖等將武漢的氣候、地質(zhì)、人口、交通、醫(yī)療衛(wèi)生,以及各項(xiàng)自然和人文經(jīng)濟(jì)指標(biāo)進(jìn)行縱向和橫向比較;然后將中心城區(qū)采取矢量和影像對(duì)照的形式、以大比例尺1∶4000~1∶16 000的圖幅詳細(xì)表示。
3) “覽勝三鎮(zhèn)”圖組:從城市歷史變遷、楚風(fēng)漢韻、商貿(mào)重鎮(zhèn)、都市點(diǎn)睛等體現(xiàn)武漢發(fā)展歷程。通過(guò)歷史圖片、文字、效果圖、三維立體影像圖等對(duì)三鎮(zhèn)演變、城市擴(kuò)展、風(fēng)俗民情、風(fēng)味美食、文娛生活、體育特色、商業(yè)網(wǎng)點(diǎn)、主要經(jīng)濟(jì)開(kāi)發(fā)區(qū)、示范生活小區(qū)、主要景點(diǎn)、景區(qū)等進(jìn)行特色描述。
4) “展望武漢”圖組:通過(guò)城市近期和中遠(yuǎn)期規(guī)劃圖件展示武漢未來(lái)發(fā)展方向。以規(guī)劃專題圖為主題,配合相應(yīng)的文字說(shuō)明和圖片,通過(guò)都市發(fā)展組團(tuán)規(guī)劃、主城區(qū)特色景觀規(guī)劃等圖件和文字介紹的形式,展現(xiàn)若干年后武漢市的格局和面貌。
二、編圖資料與數(shù)據(jù)情況
城市綜合性地圖集所需資料和數(shù)據(jù)涵蓋城市發(fā)展過(guò)程中的方方面面,數(shù)據(jù)類型多種多樣,往往不是一個(gè)數(shù)據(jù)庫(kù)就能解決問(wèn)題的,是基礎(chǔ)地理數(shù)據(jù)庫(kù)和各專題數(shù)據(jù)庫(kù)的集合體。從我國(guó)目前對(duì)于地理信息方面的管理模式來(lái)看,綜合性地圖集的編制少不了資料收集這一重要環(huán)節(jié),需從各相關(guān)單位獲取最現(xiàn)勢(shì)、最完善的第一手資料。在收集資料的過(guò)程中,設(shè)計(jì)者必須做到心中有數(shù)、有的放矢,只有明白自己需要什么樣的資料、大概在什么地方獲得,將所要的資料列出詳細(xì)清單,才能保證信息的完備性和權(quán)威性。
《武漢城市地圖集》的編制資料以武漢市“十五”以來(lái)連續(xù)3個(gè)五年規(guī)劃1∶2000地形數(shù)據(jù)庫(kù)、“十一五”以來(lái)1∶500~1∶10 000系列比例尺地形數(shù)據(jù)庫(kù)和時(shí)間跨度達(dá)幾十年的遙感影像數(shù)據(jù)為基礎(chǔ),并輔以各行各業(yè)文字、圖片、統(tǒng)計(jì)圖表等反映城市歷史、經(jīng)濟(jì)、現(xiàn)狀、發(fā)展、規(guī)劃等與城市發(fā)展相關(guān)的專題信息,其數(shù)據(jù)類型涵蓋面向?qū)ο髷?shù)據(jù)庫(kù)、空間數(shù)據(jù)庫(kù)、時(shí)間數(shù)據(jù)庫(kù)、文本數(shù)據(jù)庫(kù)、多媒體數(shù)據(jù)庫(kù)、專題數(shù)據(jù)庫(kù)和互聯(lián)網(wǎng)數(shù)據(jù)庫(kù)等。
三、資料分析與數(shù)據(jù)預(yù)處理
在圖集編制過(guò)程中,對(duì)資料的分析和數(shù)據(jù)處理是編輯制作的前期準(zhǔn)備工作,是設(shè)計(jì)內(nèi)容能否實(shí)現(xiàn)的關(guān)鍵。設(shè)計(jì)者首先從一堆雜亂無(wú)章的資料中將面向主題的信息篩選出來(lái);然后對(duì)與時(shí)間相關(guān)的數(shù)據(jù)(如歷史數(shù)據(jù))按時(shí)間軸進(jìn)行整理,建立編制資料的信息庫(kù);最后通過(guò)數(shù)據(jù)挖掘技術(shù)和制圖綜合技術(shù)將數(shù)據(jù)集成為成果圖集。圖集工作流程如圖1所示。
圖1 圖集工作流程
1. 資料的整理、分析與評(píng)價(jià)
(1) 資料的分類、分級(jí)整理
鑒于每類數(shù)據(jù)的來(lái)源和管理方式不同,不同的數(shù)據(jù)庫(kù)之間的數(shù)據(jù)存在穿插性,并且同類數(shù)據(jù)在不同數(shù)據(jù)庫(kù)中表現(xiàn)形式和時(shí)間段也存在偏差。為提高資料的使用效率,簡(jiǎn)化作業(yè)流程,首先必須將收集到的資料進(jìn)行分類、分級(jí)整理,根據(jù)數(shù)據(jù)的表現(xiàn)形式可分為地圖資料、遙感影像資料、數(shù)據(jù)資料、文字資料、圖片資料等幾類,在此基礎(chǔ)上將每一類資料又分為基礎(chǔ)資料、補(bǔ)充資料、專題資料等不同級(jí)別。在數(shù)據(jù)管理上,緊密結(jié)合圖集內(nèi)容結(jié)構(gòu)進(jìn)行,基本上采取星形結(jié)構(gòu),在數(shù)據(jù)倉(cāng)庫(kù)的統(tǒng)一集合下,將數(shù)據(jù)以圖組為單元建立數(shù)據(jù)庫(kù),在各數(shù)據(jù)庫(kù)的基礎(chǔ)上再分專題逐級(jí)、逐層進(jìn)行管理。
(2) 編圖資料的分析與評(píng)價(jià)
從地圖編制、審核和使用幾個(gè)方面來(lái)說(shuō),城市地圖集編制資料必須具備政治性、科學(xué)性、完備性、現(xiàn)勢(shì)性等特性,因此對(duì)所收集到的資料首先進(jìn)行科學(xué)分析與評(píng)價(jià),優(yōu)先使用具備這些基本特性的資料,將政治性和現(xiàn)勢(shì)性不強(qiáng)的資料剔除出來(lái),從源頭消除地圖成果的質(zhì)量隱患。如對(duì)基礎(chǔ)地理數(shù)據(jù)進(jìn)行數(shù)據(jù)格式、數(shù)據(jù)坐標(biāo)系、數(shù)據(jù)質(zhì)量等分析;對(duì)環(huán)境監(jiān)測(cè)、氣候等動(dòng)態(tài)變化的資料進(jìn)行時(shí)間性評(píng)價(jià);對(duì)統(tǒng)計(jì)圖表進(jìn)行定位性、統(tǒng)一性等評(píng)價(jià)。
2. 數(shù)據(jù)預(yù)處理及數(shù)據(jù)倉(cāng)庫(kù)的建立
從不同渠道收集到的資料經(jīng)常會(huì)存在完整性和規(guī)范性不一致等特點(diǎn)。要想實(shí)現(xiàn)資料的有效利用,簡(jiǎn)化數(shù)據(jù)處理過(guò)程,提高最終成果質(zhì)量,在數(shù)據(jù)利用前必須進(jìn)行數(shù)據(jù)預(yù)處理,對(duì)資料進(jìn)行篩選,通過(guò)格式轉(zhuǎn)換、掃描、數(shù)字化等手段改變?cè)械姆诸悺⒎旨?jí)、規(guī)范表示方法,去除冗余數(shù)據(jù),根據(jù)時(shí)間序列和已知的變化規(guī)律補(bǔ)充不完全數(shù)據(jù)等。在此基礎(chǔ)上進(jìn)行數(shù)據(jù)集成和數(shù)據(jù)形式轉(zhuǎn)換,將數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的數(shù)據(jù)坐標(biāo)、投影方式及統(tǒng)一存儲(chǔ)在便于挖掘的數(shù)據(jù)平臺(tái),把不同來(lái)源、格式、特點(diǎn)性質(zhì)的數(shù)據(jù)在邏輯上或物理上進(jìn)行有機(jī)集中,將數(shù)據(jù)由多個(gè)源統(tǒng)一到數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行存儲(chǔ),在此基礎(chǔ)上分圖組、分專題進(jìn)行整理。數(shù)據(jù)處理流程如圖2所示。
圖2 圖集數(shù)據(jù)處理流程
四、數(shù)據(jù)處理技巧與表達(dá)效果分析
1. 數(shù)據(jù)挖掘技術(shù)應(yīng)用
任何一個(gè)數(shù)據(jù)都包含直觀表示的信息和潛在深層次的信息。直觀表現(xiàn)的信息在層面上一般讓人一目了然,這是一般讀者都能輕易獲取的信息;而潛在的信息往往容易被忽視,這些隱藏的、深層次的信息獲取一般需要有一定的數(shù)據(jù)庫(kù)作支撐,通過(guò)系列的專業(yè)技術(shù),從大量的信息源中經(jīng)過(guò)分析、對(duì)比、統(tǒng)計(jì)、歸納,提取隱藏于其中的、有效的信息和知識(shí)。所謂的的數(shù)據(jù)倉(cāng)庫(kù),實(shí)際上就是圖集所需資料數(shù)據(jù)的集合,包含基礎(chǔ)數(shù)據(jù)庫(kù)、統(tǒng)計(jì)圖表、文字信息,以及其他專題信息庫(kù)。在進(jìn)行數(shù)據(jù)挖掘之前,首先建立數(shù)據(jù)倉(cāng)庫(kù)等數(shù)據(jù)集中管理模式,然后分析數(shù)據(jù),明確目標(biāo),確定需要挖掘什么樣的信息,根據(jù)信息源實(shí)際情況采取聚類分析、關(guān)聯(lián)分析、演變分析及統(tǒng)計(jì)等有效的方法,從各種非結(jié)構(gòu)化數(shù)據(jù)(如文本、圖形、圖像等數(shù)據(jù))中尋找最有用的數(shù)據(jù)。
在地圖集的編制過(guò)程中,使用頻率最多的是空間數(shù)據(jù)挖掘技術(shù)、文本挖掘技術(shù)、多媒體挖掘技術(shù)等,利用基礎(chǔ)地理數(shù)據(jù)庫(kù)編制地理底圖,在以研究范圍的地理底圖為背景的情況下,從各行各業(yè)的經(jīng)濟(jì)和建設(shè)專題數(shù)據(jù)庫(kù)中獲取城市發(fā)展歷程、發(fā)展現(xiàn)狀和城市發(fā)展規(guī)律的知識(shí)和信息。
《武漢城市地圖集》編制的數(shù)據(jù)源主要是現(xiàn)實(shí)性較強(qiáng)的基礎(chǔ)地形矢量數(shù)據(jù)、多個(gè)時(shí)間段的航空數(shù)碼影像數(shù)據(jù),以及各行各業(yè)、各專題的文字統(tǒng)計(jì)圖表等文本信息和圖像信息。從中獲取時(shí)空信息和統(tǒng)計(jì)信息是城市地圖集編制的目的之一。其中城市大比例尺基礎(chǔ)地形和影像數(shù)據(jù)中涵蓋現(xiàn)實(shí)世界一定時(shí)間段內(nèi)幾乎所有信息。以1∶2000地形圖為例,包含水系、居民地、交通、管線、境界、地貌、土質(zhì)與植被、注記8大類城市基礎(chǔ)地理信息資源及數(shù)據(jù)庫(kù)中各類經(jīng)濟(jì)指標(biāo)屬性信息,厘米級(jí)航攝影像圖中包含地表以上信息中除注記外的7大類信息。因此,數(shù)據(jù)源的信息挖掘空間很大,從中不僅可以獲取反映城市發(fā)展變化的時(shí)空信息,同時(shí)城市行政、建設(shè)、經(jīng)濟(jì)、交通、土地利用等詳細(xì)情況都能從中分析和統(tǒng)計(jì)出來(lái),如圖3所示。
2. 知識(shí)表示效果分析
雖然基礎(chǔ)數(shù)據(jù)庫(kù)包含十分豐富的信息資源,從中探索并提煉出大量隱藏的信息并非易事,將這些潛在的信息轉(zhuǎn)化為人們可接受的表現(xiàn)形式可以說(shuō)是難上加難。如何將這些來(lái)源復(fù)雜、形式多樣、時(shí)空跨度長(zhǎng)達(dá)幾年甚至幾十年的且基本上不能直接使用的資料轉(zhuǎn)化為設(shè)計(jì)者所要表達(dá)的內(nèi)容形式,是地圖集設(shè)計(jì)過(guò)程中比較棘手的問(wèn)題。
在數(shù)據(jù)挖掘過(guò)程中獲取圖集設(shè)計(jì)思路中所要表達(dá)的信息,通過(guò)制圖綜合和統(tǒng)計(jì)分析等方法進(jìn)行知識(shí)提取和轉(zhuǎn)化,通過(guò)地圖語(yǔ)言以通俗、直觀、實(shí)用的圖片、文字、圖表、符號(hào)等進(jìn)行特征化、可視化、模型化處理,從而實(shí)現(xiàn)知識(shí)合理及正確的表達(dá);然后將數(shù)據(jù)進(jìn)行整合、包裝和輸出成印刷圖件,完成資料—數(shù)據(jù)—數(shù)據(jù)庫(kù)—單幅圖—圖集的編制過(guò)程;最終形成圖幅信息的表示方式,以地圖集的形式展示給讀者。
圖3 專題信息挖掘
圖4 文本信息知識(shí)表示效果
在此過(guò)程中,將文本信息轉(zhuǎn)化為專題圖和統(tǒng)計(jì)圖表,以及時(shí)空信息的挖掘和表示難度較大,在很多情況下沒(méi)有確定的分界線和明確的分級(jí)指標(biāo),一般憑借人的知識(shí)積累和實(shí)踐常識(shí)來(lái)分析和評(píng)判。因此,在數(shù)據(jù)挖掘和知識(shí)表達(dá)的整個(gè)流程中,不僅需要計(jì)算機(jī)技術(shù)、多媒體技術(shù)、制圖綜合技術(shù),同時(shí)人工智能技術(shù)、模糊分析、時(shí)空分析和神經(jīng)網(wǎng)絡(luò)技術(shù)的使用也較多。以文本信息為例,同樣的信息內(nèi)容在不同的專題中可以表示成專題地圖、統(tǒng)計(jì)圖表、文字與圖片穿插等不同的表達(dá)方式,如圖4所示?!段錆h城市地圖集》將專題地圖、統(tǒng)計(jì)圖表、文字介紹、圖片信息等融合在一起,采取圖文并茂的形式進(jìn)行表示,在表達(dá)上突出藝術(shù)性,效果如圖5、圖6所示。
圖5 專題地圖與文字圖片結(jié)合表示效果
圖6 專題地圖與統(tǒng)計(jì)圖表結(jié)合表示效果
五、結(jié)束語(yǔ)
綜合性地圖集的編制是一項(xiàng)系統(tǒng)工程和精細(xì)工
程,數(shù)據(jù)挖掘和信息表達(dá)技術(shù)在其中表現(xiàn)得特別充分,廣大地圖編制工作者必須在長(zhǎng)期的生產(chǎn)實(shí)踐中進(jìn)行積累,并與時(shí)俱進(jìn),利用先進(jìn)的技術(shù)理念和方法來(lái)指導(dǎo)實(shí)踐。在當(dāng)今的大數(shù)據(jù)時(shí)代,能充分利用和開(kāi)發(fā)數(shù)據(jù),才能引領(lǐng)時(shí)代。地圖學(xué)是站在時(shí)代最前沿的學(xué)科之一,各行各業(yè)的信息化建設(shè)都離不開(kāi)地圖這個(gè)載體,地圖也是利用數(shù)據(jù)最多、最全面的學(xué)科,從現(xiàn)實(shí)世界中挖掘知識(shí)是地圖學(xué)發(fā)展的精髓所在,數(shù)據(jù)挖掘技術(shù)必將在這個(gè)領(lǐng)域得到更好的發(fā)揮和延伸。
參考文獻(xiàn):
[1]HAN J,KAMBER M.數(shù)據(jù)挖掘概念與技術(shù)[M].范明,孟小峰,譯. 2版. 北京:機(jī)械工業(yè)出版社,2007.
[2]李新運(yùn).城市空間數(shù)據(jù)挖掘方法與應(yīng)用[M]. 山東:山東大學(xué)出版社,2005.
[3]呂曉玲.?dāng)?shù)據(jù)挖掘方法與應(yīng)用[M]. 北京:中國(guó)人民大學(xué)出版社,2009.
[4]汪前進(jìn).羅明堅(jiān)編繪《中國(guó)地圖集》所依據(jù)中文原始資料新探[J]. 北京行政學(xué)院學(xué)報(bào), 2013(3):120-123.
[5]唐靜,王貝,趙飛.城市專題地圖指標(biāo)內(nèi)容的分析和處理[J]. 地理信息世界, 2010(4),35-39.
[6]SOWA J F. 知識(shí)表示[M]. 北京:機(jī)械工業(yè)出版社,2003.
[7]龐玉華. 對(duì)地圖集總體設(shè)計(jì)的思考[J]. 測(cè)繪通報(bào),2007(5):63-65.
[8]王秀斌. 區(qū)域綜合地圖集總體設(shè)計(jì)思路探討——《福建省情地圖集》總體方案設(shè)計(jì)研究[J]. 測(cè)繪通報(bào),2008(1):59-61.
引文格式: 劉美春,張力,肖劍平. 城市綜合性地圖集編制中數(shù)據(jù)處理技巧研究[J].測(cè)繪通報(bào),2016(1):128-131.DOI:10.13474/j.cnki.11-2246.2016.0032.
作者簡(jiǎn)介:劉美春(1973—),女,高級(jí)工程師,主要從事地圖編研、數(shù)據(jù)處理等工作。E-mail: lmcwhkc@sohu.com
收稿日期:2014-10-17
中圖分類號(hào):P283
文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):0494-0911(2016)01-0128-04