李元復,孫 群,季曉林,周 炤,呂 錚
(信息工程大學,河南 鄭州 450001)
地理信息在當今社會的生產(chǎn)生活中發(fā)揮著越來越重要的作用,作為一種地理信息的組織形式,地理實體指的是具有完整性質感的目標集合,具有可識別性、主題相關性和可描述性的特點[1-2],是多源數(shù)據(jù)融合中匹配的基本單位[3]?;诘乩韺嶓w的數(shù)據(jù)模型具有以下優(yōu)點:①符合人們的認知習慣,便于非測繪專業(yè)人員的使用;②有利于實現(xiàn)地理目標與相關專題信息的掛接;③可以實現(xiàn)實體級的數(shù)據(jù)更新,有助于地理信息實時更新的實現(xiàn),便于表現(xiàn)地理目標的時空變化。實現(xiàn)城市道路的實體化,有利于拓寬道路數(shù)據(jù)的應用范圍,使之更好地服務于城市規(guī)劃與建設。
部分發(fā)達國家和地區(qū)對于地理實體數(shù)據(jù)的管理已初步形成了規(guī)范,并在實際生產(chǎn)中采用了面向實體的數(shù)據(jù)模型。國內(nèi)外許多學者對于地理實體的構建[4-8]、管理[9-10]與表達[11-12]進行了深入研究。目前,與城市道路實體化相關的研究主要集中于Stroke構造方面。文獻[13]以城市導航地圖數(shù)據(jù)為基礎,根據(jù)道路的特點進行分類,并分別給出具體的Stroke構建方法。文獻[14]根據(jù)道路的幾何特征對不含語義信息的城市道路進行了Stroke構建。關于Stroke構建的研究僅考慮了道路數(shù)據(jù)幾何特征,沒有充分顧及名稱語義在實體化構建中的作用,在數(shù)據(jù)生產(chǎn)過程中會存在同一道路實體被分為多條Stroke的情況,因此不能直接用于城市道路的實體化構建。
鑒于此,本文對城市路段數(shù)據(jù)實體化的具體方法進行了研究。首先,對道路實體的構建原則進行闡述;在此基礎上,本文給出了交叉路口相接路段的幾何連通度、名稱匹配度和綜合匹配度的計算方法,對實體化匹配的具體過程進行了描述;以鄭州市區(qū)部分道路數(shù)據(jù)為試驗對象,構建了道路實體;最后通過對比試驗,驗證了本文方法的準確性。
與公路和鄉(xiāng)村道路等其他類型道路相比,城市道路數(shù)據(jù)具有以下特點:①大部分具備名稱信息;②大部分不具備編號信息;③大部分路段在交叉路口的連通性較好,即夾角接近180°。根據(jù)以上特點,本文將城市道路數(shù)據(jù)的實體化構建原則歸納如下:
(1) 同一道路實體必須具備整體連通性。
(2) 實體與路段之間的關系可以是一對一、一對多和多對多。
(3) 相接路段的實體化要充分顧及幾何連通性和名稱一致性。
城市道路實體化構建總體方法如圖1所示。首先,根據(jù)每個路段端點的坐標進行匹配,生成道路交叉口數(shù)據(jù),作為進行路段匹配的基本對象,記錄其對應路段的索引號。對每個路口進行遍歷,將路口所有路段兩兩配對,計算每個路段對的幾何連通度和名稱匹配度,并據(jù)此計算綜合匹配度。根據(jù)綜合匹配度及其閾值,判定該相接路段對是否屬于同一實體。最后,遍歷各個路口,生成道路實體索引號與路段索引號對應關系表,并據(jù)其對路段進行拼接,生成道路實體數(shù)據(jù)。
圖1 城市道路實體化構建總體方法
1.2.1 幾何連通度
幾何連通性指的是兩路段在連接處的平滑程度,即兩路段夾角越接近180°,其幾何連通性越強。隨著路段之間夾角從180°開始逐漸減小,其幾何連通性呈快速減弱趨勢,在兩路段呈直角時其幾何連通性已經(jīng)處于很弱的狀態(tài),當其夾角繼續(xù)減小時,其幾何連通性減弱速度也逐漸減緩。為了量化展現(xiàn)幾何連通性隨路段夾角的變化,同時考慮后續(xù)綜合匹配度計算的需要,本文對路段夾角進行基于反比例函數(shù)的歸一化處理,提出幾何連通度的概念,其計算方法為
(1)
式中,GCij和αij為索引號為i的路口中第j個路段對的幾何連通度和夾角。
1.2.2 名稱匹配度
名稱一致性指的是兩相接路段的名稱具有較高關聯(lián)度的性質,具有較高名稱一致性的路段對可分為完全同名路段對和不完全同名路段對(如“嵩山北路”與“嵩山南路”)兩類。為了定量描述名稱的一致性,本文引入了名稱匹配度的概念。
按詞性進行分割,路段名稱可分為3個部分:實體名項(如街、路和大道)、方位項(東、西、南、北、中)和特征名項(除實體名項和方位項以外的部分)。首先,采用基于整詞二分的分詞詞典機制[15]對實體名項進行后序查找,并引入方位詞敏感機制,若名稱中含方位詞,則其最長字串從方位詞后的字開始計算。方位項通常位于名稱開頭或實體名項前特征名項后,本文將這兩種情況分別定義為方位項的前置和后置,在提取方位項時,后置的優(yōu)先級高于前置。最后將除實體名項和方位項以外的其他字符歸為特征名項,便完成了路段名稱的分割。
設第i個路口第j個路段對的實體名項匹配度、方位項匹配度和特征名項匹配度分別為sij1、sij2和sij3,其對應的權值分別為a1、a2和a3,則名稱匹配度SSij的定義為
(2)
對于路段對的方位項,若同時屬于集合{東,西,中}或{南,北,中},而且同為前置或后置,則稱其具有關聯(lián)關系。對于每個路段對,實體名項、方位項和特征名項匹配度的具體計算方法為:
(1) 若實體名項相同,則sij1=1;否則sij1,sij2和sij3均為0。
(2) 在實體名項相同的前提下:
a. 若特征名項不同,則sij2和sij3均為0。
b. 若特征名項與方位項均為空,或特征名項相同且方位項關聯(lián),則sij2和sij3均為1。
c. 若特征名項相同但方位項不關聯(lián),則sij2=0,sij3=1。
1.2.3 道路實體生成
為了表示幾何連通度與名稱匹配度對路段匹配的綜合影響,本文引入了綜合匹配度的概念,其計算方法為
Cij=β1GCij+β2SSij
(3)
式中,β1和β2分別為幾何連通度與名稱匹配度的加權系數(shù)。對于每個路口,路段匹配過程為:
(1) 若該路口路段數(shù)不少于2,若其中綜合匹配度的最大值大于閾值,則將其對應的路段對記錄到路段匹配表中,執(zhí)行步驟(2);若其小于閾值或路段數(shù)少于2,則該路口不存在匹配路段,該路口匹配結束。
(2) 將步驟(1)中記錄到路段匹配表中的路段移除,再次執(zhí)行步驟(1)。
對所有路口進行遍歷后,根據(jù)路段匹配表對路段進行連接,生成多路段道路實體數(shù)據(jù),并將未在路段匹配表中出現(xiàn)的路段單獨提取出來,其即為單路段實體。考慮城市環(huán)線道路可能出現(xiàn)的借道現(xiàn)象,本文采用屬性傳播方法[8]進行處理,對生成的道路實體經(jīng)過的路口進行遍歷,若其中包含另一實體的兩端點且另一實體名稱的實體名項中包含“環(huán)”字,則將兩端點之間路段復制到另一實體上使其閉合,從而達到保證實體完整性的目的。
試驗數(shù)據(jù)為鄭州主城區(qū)部分區(qū)域的道路數(shù)據(jù)(如圖2所示),采用Shapefile數(shù)據(jù)格式,以路段的形式分條進行存儲,包含端點與折點坐標信息及路段的名稱信息,共1541條記錄。
圖2 試驗數(shù)據(jù)
根據(jù)路段的端點坐標對路段進行拓撲關系構建,生成交叉路口數(shù)據(jù),共計886個。以路口為基本單位進行遍歷,分別對每個路口關聯(lián)的路段進行兩兩組合,計算其幾何連通度和名稱匹配度,并進而計算其綜合匹配度。其參數(shù)設置見表1。
表1 算法參數(shù)設置
將綜合匹配度閾值設置為0.5,根據(jù)每個路口路段對的綜合匹配度,對路段對進行實體化匹配,并根據(jù)匹配結果對路段進行連接和其他處理,最終得到226個城市道路實體,其中多路段實體200個、單路段實體26個。為了體現(xiàn)實體化前后道路數(shù)據(jù)組織形式的不同及實體數(shù)據(jù)在面向完整目標的查詢方面的優(yōu)勢,本文分別對實體化前后的道路數(shù)據(jù)進行基于長度的查詢,對長度超過1500 m的道路查詢結果(加粗顯示)如圖3所示。
圖3 超過1500 m的道路查詢結果
由試驗結果可知,采用道路實體數(shù)據(jù)解決“哪些道路長度超過1500 m”的問題時,得到的結果更符合人的認知,體現(xiàn)了地理實體數(shù)據(jù)在針對整體目標查詢上的優(yōu)勢。
為了體現(xiàn)本文提出的算法在城市道路實體化上的優(yōu)勢,本文以人工實體化匹配結果為參照對象,將其與文獻[13]中提出的城市道路Stroke生成算法進行比較。本文將易出現(xiàn)匹配錯誤的路口稱為復雜路口,對于關聯(lián)路段數(shù)量為3或4的路口用路口復雜度(D)來進行衡量,其計算方法為
(4)
式中,N為關聯(lián)路段數(shù);αi為第i組關聯(lián)路段的夾角。判定復雜路口的充分非必要條件包括:
(1) 關聯(lián)路段數(shù)大于4。
滿足以上條件之一的路口即為復雜路口,在試驗數(shù)據(jù)中共計64個。與人工實體化匹配結果進行比對,本文方法與文獻[13]的方法出現(xiàn)匹配的路口數(shù)分別為1和7,即本文提出算法的總體準確率為99.89%。經(jīng)查驗,出現(xiàn)錯誤匹配的路口均為復雜路口。兩種方法關于復雜路口的精度驗證結果見表2,從結果來看,本文方法的正確率明顯高于文獻[13]提出的僅顧及幾何特征的方法。
表2 復雜路口實體化匹配精度驗證
本文根據(jù)城市道路的特點,提出一套基于路段數(shù)據(jù)的實體化構建方法,主要包括路口的提取與拓撲關系的建立、幾何連通度、名稱匹配度與綜合匹配度概念的引入、以路口為單位的路段實體化匹配與連接和借道現(xiàn)象的處理。通過復雜路口的匹配結果,體現(xiàn)了本文提出算法進行實體化的優(yōu)勢。當前,城市化進程加快推進,城市道路也隨之發(fā)生著變化,而反映地理空間變化的時空數(shù)據(jù)模型多采用基于實體的數(shù)據(jù)組織形式。本文研究為城市空間時空數(shù)據(jù)模型的數(shù)據(jù)轉換提供了具體的實踐參考,具有一定的應用價值。