聞 俏 蔡紅玥 逯躍鋒,3*
(1、山東理工大學(xué) 建筑工程學(xué)院工程學(xué)院,山東 淄博255049 2、中國(guó)交通通信信息中心,北京100011 3、中國(guó)科學(xué)院地理科學(xué)與資源研究所 資源與環(huán)境信息系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京100101)
對(duì)現(xiàn)實(shí)世界中地理實(shí)體以空間數(shù)據(jù)對(duì)其進(jìn)行表達(dá)時(shí),由于觀測(cè)尺度、應(yīng)用需求等不同,導(dǎo)致產(chǎn)生不同比例尺的空間數(shù)據(jù)[1],匹配技術(shù)成為數(shù)據(jù)融合的主要途徑,是目前研究的難點(diǎn)[2]。空間數(shù)據(jù)匹配就是通過(guò)分析空間實(shí)體的差異和相似性識(shí)別出不同來(lái)源圖中表達(dá)現(xiàn)實(shí)世界同一地物或地物集(即同名實(shí)體)的過(guò)程[3]。
目前所采用的匹配方法中,采用的特征指標(biāo)主要有長(zhǎng)度、面積、方向、形狀、距離等[4-5],文獻(xiàn)[6]所用方法利用數(shù)據(jù)的語(yǔ)義關(guān)系進(jìn)行識(shí)別和融合。本文基于幾何特征提出基于最小凸包的形狀描述子,結(jié)合方向、長(zhǎng)度、節(jié)點(diǎn)度、Hausdorff 距離等相似度度量指標(biāo)構(gòu)建綜合空間相似度度量模型,將此模型與其他指標(biāo)構(gòu)建的空間相似度模型進(jìn)行比較以驗(yàn)證本文方法的有效性。
圖1 線實(shí)體最小凸包構(gòu)造原理
其中,T1和T2分別是PL1、PL2有序點(diǎn)集構(gòu)建的最小凸包,D1和D2為PL1、PL2的長(zhǎng)度。
將線狀矢量對(duì)象的方位角、長(zhǎng)度、節(jié)點(diǎn)度、Hausdorff 距離與基于最小凸包的形狀描述子等相似度度量以向量組的形式加權(quán)綜合構(gòu)建綜合空間相似度度量模型。各度量指標(biāo)如下:
長(zhǎng)度:一種常用的線實(shí)體線實(shí)體PL1、PL2的長(zhǎng)度之差C2。
方向:線實(shí)體首尾節(jié)點(diǎn)所連直線的方位角。線實(shí)體PL1、PL2的方向之差為C3。
距離:本文采用Hausdorff 距離表示線實(shí)體間的距離,設(shè)有線實(shí)體PL1、PL2距離計(jì)算公式如下:
設(shè)已知兩個(gè)線狀矢量數(shù)據(jù)集分別A 和B,且以A 為參考數(shù)據(jù)集、B 為目標(biāo)數(shù)據(jù)集。根據(jù)綜合相似度模型的具體匹配步驟為:
3.2.1 數(shù)據(jù)預(yù)處理。對(duì)來(lái)自不同尺度下數(shù)據(jù)集統(tǒng)一坐標(biāo)系,使各個(gè)空間對(duì)象之間的關(guān)系一致。
3.2.2 通過(guò)等間距距離插值方法對(duì)線實(shí)體來(lái)均勻增加線實(shí)體特征點(diǎn)數(shù)。
3.2.3 根據(jù)參考數(shù)據(jù)集生成線實(shí)體泰森多邊形確定候選匹配集。
在上述公式中,TP 是正確的匹配對(duì)數(shù)量,F(xiàn)P 是錯(cuò)誤匹配的匹配對(duì)數(shù)量,F(xiàn)N 是漏匹配的匹配對(duì)數(shù)量。
本文實(shí)驗(yàn)數(shù)據(jù)采用某縣級(jí)市的1:50 000 和1:250 000 的不同比例尺的數(shù)據(jù)集。通過(guò)對(duì)已匹配實(shí)體進(jìn)行隨機(jī)取樣,獲得正例樣本,計(jì)算各樣本差異度和綜合相似度,得到各指標(biāo)的權(quán)值和綜合相似度閾值0.75,表1 為各指標(biāo)的權(quán)重值。根據(jù)3.2 節(jié)中數(shù)據(jù)處理、匹配步驟以及5 個(gè)描述子提取計(jì)算,對(duì)兩數(shù)據(jù)集進(jìn)行匹配試驗(yàn)。
表1 指標(biāo)的權(quán)重
本文將1:250 000 道路數(shù)據(jù)作為參考數(shù)據(jù)集,將1:50 000道路數(shù)據(jù)作為目標(biāo)數(shù)據(jù)集(待匹配數(shù)據(jù)集)。通過(guò)生成路段泰森多邊形構(gòu)建參考路段道路匹配單元,與待匹配數(shù)據(jù)集進(jìn)行空間相交,得到匹配候選集,最后遍歷匹配單元與匹配候選集中路段完成相似度評(píng)價(jià)。
圖2 算法匹配精度
表2 為添加本文所提描述子前后的對(duì)比結(jié)果,從中可以看出,本文方法相比僅采用其余4 種描述子的匹配方法,減少了誤匹配和漏匹配,且正確匹配對(duì)數(shù)由36 增加到40。由圖2 可知,通過(guò)在匹配過(guò)程中增加基于最小凸包的形狀描述子,查準(zhǔn)率和查全率分別提高2.5%、6.5%,相應(yīng)的,F(xiàn)-score 值從87.6%提高到了92.3%,該匹配精度結(jié)果說(shuō)明了增加本文所提出的形狀描述子的算法正確率更高,有效提高了多尺度線實(shí)體匹配精度。
通過(guò)對(duì)某縣級(jí)市道路矢量數(shù)據(jù)集進(jìn)行匹配試驗(yàn),經(jīng)添加基于最小凸包的形狀描述子,與長(zhǎng)度、方向、節(jié)點(diǎn)度、Hausdorff 距離所構(gòu)建的基于5 種指標(biāo)的綜合相似度模型,能夠增加描述矢量數(shù)據(jù)實(shí)體的形狀細(xì)節(jié)特征,提高了實(shí)體匹配相似度,減少漏匹配與誤匹配,相較于4 種指標(biāo)的匹配算法F-score 值提高了4.7%。表明本文所提綜合相似度模型能夠在不同尺度、不同時(shí)相下的數(shù)據(jù)集中有效,并且具有較高的匹配質(zhì)量和準(zhǔn)確率。