李進強,王會珠
(1. 閩江學(xué)院地理科學(xué)系,福建 福州 350108; 2. 清華山維新技術(shù)開發(fā)公司, 北京 100084)
Research on the Spatial Classification Matching Model Based on
Fuzzy Reasoning Rules
LI Jinqiang,WANG Huizhu
?
基于多元模糊推理的空間分類匹配模型研究
李進強1,王會珠2
(1. 閩江學(xué)院地理科學(xué)系,福建 福州 350108; 2. 清華山維新技術(shù)開發(fā)公司, 北京 100084)
Research on the Spatial Classification Matching Model Based on
Fuzzy Reasoning Rules
LI Jinqiang,WANG Huizhu
摘要:空間分類匹配是智能GIS研究領(lǐng)域的熱點問題,具有重要的理論和實踐意義。本文深入分析了現(xiàn)有匹配技術(shù)的不足,提出了基于模糊推理規(guī)則進行空間分類匹配的通用算法框架,并重點解決了指標(biāo)集的“模糊隸屬度”轉(zhuǎn)化問題,對其正確性和實用性在ArcGIS 9.3平臺上進行了驗證。
關(guān)鍵詞:空間分類匹配;模糊推理;GIS
一、引言
空間分類匹配是智能GIS的核心技術(shù)之一, 可廣泛用于空間數(shù)據(jù)庫更新、多源空間數(shù)據(jù)集成、多尺度空間數(shù)據(jù)庫變化信息發(fā)現(xiàn)與同步分發(fā)等方面,受到業(yè)界高度關(guān)注。
1. 空間分類匹配研究現(xiàn)狀
所謂空間分類匹配,是通過分析兩個數(shù)據(jù)集(新舊版本)中空間目標(biāo)的差異與相似性,識別出不同數(shù)據(jù)集中表達現(xiàn)實世界同一地理要素的空間目標(biāo),確定不同時期、不同尺度的同名地物是否發(fā)生變化[1]。
(1) 空間匹配流程分析
1) 確定集候選:在待匹配的兩個數(shù)據(jù)集中,以其中一個作為參考,在另一個數(shù)據(jù)集中作空間查詢,得到待匹配的候選對象集。
2) 計算評價指標(biāo):如幾何相似度(形狀、位置、方向、長度或大小等)、空間關(guān)系相似度、語義相似度等。
3) 多指標(biāo)合成:即綜合語義、幾何、拓?fù)涞榷鄠€匹配指標(biāo)。一種做法是順序使用各種匹配指標(biāo),排除一些不可能目標(biāo),這種策略需要為每一個指標(biāo)確定一個閾值,且匹配結(jié)果可能與匹配順序有關(guān)。另一種做法是對評價指標(biāo)進行綜合計算,得出結(jié)論。顯然,第二種方法更加科學(xué)合理。
(2) 研究現(xiàn)狀分析
① 評價指標(biāo)研究現(xiàn)狀
形狀相似度計算是幾何評價指標(biāo)計算中的難點,目前已有許多研究成果,如Hausdorff距離、Fourier描述子[2]、夾角鏈碼法[3]、正切空間(轉(zhuǎn)向角函數(shù)法)[4]、最大基因組比對法等,位置和方位指標(biāo)可通過計算圖形的二階不變矩[5]或進行趨勢分析得到,這些方法側(cè)重點各不相同。
在空間關(guān)系計算方面,Egenhofer等提出的九交模型來描述實體與實體之間的拓?fù)潢P(guān)系[6]。丁虹在Egenhofer和AI-Taha基礎(chǔ)上建立了面的8種拓?fù)潢P(guān)系的差異矩陣[7],確定拓?fù)潢P(guān)系的強弱程度。張橋平等在Winter形態(tài)距離(morphological distance)概念上,提出了針對不同數(shù)據(jù)源的面目標(biāo)(集)模糊拓?fù)潢P(guān)系[8]。
由于語義匹配在很大程度上依賴于屬性數(shù)據(jù)結(jié)構(gòu)及屬性信息的完整性,往往缺少唯一標(biāo)識的屬性數(shù)據(jù)[1],或由于說明文件的缺失等導(dǎo)致語義理解困難,語義相似度計算失去實用性。
② 多指標(biāo)合成研究現(xiàn)狀
Walter & Fritsch 提出基于概率統(tǒng)計的匹配方法,通過區(qū)域統(tǒng)計確定匹配閾值,最后利用信息論的優(yōu)勢函數(shù)確定匹配結(jié)果。童小華等為克服Walter & Fritsch法計算效率低下的缺點,提出基于理論概率的多指標(biāo)融合匹配算法[9],其主要優(yōu)點是受閾值的影響較小。
熊天星將模糊綜合評判引入面實體匹配[10],綜合面質(zhì)心幾何距離法、面實體之間模糊拓?fù)潢P(guān)系、轉(zhuǎn)向角函數(shù)法3種方法。
③ 非一對一匹配模式
趙彬彬等對不同類型(點、線、面)、不同尺度(較大、較小比例尺)空間目標(biāo)之間的多種匹配模式進行了討論,并用信息傳輸模型對1:N、N:1、M:N進行目標(biāo)相似度計算[11]。
2. 現(xiàn)有研究的不足
從上述分析可以看出,除語義相似度及非一對一匹配模式研究程度不足外,多指標(biāo)融合模型存在如下問題:
1) 指標(biāo)體系缺乏系統(tǒng)性,即指標(biāo)不夠全面,或沒有從空間匹配的不同角度進行系統(tǒng)考慮。
2) 合成模型理論依據(jù)不足,如基于概率的匹配方法,其匹配程度是否符合概率分布,概率值如何計算等。
3) 單一指標(biāo)可信度和合成權(quán)重對匹配結(jié)果影響很大,但已有研究大多沒有合理的交代。
二、多元模糊推理模型
由于使用不同精度的采集方法、不同的參考系、不同概念/語義模型,以及現(xiàn)實世界時刻發(fā)生著變化(人工改造或自然變遷),使得兩個數(shù)據(jù)集之間存在著不確定性[8],模糊數(shù)學(xué)為解決這類問題提供了有效工具。
1. 模糊推理規(guī)則
設(shè)模糊集U=(u1,u2,…,un),V=(v1,v2,…,vm),令R為U到V的模糊關(guān)系矩陣,R=(rij)n×m,rij表示ui到vj為真的可信度。A=(a1,a2,…,an),B=(b1,b2,…,bm)分別表示U和V的模糊子集,則稱模糊變換
B=A·R
(1)
由于涉及多個因素,故又稱多元模糊推理。
2. 多元模糊推理匹配模型
(1) 指標(biāo)集
指標(biāo)體系的好壞可從如下3個方面考量:
1) 指標(biāo)的選取要有系統(tǒng)性,即指標(biāo)集能夠從多個角度較全面地反映空間對象的異同。
2) 指標(biāo)與匹配結(jié)果嚴(yán)格相關(guān),即指標(biāo)越好越能得到肯定的匹配結(jié)果。
3) 指標(biāo)內(nèi)涵不交叉重復(fù)。
重疊度作為預(yù)匹配是一個比較好的指標(biāo),但其中包含形狀、距離、大小、拓?fù)潢P(guān)系等指標(biāo)概念交叉。另外,形狀越相似,大小越接近,因此不宜同時選用形狀相似度和大小相似度。
本文建議采用的指標(biāo)集見表1。
表1 模糊關(guān)系矩陣
(2) 評判集
理論上評判集可包含任意多個元素,但元素太多,易造成模糊關(guān)系矩陣太復(fù)雜,因此在能夠滿足要求的前提下,評判集元素應(yīng)盡可能少,本文取V={A,B,C},包含3個元素,含義分別是:A表示“匹配”;B表示“不匹配”;C表示“未知”。
(3) 模糊關(guān)系矩陣
模糊關(guān)系矩陣R 可表示為表1,其中rij表示由U到V為真的隸屬度。
三、空間模糊度轉(zhuǎn)化計算
確定模糊關(guān)系矩陣(隸屬度)是進行模糊推理的關(guān)鍵,下面介紹將指標(biāo)值轉(zhuǎn)化為模糊隸屬度的方法。
1. 形狀相似隸屬度轉(zhuǎn)化
形狀相似度計算一般符合如下規(guī)則:
1) 具有平移、旋轉(zhuǎn)不變性,即形狀相似度不受平移旋轉(zhuǎn)的影響,縮放因子則可以忽略。
2) 兩個要素的形狀相似度必須與其匹配程度成嚴(yán)格單調(diào)性,即越相似的匹配度越高,越不相似的匹配度越低。
3) 取值在0~1,越接近0越不相似,越接近1越相似,0.5屬于最模糊狀態(tài)。
設(shè)形狀相似度為x,評判 A、B、C相應(yīng)的隸屬函數(shù)分別為μA(x)、μB(x)、μC(x)。因為B是A的補集,因此μB(x)=1-μA(x);C是表達A/B之間最模糊地帶,如果A隸屬函數(shù)與參數(shù)x呈線性關(guān)系, μC(x)可表示為μA(x)的三角型隸屬關(guān)系(如圖1所示), 即有
(2)
圖1
2. 空間距離隸屬度轉(zhuǎn)化
距離指標(biāo)可使用空間目標(biāo)重心之間的歐氏距離,或通過平移旋轉(zhuǎn)將兩個空間目標(biāo)相互對齊,獲得平移量,假設(shè)δ為空間距離s的標(biāo)準(zhǔn)差(δ可根據(jù)采集精度、成圖比例尺等因素確定),本文采用正態(tài)隸屬度函數(shù)模型
s∈[0, 2δ]表示明顯支持隸屬于同名地物的區(qū)域;s∈[3δ,∞]表示明顯不支持隸屬于同名地物的區(qū)域;s∈[2δ, 3δ]是過渡區(qū)域, s=2.5δ是最模糊狀態(tài),隸屬度≈0.5。
μC(s)中心位置μ=2.5δ,參數(shù)k盡量接近μA對應(yīng)的三角型隸屬關(guān)系。
綜合考慮后,得隸屬函數(shù)如下
(3)
3. 相對方位隸屬度轉(zhuǎn)化
公認(rèn)的8個方位分別為:東、南、西、北、東南、西
北、西南、東北,如圖2所示。
圖2
假設(shè)T1、T2分別表示待匹配空間目標(biāo)的方向角,相對方位角可用T=A2-A1進行計算,取值范圍為[-90°,90°]。
1) |T|=0°,方位隸屬度應(yīng)等于1。
2) |T|≥45°,因為“東”在[-45°,45°]之間,方位隸屬度應(yīng)等于0。
3) |T|= 22.5°是最模糊的狀態(tài),方位隸屬度=0.5。
以下三角函數(shù)表示的方位隸屬度函數(shù)恰好滿足上述要求
(4)
4. 拓?fù)潢P(guān)系隸屬度轉(zhuǎn)化
丁虹在Egenhofer和AI-Taha基礎(chǔ)上建立了8種拓?fù)潢P(guān)系的差異矩陣確定拓?fù)潢P(guān)系的強弱程度,差異矩陣從相離(無關(guān))到相等共分為9個等級(0-8),實質(zhì)上反映了空間目標(biāo)是否匹配的可信度。
本文采用模糊層次分析法,將差異矩陣轉(zhuǎn)化為相應(yīng)的隸屬度:
1) 將差異矩陣改造成1—9度重要性正反矩陣,方法是將差異矩陣上三角元素全部+1,使得自身對自身的重要度比為1∶1,然后改寫為比例形式,下三角部分取反(見表2)。
表2 重要性正反矩陣
根據(jù)文獻[8]研究,包含與被包含,往往意味著兩空間目標(biāo)是非同名實體,可能是變更引起的,如房屋拆遷后在原位置重蓋。而覆蓋和被覆蓋,往往說明兩空間目標(biāo)是同名實體,因此,“包含”與“被包含”兩列數(shù)據(jù)沒有+1。
2) 按公式 0.5+log81rij將表2轉(zhuǎn)換為模糊互補矩陣。
3) 利用式(5)求取權(quán)重向量wi(j=1,2,…,n)
(5)
4) 求隸屬度,即μA(j)=wi/max(wi),同樣求μB(j)、 μC(j)。結(jié)果見表3。
表3 拓?fù)潢P(guān)系權(quán)值向量與隸屬度表
5. 語義相似度隸屬度轉(zhuǎn)化
文本型字段相似度采用基于分詞的中文文本相似度計算法,數(shù)值型字段相似度采用差異距離法,最后將所有字段相似度進行綜合求得整體相似度,相應(yīng)的隸屬度函數(shù)和前文基本相同。
6. 指標(biāo)權(quán)重的確定
權(quán)重向量與應(yīng)用類型相關(guān),本文針對1∶500空間數(shù)據(jù)更新,對10位專家進行問卷調(diào)查,按“0.5—1.0”標(biāo)度法統(tǒng)計得出各指標(biāo)重要性系數(shù),然后采用模糊層次分析法求取權(quán)重向量,結(jié)果見表4。
表4 指標(biāo)重要系數(shù)表
7. 計算舉例
有新舊數(shù)據(jù)集目標(biāo)對,評價指標(biāo)為:u1=0.850, u2=0.624 m(δ=0.2 m 計算),u3=12°,u4=“相交”,u5=0.777,得到模糊關(guān)系矩陣
為保留所有信息不被遺漏,采用加權(quán)算子進行矩陣合成運算
B=W·R=[0.6540.3470.471]
根據(jù)最大隸屬度原則,可判定待匹配目標(biāo)屬于同名對象。
四、實例驗證
為驗證匹配模型的正確性,筆者利用ArcGIS Engine 9.3+Visual C#,開發(fā)匹配程序模塊,然后掛接到福州市空間資源數(shù)據(jù)庫同步系統(tǒng)上進行驗證。
1. 試驗環(huán)境
同步系統(tǒng)可按指定時間將生產(chǎn)庫中的變化信息同步到應(yīng)用庫。本次試驗的生產(chǎn)庫為1∶500空間數(shù)據(jù)庫,該系統(tǒng)對1∶500數(shù)據(jù)進行不間斷的修測。應(yīng)用庫采用Oracle 9i+ArcSDE 9.3臨時搭建,入庫數(shù)據(jù)是福州大學(xué)城周邊地區(qū),面積約20 km2。
同步系統(tǒng)啟動后,先提取1∶500生產(chǎn)庫中更新區(qū)域的數(shù)據(jù),再送交匹配程序與應(yīng)用庫的相同區(qū)域進行匹配,最后根據(jù)匹配結(jié)果對應(yīng)用庫進行更新。以上過程由同步控制器進行控制,每天晚上0點自動執(zhí)行一次。
2. 匹配指標(biāo)計算方法
對于自然變遷數(shù)據(jù)層,形狀相似度采用Fourier描述子計算,距離和方位指標(biāo)采用不變矩法計算;對于人工地物數(shù)據(jù)層, 形狀相似度采用最大基因組比對法進行計算,同時獲得距離和方位指標(biāo)值。拓?fù)潢P(guān)系采用ArcGIS Engine 拓?fù)溥\算接口計算。另外,為簡化計算,語義相似度僅考慮變化字段與不變化字段的數(shù)量比例。
3. 試驗結(jié)果
經(jīng)過分析統(tǒng)計程序連續(xù)運行一個月的匹配記錄,去除不在有效區(qū)域內(nèi)的內(nèi)容(16 d),以及新增地物、消亡地物和未變化的地物,共成功匹配新舊版本同名變化對象:點87個,線230個,面115個,匹配準(zhǔn)確率達到91.5%。試驗結(jié)果表明, 本文提出的匹
配方法針對性強、準(zhǔn)確率高,能有效發(fā)現(xiàn)新舊版本變化信息,可作為空間數(shù)據(jù)更新的關(guān)鍵技術(shù)。
五、結(jié)論與展望
本文采用空間信息科學(xué)與模糊集理論相結(jié)合的分析方法,對空間分類匹配問題進行深入研究,主要結(jié)論如下:
1) 本文基于模糊推理規(guī)則,為空間匹配提供了通用的算法框架。
2) 綜合運用半經(jīng)驗半理論分析法和模糊層次分析法等,解決了各指標(biāo)“隸屬度”轉(zhuǎn)化問題,使計算模型兼?zhèn)淞己玫睦碚撔院蛯嵱眯浴?/p>
3) 基于該算法框架,可實現(xiàn)庫對庫增量變化自動提取,為數(shù)據(jù)更新、變化率統(tǒng)計提供了理論基礎(chǔ)。
本文研究成果在ArcGIS 9.3平臺上進行了驗證,可為同類型空間數(shù)據(jù)庫更新維護、多源數(shù)據(jù)融合等人員借鑒和參考。
參考文獻:
[1]徐楓,鄧敏,趙彬彬,等.空間目標(biāo)匹配方法的應(yīng)用分析[J].地球信息科學(xué)學(xué)報,2009, 11(5):657-663.
[2]王濤,劉文印.傅立葉描述子識別物體的形狀[J].計算機研究與發(fā)展, 2002, 13(12):1715-1718.
[3]趙宇,陳雁秋.曲線描述的一種方法:夾角鏈碼[J].軟件學(xué)報, 2004, 15(2):300-307.
[4]付忠良,邵世雄,童春芽.基于正切空間的多尺度面實體形狀匹配[J].計算機工程, 2010, 36(17):216-217.
[5]曹明.不變矩在矢量圖形識別中的應(yīng)用[D].大連:大連理工大學(xué),2008:14-16.
[6]EGENHOFER M,AI-TAHA K.Reasoning about Gradual Change of Topological Relationship[J].Lecture Note in Computer Science,1992(639):196-219.
[7]丁虹.空間相似性理論與計算模型的研究[D].武漢:武漢大學(xué),2004:13-34.
[8]張橋平,李德仁,龔健雅.城市地圖數(shù)據(jù)庫面實體匹配技術(shù)[J].遙感學(xué)報, 2004, 8(2):107-112.
[9]童小華,鄧愫愫,史文中.基于概率的地圖實體匹配方法[J].測繪學(xué)報, 2007, 36(2):210-217.
[10]熊天星.模糊綜合評判在面實體匹配中的應(yīng)用研究[J].長江大學(xué)學(xué)報, 2013, 10(25):23-27.
[11]趙彬彬.多尺度矢量地圖空間目標(biāo)匹配方法及其應(yīng)用研究[D].長沙:中南大學(xué),2011:70-77.引文格式: 張弓同,李四海,焦紅波,等. LiDAR點云生成DEM的水面置平方法研究與實現(xiàn)[J].測繪通報,2015(6):61-64.DOI:10.13474/j.cnki.11-2246.2015.0179
引文格式:李進強,王會珠. 基于多元模糊推理的空間分類匹配模型研究[J].測繪通報,2015(6):49-52.DOI:10.13474/j.cnki.11-2246.2015.0176
作者簡介:李進強(1962—),男,碩士,教授,主要從事地理空間數(shù)據(jù)庫開發(fā)與應(yīng)用等方面的教學(xué)與研究。E-mail:1361639771@qq.com
基金項目:福建省測繪地理信息局2013年科技計劃項目(2013M15)
收稿日期:2014-08-27
中圖分類號:P208
文獻標(biāo)識碼:B
文章編號:0494-0911(2015)06-0049-04