丁宇虹
(山西省交通科學(xué)研究院,山西 太原 030006)
隨著我國城市建設(shè)速度的加快,道路新建、改建、擴(kuò)建等情況時(shí)有發(fā)生,現(xiàn)在電子地圖更新的速度遠(yuǎn)遠(yuǎn)滿足不了用戶需求。如何使變化及時(shí)準(zhǔn)確地反映到電子地圖數(shù)據(jù)中,成為制約電子地圖發(fā)展應(yīng)用的一個(gè)難題[1]。
傳統(tǒng)的地圖數(shù)據(jù)更新方法數(shù)據(jù)重復(fù)加載,效率低。地圖測(cè)繪工作的重心已經(jīng)從數(shù)據(jù)生產(chǎn)轉(zhuǎn)變?yōu)閿?shù)據(jù)更新,如何利用已有的工作成果和數(shù)據(jù)快速準(zhǔn)確地更新電子地圖,減少地圖更新中的重復(fù)勞動(dòng),提高地圖數(shù)據(jù)更新的效率,是目前研究的一個(gè)重要方向。不同時(shí)刻道路數(shù)據(jù)更新主要是提取增量信息,提取方法會(huì)直接影響道路網(wǎng)數(shù)據(jù)更新的準(zhǔn)確率和效率。本文采用基于目標(biāo)匹配的方法結(jié)合語義匹配來識(shí)別和提取同比例尺道路網(wǎng)數(shù)據(jù)的增量信息。
本文的增量信息是同一區(qū)域范圍內(nèi)的同比例尺不同時(shí)刻道路網(wǎng)的變化信息,其識(shí)別和提取其實(shí)是一個(gè)目標(biāo)匹配的過程。語義匹配主要是通過道路屬性信息來判斷匹配,完成匹配的道路不用再進(jìn)行目標(biāo)匹配。目標(biāo)匹配是通過緩沖區(qū)面積迭置率和最大類間方差法實(shí)現(xiàn),這里的重點(diǎn)是面積迭置率閾值的確定。通過語義匹配和目標(biāo)匹配二者結(jié)合實(shí)現(xiàn)導(dǎo)航道路網(wǎng)增量信息識(shí)別和提取。
由于數(shù)據(jù)屬性信息并不完全一致,語義匹配只能完成一部分道路的匹配,還有很大一部分道路還需要進(jìn)行增量信息提取。對(duì)于這部分?jǐn)?shù)據(jù)通過面積迭置率和最大類間方差法相結(jié)合來處理。此處面積迭置率定義為2個(gè)道路緩沖區(qū)的相互重疊部分的面積占各自總面積的比值[2],是通過對(duì)2條道路線要素根據(jù)試驗(yàn)情況建立一定寬度的緩沖區(qū),對(duì)兩者的緩沖區(qū)進(jìn)行計(jì)算。
首先定義面積迭置率指標(biāo)。假設(shè)Ai和Bi是2個(gè)待匹配線實(shí)體的面狀緩沖區(qū),Sim(Ai,Bi)和Sim(Bi,Ai)是各自的面積迭置率。則:
Sim(Ai,Bi)和Sim(Bi,Ai)中必須至少有一個(gè)大于某個(gè)閾值(0.3),才說明兩者有匹配的可能;且當(dāng)Sim(Ai,Bi)接近于1的時(shí)候,說明Ai是整體和Bi匹配的;對(duì)于Bi也是這樣;當(dāng)Sim(Ai,Bi)和Sim(Bi,Ai)都同時(shí)接近1的時(shí)候,說明Ai和Bi是1∶1匹配的。
圖像分割就是指把圖像分成具有特殊含義的區(qū)域,并提取出感興趣的目標(biāo)的過程,本文采取的方法是基于閾值計(jì)算的圖像分割方法。閾值計(jì)算方法本文采用最大類間方差閾值法,是由Ostu提出的。Ostu法的圖像模型是:把圖像分為目標(biāo)和背景兩類,處于目標(biāo)和背景交接處兩邊的像素灰度值有較大的差別,它的灰度直方圖可以看成是由對(duì)應(yīng)目標(biāo)和背景的2個(gè)單峰的直方圖混合構(gòu)成。如果這2個(gè)分布大小相隔很近且均值相距足夠遠(yuǎn),而且2個(gè)部分的均方差也足夠小,則直方圖表現(xiàn)為較明顯的雙峰,如圖1,這類圖像適用最大類間閾值法[3]。用類間方差閾值法來進(jìn)行圖像分割可以使圖像錯(cuò)分概率最小。Ostu法的不足是當(dāng)目標(biāo)與背景灰度差不明顯時(shí),分割得到的圖像誤差較大,甚至?xí)G失整幅圖像的信息[4]。利用最大類間方差法,使2個(gè)數(shù)據(jù)集的差異達(dá)到最大的值便是最佳閾值。
圖1 迭置率灰度直方圖(適用Ostu方法)
為了驗(yàn)證上述的方法是否可行,采用ESRI公司的ArcGIS Engine SDK和Visual Studio.NET 2008開發(fā)工具進(jìn)行驗(yàn)證。本文研究的數(shù)據(jù)源為北京房山區(qū)2007和2010年的1∶10 000道路矢量數(shù)據(jù)。將2010年和2007年道路矢量數(shù)據(jù)進(jìn)行疊加分析后得到這2年道路數(shù)據(jù)的交集數(shù)據(jù)表,在進(jìn)行目標(biāo)識(shí)別和提取前可以根據(jù)計(jì)算的閾值把小于閾值的從交集數(shù)據(jù)表中刪除。
下面用面積迭置率的方法對(duì)本文的數(shù)據(jù)進(jìn)行分析。在進(jìn)行匹配前,先要對(duì)2年的數(shù)據(jù)建立緩沖區(qū),緩沖區(qū)的大小與比例尺有關(guān)。通常選為對(duì)應(yīng)比例尺最小許可間隔距離的2倍[5]。因此此處設(shè)定的緩沖區(qū)寬度為D=10 000×0.2 mm×2=4 m。
在ARCGIS9.3中生成緩沖區(qū)的疊加分析圖層,在新圖層的屬性表中會(huì)自動(dòng)生成兩列數(shù)據(jù),記錄每個(gè)要素對(duì)應(yīng)的2007年和2010年道路要素ID,如表1。其中第一列為系統(tǒng)ID,第二、三列為2007、2010道路要素ID,第四列“Have07”代表相交面積Area(07∩10)/Area(07),第五列“Have10”代表相交面積Area(07∩10)/Area(10)。對(duì)這些數(shù)據(jù)根據(jù)面積迭置的計(jì)算方法進(jìn)行處理,分別得到2007的迭置率集合和2010年的迭置集合:
表1 道路網(wǎng)緩沖區(qū)疊加分析屬性數(shù)據(jù)
對(duì)2個(gè)集合分別按大小排序后生成它們相關(guān)的折線圖如圖3所示。
圖2 迭置率統(tǒng)計(jì)圖
圖2中縱坐標(biāo)代表面積迭置率,橫坐標(biāo)代表重新排序后的自動(dòng)生成的序號(hào)。從圖2中可以看出這2年的面積迭置率基本重合,2個(gè)的面積迭置率介于0~0.9之間,其中在折線拐點(diǎn)左側(cè)0~0.2之間的元素占了很大的比例,但并不能確定閾值的大小。為了進(jìn)一步找出數(shù)據(jù)的分布規(guī)律,在Matlab中做出數(shù)據(jù)的灰度直方圖,如圖3所示。
圖3 迭置率灰度直方圖
圖3中橫坐標(biāo)表示面積迭置率,縱坐標(biāo)表示面積迭置率的某個(gè)值的要素個(gè)數(shù),可以看出數(shù)據(jù)呈明顯的雙峰分布,在25處出現(xiàn)了一個(gè)較明顯的峰谷。為了分析數(shù)據(jù)這種分布的原因,把值域分為(0~5)、(5~30)、(30~100)3 組來進(jìn)行抽樣分析,每個(gè)樣本個(gè)數(shù)為30。發(fā)現(xiàn)值域?yàn)椋?~5)的要素主要是多條相交線段結(jié)點(diǎn)緩沖區(qū)重合引起的疊加分析誤差導(dǎo)致,值域在(5~30)的要素主要是由于地圖數(shù)據(jù)誤差造成。值域30以上的要素是2條線要素存在匹配關(guān)系形成的。由此可知整個(gè)數(shù)據(jù)集大致有兩類:一類為非匹配關(guān)系產(chǎn)生的冗余非匹配數(shù)據(jù),另一類是由匹配關(guān)系產(chǎn)生的有效匹配數(shù)據(jù)。接下來用最大類間方差法來計(jì)算圖像的最佳閾值,把圖像進(jìn)行分割。
用最大類間方差法得到2007年匹配閾值是29,2010年的是30,2個(gè)值非常接近。如果選擇30為最佳匹配閾值,刪除的數(shù)據(jù)要比閾值是29時(shí)要多,為了避免個(gè)別匹配的數(shù)據(jù)被刪除,這里選取29為最佳匹配閾值,即2條道路的面積迭置率達(dá)到29%,認(rèn)為這2條道路是匹配的。
為了確定29是最佳的匹配閾值,本文選取了不同閾值統(tǒng)計(jì)了不同閾值的匹配準(zhǔn)確率,如表2所示。不同閾值抽樣統(tǒng)計(jì)的道路個(gè)數(shù)不同,實(shí)驗(yàn)閾值取10、20、29、40、50,對(duì)應(yīng)的抽樣道路個(gè)數(shù)依次為 155、191、237、207、150。通過人工匹配數(shù)和閾值匹配數(shù)計(jì)算匹配的準(zhǔn)確率,判斷29是否為最佳閾值。從表2可以發(fā)現(xiàn),當(dāng)實(shí)驗(yàn)閾值較小時(shí),閾值匹配的道路個(gè)數(shù)要略比人工匹配的道路個(gè)數(shù)大,這是因?yàn)殚撝递^小時(shí)被選取的道路要相對(duì)多一些;當(dāng)實(shí)驗(yàn)閾值較大時(shí)則反之。閾值大小會(huì)影響匹配的準(zhǔn)確率,發(fā)現(xiàn)閾值取29時(shí),匹配準(zhǔn)確率最高。試驗(yàn)發(fā)現(xiàn)通過面積疊置率和最大類間方差計(jì)算的閾值對(duì)同比例尺電子地圖道路數(shù)據(jù)增量信息進(jìn)行識(shí)別和提取的效果比較好。
表2 不同閾值匹配精度
本文通過對(duì)目標(biāo)匹配提取增量信息,發(fā)現(xiàn)面積疊置率結(jié)合最大類間方差的方法有很好的數(shù)據(jù)針對(duì)性,提取的效果比較好,且算法簡單容易實(shí)現(xiàn)。但該方法在實(shí)際應(yīng)用中還存在不完善的地方有待改進(jìn)。如當(dāng)數(shù)據(jù)沒有明顯差異,在數(shù)據(jù)直方圖上沒有單峰出現(xiàn),計(jì)算得到的匹配閾值匹配效果不能滿足要求,在下一步的工作中對(duì)該方法進(jìn)行改進(jìn),提高該方法的通用性。