褚喆 毛川
摘要:隨著測(cè)繪技術(shù)的發(fā)展,地理空間數(shù)據(jù)的分辨率和精度越來(lái)越高,數(shù)據(jù)的覆蓋范圍和數(shù)據(jù)量也越來(lái)越大,全國(guó)范圍內(nèi)各種類型、各種用途的地理空間數(shù)據(jù)已達(dá)到海量規(guī)模,對(duì)空間數(shù)據(jù)進(jìn)行高效率和高可靠性的數(shù)據(jù)更新的需求越來(lái)越迫切,在數(shù)據(jù)更新或數(shù)據(jù)融合過(guò)程中通常需要判斷圖斑之間的相似性。另外,在變更調(diào)查信息套合、違法用地分析等國(guó)土業(yè)務(wù)中,也需要判斷圖斑之間的相似性從而判斷地塊是否變化、審批是否合法等。目前已有的圖斑相似性度量方法存在人為干預(yù)多、準(zhǔn)確率低、效率慢等問(wèn)題,無(wú)法滿足相關(guān)業(yè)務(wù)管理部門對(duì)海量矢量圖斑相似性比對(duì)的需求,因此研究如何快速準(zhǔn)確有效地計(jì)算海量矢量圖斑數(shù)據(jù)之間的相似性程度具有重要意義。該文以海量矢量圖斑的相似性快速準(zhǔn)確度量為出發(fā)點(diǎn),提出基于一種混合索引模型的候選匹配集快速獲取方法和一種基于CDB直方圖的矢量圖斑相似性快速準(zhǔn)確度量方法,具有一定的創(chuàng)新性。
關(guān)鍵詞:地理空間數(shù)據(jù)?測(cè)繪技術(shù)?制圖方法?應(yīng)用研究
中圖分類號(hào):P228.4?????文獻(xiàn)標(biāo)識(shí)碼:A
Research?on?the?Application?of?GIS?in?Land?Survey
CHU?Zhe??MAO?Chuan
(Henan?College?of?Surveying?and?Mapping,?Zhengzhou,?Henan?Province,?450015?China)
Abstract:?With?the?development?of?surveying?and?mapping?technology,?the?resolution?and?accuracy?of?geo-spatial?data?are?getting?higher?and?higher,?and?the?coverage?and?volume?of?data?are?getting?larger?and?larger.?Geo-spatial?data?of?various?types?and?purposes?nationwide?have?reached?a?massive?scale,?and?the?demand?for?efficient?and?reliable?data?update?of?spatial?data?is?becoming?more?and?more?urgent.?It?is?usually?necessary?to?judge?the?similarity?between?patches?in?the?process?of?data?update?or?data?fusion,?and?in?addition,?in?the?land?business?such?as?the?registration?of?change?survey?information?and?analysis?of?illegal?land,?it?is?also?necessary?to?judge?the?similarity?between?patches?to?determine?whether?the?land?plot?has?changed?and?whether?the?approval?is?legal.?At?present,?the?existing?methods?for?measuring?the?similarity?of?patches?have?many?problems?such?as?human?intervention,?low?accuracy?rate?and?slow?efficiency,?which?cannot?meet?the?needs?of?relevant?business?management?departments?for?the?comparison?of?the?similarity?of?massive?vector?patches,?so?it?is?of?great?significance?to?study?how?to?calculate?quickly,?accurately?and?effectively?the?similarity?degree?of?massive?vector?patch?date.?This?paper?takes?the?rapid?and?accurate?measurement?of?the?similarity?of?massive?vector?patches?as?the?starting?point,?and?proposes?a?method?for?the?rapid?acquisition?of?candidate?matching?sets?based?on?a?hybrid?index?model?and?a?method?for?the?rapid?and?accurate?measurement?of?the?similarity?of?vector?patches?based?on?the?CDB?histogram,?which?are?innovative.
Key?Words:?Geo-spatial?data;?Surveying?and?mapping?technology;?Mapping?method;?Application?research
在第一次、第二次、第三次全國(guó)土地調(diào)查等國(guó)土調(diào)查任務(wù)中,由于測(cè)繪技術(shù)的發(fā)展和進(jìn)步、遙感影像分辨率和質(zhì)量的提高,使基礎(chǔ)地理數(shù)據(jù)的精度越來(lái)越高,數(shù)據(jù)尺度和覆蓋范圍的不斷加大,數(shù)據(jù)量也越來(lái)越大。如何正確識(shí)別不一致圖斑,判斷圖斑之間的相似性,正確處理不一致圖斑的幾何、屬性等信息數(shù)據(jù),對(duì)保證融合數(shù)據(jù)的質(zhì)量和精度具有重要作用。在土地利用變更調(diào)查中,新增建設(shè)用地、新增耕地信息套合、耕地占補(bǔ)平衡考核以及違法用地分析等專項(xiàng)業(yè)務(wù)數(shù)據(jù)處理工作中都需要判斷矢量圖斑之間的相似性,對(duì)不同數(shù)據(jù)集中同一位置的圖斑進(jìn)行一致性檢查,及時(shí)發(fā)現(xiàn)不一致圖斑,為土地利用變更、違法用地分析等分析判斷提供技術(shù)支持。以二調(diào)數(shù)據(jù)庫(kù)為例,全國(guó)范圍內(nèi)一般地區(qū)縣市的土地利用現(xiàn)狀圖斑個(gè)數(shù)可以達(dá)到幾萬(wàn)個(gè),部分地區(qū)達(dá)到幾十萬(wàn)個(gè),全國(guó)范圍內(nèi)兩千多縣市的土地利用現(xiàn)狀圖斑總數(shù)量級(jí)約為108,更有海量的其他類型和用途的矢量圖斑數(shù)據(jù)。因此,如何快速、準(zhǔn)確、有效地計(jì)算海量矢量圖斑數(shù)據(jù)之間的相似性程度具有重要意義。
1基于混合索引的候選匹配集快速獲取方法
1.1混合索引模型設(shè)計(jì)
常用空間數(shù)據(jù)索引中,格網(wǎng)索引算法相對(duì)簡(jiǎn)單且擴(kuò)展性好,但實(shí)際應(yīng)用時(shí)不好控制格網(wǎng)大小,格網(wǎng)過(guò)大可能導(dǎo)致落入某一網(wǎng)格內(nèi)的空間數(shù)據(jù)過(guò)多,格網(wǎng)過(guò)小會(huì)導(dǎo)致索引表過(guò)大,降低檢索效率;四叉樹(shù)索引可以保證格網(wǎng)內(nèi)的數(shù)據(jù)不超過(guò)指定的范圍,但樹(shù)深度隨空間數(shù)據(jù)量增大而增大,從而影響數(shù)據(jù)檢索效率,且當(dāng)數(shù)據(jù)新增、刪除、更新時(shí)需要調(diào)整相關(guān)節(jié)點(diǎn)索引,靈活性較差;R樹(shù)索引的樹(shù)結(jié)構(gòu)深度平衡,但由于有節(jié)點(diǎn)重疊而導(dǎo)致多路徑查詢,影響查詢效率,R+樹(shù)雖然避免了節(jié)點(diǎn)間的重疊,但數(shù)據(jù)動(dòng)態(tài)變化時(shí)的索引性能略低。綜上所述,應(yīng)用目前常用的空間索引對(duì)海量空間數(shù)據(jù)檢索的效率有待進(jìn)一步提高。該節(jié)綜合不同空間索引的優(yōu)勢(shì),提出一種結(jié)合行政區(qū)索引、粗分格網(wǎng)索引以及R樹(shù)索引的混合索引模型,以提高海量基礎(chǔ)地理信息數(shù)據(jù)的檢索效率。利用粗分格網(wǎng)索引快速定位圖斑所在區(qū)域,縮小圖斑檢索范圍,同時(shí)避免因格網(wǎng)太小導(dǎo)致索引空間過(guò)大的問(wèn)題;對(duì)每一個(gè)格網(wǎng)內(nèi)的圖斑建立R樹(shù)索引降低單個(gè)R樹(shù)的深度、提高檢索性能,快速查詢空間對(duì)象;利用數(shù)據(jù)所屬行政區(qū)字段索引進(jìn)一步縮小圖斑檢索范圍,提高檢索效率。首先對(duì)圖斑數(shù)據(jù)集屬性中所屬行政區(qū)字段建立行政區(qū)索引,其次采用較大間隔在數(shù)據(jù)集四至范圍內(nèi)建立粗分格網(wǎng),將粗分格網(wǎng)與數(shù)據(jù)集的相交結(jié)果存儲(chǔ)為粗分格網(wǎng)索引,最后對(duì)完全落入同一個(gè)粗分格網(wǎng)內(nèi)的圖斑建立單獨(dú)的R樹(shù)索引,以減少單樹(shù)的節(jié)點(diǎn)數(shù)量[1]。具體如圖1所示。
1.2?基于混合索引模型的數(shù)據(jù)檢索方法
基于以上行政區(qū)索引、粗分格網(wǎng)索引和?R?樹(shù)索引的混合索引模型,對(duì)兩矢量圖斑數(shù)據(jù)集進(jìn)行相交查詢,快速獲取候選匹配集,獲取流程如圖2所示。
假設(shè)t為待比較數(shù)據(jù)集T中的一個(gè)圖斑,S為基礎(chǔ)數(shù)據(jù)集。圖斑t與S中圖斑的相似性計(jì)算步驟如下:首先,由粗分?格網(wǎng)索引的劃分方法計(jì)算圖斑t的MBR所在的格網(wǎng)集合G,即分別計(jì)算圖斑t的MBR的左上角和右下角兩個(gè)頂點(diǎn)所在的格?網(wǎng)編號(hào)X1Y1以及X2Y2,則格網(wǎng)集合G={NM|X1≤N≤X2,Y1≤M≤Y2},如左上角頂點(diǎn)所在格網(wǎng)編號(hào)為00右下角所在格網(wǎng)?編號(hào)為21,在格網(wǎng)集合G={00,01,10,11,20,21}。然后,遍歷格網(wǎng)集合G,若格網(wǎng)中存在無(wú)R樹(shù)根節(jié)點(diǎn)的圖斑,?即跨格網(wǎng)的圖斑,則依據(jù)行政區(qū)索引判斷圖斑t是否與該圖斑所屬行政區(qū)一致,若一致則進(jìn)行MBR及精確相交判斷,將相交圖斑納入候選匹配集H,若不一致則判斷下一個(gè)無(wú)R樹(shù)根節(jié)點(diǎn)的圖斑;最后,從每一個(gè)格網(wǎng)指向的R樹(shù)根節(jié)點(diǎn)開(kāi)始,判斷節(jié)點(diǎn)的MBR與圖斑t的MBR之間的空間關(guān)系,若相交且該節(jié)點(diǎn)不是葉子節(jié)點(diǎn),則依次向子節(jié)點(diǎn)逐級(jí)判斷;若節(jié)點(diǎn)是葉子節(jié)點(diǎn),將其匹配行政區(qū)索引,所屬行政區(qū)相同則進(jìn)行精確相交判斷,相交則納入候選匹配集H;所屬行政區(qū)不同或不相交,則進(jìn)行兄弟節(jié)點(diǎn)的判斷;直到遍歷集合G結(jié)束,最終得到候選匹配集H。
1.3?候選匹配集快速獲取實(shí)驗(yàn)
在GIS中,空間數(shù)據(jù)庫(kù)是管理各種空間數(shù)據(jù)的關(guān)鍵技術(shù)支撐,包括數(shù)據(jù)存儲(chǔ)和檢索等。目前,Oracle、SQLServer、PostgreSQL等常用數(shù)據(jù)庫(kù)都可以支持空間數(shù)據(jù)存儲(chǔ)。其中PostgreSQL是一款開(kāi)源對(duì)象關(guān)系型數(shù)據(jù)庫(kù),由于其開(kāi)源免費(fèi)、源碼規(guī)范清晰、功能強(qiáng)大、跨平臺(tái)等特點(diǎn)而應(yīng)用廣泛,PostGIS是對(duì)PostgreSQL數(shù)據(jù)庫(kù)的空間拓展插件,提供各種空間操作函數(shù)、索引等功能。PostgreSQL內(nèi)置的GiST(通用搜索樹(shù))索引可以實(shí)現(xiàn)任意的搜索模式,PostGIS在GiST的基礎(chǔ)上實(shí)現(xiàn)了R樹(shù)空間索引,以下簡(jiǎn)稱為GiST索引。該節(jié)選用PostgreSQL/PostGIS存儲(chǔ)和檢索空間數(shù)據(jù),利用3個(gè)縣的土地利用現(xiàn)狀數(shù)據(jù)以及基本農(nóng)田圖斑數(shù)據(jù)對(duì)混合索引模型的檢索效率進(jìn)行實(shí)驗(yàn)測(cè)試,并與GiST索引以及ArcGIS的格網(wǎng)索引進(jìn)行對(duì)比分析。土地利用現(xiàn)狀數(shù)據(jù)和基本農(nóng)田數(shù)據(jù)是新增耕地、新增建設(shè)用地比對(duì)核查、違法用地分析等業(yè)務(wù)的重要數(shù)據(jù)源,在這些業(yè)務(wù)中需要進(jìn)行圖斑相似性比較。該研究由項(xiàng)目支撐,收集3個(gè)縣的不同年度土地利用現(xiàn)狀圖斑數(shù)據(jù)和基本農(nóng)田圖斑數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),對(duì)比數(shù)據(jù)集之間圖斑的形狀相似性可以快速、有效地發(fā)現(xiàn)土地利用的變化情況。實(shí)驗(yàn)數(shù)據(jù)的地區(qū)包含多種地形地貌,簡(jiǎn)單圖斑與復(fù)雜圖斑并存,平均圖斑面積差異大,具有一定的代表性。實(shí)驗(yàn)數(shù)據(jù)具體情況如下。
(1)縣1,南北跨78?km,東西長(zhǎng)71?km,2013年行政區(qū)面積2?732.77?km2,區(qū)域內(nèi)地形地貌復(fù)雜,地勢(shì)東南高、西北低,有山地、丘陵、平原、洼地等;如圖3所示,2013年土地利用現(xiàn)狀數(shù)據(jù)圖斑個(gè)數(shù)為55?521個(gè),2012年基本農(nóng)田數(shù)據(jù)圖斑個(gè)數(shù)為14?387個(gè),土地利用現(xiàn)狀數(shù)據(jù)最大圖斑面積30.64?km2,最小圖斑面積2.71?m2,平均圖斑面積0.05?km2。(2)縣2,南北長(zhǎng)74?km,東西寬79?km,2013年行政區(qū)面積?2?859.55?km2,區(qū)域內(nèi)地形復(fù)雜,西南多為山地,東部地勢(shì)低緩,海拔差達(dá)1?000多m;2013年土地利用現(xiàn)狀數(shù)據(jù)圖斑個(gè)數(shù)為50?434個(gè),2012年基本農(nóng)田數(shù)據(jù)圖斑個(gè)數(shù)為18?829個(gè),?土地利用現(xiàn)狀數(shù)據(jù)最大圖斑面積26.58?km2,最小圖斑面積2.08?m2,平均圖斑面積0.06?km2。(3)縣3,南北長(zhǎng)44?km,東西長(zhǎng)30?km,2013年行政區(qū)面積744.68?km2,地勢(shì)平緩,以平原和丘陵為主;2013年土地利用現(xiàn)狀數(shù)據(jù)圖斑個(gè)數(shù)為189?340個(gè),2012年基本農(nóng)田數(shù)據(jù)圖斑個(gè)數(shù)為39?493?個(gè),土地利用現(xiàn)狀數(shù)據(jù)最大圖斑面積41.70?km2,最小圖斑面積0.12?m2,平均圖斑面積0.004?km2,區(qū)域內(nèi)圖斑個(gè)數(shù)多,圖斑平均面積偏小[2]。
2?基于CDB直方圖的圖斑相似性快速度量方法
2.1?基于CDB直方圖的圖斑相似性快速度量方法
基于F直方圖的圖斑幾何形狀相似性度量方法基于F直方圖的圖斑幾何形狀相似性度量方法的原理是計(jì)算圖斑與其主軸上參考點(diǎn)之間在360°方向上的作用力強(qiáng)度,用F直方圖的形式來(lái)刻畫圖斑的幾何形狀,通過(guò)歸一化和中值濾?波減少噪聲,然后利用歐氏距離度量圖斑特征向量間的相似程度。其中F直方圖用來(lái)描述兩個(gè)空間對(duì)象之間的空?間方向關(guān)系,兩個(gè)空間對(duì)象A、B間的F直方圖計(jì)算公式如式該方法的計(jì)算流程是:首先計(jì)算圖斑的質(zhì)心坐標(biāo),然后計(jì)算圖斑協(xié)方差矩陣,得到特征值和特征向量,以此確定圖斑主軸方向,再計(jì)算以質(zhì)心為圓心的圖斑最小外接圓,以主軸與圖斑最小外接圓的兩個(gè)交點(diǎn)作為參考點(diǎn),分別計(jì)算兩個(gè)參考點(diǎn)與圖斑構(gòu)成的F直方圖,合并兩個(gè)F直方圖并進(jìn)行歸一化和濾波后得到最終的圖斑F直方圖,如圖3所示。
通過(guò)計(jì)算兩個(gè)圖斑F直方圖間的歐氏距離,?得到兩個(gè)圖斑的相似性度量結(jié)果。?歐氏距離值越小,兩個(gè)F直方圖之間的特征相似度越大,歐氏距離值越大,兩個(gè)F直方圖之間的特征相似度越小[3]。基于F直方圖的圖斑幾何形狀相似?性度量方法具有仿射不變性,即平移、旋轉(zhuǎn)、縮放前后的圖斑F直方圖無(wú)明顯變化。該方法的建議相似性判斷閾值為1,即當(dāng)兩圖斑相似度值小于或等于1時(shí),判斷兩圖斑基本相似;當(dāng)兩圖斑相似度值大于1時(shí),判斷兩圖斑不相似[4]。
2.2?基于CDB直方圖的圖斑相似性快速度量方法
CDB直方圖原理基于F直方圖的圖斑相似性度量方法需要計(jì)算圖斑主軸、圖斑外接圓、主軸參考點(diǎn)以及對(duì)F直方圖?進(jìn)行歸一化濾波等計(jì)算,計(jì)算量偏大,難以滿足海量圖斑的相似性快速計(jì)算需求。由于在變更調(diào)查信息套合、違法?用地分析等自然資源監(jiān)管工作中,主要是計(jì)算不同地理數(shù)據(jù)集或不同年度的同一類型地理數(shù)據(jù)集中的同一地理位置?的圖斑相似性,可以不考慮因數(shù)據(jù)集比例尺和投影等的不同導(dǎo)致的圖斑縮放、旋轉(zhuǎn)、平移等情況,將形狀、大小等?發(fā)生變化的圖斑認(rèn)定為不一致圖斑。因此,研究改進(jìn)基于F直方圖的圖斑幾何形狀相似性度量方法,結(jié)合基于空間數(shù)據(jù)?幾何圖形相似度模型(SDSM)的特點(diǎn),提出一種基于質(zhì)心射線距離直方圖(Histogram?of?Centroid?Distance?to?Boundary,CDB-Histogram)的圖斑相似性度量方法:即以圖斑質(zhì)心為起點(diǎn),沿固定間隔旋轉(zhuǎn)角的射線方向到圖斑輪廓的距離直方圖代替F直方圖,歸一化兩圖斑的CDB直方圖間的歐氏距離作為圖斑相似度值,以減少計(jì)算量,提高計(jì)算速度,實(shí)現(xiàn)相似性快速度量[5]。CDB直方圖計(jì)算原理如圖4所示。
首先計(jì)算圖斑的質(zhì)心坐標(biāo)O(X,Y),如圖5所圖所示,以圖斑質(zhì)心O為起點(diǎn)計(jì)算360°內(nèi)以固定角a為間隔的質(zhì)心射線集合R={R1…Rn},其中n=360/a,射線Ri的方向角為θi=i-1a,其中i從1~n;然后分別計(jì)算質(zhì)心射線Ri與?圖斑輪廓的交點(diǎn)得到集合P={P1…Pn}最后分別計(jì)算每一個(gè)交點(diǎn)Ri?(XSi,YSi)與質(zhì)心O的距離得到集合L={L1…Ln},由集合L組成CDB直方圖。具體情況如圖5所示。
式(1)、式(2)中,a為圖斑的質(zhì)心射線間隔角,、分別為圖斑A和圖斑B的質(zhì)心沿其第條射線方向到圖斑輪廓的距離。由式(2)可知,當(dāng)圖斑A與圖斑B的形狀一致時(shí),圖斑A與圖斑B的質(zhì)心射線到圖斑輪廓的距離值均相等,其CDB直方圖間的歐氏距離,圖斑相似度值;(2)圖斑A與圖斑B的形狀差異越小,其CDB直方圖間的歐氏距離越接近于0,相似度值越接近于1;圖斑A與圖斑B的形狀差異越大,其CDB直方圖間的歐氏距離越大,相似度值越小,當(dāng)無(wú)限大時(shí),相似度值無(wú)限趨近于0。對(duì)二維圖斑來(lái)說(shuō),圖斑質(zhì)心與重心重合,CDB直方圖法與SDSM法相比,都利用了質(zhì)心(重心)到圖斑輪廓的距離這一指標(biāo),CDB直方圖法是將質(zhì)心到輪廓距離的差異值的歐氏距離的歸一化值作為相似度值,但SDSM法是將1與歸一化重心到輪廓距離的差異值的差值作為相似度值,且需要參數(shù)調(diào)節(jié)差異距離的大?。籆DB直方圖法與F直方圖法相比,都利用了歐氏距離計(jì)算圖斑相似性度,但F直方圖法是計(jì)算圖斑主?軸參考點(diǎn)到圖斑輪廓的歸一化距離的歐氏距離作為相似度值,且需要計(jì)算圖斑主軸、主軸參考點(diǎn)等??傮w來(lái)說(shuō),CDB直方圖法兼具F直方圖法和SDSM法的優(yōu)點(diǎn),包括計(jì)算量偏小、不需要額外參數(shù)等[6]。
2.3?計(jì)算流程和方法對(duì)比分析
由以上實(shí)驗(yàn)可以得出,圖斑間的CDB直方圖的相似度可以判斷出圖斑形狀相似和圖斑形狀不相似兩種情況,由CDB直方圖可以進(jìn)一步判斷出形狀不相似圖斑中的縮放、旋轉(zhuǎn)圖斑,但不能有效識(shí)別形狀相似圖斑中的平移圖斑。因?yàn)槠揭茍D斑間質(zhì)心距離大于0,所以對(duì)于形狀相似圖斑,可以結(jié)合質(zhì)心距離指標(biāo)判斷圖斑是否似平移,以避免因圖斑?形狀相似但因所處位置不同等造成的相似性誤判的情況;對(duì)于形狀不相似圖斑,可以對(duì)CDB直方圖做平移以及比例分析,進(jìn)而判斷圖斑是否似旋轉(zhuǎn)或者似縮放[7]。因此,提出CDB直方圖圖斑相似性快速度量方法計(jì)算流程:首先分別計(jì)算圖斑A和圖斑B的質(zhì)心坐標(biāo)OA(XA,YA)、OB(XB,YB);其次分別計(jì)算以質(zhì)心OA、OB為起點(diǎn),按固定間隔角a在360°內(nèi)的質(zhì)心射線集合RA={RA1…RAn}和RB={RB1…RBn},其中n=360/a;然后分別計(jì)算RA與圖斑A輪廓的交點(diǎn)得到集合PA={PA1…PAn},RB與圖斑B輪廓的交點(diǎn)得到集合PB={PB1…PBn},分別計(jì)算PA與質(zhì)心OA的距離?得到集合LA={LA1…LAn},PB與質(zhì)心OB的距離得到集合LB={LB1…LBn};最后計(jì)算集合。
以示例圖斑數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),取射線間隔角等于12°為例,對(duì)比CDB直方圖、F直方圖及SDSM法圖斑相似性度量結(jié)果。從相似性度量結(jié)果來(lái)看:對(duì)于平移圖斑(a1/b1/c1/d1),SDSM法和CDB直方圖法計(jì)算的相似度?值均為1,F(xiàn)直方圖法計(jì)算的相似度值為0,表明圖斑形狀相似,即3種方法均可以將平移圖斑識(shí)別為相似圖斑;對(duì)于旋轉(zhuǎn)圖斑(a2/b2/c2/d2)和縮放圖斑(a3/b3/c3/d3),SDSM法和CDB直方圖法計(jì)算的相似度值較?。ǔ龍A形以外),可以識(shí)別旋轉(zhuǎn)和縮放圖斑為不相似圖斑,其中SDSM法計(jì)算的相似度值出現(xiàn)負(fù)值,表明調(diào)節(jié)差異距離的系數(shù)不太合理;F直方圖法計(jì)算的相似度值接近于0說(shuō)明直方圖法不能有效識(shí)別旋轉(zhuǎn)和縮放圖斑;對(duì)于頂點(diǎn)偏移圖斑(a4/a5/a6/b4/b5/b6/c4/c5/c6/d4/d5/d6),頂點(diǎn)坐標(biāo)偏移值越大,圖斑的相似性越差,SDSM法和CDB直方圖法計(jì)算的?相似度值越小,其中CDB直方圖法相似度值差異較為明顯,但SDSM法相似度值差異不明顯;F直方圖法計(jì)算的相似度?值則沒(méi)有明顯規(guī)律,不能直觀體現(xiàn)出偏移量的細(xì)微變化對(duì)相似度值的影響;對(duì)于形狀不一致圖斑(e1/e2/e3/e4/e5/e6),SDSM法計(jì)算的相似度接近于0或者小于0,CDB直方圖法計(jì)算的相似度值接近于0,表明圖斑形狀不相似,F(xiàn)直方圖法計(jì)算的相似度值均大于1,這3種方法均可以將識(shí)別形狀不相似圖斑;從計(jì)算效率來(lái)說(shuō),F(xiàn)直方圖法的相似度計(jì)?算平均耗時(shí)845.124?ms,SDSM法的計(jì)算平均耗時(shí)6.986?ms,而CDB直方圖法的計(jì)算平均耗時(shí)6.971?ms,可見(jiàn)CDB直方圖法?的計(jì)算效率最高[8]。
對(duì)比這3種方法計(jì)算圖斑相似度結(jié)果表明,F(xiàn)直方圖法不能有效識(shí)別平移、旋轉(zhuǎn)、縮放圖斑,SDSM法和CDB直方圖?法能夠識(shí)別旋轉(zhuǎn)和縮放圖斑,但無(wú)法有效識(shí)別平移圖斑;SDSM法和F直方圖法對(duì)圖斑形狀的微小差異不敏感,其中?SDSM法需要參數(shù)調(diào)節(jié)差異距離的大小,參數(shù)設(shè)置不合理時(shí)相似度值會(huì)出現(xiàn)負(fù)值,而CDB直方圖法能夠較為準(zhǔn)確的識(shí)別?出圖斑形狀的微小差異,且不需要額外的計(jì)算參數(shù),其計(jì)算效率也最高[9]。
3?海量矢量圖斑相似性快速度量系統(tǒng)
3.1系統(tǒng)功能需求分析
海量矢量圖斑相似性快速度量系統(tǒng)主要功能需求如下:(1)基礎(chǔ)數(shù)據(jù)管理以基礎(chǔ)地理數(shù)據(jù)的讀取以及導(dǎo)入導(dǎo)出為目標(biāo),開(kāi)發(fā)基礎(chǔ)數(shù)據(jù)管理模塊,能夠?qū)雽?dǎo)出基礎(chǔ)地理數(shù)據(jù),瀏覽基礎(chǔ)地理數(shù)據(jù)的元數(shù)據(jù)、圖形以及屬性數(shù)據(jù)等[10];(2)數(shù)據(jù)索引管理實(shí)現(xiàn)基于行政區(qū)索引、粗分格網(wǎng)索引以及R樹(shù)索引的混合索引算法,能夠創(chuàng)建、更新、刪除?空間數(shù)據(jù)的混合索引等;(3)矢量圖斑相似性快速度量基于CDB直方圖圖斑相似性快速度量方法,開(kāi)發(fā)矢量圖斑相?似性快速度量模塊,在混合索引的基礎(chǔ)上快速獲取候選匹配集,采用并行計(jì)算的方式進(jìn)行圖斑相似性計(jì)算,實(shí)現(xiàn)候?選匹配集中矢量圖斑的相似性快速度量[11];(4)相似性度量結(jié)果查詢與分析能夠?qū)κ噶繄D斑相似性度量結(jié)果進(jìn)行查詢?和定位,分析相似圖斑的似平移、似旋轉(zhuǎn)、似縮放情況,查看矢量圖斑相似性度量結(jié)果等;(5)制圖與輸出能夠?qū)κ噶繄D斑相似性度量結(jié)果制作專題圖,并導(dǎo)出專題圖。
3.2?主要系統(tǒng)架構(gòu)功能設(shè)計(jì)
系統(tǒng)整體將采用?C/S?模式的?4?層體系結(jié)構(gòu)進(jìn)行設(shè)計(jì)和開(kāi)發(fā),包括基礎(chǔ)設(shè)施層、數(shù)據(jù)資。具體如圖6所示。
根據(jù)系統(tǒng)功能需求分析,設(shè)計(jì)系統(tǒng)的主要功能模塊如圖7所示。
3.3圖斑相似性度量計(jì)算流程設(shè)計(jì),系統(tǒng)性能測(cè)試
系統(tǒng)中矢量圖斑相似性度量計(jì)算流程,具體過(guò)程如下。(1)數(shù)據(jù)入庫(kù)。分別將基礎(chǔ)數(shù)據(jù)集A和待比較數(shù)據(jù)集B導(dǎo)入數(shù)據(jù)庫(kù)。(2)候選匹配集快速提取。對(duì)兩個(gè)數(shù)據(jù)集建立基于行政區(qū)索引、粗分格網(wǎng)索引以及R樹(shù)索引的混合索引;然后依據(jù)混合索引,對(duì)兩數(shù)據(jù)集進(jìn)行相交查詢,快速獲取候選匹配集。(3)并行管理[12]。根據(jù)設(shè)定的并發(fā)線程數(shù)量以及最大占用內(nèi)存,利用C#線程池合理地分配和管理并發(fā)線程,以多線程的方式進(jìn)行圖斑相似性并發(fā)計(jì)算。(4)矢量圖斑相似性快速計(jì)算。采用該文提出的基于CDB直方圖的圖斑相似性快速度量方法對(duì)候選匹配集進(jìn)行圖斑相似性度量;利用并行計(jì)算提高計(jì)算效率,最后輸出保存相似性度量結(jié)果[13]。通過(guò)對(duì)比分析計(jì)算結(jié)果發(fā)現(xiàn),當(dāng)圖斑相似時(shí),F(xiàn)直方圖法相似度值接近于0,SDSM法和CDB直方圖法相似度值接近于1;當(dāng)圖斑不相似且圖斑輪廓差異較小時(shí),F(xiàn)直方圖法相似度值仍接近于0,SDSM法相似度值仍接近于1,且差異不明顯,而CDB直方圖法相似度值與1的差異較為明顯,表明CDB直方圖法相似度值對(duì)圖斑輪廓差異較為敏感;當(dāng)圖斑不相似且圖斑輪廓差異較大時(shí),F(xiàn)直方圖法相似度值大于0,SDSM法相似度值小于1,CDB直方圖法相似度值則接近于0,與理論公式相符。分別以不同的相似度閾值對(duì)3個(gè)縣的CDB直方圖法圖斑相似度計(jì)算結(jié)果作出相似性判斷,從圖斑相似和圖斑不相似兩類中分別隨機(jī)抽取100個(gè)樣本,統(tǒng)計(jì)樣本的圖斑相似性度量結(jié)果的正確率,可以得出相似度閾值過(guò)大或過(guò)小都會(huì)降低CDB直方圖法10圖斑相似性度量結(jié)果的正確率,相似度閾值取0.80時(shí)正確率最高。響應(yīng)時(shí)間測(cè)試,測(cè)試系統(tǒng)滿足在用戶進(jìn)行任何操作的時(shí)候,系統(tǒng)反應(yīng)的時(shí)間在?3?s以內(nèi)。系統(tǒng)能夠監(jiān)測(cè)出各種非正常情況,如無(wú)法連接數(shù)據(jù)庫(kù)服務(wù)器、數(shù)據(jù)異常等情況,避免出現(xiàn)長(zhǎng)時(shí)間等待,以及請(qǐng)求無(wú)響應(yīng)等情況[14]。可靠性測(cè)試,測(cè)試系統(tǒng)可以保證24?h不間斷可靠運(yùn)行,正確提示相關(guān)正確或錯(cuò)誤信息;系統(tǒng)支持?jǐn)?shù)據(jù)的導(dǎo)入與導(dǎo)出,便于故障恢復(fù);系統(tǒng)具有完備的日志記錄,方便系統(tǒng)維護(hù)以及管理人員分析系統(tǒng)的使用情況等。系統(tǒng)功能測(cè)試和性能測(cè)試結(jié)果表明系統(tǒng)各功能單元正常,系統(tǒng)能夠可靠、高效地運(yùn)行[15]。
4?結(jié)語(yǔ)
快速、準(zhǔn)確、有效地計(jì)算海量矢量圖斑之間的相似性可用于地圖數(shù)據(jù)精確融合、空間數(shù)據(jù)快速更新、國(guó)土資源動(dòng)態(tài)監(jiān)管等,對(duì)提高數(shù)據(jù)利用率、降低數(shù)據(jù)獲取成本、縮短數(shù)據(jù)獲取周期、不一致圖斑檢測(cè)、違法用地分析等具有重要意義。該文綜合不同索引的優(yōu)點(diǎn),研究了一種混合索引模型,通過(guò)該混合索引可以快速檢索空間數(shù)據(jù),提高數(shù)據(jù)集相交查詢效率,快速獲取候選匹配集;提出了一種基于質(zhì)心射線距離直方圖(CDB直方圖)的矢量圖斑相似性快速度量方法,通過(guò)計(jì)算矢量圖斑CDB直方圖和質(zhì)心距離可以判斷兩圖斑是否相似以及是否似平移、似旋轉(zhuǎn)或者似縮放,實(shí)現(xiàn)矢量圖斑相似性快速準(zhǔn)確度量;設(shè)計(jì)并研發(fā)了海量矢量圖斑相似性快速度量系統(tǒng),利于研究成果的應(yīng)用。通過(guò)該研究,以圖斑相似性快速準(zhǔn)確度量為目標(biāo),提出了基于一種混合索引模型的候選匹配集快速獲取方法和基于CDB直方圖的矢量圖斑相似性快速度量方法,具有一定的創(chuàng)新性。
參考文獻(xiàn)
[1] 林鵬.傾斜攝影測(cè)量技術(shù)在不動(dòng)產(chǎn)測(cè)繪中的應(yīng)用[J].城鎮(zhèn)建設(shè),2021(1):377.[2] 薛東方.現(xiàn)代信息測(cè)繪新技術(shù)在工程測(cè)量中的應(yīng)用改造對(duì)策研究[J].磚瓦世界,2021(4):83,85.