王 程,王小軍,趙 龍,張 號,王煥萍
(1.自然資源部陜西測繪產(chǎn)品質(zhì)量監(jiān)督檢驗站,陜西 西安 710054;2.自然資源部測繪標(biāo)準(zhǔn)化研究所,陜西 西安 710054)
現(xiàn)有的地理空間數(shù)據(jù)存在形式多樣,種類繁多、關(guān)系復(fù)雜等特點,用于描述各類實體要素(地理空間數(shù)據(jù)中對現(xiàn)實世界現(xiàn)象(實體)的抽象描述)的數(shù)據(jù)也十分復(fù)雜,按表達(dá)形態(tài)進(jìn)行分類,實體要素可分為點、線和面實體要素。研究不同實體要素與地球空間網(wǎng)格對應(yīng)關(guān)系,實現(xiàn)實體要素的網(wǎng)格化離散,利用適宜級的地球空間網(wǎng)格單元表達(dá),能夠推進(jìn)地球空間網(wǎng)格地理信息的組織、表達(dá)方式,更好地發(fā)揮其作為信息整合、管理的作用。本文主要研究1∶10 000 常用比例尺下,面實體要素的表達(dá)精度,確定面實體要素網(wǎng)格化描述的地球空間網(wǎng)格的較優(yōu)級[1-5]。
面實體要素網(wǎng)格化是在確保據(jù)數(shù)據(jù)精度的基礎(chǔ)上,利用地球空間網(wǎng)格對面實體要素進(jìn)行網(wǎng)格化離散,通過選定適合級的地球空間網(wǎng)格單元,將面實體要素離散為一系列緊密關(guān)聯(lián)的空間單元集合。網(wǎng)格化離散能夠為多維、多源、多尺度空間數(shù)據(jù)的一致性關(guān)聯(lián)、新型空間索引建立提供解決方案,促進(jìn)多源空間數(shù)據(jù)統(tǒng)一組織、融合和管理,消除數(shù)據(jù)間的不一致、矛盾和沖突情況,提高空間數(shù)據(jù)融合、管理及應(yīng)用的效率,滿足統(tǒng)一化、精細(xì)化管理的需要。地球空間網(wǎng)格共分為33 級,各級地球空間網(wǎng)格所表示的空間范圍固定,而不同實體要素大小、范圍和幾何特征不相同,不同比例尺其精度也不同,若選取的網(wǎng)格過大(級過低),則不能夠準(zhǔn)確的表達(dá)面實體要素,損失其精度。選取的網(wǎng)格過小(級過高),會增加數(shù)據(jù)量,造成數(shù)據(jù)冗余,降低索引速率。因此,合適的地球空間網(wǎng)格級的選取是面實體要素網(wǎng)格化離散表達(dá)的關(guān)鍵。
面實體要素網(wǎng)格化描述的較優(yōu)級需要按照其表達(dá)精度和尺寸確定,在保證數(shù)據(jù)精度基礎(chǔ)上利用合適大小的網(wǎng)格單元,描述面實體要素的形狀、分布、大小和地理空間位置。首先需要確定面實體要素網(wǎng)格化描述級范圍,在選擇合適的網(wǎng)格級范圍內(nèi),才能進(jìn)一步找到較優(yōu)級。在確定網(wǎng)格化描述級范圍后,通過選定判別因子,統(tǒng)計分析結(jié)果,最終找到面實體要素網(wǎng)格化描述較優(yōu)級。
根據(jù)《基礎(chǔ)地理信息數(shù)字成果1∶5 000 1∶10 000 1∶25 000 1∶50 000 1∶100 000 數(shù)字線劃圖》和《1∶5 000 1∶10 000 地形圖航空攝影測量內(nèi)業(yè)規(guī)范》中的規(guī)定:“地物點相對鄰近野外控制點的平面位置中誤差平地、丘陵地不大于5 m;山地、高山地應(yīng)不大于7.5 m”[6];“地物點對附近野外控制點中誤差分別在平地、丘陵地不大于0.50 m;在山地、高山地不大于0.75 mm 的規(guī)定”[7]。將這2 個指標(biāo)解算到地面約為5 m 和7.5 m,限差約為10 m 和15 m,可以確定1∶10 000 面實體要素的平面位置精度應(yīng)在5 m 和15 m 之間。而22~24 級地球空間網(wǎng)格赤道附近邊長在15.5~3.9 m 之間[5],由此可得,1∶10 000 面實體要素網(wǎng)格化描述的級對應(yīng)范圍為22~24 級網(wǎng)格。
面實體要素網(wǎng)格化較優(yōu)表達(dá)可以通過面積差比指標(biāo)來進(jìn)行判斷,即面實體要素的網(wǎng)格面積與實體要素本身的面積(面實體要素的矢量面積作為真值,以下簡稱面積真值)之差的比值越小,越接近零,說明網(wǎng)格化表達(dá)越優(yōu),網(wǎng)格化圖形更接近面實體要素。正確的統(tǒng)計網(wǎng)格面積,對正確計算面積差比有重要的影響。面實體要素網(wǎng)格化,對于實體要素內(nèi)部,面積統(tǒng)計可以直接計算網(wǎng)格總面積(即網(wǎng)格面積×網(wǎng)格總個數(shù))。對于邊緣網(wǎng)格(面要素邊界落入的網(wǎng)格),如何統(tǒng)計其面積,確保面實體要素的網(wǎng)格面積計算能夠最準(zhǔn)確,是解決問題的關(guān)鍵。本研究通過計算面實體要素在邊緣網(wǎng)格的面積占比,并利用不同的面積占比閾值,作為邊緣網(wǎng)格是否統(tǒng)計面積的依據(jù),找到邊緣網(wǎng)格的最優(yōu)面積占比閾值,準(zhǔn)確統(tǒng)計網(wǎng)格面積。并統(tǒng)計在最優(yōu)面積占比閾值下,各面實體要素在不同的網(wǎng)格級,計算得到的網(wǎng)格面積與面積真值的差比,找出1∶10 000比例尺下,面實體要素網(wǎng)格化的較優(yōu)級,即面實體要素網(wǎng)格化的較優(yōu)表達(dá)。
本實驗共選取9 幅1∶10 000 標(biāo)準(zhǔn)圖幅DLG 面實體要素數(shù)據(jù)展開,選取了陜西省范圍內(nèi)不同地貌特征的典型區(qū)域進(jìn)行。由于各矢量圖幅中的面實體要素是按照類型進(jìn)行分層表示的,如:HYDA 層為水系面層,LRDA 層為道路面層,所以,對面實體要素的相關(guān)面積統(tǒng)計是按照各圖幅下的分層進(jìn)行分類統(tǒng)計。
通過統(tǒng)計各圖幅面實體要素(以圖層為統(tǒng)計單元)22 級到24 級網(wǎng)格面積,同時利用面實體要素矢量數(shù)據(jù)計算得到的面積真值,比較網(wǎng)格面積與面積真值之間的數(shù)據(jù)差異,統(tǒng)計分析確定1∶10 000 面實體要素較優(yōu)表達(dá)尺度所對應(yīng)網(wǎng)格大?。ㄝ^優(yōu)級)。
表1 試驗數(shù)據(jù)情況簡介
實驗主要分為2 個部分:
1)最優(yōu)面積占比閾值的確定。主要選取了網(wǎng)格面積與實體要素的面積真值之差比作為級選取的判別因子。網(wǎng)格面積計算的正確性將直接影響級的選取,而邊緣網(wǎng)格面積的統(tǒng)計直接影響著網(wǎng)格面積計算的正確性。因此首先要確定邊緣網(wǎng)格統(tǒng)計的正確性,即邊緣網(wǎng)格最優(yōu)面積占比閾值。實驗閾值選定了10%,20%,30%,40%,50%,60%,70%,80%,90%,即對于邊緣網(wǎng)格,面實體要素落入網(wǎng)格內(nèi)部,其面積占比達(dá)到設(shè)定的閾值后,將網(wǎng)格面積統(tǒng)計在內(nèi),否則,不統(tǒng)計此網(wǎng)格面積。實驗主要統(tǒng)計圖幅內(nèi)面實體要素在22~24 級的地球空間網(wǎng)格面積,對邊緣網(wǎng)格分別計算不同面積占比閾值得到的網(wǎng)格面積與面積真值的差比,找到最接近面積真值的最優(yōu)面積占比閾值。
2)較優(yōu)級的選取。面實體要素網(wǎng)格化較優(yōu)級的確定需要在保證數(shù)據(jù)精度的前提下,利用合適大小的網(wǎng)格單元對其進(jìn)行描述,既要保證數(shù)據(jù)本身的精度,又要避免數(shù)據(jù)冗余。1∶10 000 面實體要素的平面位置精度在5 m 和15 m 之間,由此確定其網(wǎng)格化描述對應(yīng)的等級范圍為22~24 級。在找到邊緣網(wǎng)格最優(yōu)面積占比閾值的情況下,統(tǒng)計實驗圖幅中各面實體要素在22~24 級下,各圖層面實體要素的網(wǎng)格面積與面積真值的差比,并對結(jié)果進(jìn)行分析,找到1∶10 000 比例尺面實體要素網(wǎng)格化描述較優(yōu)級。
1)通過對9 幅實驗圖計算各面實體要素在22 ~24 級網(wǎng)格下,對邊緣網(wǎng)格的不同面積占比閾值統(tǒng)計,得到的網(wǎng)格面積與面積真值的差比結(jié)果可知,邊緣網(wǎng)格面積占比閾值過小或者過大,都不能夠正確的表達(dá)面實體要素的網(wǎng)格面積。隨著閾值的變化可以發(fā)現(xiàn),閾值選定離50%越遠(yuǎn),統(tǒng)計得到的面實體要素的面積真值與網(wǎng)格面積差比越大,越難正確的表達(dá)面實體要素的面積。
實驗結(jié)果表明,所有實驗圖幅在22、23、24 級,均以50%面積占比閾值統(tǒng)計得到的網(wǎng)格面積與面積真值的差比最小,最接近實體要素面積真值。對于邊緣網(wǎng)格而言,面實體要素與網(wǎng)格相交,面積占比大于網(wǎng)格面積的50%,才將其面積統(tǒng)計在內(nèi)。由此可知,50%面積占比閾值為邊緣網(wǎng)格的最優(yōu)面積占比閾值,如圖1所示。
圖1 不同面積占比閾值下面積真值與網(wǎng)格面積差比統(tǒng)計圖(部分圖幅,23 級)
2)通過統(tǒng)計實驗圖幅在最優(yōu)面積占比閾值(50%)下22~24 級網(wǎng)格面積與面積真值之差比(見圖2)發(fā)現(xiàn),在所有實驗圖幅中,22 級網(wǎng)格面積與面積真值的差比最大為-82.42%;23 級網(wǎng)格面積與面積真值的差比最大僅為-4.64%;24 級網(wǎng)格面積與面積真值的差比最大為10.84%。從22 級到23 級間網(wǎng)格面積與面積真值的差比變化速率最大,而從23 級到24 級間網(wǎng)格面積與面積真值的差比變化速率相對較小。由此可見,面實體要素利用23 級網(wǎng)格計算得到的網(wǎng)格面積與面積真值較為接近,表達(dá)效果較好。
圖2 各級面實體要素網(wǎng)格面積與面積真值差比統(tǒng)計圖(50%面積占比閾值)
綜上所述,在考慮數(shù)據(jù)的表達(dá)精度和尺寸的前提下,23 級網(wǎng)格能夠較好的對1∶10 000 面實體要素網(wǎng)格化進(jìn)行描述。
本文以地球空間網(wǎng)格理論為基礎(chǔ),對1∶10 000 比例尺面實體要素網(wǎng)格化表達(dá)較優(yōu)級進(jìn)行研究,根據(jù)1∶10 000 面實體要素的平面位置精度,確定其網(wǎng)格化描述對應(yīng)的級范圍為22 ~24 級。利用網(wǎng)格面積與面積真值的差比為判別指標(biāo),找到了邊緣網(wǎng)格統(tǒng)計面積的最優(yōu)面積占比閾值為50%。在此基礎(chǔ)上,通過實驗統(tǒng)計得到從22 級到23 級間網(wǎng)格面積與要素面積差比變化速率最大,23 級的網(wǎng)格面積與要素面積差比值較小,多集中在0~1%之間。在考慮數(shù)據(jù)的表達(dá)精度和尺寸的前提下,選取23 級網(wǎng)格作為1∶10 000 面實體要素網(wǎng)格化描述的較優(yōu)級。本實驗結(jié)果進(jìn)一步驗證了利用比例尺精度確定實體要素網(wǎng)格化描述適合級的可行性。然而本實驗?zāi)壳皟H完成了某一特定比例尺下的某一類實體要素的網(wǎng)格化級選取工作,需要進(jìn)一步研究完善。下一階段將加大樣本選取量并選擇不同比例尺下實體要素開展實驗,進(jìn)一步確定不同比例尺實體要素描述所需的較優(yōu)地球空間網(wǎng)格級,找到其規(guī)律。