馬夢(mèng)然,花向紅,賀小星,舒穎,龔國(guó)棟
(1.武漢大學(xué)測(cè)繪學(xué)院,湖北武漢 430079; 2.江西省數(shù)字國(guó)土重點(diǎn)實(shí)驗(yàn)室,江西南昌 330013; 3.地球空間信息技術(shù)協(xié)同創(chuàng)新中心,湖北武漢 430079; 4.武漢大學(xué)災(zāi)害監(jiān)測(cè)和防治研究中心,湖北武漢 430079)
地理國(guó)情普查入庫(kù)數(shù)據(jù)質(zhì)量檢查相關(guān)問題研究
馬夢(mèng)然1,2?,花向紅1,3,4,賀小星1,2,舒穎1,2,龔國(guó)棟1,2
(1.武漢大學(xué)測(cè)繪學(xué)院,湖北武漢 430079; 2.江西省數(shù)字國(guó)土重點(diǎn)實(shí)驗(yàn)室,江西南昌 330013; 3.地球空間信息技術(shù)協(xié)同創(chuàng)新中心,湖北武漢 430079; 4.武漢大學(xué)災(zāi)害監(jiān)測(cè)和防治研究中心,湖北武漢 430079)
以河北省某縣地理國(guó)情普查入庫(kù)數(shù)據(jù)質(zhì)量檢查為例,系統(tǒng)介紹了地理國(guó)情普查數(shù)據(jù)入庫(kù)質(zhì)量檢查方法及流程,提出了基于5種屬性數(shù)據(jù)的入庫(kù)數(shù)據(jù)質(zhì)量檢查方法,并結(jié)合ArcGIS進(jìn)行實(shí)例進(jìn)行分析,提出了相應(yīng)的質(zhì)量修正方案。結(jié)果表明:經(jīng)過ArcGIS對(duì)5種屬性數(shù)據(jù)進(jìn)行拓?fù)浞治黾靶拚?能夠有效提高質(zhì)量檢查的效率和質(zhì)量,確保地理國(guó)情普查成果順利進(jìn)行入庫(kù)。
地理國(guó)情普查;數(shù)據(jù)入庫(kù);方法與流程;質(zhì)量檢查
為全面掌握我國(guó)地理國(guó)情現(xiàn)狀,滿足經(jīng)濟(jì)社會(huì)發(fā)展和生態(tài)文明建設(shè)的需要,國(guó)務(wù)院下發(fā)了《國(guó)務(wù)院關(guān)于開展第一次全國(guó)地理國(guó)情普查的通知》(國(guó)發(fā)[2013]9號(hào))決定于2013年~2015年開展第一次全國(guó)地理國(guó)情普查工作[1]。為順利開展國(guó)情普查數(shù)據(jù)地理國(guó)情監(jiān)測(cè)與統(tǒng)計(jì)分析應(yīng)用,確保地理國(guó)情普查中各種成果數(shù)據(jù)能夠順利入庫(kù),各類成果數(shù)據(jù)在入庫(kù)前均需要按照成果數(shù)據(jù)入庫(kù)檢查技術(shù)要求進(jìn)行入庫(kù)檢查。由于檢查成果數(shù)據(jù)中可能存在待入庫(kù)數(shù)據(jù)文件與結(jié)構(gòu)一致性、邏輯一致性、拓?fù)潢P(guān)系一致性、空間參考正確性及矢量數(shù)據(jù)接邊等影響入庫(kù)的數(shù)據(jù)問題,需要利用地理國(guó)情普查質(zhì)檢軟件依據(jù)檢查要求對(duì)地理國(guó)情普查入庫(kù)數(shù)據(jù)進(jìn)行質(zhì)量檢查與質(zhì)量評(píng)價(jià)[2,3]。對(duì)于影響數(shù)據(jù)入庫(kù)的問題需要修改后才能進(jìn)入下一個(gè)建庫(kù)工序。從第一次全國(guó)地理國(guó)情普查開始以來,各省測(cè)繪地理信息相關(guān)部門都積極行動(dòng)起來,在全國(guó)各個(gè)任務(wù)區(qū)開展了大量工作。針對(duì)地理國(guó)情普查數(shù)據(jù)庫(kù)的建設(shè),國(guó)家測(cè)繪產(chǎn)品質(zhì)量檢查測(cè)試中心和四川省測(cè)繪產(chǎn)品質(zhì)量監(jiān)督檢驗(yàn)站共同開發(fā)了地理國(guó)情普查質(zhì)檢軟件,實(shí)現(xiàn)了對(duì)數(shù)據(jù)檢查的自動(dòng)化[4,5]。
2.1地理國(guó)情普查入庫(kù)數(shù)據(jù)
通過二級(jí)檢查驗(yàn)收后的地理國(guó)情普查數(shù)據(jù)主要包括:地表覆蓋數(shù)據(jù)、地形地貌數(shù)據(jù)、地理國(guó)情要素?cái)?shù)據(jù)、正射影像數(shù)據(jù)、遙感影像解譯樣本數(shù)據(jù)及相關(guān)元數(shù)據(jù)等數(shù)據(jù)成果。按照地理國(guó)情普查數(shù)據(jù)入庫(kù)質(zhì)量檢查程序,需要在質(zhì)檢前將成果數(shù)據(jù)統(tǒng)一拷貝到預(yù)先分配好的存儲(chǔ)位置和目錄下,并轉(zhuǎn)換成軟件可識(shí)別的數(shù)據(jù)組織形式,其數(shù)據(jù)組織形式如圖1所示。
圖1 數(shù)據(jù)組織形式圖
由圖1可以看出地理國(guó)情普查入庫(kù)原始數(shù)據(jù)格式主要分為地表覆蓋及國(guó)情要素和解譯樣本兩大類[6],其中地表覆蓋及國(guó)情要素包括地表覆蓋數(shù)據(jù)(DLGO)和元數(shù)據(jù)(Metadata),其數(shù)據(jù)存儲(chǔ)方式按照“一個(gè)縣一個(gè)gdb存儲(chǔ)”,數(shù)據(jù)命名方式為“縣級(jí)代碼+縮寫.gdb”、“M+縣級(jí)代碼+縮寫.gdb”;解譯樣本數(shù)據(jù)按照國(guó)家生產(chǎn)規(guī)定進(jìn)行數(shù)據(jù)組織,即SMPDATA,包括數(shù)據(jù)庫(kù)文件SMPDATA.mdb、地面照片文件PHOTO、影像實(shí)例目錄SMPIMG[5]。
2.2數(shù)據(jù)入庫(kù)檢查方法
數(shù)據(jù)入庫(kù)質(zhì)量檢查方法以自動(dòng)檢查為主,利用地理國(guó)情普查入庫(kù)質(zhì)檢軟件,對(duì)生產(chǎn)單位提交的成果數(shù)據(jù)的文件與結(jié)構(gòu)一致性、拓?fù)潢P(guān)系一致性、邏輯一致性、空間參考正確性以及矢量數(shù)據(jù)接邊等進(jìn)行檢查,發(fā)現(xiàn)問題給出錯(cuò)誤列表,然后進(jìn)行修改[7,8]。而對(duì)無法實(shí)現(xiàn)自動(dòng)檢查的要素內(nèi)容,可采用可視化的半自動(dòng)人機(jī)交互檢查方式發(fā)現(xiàn)問題,檢查人員對(duì)問題進(jìn)行分析后,采取相應(yīng)的技術(shù)措施,主要是利用ArcGIS軟件中的相應(yīng)功能或以人工方式進(jìn)行文件格式、命名修正等方法進(jìn)行修改,保證數(shù)據(jù)完整,數(shù)據(jù)格式、結(jié)構(gòu)和內(nèi)容符合數(shù)據(jù)入庫(kù)要求。
2.3入庫(kù)質(zhì)檢的工作流程
入庫(kù)質(zhì)檢的工作流程如圖2所示。首先對(duì)入庫(kù)前數(shù)據(jù)成果進(jìn)行匯交目錄的檢查,按照生產(chǎn)規(guī)定、建庫(kù)規(guī)定和匯交規(guī)定進(jìn)行省級(jí)匯交目錄和國(guó)家級(jí)匯交目錄檢查,檢查未通過,按照錯(cuò)誤信息提示,對(duì)照數(shù)據(jù)格式要求由生產(chǎn)單位進(jìn)行修改。
然后,匯交目錄的檢查合格后,主要進(jìn)行地理國(guó)情普查要素?cái)?shù)據(jù)、地表覆蓋數(shù)據(jù)、普查元數(shù)據(jù)、正射影像數(shù)據(jù)、遙感解譯樣本數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)檢查6類數(shù)據(jù)的檢查工作。對(duì)于檢查結(jié)果不合格的數(shù)據(jù),檢查后會(huì)自動(dòng)生成相應(yīng)的錯(cuò)誤列表文件。生產(chǎn)單位根據(jù)錯(cuò)誤列表文件信息進(jìn)行相關(guān)數(shù)據(jù)的修改。
第三,對(duì)檢查合格的數(shù)據(jù)進(jìn)行入庫(kù)前數(shù)據(jù)預(yù)處理工作。預(yù)處理工作主要包括普查要素處理、地形地貌數(shù)據(jù)處理、解譯樣本數(shù)據(jù)處理、地表覆蓋數(shù)據(jù)處理、網(wǎng)絡(luò)數(shù)據(jù)處理、正射影像數(shù)據(jù)處理,并進(jìn)行數(shù)據(jù)整合。
最后,經(jīng)過預(yù)處理的數(shù)據(jù),仍需進(jìn)行上述第二步檢查,檢查合格后才能進(jìn)行地理國(guó)情普查數(shù)據(jù)入庫(kù)工作[10]。
圖2 入庫(kù)質(zhì)檢的工作流程
3.1省級(jí)匯交目錄檢查
省級(jí)匯交目錄檢查主要對(duì)提交的地理國(guó)情數(shù)據(jù)資料進(jìn)行初步檢查,按照規(guī)定的格式進(jìn)行數(shù)據(jù)轉(zhuǎn)換,并按照一定的組織形式進(jìn)行存儲(chǔ),通過與標(biāo)準(zhǔn)目錄信息進(jìn)行比較分析,來檢查省級(jí)匯交目錄的正確性、完整性。圖3給出了河北省某縣地理國(guó)情普查入庫(kù)數(shù)據(jù)匯交目錄檢查情況。從圖3及檢查結(jié)果表明提交的數(shù)據(jù)存在DEM、DOM、SURVEYDATA、省級(jí)擴(kuò)展普查成果文件缺失等錯(cuò)誤,其處理辦法是用戶根據(jù)生成的錯(cuò)誤列表文件進(jìn)行編輯處理,必要時(shí)由生產(chǎn)單位補(bǔ)交缺失的相關(guān)的數(shù)據(jù)資料。
圖3 省級(jí)匯交目錄檢查分析結(jié)果
3.2地理國(guó)情普查要素?cái)?shù)據(jù)檢查
地理國(guó)情普查要素?cái)?shù)據(jù)主要是對(duì)不同地理要素?cái)?shù)據(jù)的拓?fù)潢P(guān)系進(jìn)行檢查,即檢查鐵路、城市道路、公路、鄉(xiāng)村道路、水系、構(gòu)筑物等對(duì)象是否存在重合、重復(fù)、懸掛點(diǎn)、偽節(jié)點(diǎn)、未閉合以及幾何位置接邊是否超限、屬性值錯(cuò)漏或不接邊、是否存在極小不合理面或極短的不合理線等。圖4給出了要素?cái)?shù)據(jù)檢查過程中發(fā)現(xiàn)不同屬性的要素(要素3、要素6)相交處未斷開的情況,其處理方案是結(jié)合原始數(shù)據(jù)利用ArcGIS軟件的拓?fù)涔δ軐?duì)出現(xiàn)的錯(cuò)誤的拓?fù)潢P(guān)系進(jìn)行相應(yīng)的修改。
圖4 地理國(guó)情普查要素?cái)?shù)據(jù)結(jié)果情況
3.3 地表覆蓋數(shù)據(jù)檢查
地理國(guó)情普查要素?cái)?shù)據(jù)地表覆蓋數(shù)據(jù)檢查的對(duì)象為矢量、柵格以及網(wǎng)格化的地表覆蓋數(shù)據(jù),對(duì)數(shù)據(jù)集屬性項(xiàng)定義是否符合要求、格式及拓?fù)潢P(guān)系是否一致、圖斑是否有細(xì)縫或重疊、位置相鄰CC碼是否一致等進(jìn)行檢查。圖5給出了地表覆蓋數(shù)據(jù)檢查中出現(xiàn)的問題,從圖5可以看出層內(nèi)拓?fù)潢P(guān)系地表覆蓋面折刺不符合規(guī)范要求,即出現(xiàn)小于規(guī)范限差的打折角(限差為5°),其解決問題方法是采用ArcGIS軟件的拓?fù)涔ぞ?如planarize lines工具)對(duì)不符合規(guī)范的打折角度進(jìn)行拓?fù)潢P(guān)系修改。
圖5 地表覆蓋數(shù)據(jù)結(jié)果情況
3.4普查元數(shù)據(jù)檢查
普查元數(shù)據(jù)檢查主要是對(duì)高程帶、坡度帶、行政區(qū)劃、水系參考資料及格網(wǎng)單元數(shù)據(jù)進(jìn)行分析,對(duì)文件結(jié)構(gòu)一致性、空間參考正確性、層內(nèi)拓?fù)潢P(guān)系、屬性項(xiàng)值域及其數(shù)據(jù)模型等進(jìn)行檢查分析。圖6給出了普查元數(shù)據(jù)檢查分析結(jié)果情況,由圖6可知檢查出的錯(cuò)誤為字段refFreshWater的長(zhǎng)度為64,根據(jù)《地理國(guó)情普查數(shù)據(jù)生產(chǎn)元數(shù)據(jù)規(guī)定》,有關(guān)水系參考資料元數(shù)據(jù)MRDW圖層中,字段refFreshWater的屬性長(zhǎng)度為10,與數(shù)據(jù)模型定義的字段不符,通過分析提出的修改方案為將錯(cuò)誤字段長(zhǎng)度修改為規(guī)范要求的字段長(zhǎng)度。
圖6 普查元數(shù)據(jù)檢查情況
3.5普查元數(shù)據(jù)檢查
遙感解譯樣本數(shù)據(jù)包括地面照片和遙感影像實(shí)例,遙感解譯樣本數(shù)據(jù)檢查主要檢查數(shù)據(jù)完整性(文件缺失及冗余檢查)、屬性正確性等進(jìn)行檢查。圖7為遙感解譯樣本數(shù)據(jù)檢查情況,從圖7可知解譯樣本數(shù)據(jù)存在遙感影像實(shí)例、地面照片格式及命名不正確、遙感影像實(shí)例裁切范圍不正確等錯(cuò)誤。其解決方案是按照生成的錯(cuò)誤列表相應(yīng)提示進(jìn)行修改,使其符合相關(guān)規(guī)范的要求。
圖7 遙感解譯樣本數(shù)據(jù)檢查情況
本文主要以河北省某縣地理國(guó)情普查入庫(kù)數(shù)據(jù)為例,系統(tǒng)介紹了地理國(guó)情普查數(shù)據(jù)入庫(kù)質(zhì)量檢查方法及流程,提出了基于“省級(jí)匯交目錄數(shù)據(jù)、地理國(guó)情普查要素?cái)?shù)據(jù)、地表覆蓋數(shù)據(jù)、普查元數(shù)據(jù)、遙感解譯樣本數(shù)據(jù)”五類屬性數(shù)據(jù)為基礎(chǔ)的入庫(kù)數(shù)據(jù)質(zhì)量檢查方法,并結(jié)合ArcGIS進(jìn)行實(shí)例進(jìn)行分析,提出了相應(yīng)的質(zhì)量修正方案。實(shí)例分析結(jié)果表明,經(jīng)過ArcGIS對(duì)5種屬性數(shù)據(jù)進(jìn)行拓?fù)浞治黾百|(zhì)檢后,能夠發(fā)現(xiàn)地理國(guó)情數(shù)據(jù)中存在的質(zhì)量問題,通過修正后能夠有效提高相關(guān)地理國(guó)情數(shù)據(jù)的質(zhì)量,確保地理國(guó)情普查成果順利進(jìn)行入庫(kù)。
[1] 國(guó)務(wù)院關(guān)于開展第一次全國(guó)地理國(guó)情普查的通知[N].遼寧省人民政府公報(bào),2013(8):25~26,38.
[2] 薛雪舟,劉利凱.地理國(guó)情普查質(zhì)量管理探討[J].測(cè)繪與空間地理信息,2014(12):205~207.
[3] 陳俊勇.關(guān)于地理國(guó)情普查的思考[J].地理空間信息, 2014(2):1~3,7.
[4] 地理國(guó)情普查成果質(zhì)檢軟件用戶手冊(cè)V1.0[R].國(guó)家測(cè)繪產(chǎn)品質(zhì)量檢驗(yàn)測(cè)試中心,2014.
[5] 楊海關(guān),邱云峰,李俊娟.地理國(guó)情普查質(zhì)量檢驗(yàn)軟件的功能設(shè)計(jì)[J].測(cè)繪與空間地理信息,2015(6):64~65.
[6] 劉敏.面向地理國(guó)情普查的地表覆蓋解譯技術(shù)與方法[D].阜新:遼寧工程技術(shù)大學(xué),2013.
[7] 程滔.地理國(guó)情普查樣本數(shù)據(jù)入庫(kù)質(zhì)量檢查方法研究[J].測(cè)繪通報(bào),2015(10):103~106.
[8] 賈佳.地理國(guó)情普查質(zhì)量監(jiān)督檢查驗(yàn)收方法[J].測(cè)繪與空間地理信息,2014(6):220~221.
[9] 馮存均,左石磊,詹遠(yuǎn)增.地理國(guó)情監(jiān)測(cè)工作機(jī)制探討[J].測(cè)繪科學(xué),2014(4):50~54.
[10] 汪斌.關(guān)于地理國(guó)情普查過程成果質(zhì)量控制的思考[J].測(cè)繪標(biāo)準(zhǔn)化,2015(1):8~9.
[11] 戴錫花.安徽省地理國(guó)情普查管理問題研究[D].合肥:安徽大學(xué),2014.
[12] ESRI,Redlands.ArcGIS desktop:release 10.Environmental Systems Research Institute,CA,2011.
Research on Related Problems of Quality Checking During Database Construction in Geographic National Conditions Investigation
Ma Mengran1,2,Hua Xianghong1,3,4,He Xiaoxing1,2,Shu Ying1,2,Gong Guodong1,2
(1.School of Geodesy and Geomatics,Wuhan University,Wuhan 430079,China;
2.Jiangxi Province Key Lab for Digital Land,Nanchang 330013,China; 3.Collaborative Innovation Center for Geospatial Technology,Wuhan 430079,China; 4.Hazard monitoring&prevention Research Center,Wuhan University,Wuhan 430079,China)
This paper took the geographic Census data of a county in Hebei Province for example,mainly discussed the data quality checking methods and technological process of Geographic National Conditions Investigation.Quality inspection method based on five kinds of property data checking were proposed,and examples carried out with ArcGIS,several plans have been proposed according to the particular problem.The results show that the proposed strategy based on five kinds of property data checking with ArcGIS can effectively improve the quality and reliability of Geographic National Conditions investigation,ensuring the smooth progress of data warehousing on Geographic National Conditions investigation.
geography census;data warehousing;methods and processes;quality inspection
1672-8262(2016)01-72-04
P208.1
A
?2015—12—17
馬夢(mèng)然(1991—),女,碩士研究生,主要研究方向:GNSS數(shù)據(jù)處理及精密工程測(cè)量。
國(guó)家自然科學(xué)基金項(xiàng)目資助(41174010,41374011,41574031);江西省數(shù)字國(guó)土重點(diǎn)實(shí)驗(yàn)室開放研究基金資助項(xiàng)目(DLLJ201605)。
1672-8262(2016)01-76-05
P208.2
A