• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      多源地名地址數(shù)據(jù)融合更新技術(shù)方法研究

      2020-07-27 10:53:04馬春林
      經(jīng)緯天地 2020年2期
      關(guān)鍵詞:現(xiàn)勢(shì)數(shù)據(jù)源時(shí)空

      馬春林

      (新疆維吾爾自治區(qū)測(cè)繪成果中心,新疆 烏魯木齊 830002)

      0.引言

      地名地址是最常用的社會(huì)公共信息之一,在測(cè)繪、規(guī)劃、交通、郵政、電力、民生等各個(gè)領(lǐng)域扮演著不可或缺的重要角色,是現(xiàn)代社會(huì)進(jìn)行各種聯(lián)系、交流必不可少的基本工具和紐帶。通過(guò)融合多源地名地址數(shù)據(jù),構(gòu)建權(quán)威、標(biāo)準(zhǔn)化地名地址時(shí)空數(shù)據(jù),作為行業(yè)專題數(shù)據(jù)上圖的“粘合劑”,實(shí)現(xiàn)行業(yè)、社會(huì)經(jīng)濟(jì)信息與地理空間關(guān)聯(lián)的媒介和橋梁。

      建設(shè)標(biāo)準(zhǔn)化、質(zhì)量好的地名地址數(shù)據(jù),是充分發(fā)揮基礎(chǔ)地理空間數(shù)據(jù)應(yīng)用服務(wù)能力的前提與保障。為構(gòu)建新疆基礎(chǔ)地理信息時(shí)空云平臺(tái)應(yīng)用體系,提升政府治理能力和公共服務(wù)水平,促進(jìn)大數(shù)據(jù)的深化應(yīng)用和快速發(fā)展,地名地址數(shù)據(jù)融合更新是一項(xiàng)重要的基礎(chǔ)性工作。

      1.工作目標(biāo)

      以“精度高、現(xiàn)勢(shì)性好、表達(dá)豐富”為前提和目標(biāo),通過(guò)高效采集、有效融合新疆各級(jí)基礎(chǔ)地理信息數(shù)據(jù),匯聚各類與地名地址相關(guān)的信息,推進(jìn)多源異構(gòu)地名地址數(shù)據(jù)的融合、集成、服務(wù),實(shí)現(xiàn)地名地址數(shù)據(jù)資源的統(tǒng)一管理,做到“統(tǒng)籌規(guī)劃、整體設(shè)計(jì)、逐步實(shí)施”,規(guī)范有序地開(kāi)展新疆維吾爾自治區(qū)地名地址時(shí)空數(shù)據(jù)融合更新工作。

      充分利用已掌握基礎(chǔ)資料情況,將地名數(shù)據(jù)和地址數(shù)據(jù)進(jìn)行數(shù)據(jù)融合、數(shù)據(jù)預(yù)處理、數(shù)據(jù)判重及去重、地名地址標(biāo)準(zhǔn)化、實(shí)體匹配等一系列處理,實(shí)現(xiàn)地名地址數(shù)據(jù)的融合更新。通過(guò)標(biāo)準(zhǔn)化地名地址時(shí)空數(shù)據(jù)融合,解決因行政村邊界、宗地所有權(quán)數(shù)據(jù)、天地圖等各種數(shù)據(jù)來(lái)源不一、精度不同、標(biāo)準(zhǔn)各異、同物不同數(shù)、時(shí)空參考不一、邊界矛盾沖突、現(xiàn)勢(shì)性不統(tǒng)一等問(wèn)題,避免因數(shù)據(jù)源質(zhì)量不好的問(wèn)題影響基礎(chǔ)地理信息時(shí)空云平臺(tái)的數(shù)據(jù)應(yīng)用與服務(wù)。

      2.總體原則

      地名地址數(shù)據(jù)來(lái)源多樣,因而存在標(biāo)準(zhǔn)不統(tǒng)一、現(xiàn)勢(shì)差異性大、數(shù)據(jù)組織不相同等問(wèn)題,不能直接滿足客戶地理編碼服務(wù)業(yè)務(wù)的需求。為此要建立標(biāo)準(zhǔn)化、規(guī)范化及通用化的地名地址數(shù)據(jù)處理流程,實(shí)現(xiàn)標(biāo)準(zhǔn)化地名地址時(shí)空數(shù)據(jù)生產(chǎn),保證數(shù)據(jù)成果質(zhì)量,為地理編碼服務(wù)等業(yè)務(wù)需求提供數(shù)據(jù)保障。地名地址數(shù)據(jù)處理總體要求如下:

      (1)數(shù)據(jù)現(xiàn)勢(shì)性要求:不同來(lái)源的融合數(shù)據(jù)現(xiàn)勢(shì)性不一致時(shí),以現(xiàn)勢(shì)性高的數(shù)據(jù)為準(zhǔn)。

      (2)空間參考要求:融合后數(shù)據(jù)統(tǒng)一采用2000國(guó)家大地坐標(biāo)系,坐標(biāo)系單位為度,保留9位小數(shù)(0.000000001度)。高程基準(zhǔn):采用1985國(guó)家高程基準(zhǔn),高程系統(tǒng)為正常高;高程坐標(biāo)單位為“米”。

      (3)平面位置精度要求:不同來(lái)源的融合數(shù)據(jù)平面位置精度不一致時(shí),以精度高的數(shù)據(jù)為準(zhǔn)。

      (4)屬性取值要求:不同數(shù)據(jù)源中同一地物要素的相同屬性項(xiàng)取值不一致時(shí),依據(jù)現(xiàn)勢(shì)性、準(zhǔn)確性等進(jìn)行一致性處理。

      (5)空間關(guān)系與邏輯一致性要求:融合后的成果數(shù)據(jù)要素空間關(guān)系正確,各類信息邏輯一致。

      (6)數(shù)據(jù)內(nèi)容要求:融合處理后的數(shù)據(jù),數(shù)據(jù)格式、空間參考、屬性結(jié)構(gòu)及屬性取值應(yīng)滿足標(biāo)準(zhǔn)規(guī)范要求。

      3.數(shù)據(jù)收集與分析

      開(kāi)展全疆區(qū)域內(nèi)地名地址相關(guān)的數(shù)據(jù)分析工作,在了解數(shù)據(jù)來(lái)源、權(quán)威性、數(shù)據(jù)格式、空間參考、標(biāo)準(zhǔn)規(guī)范的基礎(chǔ)上,分析數(shù)據(jù)量與數(shù)據(jù)質(zhì)量等;并整理數(shù)據(jù)結(jié)構(gòu),根據(jù)數(shù)據(jù)分析結(jié)果制定融合優(yōu)先級(jí)。具體數(shù)據(jù)源為全疆區(qū)域內(nèi)的天地圖地名地址與POI數(shù)據(jù)、基礎(chǔ)性地理國(guó)情監(jiān)測(cè)行政村數(shù)據(jù)。

      (1)天地圖地名數(shù)據(jù):天地圖數(shù)據(jù)中主要采用地名地址與POI中的地名數(shù)據(jù),數(shù)據(jù)現(xiàn)勢(shì)性為2018年春季。有著現(xiàn)勢(shì)性好、豐富度高、更新頻率快等優(yōu)點(diǎn),將作為本次地名數(shù)據(jù)融合的主要數(shù)據(jù)來(lái)源。

      (2)基礎(chǔ)性地理國(guó)情監(jiān)測(cè)地名地址數(shù)據(jù):基礎(chǔ)性地理國(guó)情監(jiān)測(cè)數(shù)據(jù)中主要采用行政村數(shù)據(jù),數(shù)據(jù)現(xiàn)勢(shì)性為2017年。國(guó)情監(jiān)測(cè)數(shù)據(jù)有著位置精度高、更新頻率高等優(yōu)點(diǎn),可作為地名數(shù)據(jù)補(bǔ)充數(shù)據(jù)源。

      圖1 數(shù)據(jù)融合技術(shù)流程圖

      地名數(shù)據(jù)生產(chǎn)流程主要包括數(shù)據(jù)預(yù)處理、數(shù)據(jù)融合及數(shù)據(jù)質(zhì)檢三部分。其中數(shù)據(jù)預(yù)處理包括數(shù)據(jù)轉(zhuǎn)換和模型轉(zhuǎn)換。數(shù)據(jù)融合包括圖形屬性融合、屬性標(biāo)準(zhǔn)

      (3)已有的地址數(shù)據(jù)及相關(guān)資料主要為天地圖中的地址數(shù)據(jù),數(shù)據(jù)現(xiàn)勢(shì)性為2018年春季。有著現(xiàn)勢(shì)性好、豐富度高、更新頻度快等優(yōu)點(diǎn),將作為本次地址數(shù)據(jù)融合的主要數(shù)據(jù)來(lái)源。

      4.技術(shù)方法

      依據(jù)新疆基礎(chǔ)地理信息時(shí)空云平臺(tái)的建設(shè)要求,在現(xiàn)有地名地址數(shù)據(jù)的基礎(chǔ)上,遵循地名地址相關(guān)數(shù)據(jù)標(biāo)準(zhǔn),形成地名地址數(shù)據(jù)融合技術(shù)流程,主要包括數(shù)據(jù)預(yù)處理、數(shù)據(jù)融合、判重處理、去重處理、實(shí)體匹配、標(biāo)準(zhǔn)化及質(zhì)檢等環(huán)節(jié),融合流程(如圖1所示):

      4.1 地名數(shù)據(jù)技術(shù)路線

      以基礎(chǔ)性地理國(guó)情監(jiān)測(cè)行政村數(shù)據(jù)以及天地圖地名數(shù)據(jù)為基礎(chǔ),經(jīng)過(guò)數(shù)據(jù)預(yù)處理、數(shù)據(jù)融合和數(shù)據(jù)質(zhì)檢,形成標(biāo)準(zhǔn)化地名時(shí)空數(shù)據(jù)。技術(shù)路線(如圖2所示):化、數(shù)據(jù)判重去重、外業(yè)核查、內(nèi)業(yè)整理、數(shù)據(jù)編碼。該階段將數(shù)據(jù)源融合為一套標(biāo)準(zhǔn)的地名數(shù)據(jù)。

      圖2 地名數(shù)據(jù)技術(shù)路線

      4.1.1 數(shù)據(jù)預(yù)處理

      數(shù)據(jù)預(yù)處理是將原始數(shù)據(jù)經(jīng)過(guò)數(shù)據(jù)轉(zhuǎn)換和模型轉(zhuǎn)換,形成標(biāo)準(zhǔn)地名屬性結(jié)構(gòu)數(shù)據(jù),為數(shù)據(jù)融合做好準(zhǔn)備。

      (1)數(shù)據(jù)轉(zhuǎn)換

      數(shù)據(jù)轉(zhuǎn)換包括格式轉(zhuǎn)換和坐標(biāo)轉(zhuǎn)換。將數(shù)據(jù)格式轉(zhuǎn)換為DB格式,坐標(biāo)轉(zhuǎn)換為CGCS2000國(guó)家大地坐標(biāo)系。

      (2)模型轉(zhuǎn)換

      根據(jù)新疆基礎(chǔ)地理信息時(shí)空云平臺(tái)地名數(shù)據(jù)標(biāo)準(zhǔn)中的屬性項(xiàng)定義與說(shuō)明,建立統(tǒng)一的地名數(shù)據(jù)屬性存儲(chǔ)結(jié)構(gòu)。分析原始數(shù)據(jù)分類體系與新疆基礎(chǔ)地理信息時(shí)空云平臺(tái)地名數(shù)據(jù)分類體系的關(guān)系,進(jìn)行模型轉(zhuǎn)換,形成按照地名屬性結(jié)構(gòu)標(biāo)準(zhǔn)的地名數(shù)據(jù)。

      4.1.2 數(shù)據(jù)融合

      數(shù)據(jù)融合包括圖形屬性融合、屬性標(biāo)準(zhǔn)化、數(shù)據(jù)判重去重、外業(yè)核查、內(nèi)業(yè)整理、數(shù)據(jù)編碼三個(gè)部分,為數(shù)據(jù)生產(chǎn)的主要工作,形成融合后的地名數(shù)據(jù)。

      (1)融合原則

      數(shù)據(jù)融合處理的總體原則為現(xiàn)勢(shì)性原則、精度原則、精細(xì)度原則、拓?fù)湟恢滦栽瓌t、屬性處理原則、豐富性原則。多個(gè)原則共同出現(xiàn)時(shí),現(xiàn)勢(shì)性優(yōu)先級(jí)最高,精度和精細(xì)度次之,其他原則輔助。

      其中,行政村地名點(diǎn)位置以國(guó)情行政村數(shù)據(jù)為準(zhǔn)。

      (2)圖形屬性融合

      將不同來(lái)源的數(shù)據(jù)進(jìn)行圖形數(shù)據(jù)融合,將同名數(shù)據(jù)進(jìn)行比對(duì),保留唯一精確的數(shù)據(jù)。如果數(shù)據(jù)屬性出現(xiàn)矛盾,參照屬性填寫(xiě)要求,保留更規(guī)范的屬性。

      同一要素對(duì)象的屬性融合,宜以現(xiàn)勢(shì)性高、準(zhǔn)確性高的數(shù)據(jù)為準(zhǔn)進(jìn)行屬性賦值或補(bǔ)全。具體要素位置需參考地名數(shù)據(jù)的選取指標(biāo)與采集要求。

      (3)屬性標(biāo)準(zhǔn)化

      根據(jù)地名屬性定義與說(shuō)明中的填寫(xiě)要求,對(duì)融合后的屬性內(nèi)容進(jìn)行標(biāo)準(zhǔn)化處理。其中,地名:名稱參考地名填寫(xiě)規(guī)范要求進(jìn)行標(biāo)準(zhǔn)化;PAC碼:根據(jù)融合結(jié)果提取行政地名數(shù)據(jù),參考民政名錄中行政區(qū)劃的權(quán)屬關(guān)系,需建立地名數(shù)據(jù)中行政村與自然村的權(quán)屬關(guān)系,進(jìn)行PAC碼賦值。

      (4)數(shù)據(jù)判重、去重

      將融合后的地名點(diǎn)分別進(jìn)行數(shù)據(jù)判重、去重,使數(shù)據(jù)唯一,保留位置精確數(shù)據(jù)、屬性規(guī)范的數(shù)據(jù)。地名點(diǎn)根據(jù)要素間的距離、名稱、簡(jiǎn)稱、類別名稱、地址、電話等屬性信息識(shí)別重復(fù)對(duì)象,并進(jìn)行去重。判重原則:一定距離范圍內(nèi)類型相同,名稱、地址的相似度大于設(shè)定閾值;一定距離范圍內(nèi)類型相同,名稱、簡(jiǎn)稱、電話相似度大于設(shè)定閾值。

      (5)數(shù)據(jù)編碼

      數(shù)據(jù)編碼字段包括要素唯一標(biāo)識(shí)、地名編碼。兩者均唯一標(biāo)識(shí)要素且通過(guò)連接關(guān)系實(shí)現(xiàn)一一對(duì)應(yīng)。要素唯一標(biāo)識(shí)在入庫(kù)時(shí)批量賦值。地名編碼由3部分共20位數(shù)字組成。前9位為數(shù)據(jù)位置所在的鄉(xiāng)鎮(zhèn)/街道辦代碼,中間6位為地名類別代碼,后8位為順序碼,取值范圍為00000000-99999999,根據(jù)類別代碼排序自動(dòng)進(jìn)行生成。

      4.1.3 數(shù)據(jù)質(zhì)檢

      數(shù)據(jù)質(zhì)檢主要對(duì)融合后數(shù)據(jù)進(jìn)行質(zhì)量檢查,主要包括基本要求、完整性檢查、圖形檢查、屬性檢查和邏輯一致性檢查。具體主要有數(shù)學(xué)基礎(chǔ)、數(shù)據(jù)格式及數(shù)據(jù)文件完整性及有效性的檢查;數(shù)據(jù)位置精度及拓?fù)潢P(guān)系的檢查;屬性正確性、屬性分類、屬性精度檢查;圖形屬性一致性及圖層屬性一致性檢查等。

      4.1.4 數(shù)據(jù)反饋

      形成標(biāo)準(zhǔn)化地名數(shù)據(jù)后,將融合后的全疆標(biāo)準(zhǔn)地名數(shù)據(jù)反饋數(shù)據(jù)提供單位。

      通過(guò)標(biāo)準(zhǔn)地名數(shù)據(jù)中的數(shù)據(jù)來(lái)源、數(shù)據(jù)來(lái)源標(biāo)識(shí)碼與數(shù)據(jù)源中的實(shí)體編碼字段的對(duì)應(yīng)關(guān)系,實(shí)現(xiàn)原始數(shù)據(jù)與地名成果數(shù)據(jù)的一一對(duì)應(yīng)關(guān)系,數(shù)據(jù)提供單位可更新原始數(shù)據(jù),并根據(jù)自身業(yè)務(wù)情況進(jìn)行數(shù)據(jù)的豐富完善。

      4.1.5 數(shù)據(jù)更新與維護(hù)

      地名數(shù)據(jù)的更新主要包括匯交更新和反饋更新兩種方式。匯交更新通過(guò)數(shù)據(jù)提供單位提供新版全量數(shù)據(jù),項(xiàng)目組對(duì)比兩版數(shù)據(jù)的差異,將變化內(nèi)容進(jìn)行數(shù)據(jù)更新、數(shù)據(jù)質(zhì)檢,形成更新后的地名數(shù)據(jù)。反饋更新通過(guò)數(shù)據(jù)提供變化的增量數(shù)據(jù),直接通過(guò)數(shù)據(jù)來(lái)源和數(shù)據(jù)來(lái)源標(biāo)識(shí)碼進(jìn)行數(shù)據(jù)更新和質(zhì)檢,形成更新后的地名數(shù)據(jù)。

      4.2 地址數(shù)據(jù)技術(shù)路線

      地址數(shù)據(jù)融合技術(shù)流程主要包括數(shù)據(jù)預(yù)處理、判重處理、去重處理、實(shí)體匹配、標(biāo)準(zhǔn)化及質(zhì)檢等環(huán)節(jié),融合流程(如圖3所示):

      圖3 地址數(shù)據(jù)技術(shù)路線

      4.2.1 數(shù)據(jù)預(yù)處理

      將多源數(shù)據(jù)融合為統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)。在融合過(guò)程中根據(jù)源數(shù)據(jù)屬性結(jié)構(gòu)與標(biāo)準(zhǔn)地址數(shù)據(jù)屬性結(jié)構(gòu)之間的映射關(guān)系,將源數(shù)據(jù)的屬性值轉(zhuǎn)換到標(biāo)準(zhǔn)地址數(shù)據(jù)的字段中,同時(shí)保留可用的輔助字段,刪除無(wú)用字段。

      4.2.2 判重處理

      由于地址數(shù)據(jù)來(lái)源較雜,地址描述標(biāo)準(zhǔn)不一,數(shù)據(jù)精度不一,在同一數(shù)據(jù)源內(nèi)部或者不同數(shù)據(jù)源之間都存在地址點(diǎn)重復(fù)的情況,為提高地址匹配精度,需對(duì)地址點(diǎn)進(jìn)行重復(fù)點(diǎn)檢測(cè)和去重。即在一定范圍內(nèi)比對(duì)地址數(shù)據(jù)的地址字段及其他輔助字段,計(jì)算相似度,相似度越高,重復(fù)幾率越大。然后對(duì)判重結(jié)果進(jìn)行審核,分析輸出相似度閾值,標(biāo)識(shí)出實(shí)際的重復(fù)點(diǎn)。

      4.2.3 去重處理

      根據(jù)判重結(jié)果,結(jié)合數(shù)據(jù)源的精度、現(xiàn)勢(shì)性、邏輯一致性,疊加天地圖河流、道路、居民地等數(shù)據(jù)作為輔助信息,對(duì)重復(fù)點(diǎn)做去重處理。

      4.2.4 數(shù)據(jù)標(biāo)準(zhǔn)化處理

      數(shù)據(jù)標(biāo)準(zhǔn)化主要是指對(duì)地址數(shù)據(jù)的屬性字段做標(biāo)準(zhǔn)化處理。將地址字段內(nèi)容轉(zhuǎn)換為結(jié)構(gòu)化地址描述。同步將地址內(nèi)容拆分到省、市、區(qū)縣、鄉(xiāng)鎮(zhèn)/街道辦、行政村委會(huì)/社區(qū)居委會(huì)、片區(qū)、街巷、一級(jí)門樓址、自然村/居民小區(qū)、門樓址/標(biāo)志物、二級(jí)門樓址、單元、樓層、室等字段中。最后為地址編碼字段賦值。

      4.2.5 數(shù)據(jù)質(zhì)檢、反饋、維護(hù)與更新

      地址數(shù)據(jù)的質(zhì)檢、反饋、維護(hù)與更新與地名數(shù)據(jù)基本一致。其中,質(zhì)檢除一般檢查項(xiàng)外還增加了拓?fù)湟恢滦詸z查;而反饋同樣是通過(guò)編碼字段的對(duì)應(yīng)關(guān)系,實(shí)現(xiàn)原始數(shù)據(jù)與地址成果數(shù)據(jù)的一一對(duì)應(yīng)關(guān)系;地址數(shù)據(jù)的更新同樣包括匯交更新和反饋更新兩種方式,具體與地名數(shù)據(jù)一致,這里不再贅述。

      5.結(jié)束語(yǔ)

      以國(guó)家相關(guān)技術(shù)規(guī)范為依據(jù),結(jié)合新疆基礎(chǔ)地理信息時(shí)空云平臺(tái)建設(shè)要求與新疆?dāng)?shù)據(jù)建設(shè)的現(xiàn)狀,按照“統(tǒng)籌規(guī)劃、頂層設(shè)計(jì)、逐步完善”的工作要求和“統(tǒng)一標(biāo)準(zhǔn)、規(guī)范流程”的技術(shù)要求,制定一套地名地址數(shù)據(jù)融合與更新技術(shù)方法,用來(lái)指導(dǎo)新疆基礎(chǔ)地理信息時(shí)空云平臺(tái)數(shù)據(jù)資源體系中地名地址數(shù)據(jù)的建設(shè),進(jìn)而有效地促進(jìn)了時(shí)空大數(shù)據(jù)的深化應(yīng)用和快速發(fā)展。

      猜你喜歡
      現(xiàn)勢(shì)數(shù)據(jù)源時(shí)空
      跨越時(shí)空的相遇
      基于多源數(shù)據(jù)廈漳泉片區(qū)DLG全要素更新
      鏡中的時(shí)空穿梭
      地籍冊(cè)建設(shè)和應(yīng)用的探索
      上海房地(2020年1期)2020-02-12 09:03:48
      玩一次時(shí)空大“穿越”
      Web 大數(shù)據(jù)系統(tǒng)數(shù)據(jù)源選擇*
      基于不同網(wǎng)絡(luò)數(shù)據(jù)源的期刊評(píng)價(jià)研究
      時(shí)空之門
      第二次全國(guó)土地調(diào)查成果現(xiàn)勢(shì)性評(píng)估方法
      基于真值發(fā)現(xiàn)的沖突數(shù)據(jù)源質(zhì)量評(píng)價(jià)算法
      长兴县| 绍兴县| 甘谷县| 高碑店市| 喜德县| 南召县| 奉化市| 连江县| 克拉玛依市| 百色市| 鄄城县| 奉贤区| 长葛市| 新宾| 大姚县| 天门市| 利辛县| 宁明县| 玉门市| 双流县| 临泉县| 莲花县| 扎囊县| 札达县| 邓州市| 呈贡县| 淅川县| 曲靖市| 莱州市| 宣城市| 新龙县| 郎溪县| 常德市| 广丰县| 漠河县| 海淀区| 宜兰县| 营口市| 张掖市| 乌什县| 杭锦旗|