邢 鵬
(二十一世紀(廣州)空間技術應用有限公司,廣州510640)
地理空間信息資源已成為城市經濟及社會發(fā)展中重要的基礎性、關鍵性戰(zhàn)略資源,為城市綜合管理、應急決策、公共服務等方面提供信息保障[1]。因此,地理空間信息資源共享服務平臺建設已成為政府信息化建設框架內的核心內容。國務院關于加強測繪工作的意見中已經要求各地構建權威、標準的基礎地理信息公共服務平臺,更好地滿足政府、企業(yè)以及人民生活等方面對基礎地理信息公共產品服務的需要。以衛(wèi)星遙感為代表的空間數據獲取技術,通過快速、精確、大范圍獲取地表信息及其變化特征,已經成為獲取地理空間信息的主要手段,并廣泛應用于自然資源調查監(jiān)測等多個領域,為政府公共事務管理和決策提供了不可或缺的信息支撐。
廣州作為重要的國家中心城市以及粵港澳大灣區(qū)核心門戶城市之一,城市化進程越來越快,對政務電子地圖更新頻率要求也越來越高。政務電子地圖是城市智能化、智慧化管理的基礎,隨著政務信息公開力度和公共服務能力的不斷提升,政府各職能部門對電子地圖的應用需求日益強烈。2019年自然資源部發(fā)布《城市政務電子地圖更新技術規(guī)范》[2],然而基于傳統(tǒng)測繪地理信息數據更新的電子地圖在政務服務過程中逐漸暴露出現勢性不強[3]、豐富性不足[4]、位置信息挖掘與處理難[5]、地圖要素信息挖掘與更新問題突出[6]等問題,政務電子地圖無法滿足政府部門規(guī)劃決策提供直接參考信息[7]。
為此,本文在分析了現有政務電子地圖更新工作存在的問題的基礎上,開展了廣州市政務電子地圖中水體、植被、道路、建筑物等核心要素快速更新的關鍵技術研究,攻克了多源遙感影像在輻射和幾何自動歸一化方面的難題,形成質量高、一致性強的多源影像底圖。研制精準提取和變化診斷技術,輔助政務電子地圖核心要素更新作業(yè),并基于置信度的理論與方法,研發(fā)了政務電子地圖核心要素更新軟件,形成人機協作的作業(yè)模式,提高廣州市政務電子地圖更新的效率和精準度。
電子地圖更新工作中數據獲取周期長與處理復雜的問題突出。主要原因:傳統(tǒng)的人工數據采集的速度無法滿足經濟發(fā)展帶來的基礎設施快速增長變更的速度和獲取的數據多源化;類型、時間差異較大導致數據的歸一化處理繁瑣、復雜[3]。
位置服務是電子地圖的核心,但是準確、全面的位置信息挖掘與處理難問題顯著,一方面,互聯網中的興趣點存在結構多樣化、類型繁雜、有效信息缺失等問題;另一方面,直接網絡獲取的興趣點信息包羅萬象不成體系,無法滿足政府應用對信息的需求;再者,網絡發(fā)布的興趣點數據是通過對坐標進行加密、偏移等操作后進行發(fā)布的,直接獲取的數據在空間位置精度上無法滿足需求[5]。
電子地圖更新工作中地圖要素信息挖掘與更新問題突出:一方面,面向政務電子地圖更新的核心要素信息自動化提取程度低,各類數據之間的融合、關聯、轉化難度極大;另一方面,政務電子地圖歷史要素信息的實時更新,暫無高效便捷的手段。政務電子地圖更新工作中缺乏相應的標準規(guī)范與常態(tài)化的面向區(qū)域應用模式:一方面,面向地圖更新的數據多樣,缺少相應的數據管理規(guī)范;另一方面,缺乏從數據獲取與處理、要素提取、提取結果后處理、歷史信息更新等全鏈條的政務電子地圖更新流程與規(guī)范體系;第三,沒有一個信息化更新系統(tǒng)有效地、全面地支撐政務電子地圖更新實施工作;最后,沒有形成一個常態(tài)化的快速更新模式[6]。
廣州市政務電子地圖核心要素更新模型的建立,包含了從數據獲取、數據處理至信息要素提取、變化檢測及信息修訂與自動更新的各個環(huán)節(jié),旨在及時開展數據檢查、處理和入庫等工作,實現政務電子地圖的動態(tài)更新??傮w技術路線如下。
3.2.1 依托自主運控衛(wèi)星開展多星協調觀測規(guī)劃研究 針對廣州市的地域和氣候特點,依托自主運控衛(wèi)星,通過動態(tài)效果模擬,制定了多星協調觀測規(guī)劃,實現了多顆衛(wèi)星最優(yōu)成像、多源衛(wèi)星任務統(tǒng)籌規(guī)劃以及數據自動優(yōu)選,解決了因遙感數據零散而無法大區(qū)域覆蓋的問題,同時也解決了遙感數據時間點差異大的問題,提升了政務電子地圖核心要素快速更新中衛(wèi)星遙感數據獲取的效率和質量。
3.2.2 面向多源衛(wèi)星遙感數據的歸一化處理流程技術體系的構建 遙感數據的歸一化處理技術體系是面向多源衛(wèi)星遙感數據的歸一化處理流程技術體系?;诙嘣?、多時相數據的輻射歸一化處理技術采用自適應調整策略、基于歸一化水體指數建立偽不變特征,形成多源多時相數據的自適應輻射歸一化處理;幾何歸一化處理重點解決大區(qū)域、多時相的幾何誤差問題,通過構建網格化,將大區(qū)域按照不變點分布特征,構建多尺度網格,采用分布式校正方法,實現大區(qū)域多時相幾何誤差校正,形成質量高、一致性強的多源影像底圖。
圖1 廣州電子地圖自動更新模型建設方案Fig.1 Construction scheme of Guangzhou electronic map automatic updating model
3.3.1 基于語義擴展的興趣點檢索與匹配算法的研究 興趣點信息是政務電子地圖的核心要素之一,政務電子地圖興趣點信息更新頻率低,為實現多信息獲取,利用語義擴展方法,建立自動檢索模型,并利用語義分析模型,進行時空信息抽取,形成摘錄篇章,并對摘錄篇章基于時、空短語模板時空詞抽取和標準,并對所有表達進行規(guī)范化處理,將高頻出現的詞語作為擴展結果。同時,對數據基于空間約束關系完成興趣點地址的標準化處理與地址匹配,并采用名稱、地址、空間位置多屬性加權的興趣點語義匹配,高精度地實現了對網絡興趣點數據增量的更新。一方面,解決了直接獲取的網絡興趣點存在信息缺失問題;另一方面解決了興趣點與地理空間位置的高精度匹配問題以及增量更新問題。
3.3.2 基于光譜特征和超像素分割方法的樣本純化技術的研究 政務電子地圖更新基于已有歷史數據展開,對形成可用樣本具有良好基礎,但政務電子地圖地塊信息多為多特征組合而成,無法直接形成深度學習樣本。針對這一問題,研究了基于光譜特征和超像素分割方法的樣本純化技術,該技術通過將本底矢量信息產品與高分辨率影像進行超像素分割和決策融合,然后基于不同地物的光譜特征構建決策分類特征體系,并結合本底矢量屬性對每個高分辨率遙感影像像素所屬的標簽進行屬性賦值,實現樣本的純化。
3.3.3 綜合自適應網絡深度學習模型和全局最優(yōu)閾值算法的研制 政務電子地圖核心要素中水體、植被、道路和建筑物,均可通過遙感影像進行自動識別。因此,本研究將深度學習技術和面向對象等多種自動化信息提取技術進行有機融合,實現要素精準提取。提出了基于自適應的閾值算法——全局最優(yōu)算法,分別建立各地物要素的特征集,構建特征優(yōu)選模型,建立一套基于空間對象語義特征的自動化地物提取方法,實現對水體、植被相關地物、道路的精準提?。会槍ㄖ锒鄻有?、陰影遮擋等問題,采用對象與像素結合方法,構建自適應網絡結構的深度學習模型,提取建筑物語義分割空間分布,結合近紅外波段對陰影的顯著性反饋,建立建筑物、陰影語義特征,分離建筑物與陰影,多技術融合,揚長避短,進一步提高了地類分類精度。
3.3.4 政務電子地圖變化單元軌跡分析研究 針對政務電子地圖中核心要素變化發(fā)現難以及生產工作量大的問題,構建了面向政務電子地圖核心要素歷史信息更新的工程化實現方案。針對信息的智能化提取結果,借助圖像分割技術,充分利用了已有空間信息成果,從地類地塊的變化特點出發(fā),以地塊為分析單元,通過構建均值、方差、標準差、最大差等統(tǒng)計特征集,建立地塊單元變化矩陣,通過聚類分析診斷變化,形成分析單元變化軌跡。該方法不受季相、傳感器類型、分辨率等條件限制,并解決了基于像元的變化檢測方法中“椒鹽”現象明顯、檢測結果破碎、后期處理復雜等問題,使檢測結果更加準確,后期處理簡單,便于直接對歷史空間信息進行更新。
3.4.1 基于多源信息的置信度輔助決策模型研究 結合POI 點、志愿者地理信息、“四標四實”等多源信息,建立置信度輔助決策模型,獲取高精度的空間地理信息數據。模型中主要是將網絡爬取的POI點、“四標四實”、志愿者地理信息、電子地圖核心要素更新結果建立分層分析模型,形成評價系數,該系數的大小是衡量該要素的正確性,通過多層次灰色聚類模型,形成每個興趣點的置信度,該置信度的大小是衡量圖斑的準確程度,值越大,準確性越高,輔助后續(xù)人工決策。
3.4.2 基于分離閾值的變化圖斑置信度的算法研究 基于影像提取變化圖斑,其特征分布具有隨機性特點,為了保證廣州市政務電子地圖快速更新中人工識別精度以及提高工作效率,利用變化圖斑的分布特征,構建分離閾值算法,估計變化圖斑置信度,指導人工作業(yè)。首先將變化軌跡進行分離,確定20 種類型變化是存在的,另外5 種變化是不存在的。例如:建筑物變?yōu)楦?。再根?0 種變化軌跡的特征分布,建立光譜、形狀、紋理等多維特征集,通過分離閾值算法,確定決定性特征,進而統(tǒng)計該特征區(qū)間,建立區(qū)間估計模型,形成變化圖斑置信度,加入自動化結果中,進而指導人工作業(yè),提高成圖的精準度。
3.4.3 政務電子地圖要素樣本庫和解譯知識庫的構建 覆蓋全業(yè)務流程的政務電子地圖核心要素快速更新空間信息軟件平臺,結合形態(tài)學等方法形成了邊界優(yōu)化、信息產品標準化處理、質量檢查、質量評價等工具,為實現自動化要素識別,采用了樣本技術,構建了標準化樣本生產規(guī)范、樣本管理規(guī)范、樣本更新準則和策略,構建廣州市政務電子地圖核心要素快速更新樣本庫。平臺功能主要包括政務電子地圖核心要素大數據融合與管理;政務電子地圖核心要更新的信息提取、更新模型和算法,并具備完善后處理分析工具及地圖要素數據的空間展示與分析功能。通過構建多種標準化的規(guī)范,將技術體系進行銜接與組合,形成一種人機協作的工藝流程,更是引入置信度技術,指導人工作業(yè),建立反饋機制,形成閉環(huán)式人機協作作業(yè)模式。
結合廣州城市功能區(qū)特點,按照不同的城市化程度選取建成區(qū)、城鄉(xiāng)結合部以及郊區(qū)相應的示范區(qū)域。依據政務電子地圖數據更新的整體技術流程,要素信息提取、變化檢測等各個環(huán)節(jié)均已將不同區(qū)域的特點納入考慮,尤其是面對不同區(qū)域的建筑物分布特點,都具有較好的適用性與遷移性。同時,考慮到重要目標是發(fā)現變化要素,因此技術流程中也盡量保證減少漏提。利用相關手段對更新的地圖要素進行精度評價與效果評估,旨在服務于后續(xù)的推廣應用工作。
按照廣州城市化程度的不同,分別選取建成區(qū)、城鄉(xiāng)結合部以及郊區(qū)為示范區(qū)域,基于研究成果開展示范應用。各示范分區(qū)的定義與描述如下:
建成區(qū):城市行政區(qū)內實際已成片開發(fā)建設、市政公用設施和公共設施基本具備的地區(qū),城市化進程較高,道路、建筑物等地圖要素更新較快,選取建成區(qū)的典型區(qū)域作為示范區(qū)域。
城鄉(xiāng)結合部:隨著城市化過程,城市不斷向外圍擴展,使得毗鄰鄉(xiāng)村地區(qū)的土地利用從農業(yè)轉變?yōu)楣I(yè)、商業(yè)、居住區(qū)以及其他職能,并相應興建了城市服務設施,地圖要素變化程度處于建成區(qū)與郊區(qū)之間,選取城鄉(xiāng)結合部典型區(qū)域作為示范區(qū)域。
郊區(qū):通常是商業(yè)區(qū)較少,而以住宅為主,或者有相當程度農業(yè)活動但屬于都市行政轄區(qū)的地區(qū)地,地圖要素變化相對較少,選取郊區(qū)的典型區(qū)域作為示范區(qū)域。
在現有自動化的信息提取、變化檢測技術流程中,已將不同示范區(qū)地理要素的分布特點納入了考慮范圍。對電子地圖要素中的水體、植被、道路、建筑物等要素而言,差異最大之處即在于建筑物的外形與分布,以及由此帶來的陰影等問題。
根據表1的分析可知,對于建成區(qū)、城鄉(xiāng)結合部、郊區(qū)的各要素特點而言,主要差異體現在建筑物方面,特別是建成區(qū)內高層建筑物陰影帶來的水體錯提等問題,需要在后處理中予以關注。但就水體、植被、道路、建筑物本身的提取方法而言,在不同區(qū)域均具有較強的適用性與遷移性。這樣也避免了用戶在實際示范應用過程中,選擇不同規(guī)則集帶來的不便。
與整體的精度評價相類似,為了更準確地評價技術流程在建成區(qū)、城鄉(xiāng)結合部及郊區(qū)的適用效果,在這三處區(qū)域內均生成隨機點,通過人工目視判定的方式,對完成后處理的現狀結果與變化檢測結果分別開展精度評價?;诰仍u價的結果,可以定量化分析技術流程的適用性與遷移性。
表2 建成區(qū)現狀要素信息提取結果的精度評價Tab.2 Accuracy evaluation of information extraction results of current elements in built-up areas
對建成區(qū)內完成后處理的現狀提取結果進行了精度評價,總體精度可以達到85%以上,其中水體的用戶精度與生產者精度均可以達到75%以上。這一結果也表明,對于建成區(qū)內高層建筑物陰影帶來的水體錯提,在分類結果后處理過程中,通過要素之間的鄰近度等上下文關系進行剔除是行之有效的,可以滿足建成區(qū)內水體提取的要求。
表3 城鄉(xiāng)結合部現狀要素信息提取結果的精度評價Tab.3 Accuracy evaluation of information extraction results of status factors in urban-rural fringe
對于城鄉(xiāng)結合部內完成后處理的現狀提取結果,既存在建成區(qū)的要素分布特點,也有郊區(qū)要素的特點,整體提取精度依然可以達到85%以上,總體精度數值略低于建成區(qū),也是為了保證減少漏提所致。郊區(qū)現狀要素的提取結果,其整體精度也相對較高,表明了技術流程較強的適用性。
表4 郊區(qū)現狀要素信息提取結果的精度評價Tab.4 Accuracy evaluation of information extraction results of status quo elements in suburbs
在對現狀要素提取結果進行精度評價的基礎上,可以開展變化檢測成果的評價分析。而變化檢測的精度主要取決于兩方面因素:一是基于后時相影像進行信息提取的精度;二是后時相分類結果容錯過程中的精度。變化檢測結果的判定也包含兩個層面的內容:未變化圖斑是否判斷正確;在已變化圖斑中,變化類型是否判斷正確。
如表5所示,在建成區(qū)范圍內,變化檢測的正確率為83%;變化圖斑的發(fā)現率(能夠檢測到的確已發(fā)生變化的圖斑),可以達到77%以上,即(25%+3%)/(25%+3%+8%),為后續(xù)的人工干預減少了大量工作。對于建成區(qū)的地物分布特點而言,硬化地表占比較高,自動提取算法會將這類地物識別為建筑物,保證了盡可能多地發(fā)現新增建筑,但也會導致后續(xù)流程將部分未變化圖斑識別為變化結果。另一方面,部分高層建筑物的陰影會在初步提取中被識別為水體,在后處理過程中會將這一類對象修正為其他地類,有效減少了水體錯提,但陰影遮擋下地物的真實光譜信息會被抑制,影響了變化檢測的準確性,這都是在信息提取與變化檢測中需要注意的問題。
表5 建成區(qū)變化檢測結果的精度評價Tab.5 Accuracy evaluation of change detection results in built-up areas
如表6所示,在城鄉(xiāng)結合部范圍內,變化檢測的正確率為81%;變化圖斑的發(fā)現率(能夠檢測到的確已發(fā)生變化的圖斑),可以達到88%的高值,即(25%+5%)/(25%+5%+4%)。
表6 城鄉(xiāng)結合部變化檢測結果的精度評價Tab.6 Accuracy evaluation of change detection results in urban-rural fringe
如表7所示,在郊區(qū)范圍內,變化檢測的正確率為84%;變化圖斑的發(fā)現率(能夠檢測到的確已發(fā)生變化的圖斑),可以達到80%以上,即(22%+3%)/(22%+3%+6%)。郊區(qū)的地物分布特點是農村居民點建筑物密集,耕地、水塘等占據主要面積,硬化地表出現較少。
表7 郊區(qū)變化檢測結果的精度評價Tab.7 Accuracy evaluation of suburban change detection results
本文針對廣州市政務電子地圖更新中存在的問題,開展了廣州市政務電子地圖核心要素快速更新的關鍵技術研究,具體包括:(1)構建任務協同規(guī)劃、基于水體指數、偽不變特征點的歸一化模型,形成質量高、一致性強的多源影像底圖;(2)提出語義擴展的關鍵詞檢索算法,研發(fā)一種基于超像素分割及決策融合的樣本純化技術,綜合自適應網絡深度學習模型和全局最優(yōu)閾值算法,實現政務電子地圖核心要素精準提取,結合歷史電子地圖信息,建立變化分析單元與軌跡,輔助政務電子地圖核心要素更新作業(yè);(3)結合POI點、志愿者地理信息、“四標四實”等多源信息,建立置信度輔助決策模型,指導人工作業(yè),提高成圖的精準度,構建政務電子地圖要素樣本庫和解譯知識庫,研發(fā)基于本底庫的遙感影像變化檢測軟件,實現政務電子地圖核心要素快速更新的人機協作作業(yè)模式。
通過廣州市政務電子地圖核心要素快速更新的關鍵技術的研究,將廣州市政務電子地圖核心要素更新項目的實施工作量縮減90%以上,整體提高工作效率50%以上,實施成本減少近80%,有效提升了廣州市政務電子地圖核心要素更新的技術和工作效率。