鄧凱 朱世泉 王浩 岳梓晨 鄧虎
摘要:紙質(zhì)地形圖在掃描過程中,由于掃描儀器操作或紙質(zhì)地形圖質(zhì)量問題,會出現(xiàn)底紋、色彩失真及孔洞、斷點等噪聲。為避免這些噪聲干擾掃描地形圖等高線的自動矢量化,利用Photoshop對掃描后的電子地形圖進行降噪處理,得到光滑連續(xù)的等高線柵格圖,繼而使用ArcMap的ArcScan工具自動提取等高線,最后,從等高線質(zhì)量和處理效率角度出發(fā),對提出的方法與手動提取以及未經(jīng)過降噪處理的自動提取技術(shù)方案進行對比分析。結(jié)果表明:該方法不僅能夠保證等高線的數(shù)據(jù)質(zhì)量,作業(yè)效率也有顯著提升。
關(guān)鍵詞:地形圖,等高線,矢量化,Photoshop軟件,ArcMap軟件
中圖分類號:P208?文獻標志碼:A?文章編號:2095-5383(2020)01-0005-08
Abstract:In the process of scanning paper topographic maps,due to the operation of scanners or the quality problems of paper topographic maps,there will be background lines,color distortion,holes,breakpoints and other noises.?In order to avoid these noises from interfering with the automatic vectorization of contour lines during scanning the topographic maps,a smooth and continuous contour grid was obtained by using Photoshop to reduce the noise of scanned electronic topographic maps,and then contour lines were automatically extracted by ArcMaps ArcScan tool.?Finally,from the point of view of contour quality and processing efficiency,the contour lines were processed.?The method proposed in this paper was compared with manual extraction and automatic extraction without de-noising.?The results show that this method can not only ensure the data quality of contour lines,but also significantly improve the efficiency of operation.
Keywords:topographic map,contour line,vectorization,Photoshop,ArcMap
等高線是能夠正確表示地貌形態(tài)的重要數(shù)據(jù)源之一。實際工程中,等高線數(shù)據(jù)來源有紙質(zhì)地形圖掃描后矢量化、測繪離散高程點生成等,其中紙質(zhì)地形圖掃描方式較為普遍。然而,由于掃描儀操作不當或是紙質(zhì)地形圖本身質(zhì)量問題,致使掃描得到的電子地形圖出現(xiàn)孔洞、斷點等噪聲及底紋、色彩失真等問題,極大地影響了地形圖等高線自動矢量化作業(yè)的效率與質(zhì)量。
針對該問題,目前主要是利用工具軟件或是通過改進算法來提高等高線處理的質(zhì)量和效率。在利用軟件操作方面,較早的有董敏等[1]用ArcGIS自動矢量化提取等高線,薛濱瑞[2]用CorelDraw和ArcGIS制作地形圖等高線,但這兩種方案易導致矢量化線條變形,王麗等[3]用CASSCAN5_0軟件掃描地形圖矢量化,方式是單一的手動追蹤,工作量大,效率低,不適合大批量的矢量化作業(yè),何立恒等[4]利用AutoCAD提取矢量化地形圖要素,但該方案僅適用于1∶2 000、1∶1 000比例尺的地形圖,羅虎[5]使用Photoshop與ArcGIS提取地形圖等高線,該方法在降噪處理過程中單一地使用人機交互方式[6]剔除干擾要素,并未發(fā)揮Photoshop對顏色和圖像的處理優(yōu)勢。在算法研究方面,主要有爨瑩等[7]通過圖像智能跟蹤算法開發(fā)出地質(zhì)圖件智能數(shù)字化系統(tǒng),主要針對噪聲較小的彩色地形圖來提取交叉點畸變較小的拓撲骨架,劉人午等[8]根據(jù)柵格線體的形態(tài)特征設(shè)計通過對柵格線體的序貫推掃及截斷掃描獲取截斷處的中心像素的掃描細化算法。Naccache等[9]提出細化算法來提取等高線,雖然速度快、效果好,但算法對于掃描地形圖的質(zhì)量要求較高,且實現(xiàn)方式成本較大,不利于普及。
本文參考了鄭華利[10]提出的像素空間關(guān)系信息與顏色信息相結(jié)合的地形圖分色算法,通過噪聲分析,利用Photoshop軟件在圖像處理中的優(yōu)勢,對掃描地形圖進行降噪處理,并對地形圖中的等高線進行了提取和優(yōu)化,最后在ArcMap軟件中進行等高線自動化處理。
1?數(shù)據(jù)來源與噪聲分析
1.1?數(shù)據(jù)來源
選取具有代表性的、不同復雜度的3幅1∶10 000柵格電子地形圖,均采用高斯克呂格西安1980坐標系,采用分辨率為600×1 200,灰度系數(shù)在1.4~1.8之間,24位色彩模式掃描儀掃描處理,獲得的地形圖圖像清晰易辨。3幅地形圖等高線分布由稀疏到密集,矢量化工作由易到難,各地形圖的基本情況如表1所示,地形圖如圖1~3所示。
1.2?噪聲分析
1)底紋:底紋與掃描儀感光元件、透鏡組等本身特性[11]有關(guān),客觀上很難消除。而且掃描儀的分辨率越低,底紋現(xiàn)象越嚴重。所以在掃描紙質(zhì)地形圖時,對設(shè)備與操作技術(shù)的要求不容忽視。底紋較容易判斷,參雜在白色背景區(qū)域內(nèi)的粉紅色、排布有規(guī)律且斷斷續(xù)續(xù)的線,就是底紋,如圖4所示。
2)與等高線相交的水系:水系是地形圖組成的基本要素,如圖5所示。根據(jù)自動分色原理[10],水系線體現(xiàn)為藍色,在二值化時,水系線若不去除,會被識別為等高線的一部分,給自動矢量化等高線造成極為嚴重的影響。可根據(jù)圖斑顏色特征與等高線明顯不同的特點,利用Photoshop的顏色識別功能去除。
3)與等高線相交的圖斑:經(jīng)緯線、道路、注記,這些圖斑之所以難以去除,是因為這些圖斑與等高線顏色相近,如圖6所示。該誤差可以采用人機交互剔除[12]或在ArcMap中用像素清除。
4)等高線斷裂:如圖7所示,紙質(zhì)地圖掃描成柵格圖像時,由于儀器操作和圖像顏色分布不均勻,都會使線條會出現(xiàn)孔洞、斷點等噪聲,但正確的等高線應(yīng)該是連續(xù)、獨立的??赏ㄟ^在Photoshop中擴展與收縮填補孔洞。
2?數(shù)據(jù)處理與結(jié)果分析
2.1?處理流程
為了方便后續(xù)對比分析工作,本次實踐選用3幅1∶10 000地形圖,并制定了A、B、C 3種方案,其中方案C為本文采用的技術(shù)方案,方案A、B用于對比,具體說明如表2所示。
處理流程如圖8所示。第1步,將紙質(zhì)地形圖掃描得到電子柵格地形圖。第2步,利用Photoshop分離原始圖的色調(diào),賦予地形圖中各類要素不同的特征顏色,重點要突出等高線的紅棕色,再通過對顏色的選取與編輯剔除非等高線圖斑噪聲,對于等高線線條質(zhì)量問題,通過平滑曲線和調(diào)整閾值等操作優(yōu)化線條質(zhì)量。第3步,將符合要求的影像加載到ArcMap中,經(jīng)過配準、創(chuàng)建要素等工作,激活Editor和Arcscan工具欄,即可進行自動矢量化。
2.2?Photoshop處理
2.2.1?等高線分色處理
根據(jù)自動分色原理,由于地形圖上等高線與注記、水系等要素相比具有紅棕色特征,地形圖中紅棕色等高線的飽和度分量值相對黑色、藍色較高,據(jù)此可以有效提取等高線。紅棕色的RGB值為144、164、96,通過RGB的調(diào)整,增強等高線的棕色特征。但要徹底分離出等高線,還需淡化其他雜色。HSV是一種直觀而且比較符合人體視覺對色彩感知特征的色域空間,H是色調(diào)、S是飽合度、V是明度,通過判別各個分量的閾值,修改飽合度,描繪出等高線的輪廓。分色處理的效果如圖9所示。
2.2.2?底紋噪聲處理
底紋的產(chǎn)生主要是因為掃描儀的元器件材料本身、掃描頭的機械抖動及掃描儀中光源的光照均勻程度等因素。同時,掃描儀的光電穩(wěn)定性能直接影響所得到的RGB三分色單版圖像的灰度,掃描儀濾光片的非理想性也可引起顏色誤差。色階是表示圖像亮度強弱的指數(shù)標準,由于底紋通常顯示為粉紅色,色階的值越小,深色越深、淺色越淺,粉紅色逐漸向白色(背景色)變化,有利于去除底紋。故利用色調(diào)分離工具,調(diào)整底圖的色階來改變圖像的亮暗程度,從而達到去除底紋的目的。但色階值過小,等高線容易出現(xiàn)斷裂,所以,通常將色階設(shè)為2~4。
底紋去除效果如圖10所示。
2.2.3?非等高線噪聲處理
由于色彩的散射作用[11],掃描地形圖圖像含有成千上萬種不同顏色,但都是以黑、棕、綠、藍4色為主衍生而來,與其他圖像的分色相比,分色范圍更加明確。下面以水系線為例,說明如何去除水系、注記等顏色與等高線明顯不同的圖斑。因水系用藍色表示,若采集到圖中藍色的樣本顏色,將其填充為白色,即讓水系要素與背景融為一體,最終只區(qū)別于背景色的只有等高線。在使用魔棒工具選取水系的顏色時,注意調(diào)整容差,容差越大,樣本選取的范圍也越大。在處理水系線時,將容差選為32~60。處理完水系后,有很多小且多的短微線以及線條斷裂或色調(diào)分離未完全產(chǎn)生的點,在后續(xù)步驟中通過Photoshop的選擇填充功能去除。
去除效果如圖11所示。
2.2.4?等高線線條質(zhì)量優(yōu)化
在掃描過程中,由于圖像邊緣效應(yīng)[11]存在,地形圖上要素從一種顏色轉(zhuǎn)變到另一種顏色時會產(chǎn)生連續(xù)的過渡顏色,比如受掃描儀濾光片的實際透射性質(zhì)影響,等高線邊緣經(jīng)常表現(xiàn)為紅黑混合,通過色調(diào)分離使等高線呈現(xiàn)出與其他顏色特征相近的圖斑不一樣的像素,方便后續(xù)操作。
孔洞、斷點和線線相交,使用人機交互方式剔除[12]。用魔棒選中線條,結(jié)合閾值設(shè)置與填充工具,通過“擴展”和“收縮”改善線條的斷裂與相交:“擴展”可以有規(guī)則地將等高線的孔洞、斷點擴張,使孔洞左右的2個斷點聚攏在一起,但也會導致距離過近的等高線相交在一起,“收縮”可以讓原本粗的線條在一定程度上變細進而線線分離。
但在轉(zhuǎn)換色階時,部分毛刺及斷線顏色變淺,難以觀察??紤]到這些噪聲的像素大小與等高線相差甚遠,需要使用色階工具進行分離,設(shè)定一個色階閾值,以此值為標準,比閾值亮的像素轉(zhuǎn)換為白色,比閾值暗的像素轉(zhuǎn)換為黑色,將原來的彩色圖像轉(zhuǎn)換為高對比度的黑白圖像。
本文根據(jù)用到的地形圖中等高線的亮度判斷,其色階位于中間值附近。通過觀察毛刺、碎線以及等高線的邊緣變化,當毛刺、碎線成為極易觀察的黑色,同時等高線斷裂不明顯的時候,此時閾值最為合適。經(jīng)過反復試驗,將色階直方圖的閾值定義在中值128處比較合適,最后通過調(diào)整邊緣的命令,修改形狀的半徑大小,剔除細碎的像素。
由于文字、注記等因素干擾等高線線條邊緣走向,產(chǎn)生毛刺,在自動矢量化工作中會產(chǎn)生短折線。本文通過平滑處理毛刺[13],光滑等高線的邊緣,結(jié)合閾值設(shè)置與填充工具,使等高線達到如圖12所示的效果。
2.3?ArcMap矢量化處理
矢量化的產(chǎn)品都有屬性信息,因此沒有地理信息的柵格圖像是不能被矢量化的。首先通過地形圖左上角的標注,找到該幅地形圖的分帶,在經(jīng)緯線交點處判斷坐標并配準。方案A與方案B中配準時的點文件注意保存。由于方案C中的經(jīng)緯線和坐標模糊不清,實行方案C時需要在配準工作中要將方案A、B的點文件加載進去。創(chuàng)建可供編輯的等高線要素集,給ArcScan提供可供編輯與保存數(shù)據(jù)的圖層。
自動矢量化的ArcScan只能識別二值化的圖像,二值化就是在Spatial Analyst工具中選擇重分類,把圖中的背景色與等高線(包括未完全清理的干擾要素)劃分成如圖13所示的2個波段,將圖像的灰度值設(shè)為2個值,使整幅圖像顯出明顯的2種顏色的特征,突顯出目標的輪廓。
由于在Photoshop圖中的文字、注記等地物符號清理得不徹底,且這些干擾因素的像素與等高線不同,干擾像元主要聚集在圖框和要素密集處,利用ArcScan選擇像素清理像元。
在ArcScan中生成要素后,3種方案的矢量化完成后最終效果如圖14所示。
由圖14可知,方案A手動矢量化的線條與原始等高線吻合度較高,極少出現(xiàn)錯誤,但效率低,方案B是未經(jīng)過降噪處理自動提取的等高線,發(fā)生了距離較近的線條易相交、顏色不均勻的線條斷裂等情況、且生成了大量雜點,給后續(xù)的拓撲檢查與糾錯帶來大量難題,方案C效率高,質(zhì)量較方案B有了明顯提高,雖然在少數(shù)噪聲清理不完全的地方發(fā)生線線相交與線條斷裂,但整體上還原了原始圖等高線的走向。
3?效率與質(zhì)量分析
3.1?效率對比
為了證實效率有所提高,選用了3幅地形圖,適合自動矢量化與手動矢量化,設(shè)定每次矢量化的范圍為一整張地圖:在地形圖內(nèi)由同一起點開始打點或框選,矢量化相同范圍的地形圖等高線,通過耗時長短來比較3種方案的效率,數(shù)據(jù)如表3所示。
方案A需要操作人員的判斷和描點,且通常需要將數(shù)據(jù)框比例尺放大至1∶4 000以上,在等高線分布密集的區(qū)域甚至要將數(shù)據(jù)框比例尺增大到1∶2 000。數(shù)據(jù)框比例尺越大,每次操作之后矢量化范圍就越小。但方案A在后續(xù)的拓撲檢查及處理中耗時較少,考慮到方案A省略了Photoshop預(yù)處理步驟,遇到等高線排布簡單的地形圖時,方案A的手動矢量化與拓撲檢查及糾錯步驟節(jié)省了更多的時間,因此遇到線條簡單的地形圖時,方案A的效率比方案B高。
自動矢量化一般不用考慮比例尺,只要保證選中的區(qū)域質(zhì)量符合要求,對于同樣大小的區(qū)域,自動矢量化可以在選中的區(qū)域同時矢量化多條等高線,而手動追蹤矢量化每次最多只能矢量化一條等高線其中的某一段,對于相同長度一條等高線時,基于ArcMap所提供的算法支持,自動矢量化可以通過計算機在該條等高線范圍內(nèi)立刻生成要素,手動矢量化則需要操作人員根據(jù)等高線的走向逐個打點。
根據(jù)以上信息,在地形復雜的區(qū)域,自動矢量化的速度是手動追蹤矢量化的3倍以上。地形圖等高線分布越密集,自動矢量化能夠節(jié)省的時間就越多,尤其在地形復雜且的地形圖Ⅲ中,方案C較方案A節(jié)省了近40 h,而對于地形簡單的地形圖Ⅰ,方案B拓撲檢查和糾錯的時間與方案A的手動追蹤打點相差不大,但隨著難度指標增高,3種方案的效率優(yōu)勢差異愈加明顯。但方案B容易出錯,比如線線相交未處理完畢,矢量化的等高線可能會出現(xiàn)交點,給拓撲檢查及糾錯工作帶來了大量難題。因此,方案C是效率最高的方案。
3.2?質(zhì)量對比
等高線的質(zhì)量指標可以參考矢量化等高線與原始地形圖等高線的吻合程度[14],依據(jù)湯國安等[15]提出的等高線套合積差A(yù)P可以評定該吻合程度。
設(shè)定手動矢量化與原始地形圖等高線之間的AP=0,以手動矢量化結(jié)果為準,計算自動矢量化等高線與手動矢量化等高線之間的套合積差,評定自動矢量化等高線與原始地形圖等高線的吻合程度。如果測得自動矢量化生成等高線與手動追蹤矢量化的套合積差在0.05以內(nèi),則說明其吻合度較高,矢量化等高線質(zhì)量合格。
單條等高線套合差:
(1)整幅地形圖的等高線套合積差:
(2)其中:Si為該條自動矢量化等高線與手動追蹤矢量化等高線復合后細碎多邊形的面積,M為相鄰2條間曲線的面積,m為等高線的條數(shù)。首先計算手動追蹤矢量化與自動矢量化生成的兩種等高線相交而產(chǎn)生的面積與相鄰的每3條等高線之間的面積之和的比值,再收集所有的比值計算出AP值。經(jīng)過提取半距等高線和分帶統(tǒng)計與計算,得到各方案AP值,如圖15所示。
由式(1)、(2)可知,P值表示的是每一條自動矢量化等高線的吻合度,P值越小,吻合度越高,越能還原原始柵格地形圖的走向,AP值的大小可以反映出該矢量化等高線方案在全圖范圍內(nèi)的各種地形是否會產(chǎn)生大幅度波動。
方案B在全圖范圍內(nèi)等高線受到干擾變形嚴重,即便在拓撲檢查及糾錯之后,偏離了原圖等高線的矢量化線條也不便糾正,而方案C的AP值均為0.03,矢量化線條與原始地形圖吻合度高,質(zhì)量好。
4?結(jié)論與討論
隨著地圖學的快速發(fā)展,如何高效提取地圖上有價值的信息,使掃描紙質(zhì)地形圖矢量化成為一項具有挑戰(zhàn)性的課題。本文分析了紙質(zhì)地形圖等高線矢量化的研究現(xiàn)狀,以快速高質(zhì)量提取等高線為目的,制訂了3種方案,分別在3種具有代表性的地形圖上進行等高線的提取,最后通過測算矢量化作業(yè)耗時與套合積差來反映等高線提取的效率與質(zhì)量,得出了以下成果與結(jié)論:
1)地形圖等高線噪聲的根本來源在于儀器掃描地圖的操作以及地形圖原圖質(zhì)量問題,可以通過優(yōu)化儀器性能、提高紙質(zhì)地形圖的印刷工藝使掃描得到的電子柵格地形圖的分辨率有所提高,為降噪工作減輕負擔;
2)利用Photoshop與ArcMap自動矢量化提取等高線的降噪技術(shù)較以往有了改進,主要依據(jù)等高線飽和度分量值與其他要素的差別,通過對彩色電子柵格地形圖的分色來實現(xiàn),可以在復雜地形圖環(huán)境下,有效地凸出等高線的輪廓,比目前較通用的人機交互剔除方式節(jié)省了大量時間,提高了矢量化等高線工作降噪步驟的效率;
同時,本文所闌述的方案也有不足之處,比如在等高線線條質(zhì)量優(yōu)化過程中,閾值的調(diào)整可能額外生成雜點,但在本次實驗中并未對矢量化操作結(jié)果造成嚴重影響,另外,擴展、收縮操作是在全圖范圍內(nèi)同時實現(xiàn)的等量變化,不能針對某一處斷點或孔洞給出最優(yōu)的變化數(shù)值,導致對排列過于緊密、或者粗細分布不均勻的線條處理不當。所以某些微小的噪聲可以依據(jù)實際情況添加手動操作,或者在拓撲檢查后逐個糾錯。
如果有更好的方案還需依賴通過算法或其他更先進的圖像處理軟件實現(xiàn)高效率高質(zhì)量的降噪工作。后續(xù)研究將立足于簡化降噪工序的流程和提高降噪工序的效率與質(zhì)量,找到更適用于所有地形圖的矢量化方案。
參考文獻:
[1]董敏,孫寶生,陳川,等.基于ArcGIS的柵格圖像自動矢量化的實現(xiàn)新方法[J].西部探礦工程,2011,23(2):139-142.
[2]薛濱瑞,余正軍.基于CorelDraw和GIS軟件的等高線地形圖制作:以翠華山地質(zhì)公園地形圖為例[C]//中國地質(zhì)學會旅游地學與地質(zhì)公園研究分會第25屆年會暨張家界世界地質(zhì)公園建設(shè)與旅游發(fā)展戰(zhàn)略研討會,2010:5.
[3]王麗,薛志勤.淺談CASSCAN5.0軟件在地形圖掃描矢量化中的應(yīng)用[J].計算機光盤軟件與應(yīng)用,2014,17(6):51-52.
[4]何立恒,鮑其勝.AutoCAD R14環(huán)境下的地形圖矢量化[J].南京林業(yè)大學學報(自然科學版),2002(2):63-65.
[5]羅虎.Adobe Photoshop CC 2015結(jié)合ArcMap10.2.2在地形圖矢量化中的應(yīng)用[J].綠色科技,2018(14):229-231.
[6]朱春節(jié),韓雪培,封殿波.土地利用圖自動矢量化方法探討[J].測繪通報,2008(7):50-53.
[7]爨瑩,袁通路,徐永高,等.地質(zhì)等值線圖矢量化算法的設(shè)計與實現(xiàn)[J].系統(tǒng)仿真學報,2003(11):1565-1566,1617.
[8]劉人午,李燕.掃描細化算法的地圖自動矢量化研究[J].測繪學報,2012,41(2):309-314.
[9]NACCACHE N J,SHINGHAL R.?SPTA:a proposed algorithm for thinning binary patterns[J].?IEEE Transactions on Systems,Man,and Cybernetics,1984,SMC-14(3):409-418.
[10]鄭華利.彩色地形圖的自動識別與矢量化研究[D].南京:南京理工大學,2004.
[11]周蓓蓓.彩色地形圖點狀地物符號的提取與識別[D].蘇州:蘇州大學,2008.
[12]紀洋,武文波,楊曉偉.等高線自動矢量化的后處理[J].遼寧工程技術(shù)大學學報(自然科學版),2008(S1):37-39.
[13]韋建波,塔西甫拉提特依拜,田源,等.一種改善地形圖等高線自動矢量化精度的方法[J].測繪通報,2008(6):61-64.
[14]張曉偉,沈軍.利用等高線套合差評定DEM質(zhì)量的應(yīng)用研究[J].青海師范大學學報(自然科學版),2013,29(2):26-29.
[15]湯國安,陶旸,王春.等高線套合差及在DEM質(zhì)量評價中的應(yīng)用研究[J].測繪通報,2007(7):65-67.