杜佳威,武 芳,朱 麗,劉呈熠,王安東
信息工程大學(xué)地理空間信息學(xué)院,河南 鄭州 450001
地圖綜合知識的抽象、獲取和運用是實現(xiàn)地圖綜合自動化、智能化的關(guān)鍵[1]。利用程序語言翻譯能夠明確表達的綜合約束是實現(xiàn)自動綜合的經(jīng)典思路[2]。但是,地圖綜合還受到制圖經(jīng)驗、主觀認知、視覺感受等諸多模糊因素[3]影響,綜合知識難以全部清晰、準確形式化描述。機器學(xué)習(xí)技術(shù)能夠從數(shù)據(jù)成果中發(fā)現(xiàn)模糊知識、輔助綜合決策,推動了自動綜合智能化升級[4]?;喿鳛橹匾C合算子之一[5],基于機器學(xué)習(xí)的智能化簡方法大體分為以下兩類:①圖形級方法。此類方法將構(gòu)成圖形的頂點作為基本處理單元,從頂點幾何特征中抽象出與化簡相關(guān)的特征項,智能算法通過學(xué)習(xí)、處理特征項實現(xiàn)壓縮頂點的化簡目的。文獻[6—7]將頂點位置坐標作為特征項,分別利用遺傳算法和蟻群模型處理特征項、優(yōu)化頂點取舍,實現(xiàn)智能化簡;文獻[8]增加了夾角參數(shù)和垂線距離兩個特征項,利用自組織神經(jīng)網(wǎng)絡(luò)聚類特征項實現(xiàn)頂點聚類和壓縮;文獻[9]提取了九個影響化簡的頂點特征項,利用支持向量機對特征項進行監(jiān)督學(xué)習(xí)實現(xiàn)智能化簡。②圖像級方法。此類方法以矢柵轉(zhuǎn)換為基礎(chǔ)、以圖像像素為基本處理單元,利用智能算法從圖像中學(xué)習(xí)化簡算子。文獻[10]利用三層BP神經(jīng)網(wǎng)絡(luò)從化簡前后的柵格建筑物輪廓中學(xué)習(xí)、追蹤化簡軌跡實現(xiàn)化簡處理;文獻[11]利用卷積自編碼器實現(xiàn)柵格建筑物模板匹配,并利用匹配模板化簡建筑物輪廓。隨著深度學(xué)習(xí)模型在圖像翻譯、風(fēng)格遷移中成功應(yīng)用[12-13],學(xué)習(xí)、模擬從化簡前到化簡后圖像變換的思路逐步展開。文獻[4]利用U-net學(xué)習(xí)、模擬從化簡前到化簡后柵格建筑物輪廓變化;針對蜿蜒、綿長的線要素,文獻[14—15]設(shè)計了專門的剖分及柵格樣本生成方法,分別利用殘差Unet、Pix2Pix等深度學(xué)習(xí)模型模擬從化簡前到化簡后的圖像變換。
利用機器學(xué)習(xí)方法感知柵格圖像、指導(dǎo)化簡決策的學(xué)習(xí)模擬包含了對未被發(fā)現(xiàn)且難以形式化描述的模糊化簡知識的利用,但受到矢柵轉(zhuǎn)換損失的影響,以像素作為化簡處理單元難以保證化簡結(jié)果的點位準確。化簡處理圖形頂點能夠保持化簡結(jié)果點位準確,但僅利用可度量特征項學(xué)習(xí)模擬化簡算子,局限于對已知明確化簡知識的利用。本文基于集成學(xué)習(xí)策略[16],通過集成幾種機器學(xué)習(xí)算法,設(shè)計能夠融合利用圖形、圖像學(xué)習(xí)模擬頂點取舍決策的智能化簡方法,在確保點位準確的條件下,達到充分利用各種化簡知識、優(yōu)化智能化簡效果的目的。
集成學(xué)習(xí)通過構(gòu)建、結(jié)合多個機器學(xué)習(xí)器完成學(xué)習(xí)任務(wù)[16],以實現(xiàn)“博采眾長”。融合利用圖形、圖像的集成學(xué)習(xí)化簡方法的基本思路為:先分別構(gòu)建基于圖形和基于圖像的頂點取舍模型,分別從圖形特征層次和柵格圖像層次對同一頂點的取舍情況進行學(xué)習(xí)和預(yù)測;再構(gòu)建融合決策模型對基于圖形和基于圖像的頂點取舍進行融合利用,得到最終的取舍決策??傮w方案如圖1所示。
為方便后文敘述,將化簡前、后的比例尺分別記為S1、S2,供模型訓(xùn)練的化簡前、后的要素分別記為la、lb,模型應(yīng)用中待化簡要素記為lc。構(gòu)成要素的頂點記為vi,la、lb和lc分別表示為la={vi|i∈[1,na]},lb={vi|i∈[1,nb]},lc={vi|i∈[1,nc]}。
圖形是要素的矢量表達形式,適于空間量測、計算和分析?;嗠x不開對要素局部、整體形態(tài)特征的度量,圖形幾何特征的度量結(jié)果能夠指導(dǎo)頂點取舍。本文采用18個圖形特征項,從鄰近頂點關(guān)系、彎曲結(jié)構(gòu)和整體形態(tài)控制3個層次度量影響頂點取舍的幾何特征。其中,基于鄰近頂點的圖形特征項包含對鄰近頂點間距離、角度、垂距、弦長、弧長、面積、垂比弦和弧比弦的度量[9],基于彎曲的圖形特征項包含對左、右彎曲的基線長度、深度、面積和結(jié)構(gòu)層次的度量[17],基于整體形態(tài)控制的頂點特征項包含對頂點層次和形狀控制程度的度量[18-19]。這些指標包含了對局部和整體形態(tài)特征的描述,涉及了影響鄰近頂點取舍、彎曲取舍和整體形態(tài)控制點取舍因素的度量,體現(xiàn)了對頂點取舍已有知識的利用。
全連接神經(jīng)網(wǎng)絡(luò)能夠利用神經(jīng)元間的連接關(guān)系融合利用多種特征,常用于基于特征項的智能決策[20]。全連接神經(jīng)網(wǎng)絡(luò)僅在相鄰層神經(jīng)元間構(gòu)建連接關(guān)系,且每個神經(jīng)元都與相鄰層所有神經(jīng)元連接。神經(jīng)元連接參數(shù)為權(quán)重和偏置,圖2(a)展示了基于權(quán)重和偏置的連接計算:xj為上一層神經(jīng)元的輸出值,y為下一層連接神經(jīng)元的接收值;wj和b分別表示權(quán)重和偏置參數(shù);f為激活函數(shù),常采用非線性函數(shù),以擬合復(fù)雜非線性任務(wù)。
面向基于圖形的頂點取舍任務(wù),設(shè)計基于全連接神經(jīng)網(wǎng)絡(luò)的頂點取舍模型構(gòu)建從頂點圖形特征項到頂點取舍的映射,如圖2(b)所示。
圖2 基于全連接神經(jīng)網(wǎng)絡(luò)的頂點取舍模型Fig.2 The model of vertex selection based on the fully connected neural network
(1)輸入層含18個神經(jīng)元,接收計算的18個頂點圖形特征項FV1(vi),…,FV18(vi)。
(3)輸入層和輸出層之間可存在若干隱藏層,每個隱藏層內(nèi)可包含若干神經(jīng)元,能夠利用頂點圖形特征項生成多層次特征以指導(dǎo)頂點取舍。
神經(jīng)元間連接的權(quán)重和偏置參數(shù)是影響模型計算準確性的關(guān)鍵,利用基于圖形特征的頂點取舍樣本訓(xùn)練模型,自適應(yīng)求解、優(yōu)化模型參數(shù),使其適用于基于圖形的頂點取舍任務(wù)。
構(gòu)建基于圖形特征的頂點取舍樣本集。采用三元法記錄基于圖形特征的頂點取舍樣本,即〈頂點,頂點圖形特征,取舍情況〉。對于頂點vi,計算圖形特征項,記為FV(vi)={FV1(vi),…,FV18(vi)};采用獨熱(One-Hot)編碼[21]標記頂點取舍情況,記為[ti1,ti2]∈{[1,0],[0,1]},其中[1,0]表示vi被保留,[0,1]表示vi被刪除。對于訓(xùn)練數(shù)據(jù)la、lb,化簡前線要素la各頂點的取舍情況可以通過與化簡后線要素lb的匹配關(guān)系判定,具體方法參照文獻[9]。遍歷la各頂點,得到訓(xùn)練樣本集{〈vi,FV(vi),[ti1,ti2]〉|i∈[1,na]}。
圖像是要素的柵格表達形式,常作為機器視覺的感知對象。除明確可度量的圖形特征外,影響頂點取舍的因素還隱含于制圖員對包含頂點上下文環(huán)境的主觀感受及其引發(fā)的難以形式化描述的知識中。在視覺分辨率約束下提取包含頂點在內(nèi)一定區(qū)域的柵格圖像,可以看作是人眼感受到的頂點上下文環(huán)境;利用機器學(xué)習(xí)方法從柵格圖像中感知頂點取舍是對人眼感受頂點上下文環(huán)境指導(dǎo)頂點取舍的模擬,涵蓋了對潛在影響頂點取舍模糊知識的利用。
指導(dǎo)頂點取舍判斷的柵格圖像應(yīng)滿足:①圖像像素對應(yīng)的實際距離小于原始比例尺圖上最小可視距離[22]對應(yīng)的實際距離,保證柵格圖像中要素細節(jié)足夠清晰。即滿足pix
(1)構(gòu)建包含vi的待化簡要素的外接矩形。
(2)以vi為中心,構(gòu)建與外接矩形各邊平行且邊長為pix·npix的正方形區(qū)域。
(3)利用矢柵轉(zhuǎn)化方法[23]將包含于正方形區(qū)域內(nèi)的矢量要素轉(zhuǎn)換為柵格圖像,像素大小為pix,圖像尺寸為npix·npix。
卷積神經(jīng)網(wǎng)絡(luò)能夠利用卷積核和局部感受野從圖像中感知多層次特征,常用于基于圖像的智能決策[24-26]。卷積是感知柵格圖像特征的關(guān)鍵,圖像卷積計算方法詳見文獻[24]。輸入圖像與卷積核進行卷積運算生成特征圖,特征圖中的特征值是卷積核對局部感受野感知的結(jié)果,如圖3(a)中輸入圖像紅框區(qū)域?qū)?yīng)特征圖紅框區(qū)域的局部感受野;卷積核規(guī)模和步長影響局部感受野的范圍和位置,卷積核的權(quán)重影響局部感受野的感受結(jié)果;具有不同權(quán)重、不同規(guī)模、不同步長的卷積核能夠?qū)植扛惺芤斑M行多樣感知,得到不同特征圖,如圖3(a)中不同權(quán)重、不同步長的卷積運算產(chǎn)生了不同的特征圖;特征圖再次進行卷積運算,可以提取更深層次的特征圖、獲取多層次感知。此外,池化運算[24-25]能夠?qū)σ欢ǚ秶鷥?nèi)的特征值進行下采樣,實現(xiàn)特征圖壓縮,得到更加概略的感知結(jié)果,如圖3(b)所示。卷積神經(jīng)網(wǎng)絡(luò)通過重復(fù)布設(shè)卷積層和池化層提取、利用多層次特征,如圖3(c)所示。卷積層和池化層的計算過程分別表示為Y=f(Conv(X,WJ)+BJ)和Y=Sub(X),X和Y分別為卷積層(或池化層)的輸入和輸出像素值(或特征值)矩陣;f為激活函數(shù);WJ為卷積核權(quán)重矩陣;BJ為偏置參數(shù)。
圖3 利用卷積、池化感知圖像多層次特征Fig.3 Extraction of multi-level features using convolution and pooling
面向基于圖像的頂點取舍任務(wù),設(shè)計基于卷積神經(jīng)網(wǎng)絡(luò)的頂點取舍模型構(gòu)建從柵格圖像到頂點取舍的映射,如圖4(a)所示。
圖4 基于卷積神經(jīng)網(wǎng)絡(luò)的頂點取舍模型Fig.4 The model of vertex selection based on the convolutional neural network
(1)輸入層接收柵格圖像FI(vi)的像素值矩陣。
(3)隱藏層由一個獨立卷積層、多個殘差塊和一個全連接層構(gòu)成:卷積層用于從輸入圖像中提取與頂點取舍相關(guān)的特征圖;殘差塊用于進一步提取更深層次的特征圖,并通過跳躍連接融合利用不同層次的特征圖;全連接層利用最后一個殘差塊生成的特征圖的特征值計算頂點取舍情況。其中,卷積層和殘差塊的結(jié)構(gòu)如圖4(b)所示:卷積層中引入批量標準化(batch normalization,BN)[27]以緩解梯度消失的問題[28],且引入批量標準化還能約減卷積層偏置參數(shù)[28],使計算過程簡化為Y=f(BN(Conv(X,WJ)));殘差塊可以看作由兩個具有跳躍連接的卷積層構(gòu)成,能夠避免神經(jīng)網(wǎng)絡(luò)深度增加引發(fā)的退化問題[29],殘差塊計算見式(1)、式(2)
Y=f(Sub(X)+BN(Conv(f(BN(Conv(X,WJ)))),WJ+1))
(1)
Y=f(X+BN(Conv(f(BN(Conv(X,WJ)))),WJ+1))
(2)
式(1)、式(2)分別表示殘差塊是、否對特征圖尺寸進行壓縮,式(1)通過調(diào)整卷積步長壓縮特征圖使其與Sub(X)尺寸相同。
(3)
線性加權(quán)法是實現(xiàn)多指標融合的常用方法[30],MV和MI的輸出結(jié)果通過線性加權(quán)模型實現(xiàn)融合利用,如式(4)所示
(4)
頂點取舍模型越準確,預(yù)測的取舍結(jié)果越可靠,融合時所占權(quán)重越大。因此,MV和MI的權(quán)重(即λ′和λ″,且λ′+λ″=1)由兩模型精度計算而得,如式(5)所示
(5)
式中,Eva是對模型精度的評價,詳見式(6)
(6)
可采用查準率(Precision)、查全率(Recall)、準確率(Accuracy)和F1度量(F1score)等指標評價法。具體而言,就是利用MV(或MI)對訓(xùn)練樣本集進行測試,將預(yù)測的頂點取舍情況與實際取舍情況進行比較,計算查準率、查全率、準確率和F1度量(計算方法參見文獻[31])評價模型精度。
MV和MI模型的輸出結(jié)果都是頂點取舍概率,基于此,可計算在已知基于圖形和基于圖像的頂點取舍概率情況下的頂點取舍條件概率,即計算P([ti1,ti2]|MV(vi),MI(vi))。利用樸素貝葉斯方法,對P([ti1,ti2]|MV(vi),MI(vi))進行分解、轉(zhuǎn)化,如式(7)
(7)
(8)
(9)
(10)
(11)
式中,C為懲罰系數(shù);ξ(i)為松弛因子,利用此目標函數(shù)能夠?qū)崿F(xiàn)軟分類。
軟分類使大部分支持向量被正確分類,適用于處理由MV和MI生成的不完全準確的支持向量。將求解的超平面參數(shù)μ和η應(yīng)用于式(12),完成SVM二分類器構(gòu)建
(12)
(13)
島嶼岸線形態(tài)復(fù)雜多變,是化簡難度最大的要素之一[32],以新西蘭Stewart島嶼岸線作為試驗對象驗證各模型有效性。1∶5萬Stewart島嶼岸線包含20 775個頂點,其中前19 104個頂點用于訓(xùn)練,最后1761個頂點用于測試,如圖5(a)所示;采用文獻[9]中頂點取舍案例獲取方法,從人工綜合的1∶25萬Stewart島嶼岸線數(shù)據(jù)中提取頂點取舍結(jié)果作為標準化簡結(jié)果,如圖5(b)所示。基于TensorFlow框架,利用Python語言在GPU RTX 2070s的運算環(huán)境下實現(xiàn)本文方法,學(xué)習(xí)、模擬從1∶5萬至1∶25萬的頂點取舍決策。
圖5 試驗數(shù)據(jù)Fig.5 Experimental data
分別從訓(xùn)練部分和測試部分中提取樣本并構(gòu)建訓(xùn)練集和測試集。提取柵格圖像時,令svo=0.2 mm,pix=svo/2S1=5 m,npix=128;且考慮到文獻[15]指出面狀圖斑比柵格曲線更容易被卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),從島嶼面域中提取包含頂點上下文環(huán)境的柵格圖像如圖6所示。
圖6 提取柵格圖像的示例Fig.6 Examples of extracting raster samples
構(gòu)建、訓(xùn)練全連接神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò),實現(xiàn)基于圖形和圖像的頂點取舍。其中,全連接神經(jīng)網(wǎng)絡(luò)2個隱藏層的神經(jīng)元數(shù)依次為64和32;卷積神經(jīng)網(wǎng)絡(luò)包含1個卷積層、4個殘差塊和1個全連接層,卷積核大小依次為3×3、8×8、6×6、3×3、3×3,殘差塊將特征圖大小依次壓縮為1/4、1/4、1/2、1/2。試驗所有神經(jīng)網(wǎng)絡(luò)中間層激活函數(shù)均為ReLU函數(shù)[20],損失函數(shù)均為交叉熵函數(shù)[20],梯度下降方法均采用Adam方法[33]。全連接神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練終止條件分別為ne=20和ne=50,訓(xùn)練過程中對訓(xùn)練集擬合準確率變化如圖7所示?;谟?xùn)練集和測試集數(shù)據(jù)評價訓(xùn)練后的MV和MI,統(tǒng)計查準率、查全率、準確率和F1度量,見表1。由圖7和表1可知,MV和MI分別一定程度上學(xué)習(xí)、掌握了岸線化簡中的頂點取舍,都具有一定泛化應(yīng)用能力,且MV優(yōu)于MI。
圖7 基于圖形和基于圖像的頂點取舍模型訓(xùn)練過程中訓(xùn)練集準確率的變化Fig.7 The accuracy changes with training of vector-based and raster-based models
表1 利用訓(xùn)練集和測試集對MV和MI的效果評價Tab.1 Assessments of MV and MI based on training and testing data (%)
構(gòu)建以下幾個融合決策模型:①分別基于訓(xùn)練集Precision、Recall、Accuracy和F1score構(gòu)建4個加權(quán)融合模型,分別記為PreFu、RecFu、AccFu和F1Fu;②構(gòu)建一個貝葉斯融合模型,記為BayFu;③構(gòu)建一個采用高斯核函數(shù)、懲罰系數(shù)為0.01的支持向量機融合模型,記為SVMFu;④構(gòu)建一個隱藏層包含32個神經(jīng)元的全連接神經(jīng)網(wǎng)絡(luò),由該神經(jīng)網(wǎng)絡(luò)對訓(xùn)練集數(shù)據(jù)重復(fù)學(xué)習(xí)10次訓(xùn)練而得的融合模型記為NNFu。利用融合模型處理訓(xùn)練集和測試集,計算查準率、查全率、準確率和F1度量評價頂點取舍效果,如表2所示。由于F1score是對Precision和Recall的加權(quán)平均,著重基于Accuracy和F1score分析各融合模型效果。
(1)所有融合模型都實現(xiàn)了對圖形決策和圖像決策的集成,使融合前效果相對較差的模型得到顯著提升。表2中所有融合模型的Accuracy和F1score值高于表1中融合前MI模型的Accuracy和F1score值,融合模型使MI精度得到提升。但是,融合模型的Accuracy和F1score值不都高于融合前的MV模型,部分融合模型使MV精度受損。
表2 利用訓(xùn)練集和測試集對融合模型效果的評價Tab.2 Assessments of fusion models based on training and testing data (%)
(2)RecFu、AccFu、F1Fu和BayFu沒有起到融合利用MV和MI結(jié)果、提升頂點取舍精度的效果。對于訓(xùn)練集,RecFu、AccFu、F1Fu和BayFu的Accuracy和F1score值低于MV。這些模型屬于加權(quán)融合模型或貝葉斯融合模型,是在一定假設(shè)基礎(chǔ)上構(gòu)建的融合模型。其中,加權(quán)融合模型假設(shè)MV與MI輸出結(jié)果間存在線性關(guān)系,貝葉斯融合模型中假設(shè)概率可以被頻率近似。這些固定假設(shè)影響了模型應(yīng)用的靈活性和適應(yīng)性,導(dǎo)致融合效果不佳、準確率損失等問題。
(3)PreFu、SVMFu和NNFu起到了提升頂點取舍精度的效果,實現(xiàn)了圖形和圖像決策的融合利用。對于訓(xùn)練集和測試集,PreFu、SVMFu和NNFu的Accuracy和F1score值高于MV和MI。這些融合模型大都以機器學(xué)習(xí)為基礎(chǔ),支持向量機和人工神經(jīng)網(wǎng)絡(luò)能夠從融合數(shù)據(jù)集中發(fā)現(xiàn)規(guī)律、指導(dǎo)融合應(yīng)用,用于關(guān)系脆弱且不明確的MV和MI結(jié)果數(shù)據(jù)融合時,具有更好的靈活性和適應(yīng)性。
對PreFu、SVMFu和NNFu的化簡效果展開進一步分析。
(1)從頂點取舍的準確性看,無論是基于訓(xùn)練集還是測試集,表2中NNFu的Accuracy和F1score值都高于PreFu和SVMFu,神經(jīng)網(wǎng)絡(luò)更好的靈活性和適應(yīng)性使NNFu的頂點取舍精度高于SVMFu和PreFu。
(2)從化簡結(jié)果的視覺感受上看,PreFu、SVMFu和NNFu都能融合利用MV和MI,在一定程度上起到了優(yōu)勢互補的效果。部分測試弧段的化簡效果如圖8所示:對于區(qū)域1內(nèi)的弧段,MV的化簡結(jié)果與目標化簡結(jié)果更加一致;對于區(qū)域2內(nèi)的弧段,MI的化簡結(jié)果與目標化簡結(jié)果更加一致;NNFu化簡區(qū)域1的結(jié)果與MV相似,化簡區(qū)域2的結(jié)果與MI相似,體現(xiàn)了對MI和MV融合利用和優(yōu)勢互補;SVMFu化簡區(qū)域2的結(jié)果與MI相似,化簡區(qū)域1的結(jié)果略遜于MV的化簡結(jié)果、但明顯優(yōu)于MI的化簡結(jié)果,在一定程度上體現(xiàn)了對MV和MI的融合利用;PreFu化簡區(qū)域1和區(qū)域2的結(jié)果與MV相似,僅使區(qū)域1和區(qū)域2間弧段的化簡效果得到改善,表現(xiàn)出對MV的嚴重依賴和對MI的利用不足。
圖8 部分測試弧段的化簡結(jié)果(藍色和紅色曲線分別表示原始岸線和化簡結(jié)果)Fig.8 Simplified results of part of test data with different models (the original coastlines and simplified coastlines are colored by bule and red respectively)
(3)計算Hausdorff距離[34]、面積差[35]、符號重疊率[36]、視覺緩沖區(qū)限差[15,34]度量模型化簡結(jié)果與標準化簡結(jié)果間的相似性(表3),量化評價各模型的整體化簡效果。其中,Hausdorff距離、面積差越小,模型化簡結(jié)果與標準化簡結(jié)果越相似;符號重疊率、視覺緩沖區(qū)限差越大,模型化簡結(jié)果與標準結(jié)果越相似,符號重疊率的線寬設(shè)置為0.1 mm,視覺緩沖區(qū)限差的最小可分辨距離設(shè)置為0.2 mm。從符號重疊率上看,PreFu和MV相差不大,但從Hausdorff距離、面積差和視覺緩沖區(qū)限差上看,PreFu生成的化簡結(jié)果沒有比MV更接近于標準化簡結(jié)果,融合效果并不理想;從所有指標上看,SVMFu和NNFu生成的化簡結(jié)果與標準化簡結(jié)果的相似性都高于MV和MI,融合效果良好;且NNFu的化簡結(jié)果與標準化簡結(jié)果具有最高的相似性,做到了相對最優(yōu)的融合利用。
表3 測試弧段化簡結(jié)果與標準化簡結(jié)果的相似性評價Tab.3 Evaluation of similarities between automated results and target results for the testing data
類似地,利用本文方法進行多尺度化簡試驗,并計算測試部分海岸線由1∶5萬化簡至1∶25萬、1∶50萬、1∶75萬和1∶100萬時線要素化簡前后的頂點壓縮率[9]、長度比[15]、Hausdorff距離、面積差和平均曲率相似度[37],見表4。本文方法能夠進行多尺度化簡,且比例尺跨度越大、化簡結(jié)果越概略,符合多尺度變化的客觀規(guī)律;各尺度化簡結(jié)果與原始線要素的曲折程度一致性較高,保持了良好的幾何相似性。
表4 測試部分海岸線多尺度化簡結(jié)果的評價Tab.4 Evaluations of multi-scale simplifications of the testing coastline
令融合效果最好的NNFu模型與以下化簡方法進行對比,驗證本文方法的優(yōu)越性。
5.2.1 與其他智能化簡方法的對比分析。
文獻[9]是近些年具有代表性的智能化簡方法,但其采用的特征項不及本文采用的18種頂點特征項豐富、全面。為增強兩方法的可比性、控制對比試驗變量,對比方法1采用文獻[9]方法并將其特征項擴展至與本方法相同。利用訓(xùn)練部分岸線對方法1進行訓(xùn)練,過程如圖9所示,迭代至5500次時方法1的準確率和F1度量都相對較高,利用此時的模型對測試部分進行化簡,化簡結(jié)果的量化評估如表5所示。
圖9 方法1在訓(xùn)練過程中模型準確率和F1 score的變化Fig.9 The accuracy and F1 score changes with training of the comparison method 1
比較表1—3與表5發(fā)現(xiàn):方法1對訓(xùn)練集的學(xué)習(xí)效果和測試集的預(yù)測效果都沒有達到NNFu模型的效果,甚至遜于融合前的MV模型。這是因為方法1采用的支持向量機模型的學(xué)習(xí)能力通常被認為弱于MV模型采用的多層全連接神經(jīng)網(wǎng)絡(luò),其難以充分學(xué)習(xí)掌握岸線頂點取舍這一相對復(fù)雜任務(wù);此外,方法1只顧及了可度量的圖形特征,而NNFu模型還融合了隱含于圖像中的模糊知識。綜上所述,本文方法優(yōu)于方法1。
表5 方法1對測試部分海岸線化簡效果的評價Tab.5 Evaluation of the contrast method simplification for the testing data
5.2.2 與其他自動化簡方法的對比分析。
文獻[32,35,38—39]是近些年具有代表性的自動化簡方法。其中,文獻[35,39]是基于頂點的化簡方法,文獻[32,38]是基于彎曲的化簡方法,都可用于岸線化簡。文獻[35,39]方法記為方法2和方法3,都參照文獻[35]控制兩方法的化簡參數(shù),使化簡結(jié)果與標準化簡結(jié)果的頂點數(shù)相同;文獻[38]記為方法4,彎曲化簡的寬度閾值和深度閾值設(shè)置為0.3 mm和0.5 mm;文獻[32]記為方法5。利用方法2—5化簡測試部分岸線,化簡結(jié)果量化評價如表6所示。
表6 方法2—5化簡結(jié)果與標準化簡結(jié)果的相似性評價Tab.6 Evaluation of similarities between automated results of contrast methods 2—5 and target results
分析表6與表3可以發(fā)現(xiàn):方法2顧及了化簡前后的面積保持,面積差、符號重疊率、視覺緩沖區(qū)限差都優(yōu)于方法3—方法5,與標準化簡結(jié)果具有很好的整體相似性,但除視覺緩沖區(qū)限差外,面積差、符號重疊率都沒有達到NNFu的水平,且嚴格保證化簡前后面積相等會導(dǎo)致局部變形較大,表現(xiàn)為Hausdorff距離相對最大;方法3化簡結(jié)果與標準化簡結(jié)果的整體相似性遜于NNFu,但方法3在壓縮頂點的同時允許在可視范圍內(nèi)移動頂點,使表征局部相似性的Hausdorff距離優(yōu)于NNFu;方法4—5化簡結(jié)果與標準化簡結(jié)果的整體相似更差,這是由于彎曲比頂點的處理粒度更粗,容易產(chǎn)生更大的變形;特別是方法5面向海圖應(yīng)用,以單側(cè)彎曲化簡為主,與標準化簡結(jié)果的整體相似最弱。這些自動化簡方法往往只顧及有限約束,且只在約束范圍內(nèi)效果良好,表現(xiàn)為方法2—5化簡結(jié)果的量化評價中可能存在1個指標優(yōu)于NNFu的化簡結(jié)果;而實際地圖綜合中化簡約束往往是多元混合的,本文方法從數(shù)據(jù)成果中學(xué)習(xí)化簡決策,更具優(yōu)越性和適應(yīng)性,表現(xiàn)為方法2—5優(yōu)于NNFu的量化評價指標最多不超過1個。
進一步驗證本文方法的優(yōu)越性與適應(yīng)性,擴充測試數(shù)據(jù)并與具有廣泛適用性的化簡方法3、4進行對比試驗:利用NNFu化簡新西蘭南島的4段岸線(表7),計算化簡后的頂點壓縮率[9]、彎曲壓縮率[38];利用方法3化簡岸線1—4至與NNFu相同的頂點壓縮率,各化簡結(jié)果的位置誤差[40]如表8所示;利用方法4重復(fù)刪除細小彎曲,直至化簡后岸線1—4的彎曲壓縮率恰好不大于NNFu化簡結(jié)果為止,各化簡結(jié)果的位置誤差見表9。
表7 其他1∶5萬的海岸線數(shù)據(jù)Tab.7 Some other coastlines to be simplified
分析表8、表9可知:在相同的頂點壓縮率下,NNFu化簡岸線1—4的位置誤差比方法3更??;在相似的彎曲壓縮率下,本文方法較方法4能夠壓縮更多的彎曲且產(chǎn)生更小的位置誤差,本文方法更好地保持了化簡前后的整體相似性。此外,在保持不同海岸地理特征上,本文方法也具有一定優(yōu)勢。圖10(a)中,本文方法更好地保持了人工岸線規(guī)則平直的特征,方法3、4對其中海岸人工建筑[41](虛線框內(nèi))的不良化簡破壞了其原本地理意義;圖10(b)中,本文方法更好地保持了海灣的整體形態(tài)及灣口位置的準確性(虛線框內(nèi)),確保了對化簡前、后海灣地理特征認識的一致性;圖10(c)中,本文方法較方法4更好地化簡了狹長河口(虛線框內(nèi)),較方法3更好地保持了曲折部分與平滑部分的差異性。綜上所述,進一步證實了本文方法的優(yōu)越性和適應(yīng)性。
表8 方法3和NNFu化簡效果的比較Tab.8 Comparisons on different simplifications with same vertex compression ratio
表9 方法4和NNFu化簡效果的比較Tab.9 Comparisons on different simplifications with similar bend compression ratio
圖10 不同類型海岸線化簡效果的比較(藍色曲線為原始岸線、紅色曲線為化簡結(jié)果)Fig.10 Comparison of different simplifications of various coasts:the original coastlines and simplified coastlines are colored by bule and red respectively
本文集成幾種機器學(xué)習(xí)算法學(xué)習(xí)、模擬、優(yōu)化化簡過程中的頂點取舍決策:利用全連接神經(jīng)網(wǎng)絡(luò)構(gòu)建了基于圖形的頂點取舍模型,利用卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建了基于圖像的頂點取舍模型,利用線性加權(quán)、貝葉斯理論、支持向量機、全連接神經(jīng)網(wǎng)絡(luò)建立了能夠綜合利用基于圖形和基于圖像的頂點取舍的諸多融合決策模型,實現(xiàn)了融合利用圖形和圖像中蘊含的化簡知識學(xué)習(xí)模擬頂點取舍的智能化簡,起到了頂點取舍優(yōu)化、化簡精度提高、不同模型優(yōu)勢互補的良好效果。
在實際應(yīng)用中,不是所有融合決策模型都發(fā)揮了良好效果,如何選擇、衡量、解釋融合決策模型還需進一步研究;此外,向智能化簡模型中引入明確的地圖綜合知識以增強智能方法可解釋性和約束性,也是十分重要研究。特別的,本文提出的圖形、圖像融合利用的思路還能用于指導(dǎo)模式識別、數(shù)據(jù)增強和其他綜合算子中智能方法(如文獻[4,25—26,42])的優(yōu)化升級。沿著多特征融合利用的集成學(xué)習(xí)思路,融合語義特征、三維特征等更加豐富的特征項,集成圖卷積神經(jīng)網(wǎng)絡(luò)[42]、生成對抗網(wǎng)絡(luò)[15]等更加多元的機器學(xué)習(xí)算法,都值得進一步探索。