王艷梅,李金雨,馮海霞
(1.安徽三聯(lián)學(xué)院 交通工程學(xué)院,安徽 合肥 230601;2.山東交通學(xué)院 交通與物流工程學(xué)院,山東 濟(jì)南 250357)
隨著空間技術(shù)的不斷發(fā)展,遙感影像的分辨率越來越高,為更準(zhǔn)確地提取地物信息提供了更好的數(shù)據(jù)基礎(chǔ)。道路是高分辨率遙感影像中一種很重要的地物信息,如何從高分辨率遙感影像中精確地提取出道路信息,成為國(guó)內(nèi)外眾多學(xué)者研究的熱點(diǎn),因此也提出了各種各樣的算法[1-5]。雖然高分辨率遙感影像中道路信息的幾何特征和紋理特征都非常明顯,但是由于同物異譜和同譜異物現(xiàn)象的存在,使得道路信息提取的精度受到一定限制,給提取算法的設(shè)計(jì)帶來一定難度。
支持向量機(jī)(support vector machine,SVM)是國(guó)內(nèi)外眾多學(xué)者研究的熱點(diǎn)[6-11]。汪閩等[12-13]設(shè)計(jì)了一種使用非線性映射SVM從高分辨率遙感影像中提取道路信息的方法。SONG M等[14]對(duì)于遙感影像中被遮擋的道路使用區(qū)域增長(zhǎng)法進(jìn)行提取,然后使用SVM將遙感影像分為道路和非道路兩大類。GHULE S A等[15]提出,借助紋理特征和顏色特征分析遙感影像中道路信息,然后采用SVM提取道路網(wǎng)信息。但是,這些算法存在提取的道路位置不準(zhǔn)確、像素錯(cuò)分等問題,導(dǎo)致道路信息提取的整體精度不高。本文提出了一種改進(jìn)的SVM算法。該方法首先使用K均值聚類算法(K-means clustering algorithm)對(duì)遙感影像進(jìn)行聚類分析,抓住關(guān)鍵樣本,剔除沉冗樣本,然后使用SVM提取道路信息,可以降低誤判率。
該算法首先將樣本聚類為K個(gè)簇,然后計(jì)算每個(gè)對(duì)象到各聚類中心的距離,把每個(gè)對(duì)象分配給距離它最近的聚類中心。
(1)隨機(jī)選擇K個(gè)對(duì)象作為原始的聚類中心;
(2)計(jì)算每個(gè)樣本點(diǎn)到聚類中心的距離,將每個(gè)樣本點(diǎn)歸類到距離該點(diǎn)最近的聚類中心;
(3)計(jì)算每個(gè)聚類中所有點(diǎn)的質(zhì)心(坐標(biāo)平均值);
(4)如果簇的質(zhì)心不變,則返回到劃分結(jié)果,否則轉(zhuǎn)到步驟(2)。
隨機(jī)選擇k個(gè)聚類中心μ1,μ2,…,μk∈R。然后對(duì)各個(gè)樣本進(jìn)行分類計(jì)算:
ci=argminxi-μj2
(1)
對(duì)于每一個(gè)類j,重新計(jì)算該類的質(zhì)心
(2)
式(1)—式(2)中ci表示的是樣本i與各類k中距離最近的類,質(zhì)心μj則代表用戶對(duì)屬于同一個(gè)類的樣本中心點(diǎn)的猜測(cè)。分好類后,用戶要重新計(jì)算它的質(zhì)心然后重復(fù)迭代直至質(zhì)心不變。
(1)構(gòu)造n個(gè)二值分類器,fk(x),k=[1,n]。將第k類的訓(xùn)練樣本和其他訓(xùn)練樣本集分開。若樣本xi屬于第k類,則有sgnfk(xi)=1,否則sgnfk(xi)=-1。
(2)尋找函數(shù)fk(xi),k=[1,n]中最大值所對(duì)應(yīng)的類別即為xi的類別,yi=argmaxf1(xi),f2(xi),…,fn(xi)。
本文選擇具有線性核函數(shù)的SVM將原始影像分為道路和非道路兩大類,主要過程是先將原始遙感影像經(jīng)過K均值聚類,然后通過SVM提取道路信息。最后,將K均值+SVM提取道路信息結(jié)果與直接使用SVM提取道路信息結(jié)果進(jìn)行精度比較。
本次選用的實(shí)驗(yàn)數(shù)據(jù)是由高分二號(hào)衛(wèi)星采集的合肥市城區(qū)的部分道路影像,分辨率為4 m的多光譜數(shù)據(jù)。選取的合肥城區(qū)實(shí)驗(yàn)數(shù)據(jù)原始影像見圖1,影像中包含了道路、房屋、植被、水體等地物信息。
圖1 原始影像數(shù)據(jù)
實(shí)驗(yàn)在matlab環(huán)境下實(shí)現(xiàn),實(shí)驗(yàn)1是選擇線性核函數(shù)的SVM直接提取道路信息,提取結(jié)果見圖2。實(shí)驗(yàn)2是先將遙感影像經(jīng)過K均值聚類,然后通過SVM提取道路信息,提取結(jié)果見圖3。通過視覺分析,從提取結(jié)果可以看出,SVM算法提取結(jié)果噪聲較大,而K均值+SVM提取結(jié)果噪聲較小,提取結(jié)果相對(duì)更準(zhǔn)確一些。
圖2 直接使用SVM提取道路信息結(jié)果
圖3 K均值+SVM提取道路信息結(jié)果
通過實(shí)驗(yàn)可以看出,兩種方法提取的道路信息完全不同,直接使用SVM提取道路的噪聲較大,而使用K均值+SVM提取道路信息的噪聲較小。為了更精確地評(píng)估兩種方法提取道路的精度,可以采用數(shù)據(jù)分析的方法評(píng)估道路提取的精度??筛鶕?jù)所提取道路的幾何長(zhǎng)度,使用準(zhǔn)確度、冗余誤差和遺漏誤差對(duì)提取道路結(jié)果進(jìn)行評(píng)估。
(3)
(4)
(5)
根據(jù)實(shí)驗(yàn)中所提取的道路信息結(jié)果,表1列出了實(shí)驗(yàn)1和實(shí)驗(yàn)2中提取道路信息的準(zhǔn)確度、冗余誤差和遺漏誤差。從表1中可以看出,直接使用SVM提取道路信息的準(zhǔn)確度、冗余誤差和遺漏誤差分別為81.29%、0.85%和12.24%,使用K均值+SVM的準(zhǔn)確度、冗余誤差和遺漏誤差分別為92.15%、0.19和5.31。通過K均值+SVM算法提取道路信息比直接使用SVM算法提取道路信息精度更好。
表1 道路目標(biāo)提取結(jié)果的精度統(tǒng)計(jì)
高空間分辨率遙感影像中道路信息的紋理特征和幾何特征都非常豐富。本文基于高分二號(hào)遙感影像數(shù)據(jù)采用K均值與SVM相結(jié)合的方法提取道路信息,通過算法精度分析,該方法提取道路信息精度比直接使用SVM提取道路信息效果更好。但是,使用K均值與SVM相結(jié)合的方法提取道路信息時(shí),仍存在道路信息丟失及自動(dòng)化程度不高等問題,需要進(jìn)一步深入研究。
浙江水利水電學(xué)院學(xué)報(bào)2021年3期