龔 亮,張永生,李正國,包全福
(1.信息工程大學(xué)測繪學(xué)院,河南鄭州450052;2.江西省數(shù)字國土重點(diǎn)實驗室,江西撫州344000)
基于強(qiáng)度信息聚類的機(jī)載LiDAR點(diǎn)云道路提取
龔 亮1,2,張永生1,李正國1,包全福1
(1.信息工程大學(xué)測繪學(xué)院,河南鄭州450052;2.江西省數(shù)字國土重點(diǎn)實驗室,江西撫州344000)
提出一種利用強(qiáng)度信息聚類提取機(jī)載LiDAR點(diǎn)云道路的方法,并綜合利用回波次數(shù)信息與高程信息對分類結(jié)果進(jìn)行進(jìn)一步精化。采用北京鳳凰嶺地區(qū)某塊機(jī)載LiDAR數(shù)據(jù)進(jìn)行試驗,試驗結(jié)果表明,通過強(qiáng)度信息聚類從LiDAR點(diǎn)云中提取道路能取得一定效果,但誤差較大;經(jīng)過回波次數(shù)和高程信息篩選精化后,試驗效果得到明顯提升,大量的誤分點(diǎn)被去除,道路點(diǎn)云得到較好的保留。
機(jī)載激光掃描;點(diǎn)云;強(qiáng)度;K均值聚類;模糊C均值聚類
激光雷達(dá)(light detection and ranging,LiDAR)系統(tǒng)融合了激光雷達(dá)、全球定位系統(tǒng)(GPS)和慣性導(dǎo)航系統(tǒng)(INS),可以快速有效地獲取測區(qū)表面的三維坐標(biāo)信息,得到了越來越廣泛的應(yīng)用。機(jī)載LiDAR系統(tǒng)在測定激光腳點(diǎn)三維坐標(biāo)的同時,還能夠記錄該激光腳點(diǎn)位置反射激光信號的強(qiáng)度信息。本文的目的就是要利用LiDAR點(diǎn)云數(shù)據(jù)的強(qiáng)度信息對非城區(qū)進(jìn)行道路的提取。
目前強(qiáng)度信息在點(diǎn)云數(shù)據(jù)處理中的應(yīng)用還不多見,JeongHeon Song等人對利用強(qiáng)度信息進(jìn)行LiDAR數(shù)據(jù)分類的可行性做出了評估[1];James Bethel等人綜合利用強(qiáng)度信息和三維坐標(biāo)信息進(jìn)行了道路提?。?]。理論上,激光回波強(qiáng)度與地物目標(biāo)的反射率成正比關(guān)系,即反射率越大激光強(qiáng)度值越高。但是激光雷達(dá)系統(tǒng)記錄的回波強(qiáng)度是尚未經(jīng)過校正的值,會受大氣衰減、激光入射角度等多種因素的影響,而且激光回波強(qiáng)度的校正至今還是一個比較困難的課題,因此激光回波強(qiáng)度很難真實地反映地物的反射率信息。但利用激光回波強(qiáng)度信息能夠區(qū)分開介質(zhì)屬性區(qū)別較明顯的地物。
在非城區(qū),道路通常為水泥材質(zhì),而且兩旁通常都是植被或者莊稼地,所以通過強(qiáng)度信息聚類可以將道路從點(diǎn)云中分離出來。目前常見的聚類算法主要有基于劃分的方法和基于網(wǎng)格的方法[3]。本文采用的聚類算法為K均值聚類和模糊C均值聚類算法,它們都是基于劃分的方法,優(yōu)點(diǎn)是通過最小空間距離達(dá)到均衡狀態(tài),而且收斂速度較快。
1.K均值聚類
K均值聚類[4]屬于劃分型聚類方法,應(yīng)用領(lǐng)域十分廣泛。假設(shè)待聚類數(shù)據(jù)為X={x1,…,xn}(其中,xj={xj1,…,xjq}∈Rq,j=1,…,N),則K均值聚類問題就是要找到X的一個劃分pk={C1,…,Ck},使目標(biāo)函數(shù)最小。式中表示第i個類的中心位置(i= 1,…,k);n是類Ci中數(shù)據(jù)項的個數(shù);d(xl,mi)表示xl到mi的距離。而K均值聚類算法的具體工作流程如下:
1)選取k個初始聚類中心{c1,c2,…,ck}(其中cj={cj1,cj2,…,cjd}),給定聚類最大迭代次數(shù)I和迭代結(jié)束的最大收斂系數(shù)T。
2)根據(jù)歐氏距離公式,計算每個數(shù)據(jù)到各類的距離,并將各數(shù)據(jù)劃分到具有最小距離的類中。其中,距離計算公式為
式中,d(xi,mj)表示第i個矢量數(shù)據(jù)到第j個聚類的距離。
3)重新計算k個聚類的中心值 {m1,m2,…,mk},計算公式為
式中,mj為第j類的聚類中心。
4)檢驗聚類操作是否應(yīng)該結(jié)束。若迭代次數(shù)等于I,則結(jié)束聚類;否則計算該次迭代的各個收斂聚類,若每個類的收斂距離都小于給定參數(shù)T,則結(jié)束;否則,轉(zhuǎn)向步驟2),繼續(xù)迭代。收斂距離的計算公式為
式中,j=1,…,k;l=1,…,d;k為當(dāng)前迭代次數(shù)。
K均值聚類算法是一種滿足最小二乘誤差約束的迭代算法,它通過移動類中心而逐次優(yōu)化聚類結(jié)果。但該方法受到選定的聚類數(shù)和給定的初始類中心位置的影響。
2.模糊C均值聚類
模糊C均值算法[5]是由Dunn于1974年提出并經(jīng)Bezdek加以推廣的模糊聚類算法。其原理為:把N個M維數(shù)據(jù)集X={Xj,|j=1,2,…,N}劃分為模糊類別F~={F~i|i=1,2,…,c}。通過計算歐氏距離d的度量,求得第i個聚類F~i的類心Vi(1≤i≤c),使得準(zhǔn)則函數(shù)J(U,V)最小化。
式中,m為模糊加權(quán)系數(shù);μij∈U是數(shù)據(jù)Xj屬于~Fi的模糊隸屬度,它必須滿足以下的約束條件
模糊C聚類算法計算簡單,運(yùn)算速度快,但是對噪聲數(shù)據(jù)敏感。
本文試驗數(shù)據(jù)為北京鳳凰嶺地區(qū)的一塊機(jī)載LiDAR數(shù)據(jù),該塊數(shù)據(jù)采用Riegl公司的LMS Q560系統(tǒng)獲得,總點(diǎn)數(shù)為129 636,平均點(diǎn)云密度為1.7個/m2。數(shù)據(jù)區(qū)中包含道路、植被和建筑物等信息。數(shù)據(jù)區(qū)的航空正射影像如圖1(a)所示,原始點(diǎn)云分層設(shè)色如圖1(b)所示。
1.強(qiáng)度信息預(yù)處理
由于激光雷達(dá)的回波強(qiáng)度值中有很多的粗差,在道路區(qū)域內(nèi)的點(diǎn)也可能出現(xiàn)強(qiáng)度值與道路兩邊其他類別地物像素的強(qiáng)度值相同的情形。因此,直接利用激光強(qiáng)度信息進(jìn)行地物的識別和提取還有很大困難。在利用回波強(qiáng)度進(jìn)行地物點(diǎn)云提取時,首先應(yīng)該進(jìn)行強(qiáng)度值的規(guī)則化等預(yù)處理,然后利用處理后的強(qiáng)度數(shù)據(jù)分析典型地物的強(qiáng)度值差異。強(qiáng)度值規(guī)則化預(yù)處理包括去除粗差點(diǎn)(奇異點(diǎn))和強(qiáng)度值范圍變換等,首先去除明顯錯誤的異常強(qiáng)度值,然后變換強(qiáng)度值的動態(tài)分布范圍,將強(qiáng)度值的分布范圍拉伸到0~255之間。本文采用線性拉伸法對強(qiáng)度值的分布范圍進(jìn)行變換,線性拉伸法是采用線性關(guān)系將原始的強(qiáng)度值變換到新的強(qiáng)度值。
圖1 試驗數(shù)據(jù)影像與原始點(diǎn)云
設(shè)原數(shù)據(jù)的強(qiáng)度值為I,強(qiáng)度值的分布范圍為[Imin,Imax],變換后數(shù)據(jù)的強(qiáng)度值為Int,強(qiáng)度值的分布范圍為[Intmin,Intmax],則原數(shù)據(jù)和變換后數(shù)據(jù)強(qiáng)度值之間的對應(yīng)關(guān)系為
圖2(a)中點(diǎn)云數(shù)據(jù)的原始回波強(qiáng)度值范圍為10~165,通過回波強(qiáng)度值的線性拉伸得到的強(qiáng)度值數(shù)據(jù)如圖2(b)所示。
圖2 線性拉伸前后的強(qiáng)度值圖像顯示
2.強(qiáng)度信息聚類
理論上,激光回波強(qiáng)度與目標(biāo)的反射率成正比,目標(biāo)反射率越大,激光強(qiáng)度值越高。但是激光雷達(dá)系統(tǒng)記錄的回波強(qiáng)度是尚未經(jīng)過校正的值,受激光入射角度、大氣衰減等多種因素的影響,而且激光回波強(qiáng)度的校正至今仍然是一個比較困難的課題。因此,單純利用激光回波強(qiáng)度很難判斷出地物屬性。但不同地物的反射強(qiáng)度會有不同程度的差別,利用激光回波強(qiáng)度信息聚類能夠區(qū)分開介質(zhì)屬性區(qū)別較明顯的地物。
本文分別利用K均值聚類和模糊C均值聚類對線性拉伸后的強(qiáng)度值進(jìn)行聚類。通過采集訓(xùn)練樣本確定初始聚類中心為{7,82,164,247},聚類數(shù)均為4。圖3為K均值聚類結(jié)果;圖4為模糊C均值聚類結(jié)果;表1為兩種聚類算法對比。
圖3 K均值聚類結(jié)果
圖4 模糊C均值聚類結(jié)果
表1 兩種聚類算法對比
從圖3、圖4和表1可以看出,模糊C均值聚類雖然運(yùn)算速度快,但是效果要遠(yuǎn)差于K均值聚類。原因在于模糊C均值聚類對噪聲很敏感,而LiDAR點(diǎn)云數(shù)據(jù)的強(qiáng)度信息噪聲較大,導(dǎo)致聚類效果不夠好。
觀察圖3聚類結(jié)果和圖1(a)的航空影像可以發(fā)現(xiàn),當(dāng)?shù)缆穬膳詾橹脖坏扰c道路反射強(qiáng)度差別較大的地物時,聚類效果較好。但也有許多與道路材質(zhì)差別小的地物被誤分為道路點(diǎn),如建筑物、水泥地面等。
3.聚類結(jié)果篩選精化
由于道路點(diǎn)通常是僅有一次回波,所以首先可以利用回波次數(shù)信息對分為道路一類的數(shù)據(jù)進(jìn)行再次篩選。Num(number of returns)表示產(chǎn)生該點(diǎn)的這次脈沖的總回波數(shù),Rnum(return number)表示該點(diǎn)回波在這一次脈沖所有回波(Num)中的次序。本步驟的目的是要去除道路點(diǎn)中Num>1的點(diǎn)。K均值聚類提取的道路如圖5所示;利用回波次數(shù)信息篩選結(jié)果如圖6所示。
圖5 K均值聚類提取的道路
圖6 回波次數(shù)篩選結(jié)果
從圖6可以看出,還有一些建筑物點(diǎn)沒有被去除,因為建筑物通常也只有一次回波,這個特性與道路一樣。但是利用高程信息可以進(jìn)一步將建筑物與道路區(qū)分,由于試驗區(qū)地勢較平坦,所以可以直接利用高程閾值將建筑物過濾。本試驗高程閾值T=90 m,將圖6中高程大于90 m的點(diǎn)去除,結(jié)果如圖7所示。
圖7 高程閾值篩選結(jié)果
經(jīng)過回波次數(shù)和高程閾值篩選后,大量的誤分點(diǎn)(如建筑物點(diǎn))被去除,道路點(diǎn)得到較好的保留。但是仍有一些點(diǎn)(如水泥地面點(diǎn))難以區(qū)分,目前只能結(jié)合航空影像進(jìn)行目視判讀,道路的進(jìn)一步精確自動提取還需要深入研究。
通過激光回波強(qiáng)度信息聚類分析,能比較容易地區(qū)分開植被和水泥介質(zhì)的道路,但是對于某些回波強(qiáng)度相似的地物點(diǎn)和道路則較難區(qū)分。同時也證明了模糊C均值聚類對噪聲數(shù)據(jù)非常敏感,聚類效果差于K均值聚類。在經(jīng)過K均值聚類后,本文先后利用回波次數(shù)信息和高程信息對結(jié)果進(jìn)行了進(jìn)一步的精化,效果比較顯著,基本上可以去除一般地面點(diǎn)和建筑物的影響,但是水泥地面與道路的區(qū)分還比較困難,需要作進(jìn)一步的研究。
[1] SONG J H,HAN S H,YU Kiyun.Assessing the Possibility of Land-cover Classification Using LiDAR Intensity Data[C]∥ISPRS CommissionⅢ.Graz:[s.n.],2002.
[2] ALHARTHY A,BETHEL J.Automated Road Extraction from LiDAR Data[C]∥Proceedings of American Society of Photogrammetry and Remote Sensing.Ancharage,Alaska:[s.n.],2003.
[3] 劉春,陳華云,吳杭彬.激光三維遙感的數(shù)據(jù)處理與特征提?。跰].北京:科學(xué)出版社,2010.
[4] 余旭初.模式識別與人工智能[M].北京:解放軍出版社,2000.
[5] 卜娟,王向陽,孫藝峰.基于模糊C均值聚類的多分量彩色圖像分割算法[J].中國圖象圖形學(xué)報,2008,13(10):1837-1840.
Automated Road Extraction from LiDAR Data Based on Clustering of Intensity
GONG Liang,ZHANG Yongsheng,LI Zhengguo,BAO Quanfu
0494-0911(2011)09-0015-03
P237
B
2010-09-06
江西省數(shù)字國土重點(diǎn)實驗室開放研究基金資助項目(DLLJ201001);測繪學(xué)院碩士學(xué)位論文創(chuàng)新與創(chuàng)優(yōu)基金資助項目
龔 亮(1985—),男,四川自貢人,碩士生,主要研究方向為機(jī)載LiDAR數(shù)據(jù)處理。