付杰 ,宋倫,2 ,于旭光,2 ,雷利元
(1.遼寧省海洋水產(chǎn)科學(xué)研究院 大連 116023;2.遼寧省海洋環(huán)境監(jiān)測總站 大連 116020)
《中華人民共和國海島保護(hù)法》中的海島是指“四面環(huán)海水并在高潮時高于水面的自然形成的陸地區(qū)域,包括有居民海島和無居民海島”。海島作為重要的國土資源,在維護(hù)國家安全與海洋權(quán)益、保障海洋生態(tài)環(huán)境安全等方面具有不可替代的作用。近年來,隨著我國沿海經(jīng)濟(jì)的快速發(fā)展,近岸海島成為海洋經(jīng)濟(jì)發(fā)展的前沿陣地,然而海島資源有限,生態(tài)承載力低、生態(tài)系統(tǒng)脆弱,如何實施海島及其周邊海域可持續(xù)利用,是當(dāng)前重大而又緊迫的任務(wù)。當(dāng)今,遙感監(jiān)測技術(shù)發(fā)展主要呈現(xiàn)“高空間分辨率”“高光譜分辨率”與“多時相/高時相”等優(yōu)勢,廣泛應(yīng)用于海島土地利用監(jiān)測領(lǐng)域。隋玉正等[1]利用SPOT-5 影像結(jié)合實地調(diào)查,分析了2004年、2008年 和2010 年浙江洞頭縣43個海島填海造地時空變化。李利紅等[2]以西門島SPOT-5影像為數(shù)據(jù)源,通過不同單尺度紋理指數(shù)結(jié)合光譜信息得出不同精度的土地利用分類,篩選出最佳波段和最佳紋理指數(shù)。楊曦光等[3]探討利用決策樹分類器對鏌铘島土地利用進(jìn)行分類,相較其他分類器得到較好的分類結(jié)果。王忠芳等[4]利用南威島QuickBird遙感影像,通過加權(quán)均值方差法和最大面積法確定了島礁上各類典型地物的最優(yōu)分割尺度。上述方法代表遙感圖像分類的4個階段:人工解譯、基于像素的光譜自動分類、基于像素的專家決策樹分類和面向?qū)ο髨D像分類。人工解譯需要一種先驗知識,在遙感圖像尋找對應(yīng)關(guān)系?;谙袼氐膱D像分類以像元為研究尺度,主要利用光譜特征,使用統(tǒng)計學(xué)方法、支持向量機(jī)、最大似然法等進(jìn)行分類。但是這些方法存在明顯局限,首先單純地采用光譜特征未考慮其紋理特征和幾何特征,造成分類精度低下;其次分類器需要處理大量的影像數(shù)據(jù),效率低下;最后未考慮影像的空間結(jié)構(gòu)信息和相鄰像元之間的影響關(guān)系,造成“椒鹽”及錯分現(xiàn)象,直接影響分類精度。面向?qū)ο蠓诸悓υ杏跋癜凑找欢ǖ囊?guī)則進(jìn)行分割,從而提取同質(zhì)對象,將最小的工作單元由像元變成同質(zhì)對象。用同質(zhì)對象間的關(guān)系反映地面實體間的聯(lián)系,充分利用影像的光譜、紋理、形狀等特征,能夠十分有效地保持地類的完整性,是目前主流的分類方法。
面向?qū)ο蠓指畛叨葏?shù)的選擇直接決定著同質(zhì)對象斑塊的大小。參數(shù)設(shè)置上,如果選擇的分割尺度過大,分割得到的對象數(shù)量就越少,易將不同類型的地物分割成為一個同質(zhì)對象,降低分類精度,地物類別處于“欠擬合”狀態(tài)。反過來,選擇的分割尺度越小,分割得到的對象數(shù)量就越多,大大降低了運算效率,地物處于“過擬合”狀態(tài)。如何智能高效地選擇最優(yōu)分割尺度來提高海島土地利用的分類精度是個值得研究的問題。
分類器的選擇對于分類結(jié)果也是至關(guān)重要的,針對簡單地物類別,擬合能力強(qiáng)泛化能力弱的分類器就可以通過較少的訓(xùn)練樣本得到較好分類結(jié)果。反之,如果是復(fù)雜地物,那么分類器學(xué)習(xí)就需要大量的訓(xùn)練樣本和泛化能力強(qiáng)的學(xué)習(xí)算法。好的分類器能夠根據(jù)分類對象復(fù)雜度和訓(xùn)練樣本的數(shù)量自動地調(diào)整擬合能力和泛化能力之間的平衡。
本研究提出一種局部方差變化率算法計算海島地類所對應(yīng)的多級最優(yōu)分割尺度,借助隨機(jī)森林算法分類器對海島土地利用進(jìn)行智能化分類,目的是提高分類效率和精度,為開展海島土地利用適宜性、開發(fā)強(qiáng)度和生態(tài)承載力評價提供前期技術(shù)參考。
覺華島,俗稱“大海山”,又稱“菊花島”,位于遼東灣西部,連山灣與長山寺灣之間,遼寧省興城市曹莊鎮(zhèn)對面,距大陸最近(遼寧省興城市曹莊鎮(zhèn)五城子村)6.7 km,其地理坐標(biāo)120°48'49.4″E,40°30'08.7″N。整體呈NE-SW 走向,形似長葫蘆,兩頭寬闊,中間窄細(xì)。最長處約6 km,寬1~4 km,海島岸線長245 km,海島面積11.25 km2,是遼東灣內(nèi)最大的島嶼。島上最高點為大架山,海拔198.2 m。海島周邊海域分布有磨盤山島、楊家山島、張家山島、雙砬子礁島、無名島XCL4等島礁。
本研究采用的遙感數(shù)據(jù)源是2018年6月28日獲取的北京二號衛(wèi)星0.8 m 全色波段和3.2 m 多光譜波段影像,覆蓋面積62 km2。波段范圍:藍(lán)色,440~510 nm;綠色,510~590 nm;紅色,600~670 nm;全色,450~650 nm;近紅外,760~910 nm。多光譜與全色融合后的圖像最高分辨率為0.8 m,換算成比例尺為1∶(0.8×3 779.52)=1∶3 023.616,所以成圖比例尺為1∶5 000。本研究還搜集了1∶5 000 研究區(qū)內(nèi)第三次土地利用現(xiàn)狀調(diào)查矢量數(shù)據(jù),主要用于該研究方法分類精度評價。
數(shù)據(jù)預(yù)處理首先對獲取影像進(jìn)行輻射定標(biāo)、FLAASH 大氣校正和幾何配準(zhǔn),配準(zhǔn)誤差在一個像素之內(nèi)。用搜集12.5 m 分辨率的DEM 進(jìn)行正射校正,對研究區(qū)影像同時進(jìn)行傾斜改正和投影差改正。為了提高影像的空間分辨率,將多光譜和與之對應(yīng)的全色波段進(jìn)行Gram-Schmidt算法的波段融合,該融合方法原始多光譜和輻射校正后的多光譜各自融合后的色彩效果相差極小,能保持融合前后影像波譜信息的一致性,是一種高保真的遙感影像融合方法。
圖像分割是面向?qū)ο蠓诸惣夹g(shù)最為基礎(chǔ)和重要的問題,尺度直接決定著分類后的精度。本研究采用多尺度分割(multiresolution segmentation)算法,能夠達(dá)到給定尺度較好的地物斑塊提取效果。多尺度分割是一種自下而上(bottom-up)的分割技術(shù),其目的是實現(xiàn)分割后影像對象內(nèi)部異質(zhì)性最小化。在分割過程中,需要綜合考慮光譜異質(zhì)性和形狀異質(zhì)性,以實現(xiàn)分割對象形狀緊湊以及邊界光滑的效果。形狀異質(zhì)性又包括光滑度與緊致度兩個因子[5]。
(1)影像對象的光譜異質(zhì)性hspectrum:
式中:C為參與分割波段的總波段數(shù);Wc為對應(yīng)波段權(quán)重;σc為該波段的影像對象標(biāo)準(zhǔn)差,由構(gòu)成一個影像對象的所有像素值計算得到。標(biāo)準(zhǔn)差代表了影像灰度分布的波動情況,可以用來衡量整體差異。
(2)影像對象的形狀異質(zhì)性hshape:
式中:hsmooth代表光滑度異質(zhì)性參數(shù);hcompact代表緊致度參數(shù);W代表各自的權(quán)重值,二者和為一。光滑度是對象的周長l與最小外包矩形周長b的比值,用來表示對象的平滑程度,是衡量對象規(guī)則與否的一種指標(biāo)。緊致度是對象的周長l與對象大小(對象的像素數(shù)n)的平方根的比值,衡量對象接近圓的程度。若光滑度權(quán)重越高,分割后的圖像斑塊邊界就越光滑,反之,緊致度權(quán)重越高,分割后的圖像斑塊邊界就越接近矩形。
(3)影像對象合并前后的異質(zhì)性:
式中:nobj1、nobj2為兩個相鄰的子對象像素數(shù),nmerge為合并新生成的對象像素數(shù);為兩個相鄰的子對象標(biāo)準(zhǔn)差為合并新生成的對象標(biāo)準(zhǔn)差。得出結(jié)果為對象合并后得到的光譜異質(zhì)性值。
(4)影像對象的總異質(zhì)性f:
f=Wspectrum×hspectrum+Wshape×hshape
式中:對象的總體異質(zhì)性f由光譜異質(zhì)性和形狀異質(zhì)性的加權(quán)平均值所構(gòu)成。Wspectrum和Wshape代表光譜和形狀的權(quán)重值,二者之和為一。
多尺度分割僅僅是高分辨率影像解譯的第一步,針對海島每一種的土地利用類型,理論意義上都會存在一個最佳尺度與之相吻合,尚不存在單一的普適尺度滿足所有地類,智能快速高效獲取最佳尺度仍是面向?qū)ο笥跋穹指畹难芯繜狳c。過往研究中,有不斷反復(fù)“試錯法”,通過目視解譯定性判斷不同地類的最佳分割尺度;于歡等[6]提出了矢量距離指數(shù)法來解決面向?qū)ο筮b感影像分類中的最優(yōu)分割尺度選擇問題,取得較好效果;后續(xù)國外學(xué)者Drǎgu?等[7]引入局部方差變化率(ROC-LV)并開發(fā)了尺度參數(shù)估算2.0(ESP2)模塊,是對最早采用局部方差(LV)法的改進(jìn),用于評價不同尺度分割結(jié)果整體最大異質(zhì)性。該模塊能直觀顯示局部方差變化率隨分割尺度變化曲線,曲線對應(yīng)的峰值指向了可能的最優(yōu)分割尺度。由于影像的復(fù)雜性,最優(yōu)分割尺度往往存在很多個,這是針對影像所包含不同地物類別得出的。本研究利用ESP2確定多個最佳分割尺度,目的使得分割對象內(nèi)同質(zhì)性最大且對象間異質(zhì)性最大。LV和ROC-LV的計算公式為:
式中:CL為單個影像對象在第L波段的亮度值;為影像所有對象在第L波段的亮度均值;m為影像對象總個數(shù);LVL-1表示將L目標(biāo)層當(dāng)作基準(zhǔn)的下一層局部方差。
最佳尺度分割得到影像對象作為面向?qū)ο笥跋穹诸惖淖钚卧?后期必須經(jīng)過不同地物類別樣本選取、最優(yōu)特征篩選、使用最優(yōu)特征子集訓(xùn)練樣本、選擇合適分類器對多尺度影像對象進(jìn)行分類。分類器的選擇也是本研究的關(guān)鍵。目前主流的監(jiān)督分類器有:貝葉斯、K最近鄰、支持向量機(jī)、決策樹、隨機(jī)森林和深度學(xué)習(xí)等。針對特定分類問題,選擇最適合分類器的最佳途徑是測試算法,即選擇在交叉驗證中表現(xiàn)最好的,首要考慮的是分類精度、訓(xùn)練和分類速度、易用性和原始數(shù)據(jù)集大小等因素。支持向量機(jī)、隨機(jī)森林和K最近鄰精度高,效率不是很高,不利于解釋;決策樹精度和效率適中,容易發(fā)生過擬合,可解釋性好,易用性好;貝葉斯能對大規(guī)模數(shù)據(jù)進(jìn)行分類,效率高,但需要計算先驗概率,決策分類存在錯誤率;深度學(xué)習(xí)分類精度高,可移植性好且學(xué)習(xí)能力強(qiáng),但模型過于復(fù)雜、計算量大和對軟硬件要求較高,目前在AI領(lǐng)域很有前景,屬于比較“奢侈”的分類器。本研究采用隨機(jī)森林(RF)分類器對基于最佳尺度的海島土地利用類別進(jìn)行分類。RF 分類核心思想[8]是以指定決策樹數(shù)量(Ntree)為基礎(chǔ)的集成分類器。分類過程是對所有決策樹的決策結(jié)果使用“少數(shù)服從多數(shù)”原則進(jìn)行打分,得到最終的分類結(jié)果。袋外數(shù)據(jù)(OOB)誤差決定分類精度。
隨機(jī)森林方法主要包括訓(xùn)練與分類兩個過程。生成RF的步驟如下[9]:①訓(xùn)練過程通過Bootstrap自助抽樣方法從訓(xùn)練樣本中有放回地隨機(jī)抽取K個樣本子集,構(gòu)建K棵樹,沒有抽中的樣本作為袋外數(shù)據(jù),共計K個袋外數(shù)據(jù)。②每一棵樹的所有節(jié)點有放回的抽取m個(m小于對應(yīng)樣本子集中總特征數(shù)量M)特征,通過計算每一個特征所包含的信息量,在m個特征中選擇一個最具分類能力的特征進(jìn)行節(jié)點分裂。③每棵樹最大限度生長,不做修剪。④由生成的每棵樹組建隨機(jī)森林,用隨機(jī)森林對沒有參與采樣數(shù)據(jù)進(jìn)行分類,按照如下算式產(chǎn)生分類結(jié)果:
式中:H(x)為RF 最終分類結(jié)果;hi(x)為單棵樹分類結(jié)果;Y為輸出變量;I為示性函數(shù)。分類后,結(jié)合驗證樣本得到每一地類分類的Kappa系數(shù)和總體精度。采用多尺度可連續(xù)性技術(shù),保證相鄰地類邊界的一致性,最終所有土地利用分類結(jié)果呈現(xiàn)在一幅圖上。采用聚類技術(shù),對分類圖像進(jìn)一步完善,技術(shù)流程如圖1所示。RF 具備復(fù)雜地物分類的能力,對于噪聲和存在缺損值的數(shù)據(jù)具有良好的魯棒性,同時具有較快的學(xué)習(xí)速度,其對多維特征數(shù)據(jù)重要性程度進(jìn)行度量,依據(jù)特征貢獻(xiàn)率進(jìn)行最優(yōu)特征篩選,從而達(dá)到對高維特征空間進(jìn)行降維的目的。相較當(dāng)前流行的分類器具有較高的準(zhǔn)確性和穩(wěn)健性。因此,本研究使用RF進(jìn)行分類。
圖1 技術(shù)流程
執(zhí)行多尺度分割需要首先設(shè)置形狀因子和緊致度因子,針對森林覆蓋度較高區(qū)域,過往研究得出在因子0.5 附近[10],分割結(jié)果更為符合研究區(qū)覆蓋特征。本研究在50~545尺度參數(shù)范圍內(nèi)開展以單位步長為5 進(jìn)行遞增的多尺度分割測試,將形狀因子和緊致度因子參數(shù)設(shè)置為3種情況來計算最優(yōu)分割尺度:①Wshape=0.5,Wcompact=0.4;②Wshape=0.5,Wcompact=0.6;③Wshape=0.4,Wcompact=0.6。局部方差及變化率隨分割尺度變化曲線見圖2。由圖2 可以得出:Wshape=0.5,Wcompact=0.4,對應(yīng)最佳尺度為75、135、230、415;Wshape=0.5,Wcompact=0.6,對應(yīng)最佳尺度為65、90、180、520;Wshape=0.4,Wcompact=0.6,對應(yīng)最佳尺度為80、160、355、465。
圖2 多分割尺度LV、ROC變化曲線
經(jīng)目視解譯,在影像上選取7處位置依次分別對應(yīng)典型7類地物類型:淤泥質(zhì)海岸、農(nóng)用地、林草地、建設(shè)用地、針葉林地、水體和基巖海岸。利用3組形狀因子和緊致度因子對應(yīng)最佳尺度對研究區(qū)影像進(jìn)行分割,為保證同一組內(nèi)不同尺度分割結(jié)果得到對象邊界的連續(xù)性,首先需要實現(xiàn)在最小尺度下分割出若干子對象,然后不斷向上(Create above)重新聚類實現(xiàn)較大尺度下分割出中間對象,最后在最大尺度下生成一個父對象(圖3至圖5,表1)。
表1 最佳尺度分割層次
經(jīng)過實地踏勘,結(jié)合圖3、圖4、圖5和表1可以得到:當(dāng)分割尺度小于160 時,影像產(chǎn)生對象均在15 000以上,在7類典型地物類別中,真實地物斑塊要比分割后的影像對象大,地物類別處于過擬合狀態(tài),代表地類有淤泥質(zhì)海岸、水體和基巖海岸;尺度大于180時,其他4類典型地類分割數(shù)量驟減,真實地物斑塊要比分割后的影像對象小,地物類別處于欠分割狀態(tài)。因此,圖3至圖5中農(nóng)用地應(yīng)繼續(xù)細(xì)分為有茬(長有農(nóng)作物)耕地和無茬耕地。林草地應(yīng)細(xì)分為落葉闊葉林地和草地。建設(shè)用地應(yīng)細(xì)分為建筑物、道路和裸地。上述確定海島地類的核心思想是:選擇經(jīng)ESP2模塊計算的最優(yōu)分割尺度,再將分割結(jié)果對象與影像進(jìn)行疊加分析,通過實地判
圖3 Wshape=0.4,Wcompact=0.6
圖4 Wshape=0.5,Wcompact=0.4
圖5 Wshape=0.5,Wcompact=0.6
讀研究分割對象與地類斑塊兩者的邊界形狀、面積大小以及分割個數(shù)的吻合程度,從而判定該尺度針對該地類分割結(jié)果的好壞。如果一種地類,隨著分割尺度減小,生成對象數(shù)量急劇上升,表明該地類“不純”,需要細(xì)分。為便于對比研究不同地類對應(yīng)最佳尺度,本研究將覺華島及周邊島嶼劃分11個土地利用類別,分別為建筑物、道路、裸地、常綠針葉林地、落葉闊葉林地、灌草地、有茬耕地、無茬耕地、粉砂淤泥質(zhì)海岸、基巖海岸和水域。
本研究共提取3類特征,分別是光譜、紋理和幾何特征。
(1)光譜特征包含所有波段像元亮度均值(brightness)、標(biāo)準(zhǔn)差(standard deviation)、最大差分(Max.diff.)、每個波段像元亮度均值(mean)、貢獻(xiàn)率(ratio)、歸一化植被指數(shù)(NDVI)、歸一化水體指數(shù)(NDWI)、土壤指數(shù)(NDSI)和建筑物面積指數(shù)(BAI),共4個波段累計18個特征。
(2)紋理特征使用灰度共生矩陣(GLCM)來描述,選取特征有均質(zhì)性(homogeneity)、對比度(contrast)、相異性(dissimilarity)、熵(entropy)和角二階矩(Ang.2nd moment),共4個方向累計20個特征。
(3)幾何特征是基于構(gòu)成影像對象的像素的空間分布統(tǒng)計之上的。使用協(xié)方差矩陣作為統(tǒng)計處理工具。選取特征有緊致度(compactness)、密度(density)、面積(area)、矩形適合性(rectangular Fit)和長寬比(length/width),共5個特征。
上述選擇了43個針對海島地物類別的典型特征。對于分類器訓(xùn)練樣本來講,并不是特征越多分類精度越高,而是特征越多模型越容易過擬合,分類效率和精度越低。因此需要從過多特征中篩選出對地物類別識別作用最大的特征子集。如何高效智能地對高維特征空間精準(zhǔn)降維是當(dāng)前研究的熱點,國內(nèi)外學(xué)者認(rèn)為[10-11]分離閾值法(SEa TH)是目前比較有代表的特征優(yōu)化方法,該方法最大優(yōu)點是:①能夠自動選擇特征,自動確定分離閾值;②J-M 距離適用于專題信息提取,以及類別數(shù)目較少的情況(兩兩類別區(qū)分)。當(dāng)然此法仍需學(xué)者不斷改進(jìn)[12-13],這里不再贅述。本研究依照SEa TH,結(jié)合電腦硬件配置綜合考慮,篩選出13個特征作為最優(yōu)特征組合,按照特征貢獻(xiàn)度依次是:ratio(Blue)、length/width、Max.diff.、density、GLCM entropy(0)、ratio(Red)、mean(Nir)、compactness、mean(Blue)、NDVI、brightness、ratio(Nir)、mean(Green),能有效提高分類精度及減少分類時間。
前期最佳分割結(jié)果產(chǎn)生的對象是地物分類的基礎(chǔ)。經(jīng)實地踏勘,確定11個土地利用類別后,需建立遙感信息解譯標(biāo)志。研究區(qū)內(nèi)海島植被占比較大,主要植被類型是農(nóng)作物群落、常綠針葉林、落葉闊葉林和灌草叢。農(nóng)作物種為玉米和果蔬,分布在海島居民區(qū)附近的平地;常綠針葉林主要是油松林、油松刺槐林,以油松純林為主;落葉闊葉林為刺槐林,分布在平緩低地;灌草叢包括崖椒灌叢和荊條灌叢,以荊條灌叢為主,在林緣坡地和海岸坡地處分布。針葉林在北京二號衛(wèi)星R4G3B2 假彩色影像上呈深暗紅色及暗紅色,紋理呈不規(guī)則的條帶或面狀,紋理較粗糙,有立體感。闊葉林在R3G2B1真彩色影像上呈亮綠色,與針葉林比較,色調(diào)更亮一些。農(nóng)作物群落劃分在有茬耕地類中,在影像中形狀規(guī)則,呈格狀、弧形或條帶狀,紋理粗糙,假彩色中呈深灰、淺紅色或鮮紅。灌草地是磨盤山島、楊家山島和張家山島的主要植被類型,連片分布,由于覆蓋度不同,在假彩色中分別呈暗紅、紅色、淺紅和淺黃綠色。覺華島海岸帶主要有基巖和粉砂淤泥質(zhì)海岸,基巖坡度較大,寬度較窄,干燥的部分亮度較高,常被海水沖刷部分呈暗灰色。淤泥質(zhì)形狀呈帶狀分布,寬度不等,從數(shù)百米到數(shù)千米,坡度平緩,有潮溝發(fā)育,影像上多呈樹枝狀或蛇形狀,假彩色上呈灰黑色條帶,色調(diào)較暗,無立體感。
隨機(jī)森林重要參數(shù)的確定:參考劉敏等[14]利用加州大學(xué)歐文分校(University of CaliforniaIrvine,UCI)數(shù)據(jù)集對隨機(jī)森林中決策樹的數(shù)量與數(shù)據(jù)集的關(guān)系進(jìn)行實驗分析,實驗結(jié)果表明當(dāng)樹的數(shù)量為100時,就可以使分類精度達(dá)到要求。顧海燕等[9]實驗得出在特征數(shù)量保持常量為5時,隨著樹的數(shù)量的增加,誤差變小;當(dāng)樹的數(shù)量為200時,誤差達(dá)到最小;當(dāng)大于200時,誤差差別很小,趨于穩(wěn)定,計算時間隨著樹的數(shù)量增加而增加。考慮到運算效率與分類精度平衡,本研究實驗設(shè)計如下:決策樹設(shè)置范圍為(150,200,250),特征數(shù)分別為(11,12,13)時,參數(shù)配對9組,通過樣本精度驗證來尋找參數(shù)最佳組合。最終確定使用篩選好的13個特征對520、465、415、230、180、160這6種尺度選取一定數(shù)量樣本進(jìn)行訓(xùn)練,考慮到運算效率與分類后精度可對比性,將隨機(jī)森林中決策樹的數(shù)量Ntree選定為200。本研究通過不同尺度分類結(jié)果的混淆矩陣提取4類指標(biāo)來進(jìn)行總體和某一類地物的精度評價,分別為總體精度(overall accuracy,OA)、Kappa系數(shù)、生產(chǎn)者精度和用戶精度。6組分割尺度對應(yīng)整體精度評價如表2 所示,11 種地物分類精度與Kappa系數(shù)如表3所示。
表2 6組分割尺度對應(yīng)整體精度評價
表3 6組分割尺度對應(yīng)11種地物類別精度評價匯總
研究區(qū)內(nèi)建筑物對應(yīng)最佳分割參數(shù)為(0.5,0.6,180),單類Kappa系數(shù)為0.735 7;道路對應(yīng)最佳分割參數(shù)為(0.5,0.4,230),單類Kappa系數(shù)為0.752 8。本研究建筑物提取精度不高主要原因是高分辨率影像形狀細(xì)節(jié)特征冗余,陰影遮擋,屋頂材質(zhì)不同導(dǎo)致光譜信息多變從而影響建筑物提取精度。目前高分辨率影像建筑物精準(zhǔn)獲取是研究熱點問題,國內(nèi)一些學(xué)者進(jìn)行了深入研究[15-18]。不同分割尺度下道路提取的生產(chǎn)者精度較低而用戶精度均高于83.87%,道路驗證樣本被錯分到建筑物、裸地和有茬耕地的比例較高,其他驗證樣本錯分到道路的比例較低。研究區(qū)內(nèi)主次干道的光譜特征和幾何形狀與局部建筑物屋頂和裸地表面呈現(xiàn)極大相似性,支路由于寬度較窄,與有茬耕地在160以上的分割尺度難以區(qū)分。水域包含養(yǎng)殖的坑塘水面和島嶼周邊海域[19],對應(yīng)的最佳分割參數(shù)為(0.5,0.4,230),83個驗證樣本全部得到正確分類,與海域鄰接的13個海岸帶地類被錯誤劃分到水域中,導(dǎo)致用戶精度降低至86.46%。裸地在假彩色影像上色調(diào)呈青灰或亮白色,形狀為塊狀、條帶狀,紋理上有凸凹不平的立體感,對應(yīng)最佳分割參數(shù)為(0.4,0.6,465),提取用戶精度低是由于43個建筑物、道路和基巖樣本被錯誤劃分到此類中,類別特征空間距離較近。其他作為海島特色的地類,采用本研究分類器,提取精度較高:①海島植被,其中常綠針葉林地對應(yīng)最佳分割參數(shù)為(0.5,0.4,415),單類Kappa系數(shù)為0.923 2;落葉闊葉林地對應(yīng)最佳分割參數(shù)為(0.4,0.6,465),單類Kappa 系數(shù)為0.895 0;灌草地對應(yīng)最佳分割參數(shù)為(0.5,0.4,230),單類Kappa系數(shù)為0.889 0。海島植被提取的生產(chǎn)者精度均在90.40%以上。②海岸帶,其中基巖海岸對應(yīng)最佳分割參數(shù)為(0.5,0.6,520),單類Kappa系數(shù)為0.909 2;粉砂淤泥質(zhì)海岸對應(yīng)最佳分割參數(shù)為(0.4,0.6,465),單類Kappa系數(shù)為0.979 9。海岸帶提取的生產(chǎn)者精度均在92.07%以上。③耕地,其中有茬耕地和無茬耕地對應(yīng)最佳分割參數(shù)為(0.5,0.6,180),單類Kappa系數(shù)分別是0.858 7和0.915 3。耕地提取的生產(chǎn)者精度均在87.70%以上。
使用高分辨率遙感影像對海島土地利用類型進(jìn)行遙感分類研究必然涉及最優(yōu)分割尺度和分類器選擇問題,不同地類要求使用與之對應(yīng)的繪制尺度,一種尺度不可能滿足所有地物類別劃分。本研究通過對候選最佳分割尺度范圍內(nèi)的樣本參與隨機(jī)森林分類所取得的分類精度進(jìn)行評價分析,得到以下結(jié)論。
(1)基于高分辨率的北京二號衛(wèi)星融合后0.8 m分辨率數(shù)據(jù),采用隨機(jī)森林分類進(jìn)行覺華島及周邊島嶼土地利用類型分類,當(dāng)形狀因子、緊致度因子和分割尺度3參數(shù)組合為(0.5,0.6,180)時,整幅圖分類精度表現(xiàn)最佳,總分類精度達(dá)到81.73%,總Kappa系數(shù)為0.798 0。
(2)本研究針對海島特色地類,選擇最佳分割尺度,篩選特征貢獻(xiàn)率最高的13個特征,隨機(jī)森林中決策樹的數(shù)量Ntree為200,可以得到單個地類分類精度達(dá)到效果最好。海島植被提取的單類Kappa系數(shù)為0.889 0以上,生產(chǎn)者精度均在90.40%以上;海岸帶提取單類Kappa系數(shù)為0.909 2以上,生產(chǎn)者精度均在90.40%以上;耕地提取單類Kappa系數(shù)為0.858 7以上,生產(chǎn)者精度均在87.70%以上。
(3)本研究針對高分辨率建筑物類別提取精度不高。主要原因是高分辨率影像形狀細(xì)節(jié)特征冗余,陰影遮擋,屋頂材質(zhì)不同導(dǎo)致光譜信息多變。