王海霞 丁春蓮 韓奮
摘 ?要:利用libsvm軟件包的交叉驗(yàn)證方法選擇了支持向量機(jī)的最優(yōu)參數(shù),利用ENVI5.1軟件將支持向量機(jī)作為分類器,對覆蓋整個(gè)河套灌域的2014年5-9月的高分一號和資源三號衛(wèi)星遙感影像進(jìn)行監(jiān)督分類,提取出灌區(qū)耕地信息,經(jīng)過人工修改,最終得到河套灌區(qū)耕地面積為634804.81ha,幾何精度為91.23%,屬性精度為93%。
關(guān)鍵詞:遙感技術(shù);支持向量機(jī)(SVM);耕地提取
中圖分類號:P237 文獻(xiàn)標(biāo)志碼:A 文章編號:2095-2945(2019)22-0050-03
Abstract: The optimal parameters of support vector machine are selected using the cross-verification method of LIBSVM software package, and the support vector machine is used as the classifier to supervise and classify the satellite remote sensing images of Gaofen No.1 and Resource No.3, which cover the whole Hetao irrigation area from May to September 2014. The cultivated land information is extracted. After manual modification, the cultivated land area of Hetao irrigation area is 634804.81ha, the geometric accuracy is 91.23% and the attribute accuracy is 93%.
Keywords: remote sensing technology; support vector machine (SVM); cultivated land extraction
引言
耕地是寶貴的物質(zhì)資源,也是工、農(nóng)業(yè)持續(xù)發(fā)展的重要基礎(chǔ)[1]。隨著人口的不斷增長,人類對居住環(huán)境、住房面積的需求也隨著增加,對耕地的私用、濫用及非法開發(fā)事件屢見不鮮,因此,科學(xué)、實(shí)時(shí)、準(zhǔn)確地獲取耕地?cái)?shù)據(jù)為保護(hù)耕地提供準(zhǔn)確的依據(jù)。利用高分辨率衛(wèi)星遙感影像來獲取豐富而詳盡的耕地信息是目前最有效的手段。本研究利用高分一號和資源三號衛(wèi)星遙感影像對河套灌區(qū)耕地信息提取,具體研究如下。
1 技術(shù)路線
整個(gè)耕地提取過程分為三大部分內(nèi)容,依次是遙感影像預(yù)處理、耕地提取、精度驗(yàn)證,具體操作如圖1。
2 耕地信息提取
2.1 衛(wèi)星影像預(yù)處理
本研究選用了高分一號(全色波段2m,多光譜波段8m)和資源三號(全色波段2.1m,多光譜波段5.8m)衛(wèi)星遙感影像,為獲得更加準(zhǔn)確的耕地信息,結(jié)合河套灌區(qū)水文、氣候特點(diǎn)及農(nóng)作物的生長特點(diǎn)選擇了2015年5-10月的衛(wèi)片。
利用ENVI5.1遙感處理軟件完成覆蓋整個(gè)灌區(qū)衛(wèi)星影像的預(yù)處理,主要處理有全色影像和多光譜影像的正射校正、圖像融合、圖像鑲嵌等處理。利用ArcMap10.2對灌區(qū)的行政規(guī)劃圖進(jìn)行配準(zhǔn),并對其進(jìn)行矢量化得到灌區(qū)內(nèi)烏蘭布和、解放閘、 永濟(jì)、 義長、 烏拉特五大灌區(qū)界線,使用這五大灌區(qū)界線的矢量數(shù)據(jù),對處理好的灌區(qū)影像進(jìn)行掩膜裁剪處理、增強(qiáng)處理。
2.2 耕地提取
2.2.1 定義分類樣本
根據(jù)整個(gè)灌區(qū)地表覆蓋的地域特點(diǎn),將該區(qū)的土地利用分為耕地、道路、水體、居民地、林地、裸地六大類。利用實(shí)地GPS定位踏查的六大類多地區(qū)的數(shù)據(jù)作為分類樣本,采用ENVI5.1中的ROI Tool確定樣本對應(yīng)的遙感影像像元,并確定分類樣本及檢測樣本,使用Computer ROI Separability工具計(jì)算分類樣本的可分離性幾乎在1.78-2.0之間[2](如圖2)。
2.2.2 監(jiān)督分類
該研究選擇監(jiān)督分類,分類器選擇的是支持向量機(jī)(SVM),SVM是一種建立在統(tǒng)計(jì)學(xué)理論基礎(chǔ)上的模式識別的自學(xué)習(xí)方法,通過自動尋找對分類有較好區(qū)分度的支持向量,建立某個(gè)超平面,該方法構(gòu)建的分類器可以最大化類間距離,將訓(xùn)練集中的數(shù)據(jù)分離開,獲得較優(yōu)的分類結(jié)果[3]。
充分利用高分辨率遙感圖像維數(shù)高、數(shù)據(jù)不確定性及地物波譜曲線連續(xù)、紋理復(fù)雜、數(shù)據(jù)量大的特點(diǎn)。SVM算法利用核函數(shù)將非線性變換映射到高維的特征空間,在高維空間中構(gòu)造線性判別函數(shù)來獲取原空間中的非線性判別函數(shù),巧妙地解決了維數(shù)數(shù)據(jù)不確定性的問題[4]。通過分析已有的遙感影像分類實(shí)驗(yàn)表明SVM較神經(jīng)網(wǎng)絡(luò)、最大似然、平行六面體、最小距離等方法的穩(wěn)定性與精度更高[5]。
選擇灌區(qū)內(nèi)1024*1024像素大小作為研究區(qū)域,依次采用四種常用核函數(shù)線性函數(shù)、多項(xiàng)式核函數(shù)、徑向基核函數(shù)、間隔松弛向量函數(shù)進(jìn)行基于支持向量機(jī)的監(jiān)督分類。主要參數(shù)設(shè)置如下:多項(xiàng)式核函數(shù)的級數(shù)(Degree of Polynomial Kernel),用來衡量不同類別邊界的準(zhǔn)確度,輸入范圍是(1,6),理論上取值增大準(zhǔn)確度就越高,但是實(shí)際上如果選值太大會使分類變成噪聲的可能性增加,這里根據(jù)實(shí)驗(yàn)設(shè)置為3;核參數(shù)?酌(Gamma in kernel Function)設(shè)置為輸入影像波段數(shù)的倒數(shù)0.25;懲罰參數(shù)(Penalty Parameter)體現(xiàn)對誤差的容忍度,該值設(shè)置越高,反映對出現(xiàn)誤差的現(xiàn)象越不能容忍,更為嚴(yán)重的后果是會造成嚴(yán)重的“椒鹽”現(xiàn)象,根據(jù)實(shí)驗(yàn)該值設(shè)置為100[6]。
將上訴四類核函數(shù)SVM監(jiān)督分類的結(jié)果與GPS取樣數(shù)據(jù)計(jì)算得到分類誤差混淆矩陣,獲得SVM分類不同核函數(shù)的錯(cuò)分誤差、漏分誤差、制圖精度、用戶精度、總精度、Kappa系數(shù),以徑向基SVM的分類誤差混淆矩陣為例如表1,水體的錯(cuò)分誤差為0,漏分誤差為10.3、制圖精度89.71、用戶精度100,表明在六大類中水體的可分離度最高,與樣本可分離性統(tǒng)計(jì)表的結(jié)果一致。四種核函數(shù)SVM監(jiān)督分類的精度如表2,其中徑向基SVM監(jiān)督分類的精度最高,總精度達(dá)到87.8587%,Kappa系數(shù)為0.81333,間隔松弛向量函數(shù)SVM的精度最低,總精度達(dá)到76.4240%,Kappa系數(shù)為0.6355。本研究采用徑向基SVM進(jìn)行土地利用監(jiān)督分類。
? ? 2.2.3 分類后處理
基于SVM的灌區(qū)耕地信息監(jiān)督分類,產(chǎn)生“椒鹽”現(xiàn)象是無法避免地,因此需要對“椒鹽”噪點(diǎn)進(jìn)行剔除或者再次進(jìn)行分類。一般采用的分類后處理方法有Majority/Minority分析、聚類處理和過濾處理三種,通過實(shí)驗(yàn)對比Majority/Minority分析進(jìn)行分類后處理的效果最好[7],同時(shí)采用變換核為7×7的像元類別代替中心像元。
3 精度評價(jià)
精度評估分為兩部分幾何精度評估與屬性精度評估。
3.1 幾何精度評估
幾何精度評估主要指圖斑的大小、形狀與位置誤差等量算精度的評估。
(1)采樣方法
通過實(shí)地抽樣調(diào)查法、高精度影像檢驗(yàn)兩種方法相結(jié)合,將精提后的耕地按圖斑面積進(jìn)行分層,根據(jù)情況將精提后的耕地按烏蘭布和、解放閘、永濟(jì)、義長、烏拉特五大灌區(qū)進(jìn)行分層,由于實(shí)際情況限制,實(shí)地面積量算較少,共抽取80個(gè)面,在每個(gè)灌區(qū)內(nèi)分別隨機(jī)抽取16個(gè)面,多利用Google Earth的高分辨率影像進(jìn)行對比精度檢驗(yàn)。
(2)精度評估
對比耕地的提取面積和實(shí)際測量面積,耕地提取的形狀、位置與實(shí)際吻合。另外,通過統(tǒng)計(jì)得到烏蘭布和灌域耕地面積提取的幾何精度為91.51%,解放閘灌域的幾何精度為88.81%,永濟(jì)灌域的幾何精度為90.03%,義長灌域的幾何精度為95.05%,烏拉特灌域的幾何精度為90.73%,河套灌區(qū)耕地面積提取的幾何精度為91.23%。
3.2 屬性精度評估
屬性精度評估包括類別誤差與遺漏誤差。
(1)采樣方法
通過實(shí)地抽樣調(diào)查法和高精度影像檢驗(yàn)兩種方法相結(jié)合,將精提后的耕地按烏蘭布和、解放閘、永濟(jì)、義長、烏拉特五大灌區(qū)進(jìn)行分層,在每個(gè)灌區(qū)內(nèi),分別隨機(jī)抽取20個(gè)點(diǎn)共100個(gè)點(diǎn),此過程利用Google Earth的高分辨率影像進(jìn)行對比精度檢驗(yàn)。
(2)精度評估
隨機(jī)選擇的100個(gè)點(diǎn)中有7個(gè)為誤分或遺漏,所以得到河套灌區(qū)耕地面積提取的屬性精度為93%。
最終得到河套灌區(qū)耕地面積為634804.81ha,幾何精度為91.23%,屬性精度為93%。
4 結(jié)束語
本文使用基于SVM的監(jiān)督分類方式提取了河套灌區(qū)的耕地信息,由于光學(xué)遙感本身不可避免的“同物異譜”和“同譜異物”現(xiàn)象,使分類結(jié)果必然存在一定誤差,為了更加準(zhǔn)確的反映該區(qū)域的實(shí)際耕地信息,本研究對提取結(jié)果進(jìn)行了人工修改,最終獲得了精度較高的結(jié)果。由于農(nóng)作物在不同時(shí)期具有顯著的生長特點(diǎn),今后可考慮依據(jù)NDVI進(jìn)行耕地信息提取。另外,在研究方法上僅使用了單窗口紋理的SVM分類,后期人工修改的工作量較為龐大,適當(dāng)研究使用多窗口紋理的SVM分類能有效減少人工修改的工作量,進(jìn)而提高耕地提取的效率。
參考文獻(xiàn):
[1]鄧際洪.基于PSR模型的四川省耕地可持續(xù)利用評價(jià)[D].四川農(nóng)業(yè)大學(xué),2015.
[2]許廣軍,吳玉煒,周智明.應(yīng)用遙感影像分類方法的土地利用情況分析[J].科技資訊,2016,4:12-13.
[3]羅建華.基于粗糙集與神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)分類研究及應(yīng)用[D].大連理工大學(xué),2008.
[4]劉偉.車牌識別系統(tǒng)中字符識別技術(shù)的研究[D].東華大學(xué),2012.
[5]邵振峰,潘銀,等.基于Landsat年際序列影像的武漢市不透水面遙感監(jiān)測[J].地理空間信息,2018,1:1-5+7.
[6]王海霞,韓奮,吳玲敏.基于支持向量機(jī)的河套灌區(qū)耕地信息提取[J].產(chǎn)業(yè)與科技論壇,2016,24(1):84-86.
[7]陳利.基于混合像元分解方法的MODIS森林類型識別研究[D].中南林業(yè)科技大學(xué),2014.