刁淑娟, 劉春玲, 張濤, 賀鵬, 郭兆成, 涂杰楠
(1.中國(guó)地質(zhì)圖書(shū)館,北京 100083; 2.中國(guó)國(guó)土資源航空物探遙感中心,北京 100083)
?
基于SVM的湖泊咸度等級(jí)遙感信息提取方法
——以內(nèi)蒙古巴丹吉林沙漠為例
刁淑娟1, 劉春玲2, 張濤2, 賀鵬2, 郭兆成2, 涂杰楠2
(1.中國(guó)地質(zhì)圖書(shū)館,北京 100083; 2.中國(guó)國(guó)土資源航空物探遙感中心,北京 100083)
以Landsat8 OLI圖像為信息源,在完成幾何糾正、配準(zhǔn)及鑲嵌等圖像預(yù)處理的基礎(chǔ)上,對(duì)內(nèi)蒙古巴丹吉林沙漠湖泊進(jìn)行光譜信息提??; 結(jié)合實(shí)地采集的湖泊咸度等級(jí)樣本,分析湖泊咸度光譜特征及其遙感信息特征,提出了基于支持向量機(jī)(support vector machine,SVM)的咸度等級(jí)分類方法和咸度區(qū)劃分方案,實(shí)現(xiàn)了對(duì)巴丹吉林沙漠湖泊咸度等級(jí)遙感信息的提取。研究結(jié)果表明,該方法能有效地解決湖泊咸度樣本數(shù)量較少、樣本間光譜信息差異較小、采用常規(guī)分類方法難以取得較好效果情況下的湖泊咸度信息提取問(wèn)題,有一定的推廣應(yīng)用價(jià)值。
湖泊咸度等級(jí); 信息提取; 支持向量機(jī)(SVM); 光譜分析; 巴丹吉林
內(nèi)蒙古巴丹吉林沙漠以其獨(dú)特的風(fēng)沙地貌和沙漠腹地深處形態(tài)各異的湖泊景觀聞名于世。據(jù)前人統(tǒng)計(jì),在巴丹吉林沙漠現(xiàn)存的100多個(gè)湖泊中,常年有水的就超過(guò)70多個(gè),這一現(xiàn)象實(shí)為罕見(jiàn)。沙漠內(nèi)部的湖泊及周邊的濕地是牧民們種植及放牧依托的根本,從湖泊周邊淺井內(nèi)獲取的地下水也是牧民們的主要飲用水,因此,查明該區(qū)的湖泊咸度非常必要。早在21世紀(jì)70年代末,我國(guó)學(xué)者已對(duì)該區(qū)現(xiàn)存內(nèi)陸湖泊的分布、補(bǔ)給來(lái)源及地下水系統(tǒng)等特征做了大量研究[1-2],但對(duì)湖泊咸度的研究較少。
支持向量機(jī)(support vector machines,SVM)是一種基于統(tǒng)計(jì)學(xué)理論的監(jiān)督學(xué)習(xí)算法,即通過(guò)對(duì)偶優(yōu)化形式在高維特征空間中尋找最優(yōu)分類超平面,解決復(fù)雜數(shù)據(jù)的分類及回歸問(wèn)題[3-4]。該算法已經(jīng)被廣泛應(yīng)用于土地覆蓋遙感分類。Pal[5]提出非窮盡搜索與遺傳算法(genetic algorithms,GA)結(jié)合 SVM 的分類方法,并將其應(yīng)用于土地覆蓋分類。Carrao 等[6]利用 SVM 分類方法對(duì)多光譜 MODIS 數(shù)據(jù)進(jìn)行處理,解決了土地利用分類問(wèn)題。Nemmour等[7]利用Landsat圖像進(jìn)行城市變化監(jiān)測(cè),試驗(yàn)結(jié)果表明 SVM 方法的分類效果優(yōu)于神經(jīng)網(wǎng)絡(luò)方法。王朔琛[8]研究了基于半監(jiān)督SVM的圖像分類方法。李馳[9]完成了基于SVM的超分辨率圖像重建。筆者從上述研究得到啟示,考慮到研究區(qū)湖泊咸度樣本數(shù)量較少,且樣本間光譜信息差異較小,采用常規(guī)分類(如最大似然分類)方法難以取得較好效果,而SVM方法對(duì)小樣本高維數(shù)據(jù)分類具有優(yōu)勢(shì),因此將其引入到湖泊咸度等級(jí)信息的提取中,探討該方法的可行性和實(shí)用性。
為全面了解巴丹吉林沙漠區(qū)內(nèi)湖泊的分布及咸淡情況,摸清其資源潛力及潛在經(jīng)濟(jì)價(jià)值,促進(jìn)當(dāng)?shù)厣鐣?huì)與經(jīng)濟(jì)可持續(xù)發(fā)展,本文在1∶25萬(wàn)水文地質(zhì)遙感調(diào)查工作基礎(chǔ)上,通過(guò)引入SVM技術(shù),成功實(shí)現(xiàn)了對(duì)該區(qū)湖泊咸度等級(jí)遙感信息的自動(dòng)提取。
研究區(qū)巴丹吉林沙漠又稱巴丹扎蘭格沙漠,系中國(guó)第三大沙漠,位于中國(guó)北部阿拉善高原腹地。沙漠東南部以雅布賴山為界,西北與古日乃湖盆區(qū)相接,東依宗乃山,西靠古日乃湖,北連拐子湖,南臨合黎山和北大山,總面積約4.92萬(wàn)km2[10]。地勢(shì)自東南向西北部緩緩傾斜降低,過(guò)黑河以西后又逐漸回升,其中吉訶德沙山是世界上最高的沙丘(圖1)。
巴丹吉林沙漠地區(qū)屬大陸性氣候,年均溫度為7~8℃,多年平均降水量由東南向西北部逐漸減少,東南部約為120 mm,西北部則不足40 mm。區(qū)內(nèi)植被覆蓋度很低,且風(fēng)沙頻繁,風(fēng)力強(qiáng)勁。巴丹吉林沙漠雖然氣候極為干旱,但是其中的湖泊竟然多達(dá)100多個(gè),面積多在0.1~1.0 km2之間,為全世界所罕見(jiàn)[11]。
以2014年7月17日獲取的覆蓋巴丹吉林沙漠Landsat8 OLI遙感圖像為數(shù)據(jù)源,進(jìn)行了幾何糾正、配準(zhǔn)及鑲嵌等圖像預(yù)處理。
研究區(qū)Landsat8數(shù)據(jù)預(yù)處理后,對(duì)湖泊光譜信息進(jìn)行提?。?結(jié)合實(shí)地采集的湖泊咸度等級(jí)樣本,分析不同咸度等級(jí)湖泊水體的光譜特征; 然后采用SVM分類方法,提取巴丹吉林沙漠區(qū)內(nèi)各個(gè)湖泊的咸度等級(jí)。其技術(shù)流程如圖2所示。
圖2 湖泊咸度等級(jí)遙感信息提取技術(shù)流程
2.1 湖泊樣本的光譜特征分析
為了得到巴丹吉林沙漠區(qū)內(nèi)所有湖泊的咸度等級(jí),通過(guò)查閱現(xiàn)有地質(zhì)圖和檢索他人研究成果,結(jié)合實(shí)地考察,獲取了該區(qū)內(nèi)37個(gè)湖泊樣本的實(shí)際含鹽度數(shù)據(jù)資料。將這些湖泊樣本的咸度分為4個(gè)等級(jí)(表1),各咸度等級(jí)樣本的空間分布如圖3所示。
表1 巴丹吉林沙漠湖泊的咸度分級(jí)
圖3 湖泊咸度等級(jí)樣本空間分布
以2014年7月17日獲取的Landsat8 OLI圖像為信息源,采集上述樣本的光譜曲線(圖4)。
圖4 樣本的光譜曲線
從圖4可以看出,不同咸度等級(jí)樣本的光譜曲線形態(tài)和變化趨勢(shì)是類似的,DN值隨波長(zhǎng)的增大而減小。另外,隨著咸度等級(jí)降低,DN值整體有升高趨勢(shì)。從每個(gè)咸度等級(jí)的樣本中分別取出1個(gè)典型樣本,制做出4個(gè)典型樣本的光譜特征曲線(圖5)。
圖5 4個(gè)典型樣本的光譜曲線
從圖5可以看出,在同一個(gè)波段,隨著咸度等級(jí)降低,DN值逐漸增大。另外,相對(duì)于藍(lán)(B)和 綠(G)波段,紅(R)、近紅外(NIR)、短波紅外(SWIR1)和中紅外 (SWIR2)波段對(duì)咸度等級(jí)的區(qū)分度更高。因此,本文將紅、近紅外、短波紅外及中紅外波段組合起來(lái),形成一個(gè)新的組合波段(記作:BR+BNIR+BSWIR1+BSWIR2)。不同咸度等級(jí)樣本的DN值見(jiàn)圖6。
從圖6可以看出,隨著咸度等級(jí)的增加,DN值明顯下降,且“咸度1”和“咸度2”與“咸度3”和“咸度4”之間有很高的區(qū)分度。
2.2 湖泊光譜特征提取
對(duì)于Landsat8 OLI衛(wèi)星數(shù)據(jù)來(lái)說(shuō),巴丹吉林沙漠的湖泊一般都包含了眾多的水體像元。選擇有代表性的水體像元代表各個(gè)湖泊的光譜信息,對(duì)湖泊咸度等級(jí)遙感分類十分重要。位于湖泊邊緣區(qū)域的水體深度較淺,容易受底部物質(zhì)的影響。因此,本文以每個(gè)湖泊多邊形的重心為基準(zhǔn),提取重心位置像元的光譜信息,作為該湖泊的光譜特征。
所提取的光譜特征共有7個(gè)維度,包括Landsat8 OLI的第2―7波段,另外增加了組合波段(BR+BNIR+BSWIR1+BSWIR2)。
2.3 湖泊咸度等級(jí)SVM分類
本文采用LibSVM庫(kù)實(shí)現(xiàn)SVM分類。SVM分類需要設(shè)置一些參數(shù)。首先將原始的各個(gè)特征歸一化到[0, 1]范圍,以便輸入SVM; 然后選擇徑向基函數(shù)(radial basis function,RBF),在實(shí)際測(cè)試中,RBF核優(yōu)于線性核函數(shù)和多項(xiàng)式核函數(shù); 最后對(duì)參數(shù)C與參數(shù)γ采用交叉驗(yàn)證方法進(jìn)行優(yōu)化,選擇最佳的C與γ進(jìn)行SVM的訓(xùn)練與分類。
針對(duì)巴丹吉林沙漠東南部提取的122個(gè)湖泊,采用本文方法將湖泊咸度分為4個(gè)等級(jí),其中,咸度等級(jí)為1的淡水湖有9個(gè),咸度等級(jí)為2的微咸湖有10個(gè),咸度等級(jí)為3的咸水湖有40個(gè),咸度等級(jí)為4的鹽水湖有63個(gè)。咸度等級(jí)提取結(jié)果見(jiàn)圖7。
圖7 巴丹吉林湖泊咸度等級(jí)提取結(jié)果
從圖7可以看出,不同咸度級(jí)在空間分布上存在明顯的規(guī)律。根據(jù)不同咸度級(jí)湖泊在空間上的聚集關(guān)系,以NE走向的2條分界線將巴丹吉林沙漠東南部湖泊分成3個(gè)區(qū),從東南部向西北部,分別對(duì)應(yīng)“低”、“中”、“高”3個(gè)咸度分區(qū)。其中,低咸度區(qū)以淡水湖泊(咸度級(jí)1級(jí)湖泊)及微咸水湖泊(咸度級(jí)2級(jí)湖泊)為主,中咸度區(qū)以咸水湖泊(咸度級(jí)3級(jí)湖泊)為主,高咸度區(qū)以鹽水湖泊(咸度級(jí)4級(jí)湖泊)為主。
為了驗(yàn)證SVM法在湖泊咸度等級(jí)遙感信息提取中的準(zhǔn)確性,對(duì)巴丹吉林沙漠內(nèi)湖泊咸度遙感信息提取結(jié)果進(jìn)行了野外驗(yàn)證。因受實(shí)際條件所限,野外實(shí)際驗(yàn)證點(diǎn)數(shù)為26個(gè),驗(yàn)證結(jié)果見(jiàn)圖8和表2。
圖8 巴丹吉林湖泊實(shí)測(cè)咸度等級(jí)空間分布
從圖8和表2可以看出,咸度等級(jí)為1級(jí)信息提取點(diǎn)與實(shí)測(cè)點(diǎn)相符,正確率為100%; 咸度等級(jí)為2級(jí)信息提取點(diǎn)與實(shí)測(cè)結(jié)果相符的為5個(gè),其余2個(gè)實(shí)測(cè)點(diǎn)咸度等級(jí)為3級(jí),準(zhǔn)確率為71.43%; 咸度等級(jí)為3級(jí)的信息提取點(diǎn)與實(shí)測(cè)結(jié)果相符的為6個(gè),剩余1個(gè)實(shí)測(cè)點(diǎn)的咸度等級(jí)為2級(jí),準(zhǔn)確率為85.71%; 咸度等級(jí)為4級(jí)的信息提取點(diǎn)與實(shí)測(cè)結(jié)果相符的為7個(gè),剩余1個(gè)實(shí)測(cè)點(diǎn)的咸度等級(jí)為3級(jí),準(zhǔn)確率為87.50%。對(duì)比各咸度等級(jí)的信息提取結(jié)果與實(shí)測(cè)結(jié)果表明,總體正確率約為84.62%,利用遙感手段所提取的結(jié)果較為理想。
表2 湖泊咸度遙感信息提取與野外實(shí)地驗(yàn)證結(jié)果對(duì)比
本文基于支持向量機(jī)(SVM)的方法,以Landsat8 OLI遙感圖像為數(shù)據(jù)源,成功提取了內(nèi)蒙古巴丹吉林沙漠湖泊咸度等級(jí)遙感信息。從遙感調(diào)查成果可以看出,巴丹吉林沙漠東南部湖泊的咸度等級(jí)存在明顯的空間分異規(guī)律: 淡水(微咸水)主要分布于湖泊區(qū)的東南角; 從東南向西北方向,湖水咸度不斷增加。依據(jù)巴丹吉林沙漠湖泊咸度等級(jí)的空間聚集規(guī)律進(jìn)行的咸度區(qū)劃分,可為沙漠湖泊地下水補(bǔ)給機(jī)制分析提供參考,對(duì)解決當(dāng)?shù)厝?、畜飲水難題,促進(jìn)當(dāng)?shù)厣鐣?huì)與經(jīng)濟(jì)可持續(xù)發(fā)展均有極其重要的意義。
[1] 梁永平,趙春紅,唐春雷,等.北方巖溶區(qū)水文地質(zhì)環(huán)境調(diào)查進(jìn)展——以北京西山巖溶區(qū)為例[J].中國(guó)地質(zhì)調(diào)查,2015,2(8):1-8. Liang Y P,Zhao C H,Tang C L,et al.Progress of hydrogeology and environmental geology survey in Karst Area of northern China:An example from karst area in western hills of Beijing[J].Geology Survey of China,2015,2(8):1-8.
[2] 蘇春田,潘曉東,李兆林,等.云南廣南巖溶區(qū)水文地質(zhì)環(huán)境地質(zhì)調(diào)查進(jìn)展[J].中國(guó)地質(zhì)調(diào)查,2015,2(8):9-16. Su C T,Pan X D,Li Z L,et al.Progress of hydrogeology and environment geology survey in Guangnan karst area,Yunnan province[J].Geology Survey of China,2015,2(8):9-16.
[3] Vapnik V N.The Nature of Statistical Learning Theory[M].New York:Springer-Verlag,1995.
[4] Pal M,Mather P M.Support vector machines for classification in remote sensing[J].International Journal of Remote Sensing,2005,26(5):1007-1011.
[5] Pal M.Support vector machine-based feature selection for land cover classification:A case study with DAIS hyperspectral data[J].International Journal of Remote Sensing,2006,27(14):2877-2894.
[6] Carr?o H,Gon?alves P,Caetano M.Contribution of multispectral and multitemporal information from MODIS images to land cover classification[J].Remote Sensing of Environment,2008,112(3):986-997.
[7] Nemmour H,Chibani Y.Fuzzy neural network architecture for change detection in remotely sensed imagery[J].International Journal of Remote Sensing,2006,27(4):705-717.
[8] 王朔琛.基于半監(jiān)督支持向量機(jī)的圖像分類方法研究[D].西安:陜西師范大學(xué),2015. Wang S C.Research on Image Classification Based on Semi Supervise Support Vector Machine[D].Xi’an:Shaanxi Normal University,2015.
[9] 李馳.基于支持向量機(jī)的超分辨率圖像重建[J].激光雜志,2016,37(1):138-141. Li C.Super resolution image reconstruction based on support vector machine[J].Laser Journal,2016,37(1):138-141.
[10]吳正.風(fēng)沙地貌與治沙工程學(xué)[M].北京:科學(xué)出版社,2003. Wu Z.Control Engineering of Sand Physiognomy[M].Beijing:Science Press,2003.
[11]丁宏偉,王貴玲.巴丹吉林沙漠湖泊形成的機(jī)理分析[J].干旱區(qū)研究,2007,24(1):1-7. Ding H W,Wang G L.Study on the formation mechanism of the lakes in the Badain Juran desert[J].Arid Zone Research,2007,24(1):1-7.
(責(zé)任編輯: 劉心季)
Extraction of remote sensing information for lake salinity level based on SVM: A case from Badain Jaran desert in Inner Mongolia
DIAO Shujuan1, LIU Chunling2, ZHANG Tao2, HE Peng2, GUO Zhaocheng2, TU Jienan2
(1.NationalGeologicalLibraryofChina,Beijing100083,China; 2.ChinaAeroGeophysicalSurveyandRemoteSensingCenterforLandandResources,Beijing100083,China)
According to the problems of remote sensing information extraction in lake salinity level of Badain Jaran desert, the authors put forward a method based on support vector machine (SVM). In this paper, the authors adopted Landsat8 OLI remote sensing image as the data source, completed the image preprocessing such as geometric correction, image registration and mosaicking. With the help of the RS and GIS technology, the authors successfully extracted the information of lake salinity levels of the Badain Jaran desert. The results show that the proposed method can effectively solve the problems of less samples and the information extraction of lake salinity levels when the spectral information is confused, and hence has the reference value and can be promoted to other similar situations.
lake salinity levels;information extraction;support vector machine(SVM);spectral analysis;Badain Jaran
10.6046/gtzyyg.2016.04.18
刁淑娟,劉春玲,張濤,等.基于SVM的湖泊咸度等級(jí)遙感信息提取方法——以內(nèi)蒙古巴丹吉林沙漠為例[J].國(guó)土資源遙感,2016,28(4):114-118.(Diao S J,Liu C L,Zhang T,et al.Extraction of remote sensing information for lake salinity level based on SVM:A case from Badain Jaran desert in Inner Mongolia[J].Remote Sensing for Land and Resources,2016,28(4):114-118.)
2015-10-16;
2015-12-12
中國(guó)地質(zhì)調(diào)查局地質(zhì)調(diào)查項(xiàng)目“巴丹吉林沙漠1∶25萬(wàn)水文地質(zhì)調(diào)查”(編號(hào): 12120114018501)及“區(qū)域水文地質(zhì)遙感調(diào)查技術(shù)要求(1∶50 000、1∶250 000)”(編號(hào): 121200114029401)共同資助。
TP 79
A
1001-070X(2016)04-0114-05
刁淑娟(1965-),女,碩士,教授級(jí)高級(jí)工程師,長(zhǎng)期從事遙感技術(shù)應(yīng)用研究和期刊編輯出版工作。Email: zgdzdc_dsj@126.com。