李志花,馮美臣,王超,趙佳佳,王慧琴,劉婷婷,楊武德
(山西農(nóng)業(yè)大學(xué) 旱作農(nóng)業(yè)工程研究所,山西 太谷 030801)
冬小麥高光譜信息提取方法的研究
李志花,馮美臣,王超,趙佳佳,王慧琴,劉婷婷,楊武德*
(山西農(nóng)業(yè)大學(xué) 旱作農(nóng)業(yè)工程研究所,山西 太谷 030801)
針對(duì)高光譜數(shù)據(jù)波段多、數(shù)據(jù)量大和冗余度大等特點(diǎn),本文以ASD便攜式高光譜儀為光譜數(shù)據(jù)獲取手段,以不同生育時(shí)期冬小麥冠層高光譜為研究對(duì)象,采用主成分分析和波段自相關(guān)分析兩種方法來進(jìn)行數(shù)據(jù)降維,通過采用基于高光譜與葉面積指數(shù)估算(LAI)相關(guān)系數(shù)法進(jìn)行驗(yàn)證,以確定冬小麥高光譜遙感信息提取的最佳波段。結(jié)果表明,主成分分析法(PCA)和波段自相關(guān)分析法選擇的波段主要在可見光區(qū)域(350~450nm和600~700nm)、近紅外區(qū)域(1 100~1 200nm)和短波紅外區(qū)域(1 500~1 750nm),包含了驗(yàn)證方法基于高光譜與LAI相關(guān)系數(shù)法所選擇的主要波段范圍:可見光區(qū)域和近紅外區(qū)域。綜合考慮,用主成分分析法和波段自相關(guān)分析法兩種方法對(duì)冬小麥高光譜提取的信息是全面、可靠的,包含了針對(duì)某一生理指標(biāo)如LAI的有關(guān)信息。
高光譜遙感;信息提取;主成分分析;自相關(guān)分析
高光譜(Hyperspectral)遙感是上世紀(jì)末地球觀測(cè)系統(tǒng)中最重要的技術(shù)突破之一,它克服了傳統(tǒng)單波段、多光譜遙感在波段數(shù)、波段范圍、精細(xì)信息表達(dá)等方面的局限性,以較窄的波段區(qū)間、較多的波段數(shù)量提供遙感信息,能夠從光譜空間中對(duì)地物予以細(xì)分和鑒別,在資源、環(huán)境、城市、生態(tài)等領(lǐng)域得到了廣泛應(yīng)用。
高光譜數(shù)據(jù)具有波段多、光譜范圍窄、數(shù)據(jù)量大等特點(diǎn),對(duì)此已經(jīng)有很多這方面的研究。杜華強(qiáng)[1]利用方差、最大最小值及波段間的相關(guān)性等方法進(jìn)行波段選擇,取得了較好的效果。劉建平等[2]提出了基于類間可分性的高光譜數(shù)據(jù)最佳波段選擇理論模型,具有一定的實(shí)用性。Thenkabail等[3]通過對(duì)灌木層、草地、雜草和農(nóng)作物進(jìn)行綜合分析,選擇22個(gè)10nm波段作為植被監(jiān)測(cè)的最佳波段。Lavanya等[4]運(yùn)用波段去除技術(shù)和方差分析得到最大差異波段。張雪紅等[5]將廣泛應(yīng)用于巖礦中的包絡(luò)線消除法應(yīng)用于油菜高光譜評(píng)價(jià)中。Nakariyakul等[6]運(yùn)用比率特征選擇對(duì)農(nóng)業(yè)生產(chǎn)進(jìn)行了研究。此外,關(guān)于光譜特征選擇與提取的方法還有光譜吸收特征參數(shù)、光譜編碼、原始光譜與LAI光譜和光譜吸收指數(shù)等[7]。
大量的研究表明高光譜數(shù)據(jù)在估算光合作用[8]、覆 蓋 度[9]、葉 面 積 指 數(shù) (LAI)[10,11]、生 物量[12]和氮素含 量[13,14]等 方 面 具 有 一 定 的 改 進(jìn) 和提高,但是,高光譜數(shù)據(jù)相鄰波段存在大量冗余。為了解決高光譜波段冗余問題,必須從眾多高光譜波段中選擇一些有用的窄波段進(jìn)行遙感信息提?。?5]。
本文以不同品種在不同施氮素水平下,于不同生育時(shí)期測(cè)定的冬小麥冠層高光譜數(shù)據(jù)為數(shù)據(jù)源,采用主成分分析和波段自相關(guān)分析兩種方法,來確定冬小麥高光譜信息提取的最佳波段,再用基于原始光譜與LAI相關(guān)系數(shù)分析法進(jìn)行驗(yàn)證。研究結(jié)果為實(shí)現(xiàn)冬小麥高光譜遙感數(shù)據(jù)優(yōu)化處理和高效利用提供理論和技術(shù)支撐。
試驗(yàn)于2012年10月—2013年6月在山西農(nóng)業(yè)大學(xué)農(nóng)學(xué)院的農(nóng)作站進(jìn)行。供試土壤為黃土母質(zhì)發(fā)育而成的石灰性褐土,土壤肥力水平中等,其理化性質(zhì)為:土壤有機(jī)質(zhì)含量22.01g·kg-1,堿解氮53.8mg·kg-1,有效磷18.43mg·kg-1,速效鉀236.9mg·kg-1。供試肥料為尿素(含純N 46%),過磷酸鈣(含P2O512%)。
裂區(qū)設(shè)計(jì)。主區(qū)為品種3個(gè),分別為長(zhǎng)4738、晉農(nóng)190和晉太 9923;副區(qū)為土壤施氮素水平,5個(gè),分別為0、75、150、225、300kg·hm-2。重復(fù)3次。共計(jì)小區(qū)3×5×3=45個(gè),每個(gè)小區(qū)面積3m×4m。于2012年10月初播種,播種密度為每公頃60萬(wàn)株,播種行距為20cm。田間管理的各處理均采用常規(guī)方法進(jìn)行管理。分別于播種期和拔節(jié)期施基、追肥,基追肥比為4∶6。
采用美國(guó)ASD公司生產(chǎn)的ASD Field Spec 3.0型便攜式高光譜儀,分別在冬小麥返青期、拔節(jié)期、孕穗期、開花期以及開花后每隔7d進(jìn)行田間冠層LAI光譜測(cè)定。儀器視場(chǎng)角為25°,波段范圍為350~2 500nm,波長(zhǎng)精度為1nm。所有光譜測(cè)量均選擇在天氣晴朗、無風(fēng)或者風(fēng)速較小時(shí)進(jìn)行,測(cè)量時(shí)間段為10:00~14:00。每次測(cè)量時(shí)需用白色標(biāo)準(zhǔn)板校準(zhǔn)1次,探頭垂直向下,探頭距離冠層的垂直高度約1m。每個(gè)小區(qū)測(cè)定3點(diǎn),每點(diǎn)重復(fù)10次,取平均值作為該小區(qū)小麥的冠層光譜。
干重法,與光譜測(cè)量同步進(jìn)行。每次每個(gè)小區(qū)采樣0.5m2,隨機(jī)選取5片葉整齊地排列在一起(各葉片的中部邊緣緊靠),測(cè)其總寬度;然后精確地剪下葉片中段4厘米長(zhǎng),求得其葉面積(S1),烘干稱重(W1);再將剩余葉片烘干稱重(W2),進(jìn)而求得5株小麥的總?cè)~面積(記為S=S1×(W1+W2)/W1)。
利用光譜儀處理軟件ASD ViewSpecPro對(duì)采集的光譜曲線進(jìn)行分析,剔除無效數(shù)據(jù),所得曲線即為光譜曲線圖。另外,將350~2 500nm光譜范圍內(nèi)的水汽吸收帶1 350~1 480、1 780~1 990和2 400~2 500nm等范圍內(nèi)的噪聲波段進(jìn)行剔除(如圖1所示),使光譜數(shù)據(jù)有利于敏感波段的提取。
主成分分析(Principal Component Analysis,PCA)作為一種多元數(shù)據(jù)統(tǒng)計(jì)分析的工具,其基本方法是通過原變量構(gòu)造適當(dāng)?shù)木€性組合,產(chǎn)生一系列互不相關(guān)的新變量(主成分),從中選出少數(shù)幾個(gè)新變量盡可能多地表征原變量數(shù)據(jù)特征而不丟失信息[16]。由于高光譜相鄰波段高度相關(guān),因此將去除受水汽影響的波段之后剩下的所有波段,以5nm為波段寬度,在SAS程序中以不同生育時(shí)期分別導(dǎo)入冬小麥高光譜對(duì)應(yīng)波段的反射率數(shù)據(jù),進(jìn)行主成分分析。
表1給出了不同時(shí)期冬小麥最優(yōu)光譜波段及各個(gè)主成分解釋的變異百分比(即貢獻(xiàn)率)。由表1可知,前4個(gè)主成分就可以解釋99%以上的光譜變異。因此,將前4個(gè)主成分選擇的波段作為表征冬小麥信息的最優(yōu)波段。將每個(gè)主成分前10個(gè)最大的權(quán)重系數(shù)對(duì)應(yīng)的波段選擇出來作為表征冬小麥光譜信息的最優(yōu)波段(表1)。一般前幾個(gè)主成分選擇出的波段都包含在同一光譜區(qū)域內(nèi),表示這個(gè)主成分主要是受到選擇波段所在的光譜區(qū)域影響,而后面幾個(gè)主成分選擇的波段則一般是由幾個(gè)光譜區(qū)域構(gòu)成的。以返青期為例,光譜的第一主成分選擇的波段主要集中在1 690~1 750nm,因此這個(gè)主成分主要受到短波近紅外的影響。拔節(jié)期第二個(gè)主成分,不僅包含紅光波段,而且還包含近紅外,該主成分表示拔節(jié)期的冬小麥光譜在這些波段中包含有信息。
圖1 高光譜數(shù)據(jù)反射率曲線圖Fig.1 The graph of hyperspectral reflectivity
表1 主成分分析選擇的不同生育時(shí)期冬小麥的最優(yōu)波段及其貢獻(xiàn)率Table 1 Wavebands and proportion selected using PCA method at different growth stages
續(xù)表1
從每個(gè)時(shí)期選擇出4×10=40個(gè)光譜波段,共160個(gè)波段(包括重復(fù)波段)。將160個(gè)波段按照所有可能的波段值進(jìn)行統(tǒng)計(jì),并以50nm為區(qū)間做成直方圖(圖2藍(lán)色柱狀圖,電子版)。從圖2可以看出,冬小麥最優(yōu)波段主要分布在350~450、600~700、1 050~1 250、1 500~1 740、2 000~2 050nm這幾個(gè)區(qū)域,其中350~450nm占總波段的25.63%,600~700nm 占12.50%,1 050~1 150nm占11.25%,其他的波段范圍所占百分比相對(duì)較小。
本方法的基本原理是相關(guān)分析,計(jì)算的是波段與波段之間的相關(guān)性。對(duì)不同生育時(shí)期的光譜反射率數(shù)據(jù)進(jìn)行波段自相關(guān)分析,相關(guān)系數(shù)越小,冬小麥光譜波段信息含量越多。同主成分分析法一樣,去除受水汽影響的波段后,從350nm開始構(gòu)成340個(gè)5nm寬度的波段值,最后分別將不同生育時(shí)期的冬小麥高光譜數(shù)據(jù)導(dǎo)入SAS進(jìn)行計(jì)算,所有波段兩兩組合計(jì)算相關(guān)系數(shù)R,生成340×340個(gè)數(shù)據(jù)量的R矩陣。再將R矩陣在Excel中進(jìn)行平方計(jì)算,得到R2矩陣。
根據(jù)R2越大光譜波段之間冗余信息越多,R2越小冬小麥光譜波段信息含量越多的原則,在所有結(jié)果中選擇出前100個(gè)R2最小值對(duì)應(yīng)的波段,將這些波段進(jìn)行統(tǒng)計(jì)分析,由于數(shù)據(jù)量過大,因此只給出出現(xiàn)次數(shù)大于2次的波段值,如表2所示。
表2 波段自相關(guān)選擇的波段及出現(xiàn)的次數(shù)Table 2 Wavebands selected by intercorrelation between spectral bands and their occurrences
由表3可知,不同生育時(shí)期冬小麥信息含量豐富程度不同,對(duì)應(yīng)波段也不同。整體而言,主要集中在350~430、655~720、770~790、1 115~1 140 nm幾個(gè)區(qū)間。其中,1 115~1 140nm包含了冬小麥18.82%的信息量,655~675和350~430nm分別包含了14.1%、10.72%的信息量,另外三個(gè)波段區(qū)間所包含的信息量相對(duì)較少。
為了更加清晰的表示出波段的位置,將100個(gè)波段出現(xiàn)的情況以50nm寬度為區(qū)間做成柱狀圖,統(tǒng)計(jì)在各個(gè)區(qū)間內(nèi)波段出現(xiàn)的次數(shù),并計(jì)算得到百分比(圖2紅色柱狀圖)。由圖2可見,1 100~1 150 nm(近紅外)這個(gè)范圍內(nèi)的波段出現(xiàn)頻率最高,這個(gè)波段的反射率對(duì)葉片細(xì)胞結(jié)構(gòu)變化比較敏感,1 500~1 550nm(短波紅外)這個(gè)波段范圍的反射率對(duì)水分變化比較敏感,600~700nm波段區(qū)間是對(duì)低葉綠素含量敏感對(duì)中高葉綠素含量不敏感的紅光波段以及與生理生化參數(shù)密切相關(guān)的部分紅邊波段。另外,在350~450、750~900、1 050~1 100nm等幾個(gè)區(qū)間也有相對(duì)較高的出現(xiàn)頻率。
本方法是以LAI與原始光譜(去除水汽影響波段)相關(guān)系數(shù)的波段選擇。計(jì)算這些原始光譜與LAI之間的相關(guān)系數(shù),然后根據(jù)相關(guān)系數(shù)與光譜波長(zhǎng)的關(guān)系圖,選擇出不同生育期的相關(guān)系數(shù)較大值所對(duì)應(yīng)的波段。表3給出了相關(guān)系數(shù)較大的波段作為冬小麥LAI估算的合適波段。
圖2 前三種方法選擇的波段出現(xiàn)次數(shù)百分比的綜合比較(區(qū)間寬度為50nm)Fig.2 Occurrence percentage of hyperspectral narrow bands in 50nm bandwidth over all bands selected using 3 methods
表3 原始光譜相關(guān)系數(shù)選擇的光譜波段Table 3 Wavebands selected using correlation coefficient between spectral bands and LAI
將原始光譜與LAI計(jì)算所得相關(guān)系數(shù)選擇的波段進(jìn)行匯總,然后以50nm為間隔統(tǒng)計(jì)出現(xiàn)在各個(gè)光譜區(qū)間的波段個(gè)數(shù)(圖2電子版中綠色柱狀圖),并計(jì)算其百分比。所選擇的光譜波段主要位于可見光區(qū)域350~450nm,近紅外600~700、1 100~1 150nm區(qū)域,和短波紅外2 350~2 400 nm區(qū)域。
由圖2可見,冬小麥LAI估算的光譜波段主要位于可見光區(qū)域350~450nm,近紅外600~700、1 100~1 150nm區(qū)域(圖2電子版綠色柱狀條所示)。與另外兩種方法選擇出的波段(圖2電子版紅色和藍(lán)色柱狀條所示)有重合部分,表示這三種方法選擇的波段都包含有LAI信息。
雖然主成分分析和波段自相關(guān)分析選出的波段有所不同,但是這些波段都包含了能表征冬小麥LAI信息的波段,表明主成分分析和波段自相關(guān)分析這兩種方法在反映冬小麥信息時(shí),選擇的波段會(huì)包含冬小麥所有信息,而與LAI相關(guān)分析時(shí)選擇的波段主要是有關(guān)LAI的信息。
本文以冬小麥大田試驗(yàn)為基礎(chǔ),研究了冬小麥四個(gè)生育時(shí)期的冠層光譜,并針對(duì)高光譜數(shù)據(jù)波段多、數(shù)據(jù)量大、冗余度大等特點(diǎn),論述了冬小麥高光譜數(shù)據(jù)信息提取的兩種方法:一是主成分分析法,二是波段自相關(guān)分析法,并用原始光譜與LAI相關(guān)系數(shù)法進(jìn)行驗(yàn)證。
按照特征提取的觀點(diǎn),主成分分析相當(dāng)于一種基于最小均方誤差的提取方法,是研究如何將多指標(biāo)問題轉(zhuǎn)化為較少的綜合指標(biāo)的一種重要統(tǒng)計(jì)方法[16]。與另外兩種方法相比較,最突出的優(yōu)點(diǎn)是選出來的敏感波段會(huì)有各自的貢獻(xiàn)率,對(duì)于本研究來說,前4個(gè)主成分就包含了全部信息的99%,這對(duì)于大量遙感數(shù)據(jù)提取敏感波段有重要意義,既壓縮了數(shù)據(jù)量又不會(huì)丟失信息,使得所獲取的信息豐富、完整,對(duì)于今后進(jìn)一步進(jìn)行詳細(xì)農(nóng)學(xué)指標(biāo)信息的提取打下基礎(chǔ)。
波段自相關(guān)法是波段與波段之間進(jìn)行的相關(guān)分析,可以更直觀、快捷的剔除其冗余信息,減少波段間的干擾,為之后具體與冬小麥各農(nóng)學(xué)指標(biāo)進(jìn)行計(jì)算時(shí)減小計(jì)算量,節(jié)約時(shí)間。但是波段自相關(guān)法也有其自身缺點(diǎn),它不像主成分分析一樣可以直接利用貢獻(xiàn)率大小挑選敏感波段,而是需要人工選擇相關(guān)系數(shù)最小的波段,費(fèi)時(shí)費(fèi)力。
原始光譜與LAI進(jìn)行的相關(guān)分析,其結(jié)果百分比中最大的5個(gè)峰值相差很小,說明這些波段中包含了較多與LAI有關(guān)的信息,且該方法同樣可以用在葉綠素、可溶性糖、有機(jī)質(zhì)、氮素等一些其他指標(biāo)與原始光譜進(jìn)行相關(guān)系數(shù)分析上。
主成分分析法和波段自相關(guān)分析法兩種方法選擇的波段主要在可見光區(qū)域、近紅外區(qū)域和短波紅外區(qū)域,而基于原始光譜與LAI相關(guān)系數(shù)法作為驗(yàn)證方法選擇的波段主要在可見光區(qū)域和近紅外區(qū)域。這就說明,主成分分析和波段自相關(guān)分析都是只針對(duì)光譜數(shù)據(jù)的波段選擇,是從整體上進(jìn)行的信息提取,波段選擇的結(jié)果受包括LAI在內(nèi)的多種因素綜合影響。原始光譜與LAI進(jìn)行的相關(guān)分析法,驗(yàn)證了前兩種方法所選擇波段的信息的正確性及豐富性,為后續(xù)的建模等提供方法基礎(chǔ)。
另外,本研究基于大田試驗(yàn)進(jìn)行的測(cè)量,由于種植方式、肥力狀況、管理水平等的差異,可能會(huì)對(duì)冬小麥的光譜特征產(chǎn)生一定影響,方法是否適合其它更廣闊的領(lǐng)域還有待進(jìn)一步驗(yàn)證。
[1]杜華強(qiáng),趙憲文,范文義.分形維數(shù)作為高光譜遙感數(shù)據(jù)波段選擇的一個(gè)指標(biāo)[J].遙感技術(shù)與應(yīng)用,2004,19(1):5-9.
[2]劉建平,趙英時(shí),孫淑玲.高光譜遙感數(shù)據(jù)最佳波段選擇方法試驗(yàn)研究[J].遙感技術(shù)與應(yīng)用,2001,16(1):7-9.
[3]Thenkabail P S,Enclona E A,Ashton M S,et al.Accuracy assessments of hyperspectral waveband performance for vegetation analysis applications[J].Remote Sensing of Environment,2004,3(4):354-376.
[4]A.Lavanya,S.Sanjeevi.An Improved Band Selection Technique for Hyperspectral Data Using Factor Analysis[J].Journal of the Indian Society of Remote Sensing,2013,41(2):199-211.
[5]張雪紅,劉紹民,何蓓蓓.基于包絡(luò)線消除法的油菜氮素營(yíng)養(yǎng)高光譜評(píng)價(jià)[J].農(nóng)業(yè)工程學(xué)報(bào),2008,24(10):151-155.
[6]Nakariyakul S,Casasent D.Hyperspectral ratio feature selection:agricultural product inspection example [C]// Proc of Spie,vol5587.2004:133-143.
[7]Withagen P J,den Breejen E,F(xiàn)ranken E M,et al.Band selection from a hyperspectral data-cube for a real-time multispectral 3CCD camera[C]//Shen S S,Descour M R.Proc of Spie,vol4381.Orlando:[s.n],2001:84-93.
[8]趙進(jìn)平,王維波,Cooper Lee.利用北冰洋多光譜數(shù)據(jù)計(jì)算光合有效輻射的研究[J].極地研究,2010,22(2):91-95.
[9]劉占宇,黃敬峰,吳新宏,等.天然草地植被覆蓋度的高光譜遙感估算模型[J].應(yīng)用生態(tài)學(xué)報(bào),2006,17(6):998-1002.
[10]楊峰,范亞民,李建龍,等.高光譜數(shù)據(jù)估測(cè)稻麥葉面積指數(shù)和葉綠素密度[J].農(nóng)業(yè)工程學(xué)報(bào),2010,26(2):237-242.
[11]馮偉,朱艷,姚霞,等.基于高光譜遙感的小麥葉干重和葉面積指數(shù)監(jiān)測(cè)[J].植物生態(tài)學(xué)報(bào),2009,33(1):34-44.
[12]柏軍華,李少昆,王克如,等.基于近地高光譜棉花生物量遙感估算模型[J].作物學(xué)報(bào),2007,33(2):311-316.
[13]趙剛峰,李軍,劉冰峰,等.關(guān)中冬小麥葉片氮素含量高光譜遙感監(jiān)測(cè)模型[J].麥類作物學(xué)報(bào),2012,32(3):530-536.
[14]王淵,黃敬峰,王福民,等.油菜葉片和冠層水平氮素含量的高光譜反射率估算模型[J].光譜學(xué)與光譜分析,2008,28(2):273-275.
[15]黃敬峰,王福民,王秀珍.水稻高光譜遙感實(shí)驗(yàn)研究[M].杭州:浙江大學(xué)出版社,2010:32-33.
[16]唐紅,鄭文斌,李憲霞.主成分分析在光全散射特征波長(zhǎng)選擇中的應(yīng)用[J].光學(xué)精密工程,2010,18(8):1691-1698.
The Study of Winter Wheat Hyperspectral Information Extraction Method
Li Zhihua,F(xiàn)eng Meichen,Wang Chao,Zhao Jiajia,Wang Huiqin,Liu Tingting,Yang Wude*
(InstituteofDryFarmingEngineering,ShanxiAgriculturalUniversity,TaiguShanxi030801,China)
In accordance with the high spectral data band,the large amount of data and the redundancy of the high data,the method of principal component analysis(PCA)and band intercorrelation analysis were used in the paper.The experiment was conducted to obtain the hyperspectral data under different growth stages of winter wheat.Moreover,the extracted hyperspectral information was validated by the sensitive bands of leaf area index (LAI)selected with the method of correlative analysis.The results showed that the hyperspectral information selected with methods of principal component analysis(PCA)and intercorrelation analysis are mainly centered in the area of 350~450nm,600~700nm,1 100~1 200nm and 1 500~1 750nm which covered the visible,near-infrared and shortwave infrared bands.To validate the selected hyperspectral information,the sensitive bands of LAI extracted with the correlative coefficient analysis were contained in the hyperspectral information of winter wheat.The paper indicated that the method of PCA and correlation analysis was available and reliable in reducing the hyperspectral redundancy and extracting hyperspectral information of winter wheat.
Hyperspectral remote sensing;Information extraction;PCA;Intercorrelation
S 12;S126
A
1671-8151(2015)05-0467-07
10.13842/j.cnki.issn1671-8151.2015.05.004
2015-03-06
2015-05-01
李志花(1988-),女(漢),山西離石人,碩士研究生,研究方向:作物信息技術(shù)
*通訊作者:楊武德,教授,博士生導(dǎo)師。Tel:0354-6288227,E-mail:sxauywd@126.com
國(guó)家自然科學(xué)基金項(xiàng)目(31371572,31201168);山西省科技攻關(guān)項(xiàng)目(20110311038);山西省青年基金項(xiàng)目(2012021023-5)
(編輯:武英耀)