• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      高光譜數(shù)據(jù)降維對(duì)馬鈴薯分類的影響

      2017-11-18 19:55:09王麗艷薛河儒王洪南
      江蘇農(nóng)業(yè)科學(xué) 2017年18期
      關(guān)鍵詞:主成分分析馬鈴薯

      王麗艷+薛河儒+王洪南

      摘要:高光譜儀器采集光譜數(shù)據(jù)的波長(zhǎng)范圍大、波段數(shù)據(jù)多。如果將這些波段作為模型的輸入,數(shù)據(jù)量大、計(jì)算太復(fù)雜,必然會(huì)影響建模的速度,因此有必要采取合適的算法對(duì)高光譜圖像的光譜數(shù)據(jù)進(jìn)行降維處理。采用主成分分析(principal component analysis,簡(jiǎn)稱PCA)、逐步判別分析、連續(xù)投影(successive projections algorithm,簡(jiǎn)稱SPA)方法對(duì)馬鈴薯的光譜數(shù)據(jù)進(jìn)行降維處理。主成分分析選出8個(gè)特征波段,逐步判別分析選出8個(gè)特征波段,連續(xù)投影法選出6個(gè)特征波段。將降維后的特征波段作為輸入,分別建立支持向量機(jī)(support vector machine,簡(jiǎn)稱SVM)模型,這3種降維方法的識(shí)別準(zhǔn)確率均為100%,由于連續(xù)投影法選擇的波段數(shù)少,所以連續(xù)投影法是一種較好的降維方法。

      關(guān)鍵詞:高光譜數(shù)據(jù)降維;馬鈴薯;主成分分析;逐步判別;連續(xù)投影

      中圖分類號(hào): TP391.4 文獻(xiàn)標(biāo)志碼: A 文章編號(hào):1002-1302(2017)18-0229-04

      收稿日期:2016-04-06

      基金項(xiàng)目:國(guó)家自然科學(xué)基金(編號(hào):61461041)。

      作者簡(jiǎn)介:王麗艷(1987—),女,內(nèi)蒙古通遼人,碩士,主要從事模式識(shí)別與圖像處理研究。E-mail:1515128328@qq.com。

      通信作者:薛河儒,博士,教授,主要從事模式識(shí)別與圖像處理研究。E-mail:xuehr@imau.edu.cn。 目前,高光譜成像技術(shù)廣泛應(yīng)用在無(wú)損檢測(cè)領(lǐng)域,高光譜圖像集合了圖像信息和光譜信息,圖像信息可以反映樣本外部品質(zhì)的一些特征[1];光譜信息則反映樣品內(nèi)部品質(zhì),根據(jù)內(nèi)部不同成分對(duì)光譜的吸收不同來(lái)檢測(cè)樣本物理結(jié)構(gòu)、化學(xué)成分,有一舉兩得的作用,但是光譜信息數(shù)據(jù)量大,影響建模速度[2]。本試驗(yàn)采用的光譜儀測(cè)量的波長(zhǎng)范圍為380~1 000 nm,光譜分辨率為4.8 nm,平均間隔0.8 nm,采集的馬鈴薯高光譜圖片為388像素×1 004像素,總共有750個(gè)波段,即使將6個(gè)波段混在一起,也要125個(gè)波段。將125個(gè)數(shù)據(jù)作為模型的輸入,數(shù)據(jù)量大、計(jì)算復(fù)雜,必然會(huì)影響建模的速度和精度。因此,有必要采取合適的算法對(duì)高維數(shù)據(jù)進(jìn)行降維處理,將高維數(shù)據(jù)映射到低維數(shù)據(jù),提取特征波段,對(duì)高光譜圖像及數(shù)據(jù)進(jìn)行快速處理具有重要意義[3-4]。

      目前,光譜數(shù)據(jù)降維已成為高光譜研究領(lǐng)域的熱點(diǎn)。丁玲等采用全局等距特征映射(isometric feature mapping,簡(jiǎn)稱ISOMAP)算法[5],對(duì)高光譜遙感數(shù)據(jù)進(jìn)行非線性降維,使數(shù)據(jù)具有較好的壓縮性,具有良好的降維效果,提高了分類的精度;臧卓等利用主成分分析法對(duì)喬木樹種進(jìn)行高光譜數(shù)據(jù)降維,并使用不同的分類方法對(duì)降維后的數(shù)據(jù)進(jìn)行分類發(fā)現(xiàn),主成分的個(gè)數(shù)對(duì)分類結(jié)果影響比較明顯[6-7]。近鄰保持嵌入模型雖然可以實(shí)現(xiàn)簡(jiǎn)單、快速、非線性的降維,但是性能嚴(yán)重依賴于所選取的距離度測(cè)量度[8],陳新忠等提出一種加權(quán)近鄰保持嵌入的一種降維方法,改進(jìn)了這一算法[9]。目前,關(guān)于數(shù)據(jù)降維對(duì)馬鈴薯分類影響的研究較少,因此本研究采用主成分分析[7]、逐步判別、連續(xù)投影方法對(duì)馬鈴薯的光譜數(shù)據(jù)進(jìn)行降維處理,將降維后的數(shù)據(jù)作為輸入,建立支持向量機(jī)種類鑒別模型,實(shí)現(xiàn)對(duì)費(fèi)烏瑞它、克新、大西洋等3種馬鈴薯的種類鑒別。

      1 材料與方法

      1.1 儀器設(shè)備

      試驗(yàn)采用基于高光譜圖像采集系統(tǒng),由高光譜成像光譜儀[HyperSpec VNIR(380~1 000 nm)]、高精度掃描云臺(tái)(Hyperspec Pan&Tilt)、光纖鹵素?zé)粝到y(tǒng)(PHOTO LIGHT-1 000 W)等部件組成。光譜儀測(cè)量的光譜范圍是380~1 000 nm,光譜分辨率為4.8 nm,平均間隔0.8 nm。光譜數(shù)據(jù)分析采用ENVI[國(guó)際電話電報(bào)公司(Internatinal Telephone and Telegraph Corporation,簡(jiǎn)稱ITT,美國(guó))]軟件和Matlab 2011b(MathWorks,內(nèi)蒂克,美國(guó))來(lái)完成。

      1.2 樣本來(lái)源與圖像獲取

      試驗(yàn)選用武川黃馬鈴薯的3個(gè)品種(圖1):大西洋、費(fèi)烏瑞它、克新,選取大小、形狀均勻一致的馬鈴薯各50個(gè),其中每個(gè)品種30個(gè)作為校正集,20個(gè)作為預(yù)測(cè)集。

      高光譜圖像在采集過(guò)程中,因攝像頭傳感器中存在暗電流以及各波段下的光源強(qiáng)度分布不均勻,會(huì)使高光譜圖像數(shù)據(jù)存在較大噪聲,不同波長(zhǎng)下的圖像亮度值也存在較大差異[10]。因此,在數(shù)據(jù)分析前,須對(duì)高光譜圖像進(jìn)行標(biāo)定,標(biāo)定過(guò)程為在設(shè)定的圖像采集參數(shù)條件下,采集標(biāo)準(zhǔn)白色校正板的標(biāo)定圖像(W);隨后蓋上鏡頭蓋,采集全黑的標(biāo)定圖像(B);再按公式(1)對(duì)高光譜圖像數(shù)據(jù)進(jìn)行標(biāo)定校正,將采集的絕對(duì)圖像(I)轉(zhuǎn)換成相對(duì)圖像(R)。

      R=I-BW-B。

      1.3 光譜數(shù)據(jù)提取及預(yù)處理

      利用ENVI軟件提取其中3個(gè)光線均勻的感興趣區(qū)域,每個(gè)感興趣區(qū)域要選擇光線均勻的部位,并且越大越好,然后計(jì)算3個(gè)感興趣區(qū)域的平均反射率,得到的馬鈴薯平均反射光譜(圖2),采用Matlab 2011b軟件,對(duì)3類馬鈴薯的光譜曲線進(jìn)行多元散射校正(muliplicative scatter correction,簡(jiǎn)稱MSC)預(yù)處理[11](圖3)。

      2 結(jié)果與分析

      利用Matlab 2011b和SAS軟件對(duì)光譜數(shù)據(jù),采用主成分分析、逐步判別、連續(xù)投影3種方法進(jìn)行降維處理。

      2.1 主成分分析

      通過(guò)主成分分析對(duì)高光譜數(shù)據(jù)進(jìn)行降維[7],累計(jì)方差貢獻(xiàn)率大于85%的作為主成分,每個(gè)主成分都是由原始的各個(gè)波長(zhǎng)下的圖像的線性組合[12]。

      PCk表示第K個(gè)主成分;αi表示第i個(gè)波段的權(quán)重系數(shù);Ii表示第i個(gè)波段的原始圖像。第一主成分的貢獻(xiàn)率已經(jīng)達(dá)到85%以上,根據(jù)第一主成分各波段的權(quán)重系數(shù),選出絕對(duì)值最大的權(quán)重系數(shù)所對(duì)應(yīng)的波段作為特征波段。本試驗(yàn)發(fā)現(xiàn)8個(gè)特征波段(530.1、621.3、678.9、683.7、799.0、803.8、endprint

      875.5、943.0 nm),各波段的主成分載荷如圖4所示。

      2.2 SAS逐步判別

      利用SAS軟件進(jìn)行逐步判別,基本思想為每次引入1個(gè)

      變量,將其視為“最重要”的變量,同時(shí)檢測(cè)先前引入的變量,如果由于新變量引入使先前的變量的判別能力下降,則將其先前的變量從判別式中剔除,直到判別式中的變量都很顯著,逐步篩選結(jié)束。逐步判別就是不斷檢驗(yàn)篩選進(jìn)來(lái)的變量,找出顯著變量,剔除不顯著變量。利用SAS中STEPDISC過(guò)程篩選出對(duì)數(shù)據(jù)的判別具有顯著影響的變量。STEPDISC過(guò)程的基本語(yǔ)法格式為(1)PROC STEPDISC選項(xiàng);(2)CLASS分類變量;(3)VAR指標(biāo)變量,其中PROC語(yǔ)句為必需語(yǔ)句,用于指定分析的過(guò)程為STEPDISC逐步判別分析過(guò)程。在選項(xiàng)中當(dāng)引入變量顯著水平P為0.000 1,剔除變量的顯著水平P為0.01時(shí)引入的變量時(shí),達(dá)到最大的降維限度。

      圖5中各變量為x2、x21、x78、x83、x96、x97、x112、x119,對(duì)應(yīng)的波段分別為405.3、496.5、770.2、794.2、856.6、861.4、9334、967.0 mm。

      2.3 連續(xù)投影

      連續(xù)投影法能有效解決波長(zhǎng)變量之間的共線性問(wèn)題[13],選擇出冗余信息較少的波長(zhǎng)。本試驗(yàn)選擇6個(gè)特征波段。由圖6可知,選出的特征波段變量為x2、x11、x57、x62、x66、x86,它們所對(duì)應(yīng)的波段為405.3、448.5、669.3、693.3、712.5、808.6 nm。

      2.4 建立支持向量機(jī)種類鑒別模型

      支持向量機(jī)在解決小樣本、非線性識(shí)別中表現(xiàn)出許多特有的優(yōu)勢(shì)。將SVM引入到光譜分析中建立定量或定性模型時(shí)常采用徑向基核函數(shù)(radial basis function,簡(jiǎn)稱RBF),即某種沿徑向?qū)ΨQ的標(biāo)量函數(shù)。通常定義為空間任意一點(diǎn)到中心之間的歐式距離的單調(diào)函數(shù)。徑向基核函數(shù)能實(shí)現(xiàn)非線性映射,可以處理系統(tǒng)內(nèi)難以解析的規(guī)律性,具有良好的泛化能力,有很快的學(xué)習(xí)收斂速度,而且參數(shù)較少、計(jì)算范圍也較小[14]。目前已廣泛應(yīng)用在非線性函數(shù)逼近、時(shí)間序列分析、模式識(shí)別、圖像處理、信息處理等[15]。

      選用RBF作為核函數(shù)需要考慮2個(gè)重要參數(shù):懲罰參數(shù)c、核參數(shù)g。SVM分類模型的精度取決于這2個(gè)參數(shù)的組合,通常采用交叉驗(yàn)證方法提高預(yù)測(cè)精度。采用網(wǎng)絡(luò)搜索來(lái)找到較好的1組,先初步設(shè)定大的搜索范圍,再減小搜索范圍,減小步長(zhǎng),找到更優(yōu)的參數(shù)組合,并且提高模型的推廣能力。K重交叉驗(yàn)證是SVM中常用的交叉驗(yàn)證方法,因?yàn)閰?shù)的選擇并沒有一定的先驗(yàn)知識(shí),必須做某種類型的模型選擇(參數(shù)搜索)。目的是確定好的(c、g)使分類器能正確地預(yù)測(cè)未知數(shù)據(jù),它是將原始數(shù)據(jù)隨機(jī)分成K個(gè)模型,用這K個(gè)模型最終驗(yàn)證集的分類準(zhǔn)確率的平均數(shù)作為K-CV下分類器的性能指標(biāo)。K-CV可以有效避免過(guò)學(xué)習(xí)及欠學(xué)習(xí)狀態(tài)的發(fā)生,最后得到的結(jié)果也具有說(shuō)服力。

      本試驗(yàn)采用K-交叉驗(yàn)證(cross-validation,簡(jiǎn)稱CV)的辦法得到最佳參數(shù),初步搜索的范圍c=[2-10,…,210],g=[2-10,…,210],K=3,CV=100。該搜索范圍內(nèi)的得到最佳參數(shù)c=1 024,g=1 024。SVM模型得到準(zhǔn)確率為100%,鑒別結(jié)果如圖7所示。由圖7可知,3種降維方法都可以將3種馬鈴薯準(zhǔn)確分類。

      3 結(jié)論

      高光譜儀器采集光譜數(shù)據(jù)的波長(zhǎng)范圍較大、波段數(shù)較多。如果將這些波段作為模型的輸入,數(shù)據(jù)量太大、數(shù)據(jù)冗余、計(jì)算太復(fù)雜,必然會(huì)影響建模的速度和精度。本研究采用主成分分析、逐步判別分析、連續(xù)投影等方法對(duì)馬鈴薯的光譜數(shù)據(jù)進(jìn)行降維處理,主成分分析選出8個(gè)特征波段,逐步判別分析選出8個(gè)特征波段,連續(xù)投影法選出6個(gè)特征波段。將降維后的數(shù)據(jù)分別作為輸入,建立支持向量機(jī)數(shù)學(xué)模型,識(shí)別準(zhǔn)確率為100%。3種降維方法中,連續(xù)投影法能有效解決波長(zhǎng)變量之間的共線性問(wèn)題,選擇出冗余信息較少的波長(zhǎng),自由選擇波段個(gè)數(shù),并實(shí)現(xiàn)對(duì)馬鈴薯的準(zhǔn)確分類,所以連續(xù)投影法可以作為光譜數(shù)據(jù)降維常用的一種方法。

      由于本試驗(yàn)只是分別針對(duì)大西洋、費(fèi)烏瑞它、克新等3種馬鈴薯進(jìn)行的分類,并且3種馬鈴薯的光譜形狀差距較大,使降維比較容易,因此今后要將更多的品種考慮進(jìn)來(lái),提高降維的準(zhǔn)確度,使模型更加穩(wěn)定。

      參考文獻(xiàn):

      [1]臧 卓,林 輝,孫 華,等. 南方主要針葉樹種高光譜數(shù)據(jù)降維分類研究[J]. 中南林業(yè)科技大學(xué)學(xué)報(bào),2010,30(11):20-25.

      [2]朱 艷,劉曉莉,楊哲海. 高光譜數(shù)據(jù)的降維及Tabu搜索算法的應(yīng)用[J]. 測(cè)繪科學(xué)技術(shù)學(xué)報(bào),2007,24(1):22-25,29.

      [3]高 陽(yáng). 高光譜數(shù)據(jù)降維算法研究[D]. 徐州:中國(guó)礦業(yè)大學(xué),2013.

      [4]柳萍萍,林 輝,孫 華,等. 高光譜數(shù)據(jù)的降維處理方法研究[J]. 中南林業(yè)科技大學(xué)學(xué)報(bào),2011,31(11):34-38.

      [5]丁 玲,唐 娉,李宏益. 基于ISOMAP的高光譜遙感數(shù)據(jù)的降維與分類[J]. 紅外與激光工程,2013,42(10):2707-2711.

      [6]臧 卓. 南方主要喬木樹種高光譜數(shù)據(jù)降維組合分類算法研究[D]. 長(zhǎng)沙:中南大學(xué),2013.

      [7]臧 卓,林 輝,楊敏華. 利用PCA算法進(jìn)行喬木樹種高光譜數(shù)據(jù)降維與分類[J]. 測(cè)繪科學(xué),2014,39(2):146-149.

      [8]李 娜,趙慧潔,賈國(guó)瑞. 因子分析模型的高光譜數(shù)據(jù)降維方法[J]. 中國(guó)圖象圖形學(xué)報(bào),2011,16(11):2030-2035.

      [9]陳新忠,胡匯涓,王雪松. 基于加權(quán)近鄰保持嵌入的高光譜數(shù)據(jù)降維方法[J]. 中國(guó)礦業(yè)大學(xué)學(xué)報(bào),2013,42(6):1066-1072.

      [10]孫墨寒. 高光譜數(shù)據(jù)誤差估計(jì)及降維方法研究[D]. 北京:中國(guó)地質(zhì)大學(xué),2013.

      [11]楊珺雯,張錦水,朱秀芳,等. 隨機(jī)森林在高光譜遙感數(shù)據(jù)中降維與分類的應(yīng)用[J]. 北京師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,51(增刊1):82-88.

      [12]臧 卓,林 輝,楊敏華. ICA與PCA在高光譜數(shù)據(jù)降維分類中的對(duì)比研究[J]. 中南林業(yè)科技大學(xué)學(xué)報(bào),2011,31(11):18-22.

      [13]高 陽(yáng),王雪松,程玉虎,等. 基于非負(fù)稀疏嵌入投影的高光譜數(shù)據(jù)降維方法[J]. 中國(guó)礦業(yè)大學(xué)學(xué)報(bào),2012,41(6):1010-1017.

      [14]臧 卓,林 輝,楊敏華. 基于PSO-SVM的高光譜數(shù)據(jù)降維的可靠性研究[J]. 中國(guó)農(nóng)學(xué)通報(bào),2011,27(31):47-52.

      [15]金鵬磊. 空譜聯(lián)合高光譜數(shù)據(jù)降維與分類方法研究[D]. 西安:西安電子科技大學(xué),2014.付煥森,王郭全,夏華鳳,等. 農(nóng)產(chǎn)品保鮮冷庫(kù)的PLC控制與關(guān)鍵技術(shù)研究[J]. 江蘇農(nóng)業(yè)科學(xué),2017,45(18):233-236.endprint

      猜你喜歡
      主成分分析馬鈴薯
      馬鈴薯有功勞
      馬鈴薯種植中常見不良現(xiàn)象的發(fā)生原因及預(yù)防
      春栽馬鈴薯種植技術(shù)
      定邊馬鈴薯
      基于NAR模型的上海市房產(chǎn)稅規(guī)模預(yù)測(cè)
      主成分分析法在大學(xué)英語(yǔ)寫作評(píng)價(jià)中的應(yīng)用
      江蘇省客源市場(chǎng)影響因素研究
      SPSS在環(huán)境地球化學(xué)中的應(yīng)用
      考試周刊(2016年84期)2016-11-11 23:57:34
      長(zhǎng)沙建設(shè)國(guó)家中心城市的瓶頸及其解決路徑
      服務(wù)貿(mào)易結(jié)構(gòu)優(yōu)化路徑研究
      桃园县| 镇原县| 屯留县| 郧西县| 上饶市| 宁南县| 松桃| 潜山县| 基隆市| 天台县| 内江市| 桐柏县| 贵德县| 额尔古纳市| 青海省| 奉节县| 三门峡市| 富民县| 都江堰市| 姚安县| 略阳县| 冕宁县| 兴宁市| 舟山市| 博罗县| 万载县| 新安县| 曲周县| 巴林右旗| 霸州市| 巩义市| 南投县| 辽宁省| 辉南县| 育儿| 武鸣县| 陵川县| 嘉义县| 沈阳市| 万盛区| 莱阳市|