• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于葉片圖像處理和稀疏表示的植物識別方法

      2016-11-28 16:16:41李萍張波張善文
      江蘇農(nóng)業(yè)科學(xué) 2016年9期

      李萍+張波+張善文

      摘要:基于植物葉片圖像的植物識別方法研究在保護(hù)生態(tài)環(huán)境方面具有十分重要的意義。針對植物葉片的復(fù)雜、多樣性而導(dǎo)致很多基于特征提取的植物識別方法識別率不高的問題,提出了一種基于改進(jìn)稀疏表示的植物識別方法。該方法利用最近鄰準(zhǔn)則實(shí)現(xiàn)稀疏表示,通過稀疏表示系數(shù)實(shí)現(xiàn)植物識別。該方法的創(chuàng)新點(diǎn)是將葉片圖像識別問題轉(zhuǎn)化為求解待識別樣本關(guān)于訓(xùn)練樣本的稀疏表示問題,是直接對原始葉片圖像進(jìn)行操作,而不需要進(jìn)行特征提取和選擇過程,由此提高了算法的識別效率。在6種葉片圖像數(shù)據(jù)集上的試驗(yàn)結(jié)果顯示,該方法對葉片圖像識別是可行的,識別率高達(dá)94%以上。該方法為非線性、復(fù)雜葉片圖像識別提供了一種途徑。

      關(guān)鍵詞:植物葉片圖像;植物識別;稀疏表示分類;改進(jìn)的稀疏表示

      中圖分類號: TP391.41;S126 文獻(xiàn)標(biāo)志碼: A

      文章編號:1002-1302(2016)09-0364-04

      植物是人類賴以生存、生產(chǎn)和發(fā)展所必需的物質(zhì)資源。同時(shí),植物在水土保持、抑制荒漠和改善氣候等很多方面起著至關(guān)重要的作用。近年來隨著人類生產(chǎn)活動的日益增加,生態(tài)環(huán)境不斷遭到破壞,使得很多物種滅絕或?yàn)l臨滅絕。隨著生物多樣性的消失,人類賴以生存的自然環(huán)境受到很大威脅。因此,保護(hù)植物物種刻不容緩。要保護(hù)植物,就必須識別植物。利用植物葉片圖像進(jìn)行植物識別方法研究是目前的一個(gè)重要研究方向,已經(jīng)出現(xiàn)了很多較有效的植物識別方法?,F(xiàn)有的植物識別方法可以分為兩大類:基于特征提取和選擇的識別方法[1-4]和基于維數(shù)約簡的識別方法[5]。這些方法的一個(gè)共有的不足是,在植物識別的過程中,都把同類中的不同的葉片或從同類中不同的葉片中提取的特征對于識別算法的貢獻(xiàn)同樣看待。也就是說,訓(xùn)練集中同類植物的不同的葉片及其不同的特征,對識別的重要性是同等對待的。為了提高識別率,很多學(xué)者選擇較好的葉片作為訓(xùn)練集。但由于葉片的復(fù)雜多樣性,甚至同一植物上的葉片之間可能差別很大,使得很多現(xiàn)有的植物識別方法實(shí)際識別率不高。圖1為同一棵樹上的葉片圖像,由圖1可以看出,各個(gè)葉片之間存在明顯差異,特別是構(gòu)樹葉。

      近年來,稀疏表示作為信號處理、圖像處理和模式識別強(qiáng)有力的工具,受到了廣大學(xué)者的廣泛關(guān)注[6-8]。所謂樣本的稀疏表示,就是將給定的樣本表示為字典的相對較少數(shù)目的幾個(gè)基的線性組合。l0最小化問題可以用來求解最優(yōu)的稀疏表示,但它是一個(gè)NP難問題。很多實(shí)例證實(shí)了稀疏或近似稀疏的樣本可由求解凸優(yōu)化問題(即l1最小化問題),使得這個(gè)最優(yōu)問題得到了有效解決。由于稀疏表示具有判別性和魯棒性,它已經(jīng)被成功地應(yīng)用于模式識別中。與傳統(tǒng)的模式識別方法相比,稀疏表示在識別精度上有較大的改進(jìn)。盡管稀疏表示在人臉識別、手勢識別和信號分析等領(lǐng)域取得了較好的效果,但鮮有應(yīng)用于植物識別領(lǐng)域。本研究在稀疏表示的基礎(chǔ)上提出了一種植物識別方法[9]。在該方法中,字典直接由訓(xùn)練樣本組成。如果每一類植物有足夠的訓(xùn)練葉片圖像樣本,那么1個(gè)測試樣本的線性表示自然是稀疏的。

      1 稀疏表示

      根據(jù)得到的稀疏表示系數(shù)A或B,可以計(jì)算測試樣本與各類訓(xùn)練樣本的殘差;根據(jù)殘差的大小可以確定測試樣本的類別。該分類方法被稱為基于稀疏表示的分類(SRC)算法。該算法在沒有光照變化、遮擋腐蝕、方位變化等的理想情況下,若有多幅訓(xùn)練圖像輸入時(shí)能夠得到較高的識別率。所以該算法適用于某些特定的場景,如秘密地點(diǎn)或門禁系統(tǒng)。在非理想情況下,如實(shí)際拍攝的植物葉片圖像,可能出現(xiàn)在圖像局部空間的鏡面反射、陰影、遮擋、方位不正和葉片殘缺不全等時(shí),若直接利用SRC算法得到的識別率較低。實(shí)際上,葉片圖像的這些非理想情況一般只限于圖像的一部分,對于整個(gè)圖像的像素而言是稀疏的,所以在式(6)中可以利用1個(gè)附加的誤差e來表示非理想情況下輸入圖像與訓(xùn)練圖像之間的誤差。則式(6)的優(yōu)化問題可以轉(zhuǎn)化為式(7)的最優(yōu)解問題:

      2 基于近鄰稀疏表示的植物識別

      雖然SRC算法有很多令人滿意的優(yōu)點(diǎn),但也存在一些缺陷。該算法根據(jù)基元素所屬的類別對測試樣本y進(jìn)行分類,若基元素屬于第i類,則y也屬于第i類。其中,基元素為那些可以最好地稀疏表示y的那一類訓(xùn)練樣本。在植物葉片圖像分類中,由于同一棵樹上的葉片之間差異可能較大,所以這一條件不容易滿足。也就是說,由y確定的這組基元素中很可能包括距離y較遠(yuǎn)的樣本,即這組基元素并不一定是y的局部近鄰。在這種情況下,根據(jù)SRC算法,y將被分到某一類中,其中該類基元素所張成的子空間距離y最近,即使該類樣本離y較遠(yuǎn)。然而,若這一結(jié)論成立,SRC算法需要一個(gè)前提假設(shè):每一類的基元素之間的距離較遠(yuǎn),由各類基元素張成的子空間仍然是線性。因此,SRC算法不能有效解決植物葉片圖像等非線性數(shù)據(jù)分類問題。為此,在SRC的基礎(chǔ)上本研究提出一種改進(jìn)的SRC算法(MSRC)[9]。

      3 試驗(yàn)結(jié)果與分析

      本節(jié)試驗(yàn)驗(yàn)證本研究提出的植物識別方法的有效性。在試驗(yàn)中,選擇6種植物(海棠、五角楓、龍抓槐、枇杷、銀杏和櫻花)葉片圖像(圖2);圖3為訓(xùn)練集中50幅枇杷和五角楓葉片圖像。

      在試驗(yàn)之前,需要對所有葉片圖像進(jìn)行剪切、對齊、平滑濾波、消除葉柄和灰度化等預(yù)處理。為了便于計(jì)算,將每幅圖像裁剪成32×32的圖像。然后把每幅灰度圖像(即矩陣)變成維數(shù)大小相同的向量,作為植物識別算法的輸入數(shù)據(jù)。獲取的葉片圖像是RGB彩色圖像。葉片在不同季節(jié)顏色會有不同,而且同一張葉片圖像因光照角度不同顏色也會存在很大的差別,所以對其進(jìn)行灰度圖轉(zhuǎn)換,將彩色圖像轉(zhuǎn)換為灰度圖像,消除顏色對分類的干擾。由彩色圖像轉(zhuǎn)化為灰度圖像的公式如下:

      圖4為基于SR的植物葉片圖像分類的投影系數(shù)和殘差。圖4-A為1幅五角楓葉片在訓(xùn)練集中6種植物、每種植物50幅葉片圖像對于待識別葉片圖像的投影系數(shù),其中橫軸為6種植物共300幅葉片圖像的編號,縱軸為基于最小化l1范數(shù)得到的y在訓(xùn)練樣本上的投影系數(shù)x。可以看出,y在其所屬植物類別的訓(xùn)練樣本上的投影系數(shù)較大,而在其他類別上僅有少數(shù)投影系數(shù)不為0,而且系數(shù)值都比較小,由此表明x的稀疏性。利用x在每個(gè)類別上的投影系數(shù)近似表示y,得到重建殘差,如圖4-B所示??梢钥闯?,該訓(xùn)練樣本的投影殘差最小,由此可判定其所屬的類別,得到識別結(jié)果。

      為了說明所提出的方法的有效性,與基于神經(jīng)網(wǎng)絡(luò)(BPNN)[1]、支持向量機(jī)(SVM)[2]和流形學(xué)習(xí)(ML)[6]的植物識別方法以及SRC方法[7]進(jìn)行比較。所有試驗(yàn)在Matlab 7.0開發(fā)環(huán)境下編程實(shí)現(xiàn)基于5種方法的植物葉片圖像處理和識別程序代碼。其中,計(jì)算機(jī)配置是Pentium CPU E5300 2.60 GHz,內(nèi)存2GB。本研究SR算法的求解最小化l1范數(shù)采用Matlab的K-SVD字典學(xué)習(xí)的工具包和求解優(yōu)化問題的SPGL1工具包;BPNN采用Matlab的NN toolbox中提供的train和newff等函數(shù);SVM采用提供的LIBSVM;最近鄰分類器采用ClusteringToolbox中的1-NN函數(shù)[10-11]。

      對于每種植物,隨機(jī)選取50幅葉片圖像作為訓(xùn)練集,其余的10幅圖像用于測試。即訓(xùn)練樣樣本集由6×50=300幅圖像組成,而測試樣本集則由剩余的60幅圖像組成。對于每種算法,這樣的劃分試驗(yàn)重復(fù)進(jìn)行50次。算法中涉及到的參數(shù)選擇都是根據(jù)試驗(yàn)結(jié)果的最大值得到。在試驗(yàn)中,為了得到較高的識別率,BPNN和SVM中的多個(gè)參數(shù)經(jīng)過若干次優(yōu)化才能確定。記錄每次試驗(yàn)每種植物的最高識別率和運(yùn)行時(shí)間,再計(jì)算50次結(jié)果的平均值和方差。將本研究提出的算法與其他4種算法進(jìn)行比較。表1顯示了5種算法的試驗(yàn)結(jié)果。

      由于MSRC添加了1個(gè)加權(quán)矢量,可以使最近鄰的樣本在分類中的作用最強(qiáng),而近鄰中相對較遠(yuǎn)的樣本的作用減弱,由此保留了樣本的局部特性,從而使樣本的分類性能優(yōu)于其他4種算法。試驗(yàn)結(jié)果表明,該方法的識別率最高、識別效果最好,平均識別率高達(dá)94%以上(表1),而且由于不需要從每幅葉片圖像中提取和選擇特征,所以提高了算法的運(yùn)行時(shí)間。試驗(yàn)結(jié)果表明,該方法能夠滿足植物識別系統(tǒng)的實(shí)時(shí)性要求。

      4 結(jié)論

      本研究探討了樣本的稀疏表示理論在植物識別中的應(yīng)用,測試樣本的稀疏表示可通過求解l1最小化問題而有效獲得。最稀疏的系數(shù)可以解釋為在重構(gòu)測試樣本的過程中每個(gè)訓(xùn)練樣本所貢獻(xiàn)的權(quán)重。在此基礎(chǔ)上,提出了一種基于改進(jìn)的稀疏表示的植物識別方法,該方法比基于特征提取和選擇的分類方法具有更好的識別性能。由于植物識別的復(fù)雜性,還沒有將本研究提出的方法應(yīng)用于可行的植物識別系統(tǒng),現(xiàn)有的研究可以克服葉片圖像的光照變化、不完整及未對準(zhǔn)等方面。盡管基于稀疏表示的人臉識別方法具有在沒有特征提取的前提下也能獲得較高識別率的優(yōu)勢,并且在遮擋和噪聲情況下有出色表現(xiàn),但在植物識別方面還有待于進(jìn)行研究,如何在大數(shù)據(jù)的情況下,保證精確的識別率及快速的識別能力也是將來要探究的方向之一。

      參考文獻(xiàn):

      [1]王麗君,淮永建,彭月橙. 基于葉片圖像多特征融合的觀葉植物種類識別[J]. 北京林業(yè)大學(xué)學(xué)報(bào),2015,37(1):55-61.

      [2]陳 寅,周 平. 植物葉形狀與紋理特征提取研究[J]. 浙江理工大學(xué)學(xué)報(bào),2013,30(3):394-399.

      [3]Du J X,Huang D S,Wang X F,et al. Leaf shape based plant species recognition[J]. Applied Mathematics and Computation,2007,185(2):883-893.

      [4]Du J X,Huang D S,Wang X F,et al. Shape recognition based onneural networks trained by differential evolution algorithm[J].Neurocomputing,2007,70(4):896-903.

      [5]張善文,張傳雷,程 雷. 基于監(jiān)督正交局部保持映射的植物葉片圖像分類方法[J]. 農(nóng)業(yè)工程學(xué)報(bào),2013,29(5):125-131.

      [6]朱明旱,李樹濤,葉 華. 基于稀疏表示的遮擋人臉表情識別方法[J]. 模式識別與人工智能,2014,27(8):708-712.

      [7]Qiao L S,Chen S C,Tan X Y. Sparsity preserving projections withapplications to face recognition [J]. Pattern Recognition,2010,43(1):331-341.

      [8]肖 玲,李仁發(fā),曾凡仔. 基于自學(xué)習(xí)稀疏表示的動態(tài)手勢識別方法[J]. 通信學(xué)報(bào),2013,34(6):128-135.

      [9]王 琦,惠康華. 基于稀疏近鄰表示的分類方法[J]. 計(jì)算機(jī)工程與設(shè)計(jì),2013,34(4):1425-1431.

      [10]Chang C C,Lin C J. LIBSVM-A library for support vector machines [EB/OL]. [2015-11-20]. http://www.csie.ntu.edu. tw/cjlin/libsvm.

      [11]Koh K,K S J. Stephen Boyd. Simple matlab solver for l1-regularized least squares problems [EB/OL]. [2015-11-20]. http://www.stanford.edu/boyd/l1_ls/.

      德州市| 西丰县| 筠连县| 辉南县| 高台县| 芒康县| 垦利县| 南汇区| 湘乡市| 庆云县| 东兰县| 德保县| 垫江县| 宝应县| 宁远县| 洪泽县| 阆中市| 庄浪县| 平泉县| 彰化市| 北碚区| 漳州市| 宝坻区| 南宁市| 交城县| 千阳县| 湖北省| 长垣县| 龙门县| 舞钢市| 东台市| 平舆县| 双鸭山市| 东乡县| 莫力| 康乐县| 若尔盖县| 谢通门县| 沭阳县| 林周县| 扶风县|