• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      表示學(xué)習(xí)技術(shù)研究進(jìn)展及其在植物表型中應(yīng)用分析

      2020-06-29 01:17:10袁培森李潤(rùn)隆任守綱顧興健徐煥良
      關(guān)鍵詞:哈希編碼器表型

      袁培森 李潤(rùn)隆 任守綱 顧興健 徐煥良

      (南京農(nóng)業(yè)大學(xué)信息科學(xué)技術(shù)學(xué)院, 南京 210095)

      0 引言

      表示學(xué)習(xí)是一種將研究對(duì)象的內(nèi)在信息表示為稠密低維實(shí)值向量的方法[1],在學(xué)習(xí)使用特征的同時(shí),也需要學(xué)習(xí)如何提取特征[2]。表示學(xué)習(xí)的研究對(duì)象主要是文本[3-4]、圖像[5-6]、視頻[7-8]等。應(yīng)用于文本處理的表示學(xué)習(xí)模型主要有Word2vec[4]和神經(jīng)網(wǎng)絡(luò)語言模型[9]。應(yīng)用于圖像處理的表示學(xué)習(xí)模型有自動(dòng)編碼器[10]、深度哈希[11]等。應(yīng)用于視頻處理的表示學(xué)習(xí)模型包括卷積神經(jīng)網(wǎng)絡(luò)[12]、堆疊自編碼器[13]等。

      表示學(xué)習(xí)可以分為監(jiān)督特征學(xué)習(xí)和無監(jiān)督特征學(xué)習(xí)。監(jiān)督特征學(xué)習(xí)主要包括監(jiān)督字典學(xué)習(xí)[14]和神經(jīng)網(wǎng)絡(luò)[15];無監(jiān)督特征學(xué)習(xí)主要包括主成分分析[16]、自動(dòng)編碼器[17]以及概率圖模型[18]。在處理海量高維的植物表型數(shù)據(jù)任務(wù)中,表示學(xué)習(xí)憑借其自動(dòng)提取特征的能力,表現(xiàn)出高效性[1],獲得了研究者的關(guān)注。

      植物表型是近年來植物學(xué)領(lǐng)域研究的熱點(diǎn),其本質(zhì)是植物基因圖譜的時(shí)序三維表達(dá)及其地域分異特征和代際演進(jìn)規(guī)律[19]。1911年,丹麥遺傳學(xué)家WILHELM將生物體的表型定義為基因型和環(huán)境因素相互影響的結(jié)果,其中,基因型是表型得以表達(dá)的內(nèi)因,而環(huán)境是各類形態(tài)特征得以顯現(xiàn)的外部條件[20]。隨著透射、波譜、顯微等檢測(cè)技術(shù)以及生物信息技術(shù)和計(jì)算機(jī)技術(shù)的快速發(fā)展,該定義范圍被擴(kuò)展到了生物化學(xué)[21]和行為學(xué)[22]等領(lǐng)域??傮w而言,植物表型不僅可以反映出植物的理化性質(zhì)、形狀及內(nèi)部結(jié)構(gòu)[23],也可以體現(xiàn)基因在分子尺度上的特征,甚至可以反映出病理性質(zhì)[24]。

      傳統(tǒng)的植物表型研究使用人工測(cè)量和記錄的方式,這種方法采集到的樣本數(shù)據(jù)集小,并且僅能夠獲取器官[25]、輪廓[26]、高度[27]等外部表征,效率較低,難以對(duì)植物的多種性狀進(jìn)行綜合分析和研究[28]。

      近年來,隨著分子育種技術(shù)以及植物功能基因組相關(guān)研究的不斷深入,表型數(shù)據(jù)也擴(kuò)展到行為特性以及體內(nèi)和體表的理化和生化特征[29]。植物表型數(shù)據(jù)類型包括結(jié)構(gòu)化、非結(jié)構(gòu)化的圖像以及文本數(shù)據(jù)[19],并且具有數(shù)據(jù)量大[30]、數(shù)據(jù)多態(tài)性[31]以及數(shù)據(jù)時(shí)效性的特點(diǎn)。這對(duì)于植物表型的獲取以及處理分析技術(shù)提出了很高的要求,需要生命科學(xué)、計(jì)算機(jī)科學(xué)以及工程學(xué)等多學(xué)科知識(shí)的交叉融合[32]。

      在傳統(tǒng)植物表型分析研究過程中,研究人員需要通過費(fèi)時(shí)、費(fèi)力的手工標(biāo)注方式建立特征,再進(jìn)行相關(guān)學(xué)習(xí)算法的部署,這表明傳統(tǒng)植物表型研究技術(shù)無法自動(dòng)提取數(shù)據(jù)的特征信息。在這類處理大量復(fù)雜或者人為先驗(yàn)理解有限的數(shù)據(jù)任務(wù)時(shí),表示學(xué)習(xí)表現(xiàn)出其高效性[1]。

      在植物表型研究中,表示學(xué)習(xí)已經(jīng)在文本、圖像、三維點(diǎn)云等植物表型數(shù)據(jù)的分析研究中獲得了廣泛運(yùn)用[33]。本文對(duì)表示學(xué)習(xí)的相關(guān)概念及其模型進(jìn)行簡(jiǎn)述分析,闡述植物表型概念[22,24]及其處理方法,重點(diǎn)對(duì)表示學(xué)習(xí)在植物表型應(yīng)用中的優(yōu)勢(shì)及問題[34]進(jìn)行分析,最后對(duì)表示學(xué)習(xí)在植物表型中的應(yīng)用趨勢(shì)進(jìn)行總結(jié)與展望。

      1 表示學(xué)習(xí)技術(shù)研究進(jìn)展

      1.1 表示學(xué)習(xí)的概念

      表示學(xué)習(xí)(Representation learning),又稱為學(xué)習(xí)表示,指的是通過學(xué)習(xí)產(chǎn)生對(duì)觀測(cè)樣本有效的表示,使得能夠在建立分類器或者其他預(yù)測(cè)器時(shí)提取更有用的信息[35]。表示學(xué)習(xí)的目標(biāo)是通過學(xué)習(xí)把所需的研究對(duì)象的內(nèi)在信息表示為稠密低維實(shí)值向量,解決輸入數(shù)據(jù)的底層特征和高層語義信息之間的不一致性和差異性的問題。設(shè)輸入樣本數(shù)據(jù)為X=(x1,x2,…,xn),通過表示學(xué)習(xí)能夠得到一個(gè)低維特征表達(dá)X′=(x′1,x′2,…,x′m),m?n。當(dāng)該實(shí)體和關(guān)系處在知識(shí)庫中時(shí),可以通過計(jì)算歐氏距離等方法來獲得任意2個(gè)對(duì)象之間的語義相似度[36]。

      表示學(xué)習(xí)通過解決輸入數(shù)據(jù)中的底層特征與其高層語義信息間產(chǎn)生的差異性問題,為后續(xù)的機(jī)器學(xué)習(xí)模型構(gòu)建提供良好基礎(chǔ)。表示學(xué)習(xí)主要有兩個(gè)優(yōu)點(diǎn)。首先它能夠從大量復(fù)雜且人為先驗(yàn)理解有限的數(shù)據(jù)中自動(dòng)提取特征。其次,表示學(xué)習(xí)的向量維度較低,可以根據(jù)對(duì)象間的語義信息進(jìn)行更加充分的提取,從而解決數(shù)據(jù)稀疏問題[37]。

      表示學(xué)習(xí)與深度學(xué)習(xí)(Deep learning)具有密切的關(guān)系,如圖1所示。表示學(xué)習(xí)屬于深度學(xué)習(xí)算法中提取特征的一部分,通過自動(dòng)學(xué)習(xí)獲得好的特征表示,從而提高深度學(xué)習(xí)模型的預(yù)測(cè)準(zhǔn)確率。原始數(shù)據(jù)進(jìn)行非線性特征轉(zhuǎn)換的次數(shù)被稱為深度。深度是表示學(xué)習(xí)模型的特點(diǎn),表示學(xué)習(xí)模型通過具有深度的模型來提取各層特征,從而獲得好的表示[35]。

      圖1 深度學(xué)習(xí)與表示學(xué)習(xí)關(guān)系Fig.1 Relationship of deep learning and representation learning

      深度學(xué)習(xí)解決的關(guān)鍵問題是貢獻(xiàn)度分配問題,從而最終提升預(yù)測(cè)模型的準(zhǔn)確率。如圖1,假如把一個(gè)表示學(xué)習(xí)系統(tǒng)看作是一個(gè)有向圖結(jié)構(gòu),則深度學(xué)習(xí)覆蓋從輸入節(jié)點(diǎn)(原始數(shù)據(jù))到輸出節(jié)點(diǎn)(預(yù)測(cè)結(jié)果)所經(jīng)過的最長(zhǎng)過程。

      1.2 表示學(xué)習(xí)模型

      表示學(xué)習(xí)可以分為監(jiān)督特征學(xué)習(xí)和無監(jiān)督特征學(xué)習(xí)兩種類型,如圖2所示。常用的監(jiān)督特征學(xué)習(xí)模型主要包括監(jiān)督字典學(xué)習(xí)(Supervised dictionary learning)[14]和有監(jiān)督神經(jīng)網(wǎng)絡(luò)(Supervised neural network)[15];常用的無監(jiān)督特征學(xué)習(xí)模型主要包括主成分分析(Principal component analysis)[16]、自動(dòng)編碼器(Autoencoders)[17]和概率圖模型(Probability graph model)[18]。

      圖2 表示學(xué)習(xí)模型分類Fig.2 Classification of representation learning model

      下面對(duì)圖2中的常用表示學(xué)習(xí)模型進(jìn)行介紹,并且對(duì)其中一些模型在植物表型應(yīng)用上的優(yōu)缺點(diǎn)進(jìn)行對(duì)比分析,結(jié)果如表1所示。

      表1 常用表示學(xué)習(xí)模型對(duì)比Tab.1 Comparison of common representation learning models

      1.2.1監(jiān)督特征學(xué)習(xí)

      1.2.1.1監(jiān)督字典學(xué)習(xí)

      字典學(xué)習(xí)是從輸入數(shù)據(jù)中學(xué)習(xí)一組代表元素的字典,其中每個(gè)數(shù)據(jù)都可以表示為代表元素的加權(quán)和[38]。監(jiān)督字典學(xué)習(xí)指將分類信息添加到字典學(xué)習(xí)中,從而利用輸入數(shù)據(jù)和標(biāo)簽的隱含結(jié)構(gòu)來優(yōu)化字典。

      設(shè)數(shù)據(jù)集為X={X1,X2,…,Xc}∈Tp×n,其中c為類別的數(shù)量,T是樣本,p是每個(gè)樣本對(duì)應(yīng)的維數(shù),n是訓(xùn)練的總樣本數(shù)。訓(xùn)練字典為D={D1,D2,…,Dc}∈Tp×k,p是字典中原子數(shù)量,與樣本維度一致,k是字典中原子數(shù)量。初始化字典Di=Xi,Xi指屬于第i個(gè)分類的所有訓(xùn)練數(shù)據(jù),字典求解算法使用基于表示的稀疏分類算法[14],為

      (1)

      式中,xts∈Tp為測(cè)試數(shù)據(jù)集,X為用于訓(xùn)練字典的數(shù)據(jù)集,α為用于計(jì)算分類殘差的稀疏編碼,分類殘差計(jì)算式為

      (2)

      δi函數(shù)用于根據(jù)分類來選擇合適的稀疏編碼,ri函數(shù)根據(jù)測(cè)試數(shù)據(jù)xts計(jì)算各個(gè)分類的殘差,測(cè)試數(shù)據(jù)所屬的分類即殘差最小的分類[38]。

      字典學(xué)習(xí)在植物種類圖像識(shí)別方面得到了廣泛的應(yīng)用,能夠通過基于紋理[46]或者直接處理原始圖像的方法[38]建立稀疏表示字典,從而完成植物器官圖像分類任務(wù)。其優(yōu)點(diǎn)在于其非線性的結(jié)構(gòu)能夠使得表達(dá)能力更強(qiáng),有效對(duì)圖像、三維點(diǎn)云等數(shù)據(jù)進(jìn)行降維表示,且計(jì)算速度快[14]。缺點(diǎn)是在分類數(shù)目較多的情況下算法效果不好。

      1.2.1.2有監(jiān)督神經(jīng)網(wǎng)絡(luò)

      有監(jiān)督神經(jīng)網(wǎng)絡(luò)是通過相互關(guān)聯(lián)的節(jié)點(diǎn)構(gòu)成多層網(wǎng)絡(luò)的有監(jiān)督學(xué)習(xí)算法的總稱[47]。有監(jiān)督的神經(jīng)網(wǎng)絡(luò)包括深度神經(jīng)網(wǎng)絡(luò)[47]、循環(huán)神經(jīng)網(wǎng)絡(luò)[48]、遞歸神經(jīng)網(wǎng)絡(luò)[49]和卷積神經(jīng)網(wǎng)絡(luò)[50]。多層神經(jīng)網(wǎng)絡(luò)可以用來進(jìn)行特征學(xué)習(xí),因?yàn)樗梢垣@取隱藏層中的輸出特征。

      圖3中的卷積神經(jīng)網(wǎng)絡(luò)是一種經(jīng)典的使用卷積計(jì)算并且擁有深度結(jié)構(gòu)的前饋型有監(jiān)督神經(jīng)網(wǎng)絡(luò)。通常由卷積層(Convolution)、池化層(Pooling)、全連接層(Fully-connected)等部分組成[51]。卷積層用來分析上一部分特征中間的局部特征之間隱含的信息,而池化層則是分析并且結(jié)合具有相似意義的信息,從而可以在上層的特征圖中獲得有用的信息[50]。全連接層中,每層的每一個(gè)神經(jīng)元都和上一層的所有神經(jīng)元連接并且分析所有信息,將信息降到低維,再把信息傳輸給回歸器、分類器等來獲得最后結(jié)果。

      圖3 卷積神經(jīng)網(wǎng)絡(luò)經(jīng)典模型[50]Fig.3 Classic model of convolutional neural network

      目前,大量CNN的常用深度學(xué)習(xí)框架包括TensorFlow[50]、PyTorch[52]、Caffe[53]等,這些框架完成了深度學(xué)習(xí)的底層架構(gòu)實(shí)現(xiàn),為研究人員提供了方便進(jìn)行調(diào)用的接口,獲得了廣泛的應(yīng)用。研究人員通過對(duì)有監(jiān)督神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)和參數(shù)進(jìn)行調(diào)整,使得其在植物種類識(shí)別[34,54]、病蟲害分析[55]、產(chǎn)量預(yù)測(cè)[56]、形態(tài)結(jié)構(gòu)表型數(shù)據(jù)計(jì)算[57]等研究中都得到了廣泛應(yīng)用。卷積神經(jīng)網(wǎng)絡(luò)在處理海量高維植物表型數(shù)據(jù)任務(wù)時(shí)獲得了較高的準(zhǔn)確度,但是其需要大規(guī)模的數(shù)據(jù)集進(jìn)行訓(xùn)練和測(cè)試[39]。

      1.2.2無監(jiān)督特征學(xué)習(xí)

      1.2.2.1主成分分析

      主成分分析主要用于降維,能夠?qū)⒍鄠€(gè)變量化為少數(shù)幾個(gè)互相無關(guān)的綜合變量[58]。主成分分析的步驟如下:數(shù)據(jù)預(yù)處理;判斷要選擇的主成分?jǐn)?shù)目;選擇主成分;解釋結(jié)果;計(jì)算主成分得分。

      主成分分析能降低植物表型數(shù)據(jù)的維數(shù),是多維數(shù)據(jù)的一種有效表示方法,并且可以較好地表示植物表型的信息而不丟失重要特征,從而在雜草識(shí)別[40]、葉片分類[59]等表型數(shù)據(jù)分析任務(wù)中獲得較高的準(zhǔn)確率。但是主成分分析有幾點(diǎn)局限:主成分分析依賴于原始數(shù)據(jù)的正交變換;只有在輸入數(shù)據(jù)向量是互相相關(guān)的情況下主成分分析才能很好地降維;并且其無法通過調(diào)參等方法對(duì)結(jié)果進(jìn)行干預(yù)[41]。

      1.2.2.2自動(dòng)編碼器

      自動(dòng)編碼器是一種盡可能將輸入信號(hào)進(jìn)行復(fù)現(xiàn)的無監(jiān)督神經(jīng)網(wǎng)絡(luò)。自動(dòng)編碼器的目的是基于輸入的無標(biāo)簽數(shù)據(jù)X=(x(1),x(2),…,x(n)),通過訓(xùn)練從而獲得降維之后的特征表達(dá)H=(h(1),h(2),…,h(m))[10]。自動(dòng)編碼器分為編碼器和解碼器,自動(dòng)編碼器通過學(xué)習(xí)hw,b(x)≈x來嘗試逼近恒等函數(shù),使得輸出結(jié)果接近于輸入x。

      最經(jīng)典的自動(dòng)編碼器已發(fā)展了很多不同的種類,包括稀疏自編碼器[43]、棧式自編碼器[60]、降噪自編碼器[61]。

      稀疏自編碼器中的稀疏指的是限制編碼后隱藏層的神經(jīng)元個(gè)數(shù)[43],棧式自編碼器指由多層稀疏自動(dòng)編碼器級(jí)聯(lián)從而完成特征提取的神經(jīng)網(wǎng)絡(luò),將前一層自動(dòng)編碼器的輸出結(jié)果作為后一層自動(dòng)編碼器的輸入結(jié)果,并且在逐層訓(xùn)練結(jié)束后進(jìn)行微調(diào)[60]。降噪自動(dòng)編碼器是在原有的自動(dòng)編碼器的基礎(chǔ)上要求自動(dòng)編碼器具有通過學(xué)習(xí)恢復(fù)出原始信號(hào)的能力,其泛化能力較強(qiáng)。

      降噪自動(dòng)編碼器通過對(duì)輸入添加隨機(jī)噪聲,再通過編碼解碼來獲得健壯的結(jié)構(gòu),從而對(duì)原來數(shù)據(jù)加以恢復(fù)[61]。自動(dòng)編碼器作為一種無監(jiān)督的神經(jīng)網(wǎng)絡(luò),能夠憑借其對(duì)二維圖像特征較好的保留能力,對(duì)根[42]、種子[62]等測(cè)量困難的植物表型數(shù)據(jù)進(jìn)行快速提取計(jì)算。但是其隱藏層的維度較難選擇,確定起來比較困難。

      1.2.2.3概率圖模型

      從概率的角度來看,表示學(xué)習(xí)可以解釋為獲取數(shù)據(jù)集中簡(jiǎn)單潛在隨機(jī)變量的一種方法,概率圖提供了兩類可能的建模方式:有向圖和無向圖(圖4)。概率圖模型是綜合運(yùn)用概率論和圖論來描述統(tǒng)計(jì)關(guān)系的應(yīng)用模型[35]。有向圖模型主要包含貝葉斯網(wǎng)絡(luò)以及隱馬爾可夫模型,無向圖模型主要包括馬爾可夫隨機(jī)場(chǎng)以及條件隨機(jī)場(chǎng)[63]。

      圖4 概率圖模型Fig.4 Probability graph model

      圖4中的條件隨機(jī)場(chǎng)是給定隨機(jī)變量X條件下的隨機(jī)變量Y的概率分布無向圖[63]。條件隨機(jī)場(chǎng)對(duì)于觀測(cè)數(shù)據(jù)沒有獨(dú)立性要求,能夠?qū)?fù)雜的上下文關(guān)系進(jìn)行特征的歸一化,對(duì)圖像的紋理特征進(jìn)行有效提取[44]。條件隨機(jī)場(chǎng)在農(nóng)業(yè)場(chǎng)景圖像上對(duì)植物種類進(jìn)行了有效識(shí)別和區(qū)分[45],也能夠?qū)χ参飯D像數(shù)據(jù)進(jìn)行疾病檢測(cè)分析,獲得比有監(jiān)督卷積神經(jīng)網(wǎng)絡(luò)更高的準(zhǔn)確度,達(dá)到了99.79%[44]。條件隨機(jī)場(chǎng)的缺點(diǎn)是復(fù)雜度高[45]。

      1.3 文本處理方法

      表示學(xué)習(xí)可以計(jì)算在低維空間中實(shí)體之間的關(guān)系,從而高效解決數(shù)據(jù)表示的稀疏問題。表示學(xué)習(xí)可以發(fā)現(xiàn)文本之間的內(nèi)在關(guān)系,發(fā)現(xiàn)文本之間的語義層級(jí)關(guān)系。文本的處理方法可以分成獨(dú)熱碼表示(One-hot representation)、連續(xù)表示或者詞嵌入。本部分對(duì)文本的兩種表示學(xué)習(xí)模型:神經(jīng)網(wǎng)絡(luò)語言模型[9]和Word2vec模型[4]加以闡述。

      1.3.1神經(jīng)網(wǎng)絡(luò)語言模型

      BENGIO等[9]在訓(xùn)練語言模型的過程中提出了詞向量的基本模型:神經(jīng)網(wǎng)絡(luò)語言模型(Neural network language model),提出了一個(gè)3層神經(jīng)網(wǎng)絡(luò)模型,對(duì)語言模型和詞向量同時(shí)建模。神經(jīng)網(wǎng)絡(luò)語言模型生成的詞向量能夠很好地根據(jù)特征距離計(jì)算詞的相似性[64],因此獲得了較好的實(shí)際運(yùn)用,能夠?qū)χ参锉硇托畔⑦M(jìn)行語義挖掘[65]。

      1.3.2Word2vec

      MIKOLOV等[4]提出了用于詞向量計(jì)算的模型Word2vec,該模型能夠?qū)⒚總€(gè)詞映射到一個(gè)向量。Word2vec通過CBoW(Continuous bag-of-words)或Skip-Gram模型來建立神經(jīng)詞嵌入。二者的共同點(diǎn)在于對(duì)每個(gè)單詞都設(shè)定一個(gè)輸入向量和一個(gè)輸出向量,CBoW在給定上下文的情況下預(yù)測(cè)當(dāng)前詞,Skip-Gram模型在給定當(dāng)前詞的情況下預(yù)測(cè)上下文。Word2vec可以在百萬數(shù)量級(jí)的詞典和上億的數(shù)據(jù)集上進(jìn)行高效訓(xùn)練。同時(shí),該工具得到的詞向量可以很好地度量詞與詞之間的相似性,能夠通過對(duì)大量水稻文獻(xiàn)的訓(xùn)練來獲取水稻文本中語義距離最近的短語[66]。

      1.4 圖像處理方法

      圖像處理的關(guān)鍵是對(duì)于圖像的表示,它是進(jìn)行計(jì)算機(jī)視覺的目標(biāo)識(shí)別和分類歸納的重要技術(shù)[67],通過特征的學(xué)習(xí)和提取將特征提取為高層特征,除了傳統(tǒng)的Gist等特征,近年來也產(chǎn)生了很多基于哈希算法以及深度學(xué)習(xí)的表示方法。

      1.4.1Gist特征

      Gist特征是一種場(chǎng)景特征描述,該特征通過模擬人的視覺器官獲取圖像中的關(guān)鍵上下文信息[68]。圖像的Gist特征由多尺度多方向的Gabor濾波器組對(duì)圖像進(jìn)行濾波處理之后獲得。

      一幅尺寸為r×c的灰度圖像f(x,y)用尺度為m和方向?yàn)閚的Gabor濾波器組進(jìn)行濾波,即先同nc個(gè)通道的濾波器進(jìn)行卷積,其中nc=mn,再進(jìn)行級(jí)聯(lián)卷積得出圖像的Gist特征。

      Gist特征可以較好地提取單一場(chǎng)景的特征,從而基于Gist紋理特征對(duì)植物葉片進(jìn)行種類識(shí)別[69],但是對(duì)于包含多個(gè)場(chǎng)景的圖像,這種特征的區(qū)分性能大幅降低。

      1.4.2尺度不變特征變換特征

      尺度不變特征變換特征(Scale invariant feature transform,SIFT)在1999年由LOWE[70]提出,具有尺度不變性,可在圖像中檢測(cè)出關(guān)鍵點(diǎn),是一種局部特征描述子。

      SIFT特征主要具有以下優(yōu)勢(shì)[71]:圖像的局部特征不受旋轉(zhuǎn)、縮放、亮度等變化影響,同時(shí)對(duì)于視角及仿射變化、噪聲的處理也較為穩(wěn)定;能夠?qū)Υ罅刻卣鞯臄?shù)據(jù)集完成快速準(zhǔn)確的匹配;多量性,即使樣本數(shù)很少也能夠產(chǎn)生大量的SIFT特征。因此,利用SIFT特征提取能夠完成自然光下的植物分類任務(wù)[72]。

      1.4.3基于哈希算法的圖像處理技術(shù)

      哈希指把任意長(zhǎng)度的輸入通過散列算法來轉(zhuǎn)換成固定長(zhǎng)度的輸出,即獲得散列值。哈希方法主要分為兩大類:以局部敏感哈希為代表的傳統(tǒng)哈希,以及學(xué)習(xí)型哈希[11]。

      傳統(tǒng)哈希算法的代表為局部敏感哈希(Locality sensitive hashing,LSH),其基本思想是使用一組哈希函數(shù)把數(shù)據(jù)散列到多個(gè)桶中,使得相近的數(shù)據(jù)落在同一個(gè)哈希桶,越相似的數(shù)據(jù)分配到同一個(gè)桶中的概率越大[73]。局部敏感哈希提供了一種在海量高維數(shù)據(jù)集中高效查找數(shù)據(jù)點(diǎn)近似最相鄰的方法,從而可以加快大量數(shù)據(jù)查找的匹配速度。文獻(xiàn)[74]采用4 100幅不同花型的菊花圖像作為數(shù)據(jù)集,提出使用多探測(cè)局部位置敏感哈希技術(shù)對(duì)菊花圖像數(shù)據(jù)的哈希數(shù)據(jù)結(jié)構(gòu)進(jìn)行構(gòu)建,在菊花相似性查詢方面提高了計(jì)算效率。

      學(xué)習(xí)型哈希可以借助深度神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì),同時(shí)學(xué)習(xí)圖像表示和哈希編碼,更好地表達(dá)圖像特征信息,取得比傳統(tǒng)哈希算法更好的結(jié)果。LI等[75]提出了深度離散監(jiān)督哈希,是早期將深層神經(jīng)網(wǎng)絡(luò)與哈希編碼融合的工作之一,它使用兩個(gè)階段來學(xué)習(xí)圖像特征表示和哈希編碼。XIA等[76]提出了基于深度的哈希檢索方法,能夠獲得具備哈希表征的良好的圖像表示。YUAN等[77]提出了一種基于端到端的低維二值嵌入框架的方法,該方法通過深層卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)緊湊的二進(jìn)制編碼(Compact binary codes),提高了高通量菊花花卉圖像表型相似性評(píng)估的性能和有效性。

      1.4.4卷積神經(jīng)網(wǎng)絡(luò)

      根據(jù)圖像表示的提取流程來進(jìn)行分類,卷積神經(jīng)網(wǎng)絡(luò)特征提取方法可以分為3類:局部表示聚合[78]、深度卷積特征聚合和多層融合[79]。

      局部表示聚合從圖像當(dāng)中提取局部區(qū)域信息,輸入前饋網(wǎng)絡(luò)生成部分圖像區(qū)域的表示。隨后使用特定聚合方法來聚合圖像數(shù)據(jù),形成最后結(jié)果,效率相對(duì)較高[78]。深度卷積特征聚合將多幅圖像局部區(qū)域輸入到前饋網(wǎng)絡(luò)來生成局部特征,只進(jìn)行一次前饋,就可以生成深度卷積特征,并且可以處理任意大小的圖像輸入。多層融合根據(jù)層次性特征進(jìn)行設(shè)計(jì),從而使深度神經(jīng)網(wǎng)絡(luò)中不同層面的信息相互補(bǔ)充,獲得特征不變性和更好判別能力[79]。

      卷積神經(jīng)網(wǎng)絡(luò)憑借其優(yōu)勢(shì),完成了植物表型圖像數(shù)據(jù)的識(shí)別以及分類任務(wù)[34,54]。文獻(xiàn)[80]采用6 000幅菊花圖像作為數(shù)據(jù)集,基于端到端的卷積神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)行特征學(xué)習(xí),實(shí)現(xiàn)了菊花種類的準(zhǔn)確識(shí)別,平均識(shí)別率達(dá)到0.95。

      2 表示學(xué)習(xí)在植物表型中的應(yīng)用分析

      2.1 植物表型數(shù)據(jù)處理

      植物表型數(shù)據(jù)處理主要包括數(shù)據(jù)的獲取解析以及管理應(yīng)用。

      2.1.1植物表型數(shù)據(jù)獲取與解析

      目前,生物傳感器、圖像處理、物聯(lián)網(wǎng)及人工智能等技術(shù)的飛速發(fā)展為新一代表型數(shù)據(jù)快速獲取和處理提供了海量數(shù)據(jù)集和處理手段[28]。目前,植物表型數(shù)據(jù)研究者通過構(gòu)建表型相關(guān)基礎(chǔ)設(shè)施、研發(fā)低成本表型獲取裝置的方式來提高表型數(shù)據(jù)的通量及分辨率。

      植物表型數(shù)據(jù)獲取是指對(duì)植物形態(tài)特征進(jìn)行描述的過程,經(jīng)典的表型數(shù)據(jù)獲取方式通過手工觀察和測(cè)量,但是這一方式效率低且錯(cuò)誤率高。李少昆等[25]使用相機(jī)及掃描儀采集作物株型數(shù)據(jù),使用人工標(biāo)記的各器官表型數(shù)據(jù)來擬合出曲線,同時(shí)基于圖像處理技術(shù)的工作特點(diǎn),獲得了玉米等作物的株高、葉寬等30種表型數(shù)據(jù)的信息。方偉等[26]對(duì)圖像數(shù)據(jù)采集系統(tǒng)得到的植株圖像數(shù)據(jù)進(jìn)行預(yù)處理獲得植株輪廓信息,隨后標(biāo)定相機(jī)進(jìn)行特征識(shí)別,使用多幅二維圖像進(jìn)行融合獲取植株的三維模型。

      近年來,研究人員開發(fā)了能夠自動(dòng)進(jìn)行植物表型數(shù)據(jù)獲取的系統(tǒng)。CONSTANTINO等[27]開發(fā)了能夠?qū)λ局旮咭约胺痔Y數(shù)進(jìn)行自動(dòng)測(cè)量的系統(tǒng),首先通過HSV顏色以及空間閾值進(jìn)行預(yù)處理,接著使用Canny邊緣檢測(cè)以及Zhang-Suen細(xì)化算法來計(jì)算高度,最后通過計(jì)算ROI區(qū)域的像素簇來統(tǒng)計(jì)分蘗數(shù)。PAPROKI等[81]使用一種新型混合網(wǎng)格分割算法來解決圖像分割任務(wù)中的植株形態(tài)差異以及葉柄被葉片遮擋等問題,基于主莖、葉柄等表型數(shù)據(jù)計(jì)算了主莖高度、葉寬等參數(shù)。

      2.1.2植物表型數(shù)據(jù)管理與應(yīng)用

      植物表型數(shù)據(jù)除了結(jié)構(gòu)化的數(shù)值型或字符串型的數(shù)據(jù),還包括了大量的圖像數(shù)據(jù)。常見的關(guān)系數(shù)據(jù)庫能夠?qū)崿F(xiàn)結(jié)構(gòu)化的數(shù)據(jù)存儲(chǔ)檢索等功能,但由于近年來點(diǎn)云、光譜等表型數(shù)據(jù)的發(fā)展,海量的表型數(shù)據(jù)對(duì)于存儲(chǔ)的數(shù)據(jù)結(jié)構(gòu)和存儲(chǔ)方式提出了新要求。在存儲(chǔ)這些數(shù)據(jù)時(shí),非結(jié)構(gòu)化植物表型數(shù)據(jù)管理系統(tǒng)取代了傳統(tǒng)二維表結(jié)構(gòu)的存儲(chǔ)方式[19]。常用的非結(jié)構(gòu)化植物表型數(shù)據(jù)管理系統(tǒng)有基于關(guān)系數(shù)據(jù)庫系統(tǒng)擴(kuò)展的非結(jié)構(gòu)化數(shù)據(jù)管理系統(tǒng)CropSight[82]、基于NoSQL的非結(jié)構(gòu)化數(shù)據(jù)管理系統(tǒng)SensorDB[39]等。植物表型數(shù)據(jù)的應(yīng)用場(chǎng)景包括植物識(shí)別、產(chǎn)量預(yù)測(cè)、病蟲害檢測(cè)以及植物改良育種等。研究人員利用圖像數(shù)據(jù)的灰度[40]、顏色、紋理[41]等特征完成了分類、分割以及識(shí)別等任務(wù)。

      2.2 基于表示學(xué)習(xí)的植物表型研究

      2.2.1植物種類識(shí)別

      植物種類識(shí)別研究對(duì)于生態(tài)監(jiān)測(cè)任務(wù)至關(guān)重要,可以有效地檢測(cè)生物生長(zhǎng)情況,保護(hù)生物多樣性。分析一個(gè)地區(qū)的生物種類分布情況,對(duì)于瀕危物種的種群規(guī)模進(jìn)行定期監(jiān)測(cè),并且分析研究生態(tài)環(huán)境的變化對(duì)于物種分布的影響,這對(duì)植物識(shí)別的準(zhǔn)確性提出了很高的要求。植物種類識(shí)別研究不僅是植物學(xué)以及生態(tài)學(xué)的研究重點(diǎn),而且對(duì)于農(nóng)業(yè)生產(chǎn)有指導(dǎo)作用[83]。表示學(xué)習(xí)運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)[54]、概率神經(jīng)網(wǎng)絡(luò)[84]、稀疏表示字典[38]等模型完成了多達(dá)上萬種的植物圖像分類與識(shí)別任務(wù)(表2),在測(cè)試數(shù)據(jù)庫和公開植物數(shù)據(jù)庫中都獲得了較高的準(zhǔn)確率。但由于這一類細(xì)粒度圖像任務(wù)處理時(shí)間較長(zhǎng),仍然需要在實(shí)時(shí)性方面加以改進(jìn),以構(gòu)建適用于多種實(shí)際農(nóng)業(yè)環(huán)境且具有魯棒性的植物分類系統(tǒng)。

      2.2.2病蟲害檢測(cè)分析

      植物病蟲害自動(dòng)識(shí)別技術(shù)可以及時(shí)發(fā)現(xiàn)作物病害,幫助經(jīng)驗(yàn)不足的研究人員以及農(nóng)民完成植物病害的識(shí)別和檢驗(yàn)。但是自動(dòng)識(shí)別技術(shù)面臨的主要困難如下:首先,圖像背景復(fù)雜,圖像可能受到其他物體的干擾,比如秸稈、昆蟲等。其次,患病部位和健康部位的特征區(qū)分不夠明顯,難以獲取顯著性差異的特征[91]。同時(shí),同一疾病在不同的階段也具有不同的特征,對(duì)于特征獲取技術(shù)提出了更高的要求。

      表2 植物識(shí)別系統(tǒng)Tab.2 Plant recognition systems

      近年來,基于表示學(xué)習(xí)的方法已在植物病理學(xué)中得到了廣泛使用。

      MOHANTY等[55]采用PlantVillage數(shù)據(jù)庫中14個(gè)作物品種以及26種病蟲害圖像數(shù)據(jù)作為訓(xùn)練集,使用經(jīng)典網(wǎng)絡(luò)模型AlexNet和GoogleNet[92]對(duì)植物葉片圖像進(jìn)行“作物-病蟲害”類別的分析。BRAHIMI等[93]同樣使用AlexNet和GoogleNet[92], 實(shí)現(xiàn)了對(duì)包含9種疾病的番茄葉片圖像數(shù)據(jù)集的分類。

      除此之外,AMARA等[94]使用LeNet[92]模型在真實(shí)的田地等較為復(fù)雜條件(如復(fù)雜照明、雜亂背景、不同圖像采集器、大小和方位等)下,實(shí)現(xiàn)了對(duì)于葉斑病、條紋病的兩種香蕉病害以及健康狀態(tài)的分類任務(wù)。

      與經(jīng)典的機(jī)器學(xué)習(xí)方法相比,采用表示學(xué)習(xí)方法來識(shí)別植物病蟲害可以大幅度提升結(jié)果的準(zhǔn)確率,TOO等[95]采用PlantVillage中的14種植物和38類病蟲害作為數(shù)據(jù)集,使用VGG-16[96]、Inception V4[96]、DenseNets-121和ResNet-50[97]等多種經(jīng)典網(wǎng)絡(luò)進(jìn)行了小幅度的微調(diào)和測(cè)試。實(shí)驗(yàn)結(jié)果顯示,隨著迭代輪數(shù)的不斷提高,DenseNets的精度也較高,達(dá)到了99.75%,并且沒有發(fā)生過擬合的狀況。LI等[98]采集了包含3種水稻病蟲害的5 320幅圖像以及5段視頻作為數(shù)據(jù)集,使用Fast-RCNN作為框架,使用圖像來對(duì)相對(duì)模糊的視頻進(jìn)行訓(xùn)練,從而使得訓(xùn)練得到的模型能夠準(zhǔn)確檢測(cè)視頻中的病蟲害類別。

      除了直接使用經(jīng)典網(wǎng)絡(luò)模型,研究人員也改進(jìn)了經(jīng)典網(wǎng)絡(luò)或嘗試構(gòu)建淺層網(wǎng)絡(luò)來處理這類任務(wù)。LIU等[99]使用包含蘋果病葉的13 689幅圖像作為數(shù)據(jù)集,使用了微調(diào)的AlexNet和GoogleNet網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,該模型前端由AlexNet的前5個(gè)卷積層改造而成,卷積核較小,解決了病斑面積相對(duì)較小的問題。相比經(jīng)典的AlexNet,該網(wǎng)絡(luò)參數(shù)較少,收斂速度很快,準(zhǔn)確率較高。在對(duì)感病葉片圖像分類取得較好效果的基礎(chǔ)上,還有一些研究解決了病斑定位和感染程度判斷的問題。FUENTES等[100]使用韓國(guó)農(nóng)場(chǎng)番茄植物中幾種病蟲害的圖像作為數(shù)據(jù)集,提出了一種用于識(shí)別番茄病蟲害種類和定位感染部位的系統(tǒng),將VGG[96]和ResNet[97]相結(jié)合,解決了圖像環(huán)境復(fù)雜導(dǎo)致的圖像特征提取困難問題,可以解決復(fù)雜的任務(wù),例如判斷感染的狀態(tài)以及定位感染的位置。

      WANG等[5]采用蘋果黑腹病不同感染程度的圖像作為數(shù)據(jù)集,提出了使用VGG-16[96]來針對(duì)蘋果黑腹病感染程度進(jìn)行分類的模型。RAMCHARAN等[101]使用薯葉片表面病蟲害癥狀圖像和視頻作為數(shù)據(jù)集,訓(xùn)練MobileNet-SSD物體檢測(cè)模型用于識(shí)別木薯葉片表面病蟲害癥狀。PICON等[102]采用3種歐洲地方性小麥疾病的圖像作為訓(xùn)練集,使用深度殘差網(wǎng)絡(luò)ResNet-50[97]實(shí)現(xiàn)了自然條件下的多種病蟲害的自動(dòng)識(shí)別。

      研究人員對(duì)于VGG-16[96]、ResNet-50[97]、AlexNet和GoogleNet[92]等多種神經(jīng)網(wǎng)絡(luò)進(jìn)行微調(diào)以及改進(jìn),數(shù)據(jù)集也從公開的病蟲害數(shù)據(jù)集擴(kuò)展到了真實(shí)場(chǎng)景和復(fù)雜條件下采集的多種分辨率植物圖像[100],完成的任務(wù)也不僅包括病蟲害圖像分類與檢測(cè)等,也包含了感染程度判斷及感染部位定位等更加困難的任務(wù),但是植物病蟲害方面的公開數(shù)據(jù)集較少,深度學(xué)習(xí)模型仍然需要更大規(guī)模的相關(guān)數(shù)據(jù)集進(jìn)行訓(xùn)練。

      2.2.3產(chǎn)量預(yù)測(cè)

      產(chǎn)量預(yù)測(cè)對(duì)于育種者十分重要,對(duì)于作物產(chǎn)量和品質(zhì)的準(zhǔn)確預(yù)測(cè)和分析能夠增進(jìn)對(duì)作物的研究和認(rèn)識(shí),表示學(xué)習(xí)不僅能夠應(yīng)用于番茄[103]、小麥[104]、玉米[105]、大豆[106]、水果[107]的產(chǎn)量預(yù)測(cè)(表3),而且能夠根據(jù)遙感圖像進(jìn)行數(shù)據(jù)分析,從而對(duì)全縣乃至全州[106]的作物產(chǎn)量進(jìn)行預(yù)測(cè)。

      表3 產(chǎn)量預(yù)測(cè)方法Tab.3 Yield prediction methods

      綜上,研究者使用堆疊沙漏網(wǎng)絡(luò)以及表面特征直方圖等模型來提取圖像特征,使用Faster-RCNN等網(wǎng)絡(luò)模型對(duì)作物的產(chǎn)量預(yù)測(cè)方法進(jìn)行研究,通過對(duì)比不同的訓(xùn)練集以及測(cè)試集來調(diào)整模型以及進(jìn)行準(zhǔn)確度的測(cè)試,在單植株圖像層面上完成了小麥穗和小穗的定位和計(jì)數(shù)任務(wù),在多植株層面上完成了對(duì)于縣級(jí)乃至國(guó)家級(jí)的玉米以及大豆產(chǎn)量的預(yù)測(cè)任務(wù)。但是由于公開數(shù)據(jù)集的缺乏,對(duì)于水稻等的重要糧食作物產(chǎn)量預(yù)測(cè)研究較少。

      2.2.4基因研究

      表示學(xué)習(xí),包括深度學(xué)習(xí)模型等技術(shù)已經(jīng)被廣泛應(yīng)用到了生物醫(yī)學(xué)領(lǐng)域,而對(duì)植物基因的認(rèn)識(shí)是農(nóng)業(yè)研究的重要組成部分,基因研究的突破有利于增強(qiáng)植物的抗病性,提高植物產(chǎn)量。安高樂[112]采用GENCODE以及LNCipedia中的lncRNA以及編碼蛋白的轉(zhuǎn)錄本為數(shù)據(jù)集,使用雙向動(dòng)態(tài)循環(huán)神經(jīng)網(wǎng)絡(luò)模型完成了lncRNA的識(shí)別任務(wù),研究者將一維的堿基序列轉(zhuǎn)化為二維的向量來作為雙向動(dòng)態(tài)循環(huán)神經(jīng)網(wǎng)絡(luò)的輸入,在測(cè)試集中獲得了98%的正確率。

      MONTESINOS-LóPEZ等[113]分析了多特征深度學(xué)習(xí)模型(Multi-trait deep learning)在提高預(yù)測(cè)基因組選擇的作用。結(jié)果顯示,與貝葉斯多特征和多環(huán)境模型相比,MTDL模型對(duì)于在預(yù)測(cè)基因組需要較少的計(jì)算資源,并且能夠同時(shí)預(yù)測(cè)基因組的多個(gè)響應(yīng)變量。卷積神經(jīng)網(wǎng)絡(luò)能夠有效地表示基因序列的內(nèi)部原理以及特征,并且這種表示學(xué)習(xí)模型可以應(yīng)用到真實(shí)的植物基因序列[114]。但表示學(xué)習(xí)和植物基因的交叉研究剛開始,還需要基因組學(xué)領(lǐng)域的相關(guān)突破。

      2.2.5形態(tài)結(jié)構(gòu)表型數(shù)據(jù)計(jì)算

      植物的形態(tài)結(jié)構(gòu)表型數(shù)據(jù)的獲取計(jì)算是植物表型研究的重要部分,隨著表示學(xué)習(xí)的研究深入,研究者從植物的組織、器官、植株以及群體等不同尺度,利用表示學(xué)習(xí)完成形態(tài)結(jié)構(gòu)參數(shù)測(cè)量、二維圖像特征獲取以及三維模型構(gòu)建等任務(wù),減少了人工測(cè)量形態(tài)結(jié)構(gòu)表型數(shù)據(jù)的工作量。

      MALAMBO等[57]采集了由無人機(jī)獲取的288株玉米以及460株高粱的三維點(diǎn)云數(shù)據(jù),使用運(yùn)動(dòng)中恢復(fù)結(jié)構(gòu)算法來獲取田地間作物的精確高度。吳文華[115]選取了3種油菜品種在苗期和抽薹期的葉片圖像作為數(shù)據(jù)集,使用基于點(diǎn)分布模型的主動(dòng)形狀模型算法對(duì)破損的油菜花葉片進(jìn)行復(fù)原以及葉片面積計(jì)算,在破損面積占總面積的1%~10%之間時(shí),算法求得的油菜葉片重疊度為0.923。

      俞雙恩等[116]采用Logistic方程和DMOR模型,對(duì)于不同灌排模式和施氮水平下水稻株高和莖蘗的動(dòng)態(tài)變化過程進(jìn)行模型定量分析,獲得的模擬值和實(shí)測(cè)值標(biāo)準(zhǔn)化均方根誤差均小于10%,驗(yàn)證該模型能夠分析不同環(huán)境下的水稻株高和莖蘗的植物表型數(shù)據(jù)。

      黃成龍等[117]首先使用直通濾波、超體聚類以及條件歐氏距離算法對(duì)40株棉花幼苗點(diǎn)云數(shù)據(jù)進(jìn)行葉片的識(shí)別分割,隨后通過對(duì)分割后的葉片點(diǎn)云完成了三角面片化、隨機(jī)采樣一致性和Lab顏色分割的一系列處理,獲取的葉片面積和周長(zhǎng)的平均絕對(duì)誤差為2.59%和2.85%,準(zhǔn)確快速地獲取了葉片面積周長(zhǎng)、黃葉占比等參數(shù)。

      王琦[118]使用高光譜成像獲得的732幅秋葵植株圖像作為數(shù)據(jù)集,采用基于策略搜索的注意力機(jī)制的級(jí)聯(lián)式實(shí)例分割算法完成秋葵植株的快速分割,隨后根據(jù)植株干質(zhì)量與分割像素?cái)?shù)的散點(diǎn)圖,得到像素?cái)?shù)和干質(zhì)量的相關(guān)系數(shù)達(dá)到0.774,從而表明利用語義分割技術(shù)可以實(shí)現(xiàn)秋葵冠層面積數(shù)據(jù)的快速估測(cè)。

      張慧春等[119]使用運(yùn)動(dòng)中恢復(fù)結(jié)構(gòu)算法將光學(xué)相機(jī)采集的二維圖像轉(zhuǎn)化為三維點(diǎn)云數(shù)據(jù),設(shè)計(jì)了一種基于彩色標(biāo)版坐標(biāo)系標(biāo)準(zhǔn)化方法來提取點(diǎn)云特征,生成用于測(cè)量植物形態(tài)結(jié)構(gòu)的標(biāo)準(zhǔn)化坐標(biāo)系,對(duì)葉片寬度、長(zhǎng)度、主莖長(zhǎng)度等數(shù)據(jù)進(jìn)行了計(jì)算,相比人工測(cè)量效率高且速度快。

      BAWEJA等[120]提出了StalkNet模型,該模型使用Faster R-CNN進(jìn)行植物秸稈計(jì)數(shù)。StalkNet將物體檢測(cè)結(jié)果輸入到全連接網(wǎng)絡(luò),輸出結(jié)果為植物秸稈的像素寬度,隨后通過立體視覺匹配算法能夠?qū)⑾袼貙挾绒D(zhuǎn)換成植物秸稈的實(shí)際莖寬,莖數(shù)和寬度計(jì)算方法如圖5所示。使用OpenCV將三維圖像經(jīng)過輸入訓(xùn)練從而生成視差圖。該模型能夠準(zhǔn)確將采集檢測(cè)到的對(duì)象區(qū)域以及密集語義進(jìn)行分割,該方法比人工測(cè)量速度快30倍。

      圖5 莖數(shù)和寬度計(jì)算方法Fig.5 Calculation method of stem number and width

      除了對(duì)數(shù)據(jù)集中的植物表型數(shù)據(jù)進(jìn)行特征提取,YASRAB等[121]使用改進(jìn)的編碼器-解碼器神經(jīng)網(wǎng)絡(luò)模型,在3 630幅小麥幼苗圖像、277幅擬南芥圖像、120幅油菜圖像數(shù)據(jù)集上分別計(jì)算了根的長(zhǎng)度、彎曲度等參數(shù),獲得了高準(zhǔn)確度。

      表示學(xué)習(xí)相關(guān)模型為植物表型數(shù)據(jù)分析提供了框架,使用要素組合來提取高層特征,從而基于二維圖像、三維點(diǎn)云等數(shù)據(jù)通過主動(dòng)形狀模型算法對(duì)破損植株進(jìn)行復(fù)原和修補(bǔ),完成葉長(zhǎng)葉寬、面積周長(zhǎng)、傾角、卷曲度等形態(tài)表型數(shù)據(jù)的計(jì)算,減少了測(cè)量表型數(shù)據(jù)的工作量。但同時(shí)由于單種植物的表型數(shù)據(jù)量較少,形態(tài)結(jié)構(gòu)表型數(shù)據(jù)計(jì)算的準(zhǔn)確率仍有提高的空間。

      3 總結(jié)與展望

      表示學(xué)習(xí)技術(shù)在植物表型研究領(lǐng)域得到了成功應(yīng)用,從底層特征的提取到特征的訓(xùn)練和輸出,以深度神經(jīng)網(wǎng)絡(luò)、稀疏表示字典為代表的表示學(xué)習(xí)模型相比傳統(tǒng)植物表型研究方法擁有更優(yōu)的性能,能夠完成植株分割、分類、計(jì)數(shù)等表型數(shù)據(jù)的分析任務(wù)。表示學(xué)習(xí)在植物表型應(yīng)用中的發(fā)展方向?yàn)椋?/p>

      (1)開發(fā)能夠適用于分析不同種植物表型數(shù)據(jù)的表示學(xué)習(xí)模型,實(shí)現(xiàn)高整合度、高通用性的目標(biāo)。近年來,分析植物表型數(shù)據(jù)的表示學(xué)習(xí)模型要求訓(xùn)練集和測(cè)試集均來自于同一特征空間,而大部分的表型分析系統(tǒng)只能針對(duì)某種植物的某一表型性狀進(jìn)行分析和研究,測(cè)試不同種植物表型數(shù)據(jù)時(shí)都需要重新訓(xùn)練模型,對(duì)于數(shù)據(jù)集的要求很高。開發(fā)分析不同種植物表型數(shù)據(jù)的表示學(xué)習(xí)模型可以更好地滿足快速和高通量的研究需求,從而增強(qiáng)表示學(xué)習(xí)模型在植物研究領(lǐng)域中的應(yīng)用。

      (2)提高表示學(xué)習(xí)模型的實(shí)時(shí)性及準(zhǔn)確度,以增強(qiáng)其實(shí)用性。表示學(xué)習(xí)模型的特征提取和訓(xùn)練流程需要較長(zhǎng)的時(shí)間,在實(shí)時(shí)性方面難以滿足實(shí)際農(nóng)業(yè)環(huán)境下的運(yùn)用需求。此外,研究者使用的測(cè)試集和訓(xùn)練集大多來自公開數(shù)據(jù)集,其實(shí)用性需要在實(shí)際環(huán)境中進(jìn)行驗(yàn)證。

      (3)表示學(xué)習(xí)在植物表型中的研究和應(yīng)用需要跨學(xué)科的團(tuán)隊(duì)共同合作,多模態(tài)的表示學(xué)習(xí)將對(duì)多源表型數(shù)據(jù)構(gòu)建統(tǒng)一的數(shù)據(jù)表示,為學(xué)科的交叉數(shù)據(jù)分析研究提供統(tǒng)一的數(shù)據(jù)視圖。

      猜你喜歡
      哈希編碼器表型
      基于FPGA的同步機(jī)軸角編碼器
      建蘭、寒蘭花表型分析
      基于PRBS檢測(cè)的8B/IOB編碼器設(shè)計(jì)
      基于OpenCV與均值哈希算法的人臉相似識(shí)別系統(tǒng)
      JESD204B接口協(xié)議中的8B10B編碼器設(shè)計(jì)
      電子器件(2015年5期)2015-12-29 08:42:24
      GABABR2基因遺傳變異與肥胖及代謝相關(guān)表型的關(guān)系
      基于維度分解的哈希多維快速流分類算法
      慢性乙型肝炎患者HBV基因表型與血清學(xué)測(cè)定的臨床意義
      72例老年急性白血病免疫表型分析
      多總線式光電編碼器的設(shè)計(jì)與應(yīng)用
      遂溪县| 河北省| 响水县| 镇原县| 贵阳市| 保靖县| 巨鹿县| 安义县| 霍州市| 垫江县| 永胜县| 梓潼县| 资阳市| 昆明市| 旅游| 博乐市| 景泰县| 保山市| 翼城县| 稷山县| 库伦旗| 千阳县| 石首市| 蒙城县| 固始县| 慈利县| 安福县| 盐池县| 六安市| 博白县| 德昌县| 梅州市| 清水河县| 绍兴县| 色达县| 普洱| 甘洛县| 辽中县| 寿宁县| 大兴区| 武陟县|