• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于特征選擇和CNN+Bi-RNN模型的小麥抗寒性識別方法

      2022-06-12 01:20:07金松林來純曉鄭穎李艷翠霍云鳳劉明久4張自陽韓博閆思堯李龍威
      江蘇農(nóng)業(yè)科學(xué) 2022年10期
      關(guān)鍵詞:特征選擇小麥

      金松林 來純曉 鄭穎 李艷翠 霍云鳳 劉明久4 張自陽 韓博 閆思堯 李龍威

      摘要:針對當(dāng)前小麥抗寒性識別方法受限、資源消耗嚴(yán)重等問題,以國審小麥品種的文本數(shù)據(jù)為研究對象,利用特征選擇算法和深度學(xué)習(xí)方法實現(xiàn)小麥抗寒性識別研究。首先,使用集成學(xué)習(xí)中的自適應(yīng)增強(qiáng)(adaptive boosting,簡稱AdaBoost)算法和極端梯度提升(extreme gradient boosting,簡稱XGBoost)算法進(jìn)行特征選擇;然后,將卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,簡稱CNN)抽取的局部特征和雙向循環(huán)神經(jīng)網(wǎng)絡(luò)(Bi-direction recurrent neural network,簡稱Bi-RNN)抽取的上下文特征融合,構(gòu)建基于CNN+Bi-RNN的小麥抗寒性識別模型,通過試驗表明選擇15個特征時CNN+Bi-RNN方法的準(zhǔn)確率、F1值和Kappa系數(shù)最高,分別為0.789 8、0.810 2和0.602 7。最后,使用合成少數(shù)類過采樣技術(shù)(synthetic minority over-sampling technique,簡稱SMOTE)對樣本均衡化處理,處理后訓(xùn)練模型的準(zhǔn)確率均有所提高,其中CNN+Bi-RNN模型的準(zhǔn)確率達(dá)到0.829 2。該方法能夠較好地識別小麥抗寒性,提高育種效率。

      關(guān)鍵詞:小麥;抗寒性識別;特征選擇;CNN+Bi-RNN;樣本均衡化

      中圖分類號:TP391.4;S126 ??文獻(xiàn)標(biāo)志碼: A

      文章編號:1002-1302(2022)10-0201-07

      小麥?zhǔn)俏覈饕募Z食作物和重要的戰(zhàn)略儲備糧,提高小麥產(chǎn)量對確保國家糧食安全具有重要意義。近年來,倒春寒、寒潮等極端低溫天氣發(fā)生的頻率逐年增加、周期逐年縮短[1],黃淮麥區(qū)和長江中下游麥區(qū)發(fā)生的嚴(yán)重倒春寒等低溫天氣使小麥遭受大范圍凍害,嚴(yán)重影響小麥產(chǎn)量[2]。培育出具有抗寒性的優(yōu)良品種對提高小麥產(chǎn)量有重要作用,抗寒性識別成為小麥育種專家引種、選種和栽培確定的重要依據(jù)。

      目前,對小麥抗寒性識別的研究主要集中在生化細(xì)胞、基因分子和模擬低溫環(huán)境等方面[3]。生化細(xì)胞方法測定技術(shù)繁瑣、誤差較大;基因分子方法測定易受基因型和技術(shù)影響,效率偏低;模擬環(huán)境的方法需要營造特定環(huán)境,耗費(fèi)人力、物力和財力。近年來,深度學(xué)習(xí)方法被廣泛應(yīng)用到花型品種識別、農(nóng)業(yè)文本分類、作物病害預(yù)測等方面[4]。袁培森等使用端到端的卷積神經(jīng)網(wǎng)絡(luò)技術(shù)逐層學(xué)習(xí)特征,獲取多層網(wǎng)絡(luò)提取菊花的特征信息,實現(xiàn)了菊花花型和品種智能識別[5]。金寧等結(jié)合雙向門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)和多尺度并行卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化文本表示和文本特征提取,能夠準(zhǔn)確地對用戶提問實現(xiàn)自動分類[6]。張善文等結(jié)合知識圖譜和雙向長短時記憶網(wǎng)絡(luò)方法對小麥條銹病進(jìn)行預(yù)測,準(zhǔn)確率達(dá)到93.21%[7]。

      針對當(dāng)前小麥抗寒性識別方法存在的問題,借鑒深度學(xué)習(xí)技術(shù)和特征選擇算法在農(nóng)業(yè)和工業(yè)研究領(lǐng)域的成功案例[8-16],本研究基于特征選擇和深度學(xué)習(xí)方法對小麥抗寒性識別進(jìn)行研究。首先使用自適應(yīng)增強(qiáng)(adaptive boosting,簡稱AdaBoost)算法和極端梯度提升(extreme gradient boosting,簡稱XGBoost)算法對小麥數(shù)據(jù)進(jìn)行特征選擇,然后分別使用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,簡稱CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,簡稱RNN)提取小麥抗寒性的局部特征和序列特征,對獲取的深層語義特征信息進(jìn)行融合[17-18],構(gòu)建基于特征選擇和CNN+Bi-RNN的小麥抗寒性識別模型,最后通過樣本均衡化進(jìn)一步改善識別模型的性能。本研究的特征選擇結(jié)果可對抗寒性進(jìn)行有效特征篩選,為育種工作者培育出抗寒性品種提供更可靠的決策信息,提高育種效率。

      1 數(shù)據(jù)與方法

      1.1 試驗數(shù)據(jù)

      本研究試驗數(shù)據(jù)來源于中國種業(yè)大數(shù)據(jù)平臺(http://202.127.42.47:6010/SDSite/Home/Index)。利用Python編寫爬蟲系統(tǒng)爬取1978—2019年間的國審小麥品種信息,共得到3 513個品種的特性、熟性、生育期、幼苗特性、葉色、分葉能力、株型、株高、穗型、芒狀、殼色、粒色、籽粒硬度、籽粒飽滿度、畝穗數(shù)(1畝≈667 m2)、穗粒數(shù)、千粒重(指千粒質(zhì)量)、熟相、抗倒性、抗寒性、抗旱性、粗蛋白質(zhì)、濕面筋含量、降落指數(shù)、沉淀指數(shù)、吸水量、面團(tuán)形成時間、面團(tuán)穩(wěn)定時間、弱化度、出粉率、延伸性、最大拉伸能量、最大拉伸面積、最大拉伸阻力、容重、節(jié)水指數(shù)、節(jié)水性37個文本特征信息。針對爬取的文本數(shù)據(jù)中出現(xiàn)的多詞同義、錯別字和常量單位不統(tǒng)一等噪聲問題,參考Entz等的研究[19]并結(jié)合相關(guān)專家的建議,采用自動和人工相結(jié)合的方式對數(shù)據(jù)預(yù)處理,預(yù)處理后的每個特征信息分別按照語義信息統(tǒng)一采用字符串(如冬性、幼苗匍匐、株型緊湊等)和字符串混合數(shù)值(如生育期75至85、株高80至85、容重750至770等)2種類型表示,保留特征信息較為完整的3 049條小麥數(shù)據(jù)作為小麥抗寒性識別的數(shù)據(jù)集。不同的特征詞出現(xiàn)頻次及作用不同,根據(jù)每個特征詞的詞頻-逆向文件頻率(term frequency-inverse document frequency,簡稱 TF-IDF)的值,由高到低排序生成特征詞云分布(圖1)。

      從圖1可以看到,特征詞的顯示與 TF-IDF 呈正相關(guān)關(guān)系,在圖1中顯示較大的特征詞對應(yīng)的 TF-IDF 值也較大,說明對應(yīng)的特征詞對樣本區(qū)分較為重要。特征詞主要集中在穗粒數(shù)、畝穗數(shù)、熟性、生長期、千粒質(zhì)量等有關(guān)特征描述中,說明這些特征對目標(biāo)識別的影響較大。試驗選取抗寒性為標(biāo)簽,依據(jù)文本語義將抗寒性分為抗寒性強(qiáng)、抗寒性中、抗寒性弱、抗寒性未顯4類,將試驗數(shù)據(jù)以 6 ∶2 ∶2 的比例分為訓(xùn)練集、驗證集、測試集。

      1.2 特征選擇

      特征選擇通過評估函數(shù)度量特征與目標(biāo)值之間的相關(guān)性,從特征子集中尋找最佳組合,去除原數(shù)據(jù)中不相關(guān)或者冗余的特征。特征選擇不僅可以減少數(shù)據(jù)運(yùn)算的內(nèi)存消耗,還可以減少過擬合,提升模型的泛化能力。

      AdaBoost算法采用自適應(yīng)增強(qiáng)方式將訓(xùn)練得到的多個弱分類器加權(quán)組成強(qiáng)分類器,實現(xiàn)特征選擇。該算法充分考慮每個分類器的權(quán)重,具有很高的精度,通過增大錯誤分類樣本權(quán)值的方式增強(qiáng)學(xué)習(xí),提高分類器的精度,獲得特征的重要程度。XGBoost算法采用集成策略方式,依據(jù)梯度提升算法和正則項的引入,逐步減小已生成決策樹的損失,不斷更新最新生成樹模型,確保特征重要性程度計算的可靠性。充分發(fā)揮XGBoost和AdaBoost 2個集成算法在特征選擇過程中的優(yōu)勢,計算與抗寒性相關(guān)的各個特征的重要程度(特征值)。2種不同特征選擇算法得到的特征值結(jié)果見圖2。綜合分析2種算法計算結(jié)果,采用投票原則,分別從前10、15、20、25、30個特征中選擇2種算法重要的特征交集,構(gòu)建不同的特征組合。

      1.3 基于CNN+Bi-RNN的試驗方法

      CNN采用局部感知結(jié)構(gòu),通過局部連接和權(quán)值共享的方式提取訓(xùn)練數(shù)據(jù)的局部特征,以減少神經(jīng)網(wǎng)絡(luò)的參數(shù),緩解模型的過擬合問題;Bi-RNN采用引入記憶單元的方式,提取輸入特征在2個方向上的序列信息。為了進(jìn)一步提升小麥抗寒性識別的性能,將局部上下文特征信息和序列特征信息融合,構(gòu)建了CNN與Bi-RNN的混合模型CNN+Bi-RNN。首先,使用詞向量工具Word2vec將輸入的特征信息映射為特征向量;然后,分別使用CNN和Bi-RNN提取能夠表示抗寒性的局部特征信息和序列特征信息;最后,使用向量拼接的方法將提取的局部特征和序列特征信息拼接,完成特征的提取?;贑NN+Bi-RNN的小麥抗寒性識別模型的整體結(jié)構(gòu)見圖3。

      CNN+Bi-RNN模型依次為詞向量嵌入層、CNN、Bi-RNN、特征融合層、全連接層與輸出層。詞向量嵌入層使用Word2vec將預(yù)處理后小麥的特征詞映射到100維的向量空間,然后嵌入到神經(jīng)網(wǎng)絡(luò)中。嵌入小麥樣本的特征向量W=RL×100,其中R表示樣本集,L表示輸入特征組合中的特征數(shù)目。

      CNN使用大小為R3×100的卷積核,對輸入文本W(wǎng)向量 進(jìn)行卷積計算,獲得輸入小麥文本的局部特征信息。設(shè)定卷積核數(shù)目為64,卷積步長為1,卷積計算后的特征向量C=R(L-2)×64。為了縮減模型復(fù)雜度,提高模型計算速度和提取特征的魯棒性,使用池化層對卷積層提取的局部特征進(jìn)行2次提取,采用最大池化操作獲取最能代表輸入特征的重要信息,設(shè)定池化窗口為2,僅保留輸入特征信息在局部區(qū)域的最大值,池化操作后的特征向量P=RL-12×64。

      利用過去輸入特征詞和后面輸入特征詞采用Bi-RNN提取輸入特征詞之間的序列信息。Bi-RNN依據(jù)輸入長度的變化而動態(tài)調(diào)整自身的網(wǎng)絡(luò)狀態(tài),實現(xiàn)對嵌入小麥特征詞向量W的序列特征信息提取,此網(wǎng)絡(luò)不僅解決了輸入小麥特征詞文本之間的長序依賴問題,而且能夠從正向RNN與反向RNN 2個方向提取序列數(shù)據(jù)特征。設(shè)定隱藏神經(jīng)元個數(shù)為32,獲取的序列特征向量S=R64。

      采用向量拼接的方法進(jìn)行特征融合,將CNN提取的局部特征向量P和Bi-RNN提取的序列特征向量S進(jìn)行拼接,融合后的特征向量F=R128。該方法能夠強(qiáng)化深度學(xué)習(xí)網(wǎng)絡(luò)模型的特征學(xué)習(xí)能力,提升特征的表示強(qiáng)度。

      使用全連接層將前一層網(wǎng)絡(luò)融合后特征信息由高維轉(zhuǎn)為低維,同時映射到各個隱語義節(jié)點(diǎn)。全連接可以實現(xiàn)對輸入信息的維度變換和隱含語義表達(dá),此時網(wǎng)絡(luò)中的每個神經(jīng)元都和前一層的所有神經(jīng)元進(jìn)行全連接,將前一層提取到的高維小麥特征信息映射為一維向量D=R32。

      最后,使用Softmax分類器將多個神經(jīng)元的輸出映射到(0,1)區(qū)間內(nèi),得到所屬4個類別的概率,輸出概率值最大的類別實現(xiàn)最終的分類目標(biāo)。

      1.4 基于訓(xùn)練數(shù)據(jù)均衡化的CNN+Bi-RNN試驗方法

      不均衡樣本構(gòu)建的分類模型在訓(xùn)練過程中會降低對少數(shù)類樣本的關(guān)注程度,分類的結(jié)果會更傾向于多數(shù)類樣本,從而在整體上影響分類模型對小麥抗寒性的正確鑒定。針對本研究數(shù)據(jù)集中不同抗寒性類別的樣本數(shù)量存在的訓(xùn)練數(shù)據(jù)不均衡問題,采用合成少數(shù)類過采樣技術(shù)[20-22]對樣本進(jìn)行均衡化處理,使用默認(rèn)參數(shù)對抗寒性適中和較弱的樣本進(jìn)行過采樣,合成訓(xùn)練集中2種標(biāo)簽的樣本,使不同類別的抗寒性樣本趨于均衡化。合成少數(shù)類過采樣技術(shù)(synthetic minority over sampling technique,簡稱SMOTE)樣本均衡通過插值的方式加入近鄰的數(shù)據(jù)點(diǎn),擴(kuò)充少數(shù)類的樣本數(shù)目。樣本均衡通過隨機(jī)改變樣本,不僅可以改善抗寒性識別的性能,而且可以降低對某些屬性的依賴,從而提高模型的泛化能力。

      2 結(jié)果與分析

      以構(gòu)建的小麥特征文本數(shù)據(jù)集為研究對象,利用AdaBoost和XGBoost算法進(jìn)行特征選擇,去除數(shù)據(jù)中的冗余特征,選擇最佳特征進(jìn)行組合,然后利用構(gòu)建的CNN+Bi-RNN模型實現(xiàn)小麥抗寒性識別,最后將訓(xùn)練數(shù)據(jù)進(jìn)行均衡化,有效改善小麥抗寒性模型的識別性能。

      2.1 特征選擇結(jié)果與分析

      分別使用算法AdaBoost和XGBoost分析各個特征對小麥抗寒性的重要性。將2種算法計算出的特征重要程度進(jìn)行對比分析,從前10、15、20、25、30個特征中進(jìn)行選擇,選出2個特征選擇算法計算出重要性均較高的特征組合。試驗選擇范圍、選擇特征組和選出相同特征個數(shù)情況見表1。

      2種特征選擇算法生成最優(yōu)特征子集的計算策略不同,因此2種算法所得的特征重要性程度也有差異。通過表1可以發(fā)現(xiàn),依據(jù)2個特征選擇算法計算的特征重要性程度,從前10、15、20、25、30個特征中進(jìn)行選擇,分別有5、10、15、19、27個特征對2個模型的重要性相同。按照綜合分析選出的特征數(shù)目,共組合成5種特征子集,分別命名為Group1(即選擇特征個數(shù)為5)、Group2、Group3、Group4、Group5,將全部特征命名為Group6。最后利用本研究構(gòu)建的模型對選擇的特征組合性能進(jìn)行驗證。

      2.2 基于CNN+Bi-RNN的試驗結(jié)果與分析

      試驗采用網(wǎng)格搜索方式,設(shè)置批量訓(xùn)練的大小和迭代次數(shù)。以16為步長,評估10~300的不同批次大小的試驗結(jié)果。每次訓(xùn)練批次大小選定為32,即每批次處理32個小麥樣本數(shù)據(jù),設(shè)置模型訓(xùn)練的迭代次數(shù)為280。為了防止模型訓(xùn)練過程中神經(jīng)網(wǎng)絡(luò)參數(shù)增多產(chǎn)生過擬合,在卷積神經(jīng)網(wǎng)絡(luò)層和雙向循環(huán)神經(jīng)網(wǎng)絡(luò)層之后,添加丟棄率為0.2的Dropout層,隨機(jī)刪除部分神經(jīng)元。試驗選擇Adam為優(yōu)化器,學(xué)習(xí)速率為0.001。在劃分的訓(xùn)練集上構(gòu)建試驗?zāi)P停缓笤隍炞C集上調(diào)整優(yōu)化模型參數(shù),最后在測試集上驗證模型的整體性能。

      為驗證選出特征組合和抗寒性識別模型的有效性,試驗選取CNN、Bi-RNN與本研究構(gòu)建的CNN+Bi-RNN模型進(jìn)行對比試驗,對比模型試驗的訓(xùn)練批次設(shè)定為32,采用Early-stopping的方式監(jiān)控驗證集的loss值,當(dāng)驗證集的loss值連續(xù)10輪沒有下降則終止訓(xùn)練。試驗以準(zhǔn)確率(accuracy)、F1-值(F1-score)和一致性檢驗系數(shù)(Kappa系數(shù))作為模型的評價標(biāo)準(zhǔn)。不同特征組與模型在測試集上的試驗結(jié)果對比如表2所示。

      從表2可知,特征組為Group1時,CNN模型的試驗結(jié)果明顯高于Bi-RNN模型。特征組為Group2,CNN模型的性能仍優(yōu)于Bi-RNN,但是優(yōu)勢不太明顯。特征組選擇為Group3、Group4、Group5、Group6時,Bi-RNN模型的性能要優(yōu)于CNN模型,并且當(dāng)特征組為Group3,即特征選擇個數(shù)為15時,Bi-RNN模型的準(zhǔn)確率、F1值和Kappa系數(shù)要比Group1時的CNN模型分別高出0.077 2、0.078 8、0.172 1。結(jié)果表明,CNN提取小麥文本的上下文特征和Bi-RNN提取的特征詞之間的序列信息,均可用于小麥抗寒性鑒定。選取特征個數(shù)較少(特征選擇個數(shù)為5和10)時,CNN獲取的局部特征信息更加有利于模型做出正確的抗寒性分類識別;隨著特征選擇個數(shù)的增加,Bi-RNN獲取的序列特征信息有效地改善了分類識別的性能。

      另外,特征組為Group1,CNN+Bi-RNN模型的性能欠佳,低于CNN模型與Bi-RNN模型;特征組為Group2、Group3、Group4、Group、Group6,CNN+Bi-RNN模型的性能高于CNN模型和Bi-RNN模型,在Group3中,CNN+Bi-RNN模型對小麥的抗寒性識別的準(zhǔn)確率、F1值、Kappa系數(shù)達(dá)到了最高,分別為0.789 8、0.810 2、0.602 7。結(jié)果表明,特征選擇個數(shù)較少會導(dǎo)致模型中的參數(shù)個數(shù)較少,進(jìn)而影響模型的性能;特征選擇個數(shù)較多,增加了模型中的參數(shù)個數(shù),但是增加的冗余特征會引起模型的性能下降;特征組Group3結(jié)合CNN+Bi-RNN模型對小麥抗寒性識別的性能上表現(xiàn)最優(yōu),說明Group3中的15個特征在小麥抗寒性識別試驗中有重要作用。

      2.3 基于訓(xùn)練數(shù)據(jù)均衡化的CNN+Bi-RNN試驗結(jié)果與分析

      在小麥抗寒性識別訓(xùn)練數(shù)據(jù)集中,抗寒性未顯的樣本個數(shù)為1 218,抗寒性強(qiáng)的樣本個數(shù)為360,抗寒性中的樣本個數(shù)為202,抗寒性弱的樣本個數(shù)為49。訓(xùn)練樣本的數(shù)據(jù)存在不均衡,采用SMOTE隨機(jī)過采樣技術(shù)合成訓(xùn)練集中樣本數(shù)目較少的類別,使各個類別的樣本趨于均衡化。訓(xùn)練樣本均衡化前后數(shù)據(jù)分布見圖4。

      樣本均衡化之后,小麥抗寒性識別訓(xùn)練數(shù)據(jù)集中,抗寒性未顯的樣本個數(shù)為1 218,抗寒性強(qiáng)的樣本個數(shù)為360,抗寒性中的樣本個數(shù)為360,抗寒性弱的樣本個數(shù)為360。從圖4可以看到,樣本均衡化之后抗寒性適中和較弱的分類樣本數(shù)增多,各個分類樣本的分布較均衡化前更為清晰,但是也出現(xiàn)多個分類樣本重合的現(xiàn)象。試驗結(jié)果表明,在對訓(xùn)練集樣本均衡化之后,模型訓(xùn)練過程中出現(xiàn)了較為明顯的過擬合現(xiàn)象,本研究通過增大Dropout層的丟棄率至0.4,改善模型的過擬合,提升模型在測試集上的泛化能力。

      為了進(jìn)一步驗證樣本均衡化后小麥抗寒性識別的效果,在相同條件下使用Group3特征組對不同模型進(jìn)行樣本均衡化,試驗結(jié)果對比見圖5。

      由圖5可知,樣本均衡化后3種不同模型在測試集上的性能均有提升,其中,CNN模型與CNN+Bi-RNN的改善效果較為明顯。CNN+Bi-RNN模型的準(zhǔn)確率和F1值分別提高了0.039 4、0.013 3,Kappa系數(shù)達(dá)到了0.641 2。樣本均衡化處理通過人工合成少數(shù)類別樣本,不僅改善數(shù)據(jù)不平衡的問題,并且增加對少數(shù)類別樣本的關(guān)注程度。試驗結(jié)果表明,樣本均衡化不僅可提高試驗預(yù)測的準(zhǔn)確率,而且能改善小麥抗寒性識別的一致性檢驗性能。

      3 討論與結(jié)論

      本研究提出了一種融合特征選擇與深度學(xué)習(xí)的小麥抗寒性識別方法。首先對收集整理的國審小麥品種特征文本數(shù)據(jù)集預(yù)處理,然后構(gòu)建CNN+Bi-RNN小麥抗寒性識別模型,最后采用樣本均衡化處理的訓(xùn)練集,檢驗本研究方法的性能。通過試驗得到以下結(jié)論:(1)采用CNN+Bi-RNN模型可以有效解決小麥抗寒性識別問題。將輸入的文本特征詞訓(xùn)練為高維的詞向量,使用CNN充分挖掘特征詞上下文之間的局部信息;使用Bi-RNN從前后2個方向上提取整個輸入特征文本序列信息。通過試驗驗證表明,采用將捕獲的局部特征信息和序列特征信息進(jìn)行組合的方法對小麥抗寒性識別的準(zhǔn)確度和Kappa系數(shù)均高于其他對比模型。(2)提出融合特征選擇和深度學(xué)習(xí)的方法,將選出的特征組與構(gòu)建的CNN+Bi-RNN模型相結(jié)合,試驗結(jié)果表明特征選擇為畝穗數(shù)、熟性、品種特性、吸水量、抗倒性、株高、熟相、分葉能力、穗粒數(shù)、幼苗特性、葉色、拉伸面積、生長期、株型、抗旱性15個特征時,小麥的抗寒性識別模型結(jié)果最優(yōu),這15個特征對小麥的抗寒性影響較大。(3)使用SMOTE隨機(jī)過采樣技術(shù)可以解決樣本不均衡問題。訓(xùn)練數(shù)據(jù)集樣本均衡化后,試驗方法的準(zhǔn)確度和Kappa系數(shù)均有提高,說明通過增加數(shù)目較少的標(biāo)簽數(shù)量可以有效緩解少數(shù)類樣本被忽略的問題,從而改善小麥抗寒性識別的性能。

      本研究提出的小麥抗寒性識別方法能夠指導(dǎo)育種專家在育種選擇時更具有針對性地選擇地抗寒品種,為小麥信息化育種提供決策輔助。下一步工作將繼續(xù)優(yōu)化特征選取方法,找到更優(yōu)的特征子集,進(jìn)一步提高抗寒性識別的準(zhǔn)確率。

      參考文獻(xiàn):

      [1]張淑娟,宋國琦,高 潔,等. 小麥春季抗寒性研究進(jìn)展[J]. 山東農(nóng)業(yè)科學(xué),2017,49(6):157-162.

      [2]趙 虹,王西成,胡衛(wèi)國,等. 黃淮南片麥區(qū)小麥倒春寒凍害成因及預(yù)防措施[J]. 河南農(nóng)業(yè)科學(xué),2014,43(8):34-38.

      [3]趙瑞玲,趙 勇,易騰飛,等. 小麥種質(zhì)資源的抗寒性鑒定及品種篩選[J]. 山東農(nóng)業(yè)大學(xué)學(xué)報(自然科學(xué)版),2019,50(1):25-30.

      [4]呂盛坪,李燈輝,冼榮亨. 深度學(xué)習(xí)在我國農(nóng)業(yè)中的應(yīng)用研究現(xiàn)狀[J]. 計算機(jī)工程與應(yīng)用,2019,55(20):24-33,51.

      [5]袁培森,黎 薇,任守綱,等. 基于卷積神經(jīng)網(wǎng)絡(luò)的菊花花型和品種識別[J]. 農(nóng)業(yè)工程學(xué)報,2018,34(5):152-158.

      [6]金 寧,趙春江,吳華瑞,等. 基于BiGRU_MulCNN的農(nóng)業(yè)問答問句分類技術(shù)研究[J]. 農(nóng)業(yè)機(jī)械學(xué)報,2020,51(5):199-206.

      [7]張善文,王 振,王祖良. 結(jié)合知識圖譜與雙向長短時記憶網(wǎng)絡(luò)的小麥條銹病預(yù)測[J]. 農(nóng)業(yè)工程學(xué)報,2020,36(12):172-178.

      [8]Chen T Q,Guestrin C. XGBoost:a scalable tree boosting system[C]//Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York:ACM,2016:785-794.

      [9]李占山,劉兆賡. 基于XGBoost的特征選擇算法[J]. 通信學(xué)報,2019,40(10):101-108.

      [10]姜少飛,鄔天驥,彭 翔,等. 基于XGBoost特征提取的數(shù)據(jù)驅(qū)動故障診斷方法[J]. 中國機(jī)械工程,2020,31(10):1232-1239.

      [11]傅隆生,馮亞利,Elkamil Tola,等. 基于卷積神經(jīng)網(wǎng)絡(luò)的田間多簇獼猴桃圖像識別方法[J]. 農(nóng)業(yè)工程學(xué)報,2018,34(2):205-211.

      [12]鄭 誠,薛滿意,洪彤彤,等. 用于短文本分類的DC-BiGRU_CNN模型[J]. 計算機(jī)科學(xué),2019,46(11):186-192.

      [13]Yang F,Zhang J H,Liu G S,et al. Five-stroke based CNN-BiRNN-CRF network for Chinese named entity recognition[C]//Natural Language Processing and Chinese Computing.Switzerland:Springer,2018:184-195.

      [14]佃松宜,程 鵬,王 凱,等. 基于雙向循環(huán)神經(jīng)網(wǎng)絡(luò)的跌倒行為識別[J]. 計算機(jī)工程與設(shè)計,2020,41(7):2019-2024.

      [15]Al-shaibani M S,Alyafeai Z,Ahmad I. Meter classification of Arabic poems using deep bidirectional recurrent neural networks[J]. Pattern Recognition Letters,2020,136:1-7.

      [16]Li Z,Zhu J P,Xu X J,et al. RDense:a protein-RNA binding prediction model based on bidirectional recurrent neural network and densely connected convolutional networks[J]. IEEE Access,2019,8:14588-14605.

      [17]曹建榮,呂俊杰,武欣瑩,等. 融合運(yùn)動特征和深度學(xué)習(xí)的跌倒檢測算法[J]. 計算機(jī)應(yīng)用,2021,41(2):583-589.

      [18]楊朝強(qiáng),邵黨國,楊志豪,等. 多特征融合的中文短文本分類模型[J]. 小型微型計算機(jī)系統(tǒng),2020,41(7):1421-1426.

      [19]Entz M H,Kirk A P,Carkner M,et al. Evaluation of lines from a farmer participatory organic wheat breeding program[J]. Crop Science,2018,58(6):2433-2443.

      [20]劉云鵬,和家慧,許自強(qiáng),等. 基于SVM SMOTE的電力變壓器故障樣本均衡化方法[J]. 高電壓技術(shù),2020,46(7):2522-2529.

      [21]石洪波,陳雨文,陳 鑫. SMOTE過采樣及其改進(jìn)算法研究綜述[J]. 智能系統(tǒng)學(xué)報,2019,14(6):1073-1083.

      [22]Chawla N V,Bowyer K W,Hall L O,et al. SMOTE:synthetic minority over-sampling technique[J]. Journal of Artificial Intelligence Research,2002,16:321-357.

      猜你喜歡
      特征選擇小麥
      主產(chǎn)區(qū)小麥?zhǔn)召忂M(jìn)度過七成
      孔令讓的“小麥育種夢”
      金橋(2021年10期)2021-11-05 07:23:28
      葉面施肥實現(xiàn)小麥畝增產(chǎn)83.8千克
      哭娃小麥
      Kmeans 應(yīng)用與特征選擇
      電子制作(2017年23期)2017-02-02 07:17:06
      聯(lián)合互信息水下目標(biāo)特征選擇算法
      基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
      基于二元搭配詞的微博情感特征選擇
      安康市| 灯塔市| 衡东县| 马关县| 龙井市| 白河县| 海宁市| 泌阳县| 罗江县| 昂仁县| 乡宁县| 吉安市| 济源市| 芒康县| 武安市| 文化| 托克逊县| 永平县| 贞丰县| 昆明市| 琼海市| 博罗县| 宁化县| 高尔夫| 永善县| 康马县| 富阳市| 西吉县| 崇左市| 曲阜市| 杨浦区| 城市| 荥经县| 嵊州市| 忻城县| 英吉沙县| 叙永县| 冕宁县| 赤峰市| 平远县| 岳阳县|