• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于機(jī)器聽(tīng)覺(jué)的鳥(niǎo)聲識(shí)別的中文研究綜述

      2020-06-29 01:06:10趙子平
      關(guān)鍵詞:鳥(niǎo)聲鳥(niǎo)類(lèi)分類(lèi)器

      喬 玉,錢(qián) 昆,趙子平

      (1. 天津師范大學(xué) 計(jì)算機(jī)與信息工程學(xué)院,天津 300387; 2. 東京大學(xué) 身體教育學(xué)實(shí)驗(yàn)室,日本 東京 113-0033)

      鳥(niǎo)鳴聲包含豐富的生態(tài)學(xué)信息,其相關(guān)的研究成果可應(yīng)用于動(dòng)物行為分析與監(jiān)護(hù)、自然保護(hù)區(qū)信息采集、生態(tài)環(huán)境狀態(tài)恢復(fù)監(jiān)控等領(lǐng)域.鳥(niǎo)聲識(shí)別在現(xiàn)實(shí)中的應(yīng)用十分廣泛,例如,在一些面積比較大的濕地、森林和沼澤地中,由生態(tài)保護(hù)工作者長(zhǎng)期蹲點(diǎn)來(lái)觀察鳥(niǎo)類(lèi)的活動(dòng)規(guī)律,這將會(huì)耗費(fèi)大量的時(shí)間和成本,而基于鳥(niǎo)聲識(shí)別技術(shù)的智能聲測(cè)傳感網(wǎng)覆蓋范圍廣,持續(xù)時(shí)間長(zhǎng),即使在環(huán)境非常惡劣的野外,它也能夠在無(wú)人值守的情況下進(jìn)行監(jiān)測(cè),極大地節(jié)約了人力成本[1];同時(shí),收集到的鳥(niǎo)聲數(shù)據(jù)可供我們進(jìn)行生態(tài)監(jiān)測(cè),了解鳥(niǎo)類(lèi)的分布狀態(tài),維護(hù)生態(tài)系統(tǒng)的平衡.在日常生活中,我們能夠通過(guò)肉眼觀察鳥(niǎo)喙或者鳥(niǎo)的羽毛等形態(tài)特征來(lái)判斷鳥(niǎo)的類(lèi)別;同樣地,與這些形態(tài)特征相似,鳥(niǎo)鳴聲所蘊(yùn)含的生物學(xué)信息特征也有很大的差異,這種差異可以幫助區(qū)分不同物種的鳥(niǎo).因此,我們可以通過(guò)提取和分析鳥(niǎo)鳴聲所蘊(yùn)含的信息特征來(lái)鑒別鳥(niǎo)的物種,統(tǒng)計(jì)生態(tài)區(qū)的鳥(niǎo)類(lèi)分布特點(diǎn),從而幫助了解生物多樣性,進(jìn)而監(jiān)控生態(tài)系統(tǒng)的平衡;與此同時(shí),對(duì)鳥(niǎo)鳴聲的監(jiān)測(cè)有利于把握鳥(niǎo)類(lèi)的活動(dòng)范圍和規(guī)律,合理地安排飛機(jī)飛行的航線和時(shí)間,防止鳥(niǎo)類(lèi)與飛行器發(fā)生碰撞,造成不可挽回的損失[2].與國(guó)內(nèi)的研究相比,加拿大、德國(guó)、英國(guó)關(guān)于鳥(niǎo)聲識(shí)別的研究比較多.通過(guò)調(diào)研國(guó)內(nèi)的鳥(niǎo)聲識(shí)別文獻(xiàn),我們可以了解目前國(guó)內(nèi)在鳥(niǎo)聲識(shí)別領(lǐng)域的研究水平,并對(duì)未來(lái)需要努力的方向進(jìn)行展望.

      1 相關(guān)工作

      目前,國(guó)內(nèi)大多數(shù)語(yǔ)音識(shí)別技術(shù)都是針對(duì)音樂(lè)和語(yǔ)音的,對(duì)于鳥(niǎo)聲識(shí)別這一方面的研究還是比較少的,在識(shí)別技術(shù)上一般是通過(guò)提取鳥(niǎo)聲各方面的特征,然后使用傳統(tǒng)機(jī)器學(xué)習(xí)的算法,構(gòu)建單一的分類(lèi)器來(lái)進(jìn)行識(shí)別.通過(guò)對(duì)國(guó)內(nèi)鳥(niǎo)聲識(shí)別相關(guān)領(lǐng)域的文獻(xiàn)進(jìn)行調(diào)研和研究分析,我們發(fā)現(xiàn),相對(duì)來(lái)說(shuō),國(guó)內(nèi)學(xué)者做的比較多的研究還是在提取特征方面: 通過(guò)改進(jìn)特征提取算法,嘗試各種語(yǔ)音信號(hào)處理方法,或者是分析鳥(niǎo)鳴聲的各種特征,找出對(duì)分類(lèi)效果最好的特征.2013年陳莎莎[3]使用改進(jìn)的基于噪聲功率譜動(dòng)態(tài)估計(jì)的短時(shí)譜音頻增強(qiáng)算法來(lái)抑制背景噪音,盡可能地提取出了純粹的有效信號(hào),從而增加了分類(lèi)的正確性;隨后,陳莎莎等[4]在使用改進(jìn)后的聲音增強(qiáng)算法的基礎(chǔ)上,進(jìn)一步提取出鳥(niǎo)聲的時(shí)頻紋理特征并利用隨機(jī)森林(Random Forest, RF)分類(lèi)器對(duì)鳥(niǎo)聲進(jìn)行識(shí)別,不僅能達(dá)到良好的識(shí)別效果,還具有良好的抗噪性能,這種方法在一定程度上降低了背景噪音對(duì)鳥(niǎo)聲識(shí)別結(jié)果的影響,使得在對(duì)20種鳥(niǎo)的識(shí)別中平均識(shí)別率能夠達(dá)到95.35%.陳莎莎等的研究是在20種鳥(niǎo)鳴聲的基礎(chǔ)上進(jìn)行訓(xùn)練的,但在實(shí)際生活中所采集的鳥(niǎo)鳴聲往往包含多種鳥(niǎo)類(lèi)的叫聲,僅僅依賴(lài)于單種鳥(niǎo)聲進(jìn)行訓(xùn)練具有一定的局限性.2015年,魏靜明等[5]在提取紋理特征的算法上進(jìn)行改進(jìn),增加了和差統(tǒng)計(jì)法,得到的特征是抗噪性的紋理特征,之后在隨機(jī)森林分類(lèi)器上進(jìn)行鳥(niǎo)鳴聲識(shí)別,驗(yàn)證了改進(jìn)紋理特征提取方法后對(duì)鳥(niǎo)鳴聲識(shí)別的有效性.2016年,劉昊天等[6]將多標(biāo)記的遷移學(xué)習(xí)算法應(yīng)用于鳥(niǎo)聲識(shí)別上,同時(shí)在局部標(biāo)記關(guān)系上提出了1種新的多標(biāo)記遷移算法,相對(duì)于全局標(biāo)記關(guān)系來(lái)說(shuō),這種算法提高了分類(lèi)的精確度.隨后,劉昊天等[7]提出了基于特征遷移的多物種鳥(niǎo)聲識(shí)別方法(Recognition of Multiple Bird Species in audio recordings based on Feature Transfer, FT-RMBS),首先訓(xùn)練單物種鳥(niǎo)聲識(shí)別模型,然后再將其應(yīng)用到多物種鳥(niǎo)聲的識(shí)別中,這種方法將識(shí)別率提高了20%,這在一定程度上降低了多物種鳥(niǎo)聲樣本不足對(duì)模型訓(xùn)練的影響,同時(shí)有利于在鳥(niǎo)類(lèi)分布比較多的野生濕地、沼澤地或者森林等地區(qū)進(jìn)行鳥(niǎo)聲識(shí)別.同年,程龍等[8]將提取梅爾頻率倒譜系數(shù)(Mel Frequency Cepstral Coefficients, MFCC)的算法進(jìn)行改進(jìn),在進(jìn)行快速傅里葉變換(Fast Fourier Transformation, FFT)之前為其增加經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition, EMD)來(lái)改進(jìn)MFCC算法,改進(jìn)后的算法對(duì)7種鳥(niǎo)聲的識(shí)別率達(dá)到了70.09%,與未改進(jìn)的算法相比識(shí)別率提高了3.42%.與陳莎莎的研究不同,劉釗等[9]從不同的角度對(duì)鳥(niǎo)聲識(shí)別進(jìn)行研究,他們不是去抑制背景噪聲,而是將高斯白噪聲和真實(shí)環(huán)境背景噪聲人工加入到鳥(niǎo)鳴聲音頻中,專(zhuān)門(mén)對(duì)加入這兩種噪聲的鳥(niǎo)鳴聲進(jìn)行研究,提出了1種噪聲環(huán)境下的鳥(niǎo)聲識(shí)別的仿真方法,在人工加入高斯白噪聲和真實(shí)環(huán)境背景噪聲下,采用這種方法的魯棒性比較好,對(duì)于這兩種背景下的鳥(niǎo)聲識(shí)別效果也比較好.但是,他們的研究成果也僅僅局限于這兩種噪聲背景下的鳥(niǎo)鳴聲識(shí)別,而在實(shí)際生活中有各種各樣的背景噪音,所以這種方法是有局限性的.以上幾位學(xué)者的研究均是基于單一分類(lèi)器進(jìn)行的,到2018年,徐淑正等[10]提出了1種與以上幾位學(xué)者均不相同的方法,他們綜合鳥(niǎo)聲的多種特征,提出了1種多分類(lèi)器集成技術(shù)的方法來(lái)識(shí)別鳥(niǎo)聲,不再是使用單一的分類(lèi)器進(jìn)行鳥(niǎo)聲識(shí)別,最終對(duì)11類(lèi)的鳥(niǎo)鳴聲樣本識(shí)別能實(shí)現(xiàn)92%的準(zhǔn)確率.

      圖1 鳥(niǎo)聲識(shí)別的框圖Fig.1 The diagram of bird sound recognition

      綜上所述,通過(guò)對(duì)國(guó)內(nèi)學(xué)者在鳥(niǎo)聲識(shí)別領(lǐng)域的研究成果的分析,我們可以發(fā)現(xiàn)他們?cè)谔卣魈崛》矫孀龀隽藝L試: 通過(guò)對(duì)某些特征提取的算法的改進(jìn),以得到較好的特征來(lái)進(jìn)行鳥(niǎo)鳴聲識(shí)別;嘗試提取多種鳥(niǎo)鳴聲特征,找出對(duì)分類(lèi)效果貢獻(xiàn)度最好的特征,并由此作為分類(lèi)的有效特征放入分類(lèi)器進(jìn)行分類(lèi);通過(guò)改進(jìn)算法來(lái)抑制背景噪音的影響,以期獲得比較純凈的鳥(niǎo)鳴聲的音頻數(shù)據(jù),提高在后期分類(lèi)的準(zhǔn)確性.同時(shí),在分類(lèi)器方面也做出了努力,提出了1種將標(biāo)簽進(jìn)行融合的集成分類(lèi)方法來(lái)進(jìn)行分類(lèi),取得了比單一分類(lèi)器分類(lèi)效果更好的結(jié)果.目前,在鳥(niǎo)聲識(shí)別方面,國(guó)內(nèi)學(xué)者的研究方法多是基于傳統(tǒng)的機(jī)器學(xué)習(xí)的算法來(lái)進(jìn)行的,所使用的鳥(niǎo)鳴聲特征也多是一些手工特征.在分類(lèi)器算法上使用比較多的是支持向量機(jī)和隨機(jī)森林算法,說(shuō)明這兩種算法對(duì)于鳥(niǎo)聲識(shí)別是有一定幫助的.通過(guò)對(duì)國(guó)內(nèi)鳥(niǎo)聲識(shí)別領(lǐng)域相關(guān)文獻(xiàn)的檢索和研究發(fā)現(xiàn),鳥(niǎo)聲識(shí)別的一般過(guò)程如圖1所示.

      2 鳥(niǎo)聲識(shí)別分類(lèi)的方法

      通過(guò)調(diào)查發(fā)現(xiàn),目前在鳥(niǎo)聲識(shí)別上所使用的分類(lèi)方法大致都是從3個(gè)方面出發(fā)的.

      第一,基于模板匹配的分類(lèi)方法,比較常見(jiàn)的是動(dòng)態(tài)時(shí)間規(guī)劃(Dynamic Time Wrapping, DTW)模板算法[11],徐淑正等[10]就將此方法應(yīng)用到了自己的研究當(dāng)中,最終對(duì)11類(lèi)的鳥(niǎo)聲分類(lèi)實(shí)現(xiàn)了92%的準(zhǔn)確率.陳海蘭等[12]提出的多維特征聯(lián)合的鳥(niǎo)類(lèi)分類(lèi)方法中也使用到了模板匹配.但是這種方法的運(yùn)算量相對(duì)來(lái)說(shuō)是比較大的,所以在一定程度上會(huì)影響運(yùn)算的效率.孫斌等[13]利用自適應(yīng)最優(yōu)核時(shí)頻分布(Adaptive Optimal Kernel, AOK)方法將經(jīng)過(guò)預(yù)處理的鳥(niǎo)鳴聲音頻信號(hào)轉(zhuǎn)變成時(shí)頻譜圖,通過(guò)分析時(shí)頻譜圖上的能量分布,將其轉(zhuǎn)化為灰度圖像,利用灰度共生矩陣來(lái)提取特征,之后利用模板匹配來(lái)將待識(shí)別的鳥(niǎo)類(lèi)模板與訓(xùn)練生成的訓(xùn)練模板進(jìn)行匹配,通過(guò)對(duì)匹配值的比較來(lái)對(duì)鳥(niǎo)的物種進(jìn)行識(shí)別.

      第二,根據(jù)特征的特點(diǎn)來(lái)建立分類(lèi)模型,所使用的分類(lèi)特征多是手工提取的特征,常用的分類(lèi)模型多是隨機(jī)森林[9]、支持向量機(jī)(Support Vector Machine, SVM)[14]、隱馬爾科夫模型(Hidden Markov Model, HMM)[15]和高斯混合模型(Gaussian Mixture Model, GMM)[16]等,通過(guò)調(diào)查國(guó)內(nèi)在這方面的研究,發(fā)現(xiàn)目前較多使用的分類(lèi)器算法是隨機(jī)森林和支持向量機(jī).

      第三,利用深度學(xué)習(xí)的方法進(jìn)行分類(lèi),這是目前比較熱門(mén)的方法,但是通過(guò)調(diào)查發(fā)現(xiàn),國(guó)內(nèi)很少將深度學(xué)習(xí)的方法應(yīng)用到鳥(niǎo)聲識(shí)別領(lǐng)域.2018年,謝將劍等[17]利用線性調(diào)頻小波變換(Linear Chirplet Transform, LCT)、短時(shí)傅里葉變換(Short-Time Fourier Transform, STFT)、梅爾頻率倒譜變換(Mel Frequency Cepstrum Transform, MFCT)獲得3種語(yǔ)譜圖樣本,并將這些語(yǔ)譜圖樣本輸入至深度卷積神經(jīng)網(wǎng)絡(luò)(Deep Convolution Neural Network, DCNN)VGG16模型中,最后以平均識(shí)別準(zhǔn)確率(Mean Average Precision, MAP)作為評(píng)判模型性能的標(biāo)準(zhǔn),最終以在北京市松山國(guó)家自然保護(hù)區(qū)實(shí)地采集的18種鳥(niǎo)作為實(shí)驗(yàn)對(duì)象,使用Chirplet語(yǔ)圖所訓(xùn)練出的神經(jīng)網(wǎng)絡(luò)模型的性能最好,測(cè)試集的MAP值能夠達(dá)到98.71%,而且所需要的迭代次數(shù)也是最小的.

      表1 用于鳥(niǎo)聲識(shí)別研究的數(shù)據(jù)庫(kù)(集)Tab.1 Databases(datasets) for bird sound recognition research

      注: 數(shù)據(jù)均來(lái)自各文獻(xiàn).

      3 鳥(niǎo)聲識(shí)別數(shù)據(jù)庫(kù)(集)

      通過(guò)檢索目前國(guó)內(nèi)鳥(niǎo)聲識(shí)別領(lǐng)域的文獻(xiàn),各研究使用的數(shù)據(jù)庫(kù)(集)所涉及的鳥(niǎo)鳴聲種類(lèi)和樣本的數(shù)量如表1所示.

      4 鳥(niǎo)聲識(shí)別算法

      陳莎莎等[4]使用RF和SVM分類(lèi)器,結(jié)合時(shí)頻紋理特征對(duì)鳥(niǎo)鳴聲進(jìn)行分類(lèi),最終對(duì)通過(guò)實(shí)地采集和Freesound音頻網(wǎng)站上搜集的20種鳥(niǎo)類(lèi)的識(shí)別達(dá)到了極好的效果,其中采用RF分類(lèi)器的準(zhǔn)確度比采用SVM分類(lèi)器的高出了4%;魏靜明等[5]利用RF分類(lèi)器算法證明通過(guò)提取抗噪紋理特征能夠有效地提高分類(lèi)的準(zhǔn)確性;劉昊天等[7]在進(jìn)行鳥(niǎo)聲識(shí)別時(shí)構(gòu)造了1種GMM結(jié)合Rank SVM模型,這種模型結(jié)合了從鳥(niǎo)鳴聲中提取出來(lái)的MFCC特征來(lái)實(shí)現(xiàn)對(duì)多物種鳥(niǎo)聲的識(shí)別;劉釗等[9]采用RF分類(lèi)器對(duì)大規(guī)模聲學(xué)特征進(jìn)行分類(lèi);徐淑正等[10]提取了4種不同的聲學(xué)特征,對(duì)這些特征使用SVM和RF分類(lèi)器進(jìn)行分類(lèi),然后做了1個(gè)標(biāo)簽的融合,整合各個(gè)分類(lèi)器的分類(lèi)結(jié)果,使得最終預(yù)測(cè)的可靠性更高.通過(guò)對(duì)目前國(guó)內(nèi)鳥(niǎo)聲識(shí)別領(lǐng)域的文獻(xiàn)研究發(fā)現(xiàn),在鳥(niǎo)聲識(shí)別上多用的是RF和SVM分類(lèi)器.結(jié)合對(duì)目前國(guó)內(nèi)鳥(niǎo)聲識(shí)別領(lǐng)域的相關(guān)文獻(xiàn)的研究,本節(jié)將從以下幾個(gè)部分對(duì)鳥(niǎo)聲識(shí)別算法進(jìn)行討論.

      4.1 音頻增強(qiáng)算法

      從自然界中收集的鳥(niǎo)叫聲音頻難免會(huì)包含環(huán)境噪音,而在進(jìn)行鳥(niǎo)聲識(shí)別時(shí)所要用到的分類(lèi)特征應(yīng)當(dāng)是從比較純凈的鳥(niǎo)鳴聲信號(hào)中進(jìn)行提取,所以這種包含噪聲的音頻信號(hào)會(huì)對(duì)后期分類(lèi)器的準(zhǔn)確度造成極大的影響.為了防止這種背景噪音對(duì)鳥(niǎo)聲識(shí)別結(jié)果的影響,在進(jìn)行鳥(niǎo)叫聲特征提取之前需要利用音頻增強(qiáng)算法對(duì)鳥(niǎo)叫聲音頻進(jìn)行前端處理.

      所謂前端處理[4]就是對(duì)含有噪聲的信號(hào)進(jìn)行信號(hào)增強(qiáng)處理,從而降低背景噪聲在分類(lèi)時(shí)的影響.陳莎莎等[3-4]就提出了1種改進(jìn)的聲音增強(qiáng)算法,這種算法能夠有效抑制背景噪音對(duì)分類(lèi)結(jié)果的影響,提高分類(lèi)識(shí)別的準(zhǔn)確度.為了獲得更加純凈的音頻信號(hào),一些學(xué)者也嘗試通過(guò)改進(jìn)算法來(lái)提高音頻增強(qiáng)算法的效果,從而獲得相對(duì)來(lái)說(shuō)比較純粹的鳥(niǎo)鳴聲信號(hào).

      4.2 特征提取算法

      要對(duì)鳥(niǎo)類(lèi)進(jìn)行分類(lèi)首先需要的就是了解不同鳥(niǎo)類(lèi)的鳥(niǎo)叫聲特點(diǎn),這就要我們恰當(dāng)?shù)夭杉B(niǎo)鳴聲,并使用良好的語(yǔ)音信號(hào)處理方法對(duì)采集到的鳥(niǎo)鳴聲信號(hào)進(jìn)行處理和分析,提取最優(yōu)的音頻特征,根據(jù)不同物種的鳥(niǎo)叫聲的特征來(lái)進(jìn)行分類(lèi).通過(guò)研究國(guó)內(nèi)一些學(xué)者的文獻(xiàn)可以發(fā)現(xiàn),主要有以下幾種特征提取的方法.

      4.2.1 音節(jié)長(zhǎng)度

      音節(jié)長(zhǎng)度指音節(jié)持續(xù)的時(shí)間長(zhǎng)度,描述了鳥(niǎo)鳴聲的長(zhǎng)短.音節(jié)長(zhǎng)度的計(jì)算是在音節(jié)萃取之后進(jìn)行的.一般的音節(jié)萃取方法是先計(jì)算每幀的短時(shí)能量,然后設(shè)定1個(gè)閾值從而判斷有聲段和無(wú)聲段,得到結(jié)果后再進(jìn)行中值濾波,最后將密集的有聲段連接在一起,形成音節(jié).不同的音節(jié)長(zhǎng)度在后期進(jìn)行鳥(niǎo)聲識(shí)別分類(lèi)時(shí)的準(zhǔn)確性是不一樣的.

      4.2.2 梅爾頻率倒譜系數(shù)

      不同種類(lèi)的鳥(niǎo)在頻譜上表現(xiàn)出來(lái)的特征是不一樣的,可以通過(guò)將同一種鳥(niǎo)的特征幀拼合在一起,進(jìn)而利用拼合在一起的幀特征來(lái)識(shí)別不同種類(lèi)的鳥(niǎo).這里,梅爾頻率倒譜系數(shù)(MFCC)是語(yǔ)音識(shí)別中使用得最好的1類(lèi)特征參數(shù).對(duì)輸入的每幀語(yǔ)音先進(jìn)行快速傅里葉變換,從頻譜求得幅度譜,然后通過(guò)梅爾濾波器組平滑頻譜,消除諧波的作用后,再做對(duì)數(shù)運(yùn)算,經(jīng)過(guò)行離散余弦變換(Discrete Cosine Transform, DCT),最后得到我們所需要的MFCC.

      在分析國(guó)內(nèi)這方面研究的文章的時(shí)候發(fā)現(xiàn),對(duì)不平穩(wěn)的音頻信號(hào)可以采用經(jīng)驗(yàn)?zāi)B(tài)分解法來(lái)對(duì)信號(hào)進(jìn)行處理,而鳥(niǎo)鳴聲正好就是這樣1種非常不平穩(wěn)的信號(hào),所以在進(jìn)行FFT之前添加經(jīng)驗(yàn)?zāi)B(tài)分解法,經(jīng)過(guò)這樣的改進(jìn)之后,鳥(niǎo)鳴聲的識(shí)別準(zhǔn)確率有了明顯的提高.

      4.3 分類(lèi)器算法

      在調(diào)研過(guò)程中發(fā)現(xiàn)大部分學(xué)者在鳥(niǎo)聲識(shí)別的分類(lèi)器部分使用的都是RF和SVM,相對(duì)來(lái)說(shuō)使用RF的還是比較多的.

      4.3.1 隨機(jī)森林(RF)

      隨機(jī)森林算法是1種有監(jiān)督的學(xué)習(xí)算法,所謂森林就是決策樹(shù)的組合.它有利于防止過(guò)擬合,訓(xùn)練速度比較快,能夠處理大樣本的數(shù)據(jù),優(yōu)點(diǎn)是訓(xùn)練的參數(shù)比較少,具有較強(qiáng)的抗噪能力.“森林”的構(gòu)建采用的是“bagging(bootstrap aggregating)”方法訓(xùn)練的,也就是在選擇訓(xùn)練樣本的時(shí)候進(jìn)行隨機(jī)有放回的方法,然后再構(gòu)造分類(lèi)器,最后通過(guò)組合所有的分類(lèi)器使得整合后的分類(lèi)效果更好.

      隨機(jī)森林的具體實(shí)現(xiàn)過(guò)程如下:

      1) 隨機(jī)有放回地從訓(xùn)練集中抽取訓(xùn)練樣本作為某棵樹(shù)的訓(xùn)練集,同樣地,在為其他樹(shù)抽取訓(xùn)練樣本時(shí)也抽取相同數(shù)量的樣本作為訓(xùn)練集,以此類(lèi)推,最后每棵樹(shù)都擁有相同數(shù)量但是樣本種類(lèi)不同的訓(xùn)練集,然而樹(shù)與樹(shù)之間卻有重疊的樣本部分.通過(guò)這種抽取方法抽取出樣本后進(jìn)行訓(xùn)練,最終訓(xùn)練完成的樹(shù)會(huì)有不同的分類(lèi)結(jié)果,因?yàn)橛?xùn)練中的樣本有重復(fù)的部分,那么訓(xùn)練后的樹(shù)之間是有相關(guān)性的,這種相關(guān)性使得最終依靠這些樹(shù)進(jìn)行投票表決時(shí)的分類(lèi)結(jié)果更加準(zhǔn)確.

      2) 如果K為每個(gè)樣本的特征維度,k?K,那么在抽取特征的時(shí)候隨機(jī)從K個(gè)特征中抽取k個(gè)特征,然后找出最優(yōu)的特征進(jìn)行樹(shù)的分裂.

      3) 每棵樹(shù)都盡最大程度的生長(zhǎng),并且沒(méi)有剪枝過(guò)程.在過(guò)程1)中的隨機(jī)抽取訓(xùn)練樣本和過(guò)程2)中的隨機(jī)選取子集是影響隨機(jī)森林的分類(lèi)性能的兩個(gè)關(guān)鍵因素.隨機(jī)森林算法能夠防止過(guò)擬合并具有很好的抗噪能力都是由于隨機(jī)抽取樣本和隨機(jī)選取子集的引入,而隨機(jī)森林的最終分類(lèi)效果與特征個(gè)數(shù)k的取值有密切的關(guān)系,所以在使用隨機(jī)森林分類(lèi)器時(shí)選擇k的1個(gè)最優(yōu)值是非常關(guān)鍵的因素.

      對(duì)待測(cè)鳥(niǎo)叫聲樣本進(jìn)行預(yù)處理之后,提取特征,然后將樣本放入訓(xùn)練好的分類(lèi)器進(jìn)行分類(lèi)預(yù)測(cè).用所提取的特征向量遍歷森林中的樹(shù),然后將所有樹(shù)的結(jié)論進(jìn)行多數(shù)投票決定待測(cè)鳥(niǎo)聲的種類(lèi).生成樹(shù)的過(guò)程中是隨機(jī)生成特征進(jìn)行分支的,能夠最小化樹(shù)之間的相關(guān)性,在一定程度上增加了識(shí)別率.

      4.3.2 支持向量機(jī)(SVM)算法

      支持向量機(jī)算法是從樣本中找出1個(gè)最好的分割超平面,將不同類(lèi)別的數(shù)據(jù)完全分割開(kāi),然后最大化距離該平面兩側(cè)最近的樣本,使其能夠較好地泛化,從而對(duì)分類(lèi)問(wèn)題產(chǎn)生良好的泛化能力.

      具體實(shí)現(xiàn)步驟如下: 首先,如果樣本不是線性可分的,就需要用核函數(shù)來(lái)解決這個(gè)問(wèn)題,使樣本空間能夠轉(zhuǎn)換到線性可分的空間.這是因?yàn)槠匠N覀冊(cè)诮鉀Q問(wèn)題的時(shí)候,都是在2維或者低維來(lái)考慮問(wèn)題,但是樣本不是線性可分的話(huà)就會(huì)產(chǎn)生線性不可分的問(wèn)題,此時(shí),使用核函數(shù)就能夠解決這個(gè)問(wèn)題.其次,在高維的樣本空間中找到超平面來(lái)分割樣本,直接映射到高維的空間容易造成計(jì)算的復(fù)雜化,而這種映射方法并不是直接擴(kuò)展到高維的空間,這樣就降低了計(jì)算的復(fù)雜化.然后,在分割的時(shí)候用最大間隔化來(lái)獲取最大間隔線,進(jìn)而得出支持向量,也就是距離分類(lèi)決策面最近的樣本點(diǎn),這些點(diǎn)一般是比較難進(jìn)行分類(lèi)的.最大間隔線可以使得不同的樣本之間的距離最大,這樣,在判斷新的樣本是屬于哪一類(lèi)的時(shí)候就可以直接根據(jù)它位于分割線的哪一側(cè)來(lái)進(jìn)行判斷.最后,在前兩步中得到最大間隔線和支持向量后就可以直接利用這兩個(gè)量來(lái)預(yù)測(cè)新的樣本.

      5 深度學(xué)習(xí)在鳥(niǎo)聲識(shí)別上的應(yīng)用

      深度學(xué)習(xí)是通過(guò)建立深層神經(jīng)網(wǎng)絡(luò),經(jīng)過(guò)連續(xù)的層的學(xué)習(xí)優(yōu)化,來(lái)找到最合適地表征數(shù)據(jù)的方法,這種方法能夠模擬人腦來(lái)對(duì)數(shù)據(jù)進(jìn)行分析、解釋.深度學(xué)習(xí)方法能夠很好地對(duì)數(shù)據(jù)進(jìn)行分類(lèi),因?yàn)樗軌蜃詣?dòng)地獲取并組合表征輸入的特征信息,因此,對(duì)輸入模型的特征分析選取也是非常重要的.

      調(diào)查發(fā)現(xiàn)國(guó)內(nèi)學(xué)者將深度學(xué)習(xí)的方法應(yīng)用到鳥(niǎo)聲識(shí)別領(lǐng)域還是極少的,謝將劍等[17]利用經(jīng)典的VGG16模型,通過(guò)Chirplet變換將鳥(niǎo)鳴聲信號(hào)轉(zhuǎn)變?yōu)檎Z(yǔ)譜圖的形式,從而將音頻的分類(lèi)轉(zhuǎn)變?yōu)閷?duì)圖像的分類(lèi)問(wèn)題,將VGG16模型的softmax層的神經(jīng)元個(gè)數(shù)改為18,最終實(shí)現(xiàn)了對(duì)北京松山國(guó)家級(jí)自然保護(hù)區(qū)18種鳥(niǎo)類(lèi)的識(shí)別,使得識(shí)別的平均準(zhǔn)確率達(dá)到了98.71%.相對(duì)來(lái)說(shuō),國(guó)外學(xué)者在這方面的研究就比較多了,Koops等[18]通過(guò)提取鳥(niǎo)鳴聲信號(hào)的梅爾頻率倒譜系數(shù)(MFCC)及其均值和方差的組合,將其作為輸入到神經(jīng)網(wǎng)絡(luò)中的特征,通過(guò)對(duì)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,最終使得該模型對(duì)于鳥(niǎo)類(lèi)物種識(shí)別的平均準(zhǔn)確率達(dá)到了73%.Tóth等[19]將鳥(niǎo)叫聲信號(hào)轉(zhuǎn)變?yōu)檎Z(yǔ)譜圖,利用經(jīng)典的AlexNet神經(jīng)網(wǎng)絡(luò)模型對(duì)其進(jìn)行改進(jìn),從而實(shí)現(xiàn)對(duì)鳥(niǎo)類(lèi)物種的識(shí)別.雖然國(guó)內(nèi)學(xué)者極少利用深度學(xué)習(xí)的方法來(lái)進(jìn)行鳥(niǎo)聲的分類(lèi),但是國(guó)內(nèi)學(xué)者在提取鳥(niǎo)聲特征方面卻也取得了一些成果.例如陳海蘭等[12]提出多維特征聯(lián)合的鳥(niǎo)類(lèi)鳴聲識(shí)別的方法,這種方法將不同音節(jié)長(zhǎng)度特征與多段式平均頻譜法相結(jié)合,利用鳥(niǎo)聲音頻文件建立標(biāo)準(zhǔn)樣本數(shù)據(jù)庫(kù),并利用模板匹配的方法,將要分辨的鳥(niǎo)聲音節(jié)與標(biāo)準(zhǔn)模板音節(jié)進(jìn)行匹配,最終在濕地常見(jiàn)的17種鳥(niǎo)類(lèi)的識(shí)別中實(shí)現(xiàn)了極高的準(zhǔn)確率.

      6 結(jié)論與展望

      通過(guò)檢索文獻(xiàn),調(diào)查國(guó)內(nèi)學(xué)者在鳥(niǎo)聲識(shí)別領(lǐng)域的研究成果,我們發(fā)現(xiàn)目前國(guó)內(nèi)鳥(niǎo)聲識(shí)別技術(shù)主要集中在傳統(tǒng)機(jī)器學(xué)習(xí)算法的分類(lèi)技術(shù),多是提取鳥(niǎo)叫聲的一些音頻特征,然后利用隨機(jī)森林或者支持向量機(jī)分類(lèi)器進(jìn)行分類(lèi),而國(guó)外Koops等在2014年就已經(jīng)開(kāi)始使用神經(jīng)網(wǎng)絡(luò)進(jìn)行鳥(niǎo)聲分類(lèi),Tóth等使用經(jīng)典的AlexNet模型來(lái)實(shí)現(xiàn)對(duì)鳥(niǎo)聲物種的分類(lèi),同時(shí)國(guó)內(nèi)目前也沒(méi)有比較成型的數(shù)據(jù)庫(kù),所使用的鳥(niǎo)鳴聲樣本種類(lèi)也比較少.在未來(lái)的研究工作中,期望能夠采集更多種類(lèi)的鳥(niǎo)鳴聲樣本進(jìn)行訓(xùn)練,進(jìn)而增加鳥(niǎo)聲識(shí)別的多樣性;隨著深度學(xué)習(xí)算法的迅速發(fā)展,未來(lái)也可以利用深度神經(jīng)網(wǎng)絡(luò)來(lái)提取一些鳥(niǎo)鳴聲的更高級(jí)特征,使用一些深度學(xué)習(xí)的技術(shù)來(lái)對(duì)鳥(niǎo)鳴聲進(jìn)行識(shí)別,或許會(huì)有更好的分類(lèi)效果.

      猜你喜歡
      鳥(niǎo)聲鳥(niǎo)類(lèi)分類(lèi)器
      清晨,我們走在林子里
      草堂(2023年1期)2023-09-25 08:44:48
      善于學(xué)習(xí)的鳥(niǎo)類(lèi)
      學(xué)與玩(2022年9期)2022-10-31 02:54:08
      我的濕地鳥(niǎo)類(lèi)朋友
      文苑(2020年12期)2020-04-13 00:54:14
      七種鳥(niǎo)聲
      江南詩(shī)(2020年1期)2020-02-25 14:12:56
      鳥(niǎo)類(lèi)
      BP-GA光照分類(lèi)器在車(chē)道線識(shí)別中的應(yīng)用
      閑情
      詩(shī)潮(2017年12期)2018-01-08 07:25:20
      鳥(niǎo)類(lèi)的叫聲
      早 晨
      文苑(2016年14期)2016-11-26 23:04:39
      加權(quán)空-譜與最近鄰分類(lèi)器相結(jié)合的高光譜圖像分類(lèi)
      湖北省| 青田县| 清苑县| 万宁市| 苏尼特右旗| 台北市| 许昌市| 万盛区| 汕尾市| 军事| 通许县| 阳东县| 陵川县| 长顺县| 郧西县| 平乐县| 驻马店市| 五原县| 宁远县| 金山区| 夹江县| 隆尧县| 邳州市| 泰安市| 海晏县| 五家渠市| 泰兴市| 乌拉特前旗| 金湖县| 自贡市| 平湖市| 淮阳县| 武宣县| 双桥区| 汽车| 酒泉市| 桐梓县| 柞水县| 四会市| 军事| 大城县|