• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      EMD近似熵與支持向量機(jī)在音頻分類處理中的應(yīng)用

      2015-03-03 11:47:19黃紹平何冬康肖立光
      關(guān)鍵詞:家養(yǎng)分類器音頻

      陳 峰,黃紹平,何冬康,肖立光

      (1.湖南工程學(xué)院 電氣信息學(xué)院,湘潭 411101;2.昆明理工大學(xué) 信息工程與自動(dòng)化學(xué)院,昆明 650500)

      參 考 文 獻(xiàn)

      ?

      EMD近似熵與支持向量機(jī)在音頻分類處理中的應(yīng)用

      陳 峰1,黃紹平1,何冬康2,肖立光1

      (1.湖南工程學(xué)院 電氣信息學(xué)院,湘潭 411101;2.昆明理工大學(xué) 信息工程與自動(dòng)化學(xué)院,昆明 650500)

      將動(dòng)物聲音作為音頻源,針對(duì)家養(yǎng)動(dòng)物聲音的非線性、非平穩(wěn)特征和在現(xiàn)實(shí)條件下難以獲取大量動(dòng)物聲音樣本的實(shí)際情況, 提出一種經(jīng)驗(yàn)?zāi)B(tài)分解(EMD )近似熵(ApEn)結(jié)合支持向量機(jī)(SVM)的家養(yǎng)動(dòng)物聲音分類識(shí)別方法.通過EMD方法將非平穩(wěn)的動(dòng)物聲音信號(hào)分解成若干個(gè)平穩(wěn)的固有模態(tài)函數(shù)(IMF); 對(duì)IMF進(jìn)行篩選,計(jì)算所篩選IMF 的近似熵構(gòu)成特征向量;將特征向量輸入SVM 分類器進(jìn)行分類識(shí)別.對(duì)家養(yǎng)動(dòng)物聲音樣本按該方法進(jìn)行測(cè)試,結(jié)果表明,該方法能有效提取聲音特征,在小樣本情況下也具有較高的精度和較強(qiáng)的泛化能力,該方法能有效地應(yīng)用于動(dòng)物聲音的識(shí)別分類.

      經(jīng)驗(yàn)?zāi)B(tài)分解;近似熵;支持向量機(jī);音頻分類

      0 概 述

      聲音信號(hào)是一種非常重要的音頻信號(hào),它本身包含了各種各樣的信息.通過對(duì)聲音的分類處理可以獲得這些信息.研究人員提出了各種音頻信號(hào)分類處理和識(shí)別方法:基于神經(jīng)網(wǎng)絡(luò)的音頻分類技術(shù)[1];基于支持向量機(jī)(SVM)的音頻分類技術(shù);基于高斯混合模型(GMM)的音頻分類和識(shí)別技術(shù);基于隱馬爾可夫模型(HMM)的語音識(shí)別技術(shù)[2].

      本文將家養(yǎng)動(dòng)物聲音作為音頻源,提出了一種家養(yǎng)動(dòng)物聲音分類識(shí)別方法.首先利用EMD將原始信號(hào)分解成有限個(gè)IMF分量,將非平穩(wěn)的聲發(fā)射信號(hào)轉(zhuǎn)變?yōu)槠椒€(wěn)信號(hào),然后對(duì)IMF分量建立近似熵模型,并將模型參數(shù)組成特征向量,最后利用SVM對(duì)家養(yǎng)動(dòng)物聲音信號(hào)進(jìn)行分類.

      1 基本原理與方法

      1.1 EMD方法原理

      EMD方法分解步驟如下:

      (1)求出上下包絡(luò)線的均值m1(t),上下包絡(luò)線上含有信號(hào)x(t)所有的局部極值點(diǎn),它是通過三次樣條線將局部極小值、局部極大值連接起來形成.

      (2)用原始數(shù)據(jù)序列x(t)減去m1(t),得到一個(gè)去掉低頻的新數(shù)據(jù)序列:

      h1(t)=x(t)-m1(t)

      (1)

      根據(jù)IMF必須滿足的2個(gè)條件,判斷h1(t)是否為IMF,若h1(t)不是IMF,則將h1(t)作為新的x(t),重復(fù)執(zhí)行步驟(1)和(2),直到h1(t)滿足IMF條件,記c1(t)=h1(t),c1(t)為原始信號(hào)中頻率最高的IMF分量.

      (3)計(jì)算x(t)與c1(t)的殘差 :

      r(t)=x(t)-c1(t)

      (2)

      將r(t)作為新的x(t),重復(fù)步驟(1)和(2)計(jì)算過程,依次得到c2(t),c3(t),…直到cn(t)或r(t)滿足給定的終止條件時(shí),篩選結(jié)束.經(jīng)過EMD分解之后的原始信號(hào)x(t)被分解為 個(gè)基本模式分量和一個(gè)殘差的和:

      (3)

      為了準(zhǔn)確有效地把握原始信號(hào)的特征信息,需要對(duì)IMF分量ci(t)和殘余項(xiàng)r(t)進(jìn)行合理的分析.殘余分量能夠反映原始信號(hào)的中心趨勢(shì),而按照頻率由高到低分解出來的IMF分量c1(t)、c2(t),…,cn(t)能夠突顯出原始信號(hào)的局部特征.這兩個(gè)分量都是經(jīng)過EMD運(yùn)算而來.

      1.2 近似熵算法

      近似熵算法步驟如下:

      步驟1:設(shè)原始信號(hào)為N點(diǎn)的時(shí)間序列u=

      [u(1),u(2),…,u(N)],N為數(shù)據(jù)長(zhǎng)度,按順序構(gòu)造m維矢量X(i)=[u(1),u(i+1),…,u(i+m-1] 和X(j)=[u(1),u(j+1),…,(j+m-1)],其中i,j≤N-m+1.

      步驟2 :計(jì)算矢量X(i)和X(j)之間的距離:

      d[x(i),x(j)]=

      max[|u(i+k-1)-u(j+k-1)|]

      k=1,2,…,m

      (4)

      步驟3:給定閥值r,對(duì)于每一個(gè)i≤N-m+1統(tǒng)計(jì)d[x(i),x(j)]≤r的數(shù)目,計(jì)算近似矢量個(gè)數(shù)與矢量的比值.

      其中j≤N-m+1.

      (5)

      (6)

      步驟5:對(duì)m+1,重復(fù)步驟(1) (4),得到φm+1(r).

      步驟6:該序列的近似熵值為:ApEn(m,r,N)=φm(r)-φm+1(r)

      (7)

      顯然,近似熵值與維數(shù)m,閥值r和數(shù)據(jù)值N有關(guān),Pincus等指出,當(dāng)m=2,r-0.1~0.2SD(SD為原始數(shù)據(jù)u(i)標(biāo)準(zhǔn)差) ,近似熵對(duì)N依賴最低,具有最合理統(tǒng)計(jì)特性.

      1.3 支持向量機(jī)分類算法

      SVM是處理有限學(xué)習(xí)樣本的有效工具.設(shè)線性可分樣本集為(xi,yj)(i=1,2,…,n;x∈Rd,y∈{-1,1} 是類別標(biāo)號(hào)),d維空間中線性判別函數(shù)的一般形式為:g(x)=w·x+b,分類面方程為:

      w·x+b=0

      (8)

      將判別函數(shù)歸一化,然后等比例調(diào)節(jié)系數(shù)w和b,使兩類所有樣本都能滿足|g(x)|≥1,這時(shí)分類器間隔為2/‖w‖.這樣將求間隔最大變?yōu)榍蟆瑆‖最小.

      滿足‖g(w)‖的樣本點(diǎn),離分類線(平面)距離最小.它們決定了最優(yōu)分類線(平面),稱之為支持向量,最優(yōu)分類面的問題即轉(zhuǎn)化為優(yōu)化問題:

      s.t.yi[(w·xi+b)]-1≥0,(i=1,2,…,n)

      (9)

      (10)

      為敘述和求解的方便,將上式改寫成矩陣形式:

      s.tαi≥0,(i=1,2,…,n)

      (11)

      yTα=0

      其中,

      α=(α1α2,…,αn)T,b=(1,1,…,1)T,

      y=(y1,y2,…,yn)

      Aij=yiyj(xi·xj)

      由此可得到最優(yōu)分類函數(shù)為:

      (12)

      因?yàn)閷?duì)于非支持向量滿足αi=0,所以最優(yōu)函數(shù)只需對(duì)支持向量進(jìn)行,而b*可根據(jù)任何一個(gè)支持向量的約束條件求出.支持向量機(jī)的體系結(jié)構(gòu)如圖1所示.

      圖1 支持向量機(jī)的體系結(jié)構(gòu)

      2 實(shí)驗(yàn)數(shù)據(jù)

      實(shí)驗(yàn)用到的家養(yǎng)動(dòng)物聲音主要來自文獻(xiàn)[3-4],將每個(gè)聲音文件轉(zhuǎn)換為采樣率為11025 Hz,聲道數(shù)為l的WAV格式,然后再把它們分割成間隔為3 s的聲音片段,最后得到的聲音數(shù)據(jù)庫如表1所示.

      表1 家養(yǎng)動(dòng)物聲音數(shù)據(jù)庫

      3 家養(yǎng)動(dòng)物聲音信號(hào)分析

      3.1 動(dòng)物聲音信號(hào)的預(yù)處理

      以田園犬和蘆花雞聲音信號(hào)為例,采用時(shí)間局部性好, 能量集中度高的db6 小波對(duì)其預(yù)處理, 消噪前后的太湖鵝、田園犬和蘆花雞聲音信號(hào)分別如圖2、圖3和圖4所示.

      圖2 原始太湖鵝聲音信號(hào)和消澡后的太湖鵝聲音信號(hào)

      圖3 原始田園犬聲音信號(hào)和消澡后的聲音信號(hào)

      圖4 蘆花雞聲音信號(hào)和消澡后的聲音信號(hào)

      3.2 聲音信號(hào)的特征提取

      對(duì)經(jīng)小波消噪的動(dòng)物聲音信號(hào)采用EMD方法分解得到n重IMF分量Ci(r)(i= 1,2,…,n),每個(gè)IMF分量都包含了不同的特征尺度信息,如小波消噪后的太湖鵝、田園犬和蘆花雞聲音信號(hào)經(jīng)EMD分解后分別得到7個(gè)IMF分量和一個(gè)殘余分量,如圖5、圖6和圖7所示.

      圖5 太湖鵝聲音信號(hào)EMD分解

      圖6 田園犬聲音信號(hào)EMD分解

      圖7 蘆花雞聲音信號(hào)EMD分解

      分別對(duì)上述9類家養(yǎng)動(dòng)物進(jìn)行EMD分解,并計(jì)算前5個(gè)IMF分量的近似熵,表2為其中每類家養(yǎng)動(dòng)物的其中3種動(dòng)物IMF分量的近似熵,讓其作為SVM的輸入特征向量記為X=X(x1,x2,x3,x4,x5).

      表2 家養(yǎng)動(dòng)物聲音信號(hào)近似熵

      表2中,馬類和牛類的聲音信號(hào)近似熵極為相似,但各IMF分量的近似熵情況卻并不一樣,我們可以清楚地看到IMF4 ,IMF5特征分量與第一個(gè)分量相差較明顯,即此分辨率對(duì)信號(hào)本質(zhì)特性的反映非常明顯,說明此分量上的平穩(wěn)性非常顯著.

      3.3 支持向量機(jī)識(shí)別網(wǎng)絡(luò)

      本文選用二叉樹SVM為分類器,因?yàn)樗膬?yōu)勢(shì)是重復(fù)訓(xùn)練樣本少[5].IMF1-IMF5 的近似熵值為二叉樹SVM訓(xùn)練網(wǎng)絡(luò)的輸入向量,向量X=(X1,X2,X3…,X9)9種相對(duì)應(yīng)的輸出類型y為1,2,3,…,9,建立8個(gè)分類器按最優(yōu)分類函數(shù)進(jìn)行分類.要選好徑向基核函數(shù)(Radial basic function, RBF),因?yàn)楹撕瘮?shù)的好壞直接影響分類器的性能.徑向基核函數(shù)決定模型的復(fù)雜性和訓(xùn)練誤差主要是兩個(gè)參數(shù),Gamma和懲罰因子C.驗(yàn)證Gamma和懲罰因子C這兩個(gè)參數(shù)的性能非常重要,本文采用舍一交叉驗(yàn)證法(n-fold cross validation),目的就是為了得到最優(yōu)的分類器.具體的做法是,針對(duì)每一個(gè)參數(shù)對(duì)(Gamma,C),交叉驗(yàn)證差不多進(jìn)行20次,而該參數(shù)對(duì)的指標(biāo)就取這20次測(cè)試結(jié)果的平均值.最終的最優(yōu)參數(shù)對(duì)訓(xùn)練分類器就采用指標(biāo)最高的一組參數(shù)對(duì),然后再測(cè)試未知樣本.按照上述方法進(jìn)行試驗(yàn),發(fā)現(xiàn)分類準(zhǔn)確率達(dá)到最高時(shí)的參數(shù)對(duì)(Gamma ,C)為(2,2).

      4 實(shí)驗(yàn)結(jié)果

      為驗(yàn)證方法的有效性,對(duì)包含9種家養(yǎng)動(dòng)物聲音信號(hào)的2760個(gè)樣本.將他們建立模型,進(jìn)行訓(xùn)練.具體做法是對(duì)每組數(shù)據(jù)進(jìn)行EMD分解,并求取前5個(gè)分量的近似熵,作為SVM訓(xùn)練網(wǎng)絡(luò)的輸入向量,建立起我們需要的模型.測(cè)試二叉樹SVM分類器就是訓(xùn)練過程中采用測(cè)試集樣本數(shù)比例和訓(xùn)練集樣本數(shù)不同的兩種方案,為了提升結(jié)果的準(zhǔn)確性,需對(duì)實(shí)驗(yàn)重復(fù)20遍后取均值.實(shí)驗(yàn)軟件平臺(tái)為Microsoft windows XP下的Matlab7.1版本,算法運(yùn)行時(shí)間是通過Matlab程序提供的'tic.toc'獲得.取每類樣本特征向量中的40組作為訓(xùn)練樣本,余下20組作為測(cè)試樣本,即1840組特征向量用于訓(xùn)練并構(gòu)建分類器,另外920組用于測(cè)試分類器準(zhǔn)確性;訓(xùn)練分類器時(shí),選用徑向基核函數(shù),gamma參數(shù)為0.015,懲罰因子C為2.SVM,訓(xùn)練樣本如圖8所示[6].

      圖8 SVM訓(xùn)練樣本

      5 結(jié) 論

      提出將基于EMD 近似熵理論與SVM分類模型相結(jié)合的家養(yǎng)動(dòng)物聲音分類識(shí)別問題, 經(jīng)實(shí)驗(yàn)研究得出以下結(jié)論:

      (1)SVM網(wǎng)絡(luò)建模具有建模簡(jiǎn)單,模型更加精確等優(yōu)點(diǎn).

      (2) EMD 算法能自適應(yīng)地將非平穩(wěn)信號(hào)逐級(jí)分解,且各IMF分量體現(xiàn)原數(shù)據(jù)的局部特征,實(shí)現(xiàn)家養(yǎng)動(dòng)物類型特征的分離,從而能有效地反映聲音信號(hào)的本質(zhì)信息.

      (3) 近似熵具有很強(qiáng)的表征信號(hào)不規(guī)則性和復(fù)雜性的能力,通過比較EMD分解各IMF分量的近似熵,可以得到不同動(dòng)物類型信號(hào)在不同尺度下變化的不規(guī)則性,從而有效地提取動(dòng)物類別特征,為聲音識(shí)別分類提供依據(jù).

      參 考 文 獻(xiàn)

      [1] Freeman G,Dony R D,Areibi S M.Audio Environment Classication for Hearing Aids Using Artificial Neural Networks with Windowed Input[C]//Computational Intelligence in Image and Signal Processing,2007:183-188.

      [2] Nakamura S,Kumatani K,Tamura S.Multi-modal Temporal Asynchronicity Modeling by Product HMMs for Robust Audio-visual Speech Recognition[C]//Proceedings of the 4th IEEE International Conference on Multimodal Interfaces,2002:305-309.

      [3] Sound net of Princeton University[EB/OL].http://soundnet.cs.Princeton.edu/OMLA/.

      [4] The Freesound Project[EB/OL].http://www.freesound.org/index.php.

      [5] 朱學(xué)冬,胡 平. 基于最優(yōu)二叉樹的多故障分類器的設(shè)計(jì)[J].北京聯(lián)合大學(xué)學(xué)報(bào)(自然科學(xué)版),2009,23(2):26-29.

      [6] 宋知用.MATLAB在語音信號(hào)分析與合成中的應(yīng)用[M].北京:北京航空航天大學(xué)出版社,2013:53-59.

      Application of EMD Approximate Entropy and Support Vector Machine Method in Processing Audio Classification

      CHEN Feng1,HUANG Shao-ping1, HE Dong-kang2, XIAO Li-guang1

      (1.College of Elect.&Information Engineering,Hunan Institute of Engineering,Xiangtan 411101, China;2.Faculty of Information Engineering and Automation,Kunming University of Science and Technology, Kunming 650500, China)

      In this paper, animal sounds are used as the audio source. According to the non-stationary and non-linear characteristics of domesticated animal voice and the situation in which it`s hard to obtain enough sound samples,a domesticated animal voice diagnosis method based on Empirical Mode Decomposition(EMD), Approximate Entropy(ApEn),and Support Vector Machine(SVM) is proposed. Firstly, the domesticated animal signals are decomposed into a finite number of intrinsic mode function(IMF).Then, the ApEns of five IMFs filtered are used to form eigenvectors. Finally, the eigenvectors are put into a support vector machine categorizer . The results of animal data experimental recognition show that this method has high accuracy and good generalization abilities even in the case of small number of samples.The approach proposed can identify the domesticated animal voice effectively.

      Empirical Mode Decomposition(EMD); Approximate Entropy(ApEn); Support Vector Machine(SVM); audio classification

      2015-03-31

      陳 峰(1990-),男,碩士研究生,研究方向:電力電子與電力傳動(dòng).

      TP273+.5

      A

      1671-119X(2015)03-0001-05

      猜你喜歡
      家養(yǎng)分類器音頻
      必須了解的音頻基礎(chǔ)知識(shí) 家庭影院入門攻略:音頻認(rèn)證與推薦標(biāo)準(zhǔn)篇
      基于Daubechies(dbN)的飛行器音頻特征提取
      電子制作(2018年19期)2018-11-14 02:37:08
      看!這些家養(yǎng)植物,賞心悅目但要小心
      BP-GA光照分類器在車道線識(shí)別中的應(yīng)用
      音頻分析儀中低失真音頻信號(hào)的發(fā)生方法
      電子制作(2017年9期)2017-04-17 03:00:46
      加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
      結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
      Pro Tools音頻剪輯及修正
      人間(2015年8期)2016-01-09 13:12:42
      雞吃石子的秘密
      我家的小烏龜
      桃园市| 师宗县| 磐石市| 中西区| 通许县| 太白县| 绩溪县| 蓬莱市| 珠海市| 乌什县| 泾源县| 溧阳市| 屯留县| 陆河县| 随州市| 威远县| 从化市| 铜川市| 宁晋县| 金塔县| 平乐县| 环江| 钟山县| 安平县| 彩票| 辽源市| 民勤县| 石狮市| 浙江省| 吉木萨尔县| 辉县市| 惠州市| 安丘市| 潜山县| 宁波市| 娱乐| 通海县| 龙井市| 东阳市| 黄梅县| 化州市|