• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一種新型的特征平滑處理的民樂(lè)音符起始點(diǎn)檢測(cè)算法

      2021-09-23 02:13:14馬連航阮林萍汪萬(wàn)濤
      關(guān)鍵詞:古箏音符音頻

      馬連航,王 軍,阮林萍,汪萬(wàn)濤,文 亮,楊 帆,趙 罡

      (1.中電??导瘓F(tuán)有限公司,浙江 杭州 311100;2.北京調(diào)皮猴科技有限公司,北京 101102)

      1 研究背景

      音符起始點(diǎn)是音樂(lè)特征信息中最基礎(chǔ)的特征,其檢測(cè)任務(wù)是基于內(nèi)容的音樂(lè)信息檢索(Music Information Retrieval,MIR)領(lǐng)域的關(guān)鍵環(huán)節(jié)和基礎(chǔ)性課題,也是高級(jí)音樂(lè)分析任務(wù)(如基頻估計(jì)、節(jié)奏分析、節(jié)拍跟蹤等)的前提[1-2].換言之,音符起始點(diǎn)檢測(cè)的準(zhǔn)確度和精度極大程度地決定了后續(xù)高級(jí)特征檢測(cè)和處理的準(zhǔn)確度上限.目前較為成熟的音符起始點(diǎn)檢測(cè)算法大多借鑒了語(yǔ)音端點(diǎn)檢測(cè)方法[3],并在此基礎(chǔ)上加以改進(jìn),得到適用于音樂(lè)信號(hào)的檢測(cè)方法.

      圖1 一個(gè)音符的時(shí)域信息描述:起始點(diǎn)、上升、過(guò)渡和衰減[2]Fig.1 Temporal description of a note:onset,attack,transient and decay

      從信號(hào)處理的角度來(lái)看,音符起始點(diǎn)(Onset)是指音樂(lè)中某一音符開(kāi)始的時(shí)間,其起始階段能量突然上升(Attack),經(jīng)過(guò)一段過(guò)渡期(Transient)后能量逐漸衰減(Decay),如圖1所示[2].傳統(tǒng)的音符起始點(diǎn)檢測(cè)算法直接或間接地以信號(hào)譜分析為基礎(chǔ)進(jìn)行設(shè)計(jì),需要通過(guò)如短時(shí)傅里葉變換(Short-Time Fourier Transform,STFT)、常數(shù)Q變換(Constant Q Transform,CQT)[4]和小波變換(Wavelet Transform,WT)[5]等信號(hào)變換方法實(shí)現(xiàn)音頻信號(hào)從時(shí)域到頻域的轉(zhuǎn)變;Bello等[6]利用信號(hào)變換輸出的時(shí)譜圖,提取幅度譜和相位譜作為聲學(xué)特征;B?ck等[7-8]為了得到更符合人耳聽(tīng)覺(jué)特性的聲學(xué)特征,使用Mel變換及濾波后的能量譜作為聲學(xué)特征,并有效地提高了檢測(cè)精度.為了加強(qiáng)算法對(duì)音樂(lè)信號(hào)非平穩(wěn)部分的自適應(yīng)能力,Shao等[9]提出了基于匹配追蹤的稀疏分解算法,該算法在MIREX 2013數(shù)據(jù)集上表現(xiàn)效果良好.

      近年來(lái),隨著機(jī)器學(xué)習(xí)在語(yǔ)音識(shí)別方向的應(yīng)用和普及,神經(jīng)網(wǎng)絡(luò)相關(guān)算法也被用于音符起始點(diǎn)的檢測(cè)任務(wù)中,通過(guò)網(wǎng)絡(luò)自主學(xué)習(xí)音樂(lè)信號(hào)與音符起始點(diǎn)的關(guān)系[10-11].實(shí)際上,在MIREX大賽上,以神經(jīng)網(wǎng)絡(luò)模型為基礎(chǔ)的檢測(cè)算法已經(jīng)多次蟬聯(lián)音符起始點(diǎn)檢測(cè)任務(wù)的冠軍.Marolt等[12]在2002年就提出,通過(guò)結(jié)合神經(jīng)網(wǎng)絡(luò)和多個(gè)聽(tīng)覺(jué)濾波器組,可以實(shí)現(xiàn)鋼琴的起始點(diǎn)檢測(cè)任務(wù);Huh[13]將概率模型和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)結(jié)合,對(duì)B?ck數(shù)據(jù)集進(jìn)行起始點(diǎn)檢測(cè).Stasiak等[14-15]使用自相關(guān)函數(shù)及卷積神經(jīng)網(wǎng)絡(luò)作為音頻起始點(diǎn)算法的提取模型;Eyben等[16]利用訓(xùn)練好的循環(huán)神經(jīng)網(wǎng)絡(luò)對(duì)MIREX數(shù)據(jù)集進(jìn)行起始點(diǎn)檢測(cè),獲得同一集合上的最優(yōu)F1值.該模型經(jīng)過(guò)后續(xù)多次迭代和修改,已成為可靠性較高的起始點(diǎn)檢測(cè)算法之一[17-18].

      值得注意的是,盡管目前的音符起始點(diǎn)檢測(cè)算法日益成熟,在各自的數(shù)據(jù)集上都能呈現(xiàn)出較高的F1值,但當(dāng)前國(guó)內(nèi)外關(guān)于音樂(lè)音符起始點(diǎn)檢測(cè)的研究大多數(shù)以西洋樂(lè)為研究對(duì)象,針對(duì)中國(guó)民樂(lè)的研究少之又少,主要原因是缺少高質(zhì)量的帶標(biāo)注的數(shù)據(jù)集.事實(shí)上,民樂(lè)的起始點(diǎn)檢測(cè)更為復(fù)雜.究其原因,一方面在于民樂(lè)中存在大量時(shí)值較短的音符(如十六分音符),其銜接緊密,容易產(chǎn)生能量耦合;另一方面在于民樂(lè)強(qiáng)調(diào)形散神不散,因此民樂(lè)樂(lè)器(如古箏、古琴[19]等)通常利用復(fù)雜的技法和指法(如摁、滑、揉、顫等)使聲音和頻率產(chǎn)生波動(dòng)來(lái)呈現(xiàn)情感的表達(dá),但繁雜的技法會(huì)影響甚至改變音符的起始點(diǎn)特征,其中又以弦樂(lè)類樂(lè)器尤為明顯.所以現(xiàn)有的西洋樂(lè)器起始點(diǎn)檢測(cè)算法難以直接運(yùn)用至民樂(lè)的起始點(diǎn)檢測(cè)任務(wù)上,其挑戰(zhàn)在于設(shè)計(jì)和構(gòu)造適用于民樂(lè)的檢測(cè)算法以及提取和凸顯民樂(lè)的聲學(xué)檢測(cè)特征.

      針對(duì)上述問(wèn)題,本文選取了中國(guó)傳統(tǒng)民族樂(lè)器的代表——古箏作為研究對(duì)象,采集了古箏的部分考級(jí)曲目的音頻,并在專家的指導(dǎo)下對(duì)音符起始點(diǎn)進(jìn)行標(biāo)注,率先構(gòu)建了一個(gè)帶有詳細(xì)標(biāo)簽、包含3 529條記錄的古箏音符起始點(diǎn)數(shù)據(jù)集(曲目目前還在不斷擴(kuò)充中),并在此基礎(chǔ)上搭建了深度卷積神經(jīng)網(wǎng)絡(luò)模型.此外,由于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)特征預(yù)處理方法無(wú)法凸顯古箏音符的起始點(diǎn)特征,本文提出了一種新型的特征平滑處理方法——基于極值篩選的包絡(luò)平滑(Extremum fiLtering based Envelope Smoothing,ELES)方法,首先采用極值篩選的包絡(luò)平滑方法對(duì)訓(xùn)練數(shù)據(jù)的均值和標(biāo)準(zhǔn)差進(jìn)行平滑處理,再經(jīng)過(guò)標(biāo)準(zhǔn)化方法強(qiáng)化起始點(diǎn)特征,隨后送入網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練.結(jié)果顯示采用ELES標(biāo)準(zhǔn)化后的特征數(shù)據(jù)能更加凸顯音符起始點(diǎn)的能量變化特性,更有利于提高模型的分類準(zhǔn)確性.最后通過(guò)實(shí)驗(yàn)驗(yàn)證了本文方法相比于傳統(tǒng)音頻信號(hào)處理方法在準(zhǔn)確度上的優(yōu)越性,以及對(duì)于特殊的古箏技法和連續(xù)十六分音符起始點(diǎn)檢測(cè)的有效性.

      2 新型的特征平滑處理的民樂(lè)音符起始點(diǎn)檢測(cè)算法

      本節(jié)將介紹一種基于新型的特征平滑處理的民樂(lè)音符起始點(diǎn)檢測(cè)算法,首先描述算法的總體流程,然后重點(diǎn)闡述音頻的特征選取和標(biāo)準(zhǔn)化處理方法,最后介紹用于音符起始點(diǎn)檢測(cè)的深度卷積網(wǎng)絡(luò)模型.

      2.1 算法概述

      本方法將音符起始點(diǎn)檢測(cè)任務(wù)建模為一個(gè)有監(jiān)督的二分類問(wèn)題,算法流程如圖2所示.首先,給定一段原始音頻(wav格式),將其進(jìn)行時(shí)頻變換后得到長(zhǎng)度為N的音頻時(shí)譜圖(Spectrogram)X={x1,x2,…,xN}∈N×D.然后,對(duì)時(shí)譜圖中的每一幀xt(t=1,2,…,N)著重進(jìn)行特征選取并采用ELES方法進(jìn)行標(biāo)準(zhǔn)化.最后將特征數(shù)據(jù)(x′t,yt)送入神經(jīng)網(wǎng)絡(luò),其中x′t∈D′(D′

      圖2 音符起始點(diǎn)檢測(cè)算法流程圖Fig.2 Flow chart of note onset detection algorithm

      2.2 特征選取

      設(shè)計(jì)一個(gè)合適的音頻特征表達(dá)方式是眾多音頻信息檢索任務(wù)(如翻唱識(shí)別、主旋律抽取、音樂(lè)流派分類等)最具挑戰(zhàn)性的工作,將合適的特征送入分類器中往往會(huì)得到更好的分類效果.在音頻信號(hào)分析過(guò)程中,通常將一段音頻信號(hào)的1維時(shí)域表示變換為2維的時(shí)域-頻域表示,即時(shí)譜圖.常用的轉(zhuǎn)換方式有STFT、CQT、WT等.本文采用的STFT,因?yàn)槠涓芊磻?yīng)信號(hào)低層次的特征信息.STFT后的時(shí)譜圖記為X={x1,x2,…,xN}∈N×D,每幀的特征數(shù)據(jù)為xt∈D,t=1,2,…,N.

      民樂(lè)樂(lè)器(如古箏、琵琶等)的大多數(shù)音符具有和西洋樂(lè)器(如鋼琴、吉他、貝斯等)相似的特性,其在起始階段會(huì)出現(xiàn)能量激增的過(guò)程.因此對(duì)于一個(gè)屬于音符起始點(diǎn)的幀xt(下文簡(jiǎn)稱為起始幀)來(lái)說(shuō),起始幀之前的p幀,即xt-p,xt-p+1,…,xt-1,每一幀的能量是極其微弱的,而在其之后的q幀,能量則會(huì)呈現(xiàn)突然升高的趨勢(shì).為此,在構(gòu)建起始點(diǎn)檢測(cè)任務(wù)的神經(jīng)網(wǎng)絡(luò)模型時(shí),輸入除了應(yīng)包含當(dāng)前幀xt,還應(yīng)當(dāng)包括其上下文幀的特征數(shù)據(jù).本文選取的特征數(shù)據(jù)為當(dāng)前幀xt及其上下文共8幀(p=4,q=3)的數(shù)據(jù),即xt-4,xt-3,xt-2,xt-1,xt,xt+1,xt+2,xt+3.

      2.3 特征預(yù)處理

      深度神經(jīng)網(wǎng)絡(luò)的初始輸入數(shù)據(jù)通常都需要經(jīng)過(guò)標(biāo)準(zhǔn)化(Standardization)處理.其目的是使每個(gè)維度的特征數(shù)據(jù)取值都在相同的范圍內(nèi),從而使得網(wǎng)絡(luò)模型在訓(xùn)練過(guò)程中更加容易收斂.常用的標(biāo)準(zhǔn)化方法如下:

      (1)

      其中:xi代表第i個(gè)樣本(1≤i≤N);μ和σ分別代表樣本的均值和標(biāo)準(zhǔn)差.標(biāo)準(zhǔn)化后,樣本每個(gè)維度都滿足均值為0、方差為1的高斯分布.

      本文首先按照上述傳統(tǒng)的標(biāo)準(zhǔn)化方法對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理,處理后的起始幀及其上下文幀共8幀的頻譜圖如圖3(a)所示.可以看出頻譜能量隨時(shí)間變化的規(guī)律并不凸顯起始點(diǎn)的特性,且圖中存在較多毛刺和凸起,不利于神經(jīng)網(wǎng)絡(luò)的分類.為此,我們提出了ELES方法,對(duì)訓(xùn)練數(shù)據(jù)的均值μ和標(biāo)準(zhǔn)差σ進(jìn)行平滑化,然后采用平滑后的均值與標(biāo)準(zhǔn)差進(jìn)行輸入數(shù)據(jù)的標(biāo)準(zhǔn)化處理.經(jīng)過(guò)ELES標(biāo)準(zhǔn)化后的起始幀及其上下文幀共8幀的頻譜圖如圖3(b)所示,可以發(fā)現(xiàn)圖中的頻譜能量較為集中,過(guò)濾了大多數(shù)的毛刺與凸起,且前4幀能量較低,后4幀能量則逐漸升高,符合音符起始點(diǎn)的能量變化規(guī)律.

      圖3 采用傳統(tǒng)標(biāo)準(zhǔn)化方法(a)和經(jīng)過(guò)ELES方法標(biāo)準(zhǔn)化(b)后的頻譜圖對(duì)比Fig.3 Comparison of spectrogram by using traditional standardization (a)and ELES standardization methods (b)橫坐標(biāo)表示時(shí)間上連續(xù)的8幀,包括起始幀(圖中兩條虛線之間)和其上下文幀(前4幀和后3幀),縱坐標(biāo)表示能量值.

      圖4 訓(xùn)練數(shù)據(jù)的均值μ采用ELES方法平滑前后的變化圖Fig.4 The chart of the mean μ before and after adopting ELES approach on training data

      圖4(見(jiàn) 第318頁(yè))展示了訓(xùn)練數(shù)據(jù)的均值μ在采用ELES方法前后的變化,如圖所示,均值μ沿著能量的包絡(luò)進(jìn)行平滑,過(guò)濾了多數(shù)小的毛刺與凸起.ELES方法的偽代碼如下所示:

      輸入:特征數(shù)據(jù)的均值矢量μ={μ1,μ2,…,μD}∈D.

      輸出:平滑后的均值矢量μ′∈D.

      1:遍歷矢量μ中的每一個(gè)點(diǎn),找出其中的極大值點(diǎn)子序列μmax.極大值點(diǎn)定義為該點(diǎn)是序列中前后共m個(gè)點(diǎn)中的最大值點(diǎn);

      2:遍歷序列μmax中的每一個(gè)點(diǎn),找到其中的極小值點(diǎn),并將其從序列中刪除.極小值點(diǎn)定義為該值是序列前后共n個(gè)點(diǎn)中的最小值.

      3:重復(fù)2的過(guò)程,直到極大值序列μmax中找不到極小值點(diǎn).

      4:采用插值擬合方法,用一條平滑曲線擬合最終的極大值序列μmax中的所有點(diǎn).

      5:輸出擬合后的曲線即為平滑后的均值矢量.

      算法首先從均值向量μ∈D的序列中找到能量極高點(diǎn)序列μmax(第1行,參數(shù)選取為m=5),然后不斷迭代刪除極高點(diǎn)序列μmax中的能量極小值(第2行,參數(shù)選取為n=3).最后通過(guò)插值擬合,用一條平滑曲線將μmax中的點(diǎn)連接起來(lái)(第4行),該曲線即為平滑后的最終均值矢量μ′(第5行).標(biāo)準(zhǔn)差σ的平滑過(guò)程與均值μ相同.最后訓(xùn)練數(shù)據(jù)時(shí),每一幀特征數(shù)據(jù)都使用平滑后的均值μ′與標(biāo)準(zhǔn)差σ′,采用式(1)進(jìn)行標(biāo)準(zhǔn)化.

      2.4 卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)

      圖5 本文卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)圖Fig.5 Architecture of our convolutional neural network

      本文所采用的CNN架構(gòu)借鑒了文獻(xiàn)[18]的思路,由2個(gè)卷積層、2個(gè)池化層和2個(gè)全連接層組成,如圖5所示.采用CNN的原因是對(duì)于整首曲子而言,音符的起始點(diǎn)實(shí)際是一個(gè)時(shí)序上的局部特征,起始幀的能量與上下文幀有密切關(guān)系,且起始幀在一首曲子中的多個(gè)時(shí)間點(diǎn)上發(fā)生,因此采用卷積的思想可以很好地捕捉到這種時(shí)序上的局部特征,同時(shí)減少網(wǎng)絡(luò)的參數(shù)量.為避免低頻噪聲干擾,過(guò)濾了STFT后512個(gè)頻率子帶中的前40個(gè)子帶,因此網(wǎng)絡(luò)的輸入是2維的時(shí)譜圖(8幀×472個(gè)頻率子帶,頻率覆蓋范圍約為200~2 800 Hz),通過(guò)大小為4×3的卷積核后得到10個(gè)5×470大小的特征映射圖,再通過(guò)窗口大小為1×3的最大池化層后,將每個(gè)特征映射圖的維度縮減為5×156.第2個(gè)卷積層的卷積核大小為3×3,最大池化層窗口大小為1×3,得到20個(gè)大小為3×51的特征映射圖.最后將其送入包含256個(gè)神經(jīng)元的全連接層,輸出層只有一個(gè)神經(jīng)元,以sigmoid函數(shù)的輸出判斷是否為音符起始點(diǎn).

      3 實(shí) 驗(yàn)

      為了驗(yàn)證基于CNN的音符起始點(diǎn)檢測(cè)算法的準(zhǔn)確性,本節(jié)將本文所提算法與基于音頻信號(hào)處理的音符起始點(diǎn)檢測(cè)算法進(jìn)行比較.同時(shí),為了驗(yàn)證基于ELES標(biāo)準(zhǔn)化方法的可靠性,將其與采用不同幀數(shù)(4幀上下文)和不同標(biāo)準(zhǔn)化(傳統(tǒng)標(biāo)準(zhǔn)化方法)的特征預(yù)處理方法進(jìn)行對(duì)比.最后進(jìn)行了本文算法對(duì)于連續(xù)的十六分音符以及古箏的特殊技法音符的準(zhǔn)確性測(cè)試.

      3.1 實(shí)驗(yàn)設(shè)置

      實(shí)驗(yàn)所釆用的古箏演奏音頻的原始數(shù)據(jù)均釆集于無(wú)噪音環(huán)境中,共包含10首一至二級(jí)的古箏考級(jí)曲目.原始音頻經(jīng)過(guò)STFT后得到時(shí)頻特征表達(dá),STFT使用的參數(shù)如下:音頻釆樣率(Sampling rate)=44 100 Hz,窗函數(shù)釆用漢寧(Hanning)窗,窗函數(shù)大小(window_length)=8 192(約為186 ms),步長(zhǎng)(hopsize)=1 024(約為23 ms).經(jīng)過(guò)專家指導(dǎo)后進(jìn)行人工標(biāo)注,共得到1 777個(gè)音符起始點(diǎn)和1 752個(gè)非起始點(diǎn)的數(shù)據(jù).

      訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)的過(guò)程中,使用其中的7首曲目當(dāng)做訓(xùn)練集(包括1 267個(gè)起始點(diǎn)和1 242個(gè)非起始點(diǎn)),3首當(dāng)作測(cè)試集(《關(guān)山月》包含98個(gè)起始點(diǎn)和98個(gè)非起始點(diǎn),《孟姜女》包含193個(gè)起始點(diǎn)和193個(gè)非起始點(diǎn),《北京的金山上》包含219個(gè)起始點(diǎn)和219個(gè)非起始點(diǎn)).網(wǎng)絡(luò)模型的初始學(xué)習(xí)率為0.05,每5輪驗(yàn)證損失不下降則學(xué)習(xí)率除以5,優(yōu)化方法為動(dòng)量梯度下降法,初始動(dòng)量為0.9,批次(Batch)大小為1 024,釆用Early stopping策略和5折交叉驗(yàn)證方法,損失函數(shù)為二分類交叉熵?fù)p失.

      3.2 準(zhǔn)確性比較實(shí)驗(yàn)

      本節(jié)首先比較了不同幀數(shù)的上下文特征數(shù)據(jù)以及不同標(biāo)準(zhǔn)化方法的算法性能,其中8幀的上下文特征數(shù)據(jù)包括需分類的當(dāng)前幀及其前4幀和后3幀,4幀的上下文特征數(shù)據(jù)包括需分類的當(dāng)前幀及其前2幀和后1幀,在3首測(cè)試曲目上的結(jié)果如表1所示.可以看岀釆用8幀上下文加上ELES標(biāo)準(zhǔn)化方法后的特征數(shù)據(jù)在測(cè)試集的3首曲子中都獲得了最高的F1值.原因有二:其一,4幀的上下文數(shù)據(jù)的時(shí)間維度太短,包含的特征信息量可能不夠,而8幀上下文的特征數(shù)據(jù)更能準(zhǔn)確地反應(yīng)音符起始點(diǎn)在時(shí)間上的特性;其二,經(jīng)過(guò)ELES方法平滑后的標(biāo)準(zhǔn)化過(guò)程能夠過(guò)濾掉大量能量上較小的毛刺和凸起,使得音符起始點(diǎn)的特征更加明顯.

      表1 本文方法與基于音頻信號(hào)處理的方法的對(duì)比實(shí)驗(yàn)結(jié)果Tab.1 Performance comparision between our approach and the methods based on audio signal processing

      隨后,將本文方法與基于音頻信號(hào)處理的音符起始點(diǎn)檢測(cè)算法SF(Spectral Flux)[8]進(jìn)行了對(duì)比,結(jié)果見(jiàn)表1.從表1中可以看岀,本文方法的F1值遠(yuǎn)遠(yuǎn)高于傳統(tǒng)的SF算法的.原因是音符的起始點(diǎn)是一個(gè)時(shí)序上的局部特征,而CNN的卷積層擅長(zhǎng)處理的正是局部特性,通過(guò)不斷訓(xùn)練優(yōu)化,模型具有準(zhǔn)確抓取局部特征的強(qiáng)大能力,在計(jì)算機(jī)視覺(jué)領(lǐng)域的成功應(yīng)用也驗(yàn)證了這一特性.

      3.3 連續(xù)十六分音符和特殊演奏技法實(shí)驗(yàn)

      為了驗(yàn)證本文方法在檢測(cè)連續(xù)十六分音符和帶有古箏技法的音符起始點(diǎn)的有效性,本節(jié)選取連續(xù)十六分音符段落(包含125個(gè)起始點(diǎn))、大撮(41個(gè)起始點(diǎn))、顫音或揉音(51個(gè)起始點(diǎn))、上滑音(25個(gè)起始點(diǎn))等技法音符起始點(diǎn),以及部分技法音符尾音中帶有能量包絡(luò)的非起始點(diǎn)(156個(gè)非起始點(diǎn))進(jìn)行測(cè)試.評(píng)價(jià)指標(biāo)為準(zhǔn)確率(Accuracy)λA,定義為:

      檢測(cè)連續(xù)十六分音符的難點(diǎn)在于其每個(gè)音符的持續(xù)時(shí)間較短,且兩個(gè)音符連接緊密.前一個(gè)十六分音符的能量很可能會(huì)影響到后一個(gè)十六分音符的能量,導(dǎo)致后一個(gè)十六分音符的起始點(diǎn)特性不明顯(如圖6(a)(見(jiàn) 第320頁(yè))所示).顫音、上滑音等技法的音符尾音中常包含小的能量波形包絡(luò),其能量變化規(guī)律與起始點(diǎn)十分類似(如圖6(b)(見(jiàn) 第320頁(yè))所示),易被誤分類為起始點(diǎn).

      實(shí)驗(yàn)結(jié)果如表2所示,可見(jiàn)本文方法對(duì)連續(xù)十六分音符以及特殊技法的音符起始點(diǎn)檢測(cè)的準(zhǔn)確率都高于96%,特別是對(duì)于大撮技法檢測(cè)的準(zhǔn)確率能達(dá)到100%,對(duì)易被誤分類的非起始點(diǎn)的檢測(cè)準(zhǔn)確率也達(dá)到了96%以上.

      圖6 (a)十六分音符的起始點(diǎn)波形圖和(b)尾音中包含低能量波形包絡(luò),易被誤分類的非起始點(diǎn)Fig.6 (a)Waveforms of onsets of continuous semiquaver notes and (b)non-onsets of the notes having small energy envelopes in the tail

      表2 連續(xù)的十六分音符和帶有特殊技法的音符起始點(diǎn)和尾音上非起始點(diǎn)檢測(cè)的準(zhǔn)確性Tab.2 Accuracy of our approach on continuous semiquaver notes and notes with special playing techniques,as well as non-onsets of ending notes

      4 結(jié) 語(yǔ)

      針對(duì)缺乏高質(zhì)量的帶標(biāo)注的民樂(lè)數(shù)據(jù)集問(wèn)題,本文于國(guó)內(nèi)率先構(gòu)建了一個(gè)帶標(biāo)簽的包含3 529條記錄的古箏音符起始點(diǎn)數(shù)據(jù)集.同時(shí)提岀了一種新型特征平滑處理方法ELES,解決了傳統(tǒng)標(biāo)準(zhǔn)化預(yù)處理過(guò)程無(wú)法凸顯音符起始點(diǎn)聲學(xué)特征的問(wèn)題.實(shí)驗(yàn)驗(yàn)證了本文方法相比于傳統(tǒng)音頻信號(hào)處理方法在檢測(cè)準(zhǔn)確度上的優(yōu)越性,以及對(duì)于特殊的古箏技法和連續(xù)十六分音符起始點(diǎn)檢測(cè)的有效性.后續(xù)我們將持續(xù)采集古箏演奏音頻并加以標(biāo)注,同時(shí)不斷改進(jìn)特征選取和標(biāo)準(zhǔn)化處理過(guò)程.

      猜你喜歡
      古箏音符音頻
      我終于會(huì)彈古箏了
      一串快樂(lè)的音符
      春天的音符
      必須了解的音頻基礎(chǔ)知識(shí) 家庭影院入門(mén)攻略:音頻認(rèn)證與推薦標(biāo)準(zhǔn)篇
      基于Daubechies(dbN)的飛行器音頻特征提取
      電子制作(2018年19期)2018-11-14 02:37:08
      第一次彈古箏
      小布老虎(2017年1期)2017-07-18 10:57:28
      音頻分析儀中低失真音頻信號(hào)的發(fā)生方法
      電子制作(2017年9期)2017-04-17 03:00:46
      古箏
      寶藏(2017年2期)2017-03-20 13:16:45
      我的古箏之旅
      音符(兩首)
      和田县| 蓬溪县| 城固县| 芦山县| 武鸣县| 孟津县| 山西省| 博野县| 平罗县| 湖南省| 高淳县| 同心县| 新河县| 柳州市| 鄂托克旗| 保山市| 阿鲁科尔沁旗| 神木县| 靖远县| 巢湖市| 凤山县| 苗栗县| 池州市| 大新县| 阿克苏市| 兴化市| 成武县| 都江堰市| 交城县| 北安市| 博爱县| 廉江市| 察隅县| 温泉县| 手游| 遂昌县| 平湖市| 武夷山市| 安远县| 亳州市| 望谟县|