趙婕
(陜西工業(yè)職業(yè)技術(shù)學(xué)院 信息工程學(xué)院, 陜西 咸陽 712000)
音樂可以給人們帶來精神上的享受,消除人們身體和精神疲勞,減輕工作上的壓力,由于電子技術(shù)不斷地發(fā)展,一些專業(yè)人員通過電子設(shè)備進(jìn)行電子音樂的合成,產(chǎn)生了大量的電子音樂,給人們提供了更多的音樂欣賞素材,但是由于每一個(gè)人對(duì)電子音樂都有自己的偏好,如老年人喜歡聽一些旋律比較慢的古典音樂,而年輕人喜歡聽一些快節(jié)奏的搖滾音樂,因此幫助人們對(duì)電子音樂進(jìn)行有效辨識(shí),給他們提供最適合的電子音樂具有十分重要的意義[1-3]。
由于國(guó)內(nèi)外學(xué)者們的重視,當(dāng)前有許多類型的電子音樂辨識(shí)方法,其中人工神經(jīng)網(wǎng)絡(luò)的電子音樂辨識(shí)方法最多,如回聲狀態(tài)網(wǎng)絡(luò)的電子音樂辨識(shí)方法,BP神經(jīng)網(wǎng)絡(luò)的電子音樂辨識(shí)方法,RBF神經(jīng)網(wǎng)絡(luò)的電子音樂辨識(shí)方法、極限學(xué)習(xí)機(jī)的電子音樂辨識(shí)方法等,由于人工神經(jīng)網(wǎng)絡(luò)的工作原理與人腦的神經(jīng)網(wǎng)絡(luò)工作原理相似,可以模擬人腦對(duì)電子音樂進(jìn)行辨識(shí),電子音樂辨識(shí)效果較好,其中BP神經(jīng)網(wǎng)絡(luò)的實(shí)際應(yīng)用范圍最為廣泛[4-6]。在實(shí)際應(yīng)用過程中,BP神經(jīng)網(wǎng)絡(luò)還有許多難題沒有得到有效的解決,如BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)不穩(wěn)定,使得電子音樂辨識(shí)效果極不穩(wěn)定,可信度比較低,導(dǎo)致電子音樂辨識(shí)效率低,而且學(xué)習(xí)速率采用經(jīng)驗(yàn)方式隨機(jī)確定,使得電子音樂辨識(shí)誤差比較大[7-9]。
針對(duì)神經(jīng)網(wǎng)絡(luò)在電子音樂辨識(shí)過程中存在的參數(shù)優(yōu)化問題,為了改善電子音樂辨識(shí)結(jié)果,提高電子音樂辨識(shí)精度,提出了改進(jìn)神經(jīng)網(wǎng)絡(luò)的電子音樂辨識(shí)方法,采用自適應(yīng)遺傳算法快速、有效地尋找最優(yōu)的參數(shù),使得神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)達(dá)到最優(yōu),測(cè)試結(jié)果表明,改進(jìn)神經(jīng)網(wǎng)絡(luò)的電子音樂辨識(shí)精度高、速度快,具有十分明顯的優(yōu)越性。
由于BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力強(qiáng),與電子音樂辨識(shí)過程具有較強(qiáng)的相似性,標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)常采用3層結(jié)構(gòu),如圖1所示[10]。
電子音樂辨識(shí)特征為x1,x2,…,xm,其直接作為BP神經(jīng)網(wǎng)絡(luò)的輸入,那么其相應(yīng)的輸出為式(1)。
(1)
隱含層的輸入、輸出分別為式(2)、式(3)。
(2)
(3)
輸出層的輸入、輸出分別為式(4)、式(5)。
(4)
(5)
采用電子音樂辨識(shí)誤差作為BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練目標(biāo),BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程實(shí)際就是不斷對(duì)隱含層和輸出層的連接權(quán)值進(jìn)行調(diào)整,使電子音樂辨識(shí)誤差朝最小化方向發(fā)展,如式(6)、式(7)。
(6)
(7)
式中,η為學(xué)習(xí)速率。
參數(shù)學(xué)習(xí)速率η直接影響B(tài)P神經(jīng)網(wǎng)絡(luò)的隱含層和輸出層的連接權(quán)值確定的優(yōu)劣。η越大,隱含層和輸出層的連接權(quán)值變化量比較大,使得BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)速度快,但是過大,可能使得BP神經(jīng)網(wǎng)絡(luò)出現(xiàn)過擬合現(xiàn)象,即學(xué)習(xí)精度降低;而η越小,隱含層和輸出層的連接權(quán)值變化量比較緩慢,BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)速度慢,影響學(xué)習(xí)效率。當(dāng)前主要通過經(jīng)驗(yàn)方式確定η,難以獲得理想的BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)效果,為此本文采用自適應(yīng)遺傳算法確定參數(shù)學(xué)習(xí)速率η的值,在加快BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速度的同時(shí),提高BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)精度。
遺傳算法的性能與交叉概率(Pc)和變異概率(Pm)直接相關(guān),標(biāo)準(zhǔn)遺傳算法的交叉概率和變異概率采用固定方式,在其運(yùn)行過程中是一個(gè)常量,難以產(chǎn)生優(yōu)異的后代個(gè)體,使得遺傳算法易限入局部最優(yōu)解,因此本文采用自適應(yīng)遺傳算法,其交叉概率和變異概率隨著進(jìn)化代數(shù)的變化而變化,這樣不斷產(chǎn)生優(yōu)秀個(gè)體,避免限入局部最優(yōu)解。自適應(yīng)遺傳算法的Pc和Pm變化曲線如圖2所示。
圖2 交叉變異概率變化曲線
自適應(yīng)遺傳算法的Pc和Pm的計(jì)算式,如式(8)、式(9)。
(8)
(9)
式中,fmax和favg分別為適應(yīng)度函數(shù)的最大值和平均值;f′為交叉后較優(yōu)個(gè)體的適應(yīng)度函數(shù)值;f為變異后的個(gè)體適應(yīng)度函數(shù)值;ki為0—1范圍的常數(shù)。
本文采用電子音樂信號(hào)的短時(shí)能量特征、時(shí)域方差特征進(jìn)行電子音樂辨識(shí),它們提取步驟具體如下。
Step1:Em為電子音樂信號(hào){y(n)}的能量,那么其短時(shí)能量計(jì)算如式(10)。
(10)
式中,c(m)為電子音樂信號(hào)的滑動(dòng)窗,電子音樂信號(hào)幀長(zhǎng)度是N。
Step2:電子音樂信號(hào)可以劃分為N幀,即可以表示為Yt(n)={yt(n,1),yt(n,2),…,yt(n,N)},計(jì)算電子音樂時(shí)域的均值Ei(n)和方差Di(n),如式(11)、式(12)。
(11)
(12)
Step1:采集電子音樂信號(hào),并對(duì)其進(jìn)行去噪處理,以提高電子音樂信號(hào)的信噪比。
Step2:從去噪后的電子音樂信號(hào)中提取短時(shí)能量特征、時(shí)域方差特征,并對(duì)它們進(jìn)行歸一化處理,如式(13)。
(13)
式中,feature(i)表示第i個(gè)特征。
Step3:對(duì)于每一種電子音樂信號(hào),選擇比較重要的特征進(jìn)行建模。
Step4:根據(jù)電子音樂信號(hào)的重要特征數(shù)量和電子音樂的類型數(shù)量確定BP神經(jīng)網(wǎng)絡(luò)的輸入和輸出節(jié)點(diǎn)的數(shù)量。
Step5:根據(jù)一定的規(guī)則,確定電子音樂信號(hào)辨識(shí)的BP神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)的數(shù)量。
Step6:采用自適應(yīng)遺傳算法確定BP神經(jīng)網(wǎng)絡(luò)參數(shù)學(xué)習(xí)速率η的值。
Step7:BP神經(jīng)網(wǎng)絡(luò)對(duì)電子音樂信號(hào)訓(xùn)練樣本進(jìn)行學(xué)習(xí),建立最優(yōu)的電子音樂信號(hào)辨識(shí)模型。
為驗(yàn)證改進(jìn)神經(jīng)網(wǎng)絡(luò)的電子音樂辨識(shí)效果,選擇當(dāng)前最流行的10類種電子音樂作為實(shí)驗(yàn)對(duì)象,而且對(duì)于每一類電子音樂,采集不同數(shù)量的電子音樂樣本,如表1所示。
表1 10種電子音樂的樣本數(shù)量
由于電子音樂的類型不同,那么其特征數(shù)量應(yīng)該不同,因此提取不同的電子音樂特征,并選擇比較重要的特征進(jìn)行電子音樂辨識(shí),得到的重要特征數(shù)量如表2所示。
表2 10種電子音樂的重要特征數(shù)量
為了驗(yàn)證本文對(duì)神經(jīng)網(wǎng)絡(luò)改進(jìn)的有效性,選擇傳統(tǒng)神經(jīng)網(wǎng)絡(luò)進(jìn)行電子音樂辨識(shí)對(duì)比實(shí)驗(yàn),傳統(tǒng)神經(jīng)網(wǎng)絡(luò)采用經(jīng)驗(yàn)方式確定其參數(shù),改進(jìn)神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的電子音樂辨識(shí)精度和時(shí)間,如圖3、圖4所示。
圖3 與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的電子音樂辨識(shí)精度對(duì)比
圖4 與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的電子音樂辨識(shí)速度對(duì)比
從圖3和圖4可以看出,無論是電子音樂辨識(shí)精度或者是電子音樂辨識(shí)速度,改進(jìn)神經(jīng)網(wǎng)絡(luò)均要明顯優(yōu)于傳統(tǒng)神經(jīng)網(wǎng)絡(luò),這是因?yàn)楦倪M(jìn)神經(jīng)網(wǎng)絡(luò)引入自適應(yīng)遺傳算法解決了參數(shù)優(yōu)化的難題,能夠獲得更優(yōu)的神經(jīng)網(wǎng)絡(luò),建立了高精度的電子音樂辨識(shí)模型,而且加快了電子音樂辨識(shí)速度,在相同時(shí)間可以辨識(shí)更多的電子音樂辨識(shí)樣本,這樣可以降低電子音樂辨識(shí)成本,實(shí)際應(yīng)用價(jià)值更高。
為了進(jìn)一步測(cè)試改進(jìn)神經(jīng)網(wǎng)絡(luò)的電子音樂辨識(shí)的優(yōu)越性,選擇當(dāng)前經(jīng)典電子音樂辨識(shí)方法進(jìn)行對(duì)比實(shí)驗(yàn),具體為:隱馬爾可夫模型的電子音樂辨識(shí)方法[11]、支持向量機(jī)的電子音樂辨識(shí)方法[12],所有方法的電子音樂辨識(shí)精度如圖5所示。
圖5 與經(jīng)典電子音樂辨識(shí)方法的精度對(duì)比
從圖5可以看出,相對(duì)于支持向量機(jī)、隱馬爾可夫模型,改進(jìn)神經(jīng)網(wǎng)絡(luò)的電子音樂辨識(shí)精度均有了不同程度的得升,這表明改進(jìn)神經(jīng)網(wǎng)絡(luò)可以有效減少電子音樂辨識(shí)錯(cuò)誤率,能夠準(zhǔn)確辯識(shí)各種電子音樂,改進(jìn)神經(jīng)網(wǎng)絡(luò)可以解決當(dāng)前電子音樂辨識(shí)方法存在的弊端,獲得了更加理想的電子音樂辨識(shí)結(jié)果。
支持向量機(jī)、隱馬爾可夫模型、改進(jìn)神經(jīng)網(wǎng)絡(luò)的電子音樂辨識(shí)時(shí)間變化情況,如圖6所示。
圖6 與經(jīng)典電子音樂辨識(shí)方法的速度對(duì)比
對(duì)圖6的電子音樂辨識(shí)時(shí)間進(jìn)行對(duì)比可以清楚看出,相對(duì)于支持向量機(jī)、隱馬爾可夫模型,改進(jìn)神經(jīng)網(wǎng)絡(luò)的電子音樂辨識(shí)時(shí)間明顯減少,改進(jìn)神經(jīng)網(wǎng)絡(luò)的電子音樂辨識(shí)時(shí)間復(fù)雜度明顯降低,提高了電子音樂辨識(shí)效率,電子音樂辨識(shí)速度得到了明顯的改善。
為了改善電子音樂的辨識(shí)精度,針對(duì)當(dāng)前神經(jīng)網(wǎng)絡(luò)存在的缺陷,提出了改進(jìn)神經(jīng)網(wǎng)絡(luò)的電子音樂辨識(shí)方法,并與其它方法進(jìn)行了電子音樂辨識(shí)仿真實(shí)驗(yàn),通過對(duì)仿真實(shí)驗(yàn)結(jié)果分析可以發(fā)現(xiàn),改進(jìn)神經(jīng)網(wǎng)絡(luò)的電子音樂辨識(shí)精度高,不僅錯(cuò)誤率要小于其它電子音樂辨識(shí)方法,而且電子音樂辨識(shí)速度快,具有十分廣泛的應(yīng)用前景。