• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一種基于RBF神經(jīng)網(wǎng)絡(luò)的漢語(yǔ)耳語(yǔ)音轉(zhuǎn)化為正常語(yǔ)音的方法

      2018-01-18 09:13:26王海燕

      王海燕

      摘要:針對(duì)漢語(yǔ)耳語(yǔ)音特征參數(shù)較正常語(yǔ)音發(fā)生變化而導(dǎo)致的可懂度和清晰度較差的問(wèn)題,提出了采用能夠以任意精度逼近連續(xù)函數(shù)的RBF神經(jīng)網(wǎng)絡(luò)建立漢語(yǔ)耳語(yǔ)音到正常語(yǔ)音的頻譜包絡(luò)映射關(guān)系,用以修正漢語(yǔ)耳語(yǔ)音的線譜對(duì)參數(shù)的方法。實(shí)驗(yàn)結(jié)果表明采用本文方法的漢語(yǔ)耳語(yǔ)音MOS得分為3.6,頻譜失真距離變小,可懂度和清晰度得到了較大的提高。

      關(guān)鍵詞:RBF;漢語(yǔ)耳語(yǔ)音;線譜對(duì)參數(shù)

      中圖分類(lèi)號(hào):TN912 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2018)09-0049-03

      耳語(yǔ)音是一種特別的發(fā)音模式,發(fā)音的主要特點(diǎn)是聲帶不振動(dòng),沒(méi)有基頻,聲級(jí)低。耳語(yǔ)音轉(zhuǎn)換在禁止大聲喧嘩的場(chǎng)所、移動(dòng)通訊通話質(zhì)量提高、國(guó)家安全部門(mén)語(yǔ)音識(shí)別系統(tǒng)升級(jí)、公安法院語(yǔ)音破譯以及電子人工喉音質(zhì)改進(jìn)等方面具有非常重要的應(yīng)用價(jià)值。

      目前,對(duì)耳語(yǔ)音轉(zhuǎn)換的研究主要有:粟學(xué)麗[1]等人使用相對(duì)熵法作為耳語(yǔ)音識(shí)別和轉(zhuǎn)換的預(yù)處理來(lái)重建正常語(yǔ)間,改善了語(yǔ)音的音質(zhì),但是轉(zhuǎn)換時(shí)延較長(zhǎng);黃程[2]等人提出了使用混合激勵(lì)線性預(yù)測(cè)法實(shí)現(xiàn)漢語(yǔ)耳語(yǔ)音重建為正常語(yǔ)音,語(yǔ)音轉(zhuǎn)換的自然度有待改善;Morris.R.w[3]等人提出譜修正法實(shí)現(xiàn)了耳語(yǔ)音的轉(zhuǎn)換,但重建后的語(yǔ)音帶有明顯的失真,使得轉(zhuǎn)換后的語(yǔ)音有較強(qiáng)的金屬音質(zhì)。

      本方法將漢語(yǔ)耳語(yǔ)音和正常語(yǔ)音韻母部分的線譜對(duì)參數(shù),通過(guò)RBF網(wǎng)絡(luò)訓(xùn)練得到漢語(yǔ)耳語(yǔ)音到正常語(yǔ)音的線譜對(duì)參數(shù)轉(zhuǎn)換模型,通過(guò)轉(zhuǎn)換模型修正漢語(yǔ)耳語(yǔ)音的線譜對(duì)參數(shù);然后將修正好的漢語(yǔ)耳語(yǔ)音的線譜對(duì)參數(shù)和正常語(yǔ)音基頻平均值,輸入到線譜對(duì)參數(shù)合成器中進(jìn)行漢語(yǔ)耳語(yǔ)音韻母的轉(zhuǎn)換;最后將轉(zhuǎn)換后的清音和韻母結(jié)合,輸出目標(biāo)語(yǔ)音。

      1 漢語(yǔ)耳語(yǔ)音的特點(diǎn)

      耳語(yǔ)音發(fā)音時(shí)聲門(mén)保持半開(kāi)的狀態(tài)使得聲道增加了氣管和肺的部分,聲道傳輸函數(shù)隨之發(fā)生相應(yīng)改變,從而導(dǎo)致耳語(yǔ)音的共振峰發(fā)生偏移。

      耳語(yǔ)音的清輔音部分與正常語(yǔ)音的發(fā)音方式基本沒(méi)有區(qū)別,但是元音部分卻有明顯的差異。正常語(yǔ)音的元音是由準(zhǔn)周期脈沖激勵(lì),含有明顯的基音頻率。耳語(yǔ)音的聲源為噪聲源,聲帶不振動(dòng),故耳語(yǔ)音的元音沒(méi)有基頻。而漢語(yǔ)的聲調(diào)識(shí)別與韻律合成控制都與基頻有關(guān),漢語(yǔ)耳語(yǔ)音[4]的聲母和韻母的特征差異不大,導(dǎo)致漢語(yǔ)耳語(yǔ)音的聲韻較難分割,使得耳語(yǔ)音的可懂度和清晰度變差。

      2 RBF神經(jīng)網(wǎng)絡(luò)在耳語(yǔ)音轉(zhuǎn)換中的應(yīng)用

      RBF[5](Radial basis function)神經(jīng)網(wǎng)絡(luò)是種高效的單隱含層前饋式網(wǎng)絡(luò),能以任意精度逼近任何非線性連續(xù)函數(shù)。RBF網(wǎng)絡(luò)由輸入層、隱含層和輸出層組成。隱含層以高斯函數(shù)exp[-(b(x-w))2]為核函數(shù)。其中x是自變量,即輸入的很多值,b代表高斯函數(shù)的寬度即1/2σ2(σ為方差)。W為輸入權(quán)重,決定高斯函數(shù)的中心點(diǎn)。輸出結(jié)果是一組很平滑的小數(shù),在特定的輸入值w處具有最大exp的函數(shù)值,輸入離這個(gè)特定的值越遠(yuǎn),輸出就成指數(shù)下降。

      RBF網(wǎng)絡(luò)要學(xué)習(xí)的參數(shù)為基函數(shù)的中心和方差以及隱含層與輸出層間的權(quán)值。本文采用自組織選取中心法,將中心和權(quán)值的確定分為兩步:一是自組織學(xué)習(xí)階段,即學(xué)習(xí)和的階段;二是有監(jiān)督學(xué)習(xí)階段,即學(xué)習(xí)輸出層權(quán)值的階段。

      (1)學(xué)習(xí)中心。自組織學(xué)習(xí)過(guò)程用到的聚類(lèi)算法是K-均值聚類(lèi)算法。假設(shè)聚類(lèi)中心有個(gè)(的值由先驗(yàn)知識(shí)決定),設(shè)(=1,2,…,),是第n次迭代時(shí)基函數(shù)的中心,K一均值聚類(lèi)算法的具體步驟如下:

      ①始化聚類(lèi)中心,即根據(jù)經(jīng)驗(yàn)從訓(xùn)練樣本集中隨機(jī)選取個(gè)不同的樣本作為初始中心,(=1,2,…),設(shè)置迭代步數(shù)n=0。

      ②隨機(jī)輸入選練樣本。

      ③尋找訓(xùn)練樣本拖離哪個(gè)中心最近,即找到使其滿足,,式中,是第n次迭代時(shí)基函數(shù)的第i個(gè)中心。

      ④調(diào)整中心,用式:

      3 系統(tǒng)結(jié)構(gòu)

      本文在分析了漢語(yǔ)耳語(yǔ)音發(fā)音特點(diǎn)的基礎(chǔ)上,利用RBF神經(jīng)網(wǎng)絡(luò)建立了一個(gè)漢語(yǔ)耳語(yǔ)音與正常語(yǔ)音的頻譜映射關(guān)系,通過(guò)已訓(xùn)練的RBF神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換漢語(yǔ)耳語(yǔ)音的頻譜,使用LSP參數(shù)合成器轉(zhuǎn)化為正常語(yǔ)音。系統(tǒng)的處理方法如圖1所示:

      (1)神經(jīng)網(wǎng)絡(luò)訓(xùn)練階段:首先對(duì)漢語(yǔ)耳語(yǔ)音和正常語(yǔ)音進(jìn)行端點(diǎn)檢測(cè);然后分別對(duì)漢語(yǔ)耳語(yǔ)音和正常語(yǔ)音進(jìn)行聲韻分割,并分別對(duì)漢語(yǔ)耳語(yǔ)音、正常語(yǔ)音的韻母部分進(jìn)行預(yù)處理和LSP的提?。恢髮h語(yǔ)耳語(yǔ)音的韻母線LSP作為輸入信號(hào),正常語(yǔ)音的韻母線LSP作為導(dǎo)師信號(hào),進(jìn)行RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練,得到漢語(yǔ)耳語(yǔ)音與正常語(yǔ)音的頻譜包絡(luò)映射關(guān)系。

      (2)轉(zhuǎn)換階段:首先對(duì)漢語(yǔ)耳語(yǔ)音進(jìn)行端點(diǎn)檢測(cè);然對(duì)漢語(yǔ)耳語(yǔ)音進(jìn)行聲韻分割以及提取漢語(yǔ)耳語(yǔ)音韻母部LSP;使用訓(xùn)練好的RBF神經(jīng)網(wǎng)絡(luò)模型修正漢語(yǔ)耳語(yǔ)音的LSP;以正常語(yǔ)音的基頻平均值作為基音頻率生成語(yǔ)音的激勵(lì)源;把激勵(lì)源以及轉(zhuǎn)換后的LSP參數(shù)輸入到LSP參數(shù)合成器進(jìn)行漢語(yǔ)耳語(yǔ)音韻母部分的轉(zhuǎn)換;最后將轉(zhuǎn)換后的語(yǔ)音韻母部分和清音部分連接,輸出正常語(yǔ)音。

      4 實(shí)驗(yàn)結(jié)果與分析

      4.1 仿真結(jié)果

      本實(shí)驗(yàn)選取了采樣率為I0KHz、16bit的wav格式音頻文件,然后對(duì)漢語(yǔ)耳語(yǔ)音進(jìn)行如下處理:(1)使用線性預(yù)測(cè)法(LPC)轉(zhuǎn)換漢語(yǔ)耳語(yǔ)音;(2)使用同態(tài)信號(hào)處理法轉(zhuǎn)換漢語(yǔ)耳語(yǔ)音;(3)使用本文方法轉(zhuǎn)換漢語(yǔ)耳語(yǔ)音。圖2圖3為“酥打”的正常語(yǔ)音和分別由以上三種方法轉(zhuǎn)換后語(yǔ)音的時(shí)域波形圖和語(yǔ)譜圖。

      4.2 轉(zhuǎn)換耳語(yǔ)音質(zhì)量評(píng)價(jià)

      對(duì)三種方法轉(zhuǎn)換后的語(yǔ)音進(jìn)行了平均MOS主觀評(píng)分法和LSP失真測(cè)度、板倉(cāng)—齋田譜失真度測(cè)度、Mel頻率倒譜系數(shù)失真測(cè)度、巴克譜失真距離測(cè)度四種頻域客觀評(píng)價(jià)法[6][7],表1給出了幾種方法的評(píng)價(jià)結(jié)果。仿真實(shí)驗(yàn)結(jié)果顯示使用本文方法轉(zhuǎn)換的耳語(yǔ)音譜失真距離減小,在可懂度和音質(zhì)方面都達(dá)到了滿意的效果,見(jiàn)表1。

      5 結(jié)語(yǔ)

      為此本文結(jié)合線譜對(duì)參數(shù)合成器以及RBF神經(jīng)網(wǎng)絡(luò)建立了一個(gè)耳語(yǔ)音轉(zhuǎn)換的系統(tǒng):首先使用RBF神經(jīng)網(wǎng)絡(luò)捕獲漢語(yǔ)耳語(yǔ)音、正常語(yǔ)音頻譜包絡(luò)的映射關(guān)系;轉(zhuǎn)換時(shí),使用已訓(xùn)練好的RBF神經(jīng)網(wǎng)絡(luò)將漢語(yǔ)耳語(yǔ)音的頻譜做非線性映射產(chǎn)生轉(zhuǎn)換頻譜,最后通過(guò)LSP參數(shù)合成器轉(zhuǎn)換為正常語(yǔ)音。主觀以及客觀評(píng)價(jià)表明使用此方法轉(zhuǎn)換的漢語(yǔ)耳語(yǔ)音效果比較令人滿意。本文方法在轉(zhuǎn)換前首先需要建立一個(gè)漢語(yǔ)耳語(yǔ)音到正常語(yǔ)音的頻譜映射關(guān)系。因此本方法只適用于特定人的轉(zhuǎn)換。另外轉(zhuǎn)換后語(yǔ)音的可懂度仍偏低,效果也不及正常語(yǔ)音自然。

      參考文獻(xiàn)

      [1]粟學(xué)麗,丁慧,徐柏齡.基于熵函數(shù)的耳語(yǔ)音聲韻分割法[J].聲學(xué)學(xué)報(bào) Vol.30,NO.1 Jan,2005.

      [2]Cheng Huang ,Xing Yue Tao, Liang Tao.Reconstruction of Whisper in Chinese by Modified MELP [J].ICCSE,14-17 July 2012.Melbourne,Australia Pp:349-353.

      [3]R.WMorris,M.A.Clements.Reconstruction of speech from whispers[J].Medical Engineering &Physics.2002;,24(8):5 1 5-520.

      [4]J.J.Guo,P.B.Lull.Selecting input factors for clusters of Gaussian radial basis functionnetworks to improve market clearing priceprediction[J].IEEE Transactions on PowerSystems,2003,18(2):665-672.

      [5]王麗麗.基于RBF神經(jīng)網(wǎng)絡(luò)函數(shù)擬合方法的仿真與研究[J].河北農(nóng)機(jī).2016,11:61-63.

      [6]陳雪勤,趙鶴鳴.有效高斯分量通用背景模型下耳語(yǔ)音聲道系統(tǒng)轉(zhuǎn)換研究[J].聲學(xué)學(xué)報(bào),2013,38(2):195-200.

      [7]周健,魏昕,梁瑞宇,趙力.聯(lián)合時(shí)頻域中增強(qiáng)后耳語(yǔ)音的可懂度評(píng)估[J].東南大學(xué)學(xué)報(bào):英文版,2014,30(3):261-266.

      阳原县| 佛山市| 河间市| 治县。| 奎屯市| 嵊州市| 准格尔旗| 湘乡市| 剑河县| 大城县| 花垣县| 双桥区| 扎赉特旗| 苏尼特左旗| 永兴县| 临颍县| 赤壁市| 大邑县| 家居| 临潭县| 开鲁县| 衡水市| 兴义市| 佛学| 嘉黎县| 台南县| 五常市| 平和县| 鹤壁市| 徐州市| 梁山县| 宁波市| 嫩江县| 游戏| 贡嘎县| 开阳县| 晴隆县| 鹤壁市| 苍溪县| 师宗县| 大英县|