• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于DNN的說(shuō)話人無(wú)關(guān)單通道錄音分離

      2018-12-14 12:00:40徐海青吳立剛浦正國(guó)
      福建茶葉 2018年12期
      關(guān)鍵詞:單通道檢測(cè)器錄音

      徐海青,吳立剛,浦正國(guó),韓 濤

      (安徽繼遠(yuǎn)軟件有限公司,安徽合肥 230000)

      1 引言

      基于客服中心的業(yè)務(wù)需求,智能客服的概念被隨之提出,隨著“互聯(lián)網(wǎng)+”、大數(shù)據(jù)、深度學(xué)習(xí)等技術(shù)的發(fā)展,智能錄音技術(shù)與大數(shù)據(jù)、云計(jì)算、人工智能結(jié)合應(yīng)用,可以使用海量的數(shù)據(jù)對(duì)錄音識(shí)別的聲學(xué)模型、語(yǔ)言模型進(jìn)行不間斷的訓(xùn)練,同時(shí)采用內(nèi)存計(jì)算、流計(jì)算等技術(shù)處理數(shù)據(jù)轉(zhuǎn)寫(xiě),將會(huì)大大提升智能錄音技術(shù)識(shí)別率,提高錄音數(shù)據(jù)的轉(zhuǎn)寫(xiě)速度。但是目前客服中心的錄音工單都是單通道,其錄音識(shí)別的正確率受到很大影響,需要對(duì)單通道的錄音分離技術(shù)重點(diǎn)研究。在單通道錄音分離問(wèn)題中,神經(jīng)網(wǎng)絡(luò)(DNN、RNN)被用來(lái)探索目標(biāo)信號(hào)與干擾信號(hào)之間的非線性關(guān)系以及使用深度集成學(xué)習(xí)和學(xué)習(xí)上下文相關(guān)信息,即多上下文網(wǎng)絡(luò),被發(fā)表在張小雷、王德良的研究工作中,體現(xiàn)深度學(xué)習(xí)方法對(duì)于獨(dú)立說(shuō)話人無(wú)關(guān)的單通道語(yǔ)音分離問(wèn)題的優(yōu)勢(shì)[1-5]。

      本文假定說(shuō)話人模型的i-vector距離直接影響說(shuō)話人聚類(lèi)的效果,通過(guò)實(shí)驗(yàn)也證明了這個(gè)假設(shè),同時(shí)天然地將男性和女性說(shuō)話人聚成兩類(lèi),并進(jìn)一步的分別將男性和女性說(shuō)話人聚成兩個(gè)子類(lèi),從而用來(lái)處理同性說(shuō)話人混合的情況;通過(guò)擴(kuò)展說(shuō)話人相關(guān)的DNN解決說(shuō)話人無(wú)關(guān)問(wèn)題,進(jìn)而提出了說(shuō)話人無(wú)關(guān)的單通道錄音分離算法。

      2 基于深度神經(jīng)網(wǎng)絡(luò)的說(shuō)話人無(wú)關(guān)錄音分離系統(tǒng)

      本文的設(shè)計(jì)基于DNN的錄音分離系統(tǒng)主要是解決單通道的錄音分離問(wèn)題,為此,本文設(shè)計(jì)的系統(tǒng)存在兩個(gè)階段:前期的模型訓(xùn)練以及錄音分離。系統(tǒng)的過(guò)程如圖1所示,在訓(xùn)練階段,主要是利用提取的錄音對(duì)數(shù)功率譜特征訓(xùn)練聚類(lèi)模型(通過(guò)說(shuō)話人i-vector模型[5]距離的大小實(shí)現(xiàn)說(shuō)話人的聚類(lèi))和基于聚類(lèi)結(jié)果訓(xùn)練不同的DNN分離模型;在分離階段,先是構(gòu)造未知說(shuō)話人測(cè)試集,并將提取的特征送入說(shuō)話人組合檢測(cè)器,然后根據(jù)檢測(cè)器的判斷結(jié)果選擇對(duì)應(yīng)的分離器處理該混合錄音數(shù)據(jù)。

      圖1 未知說(shuō)話人的錄音分離系統(tǒng)

      3 實(shí)驗(yàn)結(jié)果

      3.1 實(shí)驗(yàn)配置

      3.1.1 SSC數(shù)據(jù)庫(kù)

      本文的測(cè)試和訓(xùn)練集合都是采用基于SSC數(shù)據(jù)庫(kù)(Coookie and Lee,2006)中的錄音數(shù)據(jù)來(lái)構(gòu)造的。

      (1)訓(xùn)練集。在訓(xùn)練階段需要訓(xùn)練分離器和檢測(cè)器,前者使用200小時(shí)混合錄音,后者使用100小時(shí)的混合錄音數(shù)據(jù),數(shù)據(jù)分布如表1所示。

      表1 訓(xùn)練數(shù)據(jù)集

      (2)測(cè)試集。由于數(shù)據(jù)集中說(shuō)話人有限,從M1,M2,F(xiàn)1,F(xiàn)2四個(gè)子類(lèi)中分別挑選了3個(gè)說(shuō)話人生成測(cè)試集,保證了測(cè)試集的說(shuō)話人的不可預(yù)測(cè)性,具體如表2所示。

      表2 測(cè)試數(shù)據(jù)集

      (3)DNN訓(xùn)練。設(shè)定初始學(xué)習(xí)率為0.1,在前10次的迭代訓(xùn)練中學(xué)習(xí)率保持不變,再以學(xué)習(xí)率衰減0.1方式進(jìn)行40次迭代訓(xùn)練,訓(xùn)練集是包含128個(gè)樣本的最小批。DNN包含3個(gè)具有2048個(gè)節(jié)點(diǎn)的隱層,使用sigmoid激活函數(shù),輸入層為1700多個(gè)節(jié)點(diǎn),輸出層為514個(gè)節(jié)點(diǎn)。

      3.2 實(shí)驗(yàn)結(jié)果分析

      3.2.1 說(shuō)話人組合檢測(cè)結(jié)果

      通過(guò)數(shù)據(jù)的測(cè)試,為了選擇合適的檢測(cè)器,基于包含40句男性和40女性的混合錄音開(kāi)發(fā)集,測(cè)試GMM-UBM、CDNN、RDNN檢測(cè)器在相應(yīng)門(mén)限值的范圍內(nèi)?? [0.1,0.9],?? [ 0.59,0.69]和??[8,16]的檢測(cè)性能,結(jié)果如圖2所示。

      由圖中可以發(fā)現(xiàn)基于開(kāi)發(fā)集的RDNN最優(yōu)檢測(cè)率為94.73%,GMMUBM檢測(cè)器為79.14%、CDNN檢測(cè)器為92.0%,RDNN檢測(cè)器的檢測(cè)效果最好?;跍y(cè)試集,檢測(cè)率變化情況類(lèi)似。RDNN檢測(cè)器也是最優(yōu)的高達(dá)94.75%。

      3.2.2 錄音分離結(jié)果

      在這一部分,通過(guò)在STOI指標(biāo)和PESQ指標(biāo)上對(duì)比基于DNN的說(shuō)話人無(wú)關(guān)錄音分離系統(tǒng)和經(jīng)典的CASA。

      異性說(shuō)話人混合錄音分離結(jié)果:在表3中,對(duì)比了基于DNN的說(shuō)話人無(wú)關(guān)錄音分離系統(tǒng)和CASA系統(tǒng)分離異性說(shuō)話人時(shí)的PESQ和STOI結(jié)果。雖然RDNN檢測(cè)器存在一定的檢測(cè)錯(cuò)誤,但是對(duì)于這部分錯(cuò)誤檢測(cè)的語(yǔ)句使用不匹配的分離器進(jìn)行分離以后,最終的整體結(jié)果在所有的輸入信噪比條件下仍然要比CASA系統(tǒng)要好很多。

      表3 PESQ和STOI結(jié)果對(duì)比表

      4 結(jié)論

      本文提出的基于DNN的單通道錄音分離系統(tǒng),能夠?qū)崿F(xiàn)無(wú)先驗(yàn)信息的情況下單通道錄音的角色分離。本文在構(gòu)建檢測(cè)器時(shí),通過(guò)對(duì)比高斯混合-通用背景模型、分類(lèi)深度神經(jīng)網(wǎng)絡(luò)檢測(cè)器和多輸出回歸深度神經(jīng)網(wǎng)絡(luò)檢測(cè)器三種檢測(cè)器的性能,選擇了性能最優(yōu)的RCNN檢測(cè)器。并在本文的最后實(shí)驗(yàn)證明了在對(duì)比STOI指標(biāo)和PESQ指標(biāo)上基于DNN的分離系統(tǒng)的分離效果優(yōu)于比經(jīng)典CASA系統(tǒng)。

      猜你喜歡
      單通道檢測(cè)器錄音
      Listen and Paint, etc.
      基于聯(lián)合聚類(lèi)分析的單通道腹部心電信號(hào)的胎心率提取
      Funny Phonics
      車(chē)道微波車(chē)輛檢測(cè)器的應(yīng)用
      Colorful Seasons多彩四季
      A New Term
      基于擴(kuò)頻碼周期性的單通道直擴(kuò)通信半盲分離抗干擾算法
      一種霧霾檢測(cè)器的研究與設(shè)計(jì)
      采用6.25mm×6.25mm×1.8mm LGA封裝的雙通道2.5A、單通道5A超薄微型模塊穩(wěn)壓器
      一體化火焰檢測(cè)器常見(jiàn)故障分析
      河南科技(2014年22期)2014-02-27 14:18:12
      武川县| 达孜县| 双牌县| 平和县| 新和县| 屏东市| 久治县| 沾益县| 西和县| 红安县| 体育| 九江县| 阿尔山市| 寻甸| 烟台市| 邛崃市| 衢州市| 武平县| 都匀市| 平山县| 兴城市| 辰溪县| 确山县| 赣榆县| 岳阳县| 辛集市| 铜陵市| 普宁市| 筠连县| 峡江县| 丰县| 高唐县| 长沙县| 泌阳县| 临海市| 德昌县| 黎平县| 隆子县| 成武县| 台北县| 枝江市|