• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      融合上下文短時(shí)譜特征的漢語重音檢測(cè)研究

      2014-04-29 00:44:03趙云雪張瓏鄭世杰
      關(guān)鍵詞:重音

      趙云雪 張瓏 鄭世杰

      摘要:重音是語言交流中不可或缺的部分,在語言交流中扮演著非常重要的角色。本文基于ASCCD朗讀語篇語料庫,使用MFCC算法提取每個(gè)語音段的融合上下文子段拼接短時(shí)譜信息,構(gòu)建基于MFCC算法的上下文短時(shí)譜特征集;并選用NaiveBayes分類器對(duì)這類特征集進(jìn)行建模,而且將具有最大后驗(yàn)概率的類作為該對(duì)象所屬的類,這種分類方法充分利用了當(dāng)前語音段的相關(guān)語音特性;融合上下文的MFCC短時(shí)譜特征組在ASCCD上能夠得到83.6%的漢語重音檢測(cè)正確率。實(shí)驗(yàn)結(jié)果證明,融合上下文子段拼接特征規(guī)整方法可以用于漢語重音檢測(cè)研究中。

      關(guān)鍵詞:重音; 上下文; 短時(shí)譜特征; 重音檢測(cè)

      中圖分類號(hào):TP319 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2095-2163(2014)04-0036-03

      Abstract:Accent is a critically important component of spoken communication, and plays a very important role in spoken communication. This paper selects from ASCCD corpus and conducts accent by using MFCC algorithm to extract each voice segment of short-time spectrum based on context sub-segment splicing information. After that, the paper builds integration context short-time spectrum feature sets based on MFCC algorithm, and chooses NaiveBayes classifier to model the two feature sets. NaiveBayes is to choose the classes with maximum a posteriori probability as the object's class. This classification method makes full use of the related phonetic features of speech segment. Integration context short-time spectrum of MFCC feature set respectively achieves 83.6% accent detection accuracy on ASCCD. The experimental results indicate that integration context sub-segment splicing feature structured method of MFCC can be used in Chinese accent detection study.

      Key words:Accent; Context; Short-time Spectrum Features; Accent Detection

      0引言

      漢語重音檢測(cè)技術(shù)是韻律特征研究領(lǐng)域的一個(gè)重要組成部分。韻律特征主要包括重音、語調(diào)和聲調(diào)等,重音在語言交流中起到非常重要的作用,研究韻律特征可先從“重音”入手。

      重音可以使人們的語言聽起來抑揚(yáng)頓挫,而不是平鋪直敘。另外,重音還有避免歧義和加強(qiáng)語義的作用。比如句子,“我在準(zhǔn)備考試了”,重音落在“我”和“考試”上,強(qiáng)調(diào)的內(nèi)容是不一樣的。再比如,“我想明天去游泳”,如果重音落在“明天”和“我”上,雖然語義相同,但說話人強(qiáng)調(diào)的內(nèi)容卻是不同的。

      漢語重音檢測(cè)是指通過對(duì)語音信號(hào)的分析處理,提取影響重音的語音特征或建立相應(yīng)的語音模型,用來確定某個(gè)音節(jié)是否是重音。本文主要研究融合上下文的子段拼接MFCC特征,構(gòu)建了用于漢語重音檢測(cè)的融合上下文的短時(shí)譜特征集。

      1研究狀況

      胡偉湘等人[1]利用音長(zhǎng)和音高聲學(xué)相關(guān)特征集,采用基于分類回歸樹結(jié)構(gòu)的區(qū)分度模型,在韻律標(biāo)注語料庫ASCCD上能夠達(dá)到80%的重音檢測(cè)正確率。邵艷秋等人[2]則利用神經(jīng)網(wǎng)絡(luò)對(duì)聲學(xué)相關(guān)特征、語言學(xué)相關(guān)特征和混合特征進(jìn)行漢語重音檢測(cè),能夠得到78.4%、83.2%和84.3%的正確率。同時(shí),陳楠等人[3]又提出了基于動(dòng)態(tài)幀長(zhǎng)的基音同步能量和基音同步峰值特征的英語重音檢測(cè),聯(lián)合使用新特征與傳統(tǒng)特征,可使誤識(shí)率下降6.65%。更進(jìn)一步地,陳楠等人[4]使用非線性加權(quán)能量特征以及與傳統(tǒng)特征的特征組合對(duì)英語進(jìn)行重音檢測(cè),非線性加權(quán)能量特征比傳統(tǒng)特征魯棒性更高,聯(lián)合使用新特征與傳統(tǒng)特征,可使系統(tǒng)誤識(shí)率下降3.58%。而且,陳楠等人[5]還從聽覺模型的角度出發(fā),利用能同時(shí)表征瞬時(shí)頻率和強(qiáng)度信息的基音同步幅度峰值特征進(jìn)行重音檢測(cè)。李坤等人[6]即根據(jù)聽感知特性,引入半音程和響度特征,并以歸一化的音節(jié)最高值代替其平均值,系統(tǒng)正確率達(dá)到78.7%,漏檢率為9.37%。在此基礎(chǔ)上,也陸續(xù)提出了基于掩蔽效應(yīng)的突顯度模型,系統(tǒng)正確率提高到83.4%,漏檢率下降到5.72%。相應(yīng)地,倪崇嘉等人[7-8]亦對(duì)漢語重音檢測(cè)開展了進(jìn)一步的研究,利用聲學(xué)相關(guān)特征以及詞典語法相關(guān)特征對(duì)漢語重音進(jìn)行檢測(cè),并采用Boosting集成分類回歸樹對(duì)當(dāng)前音節(jié)的聲學(xué)相關(guān)特征以及詞典和語法相關(guān)特征進(jìn)行建模,其后更對(duì)詞典和語法相關(guān)特征采用條件隨機(jī)場(chǎng)方法進(jìn)行了建模,最后,再將Boosting集成分類回歸樹模型和條件隨機(jī)場(chǎng)模型通過加權(quán)組合而獲得識(shí)別率更高的混合模型,在ASCCD語料庫上隨即獲得76.3%重音檢測(cè)正確率。此外,李心廣等人[9]研究基于重音與韻律的英語句子客觀評(píng)價(jià)系統(tǒng),通過提取語音的能量特征,對(duì)英語句子進(jìn)行重音劃分。

      現(xiàn)有的重音檢測(cè)方法一般都采用基于整個(gè)音節(jié)提取當(dāng)前音節(jié)級(jí)的聲學(xué)特征及其統(tǒng)計(jì)特征。本文提出了一種針對(duì)NaiveBayes輸入特征規(guī)整的改進(jìn)方案,即融合上下文子段拼接方法的短時(shí)譜特征(語音幀級(jí)特征),子段拼接的短時(shí)譜特征是以每個(gè)音節(jié)的語音段為單位,將每個(gè)漢字的所有語音幀平均分為多段,相當(dāng)于將時(shí)長(zhǎng)、強(qiáng)度、聲母和韻母進(jìn)行了細(xì)分。由此看來,融合上下文子段拼接的短時(shí)譜特征包含更多的信息,可以更細(xì)致地刻畫語音的細(xì)節(jié),對(duì)漢語重音檢測(cè)也更具力度。

      ASCCD朗讀語篇語料庫(Annotated Speech Corpus of Chinese Discourse)由語篇語料、語音數(shù)據(jù)和語音學(xué)標(biāo)注信息組成,適用于語言語音研究、語音工程開發(fā)和基礎(chǔ)漢語普通話教學(xué)等領(lǐng)域。語料文本是18篇敘事體、議論體語篇,每篇3-5個(gè)自然段,每個(gè)自然段500-600個(gè)音節(jié),總計(jì)9 000個(gè)音節(jié),共10個(gè)發(fā)音人,5男5女,分別記為M001、M002、M003、M004、M005、F001、F002、F003、F004、F005,使用標(biāo)準(zhǔn)普通話,以自然的方式,標(biāo)準(zhǔn)的語速,流暢地朗讀語篇。所有語音都經(jīng)過標(biāo)注,音段采用SAMPA-C標(biāo)準(zhǔn)標(biāo)注[10],韻律采用C-ToBI韻律標(biāo)注系統(tǒng)標(biāo)注,具體標(biāo)注了音節(jié)拼音、聲韻母、聲調(diào)、韻律邊界等級(jí)以及語句重音信息[11],標(biāo)記了每個(gè)韻律單位的重音,共分0、1、2、3級(jí),漢語的重音也是與韻律結(jié)構(gòu)對(duì)應(yīng)的層級(jí)結(jié)構(gòu)。韻律詞中最重音節(jié)重音標(biāo)為1,次要韻律短語中最重音節(jié)重音標(biāo)為2,主要韻律短語中最重音節(jié)重音標(biāo)為3,0則表示不重讀,即正常讀音。在本文研究中,需將音節(jié)分為正常讀音和重音,而并不細(xì)分音節(jié)之間的差別,為此則將韻律詞重音和次要韻律短語(MIP)重音看做正常讀音,卻只將主要韻律短語(MAP)重音看作是重讀。ASCCD語料庫中重音的分布如表1所示。

      梅爾頻率倒譜系數(shù)MFCC充分利用了人耳的聽覺感知特性,并將該特性與聲音產(chǎn)生機(jī)制結(jié)合,即更好地模擬了人耳對(duì)語音信號(hào)的處理過程,其提取的特征也更能真實(shí)反映聽覺系統(tǒng)的獨(dú)特性質(zhì)。因此,融合上下文子段拼接的 MFCC短時(shí)譜特征集在漢語重音檢測(cè)研究中都能取得較好的識(shí)別率。實(shí)驗(yàn)結(jié)果也證實(shí)了這一推想。

      4結(jié)束語

      本文詳細(xì)闡述了融合上下文子段拼接的MFCC短時(shí)譜特征集。然后,采用NaiveBayes分類算法在ASCCD朗讀語篇語料庫上對(duì)當(dāng)前音節(jié)的短時(shí)譜特征進(jìn)行建模,NaiveBayes即選擇具有最大后驗(yàn)概率的類作為該對(duì)象所屬的類,這種分類方法則充分利用了當(dāng)前語音段的相關(guān)語音特性。實(shí)驗(yàn)結(jié)果也進(jìn)一步表明融合上下文子段拼接的MFCC短時(shí)譜特征有著很高的識(shí)別率。下一步,就要對(duì)所用的特征進(jìn)行簡(jiǎn)化,或改進(jìn)MFCC算法,旨在提取最少的特征得到更高的識(shí)別率。

      參考文獻(xiàn):

      [1]胡偉湘,董宏輝,陶建華,等. 漢語朗讀話語重音自動(dòng)分類研究[J]. 中文信息學(xué)報(bào),2005(6):80-85.

      [2]邵艷秋,韓紀(jì)慶,劉挺,等. 自然風(fēng)格言語的漢語句重音自動(dòng)判別研究[J]. 聲學(xué)學(xué)報(bào),2006(3):203-210.

      [3]陳楠,賀前華,王偉凝,等. 基音同步幀長(zhǎng)特征在英語詞重音檢測(cè)中的應(yīng)用[J]. 計(jì)算機(jī)應(yīng)用,2008(6):1533-1536.

      [4]陳楠,賀前華. 非線性加權(quán)能量特征在英語詞重音檢測(cè)中的應(yīng)用[J]. 聲學(xué)學(xué)報(bào)(中文版),2008(6):520-525.

      [5]陳楠,賀前華,李韜. 基于聽覺模型的特征在英語重音檢測(cè)中的應(yīng)用[J]. 計(jì)算機(jī)工程,2009(8):26-27,30.

      [6]李坤,劉加. 基于聽感知特征的英語句子重音檢測(cè)[J]. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2010(4):613-617.

      [7]倪崇嘉,張愛英,劉文舉. 基于聲學(xué)相關(guān)特征與詞典語法相關(guān)特征的漢語重音檢測(cè)[J]. 計(jì)算機(jī)學(xué)報(bào), 2011(9): 1638-1649.

      [8]倪崇嘉,劉文舉,徐波. 基于互補(bǔ)模型的漢語重音檢測(cè)[J]. 計(jì)算機(jī)工程,2011,23:20-23.

      [9]李心廣,王桂珍,楊思哲. 考察重音與韻律的英語句子客觀評(píng)價(jià)系統(tǒng)研究[J]. 計(jì)算機(jī)工程與應(yīng)用,2013,(8):105-109,150.

      [10]CHEN Xiaoxia, LI Aijun, SUN Guohua, et al. An application of SAMPA-C for standard Chinese[C]//Proceedings of the International Conference on Spoken Language Processing. Beijing, China, 2000:652-655.

      [11]LI Ai jun. Chinese prosody and prosodic labeling of spontaneous speech[C]//Proceedings of the Speech Prosody 200.Aix-en-Provence, France, 2002:39-46.

      猜你喜歡
      重音
      《春》朗讀教學(xué)中的重音教學(xué)策略
      阿基與烏龜之重音
      單詞重音
      重音在“文學(xué)作品朗讀”中的運(yùn)用
      藝術(shù)家(2020年5期)2020-12-07 07:49:32
      俄語重音的變化和原因探究
      漢語詞重音若干基本理論問題研究
      維吾爾語詞重音的形式判斷
      語言與翻譯(2015年4期)2015-07-18 11:07:45
      朗讀中重音如何確定
      新教育(2015年22期)2015-02-28 04:54:27
      淺談?wù)Z句重音的把握
      大眾文藝(2015年5期)2015-01-27 11:12:44
      基于重音理論的英語聽力學(xué)習(xí)策略
      卢湾区| 长沙县| 商河县| 介休市| 神池县| 普定县| 恩平市| 吉木乃县| 河西区| 永丰县| 华蓥市| 博野县| 庐江县| 澄江县| 丰原市| 江都市| 枣阳市| 屏东市| 曲沃县| 东山县| 怀化市| 康定县| 六盘水市| 凤翔县| 石屏县| 余庆县| 淮滨县| 玉山县| 定远县| 彰武县| 沁水县| 朝阳区| 石柱| 成安县| 比如县| 博罗县| 大石桥市| 花莲市| 宝清县| 青铜峡市| 绵竹市|