2018年7月18日,由中國科學院自動化研究所承擔的國家863計劃“多方言的高表現(xiàn)力情感語音交互系統(tǒng)” 課題在北京通過驗收。
課題研發(fā)了具有多種方言口音處理能力的情感語音交互平臺,同時研制了低運算復雜度嵌入式語音交互引擎,實現(xiàn)了面向移動終端的多種交互方式融合的情感語音交互系統(tǒng)。該系統(tǒng)將高性能的自然口語生成、情感信息處理融入到語音交互中,增強了內(nèi)容理解的準確性,提高了語音交互的實用性,在此基礎(chǔ)上實現(xiàn)了高準確率的自然口語對話系統(tǒng)。課題組研發(fā)的高性能、高魯棒性的語音識別系統(tǒng),針對方言普通話的連續(xù)語音識別正確率超過95%;研發(fā)的高表現(xiàn)力的具有口語表達能力的語音合成系統(tǒng),實現(xiàn)細微可控的情感語音合成,同時能夠自然合成口語對話、疑問、感嘆等語氣的語音,合成語音的自然度主觀意見平均分(MOS)超過4.1;建立了融合語音韻律信息和內(nèi)容信息的情感識別模型,對愉悅、悲傷等情感狀態(tài)的識別準確率超過85%,能夠支撐較高性能的情感分析,并應(yīng)用于語音交互平臺、語音客服的質(zhì)檢、醫(yī)學抑郁癥患者診治、人員情緒監(jiān)控等多種場合。
(來源:http://www.most.gov.cn/kjbgz/201808/t20180802_141007.htm)