張歡
據(jù)悉,谷歌公司近期正推出一款新的AI語音合成器,用于其機器學(xué)習(xí)云工具套件。這款語音合成器是一項名為云文本到語音的服務(wù)(Cloud Text-to-Speech) ,由谷歌位于英國的AI子公司DeepMind通過WaveNet提供技術(shù)支持。
此次谷歌推出的AI語音合成器,在WaveNet的支持下借助機器學(xué)習(xí)從頭開始生成音頻,通過分析人類語音數(shù)據(jù)庫中的波形,并以每秒24000個樣本的速率重新創(chuàng)建這些波形,包括唇音和口音等微妙的聲音。
借助DeepMind AI技術(shù),谷歌數(shù)據(jù)中心的電力成本降低40%,并將WaveNet直接整合到其云服務(wù)中。在2017年10月,WaveNet被整合到Google Assistant中,現(xiàn)在基于Cloud Text-To-Speech,可用于語言的精選。谷歌稱,這項新服務(wù)提供32種不同的語音,可以說12種語言,用戶可以自定義音調(diào)和速度等因素。