周丹
摘 要:掌上氣象客戶端智能語音播報系統(tǒng)依托TTS技術,在手機上實現(xiàn)語音播報天氣信息的功能。TTS技術,又稱文語轉(zhuǎn)換技術,它將計算機、手機自己產(chǎn)生的、或外部輸入的文字信息轉(zhuǎn)變?yōu)榭梢月牭枚?、流利的漢語口語輸出的技術。
關鍵詞:TTS 語音合成 智能播報
中圖分類號:TN912.3文獻標識碼:A文章編號:1003-9082(2020)06-000-01
引言
TTS技術關鍵的就是韻律控制、符號數(shù)字、多音字、構詞方面有較多的問題,需要不斷研究,使得語音合成的自然化程度提高。掌上氣象客戶端智能語音播報系統(tǒng)使用語音合成技術(TTS),來進行天氣情況的智能播報。
一、TTS技術簡介
TTS是語音合成應用的一種,使計算機、手機等設備,具有類似于人一樣的說話能力,是當今時代信息產(chǎn)業(yè)的重要競爭技術。TTS是Text To Speech的縮寫,即“從文本到語音” [1]。語音合成,又稱文語轉(zhuǎn)換,目的是讓設備說話。文語轉(zhuǎn)換過程是先將文字序列轉(zhuǎn)換成音韻序列,再由系統(tǒng)根據(jù)音韻序列生成語音波形。如:將文本文件內(nèi)容等文字信息按語音處理規(guī)則轉(zhuǎn)換成語音信號輸出, 使設備流利地讀出文字信息, 使人們通過“聽”就可以知曉信息的內(nèi)容。
TTS技術對文本文件進行實時轉(zhuǎn)換,轉(zhuǎn)換時間之短可以秒計算。在其特有智能語音控制器作用下,文本輸出的語音音律流暢,使得聽者在聽取信息時感覺自然,毫無機器語音輸出的冷漠與生澀感。
二、掌上氣象客戶端文語轉(zhuǎn)換系統(tǒng)
文本分析、韻律控制和語音合成這三個模塊是文語轉(zhuǎn)換系統(tǒng)的三個核心部分[2]。其結構如下圖所示(如:圖示1)
(圖示1)
1.文本及文本分析
語音播放的文本由掌上氣象客戶端對所接收到的天氣信源,進行拼接處理后生成。
對輸入文本進行語言學分析,逐句進行詞匯的、語法的和語義的分析,以確定句子的低層結構和每個字的音素的組成。
2.韻律控制
合成音質(zhì)(Qualityof Synthetic Speech)是指語音合成系統(tǒng)所輸出的語音的質(zhì)量,一般從清晰度(或可懂度)、自然度和連貫性等方面進行主觀評價。掌上氣象客戶端依據(jù)普通人說話的韻律特征,并對語音播報效果進行反復調(diào)試,從而制定了一套韻律控制機制,用于控制語音的停頓以及聲調(diào)大小等。
3.語音數(shù)據(jù)庫
掌上氣象客戶端智能語音系統(tǒng)采取自行錄制語音文件的方式,通過將天氣、地名、日期、風向、風力、關鍵詞等詞句片段錄制成語音文件,并依據(jù)詞句信息進行編號入庫,生成掌上氣象客戶端專有的語音數(shù)據(jù)庫。
4.語音合成模塊
語音合成模塊最主要功能實現(xiàn)文本拆分、語音合成兩個模塊。文本拆分使用遍歷方式,將輸入語音文本分割成語音片段;語音合成采用語音二進制流,將分割完畢的語音片段進行合并。
//以下代碼為文本切割偽代碼片段
[textArray removeAllObjects];
NSString *textCopy = text;
NSString *key = nil;
NSInteger length = [text length];
int i = 0;
while (i < length)
{//遍歷所有文本
textCopy = [text substringFromIndex:i];
for (int j=0; j<[[textLib allKeys] count]; j++)
{
key = [[textLib allKeys] objectAtIndex:j];
if ([textCopy hasPrefix:key])
{//匹配某個語音片段
[textArray addObject:key];// 保存語音片段
i = i + [key length] - 1;// 遍歷下一條語音片段
break;
}
}
i++;//如果沒有匹配,跳過這個單詞
}
//以下代碼為語音合成偽代碼片段
Stream *outStream;
for (NSInteger i=0; i<語音片段長度; i++)
{
outStream? += 語音片段數(shù)組(i).toStream();
}
return outStream;
5.輸出語音
目前主流手機終端ios/android/wp7/symbian,將語音二進制流放到播放緩沖中,即可實現(xiàn)語音播放。
//以下為偽代碼
//申請播放器內(nèi)存
mediaPlay *play = new mediaPlay();
//將二進制流放入播放緩存
play.playAudio(outStream);
//play.pause();暫停播放
三、總結
TTS即語音合成技術(Text To Speech)在掌上氣象客戶端平臺上的應用,涉及到聲學、語言學、數(shù)學信號處理技術、多媒體技術等多個學科技術領域,是中文信息處理領域的一項前沿技術,實現(xiàn)了把手機中讀取的文字信源轉(zhuǎn)換成自然流暢的語音輸出。
基于TTS技術的掌上氣象客戶端智能語音系統(tǒng),實現(xiàn)“以人為本”的人性化氣象服務,圖文聲并茂,打造出最具權威和科技含量的手機氣象客戶端服務系統(tǒng)。
參考文獻
[1]顧海峰.基于中文TTS技術研究[J].電腦知識與技術:學術交流,2007,(5).
[2]馬強.嵌入TTS技術開發(fā)語音合成軟件[J].電腦開發(fā)與應用,2004,(4).