陳少華,楊勝忠,顧 欣
(貴州省黔東南自治州氣象局,貴州 凱里 556000)
氣象“12121”咨詢電話是氣象部門服務(wù)公眾的重要服務(wù)窗口,是快捷查詢到每天最新氣象信息和災(zāi)害天氣預(yù)警信息的重要途徑。隨著人民群眾生活水平的提高和社會(huì)經(jīng)濟(jì)活動(dòng)的增多,社會(huì)各界愈來(lái)愈關(guān)注每天的最新氣象信息,“12121”在健全防災(zāi)體系、構(gòu)建和諧社會(huì)以及指導(dǎo)公眾有序防御氣象災(zāi)害,合理安排工作與生活等方面發(fā)揮了積極作用。黔東南州氣象災(zāi)害頻繁,各種氣象災(zāi)害如冰雹、強(qiáng)降水等時(shí)有發(fā)生,為了滿足社會(huì)對(duì)氣象信息的需求,讓氣象更好的服務(wù)于黔東南經(jīng)濟(jì)建設(shè)和人民群眾的日常生活,黔東南州氣象局在原有的“12121”氣象語(yǔ)音自動(dòng)答詢系統(tǒng)上增加了氣象預(yù)警和天氣實(shí)況兩項(xiàng)內(nèi)容。
目前,全國(guó)“12121”氣象語(yǔ)音自動(dòng)答詢系統(tǒng)主要有伍豪和雙順達(dá)兩個(gè)品牌,貴州省主要也是在使用這兩個(gè)廠家的系統(tǒng)。和其它系統(tǒng)一樣,伍豪和雙順達(dá)系統(tǒng)的原理都大同小異,系統(tǒng)根據(jù)平常使用的播報(bào)內(nèi)容,錄制成語(yǔ)音詞條,形成專用語(yǔ)音庫(kù),當(dāng)制作預(yù)報(bào)時(shí),選擇相應(yīng)的語(yǔ)音詞條來(lái)制作播報(bào)內(nèi)容,因此,播報(bào)內(nèi)容受制于語(yǔ)音庫(kù),如果想要播報(bào)的內(nèi)容找不到相應(yīng)的語(yǔ)音詞條,就無(wú)法制作。隨著社會(huì)經(jīng)濟(jì)的發(fā)展,人們對(duì)“12121”播報(bào)內(nèi)容要求越來(lái)越豐富,如氣象預(yù)警信息,其內(nèi)容多變,沒(méi)有固定模式,也不能預(yù)知其內(nèi)容,所以無(wú)法利用事先錄制好的語(yǔ)音詞條來(lái)制作氣象預(yù)警信息,解決缺少語(yǔ)音詞條文件成了制作播報(bào)內(nèi)容最大的難題。據(jù)了解,全國(guó)有條件的少數(shù)地區(qū)“12121”氣象預(yù)警信息是通過(guò)人工現(xiàn)場(chǎng)錄制,這就需要花費(fèi)較大的人力和物力,在大多數(shù)地區(qū)無(wú)條件實(shí)施,不現(xiàn)實(shí)。通過(guò)研究發(fā)現(xiàn),利用計(jì)算機(jī)自動(dòng)處理是最好的解決方法。
本研究主要以伍豪“12121”天氣自動(dòng)答詢系統(tǒng)為例,采用TTS文本轉(zhuǎn)換語(yǔ)音技術(shù)[1],實(shí)現(xiàn)播報(bào)內(nèi)容如氣象預(yù)警信息等直接以文本內(nèi)容轉(zhuǎn)換成語(yǔ)音文件,通過(guò)開(kāi)發(fā)計(jì)算機(jī)軟件實(shí)時(shí)自動(dòng)完成播報(bào)內(nèi)容的更新,使撥打用戶了解到最新的氣象信息。同時(shí),也給其它廠商的系統(tǒng)實(shí)現(xiàn)這一功能提供進(jìn)一步參考。
伍豪“12121”氣象語(yǔ)音自動(dòng)答詢系統(tǒng)是目前比較常用的氣象語(yǔ)音自動(dòng)答詢系統(tǒng)之一,它制作氣象播報(bào)內(nèi)容的原理和其它系統(tǒng)一樣,較為簡(jiǎn)單。即根據(jù)常用的播報(bào)內(nèi)容錄制成相應(yīng)的語(yǔ)音詞條,并以PCM格式的語(yǔ)音文件存放于系統(tǒng)中,形成專用語(yǔ)音庫(kù)。伍豪通用的語(yǔ)音文件格式編碼為PCM,A律(A-Law),8 000Hz,8位,單聲道。制作播報(bào)內(nèi)容時(shí),選定相應(yīng)內(nèi)容的語(yǔ)音詞條,保存確定后,系統(tǒng)調(diào)用該詞條的語(yǔ)音文件聯(lián)接合并成完整內(nèi)容的語(yǔ)音文件,用戶撥打時(shí),系統(tǒng)播放相應(yīng)的語(yǔ)音供用戶收聽(tīng)。
伍豪“12121”氣象語(yǔ)音自動(dòng)答詢系統(tǒng)目前存在的弊端是由于系統(tǒng)中所有的語(yǔ)音詞條都是根據(jù)常用的內(nèi)容事先錄制好的,當(dāng)出現(xiàn)播報(bào)內(nèi)容找不到相應(yīng)的語(yǔ)音詞條文件時(shí),就無(wú)法制作。因此,播報(bào)內(nèi)容完全受制于語(yǔ)音詞條,即受制于系統(tǒng)內(nèi)置語(yǔ)音庫(kù)。
氣象災(zāi)害預(yù)警信息和天氣實(shí)況內(nèi)容靈活多變,無(wú)法用固定的語(yǔ)音詞條來(lái)確定,不可能使用事先錄制好的語(yǔ)音文件,特別是出現(xiàn)氣象災(zāi)害預(yù)警信息時(shí),預(yù)警信息的內(nèi)容更是不確定性,包括內(nèi)容和出現(xiàn)的時(shí)間;天氣實(shí)況每個(gè)小時(shí)內(nèi)容需要更新一次;通過(guò)系統(tǒng)自帶的功能,可以進(jìn)行人工現(xiàn)場(chǎng)錄制播報(bào)內(nèi)容來(lái)完成制作。但如果安排人工進(jìn)行實(shí)時(shí)錄制更新,那將要花費(fèi)較多的人力和物力,特別是夜間需要值守班,需要安排4~6名普通話標(biāo)準(zhǔn)的工作人員進(jìn)行24 h值班,一般情況下,各地“12121”值班人員只有1~2人,無(wú)法承擔(dān)以上工作。因此,該伍豪系統(tǒng)在實(shí)際業(yè)務(wù)使用上,存在一定的弊端。
了解伍豪“12121”氣象語(yǔ)音自動(dòng)答詢系統(tǒng)原理后,根據(jù)需要的功能,通過(guò)研究發(fā)現(xiàn),采用TTS文本轉(zhuǎn)換語(yǔ)音技術(shù),可以解決缺少語(yǔ)音詞條文件的難題。
TTS是Text To Speech的縮寫,即“從文本到語(yǔ)音”,是人機(jī)對(duì)話的一部分,讓機(jī)器能夠說(shuō)話,它是同時(shí)運(yùn)用語(yǔ)言學(xué)和心理學(xué)的杰出之作,在內(nèi)置芯片的支持之下,通過(guò)神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì),把文字智能地轉(zhuǎn)化為自然語(yǔ)音流。TTS技術(shù)對(duì)文本文件進(jìn)行實(shí)時(shí)轉(zhuǎn)換,轉(zhuǎn)換時(shí)間之短可以以秒計(jì)算。在其特有智能語(yǔ)音控制器作用下,文本輸出的語(yǔ)音音律流暢,使得聽(tīng)者在聽(tīng)取信息時(shí)感覺(jué)自然,毫無(wú)機(jī)器語(yǔ)音輸出的冷漠與生澀感。TTS語(yǔ)音合成技術(shù)即將覆蓋國(guó)標(biāo)一、二級(jí)漢字,具有英文接口,自動(dòng)識(shí)別中、英文,支持中英文混讀,所有聲音采用真人普通話為標(biāo)準(zhǔn)發(fā)音,實(shí)現(xiàn)了120~150個(gè)漢字/s的快速語(yǔ)音合成,朗讀速度達(dá)3~4個(gè)漢字/s,使用戶可以聽(tīng)到清晰悅耳的音質(zhì)和連貫流暢的語(yǔ)調(diào)。
基于計(jì)算機(jī)應(yīng)用的TTS一般用純軟件實(shí)現(xiàn),主要包括以下幾部分:
①文本分析。對(duì)輸入文本進(jìn)行語(yǔ)言學(xué)分析,逐句進(jìn)行詞匯的、語(yǔ)法的和語(yǔ)義的分析,以確定句子的低層結(jié)構(gòu)和每個(gè)字的音素的組成,包括文本的斷句、字詞切分、多音字的處理、數(shù)字的處理、縮略語(yǔ)的處理等。
②語(yǔ)音合成。把處理好的文本所對(duì)應(yīng)的單字或短語(yǔ)從語(yǔ)音合成庫(kù)中提取,把語(yǔ)言學(xué)描述轉(zhuǎn)化成言語(yǔ)波形。
③韻律處理。合成音質(zhì)(Qualityof Synthetic Speech)是指語(yǔ)音合成系統(tǒng)所輸出的語(yǔ)音的質(zhì)量,一般從清晰度(或可懂度)、自然度和連貫性等方面進(jìn)行主觀評(píng)價(jià)。
利用TTS技術(shù),通過(guò)編寫處理程序,即可實(shí)現(xiàn)氣象災(zāi)害預(yù)警信息和天氣實(shí)況內(nèi)容自動(dòng)合成語(yǔ)音文件。轉(zhuǎn)換成的語(yǔ)音采用優(yōu)質(zhì)語(yǔ)音庫(kù),語(yǔ)速適宜,朗讀流暢,幾乎能與標(biāo)準(zhǔn)普通話媲美。
原理如圖1所示:
圖1 “12121”播報(bào)內(nèi)容實(shí)時(shí)自動(dòng)更新原理
以氣象預(yù)警信息為例:
①在伍豪“12121”氣象語(yǔ)音自動(dòng)答詢系統(tǒng)上設(shè)置一個(gè)預(yù)警信箱,用來(lái)放置預(yù)警信息,并指定一個(gè)無(wú)內(nèi)容的播報(bào)語(yǔ)音文件。
②預(yù)警信息的獲取。氣象臺(tái)發(fā)布預(yù)警信息,會(huì)生成一個(gè)預(yù)警文件,讓其自動(dòng)發(fā)送到“12121”系統(tǒng)計(jì)算機(jī)上,設(shè)計(jì)一個(gè)程序,當(dāng)接收到新的預(yù)警信息文件時(shí),讀取該文件內(nèi)容即可得到播報(bào)內(nèi)容,即預(yù)警信息內(nèi)容文本。
③得到內(nèi)容文本后,通過(guò)TTS程序處理,調(diào)用專用語(yǔ)音庫(kù),根據(jù)內(nèi)容合成伍豪“12121”氣象語(yǔ)音自動(dòng)答詢系統(tǒng)通用PCM格式的語(yǔ)音文件。
④自動(dòng)覆蓋替換掉預(yù)警信箱中的原有的語(yǔ)音文件。
通過(guò)以上操作,當(dāng)氣象臺(tái)發(fā)布預(yù)警信息時(shí),會(huì)自動(dòng)讀取預(yù)警內(nèi)容并處理生成語(yǔ)音文件,替換掉原先的文件,使用戶能聽(tīng)到最新的預(yù)警信息。
天氣實(shí)況及天氣預(yù)報(bào)內(nèi)容的更新也是相同原理。
根據(jù)以上原理,利用Visual Basic程序設(shè)計(jì)開(kāi)發(fā)了伍豪“12121”系統(tǒng)播報(bào)內(nèi)容自動(dòng)制作軟件”。
①“12121”系統(tǒng)電腦連上氣象局內(nèi)網(wǎng),安裝FTP服務(wù)器。貴州省發(fā)布的氣象災(zāi)害預(yù)警信息都是通過(guò)中國(guó)氣象局下發(fā)的氣象災(zāi)情直報(bào)系統(tǒng),因此,只要在該軟件設(shè)置FTP發(fā)送設(shè)置選項(xiàng)中增加發(fā)送到“12121”FTP服務(wù)器的配置,氣象臺(tái)發(fā)布?xì)庀鬄?zāi)害預(yù)警時(shí),即可多發(fā)送一份到“12121”系統(tǒng)電腦上。
②程序通過(guò)實(shí)時(shí)監(jiān)控預(yù)警信息文件夾,當(dāng)收到新的預(yù)警文件時(shí),會(huì)自動(dòng)讀取預(yù)警內(nèi)容并正確判斷,生成預(yù)警文本內(nèi)容。通過(guò)調(diào)用TTS文本語(yǔ)音轉(zhuǎn)換功能生成PCM語(yǔ)音文件。
③預(yù)警信箱所播放的內(nèi)容存放在“12121”軟件目錄下一個(gè)指定的文件夾中,當(dāng)有新預(yù)警語(yǔ)音文件生成時(shí),自動(dòng)替換掉原來(lái)的文件,成為最新內(nèi)容。
氣象監(jiān)測(cè)資料(包括各縣(市)城區(qū)氣象站資料和各鄉(xiāng)鎮(zhèn)多要素氣象資料)存放統(tǒng)一的數(shù)據(jù)庫(kù)中,通過(guò)開(kāi)發(fā)程序可以實(shí)時(shí)調(diào)取。本研究中所需要天氣實(shí)況信息為黔東南州全州16個(gè)縣(市)每個(gè)時(shí)次的正點(diǎn)氣溫、當(dāng)日最高氣溫和最低氣溫、縣城降水量以及全縣(市)最大降水量和出現(xiàn)的地名(鄉(xiāng)鎮(zhèn))。如凱里北京時(shí)3月2日14時(shí)天氣實(shí)況的內(nèi)容為:2日14時(shí)正點(diǎn)氣溫12.5°,1日20時(shí)至當(dāng)前最高氣溫15.6°,最低氣溫5.6°,1 日 20 時(shí)至當(dāng)前市區(qū)降水量為2.3 mm,全市最大降水量為 4.2 mm,出現(xiàn)在龍場(chǎng)。每個(gè)縣(市)的天氣實(shí)況內(nèi)容設(shè)置為每個(gè)小時(shí)正點(diǎn)后10 min自動(dòng)獲取。同樣,得到實(shí)況文本內(nèi)容后,轉(zhuǎn)換成相應(yīng)的語(yǔ)音文件并替換更新。
天氣預(yù)報(bào)內(nèi)容和其它信箱的內(nèi)容也可以用同樣的方法自動(dòng)更新。天氣預(yù)報(bào)每天07時(shí)、09時(shí)、16時(shí)更新,可以采用無(wú)人值守的方式自動(dòng)讀取氣象臺(tái)制作的天氣預(yù)報(bào)內(nèi)容自動(dòng)更新即可,也可進(jìn)行人工干涉,當(dāng)出現(xiàn)失誤時(shí)及時(shí)更正。
其它內(nèi)容如氣象科普,也可用文本轉(zhuǎn)換成語(yǔ)音文件的方式來(lái)更新。
伍豪“12121”氣象語(yǔ)音自動(dòng)答詢系統(tǒng)播報(bào)內(nèi)容自動(dòng)制作軟件在后臺(tái)運(yùn)行,實(shí)時(shí)更新災(zāi)害預(yù)警和天氣實(shí)況內(nèi)容,也可人工制作,如圖2所示,程序界面簡(jiǎn)潔,主要功能是實(shí)現(xiàn)播報(bào)內(nèi)容自動(dòng)和手動(dòng)更新。當(dāng)人工制作播報(bào)內(nèi)容時(shí),修改所要播報(bào)的預(yù)警、實(shí)況和預(yù)報(bào)內(nèi)容后,點(diǎn)擊“全部處理”,后臺(tái)處理程序便會(huì)自動(dòng)更新內(nèi)容到“12121”系統(tǒng)指定的信箱中,方便用戶撥打收聽(tīng)。
圖2 軟件界面
①利用Visual Basic程序設(shè)計(jì)語(yǔ)言開(kāi)發(fā)了伍豪“12121”氣象語(yǔ)音自動(dòng)答詢系統(tǒng)播報(bào)內(nèi)容自動(dòng)更新軟件,軟件采用TTS文本轉(zhuǎn)換語(yǔ)音技術(shù),實(shí)現(xiàn)了氣象災(zāi)害預(yù)警信息、天氣實(shí)況及預(yù)報(bào)內(nèi)容的自動(dòng)更新的功能。程序運(yùn)行穩(wěn)定,解決了工作中的實(shí)際困難,使廣大公眾通過(guò)固定電話或移動(dòng)手機(jī)隨時(shí)撥打“12121”,便可了解到最新的氣象信息。
②全國(guó)大多數(shù)氣象語(yǔ)音自動(dòng)答詢系統(tǒng)的原理都大同小異,包括雙順達(dá)品牌的“12121”系統(tǒng),因此,利用TTS文本轉(zhuǎn)換語(yǔ)音技術(shù)和以上方法,完全可以實(shí)現(xiàn)雙順達(dá)“12121”氣象語(yǔ)音自動(dòng)答詢系統(tǒng)播報(bào)內(nèi)容的自動(dòng)更新。唯一有差別的地方在于雙順達(dá)品牌系統(tǒng)的語(yǔ)音格式是VOC格式,即在合成語(yǔ)音文件時(shí),轉(zhuǎn)成VOC格式即可。
③TTS文本轉(zhuǎn)換語(yǔ)音技術(shù)在其它行業(yè)的自動(dòng)答詢系統(tǒng)中,也可做一定的參考。
[1]http://baike.baidu.com/subview/66087/5117538.htm?fr=aladdin.
[2]馬月枝.氣象報(bào)文編發(fā)監(jiān)控報(bào)警系統(tǒng)設(shè)計(jì)[J].氣象與環(huán)境科學(xué),2009,32(1):91-93.