秦臻楠
[摘? ? ? ? ? ?要]? 隨著信息技術(shù)的迅速發(fā)展,智能語音技術(shù)已日漸成熟并被廣泛地應(yīng)用到語言類課程的教學(xué)中,但是在導(dǎo)游教學(xué)中應(yīng)用較少。導(dǎo)游講解是導(dǎo)游的核心技能之一,是學(xué)生未來從事導(dǎo)游崗位工作的必備技能。智能語音技術(shù)的出現(xiàn),不僅能夠有效提高學(xué)生的導(dǎo)游詞寫作能力和導(dǎo)游語言表達(dá)能力,還是對(duì)現(xiàn)在的導(dǎo)游講解訓(xùn)練方式和評(píng)價(jià)模式的顛覆性變革。以導(dǎo)游VR智慧教學(xué)系統(tǒng)為例,闡述了智能語音技術(shù)中的語音識(shí)別技術(shù)和語音評(píng)測技術(shù)在導(dǎo)游講解實(shí)訓(xùn)教學(xué)中的應(yīng)用。
[關(guān)? ? 鍵? ?詞]? 智能語音技術(shù);導(dǎo)游講解實(shí)訓(xùn);智慧教學(xué)系統(tǒng)
[中圖分類號(hào)]? G712? ? ? ? ? ? ? ? ? ?[文獻(xiàn)標(biāo)志碼]? A? ? ? ? ? ? ? ? ? ? ? [文章編號(hào)]? 2096-0603(2020)52-0228-02
智能語音技術(shù)是人工智能技術(shù)的重要領(lǐng)域,其研究可追溯到20世紀(jì)50年代。隨著信息技術(shù)的迅速發(fā)展,如今的智能語音技術(shù)已經(jīng)非常成熟,并且得到了廣泛的應(yīng)用。導(dǎo)游講解是導(dǎo)游的核心技能之一,是學(xué)生未來從事導(dǎo)游崗位工作的必備技能。導(dǎo)游講解技能的形成取決于學(xué)生的景區(qū)景點(diǎn)知識(shí)水平、景區(qū)導(dǎo)游詞寫作水平、語言表達(dá)能力和即時(shí)應(yīng)變能力。在導(dǎo)游講解技能中,語言表達(dá)能力是導(dǎo)游講解的核心,是學(xué)生學(xué)習(xí)的難點(diǎn)?;谥悄苷Z音技術(shù)的導(dǎo)游VR智慧教學(xué)系統(tǒng)為學(xué)生提供了可以進(jìn)行自主學(xué)習(xí)與訓(xùn)練的情境,使學(xué)生在不斷反復(fù)的強(qiáng)化訓(xùn)練中提升語言表達(dá)能力,進(jìn)而提高導(dǎo)游詞寫作能力。
一、智能語音技術(shù)概述
智能語音技術(shù)是實(shí)現(xiàn)人機(jī)語言的通信,包括語音識(shí)別技術(shù)、語音合成技術(shù)和語音評(píng)測技術(shù)。語音識(shí)別(Automatic Speech Recognition,ASR)技術(shù)是指讓計(jì)算機(jī)能夠接受、識(shí)別和理解人的言語信息,將語音信息自動(dòng)轉(zhuǎn)換成相應(yīng)文本信息或命令的技術(shù),實(shí)現(xiàn)人機(jī)交互的輸入;語音合成(Text To Speech,TTS)技術(shù)是指讓計(jì)算機(jī)能夠像人一樣說話,將文本信息自動(dòng)轉(zhuǎn)換成語音信息的技術(shù),實(shí)現(xiàn)人機(jī)交互的輸出[1];語音評(píng)測(Automatic Speech Certification,ASC)技術(shù)可以實(shí)現(xiàn)自動(dòng)對(duì)發(fā)音人語音水平評(píng)價(jià)、缺陷定位和問題分析,是近年來智能語音技術(shù)出現(xiàn)的第三個(gè)分支[2]。
本系統(tǒng)中主要運(yùn)用了語音識(shí)別技術(shù)和語音測評(píng)技術(shù)。
(一)智能語音技術(shù)的人機(jī)交互原理
智能語音技術(shù)的人機(jī)交互種類主要包括語音識(shí)別、語音合成和語音評(píng)測。大部分智能語音系統(tǒng)的人機(jī)交互過程一般從語音識(shí)別開始,系統(tǒng)成功接收語音信息后,通過預(yù)設(shè)的算法將其轉(zhuǎn)換為文本信息,完成人機(jī)交互中的輸入;在語音信息全部輸入后,語音評(píng)測技術(shù)開始將輸入的語音信息和系統(tǒng)語料庫進(jìn)行比對(duì),根據(jù)預(yù)設(shè)的評(píng)測標(biāo)準(zhǔn)輸出評(píng)測結(jié)果;語音合成技術(shù)則是將文本信息再次轉(zhuǎn)換為人造語音信息,實(shí)現(xiàn)人機(jī)交互中的輸出[3]。
(二)智能語音技術(shù)在教學(xué)中的應(yīng)用現(xiàn)狀
近年來,隨著我國語音識(shí)別技術(shù)和語音測評(píng)技術(shù)的飛速發(fā)展,智能語音技術(shù)在語言類教學(xué)中得到了廣泛的應(yīng)用,如英語教學(xué)中的各類口語學(xué)習(xí)軟件、普通話教學(xué)中的普通話水平測試軟件等,這些基于智能語音技術(shù)的教學(xué)軟件在很大程度上激發(fā)了學(xué)生的語言學(xué)習(xí)興趣,提升了教學(xué)效果。
在知網(wǎng)中以“智能語音技術(shù)”“智能語音系統(tǒng)”“語音識(shí)別技術(shù)”“語音評(píng)測技術(shù)”為搜索關(guān)鍵詞,發(fā)現(xiàn)與教學(xué)相關(guān)的文獻(xiàn)較少,其中大部分是針對(duì)英語教學(xué)、普通話教學(xué)的研究,沒有與導(dǎo)游教學(xué)相關(guān)的文獻(xiàn)研究。在實(shí)際導(dǎo)游教學(xué)中,智能語音技術(shù)的應(yīng)用只是作為豐富課堂的一些教學(xué)手段,如訊飛輸入法的語音轉(zhuǎn)換功能、景區(qū)的語音導(dǎo)覽服務(wù)等,缺少一個(gè)功能完整的教學(xué)系統(tǒng)。
二、智能語音技術(shù)在導(dǎo)游VR智慧教學(xué)系統(tǒng)中的應(yīng)用
導(dǎo)游VR智慧教學(xué)系統(tǒng)是我校自主開發(fā)的一款智能導(dǎo)師系統(tǒng),該系統(tǒng)整合了虛擬仿真資源、多媒體資源、智能語音功能等,其中智能語音功能是本系統(tǒng)最大的特色。利用語音識(shí)別技術(shù)實(shí)現(xiàn)了講解語音到導(dǎo)游詞文本的智能轉(zhuǎn)換,基于知識(shí)圖譜和語音語料庫能夠?qū)?dǎo)游詞的智能批改;借助語音評(píng)測技術(shù),對(duì)導(dǎo)游講解進(jìn)行智能評(píng)價(jià)和即時(shí)反饋。
(一)語音識(shí)別技術(shù)的應(yīng)用
語音識(shí)別系統(tǒng)的搭建包括兩個(gè)階段:數(shù)據(jù)訓(xùn)練階段、模型匹配識(shí)別階段。在數(shù)據(jù)訓(xùn)練階段,首先對(duì)提前收集的語音語料庫進(jìn)行信號(hào)處理和特征挖掘,得到語音識(shí)別階段所需的語言模型和聲學(xué)模型[4]。因此,語料庫的設(shè)計(jì)顯得尤為重要。
1.語音語料庫的設(shè)計(jì)
語音語料庫是指計(jì)算機(jī)中存儲(chǔ)語言音頻文件和文字副本的數(shù)據(jù)庫。本系統(tǒng)采用了基于語料庫的語音識(shí)別系統(tǒng),本系統(tǒng)中的語音識(shí)別屬于大詞匯量的連續(xù)語音識(shí)別,在設(shè)計(jì)這類語音識(shí)別系統(tǒng)的語音語料庫時(shí),應(yīng)當(dāng)有目的地選擇恰當(dāng)?shù)摹⒛鼙M可能涵蓋各種自然語言現(xiàn)象的語料,以提高語音識(shí)別的質(zhì)量和效率[5]。
根據(jù)導(dǎo)游證考證的要求,我們設(shè)計(jì)了普通話和英語雙語語音語料庫??紤]到江蘇地區(qū)五年制中高職旅游專業(yè)學(xué)生的普通話水平和英語口語水平參差不齊,適當(dāng)降低了對(duì)發(fā)音標(biāo)準(zhǔn)度的要求,在我校旅游管理專業(yè)三年級(jí)學(xué)生中挑選了6位學(xué)生(3男和3女)朗讀了無錫市導(dǎo)游證考證的11篇中文導(dǎo)游詞范文和5篇英文導(dǎo)游詞范文,這些學(xué)生均已通過導(dǎo)游考證且普通話和英語口語處于中等偏上水平,這在一定程度上增強(qiáng)了語音識(shí)別的有效性。
2.導(dǎo)游詞的智能轉(zhuǎn)換與批改
在傳統(tǒng)的導(dǎo)游講解訓(xùn)練中,導(dǎo)游詞寫作采用的是“先寫后說”的訓(xùn)練方式,學(xué)生先寫出導(dǎo)游詞文本,由教師批改后學(xué)生進(jìn)行背誦、講解,這種方式寫出的導(dǎo)游詞通常比較書面化,學(xué)生不容易背誦,講解時(shí)也比較生硬。
為了解決這一問題,導(dǎo)游VR智慧教學(xué)系統(tǒng)設(shè)計(jì)了基于語音識(shí)別技術(shù)的導(dǎo)游詞智能轉(zhuǎn)換與批改功能。學(xué)生利用系統(tǒng)的語音轉(zhuǎn)換功能,將自己口述的導(dǎo)游詞語音錄入系統(tǒng)并實(shí)時(shí)轉(zhuǎn)換成文本。系統(tǒng)對(duì)這些文本進(jìn)行智能批改,將語法錯(cuò)誤、錯(cuò)別字等問題以不同的形式進(jìn)行標(biāo)注,學(xué)生根據(jù)系統(tǒng)給出的批改結(jié)果進(jìn)行反復(fù)的修改與訓(xùn)練,形成更加生動(dòng)、流暢的導(dǎo)游詞。該功能的實(shí)現(xiàn),有效提升了學(xué)生的導(dǎo)游詞寫作能力,創(chuàng)新了“先說后寫”的講解訓(xùn)練模式。
(二)語音評(píng)測技術(shù)的應(yīng)用
1.語音評(píng)測的基本框架與流程
語音評(píng)測首先需要構(gòu)建語音模型和評(píng)分映射模型。該技術(shù)基于一個(gè)標(biāo)準(zhǔn)發(fā)音的語音語料庫,在獲取標(biāo)準(zhǔn)發(fā)音數(shù)據(jù)后,提取其語音特征,進(jìn)而構(gòu)建語音模型,使計(jì)算機(jī)能夠自動(dòng)判斷哪些是標(biāo)準(zhǔn)發(fā)音,哪些是不標(biāo)準(zhǔn)發(fā)音。語音評(píng)測研究包括標(biāo)準(zhǔn)發(fā)音模型的建立、發(fā)音的音段韻律質(zhì)量分析和人工評(píng)分映射訓(xùn)練等核心內(nèi)容[6],語音評(píng)測基本框架如圖2所示。
語音評(píng)測的流程是:系統(tǒng)在接受學(xué)生的語音輸入后,首先提取其語音特征,然后用語音語料庫中的語音模型對(duì)語音特征進(jìn)行音段切分(通常采用Viterbi算法),接著在音段上計(jì)算出各種發(fā)音質(zhì)量測度,最后用訓(xùn)練好的評(píng)分映射模型,把發(fā)音質(zhì)量測度轉(zhuǎn)換為直觀的分?jǐn)?shù)[7]。
2.導(dǎo)游講解智能評(píng)價(jià)
目前導(dǎo)游講解的評(píng)價(jià)模式主要采用主觀性評(píng)價(jià),評(píng)分完全依賴教師的主觀判斷,在實(shí)際教學(xué)中,這種評(píng)測方式存在兩個(gè)比較明顯的問題:(1)主觀性評(píng)價(jià)對(duì)教師來說耗時(shí)耗力,評(píng)價(jià)效率較低。(2)盡管有統(tǒng)一的評(píng)分標(biāo)準(zhǔn),但受到教師自身的語言水平、主觀喜好等諸多因素的影響,不可避免地會(huì)出現(xiàn)評(píng)分偏差,從而影響評(píng)分的可靠性和公正性。
為了解決這兩個(gè)問題,系統(tǒng)加入了導(dǎo)游講解智能評(píng)價(jià)功能,利用語音評(píng)測技術(shù),系統(tǒng)自動(dòng)對(duì)學(xué)生的講解語音進(jìn)行錄制,然后將講解語音與語音語料庫中的標(biāo)準(zhǔn)發(fā)音進(jìn)行分析對(duì)比,根據(jù)預(yù)設(shè)的評(píng)分標(biāo)準(zhǔn)給出評(píng)測分?jǐn)?shù),并將系統(tǒng)無法識(shí)別的語音文字、錯(cuò)誤的發(fā)音文字等進(jìn)行標(biāo)注,學(xué)生根據(jù)評(píng)分和錯(cuò)誤提示及時(shí)糾正自己的錯(cuò)誤,提升導(dǎo)游語言表達(dá)能力。在該功能的設(shè)計(jì)上,我們參考了普通話水平測試系統(tǒng),本系統(tǒng)中的語音評(píng)測目前僅針對(duì)學(xué)生導(dǎo)游講解時(shí)的講解流暢度和發(fā)音標(biāo)準(zhǔn)度進(jìn)行評(píng)價(jià),考慮到導(dǎo)游講解的特殊性,后期還應(yīng)加入針對(duì)講解語調(diào)和情緒的評(píng)價(jià)。
語音評(píng)測功能可以及時(shí)反饋學(xué)生的學(xué)習(xí)情況,能夠讓學(xué)生了解自身存在的問題,從而進(jìn)行有目的的矯正練習(xí)。教師在課上可以借助語音評(píng)測功能了解學(xué)生的導(dǎo)游講解水平,學(xué)生在課前或課后也可以利用語音評(píng)測功能進(jìn)行講解訓(xùn)練,既減輕了教師的負(fù)擔(dān),又增強(qiáng)了評(píng)測的可靠性和公正性。
(三)應(yīng)用效果分析
導(dǎo)游VR智慧教學(xué)系統(tǒng)在我校旅游管理專業(yè)3年級(jí)80名學(xué)生的導(dǎo)游講解實(shí)訓(xùn)中進(jìn)行了初步應(yīng)用,并取得了一定的效果。
1.語音識(shí)別的準(zhǔn)確度
經(jīng)過測試,當(dāng)學(xué)生的講解比較流利且普通話比較標(biāo)準(zhǔn)時(shí),識(shí)別率一般都能達(dá)到95%以上。對(duì)于系統(tǒng)不能識(shí)別的字符,我們設(shè)置了一些特殊符號(hào)以提醒學(xué)生及時(shí)修改;對(duì)于一些生僻字、專用詞,修改后還可以對(duì)語料庫進(jìn)行補(bǔ)充,不斷提高語音識(shí)別的準(zhǔn)確度。
2.語音評(píng)測的可信度
為了檢測語音評(píng)測系統(tǒng)的可信度,我們邀請了5位不同年齡和性別的導(dǎo)游教師對(duì)學(xué)生的導(dǎo)游講解進(jìn)行了人工評(píng)價(jià),測試表明:系統(tǒng)智能語音測評(píng)結(jié)果與人工評(píng)分一致性較高。
3.學(xué)生滿意度調(diào)查
在使用導(dǎo)游VR智慧教學(xué)系統(tǒng)一個(gè)學(xué)期后,我們對(duì)試用了該系統(tǒng)的學(xué)生進(jìn)行抽樣調(diào)查,結(jié)果表明,96%的學(xué)生更愿意使用導(dǎo)游VR智慧教學(xué)系統(tǒng)進(jìn)行導(dǎo)游講解訓(xùn)練,94%的學(xué)生認(rèn)為該系統(tǒng)能夠有效提高自己的語言表達(dá)能力和導(dǎo)游寫作能力。
三、結(jié)語
作為一種成熟的新型信息技術(shù),智能語音技術(shù)顛覆了傳統(tǒng)的導(dǎo)游講解訓(xùn)練方式和評(píng)價(jià)模式。本研究針對(duì)當(dāng)前導(dǎo)游講解訓(xùn)練中存在的導(dǎo)游詞記憶困難、講解生硬等問題,設(shè)計(jì)了基于智能語音技術(shù)的導(dǎo)游VR智慧教學(xué)系統(tǒng),應(yīng)用效果表明該系統(tǒng)能夠有效提高學(xué)生的導(dǎo)游語言表達(dá)能力和導(dǎo)游詞寫作能力。目前,該系統(tǒng)在智能語音功能方面尚不完整,缺少語音合成功能。如何借助語音合成技術(shù),實(shí)現(xiàn)學(xué)生與系統(tǒng)之間的人機(jī)對(duì)話,創(chuàng)設(shè)更加真實(shí)的導(dǎo)游講解訓(xùn)練情境,將是下一步研究的重點(diǎn)。
參考文獻(xiàn):
[1]張?bào)闾m,王保論.智能語音技術(shù)在教學(xué)中的應(yīng)用研究[J].現(xiàn)代教育技術(shù),2011,21(11):1.
[2]黃楠.智能語音技術(shù)在小學(xué)英語教學(xué)中的應(yīng)用研究[D].南昌:南昌大學(xué),2016.
[3]郝惠萍.智能語音教具系統(tǒng)在英語教學(xué)中的應(yīng)用研究[D].蘭州:西北師范大學(xué),2012.
[4]顧亞平.基于智能語音交互技術(shù)的智慧語音助理系統(tǒng)實(shí)現(xiàn)[D].南京:南京郵電大學(xué),2015.
[5]鄒法欣.語音語料庫的設(shè)計(jì)與實(shí)現(xiàn)[D].桂林:廣西師范大學(xué),2012.
[6]梁迎麗,梁英豪.基于語音評(píng)測的英語口語智能導(dǎo)師系統(tǒng)研究[J].現(xiàn)代教育技術(shù),2012,22(11):2.
[7]劉慶升.計(jì)算機(jī)輔助普通話發(fā)音評(píng)測關(guān)鍵技術(shù)研究[D].合肥:中國科學(xué)技術(shù)大學(xué),2010.
◎編輯 魯翠紅