陳梅 李振杰
摘 要:濟(jì)南智能旅游咨詢員,把電子科技與旅游業(yè)相結(jié)合,同時(shí)運(yùn)用3D人物虛擬技術(shù),人機(jī)智能交互等技術(shù)來(lái)完成。通過(guò)生動(dòng)的人物形象、肢體語(yǔ)言,以及智能語(yǔ)音系統(tǒng),讓游客在用文字進(jìn)行軟件使用的同時(shí),增加了語(yǔ)音識(shí)別功能,進(jìn)行語(yǔ)音輸入及輸出,提高服務(wù)質(zhì)量。文對(duì)3D虛擬人物和語(yǔ)音系統(tǒng)的實(shí)現(xiàn)技術(shù)、方法做了詳細(xì)的介紹,用此方法最終完成旅游咨詢員的各方面功能實(shí)現(xiàn),更好的服務(wù)于來(lái)濟(jì)南游玩的游客。
關(guān)鍵詞:智能旅游;3D;人機(jī)交互;語(yǔ)音識(shí)別
人機(jī)交互技術(shù),是指通過(guò)計(jì)算機(jī)輸入輸出設(shè)備,以有效的方式實(shí)現(xiàn)人與計(jì)算機(jī)對(duì)話的技術(shù)。本系統(tǒng)中,人機(jī)交互技術(shù)主要體現(xiàn)在了智能語(yǔ)音識(shí)別技術(shù)上,語(yǔ)音識(shí)別與三維動(dòng)畫同樣是本項(xiàng)目的智能核心所在。將語(yǔ)音技術(shù)運(yùn)用到計(jì)算機(jī),便可以使計(jì)算機(jī)能夠識(shí)別、接收、處理語(yǔ)言,使計(jì)算機(jī)技術(shù)運(yùn)用起來(lái)更方便,更加易于操作。濟(jì)南智能旅游咨詢員項(xiàng)目,采用語(yǔ)音技術(shù)與軟件相結(jié)合,將人聲通過(guò)麥克風(fēng)輸入到計(jì)算機(jī),然后進(jìn)行處理,同時(shí),具有文本播報(bào)功能,可以將游客查詢時(shí)所得到的文本答案通過(guò)語(yǔ)音播報(bào)出來(lái)。
1.語(yǔ)音識(shí)別
語(yǔ)音識(shí)別的目的是讓計(jì)算機(jī)能夠聽(tīng)懂人的語(yǔ)言,對(duì)于識(shí)別結(jié)果,包含兩種:一是聽(tīng)懂后能夠轉(zhuǎn)換成書面文字,二是可以聽(tīng)到后進(jìn)行理解,做出正確的動(dòng)作。
在本項(xiàng)目上的語(yǔ)音功能實(shí)現(xiàn)技術(shù)上,便是采用微軟的win7及以上操作系統(tǒng)自帶的speech語(yǔ)音識(shí)別功能。通過(guò)代碼將該功能進(jìn)行引用,簡(jiǎn)單方便。引用成功后,當(dāng)開(kāi)啟語(yǔ)音功能識(shí)別時(shí),可以調(diào)動(dòng)系統(tǒng)的語(yǔ)音識(shí)別功能,人的聲音通過(guò)麥克風(fēng)輸入到計(jì)算機(jī),計(jì)算機(jī)接收后進(jìn)行識(shí)別理解,然后將識(shí)別的結(jié)果轉(zhuǎn)換成相應(yīng)的動(dòng)作或者命令。
Speech的語(yǔ)音識(shí)別有文本識(shí)別與命令識(shí)別兩種方式,區(qū)別如下:
微軟語(yǔ)音識(shí)別中的文本識(shí)別與命令識(shí)別最大的區(qū)別是匹配字典不同。
文本識(shí)別是用的通用字典內(nèi)容多,覆蓋的詞匯量較大,字典由sdk提供,適用于沒(méi)有預(yù)定目標(biāo)的隨機(jī)聽(tīng)寫之類的應(yīng)用。因?yàn)闆](méi)有預(yù)定目標(biāo),詞匯量大,會(huì)導(dǎo)致識(shí)別時(shí)的精確度降低,識(shí)別速度慢。
SpeechVoiceSpeakFlags SpFlags = SpeechVoiceSpeakFlags.SVSFlagsAsync;
SpVoice Voice = new SpVoice();
上述代碼實(shí)現(xiàn)后,開(kāi)啟語(yǔ)音識(shí)別,使用者利用麥克風(fēng),將人聲輸入到計(jì)算機(jī),輸入到計(jì)算機(jī)后,計(jì)算機(jī)會(huì)進(jìn)行理解、識(shí)別,然后將識(shí)別的結(jié)果轉(zhuǎn)化為相應(yīng)的動(dòng)作,省去了人工,解放了雙手,使得使用者通過(guò)語(yǔ)音便可以達(dá)到自己的需求。在此功能的實(shí)現(xiàn)上,主要使用了speech.lib和SpShareRecConteatClass兩個(gè)接口,在項(xiàng)目中先引用speech.lib命名空間,然后在SpShareRecConteatClass對(duì)象中構(gòu)造一個(gè)語(yǔ)法器,各語(yǔ)法器加載到識(shí)別器中,然后識(shí)別器開(kāi)始艦艇符合該語(yǔ)法的各個(gè)語(yǔ)音,當(dāng)識(shí)別出符合的語(yǔ)法時(shí),調(diào)用SpShareRecConteatClass時(shí)間處理程序。
同時(shí),為了提高語(yǔ)音識(shí)別的準(zhǔn)確率,增加了關(guān)鍵字查詢,實(shí)現(xiàn)智能查詢功能。在一方面的實(shí)現(xiàn)上,添加了speech.xml文件,在該文件夾下會(huì)有各個(gè)功能的xml文件,添加了關(guān)鍵詞,減少了在語(yǔ)音識(shí)別時(shí)的需要匹配的詞匯量,提高了識(shí)別速度。
2.語(yǔ)音朗讀查詢
智能旅游咨詢員在人機(jī)交互技術(shù)的實(shí)現(xiàn)上面,除了可以用計(jì)算機(jī)進(jìn)行語(yǔ)音識(shí)別,讓使用者語(yǔ)音對(duì)軟件進(jìn)行控制操作外,還可以將游客使用時(shí)查詢到的答案通過(guò)語(yǔ)音播報(bào)出來(lái),讓游客不僅可以得到查詢的文字結(jié)果,同時(shí)可以語(yǔ)音播放這些文字。實(shí)現(xiàn)此功能時(shí),需要在設(shè)計(jì)的引用時(shí)添加speech.lib,通過(guò)在每個(gè)功能頁(yè)面編寫相應(yīng)代碼,就可以使得文本框里查詢到的文字答案通過(guò)語(yǔ)音播放出來(lái)。
3.智能人物
本系統(tǒng)的3D智能人物,借用下載的人物形象。該虛擬人物利用3DMAX進(jìn)行保存修改,然后借助Microsoft Expression Blend對(duì)模型進(jìn)行動(dòng)作設(shè)計(jì),再引入到VS環(huán)境中。Microsoft Expression Blend是一款功能齊全的專業(yè)設(shè)計(jì)工具,用來(lái)針對(duì)基于Microsoft Windows 和 Microsoft Silverlight的應(yīng)用程序制作精美復(fù)雜的用戶界面。Microsoft Expression Blend主要有以下功能:
(1)易于使用且新穎的可視界面,帶有可??康拿姘搴兔嫦?qū)ο蟮纳舷挛牟藛?
(2)全套矢量繪圖工具,包括文本工具和三維(3D)工具;
(3)三維和媒體支持,可增強(qiáng)用戶體驗(yàn);
(4)先進(jìn)、靈活且可重用的自定義和外觀選項(xiàng),適用于各種常用控件;
(5)實(shí)時(shí)動(dòng)畫;
(6)實(shí)時(shí)的設(shè)計(jì)和標(biāo)記視圖;
(7)強(qiáng)大的數(shù)據(jù)源和外部資源集成點(diǎn);
(8)從 Expression Encoder ?導(dǎo)入站點(diǎn)的功能;
(9)從 Expression Design導(dǎo)入作品的功能;
(10)可以與 Visual Studio 2012 交互使用,從而幫助設(shè)計(jì)人員和開(kāi)發(fā)人員更緊密、更有效地進(jìn)行團(tuán)隊(duì)協(xié)作。
首先,我們用3DMAX打開(kāi)下載的三維動(dòng)畫模型,將不匹配的部分進(jìn)行修改,然后保存為obj格式,在導(dǎo)出對(duì)話框選擇在下一步需要的顏色、圖片等。保存好后,這時(shí)候便需要上述提到的Microsoft Expression Blend,打開(kāi)后新建WPF應(yīng)用程序,從項(xiàng)目中添加現(xiàn)有項(xiàng),然后將通過(guò)3DMAX保存的包括人物模型、顏色的.mtl和.obj的兩個(gè)文件添加到項(xiàng)目中,此時(shí)便將3D模型導(dǎo)入進(jìn)了WPF中。
在本項(xiàng)目中,要求在某些功能界面需要3D人物對(duì)用戶進(jìn)行一些介紹,因此,要求人物的動(dòng)作、功能、語(yǔ)音三者之間相互配合,配合默契,才使智能交互表現(xiàn)的更加完美。而且,在進(jìn)行語(yǔ)音朗讀時(shí),3D人物可以表現(xiàn)出相應(yīng)的動(dòng)作,正如一個(gè)真實(shí)導(dǎo)游為游客介紹。
4.結(jié)論
本文介紹了智能旅游咨詢員系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)的基本實(shí)現(xiàn)過(guò)程,系統(tǒng)利用了智能語(yǔ)音識(shí)別、語(yǔ)言理解、3D動(dòng)畫人物等技術(shù),基本實(shí)現(xiàn)了具有真實(shí)感,人性化的3D人物,用戶可以通過(guò)語(yǔ)言、文本兩種方式進(jìn)行問(wèn)題查詢,得到想要的結(jié)果,并通過(guò)語(yǔ)音播放,利用3D人物將查詢答案朗讀出來(lái)。加強(qiáng)了文本、圖像與聲音的處理,提高了人機(jī)交互的能力和操作時(shí)的人性化。
項(xiàng)目支持:國(guó)家級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目——智能旅游咨詢員(編號(hào):201713324141)
參考文獻(xiàn)
[1]佩佐德著,蔡學(xué)鏞譯.Windows Presentation Foundation程序設(shè)計(jì)指南[M].電子工業(yè),2008
[2]林大為.3D游戲角色制作[M].華東師范大學(xué)出版社,2009
(作者單位:山東協(xié)和學(xué)院)