鄭紅娜
摘要: 本文著眼于語音可視化,目的在于揭示中英文輔音的發(fā)音運(yùn)動(dòng)。然而,交叉語言比較的首要任務(wù)是消除特定說話人生理特性等音素引起的固有差別,本文采用了基于說話人歸一化的普氏算法來進(jìn)行說話人歸一化處理,接著利用分層聚類分析算法和多維標(biāo)度定位算法對(duì)相似發(fā)音對(duì)進(jìn)行了量化的比較,從而獲得了英漢相似音素發(fā)音的元音對(duì)比最小對(duì)和輔音對(duì)比最小對(duì),并揭示了這2種語言的易混淆發(fā)音文本對(duì)在發(fā)音動(dòng)作上的區(qū)別。
關(guān)鍵詞: 發(fā)音動(dòng)作; 電磁發(fā)音儀(EMA)AG500; 中英文交叉語言; 普氏變換; 對(duì)比最小對(duì)
中圖分類號(hào):TP391
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):2095-2163(2017)04-0042-02
0引言
[JP+1]長(zhǎng)期以來,人們大都關(guān)注語音的聲學(xué)特性和社會(huì)屬性,很少關(guān)注其生理屬性。但是,心理研究結(jié)果表明:人類交流的3種主要模式(文本傳遞、語音傳遞和面部表情傳遞)中貢獻(xiàn)比例分別為:7%文本+39%語音+54%面部動(dòng)作[1]。因此,帶有視覺信息的語音研究已成為當(dāng)今學(xué)界熱點(diǎn)關(guān)注的課題方向。近年來,隨著發(fā)音動(dòng)作觀測(cè)技術(shù)的日趨成熟,越來越多的研究開始致力于語音生理屬性的探索分析,語音可視化就是在這樣的背景環(huán)境下獲得提出并逐漸發(fā)展起來的一門技術(shù)。[JP]
研究可知,語音可視化就是通過直觀地呈現(xiàn)可見發(fā)音器官(如牙齒、唇等)及不可見發(fā)音器官(如舌頭、軟腭等)的發(fā)音運(yùn)動(dòng),達(dá)到增強(qiáng)語音可懂度和識(shí)別率的目的。該技術(shù)在噪聲環(huán)境、聽覺損傷或其他因素導(dǎo)致的聲學(xué)信息得不到保證的情況下,可發(fā)揮顯著的優(yōu)勢(shì)。
電磁發(fā)音儀(Electro Magnetic Articulography,EMA)是研究微小復(fù)雜動(dòng)作的專用設(shè)備,該儀器可逼真模擬通常不易觀察到的舌頭、軟腭等發(fā)音器官運(yùn)動(dòng)的發(fā)音動(dòng)作[2]。
目前,越來越多的學(xué)者開始了發(fā)音訓(xùn)練的有關(guān)研究,并試圖通過直觀顯示發(fā)音器官運(yùn)動(dòng)的方法來輔助發(fā)音訓(xùn)練[3-4]。
為了有效地幫助母語為漢語的學(xué)習(xí)者學(xué)習(xí)英語發(fā)音以及幫助母語為英語的學(xué)習(xí)者學(xué)習(xí)漢語普通話,有必要通過交叉語言對(duì)比的方法找出英語和漢語中易被第二語言學(xué)習(xí)者錯(cuò)發(fā)或漏發(fā)的發(fā)音文本對(duì),進(jìn)行有針對(duì)性的交叉對(duì)比研究。
1經(jīng)驗(yàn)法獲得中英文輔音三維發(fā)音動(dòng)作文本
本文的語料包括2個(gè)主要部分,分別是:中文部分和英文部分。中英文語料的主要目標(biāo)是建立音素級(jí)和音節(jié)級(jí)的中英文標(biāo)準(zhǔn)發(fā)音動(dòng)作語料庫(kù),用以模擬真實(shí)說話人標(biāo)準(zhǔn)的發(fā)音動(dòng)作。
首先,研究以《英語發(fā)音字典》[5]、《語音學(xué)》[6]、《標(biāo)準(zhǔn)漢語》[7]和《標(biāo)準(zhǔn)漢語語音學(xué)》[8]為準(zhǔn)則選出2種語言中特有的輔音音素(漢語中不存在的英語音素以及英語中不存在的漢語音素,及其相近音素)。表1中即列出了這些音素,表1中的所有音素都用國(guó)際音標(biāo)(International Phonetic Alphabet,IPA)的符號(hào)規(guī)范書寫。
由表1中的音素對(duì)可知,經(jīng)驗(yàn)的易混淆輔音音素包括6對(duì)。這些音素對(duì)在聽覺上將很難辨別,然而,其舌頭和唇部的發(fā)音動(dòng)作卻存在很大的差異,研究結(jié)果呈現(xiàn)可如圖1所示。
圖1則描繪了中英文元音的相似音素的靜態(tài)幀和關(guān)鍵幀,圖中所有音素的靜態(tài)幀都選為同一幀,用虛線標(biāo)示;英語音素的關(guān)鍵幀用實(shí)線標(biāo)示;而普通話的關(guān)鍵幀用點(diǎn)劃線標(biāo)示。圖中用T1、T2、T3分別標(biāo)示了舌尖、舌體和舌后三個(gè)數(shù)據(jù)采集點(diǎn),而用L1、L2和L4分別標(biāo)示了左嘴角、上唇和下唇三個(gè)離散數(shù)據(jù)采集點(diǎn)。
分析圖1可知,這些易混淆的音素具有相同的發(fā)音部位,但是關(guān)于發(fā)音方法和發(fā)音動(dòng)作(包括唇形、舌位舌頭與牙齒或上顎的接觸程度等)卻截然不同。這與日常的經(jīng)驗(yàn)分析結(jié)果也是一致的。
因此,有必要進(jìn)一步在發(fā)音動(dòng)作的層面上區(qū)分這些易混淆的因素對(duì),揭示這些易混淆音素對(duì)的內(nèi)在聯(lián)系和區(qū)別。
2多維標(biāo)度定位算法
多維標(biāo)度定位算法(MultiDimension Scaling, MDS)可以定量比較發(fā)音數(shù)據(jù),并在一個(gè)說話人無關(guān)的發(fā)音空間中直觀地顯示各個(gè)音素,將英語和漢語中音素之間的差距在一個(gè)跨語言的語音空間上進(jìn)行可視化。
音素之間的差距可以通過主觀評(píng)價(jià)和客觀評(píng)價(jià)來標(biāo)定度量。在主觀評(píng)價(jià)中,可以在歸一化的發(fā)音動(dòng)作空間中形象地觀察相似音素對(duì);在客觀評(píng)價(jià)中,可以通過馬氏距離(Mahalanobis Distance)來量化各通道的位移向量。
多維標(biāo)度定位算法的原理是:首先,得到位移向量之間的馬式距離矩陣,生成一個(gè)量化的元音空間作為感知差異矩陣(perceptual dissimilarity matrices);然后,借助這個(gè)矩陣在三維空間進(jìn)行重構(gòu),重構(gòu)時(shí)應(yīng)保證盡可能各分量之間的距離接近原始的距離。
本實(shí)驗(yàn)中,MDS算法的輸入是由12個(gè)輔音音素的位移向量(位移向量是關(guān)鍵幀與靜態(tài)幀的差值)組成,將12個(gè)輔音分別進(jìn)行分析。輸出是在一個(gè)統(tǒng)一的說話人無關(guān)的發(fā)音空間上反映音素間距離的形象表示,具體如圖2所示。
3結(jié)束語
由于英語和漢語兩種語言中有些發(fā)音是極為相似的,這些相似的發(fā)音會(huì)經(jīng)常被外語初學(xué)者漏讀或者錯(cuò)讀,為了更加有效地幫助以漢語為母語的學(xué)習(xí)者練習(xí)英語發(fā)音以及幫助以英語為母語的學(xué)習(xí)者練習(xí)普通話發(fā)音,本文針對(duì)2種語言的特點(diǎn),進(jìn)行了基于最小音素對(duì)的交叉語言對(duì)比。利用多維標(biāo)度定位算法直觀比較了雙語中易被第二語言學(xué)習(xí)者錯(cuò)發(fā)或漏發(fā)的輔音發(fā)音文本對(duì)。
參考文獻(xiàn):
[1] MEHRABIAN A. Communication without words[J]. Psychology Today, 1968, 2(4): 53-56.
[2] [JP3]SUMBY W H,POLLACK I. Visual contribution to speech intelligibility in noise[J]. Acoustical Society of America, 1954, 26: 212.[JP]
[3] WANG Hongcui, KAWAHARA T. Effective error prediction using decision tree for ASR grammar network in call system[C]// ICASSP. Las Vegas, NV, USA:IEEE, 2008: 5069-5072.
[4] CHAPLLE C, JAMIESON J. Computerassisted language learning as a predictor of success in acquiring English as a second language[J]. TESOL Quarterly, 1986, 20(1): 27-46.
[5] JONES D, ROACH P, HARTMAN J. English pronouncing dictionary[M]. 17th ed. New York:Cambridge University Press, 2006.
[6] BALL M J, RAHILLY J, PICKETT J M. PHONETICS—The science of speech[J]. The Journal of the Acoustical Society of America, 2000, 108(6): 2695.
[7] LEE W S, ZEE E. Standard Chinese(Beijing)[J]. Journal of the International Phonetic Association, 2003, 33(1): 109-112.
[8] DUANMU S. The phonology of standard Chinese[M]. 2nd ed. USA:Oxford University Press, 2007.endprint