古麗江·艾力江 古力努爾·艾爾肯 地里木拉提·吐爾遜 艾斯卡爾·艾木都拉
摘 要:從高自然度參數合成與高精度語種識別技術研究的實際應用需求出發(fā),運用實驗語音學的基本理論和方法,對哈薩克族大學生漢語普通話單元音進行了統(tǒng)計分析。并給出了漢語學習者的單元音共振峰頻率參數和分布規(guī)律,利用共振峰數據作歸一化處理從而分析了元音發(fā)音差異和特點,用實驗數據驗證了其共振峰頻率分布的口耳之學規(guī)律。研究結果對阿爾泰語系語言的語音研究及應用開發(fā)具有較高的參數價值。
關鍵詞:普通話單元音;哈薩克族學習者;共振峰頻率;語種識別
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2018)10-0212-03
Abstract:In order to enhance the high-natural parameters of the synthetic and high-precise language identification technology research and practical application demand, using the basic theory and methods of experimental phonetics, This paper makes a statistical analysis on the monophthong of Kazakh college students in Mandarin Chinese.The Kazakh learner vowel formant distribution and frequency parameter presented, The differences and characteristics of vowels' pronunciation are analyzed by using the resonance peak data as a normalization process.The formant frequency distribution is verified with the experimental data of fragmentary hearsay knowledge. The results of the study have a high parameter value for the speech research and application development of the Altaic language.
Key words:mandarin monophthong; kazakh learner; formant; language identification
1 引言
普通話是現代漢民族共同語的俗稱。它是漢藏語系的一支[1],其基本元音主要包括:/a,o,γ,u,y,i,?, ?/。而哈薩克語屬于阿爾泰語系,是一種黏著型語言,哈薩克語共有九個單元音:/a,o,?, ?,u,?,e,i,y/。各單元音在彼此的元音感知空間內的位置有很大差異[2]。由于單元音可構成音節(jié),因此在參數合成與語種識別技術中常對單元音進行精密的聲學測量。
許多學者對單元音共振峰頻率研究進行了不同角度和不同方法的分析。比如對上海普通話與普通話元音系統(tǒng)的聲學特征對比研究[3],單元音共振峰參數進行處理分析,得到三種不同的共振峰參數,繪制不同共振峰參數下單元音的三維結構圖并進行探討[4],比如對維吾爾語元音共振峰模式的排列等進行了研究[5],以及對維吾爾語的聲頻特性分析和識別等。相比而言,從實驗語音學角度來考察我國國內的阿爾泰語系少數民族漢語單元音聲學的研究相對較少,目前學術界對于新疆哈薩克語背景大學生學習漢語普通話聲學研究成果極少。
因此本文主要從聲學特征角度出發(fā),圍繞新疆大學哈薩克族學生在學習普通話的單元音進行分析。通過對比的方法,得到哈薩克族學生的漢語普通話單元音共振峰值和具體音位特征,本研究對少數民族的語種識別是一項非常必要而且有意義的工作[7-8]。
2 實驗方法
2.1被試情況
該文研究哈薩克族人的漢語普通話單元音聲學特征,即母語為哈薩克語的學生學習普通話的特點,因此把學生的中國少數民族漢語水平等級考試(MHK)口語成績作為依據,將分數在規(guī)定范圍,選取年齡均為20-26歲的15名新疆大學哈薩克族學生(7男,8女)當做被試,他們的母語是哈薩克語,從小學三年級開始學習漢語,漢語水平為 MHK4 級。被試學生的漢語教師都是由民考民學習背景的本民族老師擔任,其父母的漢語水平都不好。從小到大的日常交際用語主要為本民族語言,均無明顯聽力障礙,口齒清晰。另外10名是漢族人,來自北京,他們的普通話屬于標準普通話,平均年齡是24歲。
2.2語音采集與數據處理
在專門的錄音室采集實驗所需語音信息,使用的硬件設備包括筆記本、外置聲卡、麥克風和一些相互連接的數據線。外置聲卡能達到調節(jié)聲量大小、降噪聲、監(jiān)控爆破音等功能。采集軟件為在Matlab環(huán)境下編寫的錄音工程。每個被試者的閱讀資料是50個漢語單字節(jié),采集頻率為16kHz。采集完被試的語音后,將采集的哈薩克族大學生普通話單元音和標準普通話語音進行標注,本研究中對25個人音頻進行手動人工校對,達到的準確率很高。根據已標注的單音節(jié)音,運用 Praat 語音軟件可生成聲音樣本的三維語圖并提取共振峰聲學參數。
3 數據統(tǒng)計與分析
3.1共振峰頻率分析
為了客觀而更準確的研究哈薩克族大學生漢語普通話單元音的聲學特征,本文主要測量了所有單元音的第一和第二共振峰并對共振峰頻率,全部樣點在元音共振峰的相對穩(wěn)定段選取,對所測得的共振峰數據進行了統(tǒng)計,分別計算出單元音的共振峰、標準差、離散度。其中離散度是一項重要指標( 尤其是對于共振峰) ,其中離散度是標準差與平均值的比值,用來衡量各個體距平均值的遠近。當共振峰的離散度大于 l0% 時,在聽覺上可以認為是另一個元音。表 1 和表 2 分別是的共振峰頻率統(tǒng)計結果。
共振峰頻率是語音信號的一個很重要的特征參數,它的配置和時間模式反映出語音音色的重要特征,在語音的分析、識別等研究中被廣泛地利用[6]。共振峰和舌位問題是聲學語音學的基本論問題,很多學者從不同的領域出發(fā)研究了這個問題。表 1和2 結果顯示,共振峰值都比較集中,離散度都小于 10% 。據此我們認為元音和諧在不同的語音環(huán)境中,舌位前后的變化并不造成元音和諧中各元音音質的不同,因此該元音沒有其他音質,語音變化更準確。
3.2 共振峰值歸一化處理
元音共振峰是元音音質最重要的量度,它是由聲帶振動作為激勵源經聲腔共鳴形成的。不同的元音有不同的聲腔形狀,就有各自的共振峰。一般認為,在元音聲學特征來講共振峰(F1、F2)的值與元音的發(fā)音位置呈現出相對較高的相關性,第一共振峰 F1 頻率值與元音發(fā)音的舌位高低成反比,即發(fā)音時舌位越高,F1 值越低,舌位越低,F1 值越高;而第二共振峰 F2 頻率值與發(fā)音時舌位的前后成正比,即發(fā)音時舌位越前,F2 值越高,舌位越后,F2 值越低。
由于語音具有顯著的個體性特征,僅僅以通過均值計算的各樣本共振峰數據無法真實反映其聲音共性,因此,為了更好的分析哈薩克族大學生的漢語普通話單元音聲學特征。本文采用了石峰的聲音格局理論,對共振峰數據進行歸一化處理,首先將各組 F1、F2 值轉換為 Bark 值。實驗得出的具體數據見下表,表3 和表4 分別代表女性哈薩克族學習者與漢語普通話母語者的單元音F1、F2巴克值以及男聲哈薩克族的學習者與漢語普通話母語者的單元音F1、F2巴克值。(KF和KM表示哈薩克族學習者女性和男性,CF和CM表示漢族母語者女性和男性)
表3顯示,哈薩克族學習者女聲與漢語母語者女聲在單元音共振峰頻率值存在異同。通過實驗結果,得出兩組被試者的舌位是否差異顯著,除了/? /外,女性哈薩克族學習者普通話單元音的 F1 均比漢語母語者普通話小,而女性哈薩克族學習者單元音的/a,γ / 的F2之外,其他均比漢語母語者小,就/i,y,? /而言,哈薩克族學習者女聲的F1,F2平均值比漢語普通話母語者的F1,F2平均值稍微低,由此可以推斷,學習者元音產出的舌位偏高又前,元音/ i /F1(4.12>3.7)和F2(15.26>14.60)與母語發(fā)音人的差異最為明顯。其次,元音/y,? /的差異顯著在于F1,哈薩克族學習者舌位高低,F2未能體現出具體統(tǒng)計意義的差別。元音/a/和元音/γ/而言,哈薩克族學習者女聲的F1均值低于漢語母語者,而其產出的F2頻率值高于漢語母語者,其中,元音/a/的產出舌位偏高偏后,與母語發(fā)音人差異則較為顯著。但元音/γ/的產出差異極為顯著,哈薩克族學習者的產出舌位明顯高出,而元音/γ/差異不顯著。對于元音/?,o,u/而言,哈薩克族學習者與漢語母語者單元音/?,o,u/產出的頻率值在F1、F2上無顯著性差異。
表4顯示,哈薩克族學習者男聲單元音/i,y,o,u/來說,F1比漢語母語者高,而其產出的該組元音F2比漢語母語者低,由此而出,學習者的產出的舌位偏低后。通過分析結果顯示,元音/i/和/u/的產出差異較為顯著,學習者舌位明顯偏低,而其F2的數據未能體現出具有統(tǒng)計意義的差別。另外對于元音/y,o/而言,兩組被試者無明顯差異。哈薩克族學習者男聲單元音的 /γ,a,?,?/的F1 均比標準普通話小,除了/?/ 的F2之外,其他哈薩克族學習者男聲比母語者小。兩組被試之間亦存在可辨差異,由此看出,學習者該組元音產出的舌位偏高偏前,尤其是元音/γ /F1(6.56>5.95)和(12.10>11.24)與母語者發(fā)音的差異最為明顯,哈薩克族學習者男聲主要以舌位高低區(qū)分元音/a/,而對于元音/?/差異的主要體現在舌位高低,進一步顯示,元音/?/F1(6.02>6.00)和(12.84>12.09)與母語者元音/?/產出的共振峰值差異不大。
4 結論
通過對哈薩克族大學生漢語普通話單元音進行聲學分析,給出了漢語普通話單元音的共振峰分布參數分析,以及共振峰頻率的統(tǒng)計信息??梢钥闯龉_克族大學生漢語普通話單元音離散度都小于10% 。同時從聲學角度出發(fā)通過比較哈薩克族大學生漢語學習者與漢語母語者八個單元音發(fā)音的第一、第二共振峰巴克值,分析了兩組被試者發(fā)音的差異和特點。
參考文獻:
[1] 朱曉農. 語音學[M].北京商務印書館,2010:190-195.
[2] 劉雙雙. 漢語哈薩克語音位系統(tǒng)對比與對外漢語教學[J]. 華中師范大學研究生學報,2015,22(3):5-8.
[3] 于玨,李愛軍,王霞.上海普通話與普通話元音系統(tǒng)的聲學特征對比研究[J].中文信息學報,2004(6):66-72.
[4] 趙茜. 單元音共振峰參數的三維結構分析[A]. 中國聲學學會.2014年中國聲學學會全國聲學學術會議論文集[C].中國聲學學會:,2014:4.
[5] 阿依努爾·努爾太,祖麗皮亞·阿曼,地里木拉提·吐爾遜,艾斯卡爾·艾木都拉.維吾爾語雙音節(jié)詞元音格局研究[J].計算機工程與科學,2013,35(1):185-190.
[6] 王昆侖,張貫虹,吐爾洪江·阿布都克力木.維吾爾語元音的聲頻特性分析和識別[J].中文信息學報,2010,24(2):122-128.
[7] 武光利.基于GMM的少數民族語自動語種識別系統(tǒng)設計[J].自動化與儀器儀表,2013(06):61-62.
[8]胡月,郭英,張東偉,侯文林,李紅光.基于CV音節(jié)的高效語種識別方法[J].微電子學與計算機,2015,32(10):26-30.