【摘要】計算機輔助測評英語語音能力是目前英語教學及考核所探討的一個熱點,它能進行既定標準語和目標語的語音質量對比,并提供相當客觀的數(shù)據(jù)分析結果,但其能否替代人工測試達到合理測試語音質量的效果,還有很大的研究空間。所以,本課題以高職院校英語專業(yè)學生為研究對象,采用人工與計算機輔助兩種不同測試方式及手段,對英語專業(yè)學生進行語音能力測試;并依據(jù)英語語音測試與評估的三維度(精準度、可理解度和外國口音)評估標準,對比兩種測評模式的異同;然后在對所得數(shù)據(jù)分析的基礎上,探討兩種測試模式的信度與效度。旨在建立一個公正、客觀、準確的評價機制,用以評價高職英語專業(yè)學生的英語語音能力。
【關鍵詞】高職;英語語音;測評;計算機輔助
【作者簡介】張莉(1982.04-),女,四川南充人,南充職業(yè)技術學院外語系,畢業(yè)于樂山師范學院,大學本科,講師,研究方向:英語教學。
【基金項目】該論文屬于課題《高職英語教育專業(yè)學生英語語音能力測評研究》成果之一。
一、引言
語言是人們進行溝通的重要方式,掌握一門語言的第一步,就是從該語言的發(fā)聲入手,因此,英語語音的教學作為英語教學的第一步,非母語英語學習者的四項基本技能聽、說、讀、寫與社交能力的發(fā)展都是以英語語音為前提。英語語音水平的高低對英語專業(yè)學生就更顯重要。因此,如何評判學生的英語語音水平,包括評判方式,評判依據(jù),評判有效性等因素就成了必需。目前對英語專業(yè)學生的英語語音能力的考核絕大多數(shù)仍采用人工測評,對于計算機輔助系統(tǒng)應用于英語專業(yè)學生的英語語音能力測評實踐的研究尚少有涉及。而對于職業(yè)定向明確的高職院校英語專業(yè)學生,英語語音能力普遍不高,這將影響其職場的能力發(fā)展與交流。因而,尋找更準確、客觀、完善的語音能力測評模式將有助于教師制定不同的教學策略,提高英語專業(yè)學生的語音能力,從而提高語音教學的效果。
英語語言測試與評估主要從精準度、可理解度和外國口音三個方面進行綜合考慮。而無論人工測試還是計算機輔助測試,測試內容的選取和對每項內容的具體評判標準的量化都是影響測評結果的關鍵因素。對于相同測評內容進行不同方式進行測評時,其測評結果的穩(wěn)定性能否體現(xiàn)考核語音質量特點,也應該納入測評可信度高低的分析范疇。
二、人工測評和計算機輔助測評現(xiàn)狀
1.人工測評現(xiàn)狀。目前,專門開展英語語音課程的高職院校不多,且多把重心放在英語綜合應用能力上, 因此在英語口語課程,各級別演講比賽活動中,評判標準也大多傾向被測試者選題熱度,詞匯豐富程度,句法結構復雜程度,話題是否緊扣命題要求等因素,極大程度削弱了對重音,連讀、節(jié)奏,語調等的語音特征的評定。即使評分中對語音細則有說明,也是諸如是否“語音準確,語調自然”之類的粗略描述。在這種模糊概念中進行的整體性評價跟測試人員的個人研究領域或評分經(jīng)驗等有較大關系,因此摻雜個人主觀偏見較多,對不同教育程度的學生所進行的評定會顯得粗略或不客觀。
在有開展了語音課程的院校,對語音課程效果進行考核或評判學生口語能力的時候,測試人員也傾向于采用“整體印象評分”這種更簡單的操作方式,甚至會因為測試人員的個別偏好對某個語音現(xiàn)象嚴重扣分或重復扣分。這對精準考核學生語音能力都是不夠嚴謹?shù)模彩遣还降?,不利于真正評判受試者的語音水平。
2.計算機輔助測評現(xiàn)狀。計算機輔助測評的原理為,將獲取的被測試者的發(fā)音進行特征值提取,然后在參考模型中(很多采用HMM模式)進行匹配、對齊和評分,也就是解碼過程。我院目前采用的數(shù)字化語言實驗室是“藍鴿口語教學”系統(tǒng),在采集被測試者發(fā)音的過程中出現(xiàn)了無法采集聲音或聲音采集不完整的現(xiàn)象,而在彌補這種缺陷時進行反復采集聲音的過程也無疑會影響被測試者的發(fā)音狀態(tài),同時也會增加聲音采集工作量。在匹配、對齊和評分環(huán)節(jié),明顯出現(xiàn)超長語句匹配不適應情況,即不能有效匹配超長語句。系統(tǒng)對超長語句不能識別,或者在進行數(shù)據(jù)分析時只能按照聲音的語段特征提取信息,而且識別標準具有唯一性。而其他測評平臺中,如目前正在推廣使用的MET全民英語APP,其在長句分析的精準度和語調的測評方面,也存在一定不穩(wěn)定因素,比如對意群的劃分不明顯,只認定一種語調,偶爾會出現(xiàn)兩次測評誤差超過10分的情況等。
3.測評方式及測評結果。在測評實驗中,我們將單詞朗讀,對話角色扮演,篇章朗讀三部分作為聲音采集內容,選取我院17級英語專業(yè)學生中作為測試對象,從每個班級隨意選取10份聲音,共60份,作為測評內容,將聲音交由3名不同測試人員和藍鴿口語教學系統(tǒng)測試分別測評。要求對單詞朗讀,對話角色扮演,篇章朗讀三個部分分別打分,了解同一聲音采樣中不同內容對于不同測試人員和計算機輔助測試之間存在的測評差異。統(tǒng)計數(shù)據(jù)時按整體統(tǒng)計和分項統(tǒng)計分別進行:
將每一份采樣聲音作為一個整體,進行整體統(tǒng)計。先根據(jù)藍鴿口語教學系統(tǒng)測評結果,按照分數(shù)高低劃分為優(yōu)、中、差三個等級,再根據(jù)3名測試員測評的結果取平均分數(shù)后按照分數(shù)高低劃分為優(yōu)、中、差三個等級,進行比較發(fā)現(xiàn):20份優(yōu)等級機器測評結果中有15份被人工測評為優(yōu)等級,20份中等級機器測評結果中有14份被人工測評為中等級,20份差等級機器測評結果中有10份被人工測評為差等級。
B.將采樣聲音按各部分(單詞朗讀,對話角色扮演,篇章朗讀)分別統(tǒng)計。先根據(jù)藍鴿口語教學系統(tǒng)測評結果,將三部分內容分別按照分數(shù)高低劃分為優(yōu)、中、差三個等級,再根據(jù)3名測試員測評的結果將三部分內容分別取平均分數(shù)后按照分數(shù)高低劃分為優(yōu)、中、差三個等級,進行比較發(fā)現(xiàn):單詞朗讀部分,20份優(yōu)等級機器測評結果中有19份被人工測評為優(yōu)等級,20份中等級機器測評結果中有19份被人工測評為中等級,20份差等級機器測評結果中有20份被人工測評為差等級;對話部分,20份優(yōu)等級機器測評結果中有17份被人工測評為優(yōu)等級,20份中等級機器測評結果中有15份被人工測評為中等級,20份差等級機器測評結果中有15份被人工測評為差等級;篇章朗讀部分,20份優(yōu)等級機器測評結果中有13份被人工測評為優(yōu)等級,20份中等級機器測評結果中有12份被人工測評為中等級,20份差等級機器測評結果中有14份被人工測評為差等級。
統(tǒng)計數(shù)據(jù)進行分析結果顯示,從單詞朗讀,對話角色扮演,篇章朗讀三方面 進行整體測評,人工測評和計算機輔助測評的結果契合度為75%。但僅僅從單詞朗讀方面的測試分數(shù)顯示,人工測評和計算機輔助測評的結果契合度為96.7%;從對話角色扮演方面的測試分數(shù)顯示,人工測評和計算機輔助測評的結果契合度為78.3%;而從篇章朗讀方面的測試分數(shù)顯示,人工測評和計算機輔助測評的結果契合度為66.7%。結果顯示,計算機輔助測評在單詞中音素、音節(jié)、詞重音、輔音連綴方面的測評在精準度和穩(wěn)定性上非常高,有較高可信度,較人工測試的客觀性也更強,但在處理對話和篇章朗讀時,對超音段因素如詞間連讀,失去爆破,語句重音,意群、語調的判斷就不能合理有效的判別了,尤其是對20詞以上的長句,表現(xiàn)特別明顯。
三、高職英語語音測評的建議
1.人機共測,彰顯客觀公平。介于英語語音人工測評和計算機輔助測評對獨立單詞中音素、音節(jié)、詞重音、輔音連綴方面測評較為準確,客觀,但在處理對話和篇章朗讀時,對長句中如詞間連讀,失去爆破,語句重音,意群、語調、語流、可理解度等因素的判斷不能做到合理有效,因此可以將測評內容按不同任務分類,分不同方式進行測評。將單詞、短語、短句等音段類考察內容交由計算機輔助測評,充分發(fā)揮計算機客觀、精準的優(yōu)勢;將篇章等有長句的超音段內容交由人工測評,盡量避免計算機對不容易進行量化的語調、語流、可理解度等主觀因素造成的處理不適宜,也可以對該部分內容采取人機共測的方式,以達到最大化客觀準確判斷被測試者的英語語音水平的效果。
2.計算機輔助測評對語音教學具有反撥作用。在語音學習過程中,大多數(shù)老師和學生都會在不同程度上遇到不斷重復的枯燥,也會有對某一音進行糾音卻屢不見效果的苦悶。針對計算機輔助測評功能在單詞和音素上的優(yōu)勢,可以利用計算機輔助語音訓練達到高效提高語音水平的目的,從而改進傳統(tǒng)語音音素訓練和教學口授耳聽的單一模式,以及課后訓練缺乏及時反饋指導的弊端。通過將學生利用計算機輔助語音訓練的結果進行分析篩選,總結歸納出某一班級或某一地域群體存在的發(fā)音問題共性,以此作為教學和糾音的重點,這將極大提高學生語音學習效率。
訓練方式多樣化也將在一定程度上提高學習效率。充分利用計算機測評結果即刻呈現(xiàn)的分數(shù),激發(fā)學習者不斷挑戰(zhàn)更高分數(shù)的興趣,讓學習者在大量的刺激練習環(huán)境中將語音得到有效鞏固,使教學和學習同步輕松。
四、結語
計算機輔助用語音測評對提高測評效率,擴大測評受眾面有非常積極的意義,這對提高英語語音教學質量也具有重大意義。但由于不同測試平臺采用的語音識別技術、技術參數(shù)設置等的差異,必將導致測評效果會有差異,況且同一平臺在同一被測評者穩(wěn)定發(fā)揮時的測評結果也會存在差異,加上測試卷的制定是否能全面客觀體現(xiàn)出被測試者的英語語音水平,口音是否作為評判的重要內容等問題沒能到有效決,我們將在這些方面繼續(xù)深入研究。
參考文獻:
[1]張娟.語音識別系統(tǒng)的簡述[J].科技資訊,2006:38.
[2]陳樺.英語語音評測的現(xiàn)狀與思考——一項對標準化口試評分員的調查[J].外語與外語教學,2017 (5) :81-87.
[3]滕海坤.基于語音識別技術的英語發(fā)音評測系統(tǒng)研究英[J].鹽城工學院學報:自然科學版,2016(1):17-22.
[4]梁迎麗.基于語音測評的英語口語智能導師系統(tǒng)研究[J].現(xiàn)代教育技術,2012(11):82-85.
[5]周必水.語言理解在計算機輔助測評中的應用[J].杭州電子工業(yè)學院院報,2003(2):28-32.