【摘要】商務英語專業(yè)從通用走向?qū)S玫慕徊鎸W科特點及人才培養(yǎng)目標說明商務英語口語測試是評估商務英語專業(yè)語言能力的一個至關重要的環(huán)節(jié)。本文旨通過對現(xiàn)行商務英語專業(yè)口語評分模式,錄音口試不可避免的問題,商務英語專業(yè)標準參照性錄音口試的理論依據(jù)及模糊評分研究等方面的描述試圖探索基于模糊數(shù)學原理的評分模式能夠?qū)ι虅沼⒄Z專業(yè)教育教學起到正反拔效應,為今后商務英語專業(yè)口試的健康發(fā)展提供理論依據(jù)和實踐經(jīng)驗,并促進我國商務英語專業(yè)測試的完善。
【關鍵詞】商務英語;標準參照;模糊數(shù)學原理;錄音口試評分
【作者簡介】梁娟,陜西國際商貿(mào)學院。
引言
商務部和教育部發(fā)布的2011年人才需求信息指出:我國對具備外語能力過硬、商務知識豐富的國際貿(mào)易、國際投資、國際營銷、國際沖裁、國際商務談判等國際商務人才需求強烈;2010年《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020)》和2013年教育部、國家發(fā)展改革委、財政部聯(lián)合制定的《中西部高等教育振興計劃(2012-2020)》明確指出:堅持培養(yǎng)以就業(yè)為導向的適應市場需求的國際化復合人才。2014年APEC峰會在北京的召開仍說明了急需的人才是國際商務英語復合型人才??茖W化的評估機制能夠檢測教育質(zhì)量,對培養(yǎng)學生分析問題、解決問題等綜合素質(zhì)能力,并且規(guī)范和引導教師的教學行為,發(fā)揮著非常重要的鞭策作用。如何客觀、科學地反映和評價每一位商務英語專業(yè)學生的商務理論水平和專業(yè)英語實際應用能力,定量分析比較不同教學模式、不同教師、不同院校的教學質(zhì)量和效果,在參照國際檢測標準上,充分發(fā)揮評分對改進教學的正反拔效應,目前是我國高等教育諸多亟待解決的一個重要課題。而口試測試作為商務英語專業(yè)語言能力評估的一個至關重要的環(huán)節(jié),是眾多反映應試者外語水平能力高低的最直接表現(xiàn),得到外語界人士重視和廣泛的推廣。劍橋商務英語口試、全國國際商務英語口試分別于1993年、2007年考試實施以來,對我國商務英語專業(yè)口語教學起到了極大的促進作用。據(jù)統(tǒng)計2013年,全國已有216所高校開辦了商務英語本科專業(yè),但口試考點的設置不合理,為培養(yǎng)目標的真正實現(xiàn)而發(fā)揮的作用有限。以陜西省為例,只有西安外國語大學培訓部和西北工業(yè)大學外語培訓中心2所院校有條件參加劍橋商務英語口試、全國國際商務英語口試,而口試地點設置的不廣泛普遍存在于浙江、福建、海南等多個省份。眾多高校商務英語專業(yè)的口語教學、測試、評估都由任課教師(有時是外籍教師)自己設定,受試者的過程性成績與終結(jié)性成績也由任課教師面試來評定,受試者口語的真實水平因為口試方式、評分方法等的主觀性和隨意性無法直接反映。又由于我國商務英語專業(yè)正探索從通用走向?qū)S媒徊嫘钥鐚W科特點,應在口語教學、測試和評估中強調(diào)“教考分離”尤為重要。
一、現(xiàn)行商務英語專業(yè)口試評分模式
目前大規(guī)模的商務英語口語測試從測評過程上分為兩類,形成性評估和終結(jié)性評估;從測評的理論基礎上可歸為結(jié)構(gòu)主義口語測評和交際性口語測評。結(jié)構(gòu)主義測評以結(jié)構(gòu)主義語言學為理論基礎,強調(diào)不同的語言成分可以單獨測評。而商務英語專業(yè)語言技能模塊、商務專業(yè)知識模塊及人文素養(yǎng)模塊的交叉學科特點,及商務英語專業(yè)明確的培養(yǎng)目標---即精通英語和商務的國際化復合型英語人才,決定了其測評傾向于交際性口語測評,要求通過完成實際的交流任務時必須在真實或者接近真實的情景中來測量考試運用知識的能力。商務英語專業(yè)的學科特點決定了其測評重視語言的社會交際功能、專業(yè)語言的得體性和有效性。商務英語專業(yè)口試從測評的組織形式上主要分為三類,直接測試、半直接測試和錄音測試(間接測試)。直接測試就是由測試員經(jīng)過與受試者面對面交談后,為受試者的口語表現(xiàn)直接進行評分,商務英語專業(yè)的形成性評估多采用這種形式。半直接測試是由測試員經(jīng)過與受試者面對面交談后,將錄音磁帶交由考試中心統(tǒng)一評分。間接測試即所謂的錄音測試,借由錄音設備(錄音機或計算機)錄下受試者的口語表現(xiàn),交由考試中心和計算機統(tǒng)一評分。從客觀性和公平、公正性角度來看,錄音口試(間接測試)與前兩種測試相比,較適合大規(guī)模的口試評分,從實踐上真正做到了測試和評估中關注的“教考分離”。因此探索商務英語專業(yè)錄音口試的評分方法,以便教師在口語教學實踐中改進教學方法及合理選拔商務英語口語人才提供了理論依據(jù),具有一定的現(xiàn)實意義。
商務英語專業(yè)口試評分模式主要有三種:題目分項評分(Item analytic marking)和能力分項評分(Ability analytic marking)、整體評分(holistic marking). 分項評分法就是測試員依據(jù)分項等級量表按照評分標準,對受試者口語水平、口語能力逐項做出相應評價。整體評分也稱為綜合性評分,是測試員依據(jù)某一總體水平等級量表對受試者口語水平做出總體評價,俗稱印象評分,在商務英語口語形成性評分中,整體評分是最常使用的一種評分方法。無論是題目分項評分法還是能力分項評分法,仍然避免不了每一項的主觀評分;把語言能力分割成不同方面也是任意的,主觀的;且分項評分很容易使得測試員產(chǎn)生光環(huán)效應(Halo Effect), 還要制定各項分數(shù)的加權(quán)方法,耗時耗力。整體評分因為測試員的背景經(jīng)歷、包括BEC教學經(jīng)歷、口語測評與研究經(jīng)歷,以及個人認知標準的差異等因素使得評分過于隨意,過于籠統(tǒng),主觀性較強。大規(guī)模商務英語口試中有時也采用記錯減分法和加分法,會過度關注受試者的語用錯誤或亮點,忽略整體口語水平的考察,如何確定各個因素加分的比例,也是實際應用中難統(tǒng)一的問題。
二、現(xiàn)行商務英語專業(yè)錄音口試的問題
以劍橋商務英語BEC Vantage(中級)口試為例。其口試屬于錄音測試,時間為14分鐘 。測試員多為中國國籍有商務英語專業(yè)課程教學經(jīng)歷的教師,接受過BEC口試培訓,獲得BEC考官證者,以口語測評與研究經(jīng)歷者為優(yōu)先選擇條件。錄音測試完畢后,劍橋大學考試委員會ESOL為體現(xiàn)BEC口試公正性,對測試錄音評估后抽樣再檢測。整個測試分為三個部分,第一部分Interview, 測試員和受試者雙向交流。由一位測試員對兩位受試者輪流提問,另一位測試員記錄成績??疾槭茉囌叩恼Z言溝通能力,總共約3分鐘。第二部分Long turn, 受試者在各自的三個商務話題中挑選一個話題,做一分鐘陳述,期間,測試員會依次向兩位受試者提問相關話題??疾焓茉囌叩恼Z言組織能力,總共約6分鐘。第三部分Collaborative Task, 測試員向兩位受試者提供一個商務話題或者相關的兩個問題,兩位受試者進行3分鐘討論,測試員再向兩位受試者發(fā)問??疾焓茉囌叩乃悸肥欠袂逦?、專業(yè)用語是否準確、反應是否靈敏等??谠嚦煽儾扇?分以上包括3分整為合格分的 5分制評分方法。一位測試員打總體分,一位測試員分項打分。
從上述測試員評分的操作性上看,采用的是整體評分和分項評分相結(jié)合的方法。這樣評定出來的分數(shù)雖然兼顧了綜合評分的整體性和能力分項評分的細致性,但看似“精確”卻過于武斷和絕對,無論是綜合評分標準還是分項評分標準都具有模糊性,但要求測試員在模糊的標準上即刻做出精確評估,從人類的生理機制和哲學上來說,不符合人們從事主觀活動的心理變化,會給測試員施加很大的心理壓力,且測試員之間對評分標準的闡釋和應用多半存在差異性,而個別測試員在參照考試標準的基礎上進行個人構(gòu)建和再構(gòu)建最終版的評分標準,使得測試員之間難以把握評分的一致性。測試員在評測受試者的過程中,一般采用假設—驗證/修訂的循環(huán)式初次印象評分到再評分方法,正因為呈現(xiàn)的是動態(tài)性和循環(huán)性評分過程,而不是恒定不變的評分方法,所以測試員容易被受試者的言談舉證等一切外在因素影響,以至于“光環(huán)效應”嚴重影響評分的客觀性和公平、公正性。李筱菊教授批評了分析評分混淆了“化合物”和“混合物”,各項評分簡單相加,并等于受試者口試能力的綜合表現(xiàn)。測試員在整個評分過程中扮演著三重身份:評判者、監(jiān)察者、聽眾,完全起著中心主導作用,作為評判者,要對受試者言語和意義表達進行不斷分析,依據(jù)再構(gòu)建的評分標準對其做出評判;作為監(jiān)察者,在監(jiān)察受試者言語的理解和意義構(gòu)建的基礎上,還要進行自我監(jiān)察再構(gòu)建評分標準的過程以及分數(shù)決策的過程;作為聽眾,測試員必須集中一切注意力對受試者進行語音解碼和意義構(gòu)建,同時還要做到自我感同身受,從人類生理機制上來說,測試員的疲勞使得其內(nèi)驅(qū)力和內(nèi)省化從開始的測試到即將結(jié)束的測試即使時刻參照標準也無法保持一致性,談何評分的客觀性。
按照辯證法,不同質(zhì)的矛盾需要不同質(zhì)的方法才能解決。現(xiàn)行商務英語專業(yè)評分模式試圖用精確的、靜態(tài)的評分方法描述口語水平、口語能力這個模糊的、動態(tài)的事物,最多也是精確的模糊,反而難以精確。這也是現(xiàn)行商務英語專業(yè)評分模式的癥結(jié)所在,同時也給商務英語研究者提出了一個難題。
三、商務英語專業(yè)標準參照性錄音口試的理論依據(jù)
從Glaser、Klaus、張凱和Brown等文獻中指出的常模和標準參照性口試的本質(zhì)不同在于:常模參照性口試目的是以要測量出受試者在整個群體中的相對位置,以受試者為常模,以受試者組成的隨機樣本為單位,交由不同的測試者負責。當測試員在一天之內(nèi)完成一個樣本的口試時,測試員按照打分情況將整個樣本內(nèi)的受試者口試水平從好到差排個隊,然后把每個受試者的名次按照常模規(guī)定的各等級分數(shù)比例轉(zhuǎn)換成等級分數(shù)。標準參照性口試目的是要測量出受試者的口語能力達到哪一個等級,是以課程標準或教學大綱為參照標準,測試者根據(jù)受試者的口語表現(xiàn)給予相應分數(shù),每個等級沒有限制具體比例的人數(shù)。當編制商務英語標準參照性錄音口試的試題時,應參照現(xiàn)行的《高等學校商務英語專業(yè)本科教學要求》(試行)(以下簡稱《教學要求》),并以此為準則,制定依據(jù)等級標準的試題編制原則和各項評分等級標準。針對目前尚無法參加商務英語專業(yè)全國國際商務英語口試的院校,以現(xiàn)行《教學要求》對商務英語專業(yè)二年級學生的口語(結(jié)合聽力)要求(即全國國際商務英語專業(yè)四級要求)為準則,提出測量目標,并依據(jù)測量目標,制定評分標準。因此商務英語專業(yè)的標準參照性測試相比以常模為主的CET-SET體系,就提高商務英語專業(yè)受試者的口語能力而言,具有現(xiàn)實意義和更強的可操作性。
四、商務英語專業(yè)標準參照性錄音口試的模糊評估研究
1.商務英語專業(yè)標準參照性錄音口試是一種模糊現(xiàn)象。客觀事物存在確定性和不確定性。當表現(xiàn)為確定性、精確性時,實際上是人類意識對事物運動相對靜止狀態(tài)的把握;當表現(xiàn)為不確定性時,實際上是人類意識對事物動態(tài)發(fā)展的連續(xù)性模糊的把握。模糊的把握造成意識的復雜性使人們認識、描述和界定事物的困難。例如生物界難以劃定冬蟲夏草,現(xiàn)代物理難以界定似固體又似液體的水結(jié)晶。語言學家因關注了存在于客觀世界中的人文社會科學和行為科學范疇的模糊概念和模糊語言而受到啟發(fā),誕生了模糊語言學。20世界60年代,心理語言學家在他人運用成分分析法研究詞匯意義時,提出了“原型”概念、“原型意義”(prototypical sense)。原型是某個給定范疇具備理想特征集的“理想的范例”,某個事物是否與該范疇的標準匹配,就要判定這個事物同原型之間是否有充分的相似性。這一匹配過程與本文探討的商務英語專業(yè)標準參照性錄音口試能力的評估有相似之處。與商務英語教學有觀的模糊概念也很多,例如商務英語語言知識水平、商務知識與技能、跨文化交際與溝通能力、商務英語學能與技能、人文素養(yǎng)等,在測試員對它們的描述和判斷無法做出客觀的決策時,人們基于技術(shù)以厚望,尤其是期待計算機技術(shù)能夠解決人類大腦難以解決的問題,這就需要對商務英語口語水平、口語能力等語言模糊現(xiàn)象進行科學的量化分析以及精確的描述。
2.商務英語專業(yè)標準參照性錄音口試的模糊數(shù)學原理描述。模糊數(shù)學原理描述:模糊集合中的隸屬關系的最后確定都帶有很強的主觀性,一般情況它是依據(jù)主體經(jīng)驗或者統(tǒng)計而最后確定,或者由某個權(quán)威給予,所以它總是帶有約定俗成的性質(zhì),因此被測試者很容易接受,例如商務英語標準參照性錄音口試的評分標準、評分細則或者評分指標。表1為商務英語標準參照性錄音口試的“口頭表達”內(nèi)“口語基礎”一項的評分細則。模糊集合本質(zhì)就是主觀依賴于隨意性的東西,存在無法對任何事物、任何人都FIT的精確從屬函數(shù)的方法。李柏年曾提到如果對不同人都FIT的確定方法早就知曉的話,那么“模糊性”就無法存在了。近年來,國內(nèi)眾多測試學研究者在對大規(guī)模的口試評分中尤其是英語專業(yè)口試評估體系中關注和借用了模糊數(shù)學評價方法。然而在商務英語專業(yè)標準參照性錄音口試中尚無一人就此課題做過相關研究。作為商務英語教育工作者,為了培養(yǎng)王立非教授提出的具有扎實英語基本功、合理國際商務知識與技能、寬闊國際視野,掌握法學、管理、經(jīng)濟等相關學科的基本知識和理論,具備較高的跨文化交際與溝通能力、人文素養(yǎng),能在國際環(huán)境下用英語從事經(jīng)貿(mào)、商務、外事、金融、管理等工作的復合型英語人才,我們應該認真思考和關注相關的理論研究和應用研究,予以指導教學體系和改革商務英語標準參照性錄音口試模式,使得商務英語學科日臻成熟,培養(yǎng)出的人才不只是紙上談兵,能夠與國際接軌,應付各種紛繁復雜的國際商務活動。
商務英語專業(yè)標準參照性錄音口試評估根據(jù)模糊數(shù)學原理必須建立幾個集合:
1.評測商務英語標準參照性錄音口試工作的因素集合U=(U1,U2,…UN), 所謂因素集合指影響評測商務英語標準參照性錄音口試工作的各種各樣的因素所組成的集合。因素如表一中的評分細則。
2.確定各評分細則的權(quán)重。A=(a1, a2…an)。權(quán)重分配集ai=(i=1, 2, …n)是因素集U上的一個模糊子集。這里分為三級評價細則,一級評分細則是最底部的細則,也是最基礎的細則,以此到最高層。
3.評分等級V=(v1, v2, …vn)。一般情況下,優(yōu)、良、中、差代表評語等級。就像BEC初級評定成績Pass with Merit、Pass、Narrow Fail、Fail.
4.確定隸屬關系,獲得模糊評判矩陣R=(RIJ)n×m, 其中RIJ=CIJ/C, 其中C表示參加評測的總受試者人數(shù),CIJ表示測試員對受試者的第I個因素UI作出VJ種結(jié)果的測試人數(shù)。
5.模糊矩陣合成運算,確定評定等級B=AR, 期中AR按矩陣的乘法原理運算。
五、結(jié)語
鑒于此文章的應用研究還有待進一步實證分析。但運用模糊數(shù)學原理建立的模糊評分方法從減輕測試員的心理壓力方面,更能保證測試員之間評分的一致性。這種評分方法對商務英語口語能力這一模糊現(xiàn)象的相對客觀評價邁出了一大步。在實際操作中,評分方法簡單,只需要在差、中、良、優(yōu)的評分標準表上打√,之后工作交由計算機處理,不必因為環(huán)境、個人情緒等因素影響為了0.5分權(quán)重之差而壓力過大,影響評分一致性。普通的自主學習語言實驗室比如藍鴿、Lab 100 STS 等都可以做到好的錄音效果。商務英語標準參照性錄音口試的模糊評分方法不僅能夠保證口試自身效度和信度的基礎上,而且還對大規(guī)模的口試有參照的作用,具有主觀測試評分的客觀性和一致性等優(yōu)點。同時商務英語標準參照性錄音口試對無法實現(xiàn)人機對話考試的高校來說有較強的借鑒作用。因此,加大錄音口試的模糊評分方式實證研究,為今后商務英語專業(yè)口試的健康發(fā)展提供理論依據(jù)和實踐經(jīng)驗,促進我國商務英語專業(yè)口語測試的完善具有現(xiàn)實意義。
參考文獻:
[1]梁娟.基于兩種參照測試視角下商務英語考試模式現(xiàn)狀分[J].經(jīng)濟師,2015(06):229-232.
[2]黃銳.標準參照性錄音口試的模糊評分研究[J].外語測試與教學,2011(04):51-55.
[3]王立非,葉興國,嚴明,彭青龍,許德金.商務英語專業(yè)本科教學質(zhì)量國家標準要點解讀[J].外語教學與研究(外國語文雙月刊),2015 (03):297-302.
[4]王立非,李琳.基于可視化技術(shù)的國外商務英語研究進展考察[J].中國外語:中英文版,2014(02):88-96.
[5]王盼盼.英語口語測試評分模式的比較研究[J].西南農(nóng)業(yè)大學學報,2013(06):142-145.
[6]文秋芳.英語口語測試與教學[M].上海:上海外語教育出版社,1999.
[7]王海貞.2007.Rater perceptions of factors that affect the rating of TEM-4 oral test[J].Teaching English in China 30:9-16.
[8]BEC英文官網(wǎng).http://www.cambridgeenglish.org/exams-and-qualifications//business-certificates/business-vantage/whats-in-the-exam/(2014-02-26).
[9]李筱菊.語言測試科學與藝術(shù)[M].湖南:湖南教育出版社,1997.
[10]王海貞.英語錄音口語評分過程研究[J].外語測試與教學,2011 (04):42-49.
[11]張文忠,張姮.基于模糊數(shù)學原理的口語測試模糊評估框架[J].外語教學與研究(外國語文雙月刊),2008(11):433-439.
[12]Glaser R,Klaus D J.Proficiency measurement:Assessing human performance[M]//Gagne R M.(Ed).Psychological principles in systems development.New York:Holt,Rinehart and Winston,1962:419-474.
[13]張凱.標準參照測驗理論研究[M].北京:北京語言文化大學出版社,2002:27-48.
[14]Brown James,Hudson Thom.Criterion-referenced Language Testing[M].London:Cambridge University Press,2002:3-4.
[15]盛楠.英語標準參照性口試與常模參照性口試述略[J].南昌職業(yè)技術(shù)師范學院學報,2001(12):129-130.
[16]伍鐵平.模糊語言學[M].上海:上海外語教育出版社,1999.
[17]Labov,W.1973.The boundaries of words and their meanings[A].In J.Fishman(ed.).New Ways of Analyzing Variation in English[C].Washington,DC:Georgetown University Press.340-373.
[18]Aitchison.J.1994.Words in the Mind:An Introduction to the Mental Lexicon(2nd edition)[M].Oxford:Blackwell.
[19]李柏年.模糊數(shù)學原理及其應用[M].合肥:合肥工業(yè)大學出版社,2007.
[20]金檀,王琰,宋春陽,郭曙綸.口語測試模糊評分方法設計及實驗研究[J].現(xiàn)代外語,2008(05):157-164-49.
[21]陳準民,王立非.解讀《高等學校商務英語專業(yè)本科教學要求》(試行)[J].中國外語,2009(07):4-21.
[22]王相玉.民辦高校學生英語口語教學現(xiàn)狀及提升策略[J].校園英語,2017(06):8-9.
[23]劉筱.大學實用英語口語[M].安徽:安徽師范大學出版社,2017.