楊帆 吳莎
(教育部考試中心,北京 100084)
為落實中英兩國教育部部長簽署的《中英教育合作伙伴行動計劃》,在教育部的指導下,教育部考試中心與英國文化教育協(xié)會于2017年12月2日至3日在上海聯(lián)合舉辦“第三屆語言測試與評價國際研討會暨第五屆英語語言測評新方向研討會”。會議以“測評,教學與學習的銜接”為主題,圍繞語言能力標準、人工智能技術(shù)在語言測試中的應用、外語教學及測試的改革與發(fā)展等議題進行深入的交流和討論,探討外語測評在教學和學習中的作用,推動語言測評、教學和學習三者的共同發(fā)展。來自歐美、亞太地區(qū)等23個國家及國內(nèi)的專家學者、國際教育機構(gòu)的500多名代表參加了會議,這是2017年度全球語言測試領(lǐng)域規(guī)模最大的會議。
教育部黨組成員、部長助理鄭富芝出席本次會議,與英國文化教育協(xié)會代表進行了會晤,并在大會開幕式就我國外語教育改革及外語能力測評體系的建設發(fā)表講話。他指出,推進外語教育改革,提高國民外語能力,是為實現(xiàn)“兩個一百年”奮斗目標提供強有力智力支持和人才保障的重要舉措。教育部把外語能力測評體系建設作為推動考試綜合改革的一項重要工作,三年來取得了卓有成效的進展。順利完成中國英語能力等級量表研制,加快建設英語能力等級考試體系,積極推進中國英語能力等級量表與國際知名英語考試的對接研究等。他還提出要用新理念、新技術(shù)、新方式推動外語考試改革,增強相互間的溝通與合作,促進外語教育發(fā)展。教育部考試中心主任姜鋼在會議采訪中指出,語言測試與評價國際研討會是教育部考試中心在中國舉辦的年度學術(shù)研討會。2017年和英國文化教育協(xié)會聯(lián)合舉辦,是落實中英兩國教育部部長簽署的《中英教育合作伙伴行動計劃》、促進教育合作交流的一項重要活動。會議旨在為中國及其他國家地區(qū)的外語教學、測試領(lǐng)域的研究人員,以及考試機構(gòu)和教育政策制定者提供外語教學、學習和測試交流的平臺。他還簡要介紹了外語能力測評體系建設的進展,指出教育改革,標準先行。中國英語能力等級量表即將出臺,國家英語能力等級考試將逐步推出,為各類英語考試與測評提供了衡量能力的指標體系,有助于促進英語教、學、測的協(xié)調(diào)發(fā)展。
本屆語言測評國際研討會為期兩天,包含大會主旨發(fā)言、專題論壇、平行論壇等多個環(huán)節(jié)。主旨發(fā)言邀請到多名國內(nèi)外語言測試知名專家學者,包括廣東外語外貿(mào)大學劉建達教授、英國文化教育協(xié)會首席專家Barry O’Sullivan博士、上海交通大學金艷教授、美國哥倫比亞大學語言測試專家James Purpura教授、英國蘭卡斯特大學語言測試專家Luck Harding教授。同時設置兩個大會專題論壇,多名與會專家分別就“語言能力量表”及“人工智能技術(shù)在語言測試中的應用及研究”進行專題討論。平行論壇涵蓋多個專題,近70場學術(shù)報告,圍繞語言能力量表研究、人工智能技術(shù)的應用研究、外語教學及測試的改革和發(fā)展動向等話題展開學術(shù)交流。本文就大會主要內(nèi)容進行簡要概述。
語言能力量表,是對語言使用者運用語言能力的一系列描述,由低到高覆蓋不同的級別,用于描述語言能力發(fā)展的不同階段[1]。自20世紀50年代起,語言能力量表在國外逐步發(fā)展,迄今已有60多年的歷史[2]。然而我國的語言教學環(huán)境和教育體制與其他國家和地區(qū)存在差異,并不適合直接采用或照搬現(xiàn)有的語言能力等級量表,需要立足于中國國情和國內(nèi)英語教育現(xiàn)狀[3]。2014年9月,國務院發(fā)布的《關(guān)于深化考試招生制度改革的實施意見》中明確提出要加強外語能力測評體系建設,三年來,在教育部的領(lǐng)導下,教育部考試中心及數(shù)百位國內(nèi)外一流專家共同努力,中國英語能力等級量表的研制工作已順利完成。
本次國際研討會上,國內(nèi)外多名語言測試專家、量表研制團隊專家及成員通過大會主旨演講、語言能力標準主題論壇、中國英語能力等級量表專題論壇及平行論壇報告等多種方式,對量表研制理念、方法及成果進行了全面介紹,與會專家對中國英語能力等級量表取得的成果給予了高度的肯定。國內(nèi)專家認為外語能力測評體系建設卓有成效,體現(xiàn)了外語教育發(fā)展方向,提供了貫穿各學段的測評依據(jù),有助于推動外語教育“一條龍”。參會高校教師和研究機構(gòu)代表認為量表倡導學以致用,有助于彌補學生綜合語言運用能力弱的“短板”,將對教學產(chǎn)生積極導向作用。國外學者認為量表研制過程科學、嚴謹、規(guī)范,在多方面填補了國際同類語言標準的空白,為國際語言教育貢獻了中國智慧。
劉建達教授在大會主旨演講中,就中國英語能力等級量表的研發(fā)背景、研制過程及主要內(nèi)容和成果進行了簡要概述,指出中國英語能力等級量表聚焦語言運用,借鑒國際經(jīng)驗并基于大規(guī)模實證研究,將我國學習者的英語能力分為基礎(chǔ)、發(fā)展、熟練三個階段,每個階段包含三個級別,即“三段九級”,并且創(chuàng)新開發(fā)了語用能力、筆譯能力及口譯能力標準,填補了國際同類語言能力標準的空白。中國英語能力等級量表是國內(nèi)首個面向全體學習者的英語能力測評標準,為各級各類英語學習、測試提供共同能力目標參照,為各種英語考試的能力目標銜接定位提供共同標尺。量表將有助于解決我國各項英語考試標準各異,教學與測試目標分離,學習目標不連貫等問題,促進英語考試質(zhì)量的提升,促進英語教、學、測的協(xié)調(diào)發(fā)展,實現(xiàn)英語教學“一條龍”和多種學習成果的溝通互認。他在發(fā)言中還就中國英語能力等級量表的使用提出了相關(guān)建議,指出量表必須在實踐中不斷發(fā)展,在英語教師、測評工作者和學習者的共同努力下不斷完善。
目前,中國英語能力等級量表的研制工作已順利完成,許多國際知名英語測試機構(gòu)已積極與量表研發(fā)團隊溝通,開展國際語言測試與量表的對接工作。英國文化教育協(xié)會首席專家Barry O’Sullivan在大會主旨演講中提出,語言測試與能力標準的對接意義重大,能夠有效確保標準、實施以及評價三者的一致性,對語言學習產(chǎn)生積極影響。同時他對中國在如此短的時間內(nèi)完成量表研制工作表示高度肯定,指出我國量表在翻譯能力和語用能力上的經(jīng)驗值得借鑒,量表研制符合國際規(guī)范。
根據(jù)中英兩國教育部部長的協(xié)議,英國英語考試與中國英語能力等級量表的對接研究工作已全面啟動。Barry O’Sullivan在發(fā)言中總結(jié)了中國英語能力等級量表的特點,闡述了英國英語考試與中國量表對接研究的理論框架及研究方法,指出對接研究已完成了階段任務,計劃于2018年完成中國量表與雅思和普思兩項英語測試的對接工作。
語言能力量表為語言教學和測試提供了標準,如何將量表更好地應用于語言教學和測試也成為與會專家關(guān)注的焦點。
上海交通大學金艷教授以語言能力標準在銜接英語教學與測試中發(fā)揮的作用為主題發(fā)表了大會主旨演講。當前很多語言測試都在開展與語言能力標準的對接工作,但如何通過對接更好地提升語言教育仍然值得探討。金艷教授在發(fā)言中簡要介紹了中國英語能力等級量表研發(fā)的基本原理,肯定了其在語言教育中的重要意義,并從高校英語測試改革的角度,論證了語言能力標準、國家課程標準和測試間的關(guān)系。她同時指出量表在外語教學與測試中的應用前景及可能的挑戰(zhàn),并提出應保證量表的持續(xù)驗證、有效實施,強調(diào)了量表使用過程中合理監(jiān)管的必要性。
美國哥倫比亞大學語言測試專家James Purpura教授從社會語言學的角度對語言測試進行了深入解讀。當前不少測試更多地關(guān)注語言的使用功能,如學習者能用語言做什么。使用語言完成任務的能力固然重要,但語言的語用功能對交際的意義是不可替代的。James Purpura教授的發(fā)言以寫作測試為例,強調(diào)了語用功能的重要意義,學習者的語言能力應當包含語言使用功能和語用意義兩個層面。最后他指出,盡管語用意義較為復雜,在操作層面上挑戰(zhàn)較大,但在語言教學學習和測試中忽略語用功能是不可行的,仍然需要對此進行教學以及考查,以確保語言學習的有效性。中國英語能力等級量表以交際語言能力模型為基礎(chǔ),關(guān)注語言學習者的語用能力和翻譯能力,進而能夠更好地對外語教學和測試產(chǎn)生積極影響。
劍橋大學考試委員會測試研發(fā)總監(jiān)Nick Sav?ille主持了題為“語言能力量表”的專題討論,來自中國英語能力等級量表研制團隊的專家何蓮珍教授、張文霞教授,教育部考試中心吳莎,西班牙教育部的Neus Figueras研究員,日本東京大學的Negishi Masashi教授共同參與,分別就各國語言能力量表的發(fā)展及應用現(xiàn)狀展開熱烈討論。Neus Figueras從目標、特點及影響三個方面總結(jié)了歐洲語言共同參考框架(Common European Framework of Reference for Languages)的發(fā)展。Negishi Masashi教授結(jié)合日本語言測試發(fā)展現(xiàn)狀,簡單介紹了歐洲語言共同參考框架在日本的發(fā)展歷史、現(xiàn)狀以及未來的發(fā)展前景。浙江大學何蓮珍教授以中國英語能力等級量表中的聽力能力量表研制為例,詳細介紹了能力描述語研發(fā)的過程,并通過與歐洲語言能力框架的對比,總結(jié)了中國英語能力等級量表的特點。教育部考試中心吳莎和清華大學張文霞教授基于近期的實證研究,探討了中國英語能力等級量表將對國內(nèi)英語教育產(chǎn)生的影響,同時也就可能出現(xiàn)的擔憂和挑戰(zhàn)提出相關(guān)建議和解決辦法,指出量表下一步的發(fā)展方向:如何更好地與外語教學及測試相結(jié)合,促進國內(nèi)外語教育的改革與發(fā)展。此外,在語言能力標準平行論壇中,多位與會專家學者從多層面、多角度共同探討了中國英語能力等級量表以及國外語言能力標準的現(xiàn)狀和應用。
人工智能的迅速發(fā)展在不斷改變著人類的社會。為加快國家科技建設,把握發(fā)展機遇,2017年7月國務院發(fā)布了《關(guān)于推動新一代人工智能發(fā)展的實施意見》(以下簡稱《意見》)?!兑庖姟分赋?,要建設安全便捷的智能社會,其中明確了智能教育的發(fā)展。為積極響應推進人工智能的國家戰(zhàn)略和國際教育領(lǐng)域的最新發(fā)展趨勢,人工智能技術(shù)在語言測試中的應用及研究也是本次會議的主題之一。教育部黨組成員、部長助理鄭富芝在會議致辭中也特別提到,信息技術(shù)的發(fā)展日新月異,語音識別、人工智能技術(shù)的應用為推動外語考試改革打開了新思路,提供了新路徑,為測評的發(fā)展帶來新的面貌,為教育考試現(xiàn)代化開拓了新的空間。本次會議吸引到眾多相關(guān)領(lǐng)域?qū)<壹翱萍脊镜募夹g(shù)人員積極參與,圍繞語音識別、口語和寫作自動評分及自適應考試等方面展開研討。
英國文化教育協(xié)會首席專家Barry O’Sullivan主持了“人工智能技術(shù)在語言測試中的應用及研究”的專題討論,來自英國劍橋的評價專家、美國培生教育專家以及我國訊飛啟明和流利說技術(shù)公司的專家分別就口語和寫作的自動評分技術(shù)與參會人員進行交流和討論。
英國劍橋評價專家Helen Yannakoudakis以寫作自動評分為例,指出實現(xiàn)自動評分和反饋的重點在于如何使評分系統(tǒng)基于輸入數(shù)據(jù)對新的數(shù)據(jù)進行判斷。因此,就自動評分系統(tǒng)而言,除了機器算法的選擇之外,數(shù)據(jù)輸入是否具有代表性、如何提取重要的語言信息都是決定性的影響因素。同樣,訊飛啟明公司的技術(shù)專家魏思也就寫作自動評分系統(tǒng)在大規(guī)??荚囍械膽脤嵺`進行分享,指出了未來的發(fā)展方向,比如如何評估創(chuàng)造性或藝術(shù)性文本,如何實現(xiàn)篇章邏輯性的評價等。
流利說技術(shù)公司專家林暉以口語的形成性自動評估為題,對口語和寫作、形成性與終結(jié)性評估進行了比較,從大數(shù)據(jù)的角度總結(jié)了語音識別的發(fā)展現(xiàn)狀,并指出該技術(shù)目前的挑戰(zhàn)及未來的發(fā)展方向。美國培生教育專家Ali Van Moere從語言學的角度就口語的終結(jié)性評價進行了探討?;诓煌脑u價目的及輸出語言的受限程度,口語任務分為不同類型。在朗讀、重復對話、給出事實性信息等任務中,考生的語言輸出很大程度上受限于材料輸入,在觀點、批判評價等口語任務中,考生的語言不再局限于材料輸入,而是關(guān)注到語言的內(nèi)容、流利度等方面。如今限定類口語任務自動評分的準確度已達到90%以上,未來需要攻克的挑戰(zhàn)之一是如何從社會語言學的角度,實現(xiàn)自動評分系統(tǒng)對語用功能的評價。英國文化教育協(xié)會首席專家Barry O’Sullivan在對專題論壇進行總結(jié)時指出,人工智能技術(shù)在語言測試的應用已逐步發(fā)展推廣,但仍有未知的領(lǐng)域亟待探索,需要各位專家的不懈努力,使其更好地服務于語言測試的變革和創(chuàng)新發(fā)展。
除專題論壇外,共有來自國內(nèi)外的數(shù)十位專家學者就此話題在大會平行論壇進行了分享。浙江大學陳達建探討了視覺信息在機試聽力中對考生產(chǎn)生的影響。英國文化教育協(xié)會的Richard Spiby以普思英語測試為例,分享了測試改進中的框架創(chuàng)新。流利說技術(shù)公司林暉介紹了大規(guī)模自適應語言測試以及語音識別技術(shù)在分班測試中的廣泛應用。
本次會議基于語言教師的評價素養(yǎng)和教學能力評估兩個話題,對當代語言教師提出更高要求,探討了外語教學的改革及未來的發(fā)展方向。
評價素養(yǎng)是指個體在評價過程中所需的專業(yè)知識和技能,這一概念早在20世紀90年代就已經(jīng)出現(xiàn),但直到近些年才逐漸進入語言測試領(lǐng)域,如2011年“第33屆語言測試研究學術(shù)研討會”召開了以“評價素養(yǎng)”為題的研討會,2013年《語言測試》也就此話題發(fā)表專刊進行探討[4]。教師評價素養(yǎng)是教師教學能力的重要組成部分,測評對教學的反撥作用以及教師對測試的理解將直接關(guān)系到教學的質(zhì)量。而在我國,一般的教師都沒有接受過語言測試方面的培訓,缺乏必要的教師評價素養(yǎng)[5]。本次國際研討會專門開展有關(guān)“語言教師評價素養(yǎng)”的平行論壇,為各位與會專家學者提供交流的平臺,加強對教師評價素養(yǎng)的關(guān)注,推動其在外語教育中的發(fā)展,促進我國外語教育事業(yè)的發(fā)展。
英國蘭卡斯特大學Luck Harding教授以“語言評價素養(yǎng)的過去、現(xiàn)在和將來”為題發(fā)表了大會主旨發(fā)言。他強調(diào)了評價素養(yǎng)的重要意義,并簡要回顧了語言評價素養(yǎng)在過去20年的發(fā)展歷史。從多個維度對評價素養(yǎng)進行分析,并探討比較了相關(guān)群體對此的不同需求。他指出,語言評價素養(yǎng)應關(guān)注到語言中的“意義”,評價素養(yǎng)到評價交流的轉(zhuǎn)變是十分必要的。
為期兩天的平行論壇討論中,來自中國、英國、韓國、越南、新西蘭等十余位專家學者就語言教師測評素養(yǎng)的話題進行了分享。韓國建國大學Hyoshin LEE分析了韓國國內(nèi)英語教育的現(xiàn)狀,指出韓國當前外語教育存在的各種問題,如課程標準與教學、測試目標不一致,外語教師缺乏必要的評價素養(yǎng),等等,同時肯定了課程標準、教學與評價三者間對接的必要性,以此提升教師的評價素養(yǎng),推動外語教育的發(fā)展。越南河內(nèi)工業(yè)大學Tue Hoang院長基于一項質(zhì)性案例研究探討了越南高校教師的外語測評素養(yǎng),同時強調(diào)了測評素養(yǎng)在外語教師專業(yè)發(fā)展中的重要作用。英國文化協(xié)會高級研究員Vivien Berry圍繞“評價素養(yǎng)對外語教師意義”一題展開討論,通過一項實證研究說明外語教師對提升自我評價素養(yǎng)的需求。同時她還指出,中國英語能力等級量表在教學中的應用能夠有效提升語言教師的評價素養(yǎng)。
語言測試不僅可以測量學生的語言能力,同時可以間接地反映教師的教學能力和水平。本次會議開展了以“教師語言教學能力評估”為主題的平行論壇,吸引眾多專家學者展開討論。越南平陽大學Nguyen Le Duy Hai以一項旨在提升該國外語教師語言能力的國家課題為例,指出現(xiàn)有措施及測試未能對教師的專業(yè)發(fā)展乃至課堂實踐產(chǎn)生積極影響,并分享總結(jié)了該國的經(jīng)驗和教訓。伊朗德黑蘭大學Sayyed Mohammad Alavi教授針對外語聽力教師在課堂中的診斷能力展開論述,基于一線教師的實證研究,為教師培訓工作者提供一定的啟示。
本次國際研討會就外語測試的改革及發(fā)展方向展開研討,分設兩個專題:面向就業(yè)需求的外語測試和教育體系下的招生及畢業(yè)外語測試。
習近平總書記在講話中多次指出,為適應全球化發(fā)展的時代特點,提高我國參與全球治理的能力,增強我國在國際上說話辦事的實力,需要一大批具有全球視野、熟練運用外語、通曉國際規(guī)則、精通國際談判的專業(yè)人才。現(xiàn)如今,越來越多的行業(yè)發(fā)展都離不開外語人才,而測試作為人才選拔的重要手段之一,如何在就業(yè)需求中更好地發(fā)揮作用、提升學生的就業(yè)能力,早已成為測試界關(guān)注的重要話題。本次會議的主題之一就是面向就業(yè)需求的外語測試。
浙江大學羅蘭基于一項實證研究,探討了課堂評估對醫(yī)學生專業(yè)英語學習產(chǎn)生的積極影響,指出了課堂評估的重要性和必要性。香港理工大學Al?an Urmston以大學畢業(yè)語言水平測試(GSLPA)為例,對高校畢業(yè)生及招聘人員的寫作水平進行研究,分析了高校教育能否滿足學生的就業(yè)需求。英國文化協(xié)會的Johanna Motteram結(jié)合英國就業(yè)現(xiàn)狀,探討了護理行業(yè)與雅思考試的關(guān)系,試圖解決全球勞動力供給問題。美國培生教育Mike Mayor在發(fā)言中指出,當前多數(shù)職場人員外語能力無法滿足就業(yè)需求,分析了原因并提出解決辦法,將全球英語水平測試標準與職業(yè)能力相對接。同時他還提出,不同職業(yè)對語言能力的要求有所差異,因此,相應的評價方式應當結(jié)合職業(yè)特點有所變化。
與會專家結(jié)合教育體系對于學生語言能力的要求與期望,對招生和畢業(yè)外語能力測試進行深入的探討,以期對外語教學產(chǎn)生積極的反撥和引導作用。
中國人民大學陳倪基于國外高校的招生錄取,就幾項入學外語測試的有效性進行探討,同時強調(diào)了外語測試在全球化教育體系中發(fā)揮的重要作用。浙江大學閔尚超以一項學校內(nèi)部聽力測試為例,對學生聽力能力進行分析,以優(yōu)化聽力課程設計、提升聽力教學。臺灣科技大學黃達夫分享了該校在提升學生外語能力的經(jīng)驗,結(jié)合職業(yè)院校的學生特點,設計了適應學生能力水平的教學材料和畢業(yè)測試,為臺灣高等職業(yè)院校的英語教育帶來一定的啟示。馬來西亞瑪拉工藝大學Suchithra Nair介紹了其國內(nèi)一項面向?qū)W生就業(yè)需求的外語畢業(yè)測試,從考試的設計、發(fā)展及實施等方面分享了經(jīng)驗。
本次國際研討會深入探討了語言測評、教學和學習間的相互作用,涉及語言能力量表、人工智能技術(shù)等多個話題,與會專家學者共同分享了國內(nèi)外外語測試領(lǐng)域最新的發(fā)展現(xiàn)狀和動向。國內(nèi)專家在會上向社會公布了中國英語能力等級量表。教育部考試中心副主任于涵在大會閉幕式上指出,此次會議切合中國教育改革方向,促進了相關(guān)領(lǐng)域?qū)<覍W者的學術(shù)交流。此外,在此次研討會上,教育部考試中心與英國文化教育協(xié)會宣布推出“聯(lián)合研究資助計劃”,雙方將共同資助圍繞中國英語等級量表的研究項目,推動國內(nèi)外語言測評專家就中國英語能力等級量表開展深入研究。本次會議取得了豐碩的成果,為語言測試及教育的發(fā)展和改革指明了新的方向、提供了新的方法。
[1]NORTH B.The development of a common framework scale of lan?guage proficiency[M].New York:P.Lang,2000.
[2]韓寶成.國外語言能力量表述評[J].外語教學與研究,2006,38(6):443-450.
[3]劉建達.我國英語能力等級量表研制的基本思路[J].中國考試,2015(1):7-11.
[4]林敦來,武尊民.國外語言評價素養(yǎng)研究的最新進展[J].現(xiàn)代外語,2014,37(5):711-720.
[5]楊惠中.有效測試、有效教學、有效使用[J].外國語,2015,38(1):2-26.