• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      中國語言測試之源與流

      2019-01-04 00:46:03何蓮珍
      關(guān)鍵詞:效度考試測試

      何蓮珍 張 娟

      (浙江大學(xué) 語言與翻譯系, 浙江 杭州 310058)

      現(xiàn)代意義上的語言測試于20世紀(jì)60年代初被確立為應(yīng)用語言學(xué)的分支學(xué)科[1],是語言教學(xué)活動的重要環(huán)節(jié)之一[2]。在中國,外國語言學(xué)及應(yīng)用語言學(xué)的創(chuàng)立要?dú)w功于學(xué)界泰斗桂詩春。憑借其敏銳的學(xué)科洞察力和前瞻力,桂詩春牢牢把住了應(yīng)用語言學(xué)在我國發(fā)展的時(shí)效性和必要性,王宗炎稱他為“不知疲倦的開山大力士、不言歇息的開路領(lǐng)航人”[3]4。隨著應(yīng)用語言學(xué)在中國的興起,語言測試這一分支得以開花、結(jié)果。自桂詩春主持開發(fā)我國首個(gè)英語水平考試(English Proficiency Test,EPT)以來,我國的語言測試在其指引下不斷在現(xiàn)代化道路上前進(jìn)。桂詩春作為我國引進(jìn)標(biāo)準(zhǔn)化考試的第一人,被譽(yù)為“中國語言測試之父”[4]359。

      新中國成立以來,理論、技術(shù)、方法的引介和創(chuàng)新為我國語言測試的發(fā)展持續(xù)注入了生命力。本文著眼于語言測試在我國的發(fā)源、實(shí)踐與走向,嘗試在新中國成立七十年,尤其是改革開放四十年的歷史畫卷中,描繪我國語言測試學(xué)者所做出的有益探索,提出三個(gè)值得進(jìn)一步研究的方向,以促進(jìn)我國測試研究的科學(xué)化、系統(tǒng)化。

      一、 中國語言測試之源

      高考制度的恢復(fù)為我國語言測試的發(fā)展提供了契機(jī)。囿于我國當(dāng)時(shí)教育測量學(xué)基本理論及研究方法不足,科學(xué)的考試幾乎無法有效開展。桂詩春積極引入國際主流的測試?yán)碚摚瑸闃?biāo)準(zhǔn)化考試的自主研發(fā)提供理論支持。1978年對我國語言測試領(lǐng)域而言具有里程碑式的意義,主要體現(xiàn)在四個(gè)方面:第一,我國第一個(gè)應(yīng)用語言學(xué)碩士點(diǎn)在廣州外國語學(xué)院設(shè)立;第二,我國第一份外國語言學(xué)及應(yīng)用語言學(xué)學(xué)術(shù)刊物《現(xiàn)代外語》在廣州外國語學(xué)院創(chuàng)刊;第三,全國首屆外語教育座談會在京召開[5];第四,由桂詩春主持、我國自主設(shè)計(jì)的EPT項(xiàng)目啟動[4]。

      EPT是中國有史以來第一次引進(jìn)國際現(xiàn)代考試科學(xué)理論,把考試作為一門科學(xué)建立起來的全國性考試,也是我國首次取得國際承認(rèn)的考試,其連年舉辦為我國哺育和造就了第一批考試科學(xué)人才[3]3。EPT最初用于測量出國留學(xué)人員的英語水平,其目的是預(yù)測考生的托福紙筆考試成績,避免其因英語尚未達(dá)到一定水平,在正式托??荚囍械貌坏嚼硐敕?jǐn)?shù)而造成外匯浪費(fèi)。EPT與托福紙筆考試成績的相關(guān)系數(shù)高達(dá)0.86[6]。EPT的設(shè)計(jì)與開發(fā)為我國標(biāo)準(zhǔn)化考試改革積累了寶貴經(jīng)驗(yàn)。

      我國另一項(xiàng)早期的語言測試實(shí)踐是高等學(xué)校入學(xué)英語考試(The Matriculation English Test,MET)。20世紀(jì)80年代初,我國的英語教學(xué)觀嚴(yán)重滯后,從中學(xué)到大學(xué),幾乎無一例外地將語言作為知識而非能力來學(xué)習(xí)。對此,李筱菊首先撰文介紹了“交際能力”這一概念及與之相對應(yīng)的交際教學(xué)法,即同時(shí)注重語言知識、技巧和能力的培養(yǎng)[7],并于1987年出版了《交際英語教程》[8]。然而,要想從整體上改變中國的語言教學(xué)觀,寫文章、出版教材對教學(xué)的影響遠(yuǎn)不及考試。意識到這一問題后,“廣外雙杰”桂詩春與李筱菊決定從考試入手,改變我國外語教學(xué)“重知識、輕能力”的教學(xué)觀,通過考試的正面反撥效應(yīng)推動外語教學(xué)改革。1982年,桂詩春及其團(tuán)隊(duì)開發(fā)了MET,引進(jìn)了第一臺光電閱讀器,研發(fā)了我國第一個(gè)題項(xiàng)分析軟件GITEST。1985年,廣東省高考標(biāo)準(zhǔn)化改革試驗(yàn)開始,拉開了我國考試現(xiàn)代化改革的序幕[9]。1989年,MET推廣至全國,并更名為National Matriculation English Test(NMET)。結(jié)合我國考生規(guī)模大、水平差異大的特點(diǎn),桂詩春等摸索出了符合中國國情的標(biāo)準(zhǔn)化考試改革的基本經(jīng)驗(yàn)[10]。MET堅(jiān)持在現(xiàn)代教育測量學(xué)和教育統(tǒng)計(jì)學(xué)的理論指導(dǎo)下進(jìn)行統(tǒng)計(jì)分析,試驗(yàn)期間,桂詩春團(tuán)隊(duì)對MET的成績分布、題項(xiàng)分析、評卷誤差控制、標(biāo)準(zhǔn)分及常模等進(jìn)行了逐項(xiàng)報(bào)告[11]。這項(xiàng)改革于國內(nèi)而言,“創(chuàng)建了我國有史以來第一個(gè)全國規(guī)模的標(biāo)準(zhǔn)化考試,使我國考試科學(xué)從理論到實(shí)踐都開創(chuàng)了一個(gè)新紀(jì)元”[3]3;于國際而言,在超大規(guī)模選拔性考試的標(biāo)準(zhǔn)化方面,測試?yán)碚?、技術(shù)難題均實(shí)現(xiàn)了突破。

      伴隨著EPT、(N)MET等測試實(shí)踐的開展,桂詩春結(jié)合標(biāo)準(zhǔn)化考試的設(shè)計(jì)和組織經(jīng)驗(yàn),從以下四個(gè)方面提出了一系列觀點(diǎn)和主張,為語言測試學(xué)科的發(fā)展筑路鋪石。第一,呼吁學(xué)界開展教育測量學(xué)研究,鼓勵(lì)學(xué)界用不同的測試手段和統(tǒng)計(jì)方法檢驗(yàn)教學(xué)效果,實(shí)現(xiàn)考試領(lǐng)導(dǎo)體制上的制度化、組織上的專業(yè)化、方向上的標(biāo)準(zhǔn)化和技術(shù)上的電腦化[12]。此外,桂詩春身體力行,在引介項(xiàng)目反應(yīng)理論(Item Response Theory,IRT)的同時(shí),倡導(dǎo)并實(shí)踐計(jì)算機(jī)技術(shù)在語言測試中的應(yīng)用[13]。第二,將認(rèn)知科學(xué)引入語言測試,提出了以認(rèn)知信息處理模型(Cognitive Information-Processing Models,CIP)為基礎(chǔ)的語言測試,并嘗試在閱讀測試及評分中應(yīng)用該模型[14]。第三,呼吁制定亞洲統(tǒng)一的英語語言能力等級量表,促進(jìn)亞洲地區(qū)語言教學(xué)和語言測試的發(fā)展[15]。第四,關(guān)注語言測試的多維性,發(fā)揮考試的正面反撥效應(yīng)??荚嚨膬?yōu)劣取決于內(nèi)部和外部雙重因素。內(nèi)部因素主要指考試本身的質(zhì)量,包括考試的信度、效度及區(qū)分度等;外部因素則主要指考試管理的公平性、考試結(jié)果使用的正確性及考試結(jié)果誤用的可能性[16]。相應(yīng)地,建立考試的黃金法則須從內(nèi)部、外部兩方面入手[17]。桂詩春為我國外語考試建基立業(yè),為我國語言測試與教學(xué)的良性發(fā)展開拓疆域,更為我國的測試從業(yè)人員留下了一座巨大的寶庫。

      二、 中國語言測試之實(shí)踐

      (一) 考試的內(nèi)部因素

      我國的語言測試學(xué)者探索了一系列新理論、新技術(shù)與新方法,從測試內(nèi)部問題入手,穩(wěn)步提升語言測試的科學(xué)性。

      語言測試在理論層面的研究呈現(xiàn)出明顯的跨學(xué)科特征,認(rèn)知科學(xué)、教育測量學(xué)、心理學(xué)及隸屬于應(yīng)用語言學(xué)范疇的二語習(xí)得均為測試的研究與實(shí)踐提供了思路。自桂詩春引介IRT,闡明其相較于經(jīng)典測量理論的優(yōu)點(diǎn)[13]之后,多層面Rasch模型(MFRM)作為項(xiàng)目反應(yīng)理論的延伸被廣泛應(yīng)用于評分的信度研究。何蓮珍、張潔對某次大學(xué)英語四、六級口語考試的成績進(jìn)行分析,運(yùn)用MFRM明確了測量誤差的來源及其大小,對提高評分信度具有一定參考價(jià)值[18]。借鑒二語習(xí)得的最新研究成果,韓寶成撰文介紹了動態(tài)評價(jià)(Dynamic Assessment,DA)理論,DA視域下的測評將教學(xué)、評估、干預(yù)、診斷、培訓(xùn)等環(huán)節(jié)有機(jī)結(jié)合,更加關(guān)注學(xué)習(xí)者未來的發(fā)展,不失為“以評促學(xué)”的有效實(shí)現(xiàn)手段[19]。此外,“續(xù)理論”與心理學(xué)領(lǐng)域的互動協(xié)同模型一脈相承,推動了語言測試新題型的設(shè)計(jì)[20]。

      技術(shù)的進(jìn)步改變了傳統(tǒng)的施考方式,使考試形式、內(nèi)容、評分、統(tǒng)計(jì)及成績報(bào)告體系日臻完善,在大規(guī)模和個(gè)性化測試中均有廣闊的應(yīng)用前景。大規(guī)模測試中,各次考試分?jǐn)?shù)的等值是標(biāo)準(zhǔn)化考試的基本要求之一。為建立穩(wěn)定標(biāo)準(zhǔn),結(jié)合我國高考考情,桂詩春等在廣東省率先應(yīng)用(N)MET等值統(tǒng)計(jì)模型,通過在固定觀察點(diǎn)考同一套平衡試題的方法,考查考生水平、題目難度與歷年相比有無較大變化,為成績的縱向?qū)Ρ忍峁┯行⒖糩10]。另外,教育部高等教育司于2007年5月啟動了基于計(jì)算機(jī)和網(wǎng)絡(luò)的全國大學(xué)英語四、六級考試項(xiàng)目(CET),初步探索了我國大規(guī)??荚噷?shí)施網(wǎng)考的設(shè)計(jì)原則[21],并驗(yàn)證了網(wǎng)考效度[22]。繼CET主觀題自動評分系統(tǒng)投入使用后,翻譯和寫作人工智能評分系統(tǒng)的開發(fā)極大地提升了閱卷效率[23]。一些大規(guī)模考試開始采用計(jì)算機(jī)輔助口語考試形式以避免考官因素對口語考試構(gòu)念的影響,如NMET[24]、全國英語等級考試(PETS)[25]。與之相適應(yīng),智能化口語評分技術(shù)應(yīng)運(yùn)而生,彌補(bǔ)了人工評分主觀性強(qiáng)、成本高、閱卷人員易疲勞等劣勢,在復(fù)述題[26]、朗讀題[27]等題型的自動評分中均得到了應(yīng)用。在個(gè)性化測試中,曾用強(qiáng)關(guān)注測試過程及考生個(gè)體心理差異,探究了個(gè)性化自適應(yīng)測試模型,并在題項(xiàng)選擇標(biāo)準(zhǔn)中引入自信心這一認(rèn)知因素,使測試過程更加個(gè)性化[28]。黃妍、何蓮珍開創(chuàng)性地使用三參數(shù)多級評分等級模型擬合題組,開發(fā)了自適應(yīng)聽力測試系統(tǒng),測試效率及信度均大幅提升[29]。

      新方法的應(yīng)用拓寬了語言測試學(xué)科的疆域?;谡Z料庫的研究方法為效度驗(yàn)證和自動評分系統(tǒng)的研發(fā)提供了有效手段。在建立英語專業(yè)寫作教學(xué)語料庫的基礎(chǔ)上,曾用強(qiáng)嘗試用語料庫方法開發(fā)診斷評估系統(tǒng),開展個(gè)性化教學(xué)[30]。He和Dai運(yùn)用語料庫方法,輔以會話分析手段,考查了大學(xué)英語四、六級口語考試中小組討論題型的效度[31]。此外,新的統(tǒng)計(jì)方法和工具也不斷涌現(xiàn),如結(jié)構(gòu)方程模型[32]和Coh-Metrix文本分析工具[33]。

      (二) 考試的外部因素

      進(jìn)入21世紀(jì),學(xué)界開始轉(zhuǎn)向?qū)φZ言測試外部因素的關(guān)注。一方面,語言測評是檢測語言學(xué)習(xí)、提供教學(xué)反饋的有效手段;另一方面,測試成績常被用作決策依據(jù),決策風(fēng)險(xiǎn)高低有別,高風(fēng)險(xiǎn)測試的結(jié)果會影響考生、相關(guān)機(jī)構(gòu)乃至整個(gè)社會[34]。楊惠中和桂詩春將考試置于社會環(huán)境中加以審視[16];何蓮珍和呂洲洋認(rèn)為,批判語言測試視角下的測試在教育領(lǐng)域?qū)嵸|(zhì)上變成了控制測試?yán)嫦嚓P(guān)者行為的有效工具,滲透著濃重的權(quán)力色彩[35]。

      考試反撥效應(yīng)是考試效度不可分割的一部分[36],李筱菊將其歸為超考試效度[37]。我國學(xué)者從考試與教學(xué)的關(guān)系入手,開展考試反撥效應(yīng)研究,為測試形式與內(nèi)容改革及語言教學(xué)提供了有效反饋。亓魯霞深入高中英語課堂進(jìn)行觀摩,并通過問卷調(diào)查與訪談,發(fā)現(xiàn)中學(xué)英語教學(xué)并不能有效提升學(xué)生的英語交際能力。該研究對NMET和外語教學(xué)改革具有重要的參考價(jià)值[38]。

      三、 中國語言測試之走向

      回顧過去七十年語言測試在我國的實(shí)踐,筆者認(rèn)為在深度融合教學(xué)與評價(jià)的過程中,學(xué)界需要繼續(xù)探究如何提升考試的科學(xué)性、如何有效應(yīng)用《中國英語能力等級量表》(簡稱《量表》)以及如何對考試的社會性予以關(guān)切。

      (一) 穩(wěn)步提升語言測試的科學(xué)性

      社會呼吁完善的外語能力測評體系。我國現(xiàn)存外語考試項(xiàng)目眾多、標(biāo)準(zhǔn)各異,考查內(nèi)容或重復(fù),或斷檔,直接導(dǎo)致試題本身的科學(xué)性存疑,評分、成績解釋等方面存在的問題更是不一而足。2014年,國務(wù)院頒發(fā)《關(guān)于深化考試招生制度改革的實(shí)施意見》,第一次從國家層面明確提出要加強(qiáng)“外語能力測評體系建設(shè)”。自2015年起,“國家英語能力等級考試”研發(fā)團(tuán)隊(duì)從我國教學(xué)與測評現(xiàn)狀、能力需求、對外語考試改革的建議三個(gè)方面入手,進(jìn)行了大規(guī)模調(diào)研,發(fā)現(xiàn)我國的外語測試缺乏統(tǒng)一標(biāo)準(zhǔn),考查內(nèi)容及反饋不足,對教學(xué)的反撥效應(yīng)不佳,且國際認(rèn)可度不高[39]。因此,科學(xué)的考試體系需以先進(jìn)的理論為指導(dǎo),以常態(tài)化的效度驗(yàn)證作支撐,以促學(xué)為宗旨。

      一項(xiàng)科學(xué)的語言測試必須有科學(xué)的測試?yán)碚撟髦???v觀我國幾大高風(fēng)險(xiǎn)語言測試的題型改革,我們可以清晰地看到這一點(diǎn)。(N)MET、CET及英語專業(yè)等級考試(TEM)的題型改革體現(xiàn)了三個(gè)“注重”:注重考生的語言綜合應(yīng)用能力,注重測試任務(wù)的真實(shí)性,注重考生的語言交際能力。1978—1988年,(N)MET的考查重點(diǎn)為語法、詞匯等語言知識,聽力、閱讀、寫作能力的考查嚴(yán)重缺位;1989年,啟用了書面表達(dá)題;2003年起,全國開始統(tǒng)一使用含聽力考試的英語試卷;2016年,新研發(fā)的讀后續(xù)寫和概要寫作替代了原短文改錯(cuò),讀寫結(jié)合,旨在考查學(xué)生獲取信息、處理信息及英語書面表達(dá)的綜合能力[9]。CET自1999年開始實(shí)行口試,體現(xiàn)了大學(xué)英語教學(xué)對學(xué)生英語口頭交際能力的基本要求;2005年的改革提高了聽力理解分值,并強(qiáng)調(diào)聽力材料來源于真實(shí)語料;2013、2016年的題型改革對聽力與閱讀題型進(jìn)行了微調(diào),注重考查學(xué)生的篇章理解能力。類似地,TEM-8閱讀理解部分在2015年的題型改革后新增了簡答題,寫作部分由原來以議論文體裁為主的話題作文改為材料作文,要求考生在總結(jié)閱讀材料的基礎(chǔ)上,撰文發(fā)表自己的看法。以上高風(fēng)險(xiǎn)測試中題型的調(diào)整均以先進(jìn)的測試?yán)碚摓橐罁?jù),考試的科學(xué)性也得以穩(wěn)步提升。

      貫穿測試開發(fā)、實(shí)施和使用過程的是效度驗(yàn)證[34,40]。Oller認(rèn)為,沒有效度的考試不能稱其為考試[41]。Messick將分?jǐn)?shù)解釋的有效性和測試結(jié)果的使用納入統(tǒng)一框架進(jìn)行考量,認(rèn)為考試的效度不僅關(guān)乎分?jǐn)?shù)解釋,更關(guān)乎使用考試結(jié)果帶來的社會影響[36]?!霸u估使用論證”(Assessment Use Argument,AUA)不失為一個(gè)理想的、具有極強(qiáng)操作性的效度驗(yàn)證框架。該框架幾經(jīng)修訂,于2010年正式問世[34]。AUA提倡通過四條主張收集效度證據(jù):(1)測試結(jié)果的使用對所有涉考者有益;(2)基于測試所做的決定需考慮現(xiàn)有的教育及社會價(jià)值觀和相關(guān)法律法規(guī),且對受決定影響的涉考者而言是均等的;(3)對學(xué)生語言能力的解讀需有意義、公平,且能夠?yàn)闆Q策提供足夠信息;(4)即使測試任務(wù)、測試過程和被測試者不同,測試記錄仍需具有一致性。效度驗(yàn)證在一項(xiàng)考試開考之前就應(yīng)被納入考量范圍,開考后,需建立常態(tài)化的效度驗(yàn)證機(jī)制,為考試科學(xué)性提供保障,為分?jǐn)?shù)的解釋和使用保駕護(hù)航。

      考試應(yīng)產(chǎn)生積極的導(dǎo)向作用,服務(wù)教學(xué)。學(xué)界可以從評價(jià)方式、新題型研發(fā)與測試反饋等方面著手,發(fā)揮考試的促學(xué)功能。其一,以更加個(gè)性化的評價(jià)方式促學(xué)。認(rèn)知診斷測試能夠?qū)W(xué)生語言學(xué)習(xí)過程中的問題進(jìn)行診斷,教師能夠利用診斷信息及時(shí)調(diào)整教學(xué)內(nèi)容和教學(xué)方式,提供個(gè)性化教學(xué),從而發(fā)揮教師的中介作用以達(dá)到有效促學(xué)的目的。自桂詩春提出以CIP為基礎(chǔ)的語言測試[14]以來,學(xué)界對測試過程給予了更多關(guān)注。我國語言測試學(xué)者承襲了桂詩春的觀點(diǎn),嘗試將IRT與CIP相結(jié)合,聚焦計(jì)算機(jī)認(rèn)知自適應(yīng)語言測試,使我國的語言測試研究與國際接軌[42-43]。認(rèn)知診斷測試充分體現(xiàn)了以評促學(xué)這一理念,有助于教師診斷考生的語言能力,及時(shí)有效地提供補(bǔ)償性干預(yù)。然而,目前認(rèn)知診斷測試研究多集中于閱讀技能,聽力方面的研究鳳毛麟角,口語、寫作方面的研究更是鮮有涉足,基于網(wǎng)絡(luò)的認(rèn)知診斷測試模型及其實(shí)證研究目前尚無人問津。鑒于我國考生群體基數(shù)大的國情,開展這方面的研究具有極大的理論價(jià)值與實(shí)踐意義。其二,以新題型的設(shè)計(jì)與應(yīng)用促進(jìn)學(xué)生語言綜合運(yùn)用能力的提升。諸多研究表明,隨著考試風(fēng)險(xiǎn)的提升,備考實(shí)踐強(qiáng)度也會增強(qiáng)[44-45]。我們期待通過對新題型的備考,發(fā)揮考試的正面反撥效應(yīng),為學(xué)生今后的學(xué)術(shù)生涯打下良好基礎(chǔ)。其三,以豐富和完善的評價(jià)反饋體系促進(jìn)學(xué)習(xí)。我國多數(shù)語言測試項(xiàng)目的成績報(bào)告比較單一,不利于成績的有效使用。未來的語言測試項(xiàng)目在成績報(bào)告中需兼顧總分與分項(xiàng)分,兼顧量化及質(zhì)性分?jǐn)?shù)解讀,兼顧不同分?jǐn)?shù)使用者的多元化需求。

      (二) 積極探索《量表》的應(yīng)用

      對于如何在外語學(xué)習(xí)、教學(xué)與測評之間架起一座橋梁,國家層面及測試學(xué)界均給予了熱切關(guān)注。《量表》的研制正是為了解決我國教育體系中存在的教學(xué)與測試目標(biāo)分離、考試標(biāo)準(zhǔn)不一、英語學(xué)習(xí)不連貫、語言能力等級劃分模糊等問題。學(xué)界對《量表》的研究基本圍繞本體規(guī)劃展開,集中在《量表》研制的理論基礎(chǔ)[46]、總體原則[47]、內(nèi)在結(jié)構(gòu)[48]、效度驗(yàn)證[49]等方面。

      經(jīng)過三年多的研發(fā),《量表》于2018年2月由教育部、國家語言文字工作委員會正式發(fā)布,國際重要語言考試與《量表》的對接研究隨之展開。國內(nèi)外學(xué)界對《量表》及相關(guān)研究均給予了高度關(guān)注。

      我國的考試項(xiàng)目眾多,考試與《量表》的對接研究及效度驗(yàn)證在近期也成為一大研究熱點(diǎn)。然而,目前的對接研究中,證據(jù)搜集缺乏系統(tǒng)性,且未考慮對接結(jié)果使用的后效是否有益。為解決上述難題,基于AUA框架,何蓮珍提出了對接使用論證(Linking Use Argument,LUA)框架,主張從對接后效、對接決策制定、對接結(jié)果解釋和對接記錄等方面收集證據(jù),為開展規(guī)范的對接效度驗(yàn)證提供了理論指導(dǎo)[50]。此外,已有學(xué)者基于LUA進(jìn)行了接受型語言考試與語言標(biāo)準(zhǔn)對接[51-52]、產(chǎn)出型語言考試與語言標(biāo)準(zhǔn)對接[53]的研究,對后續(xù)的相關(guān)研究提供了有效的方法參考。

      除對接研究外,《量表》的應(yīng)用潛力有待進(jìn)一步挖掘,包括考試研發(fā)與改進(jìn)、英語教學(xué)、教綱編寫、課程設(shè)計(jì)、教材開發(fā)等多個(gè)領(lǐng)域。測試研究人員應(yīng)同廣大教育工作者一起用好《量表》,保證考試質(zhì)量,促進(jìn)多元評價(jià)體系的建立,培養(yǎng)高素質(zhì)外語人才。

      (三) 持續(xù)關(guān)注考試的社會性

      目前多數(shù)語言測試研究聚焦考試的內(nèi)部因素,對測試產(chǎn)生的反撥效應(yīng)及社會影響關(guān)注不足。在有關(guān)反撥效應(yīng)的研究中,較少關(guān)注NMET、考研英語等高風(fēng)險(xiǎn)測試。此外,多數(shù)研究僅關(guān)注測試、教學(xué)、學(xué)習(xí)之間的線性關(guān)系,忽略了其中錯(cuò)綜復(fù)雜的動態(tài)變化。未來的研究可從動態(tài)系統(tǒng)理論視角入手[54],重新審視測試的反撥效應(yīng)。我們必須清醒地認(rèn)識到,考試正面反撥效應(yīng)的強(qiáng)化和負(fù)面反撥效應(yīng)的弱化并不是語言測試工作者單憑一己之力就可以做到的,需要社會各方面的協(xié)同努力[55]。

      此外,語言測試道德準(zhǔn)則和行為規(guī)范的制定是測試專業(yè)化的重要標(biāo)志,也是實(shí)現(xiàn)公平測試的重要途徑[56],國際語言測試學(xué)會已經(jīng)制定了道德規(guī)范與行為準(zhǔn)則。在此背景下,國內(nèi)已有學(xué)者提出制定我國語言測試的行業(yè)標(biāo)準(zhǔn)[57]。如何保證測試的公平性,提升利益相關(guān)群體的測評素養(yǎng),減少對測試的誤用、濫用,回歸測試開發(fā)的初衷,仍然是值得繼續(xù)深究的主題,我們期待更多關(guān)于語言測試社會性的理論研究與實(shí)證研究。

      本文聚焦新中國成立以來,尤其是改革開放以來,語言測試在我國的發(fā)端與發(fā)展,結(jié)合我國語言測試領(lǐng)域的研究與實(shí)踐,提出了三個(gè)值得進(jìn)一步研究的方向,以期實(shí)現(xiàn)測試與教學(xué)的深度融合,提升涉考者的測評素養(yǎng),并呼吁社會各界關(guān)注語言測試的社會性。我國外語能力測評體系建設(shè)關(guān)乎教育政策的落實(shí),關(guān)乎英語課程與考試改革的成敗,需要相關(guān)領(lǐng)域的專家學(xué)者與教育行政部門、教育機(jī)構(gòu)共同努力,攜手推進(jìn)我國外語教育事業(yè)的蓬勃發(fā)展。

      猜你喜歡
      效度考試測試
      幽默大測試
      幽默大師(2020年11期)2020-11-26 06:12:12
      慈善募捐規(guī)制中的國家與社會:兼論《慈善法》的效度和限度
      “攝問”測試
      “攝問”測試
      “攝問”測試
      Japanese Artificial Intelligence Robotto Take Entrance Examinations
      被看重感指數(shù)在中國大學(xué)生中的構(gòu)念效度
      你考試焦慮嗎?
      外語形成性評估的效度驗(yàn)證框架
      準(zhǔn)備考試
      麦盖提县| 巩留县| 义乌市| 新和县| 利津县| 海原县| 会同县| 河北区| 杭锦旗| 新蔡县| 凤翔县| 平遥县| 方正县| 诏安县| 日照市| 纳雍县| 南皮县| 延寿县| 黔南| 巴里| 左贡县| 巍山| 彩票| 凤山市| 湟源县| 印江| 竹山县| 廉江市| 郯城县| 龙口市| 乌鲁木齐市| 伊宁县| 崇仁县| 大庆市| 西城区| 班玛县| 双柏县| 衡南县| 忻州市| 赫章县| 冀州市|