• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      語(yǔ)言測(cè)試的道德維度:研究理路與實(shí)踐反思

      2014-04-17 11:13:50
      江海學(xué)刊 2014年6期
      關(guān)鍵詞:測(cè)試者效度準(zhǔn)則

      張 艷

      近年來(lái),語(yǔ)言測(cè)試和評(píng)估的研究重點(diǎn)從技術(shù)層面轉(zhuǎn)向了社會(huì)和政策層面,即語(yǔ)言測(cè)試的社會(huì)聲音或社會(huì)話語(yǔ),語(yǔ)言測(cè)試界也通過(guò)召開研討會(huì)、發(fā)行??瘜?duì)此做出了理論回應(yīng)。①先前的語(yǔ)言測(cè)試研究關(guān)注測(cè)試效度和信度等技術(shù)層面的問(wèn)題,而語(yǔ)言測(cè)試的社會(huì)性研究則更強(qiáng)調(diào)“測(cè)試的影響”,即從社會(huì)維度研究測(cè)試的使用、測(cè)試的作用和測(cè)試的公平性。②興起于20世紀(jì)70年代的語(yǔ)言測(cè)試道德研究就是這一新興領(lǐng)域的產(chǎn)物。語(yǔ)言測(cè)試道德包含一系列規(guī)范測(cè)試的標(biāo)準(zhǔn),如測(cè)試公平性、測(cè)試結(jié)果的使用等。③2000~2009年,國(guó)際語(yǔ)言測(cè)試機(jī)構(gòu)出臺(tái)了五部語(yǔ)言測(cè)試準(zhǔn)則,對(duì)語(yǔ)言測(cè)試的道德性進(jìn)行了規(guī)范和定義。雖然道德考量已成為國(guó)際語(yǔ)言測(cè)試的主流趨勢(shì),但我國(guó)語(yǔ)言測(cè)試實(shí)踐對(duì)于測(cè)試道德的回應(yīng)明顯不足。本文在系統(tǒng)梳理語(yǔ)言測(cè)試道德的理論脈絡(luò)和研究進(jìn)展的基礎(chǔ)上,從國(guó)際比較的視野,對(duì)國(guó)內(nèi)語(yǔ)言測(cè)試實(shí)踐進(jìn)行道德反思。

      語(yǔ)言測(cè)試道德研究的理論淵源

      測(cè)試道德研究的興起與測(cè)試界兩大理論密不可分。其一是Messick關(guān)于效度理論的拓展,其二是測(cè)試反撥效應(yīng)(washback)理論研究向測(cè)試影響(impact)層面的轉(zhuǎn)變。1989年Messick擴(kuò)展了效度理論,在分類效度觀和單一效度觀的基礎(chǔ)上提出了整體效度觀,強(qiáng)調(diào)構(gòu)念效度的地位,并指出除構(gòu)念效度這個(gè)核心觀念外,效度理念還應(yīng)包含測(cè)試解釋和使用的科學(xué)基礎(chǔ)以及道德基礎(chǔ)。這一理念后被Messick用漸進(jìn)矩陣模式展現(xiàn)出來(lái)(如表1所示)。漸進(jìn)矩陣的橫軸包含測(cè)試的科學(xué)面(測(cè)試解釋與使用)和應(yīng)用面(測(cè)試含義與價(jià)值),縱軸包含測(cè)試的證據(jù)基礎(chǔ)和后果基礎(chǔ)。構(gòu)念效度作為核心,出現(xiàn)在每個(gè)單元格中。由此可見,整體效度觀一方面強(qiáng)調(diào)了構(gòu)念效度的重要性,另一方面拓展了原有的效度理論,將與測(cè)試解釋和使用相關(guān)的社會(huì)后果和價(jià)值意義附加到測(cè)試的效度概念中,突出了測(cè)試價(jià)值的理念。漸進(jìn)矩陣的出現(xiàn)使得測(cè)試研究從先前的心理測(cè)量工具上升為社會(huì)評(píng)估手段:測(cè)試的意義不僅在于分?jǐn)?shù)本身,還應(yīng)包含分?jǐn)?shù)使用的社會(huì)意義即測(cè)試的社會(huì)性功能。其中,后果效度的提出更是實(shí)現(xiàn)了測(cè)試研究從技術(shù)層面向測(cè)試使用層面,即道德層面的轉(zhuǎn)換。④

      測(cè)試解釋 測(cè)試使用證據(jù)基礎(chǔ) 構(gòu)念效度 構(gòu)念效度+相關(guān)性/效用后果基礎(chǔ) 構(gòu)念效度+價(jià)值意義 構(gòu)念效度+相關(guān)性/效用+價(jià)值意義+社會(huì)后果

      除效度理論的拓展之外,反撥效應(yīng)理論的發(fā)展也促進(jìn)了測(cè)試的社會(huì)性功能的研究。早期的反撥效應(yīng)研究主要圍繞Alderson和Wall的15條反撥效應(yīng)構(gòu)想展開⑤,但這些構(gòu)想將反撥效應(yīng)研究局限在教學(xué)范圍內(nèi),而忽略了反撥效應(yīng)在社會(huì)層面的體現(xiàn)。2004年,Alderson將反撥效應(yīng)拓展為測(cè)試影響(impact),將反撥效應(yīng)對(duì)教學(xué)的影響擴(kuò)充到對(duì)社會(huì)各方風(fēng)險(xiǎn)承擔(dān)者的影響。⑥測(cè)試反撥效應(yīng)向測(cè)試影響的轉(zhuǎn)變,意味著語(yǔ)言測(cè)試界開始認(rèn)識(shí)到測(cè)試具有社會(huì)和教育變革的杠桿功能,而非單一測(cè)量的工具,測(cè)試的社會(huì)功能得到重視。

      整體效度觀和測(cè)試影響的概念引發(fā)了語(yǔ)言測(cè)試界對(duì)測(cè)試社會(huì)功能研究的興趣,隨后,測(cè)試道德研究應(yīng)運(yùn)而生。

      測(cè)試道德的內(nèi)涵與內(nèi)容體系

      (一)測(cè)試道德的定義

      測(cè)試道德研究始于測(cè)試道德的定義。語(yǔ)言測(cè)試界普遍采用了House的道德定義,即“道德是標(biāo)志正確行為或?qū)嵺`的道德準(zhǔn)則和標(biāo)準(zhǔn),尤其指一個(gè)行業(yè)標(biāo)準(zhǔn)”⑦。該定義與Hamp-Lyons的觀點(diǎn)有相似之處,Hamp-Lyons認(rèn)為,道德是“特定階層或組織所接受的行為規(guī)范”,如特定行為的正誤以及由該行為導(dǎo)致的動(dòng)機(jī)和結(jié)果的好壞。⑧Green等則強(qiáng)調(diào)道德是基于義務(wù)判斷而行動(dòng)的行為。⑨這幾種定義都強(qiáng)調(diào)了測(cè)試道德的兩個(gè)基本特點(diǎn):其一,測(cè)試道德的實(shí)施領(lǐng)域?yàn)樘囟ㄐ袠I(yè)或組織;其二,測(cè)試道德的內(nèi)容是一種行為規(guī)范或行業(yè)標(biāo)準(zhǔn)。測(cè)試道德定義強(qiáng)調(diào)了行業(yè)道德或?qū)I(yè)責(zé)任的重要性,并為后來(lái)的道德范疇的設(shè)定和道德準(zhǔn)則的建立打下了基礎(chǔ)。

      (二)測(cè)試道德的內(nèi)容

      根據(jù)測(cè)試道德的定義,Davies將測(cè)試道德的內(nèi)容分為三類:公共道德、專業(yè)道德和個(gè)體道德。⑩公共道德關(guān)注公共興趣所在的社會(huì)熱點(diǎn)問(wèn)題,個(gè)體道德與個(gè)人良知緊密相連,專業(yè)道德針對(duì)行業(yè)準(zhǔn)則與規(guī)范。Hamp-Lyons在此基礎(chǔ)上進(jìn)一步提出三大責(zé)任理念,即社會(huì)責(zé)任、個(gè)體責(zé)任和行業(yè)責(zé)任。社會(huì)責(zé)任指測(cè)試行業(yè)的社會(huì)各方承擔(dān)的責(zé)任,個(gè)體責(zé)任指測(cè)試行業(yè)的執(zhí)行者如測(cè)試者的責(zé)任,行業(yè)責(zé)任指通過(guò)相關(guān)機(jī)構(gòu)建立的行業(yè)規(guī)范。國(guó)內(nèi)研究者在此基礎(chǔ)上將測(cè)試道德問(wèn)題分為責(zé)任問(wèn)題、公平問(wèn)題、道德準(zhǔn)則,本文也將依據(jù)這種分類框架來(lái)探討測(cè)試道德的內(nèi)容。

      1.責(zé)任問(wèn)題

      三大責(zé)任中爭(zhēng)議最多的是測(cè)試的個(gè)體責(zé)任即測(cè)試者的責(zé)任問(wèn)題。Morrow認(rèn)為,反撥效應(yīng)的方向可以人為控制,即測(cè)試設(shè)計(jì)者可以通過(guò)測(cè)試設(shè)計(jì)實(shí)現(xiàn)正面反撥效應(yīng)。這呼應(yīng)了Messick的觀點(diǎn),即測(cè)試開發(fā)者在測(cè)試開發(fā)過(guò)程中應(yīng)考慮到測(cè)試可能帶來(lái)的正面或負(fù)面反撥效應(yīng),致力于開發(fā)正面反撥效應(yīng)的測(cè)試。Rea-Dickins在研究測(cè)試者責(zé)任問(wèn)題時(shí)提出,由于教育變革的復(fù)雜性和市場(chǎng)價(jià)值的突出作用,測(cè)試者責(zé)任范圍逐步擴(kuò)大,勢(shì)必受到其他各方的影響。顯然,由測(cè)試者單方面承擔(dān)測(cè)試責(zé)任是不公平的,因此,Shohamy提出共有責(zé)任理論,即參與測(cè)試各方都負(fù)有共同責(zé)任來(lái)維護(hù)測(cè)試的公平性和效度。Hamp-Lyons也認(rèn)為,測(cè)試開發(fā)者、制定測(cè)試政策的機(jī)構(gòu)、教材開發(fā)者、學(xué)校、各級(jí)政府部門都應(yīng)共同承擔(dān)測(cè)試責(zé)任,而非由測(cè)試開發(fā)者一方承擔(dān)??偠灾瑴y(cè)試三大責(zé)任方(社會(huì)、個(gè)體、行業(yè))在測(cè)試過(guò)程中密不可分,解決責(zé)任問(wèn)題的最終方案應(yīng)該是責(zé)任共有,行為規(guī)范。

      2.公平問(wèn)題

      測(cè)試公平與測(cè)試結(jié)果緊密相關(guān),它既能反映既定測(cè)試是否可作為檢驗(yàn)受試者的能力指標(biāo),同時(shí)也可檢驗(yàn)整個(gè)測(cè)試流程是否能反映社會(huì)公平。測(cè)試公平可分為兩類,即與測(cè)試本身關(guān)聯(lián)的公平以及與測(cè)試使用相關(guān)的社會(huì)意義的公平,前者是從測(cè)試的心理測(cè)量學(xué)維度分析的,后者與測(cè)試的社會(huì)維度相關(guān)。

      從心理測(cè)量學(xué)角度看,測(cè)試公平強(qiáng)調(diào)測(cè)試的平等因素和測(cè)量無(wú)偏差。例如,不少語(yǔ)言測(cè)試研究者關(guān)注受試者母語(yǔ)對(duì)測(cè)試行為的影響,非母語(yǔ)受試者在語(yǔ)言要求高的測(cè)試項(xiàng)目中往往處于劣勢(shì)。這體現(xiàn)了由于受試者背景差異導(dǎo)致的測(cè)試不公平現(xiàn)象。同樣,中國(guó)大學(xué)英語(yǔ)四六級(jí)考試長(zhǎng)期以來(lái)由于大量使用選擇題而受到質(zhì)疑,也是因?yàn)槠洳荒苡行y(cè)量受試者水平,構(gòu)念效度不足,后效差。這實(shí)際上反映了由于測(cè)試方法單一導(dǎo)致的測(cè)量偏差。

      從測(cè)試的社會(huì)維度分析,測(cè)試公平體現(xiàn)在測(cè)試結(jié)果的運(yùn)用和解釋上,即分?jǐn)?shù)的解釋與分?jǐn)?shù)的運(yùn)用必須是合理的、適當(dāng)?shù)?,?duì)所有受試者都適用。以中國(guó)高考的錄取流程為例,每年六月全國(guó)統(tǒng)一高考之后,高校將招生計(jì)劃分配到各個(gè)省、自治區(qū)、直轄市。招生辦建立考生信息庫(kù),劃定各批次最低控制分?jǐn)?shù)線,按考生分?jǐn)?shù)和報(bào)考學(xué)校提取考生檔案進(jìn)行錄取工作??忌呖挤?jǐn)?shù)及錄取分?jǐn)?shù)都是透明的,分?jǐn)?shù)的運(yùn)用與解釋也是公開公正的。從該流程看,這就實(shí)現(xiàn)了測(cè)試的實(shí)質(zhì)公平??偠灾?,無(wú)論從哪個(gè)維度理解,測(cè)試應(yīng)該讓每個(gè)人都最大限度地享受公平。

      3.測(cè)試道德準(zhǔn)則的建立與發(fā)展

      20世紀(jì)70年代末80年代初,社會(huì)各界開始呼吁建立道德準(zhǔn)則。共有責(zé)任的概念提出后,研究者進(jìn)一步指出,只有一個(gè)行業(yè)設(shè)定了明確的行業(yè)規(guī)范或準(zhǔn)則(專業(yè)準(zhǔn)則),所有行業(yè)內(nèi)(如測(cè)試者、個(gè)體因素)或行業(yè)外(如管理方、受試方等社會(huì)因素)的責(zé)任方才能有章可循。Shohamy在此基礎(chǔ)上進(jìn)一步指出,“建立行業(yè)行為標(biāo)準(zhǔn)是保護(hù)測(cè)試者和受試者的策略之一”,并給出了行業(yè)標(biāo)準(zhǔn)框架,即使用標(biāo)準(zhǔn)、可操作性標(biāo)準(zhǔn)和公平標(biāo)準(zhǔn),用以規(guī)范測(cè)試并預(yù)防測(cè)試結(jié)果的誤用。

      此外,由于測(cè)試分?jǐn)?shù)被運(yùn)用在多個(gè)重要領(lǐng)域,如招生、應(yīng)聘、移民等,因此受試者與相關(guān)責(zé)任人希望了解測(cè)試者專業(yè)行為所依據(jù)的道德基礎(chǔ)。社會(huì)各界對(duì)于道德準(zhǔn)則的需求使行業(yè)準(zhǔn)則的建立勢(shì)在必行,而語(yǔ)言測(cè)試道德準(zhǔn)則的建立也意味著語(yǔ)言測(cè)試作為專門行業(yè)而非語(yǔ)言教學(xué)附屬品地位的確立。

      20世紀(jì)末,語(yǔ)言學(xué)家提出了測(cè)試道德準(zhǔn)則的框架設(shè)想,即測(cè)試道德準(zhǔn)則的三大原則——平等權(quán)利、尊重人權(quán)、利益最大化,由此奠定了測(cè)試道德準(zhǔn)則的基本內(nèi)容。?Lynch進(jìn)一步補(bǔ)充了道德問(wèn)題涉及的其他相關(guān)領(lǐng)域,如測(cè)試發(fā)展、執(zhí)行、分?jǐn)?shù)使用甚至整個(gè)測(cè)試行業(yè)的可防護(hù)性。?在此基礎(chǔ)上,語(yǔ)言測(cè)試協(xié)會(huì)(ILTA)在2000年溫哥華會(huì)議上通過(guò)了Davies起草的道德準(zhǔn)則(Code of Practice),2005年升級(jí)為行為準(zhǔn)則(Guidelines for Practice),用以規(guī)范語(yǔ)言測(cè)試的道德行為。前者關(guān)注測(cè)試行業(yè)的道德和理想,后者設(shè)定了行業(yè)行為的最低標(biāo)準(zhǔn)并詳細(xì)闡述行業(yè)中的不當(dāng)行為和非專業(yè)行為。

      除ILTA設(shè)立的道德準(zhǔn)則外,其他語(yǔ)言測(cè)試機(jī)構(gòu)也不甘落后,紛紛出臺(tái)各類道德準(zhǔn)則,進(jìn)一步推進(jìn)測(cè)試專業(yè)化。目前,包括ILTA的測(cè)試標(biāo)準(zhǔn)在內(nèi),國(guó)際通行的語(yǔ)言測(cè)試標(biāo)準(zhǔn)有五種(ILTA,2000;ILTA,2007;ALTE,2001;EALTA,2006;JLTA,2006)。Jia在總結(jié)比較這五種主要測(cè)試標(biāo)準(zhǔn)的基礎(chǔ)上指出,五種標(biāo)準(zhǔn)中除EALTA是為測(cè)試者服務(wù)外,其余均可視作對(duì)測(cè)試者進(jìn)行評(píng)判的標(biāo)準(zhǔn),它們更類似于一種行業(yè)守則,用以監(jiān)督或規(guī)范執(zhí)業(yè)者的工作。?但是,以上幾種標(biāo)準(zhǔn)都未包含對(duì)違反行業(yè)規(guī)范人員的懲罰措施,也過(guò)于籠統(tǒng)、概括,缺乏針對(duì)性。語(yǔ)言測(cè)試標(biāo)準(zhǔn)應(yīng)該能體現(xiàn)各國(guó)具體國(guó)情,包括國(guó)家歷史、語(yǔ)言使用、教育體系、宗教、地理和其他風(fēng)俗等。所以,除了國(guó)際通行標(biāo)準(zhǔn)之外,各國(guó)應(yīng)根據(jù)國(guó)情制定屬于自己特有的測(cè)試標(biāo)準(zhǔn)。尤其是中國(guó),測(cè)試歷史悠久,測(cè)試涉及面廣,社會(huì)影響大,更需要地域性的、操作性強(qiáng)的行業(yè)標(biāo)準(zhǔn)的引導(dǎo)。

      道德準(zhǔn)則的出臺(tái)進(jìn)一步規(guī)范了測(cè)試行為,使得測(cè)試界有了統(tǒng)一的指導(dǎo)方針。測(cè)試界也采取了一系列實(shí)踐行為來(lái)配合其運(yùn)行,如測(cè)試的改革、測(cè)試技術(shù)手段的完善和測(cè)試政策的制定等。

      基于道德維度的語(yǔ)言測(cè)試實(shí)踐

      (一)國(guó)際英語(yǔ)考試體現(xiàn)的測(cè)試公平性

      國(guó)際語(yǔ)言測(cè)試中的道德踐行主要體現(xiàn)在對(duì)公平性原則的關(guān)注。以雅思考試為例,考生在考試結(jié)束后有權(quán)對(duì)本場(chǎng)考試的聽力設(shè)備或測(cè)試環(huán)境進(jìn)行投訴,并在3~5個(gè)工作日后收到測(cè)試主辦方英國(guó)文化委員會(huì)的回復(fù),根據(jù)實(shí)際情況可免費(fèi)獲得重新進(jìn)行聽力考試的機(jī)會(huì)。這避免了由于考試環(huán)境差異造成的外部偏差。除投訴聽力設(shè)備外,如考生對(duì)整場(chǎng)考試分?jǐn)?shù)有異議,可在收到成績(jī)單原件后登陸雅思官網(wǎng)考后服務(wù)平臺(tái)在線申請(qǐng)成績(jī)復(fù)議。考生可申請(qǐng)復(fù)議一項(xiàng)或多項(xiàng)成績(jī)。多項(xiàng)成績(jī)復(fù)議時(shí)考生各部分試卷將提交不同復(fù)議考官重判以保證評(píng)分公正。此舉有利于減少由于評(píng)分者評(píng)分標(biāo)準(zhǔn)差異而導(dǎo)致的偏差,確??荚嚨墓叫浴3鲇谕瑯永碛?,2014年8月,雅思考試實(shí)行作文評(píng)分改革。寫作考試的兩篇考試作文分別由不同評(píng)分者進(jìn)行評(píng)分,以避免同一考生作文由同一考官批改而導(dǎo)致的批改者差異產(chǎn)生的不公平問(wèn)題。

      如果說(shuō)雅思考試是通過(guò)減少測(cè)試環(huán)境差異和評(píng)分者差異實(shí)現(xiàn)測(cè)試最大公平,那么托福考試則通過(guò)測(cè)試開發(fā)過(guò)程中的公平審核制度體現(xiàn)其測(cè)試道德。ILTA在2005年渥太華大會(huì)上起草的行為準(zhǔn)則提出,題項(xiàng)編寫者必須在考試開始后結(jié)果出來(lái)前對(duì)題項(xiàng)進(jìn)行分析,不合適的或功能有誤的題項(xiàng)最終計(jì)算分?jǐn)?shù)時(shí)應(yīng)予以剔除。而公平審核即復(fù)核試題以避免偏差,就是這一道德準(zhǔn)則的體現(xiàn)。在公平審核實(shí)踐方面,托??荚囍鬓k機(jī)構(gòu)ETS建立了一系列制度和體系,積累了重要經(jīng)驗(yàn)。托福的公平審核程序如下:測(cè)試開發(fā)者提交題項(xiàng)進(jìn)行審核,審核者可以對(duì)開發(fā)者提出改動(dòng)建議,可以改善題項(xiàng)或者直接通過(guò),也可以直接質(zhì)疑該題項(xiàng)是否違反條例。審核者的觀點(diǎn)反饋至開發(fā)者,開發(fā)者可以接受建議整改題項(xiàng)或啟動(dòng)爭(zhēng)議程序,即審核者和開發(fā)者進(jìn)行討論。如意見相左,公平審核協(xié)調(diào)者出面與各方協(xié)調(diào)并建議解決方案。公平審核總部,亦即法律顧問(wèn)部門,將出面查看并建議解決方案,如仍不奏效,更高階層委員會(huì)將出面解決。如還不能達(dá)成一致,總協(xié)調(diào)部門出面,最后做出終結(jié)性決定,就此結(jié)案。公平審核政策的出臺(tái)體現(xiàn)了國(guó)際考試在道德方面的嚴(yán)格要求,同時(shí)也為其他同類考試提供了參考。

      (二)國(guó)內(nèi)大學(xué)英語(yǔ)四六級(jí)考試(CET)改革體現(xiàn)的道德內(nèi)涵

      國(guó)內(nèi)大學(xué)英語(yǔ)四六級(jí)考試為國(guó)內(nèi)語(yǔ)言測(cè)試的道德踐行提供了范本。1987年中國(guó)開始實(shí)行大學(xué)英語(yǔ)四級(jí)考試,檢測(cè)大學(xué)生畢業(yè)時(shí)是否達(dá)到大綱規(guī)定的四級(jí)要求。然而,1999年教學(xué)大綱修訂版中第一次硬性地“把四級(jí)定為全國(guó)各類高等院校應(yīng)達(dá)到的基本要求”,四六級(jí)從衡量學(xué)生英語(yǔ)水平的杠桿一下變?yōu)闆Q定學(xué)生命運(yùn)的重要砝碼。行政部門將考試通過(guò)率作為學(xué)校教學(xué)質(zhì)量評(píng)估的指標(biāo)之一,某些學(xué)校將四級(jí)通過(guò)率與學(xué)位掛鉤。四級(jí)考試分?jǐn)?shù)的濫用導(dǎo)致了語(yǔ)言測(cè)試負(fù)面反撥效應(yīng)盛行。在教學(xué)方面體現(xiàn)為教師注重精讀能力培養(yǎng),聽力課通過(guò)考試題型進(jìn)行課堂練習(xí),教材缺乏真實(shí)性,四級(jí)考前多采用題海戰(zhàn)術(shù)進(jìn)行模擬等。而學(xué)生則注重練習(xí)多項(xiàng)選擇題,輕視泛讀泛聽,通過(guò)四級(jí)作文三段論模板練習(xí)寫作。作為測(cè)試的責(zé)任方之一,教育部于2005年發(fā)布了《關(guān)于全國(guó)大學(xué)英語(yǔ)四、六級(jí)考試改革方案(試行)》,改革措施涉及成績(jī)報(bào)導(dǎo)方式和測(cè)試內(nèi)容。改革后,新的成績(jī)報(bào)告單用單項(xiàng)得分和總分的成績(jī)單取代原先只報(bào)總分的成績(jī)單,為教師了解學(xué)生水平提供參考。及格分的取消則避免了學(xué)校與學(xué)生片面追求通過(guò)率。四六級(jí)的計(jì)分制和成績(jī)報(bào)導(dǎo)方式的改革體現(xiàn)了對(duì)測(cè)試的使用和解釋的相關(guān)社會(huì)后果的重視,避免了測(cè)試結(jié)果在社會(huì)層面上的誤用。在意識(shí)到分?jǐn)?shù)使用不當(dāng)影響其后果效度的情況下通過(guò)改革及時(shí)終止測(cè)試分?jǐn)?shù)的濫用,是測(cè)試公平的體現(xiàn),符合測(cè)試道德的要求。

      在測(cè)試內(nèi)容的改革上,針對(duì)中國(guó)學(xué)生英語(yǔ)學(xué)習(xí)的弱點(diǎn),如聽說(shuō)能力低下、缺乏泛讀能力、注重技能訓(xùn)練而非應(yīng)用能力等,增加15%的聽力理解題量,精讀內(nèi)容減少5%,增加快速閱讀技能測(cè)試即泛讀能力測(cè)試,詞匯理解和語(yǔ)法結(jié)構(gòu)放入篇章中進(jìn)行測(cè)試。這些測(cè)試內(nèi)容改革同樣符合測(cè)試道德的要求,即測(cè)試責(zé)任者有義務(wù)在測(cè)試開發(fā)過(guò)程中致力于開發(fā)具有正面反撥效應(yīng)的測(cè)試,并及時(shí)通過(guò)調(diào)整實(shí)現(xiàn)測(cè)試的正面反撥。同時(shí)也體現(xiàn)了道德準(zhǔn)則的基本內(nèi)容:語(yǔ)言測(cè)試者應(yīng)考慮到他們的項(xiàng)目對(duì)所有責(zé)任人帶來(lái)的長(zhǎng)期或短期的影響,評(píng)估有可能發(fā)生的后果并及時(shí)作出反應(yīng)(ILTA道德準(zhǔn)則第九條)。

      ②Shohamy E.,“Critical Language Testing and Beyond”,Studies in Educational Evaluation,1998,24(4),pp.331 ~345.

      ③Messick,S.,“Meaning and Values in Test Validation:The Science and Ethics of Assessment”,Educational Researcher,1989,18(2),pp.5 ~11.

      ④Gipps,C.V.,Beyond Testing:Towardsa Theory of Educational Assessment,Psychology Press,1994.

      ⑤Alderson,J.C.,& Wall,D.,“Does Washback Exist?”,Applied Linguistics,1993,14(3),pp.15 ~129.

      ⑥Alderson,J.C.,“Forward”,in Cheng L.Y.,WatanabeY.(eds.),Washback in Language Testing,Routledge,2004.

      ⑦House,E.R.,Schoolsfor Sale:Why Free Market Policies Won’t Improve America’s Schools,and What Will?New York:Teacher College Press,1998.

      ⑨Green,S.K.,Johnson,R.L.& Kim D.H.,Pope N.S.,

      “Ethics in Classroom Aseessment Practice”,Teaching and Teacher Education,2007,23(7),pp.999 ~1011.

      ? Corson,D.,“Critical Realism:An Emancipatory Philosophy for Applied Linguistics?” Applied Linguistics,1997, 18(2),pp.166 ~188.

      ? Lynch,B.,“In Research of Ethical Test”,Language Testing,1997,14(3),pp.315 ~327.

      ? Jia,Y.,“Ethical Standards for Language Testing Professionals:An Introduction to Five Major Codes”,JALT Testing& Evaluation SIG Newsletter,2009,13(2),pp.2 ~8.

      猜你喜歡
      測(cè)試者效度準(zhǔn)則
      具非線性中立項(xiàng)的二階延遲微分方程的Philos型準(zhǔn)則
      慈善募捐規(guī)制中的國(guó)家與社會(huì):兼論《慈善法》的效度和限度
      搜救犬幼犬挑選測(cè)試
      指紋收集器
      基于Canny振蕩抑制準(zhǔn)則的改進(jìn)匹配濾波器
      可監(jiān)測(cè)腦電波的智能燈
      被看重感指數(shù)在中國(guó)大學(xué)生中的構(gòu)念效度
      外語(yǔ)形成性評(píng)估的效度驗(yàn)證框架
      一圖讀懂《中國(guó)共產(chǎn)黨廉潔自律準(zhǔn)則》
      很多英國(guó)人不會(huì)拼常用詞
      福泉市| 晴隆县| 雷波县| 宣威市| 瑞安市| 吴旗县| 宣汉县| 南澳县| 蒙自县| 黎川县| 彝良县| 卢氏县| 金秀| 聂拉木县| 麟游县| 闵行区| 福贡县| 正阳县| 阿瓦提县| 蛟河市| 思南县| 水富县| 辽源市| 黄梅县| 辽宁省| 安仁县| 鄂托克旗| 临洮县| 晋州市| 武城县| 永善县| 南开区| 肥东县| 大同市| 叶城县| 商洛市| 仙游县| 永善县| 旬邑县| 平乐县| 江孜县|