• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      如何做好終結(jié)性評(píng)價(jià)達(dá)成課程教學(xué)標(biāo)準(zhǔn)

      2014-07-04 07:44:20趙秦嶺
      英語學(xué)習(xí)·教師版 2014年6期
      關(guān)鍵詞:教考教學(xué)大綱信度

      引言

      自從斯克里文在其1967年所著的《評(píng)價(jià)方法論》中首先提出“形成性評(píng)價(jià)”(formative evaluation)與“終結(jié)性評(píng)價(jià)”(summative evaluation)的概念(Scriven, 1967), 不斷有學(xué)者對(duì)這兩個(gè)評(píng)價(jià)方式的定義、形式與功能展開探討。 近年更多的學(xué)者與教師開始關(guān)注如何利用“形成性評(píng)價(jià)”提升課堂教學(xué)質(zhì)量。大量研究和數(shù)據(jù)也表明,形成性評(píng)價(jià)不僅是課堂教學(xué)的重要組成部分,更是提升課堂成效的重要工具(Black & Wiliam, 1998)。形成性評(píng)價(jià)重視對(duì)學(xué)生學(xué)習(xí)過程的評(píng)估,它鼓勵(lì)通過多元評(píng)價(jià)工具,獲取學(xué)生日常學(xué)習(xí)的信息,了解學(xué)生的知識(shí)、能力、興趣和需求并加以總結(jié)和分析,從而改善教學(xué)和學(xué)習(xí)效果。它不僅注重對(duì)學(xué)生認(rèn)識(shí)能力的評(píng)價(jià),也重視對(duì)學(xué)生情感及行為能力的評(píng)價(jià)。形成性評(píng)價(jià)瞄準(zhǔn)教與學(xué)的提升,所以又被稱做 Assessment for Learning(“促學(xué)評(píng)價(jià)”)。

      然而我們?cè)陉P(guān)注“促學(xué)評(píng)價(jià)”的同時(shí),也不能忽視對(duì)整體教學(xué)大綱的設(shè)定、教學(xué)目標(biāo)的達(dá)成、以及學(xué)生整體的學(xué)習(xí)效果的判斷和審視。如果說形成性評(píng)價(jià)從微觀的角度關(guān)注某個(gè)學(xué)生或某個(gè)教師個(gè)體是否成長,終結(jié)性評(píng)價(jià)就是要從宏觀的角度對(duì)整個(gè)的教師群體的教學(xué)質(zhì)量、教學(xué)計(jì)劃的實(shí)施情況、某個(gè)學(xué)生在經(jīng)歷了一個(gè)學(xué)段的整體學(xué)習(xí)狀況給出鑒定性評(píng)價(jià),從而為學(xué)校、教師和學(xué)生群體在未來教學(xué)中更新教學(xué)內(nèi)容,改進(jìn)教學(xué)方法,提高學(xué)習(xí)質(zhì)量等下一步教學(xué)決策提供重要依據(jù)。

      但就具有鮮明校本特色的期末考試來說,尤其是學(xué)年考試,它既是終結(jié)性評(píng)價(jià),又具備形成性評(píng)價(jià)的特點(diǎn),也就是說在建構(gòu)成績和評(píng)價(jià)結(jié)論的過程中,它有一定的形成性。因?yàn)閷W(xué)生在一段、一段的語言學(xué)習(xí)進(jìn)程中,一次期末考試不過是整個(gè)長尺度學(xué)習(xí)階段中的某學(xué)段的效果檢測。說它具有終結(jié)性,是因?yàn)榻處熓前凑諏W(xué)期、學(xué)年來設(shè)計(jì)整體教學(xué)大綱的,即在一個(gè)特定的學(xué)習(xí)階段內(nèi)要達(dá)成的教學(xué)目標(biāo)。因此,期末考試在評(píng)價(jià)上的形成性和終結(jié)性并不矛盾,“形成”是學(xué)生學(xué)習(xí)角度的“形成”,“終結(jié)”則是教師教學(xué)角度的“終結(jié)”。那么,本文就從后者的視角來展開討論。

      終結(jié)性評(píng)價(jià)的定義、方法與特征

      定義

      終結(jié)性評(píng)價(jià)(summative assessment)是對(duì)一個(gè)學(xué)段、一門課程的教學(xué)質(zhì)量的綜合評(píng)價(jià),其目的是對(duì)教師和學(xué)生階段性教學(xué)效果、學(xué)習(xí)質(zhì)量做出結(jié)論性評(píng)價(jià)。評(píng)價(jià)的目的就是給學(xué)生給出分等鑒定、做出關(guān)于受教育者(學(xué)生)和教育者個(gè)體(教師)的決策、然后再與教育資源分配的決策相聯(lián)系。簡單說就是要下結(jié)論、分等級(jí)、做決定。我們熟悉的期末考試、學(xué)年考試、會(huì)考、畢業(yè)考試、教師的考核、學(xué)校的鑒定等等都是終結(jié)性評(píng)價(jià)。

      方法

      以期末考試為代表的終結(jié)性評(píng)價(jià)大多是成績測試(achievement test),主要是要測量學(xué)生整個(gè)學(xué)期掌握所學(xué)內(nèi)容的狀況(Heaton, 2000)。也就是說,所有考試內(nèi)容都應(yīng)以教學(xué)大綱中預(yù)先設(shè)定的教學(xué)目標(biāo)為基準(zhǔn),以學(xué)生達(dá)成目標(biāo)的程度即學(xué)習(xí)成績或教學(xué)效果為內(nèi)容而做出評(píng)價(jià)。雖然這種評(píng)價(jià)大多只在期中或?qū)W期末進(jìn)行,次數(shù)較少,但所提供的信息和基于這些信息而做出的教學(xué)決策的影響卻不小。期末考注重考察學(xué)生掌握課程目標(biāo)的整體程度,不僅需要高度概括所學(xué)內(nèi)容,具備代表性,還不能縮減教學(xué)計(jì)劃、隨意調(diào)整教學(xué)內(nèi)容,更不能超出大綱要求,不能不教什么而考什么。

      終結(jié)性評(píng)價(jià)的特征和反饋方式

      終結(jié)性評(píng)價(jià)的首要目的是對(duì)學(xué)生在某門課程或就其某個(gè)重要部分所取得的學(xué)習(xí)成果進(jìn)行全面的確定,以便對(duì)學(xué)生成績給予結(jié)論性評(píng)定或是為學(xué)生的下一階段學(xué)習(xí)提供依據(jù)。終結(jié)性評(píng)價(jià)關(guān)注學(xué)生對(duì)某門課程整個(gè)或一個(gè)學(xué)段的內(nèi)容的掌握,注重于檢測學(xué)生達(dá)到該課程教學(xué)目標(biāo)的程度。因此,終結(jié)性評(píng)價(jià)一般一學(xué)期或一學(xué)年只操作兩、三次。期中、期末考查或考試以及畢業(yè)會(huì)考等均屬此類。終結(jié)性評(píng)價(jià)的考試或測驗(yàn)內(nèi)容包括的范圍較廣,每個(gè)題目都包括了許多構(gòu)成該課題的基本知識(shí)、技能和核心能力。

      終結(jié)性評(píng)價(jià)的結(jié)果主要是為教育管理者(教務(wù)部門),教師以及學(xué)生提供教學(xué)效果、學(xué)習(xí)成績信息,并給評(píng)價(jià)結(jié)果的使用者提供調(diào)整對(duì)未來的教育管理、教學(xué)以及學(xué)習(xí)提供依據(jù)。我們不能只關(guān)注教學(xué)過程個(gè)體性,還應(yīng)該關(guān)注課程目標(biāo)達(dá)成的整體情況和普遍性。因?yàn)檎n程的基本目標(biāo)實(shí)現(xiàn)不可能在課程實(shí)施的每一個(gè)局部過程完整的體現(xiàn),必須要通過終結(jié)性評(píng)價(jià)來高度綜合、概括,分析和總結(jié)。

      終結(jié)性評(píng)價(jià)的效度、信度與考試后效/反撥

      要想使終結(jié)性評(píng)價(jià)真實(shí)、客觀的反映教學(xué)、學(xué)習(xí)狀況,老師們要把握以下幾個(gè)關(guān)鍵點(diǎn):

      評(píng)價(jià)測試好壞的第一標(biāo)準(zhǔn)——效度(Validity/Validation)

      任何一種測試或評(píng)價(jià)的好壞,最重要的就是看效度實(shí)現(xiàn)與否Heaton(2000)。效度就是指測試或評(píng)價(jià)在多大程度上考核了教學(xué)大綱所需考核的內(nèi)容,評(píng)價(jià)的內(nèi)容、方式有多大程度體現(xiàn)所測量的目標(biāo)。盡管考試不同,標(biāo)準(zhǔn)各異,但標(biāo)準(zhǔn)的制定都依據(jù)一定的科學(xué)規(guī)律。作為教師,最有保障的做法就是參照教學(xué)大綱和課程標(biāo)準(zhǔn),將考試內(nèi)容與教學(xué)大綱所列內(nèi)容進(jìn)行比照,從中篩選出有代表性的語言知識(shí)點(diǎn)、核心能力等成為考試內(nèi)容。例如閱讀能力,先參照大綱,列出本課程所需學(xué)習(xí)的閱讀技巧(微觀、宏觀)或能力清單, 然后抽樣選取有代表性的知識(shí)、技能或交際能力列入考試內(nèi)容,只要保證做到與教學(xué)大綱所列內(nèi)容高度一致,有一定的覆蓋面,內(nèi)容效度(content validity)就達(dá)成了。

      Heaton(2000)認(rèn)為期末考試所采用的評(píng)價(jià)工具應(yīng)該是與教學(xué)大綱緊密相扣的成績測試(achievement tests), 應(yīng)該是標(biāo)準(zhǔn)參照測試(criterion-referenced tests),而不是與學(xué)生相比較的常模參照測試(norm-referenced tests)。也就是說學(xué)生的成績表現(xiàn)取決于與一個(gè)或多個(gè)預(yù)先設(shè)定的標(biāo)準(zhǔn)相對(duì)照而得出的。這種做法的一個(gè)好處就是能真實(shí)的反映學(xué)生的語言能力,而不用與其他學(xué)生相比較表現(xiàn)如何。只要學(xué)生達(dá)到了所制定的標(biāo)準(zhǔn),不用與其他同學(xué)的表現(xiàn)做比較,我們就可以對(duì)學(xué)生水平做出推斷并給予等級(jí)評(píng)價(jià)與反饋。也就是說,一個(gè)班級(jí)可以所有同學(xué)都達(dá)標(biāo),或所有同學(xué)都達(dá)到最高級(jí)別(如等級(jí)甄別)。學(xué)生所獲得的教師評(píng)價(jià)只針對(duì)他自身學(xué)習(xí)表現(xiàn)與課程標(biāo)準(zhǔn)的差距,而不是該學(xué)生與其他學(xué)生的差距,這種反饋能增加學(xué)生的學(xué)習(xí)動(dòng)力,減少源自同輩的人為壓力,從而營造和諧的課堂氛圍,互利的師生關(guān)系和同輩關(guān)系。

      如何達(dá)成評(píng)價(jià)的一致性——信度 (Reliability)

      信度是測試或評(píng)價(jià)的第二個(gè)重要指標(biāo)。信度是指測評(píng)工具和結(jié)果的可靠性、穩(wěn)定性和客觀性。測試的信度有兩層意思,不同的閱卷人批閱同一份卷子,結(jié)果應(yīng)該大致相同;同一個(gè)評(píng)卷人在不同的時(shí)間批閱同一份試卷,分?jǐn)?shù)也應(yīng)大致相同。這就是Bachman所說的測試的一致性(1990)。但是當(dāng)信度與效度有沖突時(shí),必先保障考試的效度,然后盡量達(dá)成信度,如采用合理規(guī)范、易于操作的評(píng)分標(biāo)準(zhǔn)或評(píng)價(jià)量表、統(tǒng)一的評(píng)分程序等等。

      這里有一個(gè)需要“教考分離”還是“教考合一”問題。為保障終結(jié)性評(píng)價(jià)的信度,大多學(xué)校和教育機(jī)構(gòu)采用“教考分離”的評(píng)價(jià)模式或考試制度。“教考分離”針對(duì)傳統(tǒng)“教考合一”而提出,即在教學(xué)過程中任課教師只負(fù)責(zé)教學(xué),不直接參與所教課程的命題或試卷批改,而是由教務(wù)部門組織非任課教師根據(jù)教學(xué)大綱的要求命題,大多通過建立命題組、試題庫,統(tǒng)一組織考試、統(tǒng)一評(píng)卷。這種做法的好處是,評(píng)價(jià)過程相對(duì)客觀,考試中可以有效去除教師主觀判斷的失誤或隨意性,依照教學(xué)大綱的要求和課程標(biāo)準(zhǔn)對(duì)學(xué)生進(jìn)行考核,進(jìn)而做出結(jié)論性評(píng)價(jià)。同時(shí),教務(wù)部門也可以及時(shí)、充分的了解教師的業(yè)務(wù)水平和學(xué)生的學(xué)習(xí)情況,為下一步教學(xué)計(jì)劃或教學(xué)政策的制定提供依據(jù)。但是,這種做法在實(shí)際應(yīng)用中卻暴露出諸多不合理之處。所謂“教考分離”大多從教學(xué)管理角度出發(fā),統(tǒng)一管理、制約,甚至監(jiān)控的優(yōu)越性只是表象,并未從根本上突破傳統(tǒng)評(píng)價(jià)只重視知識(shí)檢測的局限性?!敖炭挤蛛x”保障的只是測試操作層面的一致性,而并未真正地從考試內(nèi)容、方法和教學(xué)目標(biāo)的達(dá)成上,提升測評(píng)的成效。 “教考分離”往往以目標(biāo)為指向,注重檢測和鑒定學(xué)生是否達(dá)成預(yù)定目標(biāo),忽略了測試和評(píng)價(jià)的其他功能如導(dǎo)向、激勵(lì)、及發(fā)展功能。不斷更新的試題庫,不斷隔離的師生關(guān)系雖然保障了評(píng)價(jià)的客觀性和規(guī)范性,卻顛倒了測試標(biāo)準(zhǔn)的順序,忽略了達(dá)成效度才是判斷測試好壞的第一順位標(biāo)準(zhǔn)。

      如何達(dá)成測試對(duì)教學(xué)的正面影響——正向反撥(Positive Backwash)

      “反撥效應(yīng)”(backwash effect)通常是指語言測試對(duì)語言教學(xué)和學(xué)習(xí)產(chǎn)生的正面或負(fù)面的影響,它是語言評(píng)價(jià)(language assessment)研究中的一個(gè)重要研究課題(Bachman, 1990)。這種反撥效應(yīng)也被廣泛認(rèn)為對(duì)課堂教學(xué)如何進(jìn)行起著決定性的作用。更多研究者關(guān)注課外的高風(fēng)險(xiǎn)考試 (high-stakes tests)的反撥效應(yīng)。教育機(jī)構(gòu)常常利用高風(fēng)險(xiǎn)考試對(duì)學(xué)生、教師、學(xué)校乃至學(xué)區(qū)做出重要的教育決策,使得高風(fēng)險(xiǎn)考試的反撥效應(yīng)顯得尤為顯著(Cohen,1994)。在包括中國在內(nèi)的許多國家,這些高風(fēng)險(xiǎn)考試通常是學(xué)生能否繼續(xù)接受教育的必經(jīng)門檻。中國的研究者也相繼就高風(fēng)險(xiǎn)考試對(duì)教學(xué)和學(xué)習(xí)產(chǎn)生的反撥作用作了深入研究(韓寶成等,2004; Luxia, 2005)。

      雖然測試對(duì)教學(xué)會(huì)產(chǎn)生正面或負(fù)面的影響,但反撥效應(yīng)對(duì)外語教學(xué)所產(chǎn)生的決定性影響是毋庸質(zhì)疑的(Cheng et al., 2004)。有些研究者(Morrow,1986)甚至建議,試題的效度應(yīng)該用其對(duì)教學(xué)的積極影響程度來衡量,研究者對(duì)反撥效應(yīng)的認(rèn)可程度可見一般。國內(nèi)學(xué)者的諸多研究表明(亓魯霞,2004), 考試的后效在教學(xué)內(nèi)容方面得到體現(xiàn),如高考英語能為學(xué)生提供英語學(xué)習(xí)動(dòng)力,更顯著的是促進(jìn)教學(xué)內(nèi)容、方法的改革。高考英語促使中學(xué)改革, 英語課程增加了聽說讀寫技能訓(xùn)練, 改變了原本只重視知識(shí)傳授的局面。

      高質(zhì)量的語言測試和評(píng)價(jià)可以通過診斷、激發(fā)和修正的方式對(duì)教學(xué)和學(xué)習(xí)產(chǎn)生積極影響(Heaton,2000;Hughes,1989)。成功的語言測試能幫助教師和學(xué)生診斷出教和學(xué)的效果,定期的評(píng)價(jià)會(huì)使學(xué)生產(chǎn)生一種成就感,從而激發(fā)學(xué)習(xí)興趣。另外,定期的測試還可以使學(xué)生逐漸了解課程目標(biāo)和重點(diǎn),從而提高學(xué)習(xí)效果。語言測試鼓勵(lì)好的教學(xué),修正差的教學(xué),反撥作用可以幫助教師發(fā)現(xiàn)教學(xué)問題并在將來采取有針對(duì)性的補(bǔ)救措施。

      而負(fù)面反撥往往源自對(duì)課程目標(biāo)沒有深刻的認(rèn)識(shí)而盲目進(jìn)行測試。Hughes (1989)認(rèn)為,當(dāng)測試內(nèi)容和方法違背了課程目標(biāo)時(shí),負(fù)面反撥就有可能產(chǎn)生了。負(fù)面效應(yīng)有以下幾種表現(xiàn)形式:縮減教學(xué)計(jì)劃、曲解教學(xué)目標(biāo)、浪費(fèi)教學(xué)時(shí)間、忽視培養(yǎng)學(xué)生綜合分析和解決問題的能力等。如果教師較少致力于獨(dú)立命題,可能導(dǎo)致他們不能合理地使用各種語言測試手段促進(jìn)教學(xué),對(duì)教學(xué)的負(fù)面反撥效應(yīng)也隨之而生 (趙秦嶺,2007)。換句話說,教師對(duì)測試知識(shí)的認(rèn)識(shí)誤區(qū)可能是編制出低質(zhì)量試題的一個(gè)重要原因,也是產(chǎn)生負(fù)面反撥效應(yīng)的原因之一。找出教師存在的認(rèn)識(shí)誤區(qū)就可以有針對(duì)性地對(duì)教師進(jìn)行培訓(xùn),并進(jìn)行相關(guān)的行為研究以實(shí)現(xiàn)正面反撥。

      結(jié)語

      不同的測試與評(píng)價(jià)對(duì)教與學(xué)的影響不僅能從學(xué)習(xí)成果中觀察得到,更多是從學(xué)習(xí)的過程中獲得。形成性評(píng)價(jià)關(guān)注個(gè)體差異,教師需要讓學(xué)生了解自己實(shí)際掌握語言的情況和他所期待達(dá)成的目標(biāo)之間的差距,從而激發(fā)他主動(dòng)學(xué)習(xí)的潛能,達(dá)成學(xué)習(xí)目標(biāo)的期望,是“內(nèi)推力”;而終結(jié)性評(píng)價(jià)更應(yīng)該關(guān)注對(duì)整體能力的描述,是分級(jí)、鑒定和甄別,是工具性反饋,是一種“外推力”。形成性評(píng)價(jià)和終結(jié)性評(píng)價(jià)的這些個(gè)性和共性的實(shí)質(zhì)和特點(diǎn),決定了我們?cè)谌粘=虒W(xué)中必須二者兼顧。 形成性評(píng)價(jià)關(guān)注學(xué)習(xí)過程,并及時(shí)給予學(xué)生最直接的有效幫助;終結(jié)性評(píng)價(jià)關(guān)注結(jié)果的呈現(xiàn),教學(xué)目標(biāo)的達(dá)成;也就是說,我們只有對(duì)教學(xué)全過程和結(jié)果從微觀和宏觀上共同把握,才能不斷促使學(xué)習(xí)過程和學(xué)習(xí)結(jié)果的評(píng)價(jià)達(dá)到和諧統(tǒng)一,讓教師和學(xué)生從評(píng)價(jià)中真正有收獲,有成長。

      參考文獻(xiàn)

      Bachman, L. F., & Palmer, A. S. (1990). Fundamental Considerations in Language Testing: Oxford University Press.

      Black, P.J. and Wiliam, D. (1998). Inside the Black Box. King's College London School of Education

      Cheng, Watanabe and Curtis (2004). Washback in Language Testing: Research Contexts and Methods. Lawrence Erlbaum Associates Inc.

      Cohen, A. D. (1994). Assessing Language Ability in the Classroom. Second Edition. Boston: Heinle & Heinlein Publishers.

      Heaton, J. B. (2000). Writing English Language Tests [M]. Beijing: Foreign Language Teaching and Research Press.

      Hughes, A. (2000). Testing for Language Teachers [M]. Beijing: Foreign Language Teaching and Research Press.

      Luxia, Q. (2005). Stakeholders' conflicting aims undermine the washback function of a high-stakes test. Language Testing, Volume 22, pp. 142-173(132)

      Morrow, K. (1986). The evaluation of tests of communicative performance. In M. Portal (Ed.), Innovations in language testing (pp. 1-13). Windsor: NFER Nelson.

      Scriven, M. (1967). The methodology of evaluation. Washington, DC: American Educational Research Association.

      韓寶成、戴曼純、楊莉芳,(2004),《從一項(xiàng)調(diào)查看大學(xué)英語考試存在的問題》,外語與外語教學(xué).

      亓魯霞,(2004),《意愿與現(xiàn)實(shí):中國高等院校統(tǒng)一招生英語考試的反駁作用研究》北 京:外語教學(xué)與研究出版社.

      趙秦嶺, 大學(xué)英語教師對(duì)語言評(píng)價(jià)的認(rèn)知及其反撥作用(英文)[J]. Teaching English in China, 2007, (3)

      趙秦嶺,副教授,首都師范大學(xué)外國語學(xué)院副院長,碩士生導(dǎo)師,北京市英語類專業(yè)群建設(shè)專家委員會(huì)秘書長,北京市多語種試驗(yàn)示范中心副主任。

      猜你喜歡
      教考教學(xué)大綱信度
      對(duì)標(biāo)評(píng)價(jià)體系,促進(jìn)教考一體
      《廣東地區(qū)兒童中醫(yī)體質(zhì)辨識(shí)量表》的信度和效度研究
      “教考分離”在體育院校田徑專業(yè)中的實(shí)踐與探索
      以綱為要,創(chuàng)新課程體系建設(shè)
      ——上海老年大學(xué)教學(xué)大綱建設(shè)實(shí)踐探索
      以人為本 以綱為綱
      ——老年大學(xué)教學(xué)大綱實(shí)踐與探索
      互動(dòng)式教學(xué)大綱在本科教學(xué)中的實(shí)踐與探索
      ——以《工程制圖與識(shí)圖》為例
      贏未來(2019年33期)2019-12-17 09:45:28
      中職學(xué)校教考分離后試卷分析的重要性
      活力(2019年21期)2019-04-01 12:18:30
      科技成果評(píng)價(jià)的信度分析及模型優(yōu)化
      體育社會(huì)調(diào)查問卷信度檢驗(yàn)的方法學(xué)探索——基于中文核心體育期刊163篇文章分析
      法國普通教育高中歷史教學(xué)大綱評(píng)介
      大港区| 海口市| 东至县| 锦屏县| 盘山县| 阿克陶县| 岳西县| 宽甸| 凉山| 峡江县| 吉首市| 崇州市| 定州市| 武宣县| 大关县| 洛隆县| 二手房| 梓潼县| 视频| 长泰县| 商都县| 镇巴县| 西乌| 大荔县| 邵武市| 长岭县| 汝阳县| 巢湖市| 桂林市| 渭南市| 托里县| 房产| 宜川县| 东平县| 射阳县| 洪江市| 天峨县| 德江县| 龙江县| 清徐县| 清新县|