蔣遠(yuǎn)橋
【關(guān)鍵詞】情境,測(cè)評(píng),效度,高考
隨著時(shí)代的發(fā)展,社會(huì)對(duì)教育、對(duì)人才有了新的要求,人們對(duì)學(xué)習(xí)、課程、測(cè)評(píng)也有了新的理解?!蛾P(guān)于深化考試招生制度改革的實(shí)施意見(jiàn)》《關(guān)于新時(shí)代推進(jìn)普通高中育人方式改革的指導(dǎo)意見(jiàn)》《關(guān)于深化教育教學(xué)改革全面提高義務(wù)教育質(zhì)量的意見(jiàn)》《深化新時(shí)代教育評(píng)價(jià)改革總體方案》等文件的陸續(xù)發(fā)布正是新時(shí)代、新要求、新理解的體現(xiàn)。
具體到語(yǔ)文學(xué)科,新課程標(biāo)準(zhǔn)即《普通高中語(yǔ)文課程標(biāo)準(zhǔn)(2017年版2020年修訂)》(以下簡(jiǎn)稱“ 課程標(biāo)準(zhǔn)”)既是這一進(jìn)程中的重要成果,也是新教學(xué)、新測(cè)評(píng)的綱領(lǐng)性文件。課程標(biāo)準(zhǔn)從學(xué)習(xí)目標(biāo)、學(xué)習(xí)內(nèi)容、學(xué)習(xí)方式、課程結(jié)構(gòu)、課程方式、測(cè)評(píng)內(nèi)容、測(cè)評(píng)方式各個(gè)方面提出了新要求,“任務(wù)”“活動(dòng)”“情境”是貫通整個(gè)系統(tǒng)的三個(gè)重要概念[1]。關(guān)于依憑情境開(kāi)展活動(dòng)、完成任務(wù)以達(dá)到提升核心素養(yǎng)的理論研究與教學(xué)實(shí)踐,已經(jīng)廣泛而熱烈地展開(kāi),基于情境進(jìn)行測(cè)量評(píng)價(jià),也已經(jīng)在過(guò)程性評(píng)價(jià)乃至大規(guī)模高利害考試如中高考中普遍施行。關(guān)于情境在考試中的運(yùn)用,眾多學(xué)者和考試從業(yè)者已經(jīng)作出了有益的探索[2],本文將基于這些討論,以高考為主要討論對(duì)象,從效度視域理解情境測(cè)評(píng),探究情境測(cè)評(píng)有效和有限的程度,討論情境測(cè)評(píng)的實(shí)現(xiàn)路徑和提升情境測(cè)評(píng)效度的關(guān)鍵策略,以期對(duì)情境測(cè)評(píng)在大規(guī)模高利害考試中的實(shí)踐運(yùn)用有所幫助。
一、效度視域下情境測(cè)評(píng)的必然性
教育測(cè)評(píng)以如下心理假設(shè)為基礎(chǔ):人的心理特質(zhì)是客觀存在的;這些心理特質(zhì)具有相對(duì)穩(wěn)定性;這些心理特質(zhì)雖然抽象,但可以通過(guò)一定的外部刺激作出的反應(yīng)得以測(cè)量評(píng)估;測(cè)評(píng)的結(jié)果可以類(lèi)推得到心理特質(zhì)的整體特征和水平。這些心理特質(zhì)稱為構(gòu)念(construct),具體到語(yǔ)文測(cè)評(píng),就是“構(gòu)成語(yǔ)文能力的理念”。測(cè)評(píng)就是要通過(guò)外部情境的刺激,讓考生作出反應(yīng),并依據(jù)反應(yīng)推測(cè)考生素養(yǎng)的特征和水平,即基于考生反應(yīng)推斷所測(cè)構(gòu)念的特征和水平。效度(validity)就是一個(gè)測(cè)評(píng)項(xiàng)目在多大程度上達(dá)到了測(cè)評(píng)目的,即在多大程度上準(zhǔn)確反映了所要測(cè)評(píng)的構(gòu)念。
在20世紀(jì)90年代,Messick 以構(gòu)念效度(construct validity)為效度問(wèn)題的核心提出“一元效度(unified validity)”理論,將構(gòu)念效度置于評(píng)判一個(gè)測(cè)評(píng)項(xiàng)目的頂端,認(rèn)為其中包括內(nèi)容、實(shí)體、結(jié)構(gòu)性、概化、外推、后效六個(gè)方面。[3]這六個(gè)方面都與所測(cè)評(píng)的構(gòu)念息息相關(guān),與本文討論的情境測(cè)評(píng)關(guān)系最為緊密的是構(gòu)念效度的內(nèi)容、實(shí)體、結(jié)構(gòu)性、概化四個(gè)方面。
效度理論的發(fā)展基于測(cè)評(píng)理念的發(fā)展,而任何測(cè)評(píng)改革都不會(huì)僅在測(cè)評(píng)領(lǐng)域內(nèi)發(fā)生,正如前文所言:時(shí)代、教育、人才、學(xué)習(xí)、課程、教學(xué)的發(fā)展,要求測(cè)評(píng)也要有相應(yīng)的發(fā)展。情境測(cè)評(píng)正是社會(huì)主義新時(shí)代的人才需求,以及核心素養(yǎng)的教育理念、學(xué)習(xí)內(nèi)容、學(xué)習(xí)方式方面改革在評(píng)價(jià)領(lǐng)域中的一種反映。正因?yàn)樾聲r(shí)代要求社會(huì)主義建設(shè)者和接班人具備應(yīng)對(duì)21 世紀(jì)各種復(fù)雜的、綜合的、不確定的現(xiàn)實(shí)生活環(huán)境的品質(zhì),教育教學(xué)應(yīng)以培養(yǎng)學(xué)生的這種關(guān)鍵品質(zhì)為目標(biāo),這種關(guān)鍵品質(zhì)即核心素養(yǎng)。因?yàn)楹诵乃仞B(yǎng)是應(yīng)對(duì)復(fù)雜、綜合的真實(shí)情境的品質(zhì),所以它也更適宜在復(fù)雜、綜合的情境中得到培養(yǎng)。
課程標(biāo)準(zhǔn)在“ 命題原則”中要求“ 以語(yǔ)文學(xué)科核心素養(yǎng)為考查目標(biāo)”,也就是要求測(cè)評(píng)的構(gòu)念是“核心素養(yǎng)”,那么要想提高核心素養(yǎng)測(cè)評(píng)的效度,依據(jù)構(gòu)念效度理論則需要:測(cè)評(píng)內(nèi)容必須是語(yǔ)文學(xué)科核心素養(yǎng)中具有強(qiáng)相關(guān)性和代表性的一部分;實(shí)體方面則要求考生在答題過(guò)程中的作答行為能夠反映核心素養(yǎng)的特征并得到證據(jù)的足夠支持;結(jié)構(gòu)性方面則要求試卷的各部分構(gòu)成及其構(gòu)成比例能夠真實(shí)反映核心素養(yǎng)的各部分及其比例;概化方面則要求關(guān)于核心素養(yǎng)的分?jǐn)?shù)解釋適用于其他各種不同的語(yǔ)境情景、交際任務(wù);外推方面要求考試結(jié)果具有高相關(guān)性,能夠得到外部證據(jù)的支持,如考試分?jǐn)?shù)與學(xué)生日常生活表現(xiàn)出來(lái)的實(shí)際使用語(yǔ)言的能力具有高相關(guān)性等;后效方面則要求分?jǐn)?shù)解釋的依據(jù)、考試結(jié)果的使用所產(chǎn)生的后果有利于核心素養(yǎng)的發(fā)展和提升。
也正是基于這樣的邏輯鏈條,課程標(biāo)準(zhǔn)在“學(xué)業(yè)水平測(cè)試與高考命題建議”中提出“考試、測(cè)評(píng)題目應(yīng)以具體的情境為載體”。因?yàn)椤?真實(shí)、富有意義的語(yǔ)文實(shí)踐活動(dòng)情境是學(xué)生語(yǔ)文核心素養(yǎng)形成、發(fā)展和表現(xiàn)的載體”,所以當(dāng)且僅當(dāng)“以情境任務(wù)作為試題載體”,在復(fù)雜多樣的情境中完成不良結(jié)構(gòu)的真實(shí)任務(wù),才能“呈現(xiàn)學(xué)生語(yǔ)文素養(yǎng)的多樣化表現(xiàn)”[4],然后才能依據(jù)學(xué)生的表現(xiàn)對(duì)其語(yǔ)文學(xué)科核心素養(yǎng)進(jìn)行評(píng)估。
二、效度視域下的測(cè)評(píng)情境和“語(yǔ)境”
課程標(biāo)準(zhǔn)中的“ 命題建議”在提出“ 以具體情境為載體”時(shí)對(duì)情境作了如下說(shuō)明:“ 真實(shí)、富有意義的語(yǔ)文實(shí)踐活動(dòng)情境是學(xué)生語(yǔ)文核心素養(yǎng)形成、發(fā)展和表現(xiàn)的載體。語(yǔ)文實(shí)踐活動(dòng)情境主要包括個(gè)體體驗(yàn)情境、社會(huì)生活情境、學(xué)科認(rèn)知情境?!盵5]學(xué)者揭示了情境和語(yǔ)境理論的緊密關(guān)系,指出情境化教學(xué)是語(yǔ)境理論在教育領(lǐng)域中的運(yùn)用。[6]不過(guò)課程標(biāo)準(zhǔn)對(duì)“語(yǔ)境”和“ 情境”兩個(gè)詞語(yǔ)的使用并無(wú)清晰明確的分工。課程標(biāo)準(zhǔn)中“語(yǔ)境”一詞出現(xiàn)在“語(yǔ)言建構(gòu)與運(yùn)用”相關(guān)學(xué)習(xí)任務(wù)群的學(xué)習(xí)目標(biāo)和內(nèi)容中,以及相應(yīng)的五個(gè)等級(jí)的學(xué)業(yè)質(zhì)量水平“ 質(zhì)量描述”中,體會(huì)“語(yǔ)境”的用例,可以判斷課程標(biāo)準(zhǔn)是在“ 具體的語(yǔ)言使用的場(chǎng)景環(huán)境”而非“ 語(yǔ)篇內(nèi)的上下文”的意義上來(lái)使用“ 語(yǔ)境”一詞的。而課程標(biāo)準(zhǔn)在闡述“ 語(yǔ)言建構(gòu)與運(yùn)用”時(shí)對(duì)相關(guān)要點(diǎn)的表述則使用了“情境”一詞,即“ 發(fā)展在具體語(yǔ)言情境中正確有效地運(yùn)用祖國(guó)語(yǔ)言文字進(jìn)行交流溝通的能力”,如果課程標(biāo)準(zhǔn)在闡述核心素養(yǎng)的內(nèi)涵、學(xué)習(xí)的目標(biāo)與內(nèi)容、學(xué)業(yè)質(zhì)量的表現(xiàn)時(shí)是系統(tǒng)而一貫的,則可以知道它在使用兩個(gè)詞時(shí)并未明確區(qū)分。
“ 語(yǔ)境”(context)一詞常見(jiàn)于語(yǔ)言學(xué)和邏輯學(xué)領(lǐng)域,指言語(yǔ)行為所發(fā)生的環(huán)境,一般包括文內(nèi)因素和文外因素,前者指向話語(yǔ)行為中的前后語(yǔ)或上下文,后者指向話語(yǔ)行為的“情景”和“ 背景”[7]。狹義的“ 語(yǔ)境”常常指口語(yǔ)中的前后語(yǔ)、書(shū)面語(yǔ)中的上下文,即文內(nèi)語(yǔ)境。廣義的語(yǔ)境則可以無(wú)所不包,如維特根斯坦的語(yǔ)言使用理論、奧斯汀的言語(yǔ)行為理論、斯特勞森的日常語(yǔ)言邏輯等,乃至巴赫金、克里斯蒂娃的互文理論也都是語(yǔ)境理論的組成部分。比照課程標(biāo)準(zhǔn)關(guān)于情境的分類(lèi)詮釋,可以看出語(yǔ)境和情境有千絲萬(wàn)縷的聯(lián)系:無(wú)論哪一種情境下開(kāi)展的語(yǔ)文實(shí)踐活動(dòng)都要考慮三種類(lèi)型的語(yǔ)境,即文本語(yǔ)境、情境語(yǔ)境、背景語(yǔ)境,這樣才能準(zhǔn)確地理解和表達(dá)意義、思想,達(dá)到語(yǔ)文活動(dòng)行事取效的意圖。
不過(guò)從理論來(lái)源及側(cè)重看,二者又有著區(qū)別。課程標(biāo)準(zhǔn)對(duì)情境的分類(lèi)主要基于實(shí)踐活動(dòng)的主體和客體,基于活動(dòng)的目的和意圖,這種情境含義明顯受到建構(gòu)主義和情境認(rèn)知理論的影響。情境認(rèn)知理論把知識(shí)視為個(gè)人與情境之間的交互關(guān)系的副產(chǎn)品,把學(xué)習(xí)視為個(gè)人、知識(shí)、情境之間的交互作用的副產(chǎn)品,重在基于情境的認(rèn)知過(guò)程和學(xué)習(xí)過(guò)程。情境認(rèn)知理論正是為消除學(xué)習(xí)脫離情境的弊端而提出的:傳統(tǒng)的正式的學(xué)習(xí)因孤立于獲得意義的情境,而僅能收獲靜止的、刻板的、未完成的、膚淺的理解。[8]
與傳統(tǒng)的教學(xué)類(lèi)似,傳統(tǒng)的測(cè)評(píng)多注重文內(nèi)語(yǔ)境即上下文,也會(huì)關(guān)注到背景語(yǔ)境,如歷史文化背景,這在以紙筆為載體的終結(jié)性考試如高考中尤為明顯,這也是與高考把識(shí)記、理解、概括、分析等能力作為測(cè)評(píng)構(gòu)念是一致的。以傳統(tǒng)學(xué)習(xí)掌握的知識(shí)如果能讓學(xué)生通過(guò)傳統(tǒng)的考試,卻不能將同樣的知識(shí)運(yùn)用于真實(shí)情境解決實(shí)際問(wèn)題,那么說(shuō)明傳統(tǒng)的考試是低效度的。正是為了提高測(cè)評(píng)效度,所以課程標(biāo)準(zhǔn)提出了情境測(cè)評(píng)。
正如語(yǔ)境理論強(qiáng)調(diào)話語(yǔ)行為的行事取效的意圖,我們也應(yīng)該這樣理解課程標(biāo)準(zhǔn)格外強(qiáng)調(diào)語(yǔ)言運(yùn)用的環(huán)境場(chǎng)景,格外強(qiáng)調(diào)“真實(shí)、富有意義的語(yǔ)文實(shí)踐活動(dòng)情境”的意圖。因此,試題應(yīng)當(dāng)做到以個(gè)人、社會(huì)、學(xué)科三種情境為載體,在語(yǔ)境的運(yùn)用上,需要格外強(qiáng)調(diào)情境語(yǔ)境,實(shí)現(xiàn)情境測(cè)評(píng),這樣才能有針對(duì)性地消除原有考試的弊端,提高測(cè)評(píng)的效度。
三、效度視域下“真實(shí)”的測(cè)評(píng)情境
對(duì)“ 真實(shí)”的一種常見(jiàn)理解是現(xiàn)實(shí)性,即學(xué)習(xí)和測(cè)評(píng)所利用的情境與現(xiàn)實(shí)的生活情境應(yīng)當(dāng)是吻合的,某個(gè)測(cè)評(píng)情境越能原汁原味地再現(xiàn)目標(biāo)情境中該任務(wù)的情形、要求和實(shí)施條件,該情境就越是真實(shí)的?;谶@樣的理解,“ 真實(shí)”的測(cè)評(píng)情境應(yīng)當(dāng)重現(xiàn)各種身份、行業(yè),如作家、學(xué)者、商人、科學(xué)家、管理者、設(shè)計(jì)師等通常面對(duì)的各種挑戰(zhàn)或要求。[9]當(dāng)然,真正的現(xiàn)實(shí)情境任務(wù)及其實(shí)施條件是無(wú)法完全重現(xiàn)的,正是在這個(gè)意義上,在以紙筆考試為基本方式的大規(guī)模高利害考試如高考中,“ 直接測(cè)試”或“真實(shí)測(cè)評(píng)”甚至可以看成一個(gè)偽命題。[10]
既然絕大多數(shù)現(xiàn)實(shí)性情境難以復(fù)制,那么命題者能做的是使測(cè)評(píng)情境和任務(wù)盡量模仿現(xiàn)實(shí)、靠近現(xiàn)實(shí),根據(jù)測(cè)評(píng)需要,模仿現(xiàn)實(shí)生活情境,考生則模擬完成任務(wù),任務(wù)結(jié)果和成品當(dāng)然也不會(huì)真正投入使用,這也正是目前的高考試題情境化的常見(jiàn)做法。在這種理論傾向下,我們需要額外注意以下問(wèn)題。
一是情境任務(wù)的典型性、代表性。現(xiàn)實(shí)性情境測(cè)評(píng)歸根到底針對(duì)的是考生在完成某一特定真實(shí)任務(wù)中的表現(xiàn)。楊向東指出,這樣的測(cè)評(píng)關(guān)鍵在于“ 判斷當(dāng)前評(píng)價(jià)任務(wù)的領(lǐng)域代表性”,即“如何確定所采用的評(píng)價(jià)任務(wù)是所要推斷的目標(biāo)情境或任務(wù)范圍的一個(gè)代表性樣本”[11]。具體到高考,這一問(wèn)題在寫(xiě)作測(cè)評(píng)中更為突出。課程標(biāo)準(zhǔn)中的寫(xiě)作內(nèi)容十分豐富,有作品評(píng)介、調(diào)查報(bào)告、文學(xué)作品、雜感、隨筆、評(píng)論、研究論文、研究報(bào)告、文學(xué)評(píng)論、學(xué)術(shù)性小論文等,而高考由于考試時(shí)長(zhǎng)的限制,往往只能要求完成一個(gè)寫(xiě)作任務(wù),這就需要對(duì)高考寫(xiě)作任務(wù)的典型性和代表性格外留意。也正是在這樣的考量下,課程標(biāo)準(zhǔn)對(duì)測(cè)評(píng)情境任務(wù)的典型性提出明確要求:典型任務(wù)是指“ 為評(píng)價(jià)學(xué)生語(yǔ)文素養(yǎng)水平而選取的具有代表性價(jià)值的語(yǔ)文實(shí)踐活動(dòng)”,考生通過(guò)典型的實(shí)踐活動(dòng),“ 體會(huì)典型的思維過(guò)程與方法,體驗(yàn)典型的情感,呈現(xiàn)典型的成果”。[12]
二是評(píng)價(jià)標(biāo)準(zhǔn)的可類(lèi)推?,F(xiàn)實(shí)性的情境任務(wù)往往有很多特定要素,這些要素?zé)o法涵蓋其他任務(wù)的特征,也無(wú)法代表一般性的整體素養(yǎng)??忌谕瓿涩F(xiàn)實(shí)性情境任務(wù)中的表現(xiàn)必然受到這些特定特征的影響,甚至越優(yōu)秀的考生會(huì)越注意某一現(xiàn)實(shí)性任務(wù)的“區(qū)別性特征”,而這些特征對(duì)考試目標(biāo)來(lái)說(shuō)卻可能是邊緣性的。評(píng)價(jià)標(biāo)準(zhǔn)如果不對(duì)這些邊緣特征加以關(guān)注,則測(cè)評(píng)不容易準(zhǔn)確;如果關(guān)注這些邊緣特征,評(píng)價(jià)標(biāo)準(zhǔn)又很難類(lèi)推到其他情境任務(wù)中去。這讓現(xiàn)實(shí)性情境測(cè)評(píng)陷入兩難的境地。
三是分?jǐn)?shù)和分?jǐn)?shù)使用的可解釋?!督逃c心理測(cè)量標(biāo)準(zhǔn)》的效度定義反復(fù)強(qiáng)調(diào)分?jǐn)?shù)解釋的“ 預(yù)定用途”,如“ 效度是指證據(jù)和理論支持為了某一預(yù)定用途而產(chǎn)生的測(cè)試分?jǐn)?shù)解釋的程度”,“效度驗(yàn)證過(guò)程是積累相關(guān)證據(jù)為某一特定用途的分?jǐn)?shù)解釋提供可靠科學(xué)的依據(jù)”,“基于指定用途所作的特定分?jǐn)?shù)解釋可以作為效度的證據(jù)”,甚至認(rèn)為效度必須與分?jǐn)?shù)使用關(guān)聯(lián):“ 測(cè)評(píng)效度應(yīng)當(dāng)是指向預(yù)定用途的特定解釋,不加預(yù)定用途的限制而泛泛地說(shuō)‘ 測(cè)評(píng)效度是不正確的”。[13]具體到高考,其基本功能是“為不同類(lèi)型的高校選拔出符合要求的新生”,“ 服務(wù)選才不僅是高考制度建立的目的、存在的依據(jù),也是高考的基本功能和使命”[14],其分?jǐn)?shù)解釋指向核心素養(yǎng),其分?jǐn)?shù)使用的解釋指向“高校選才”,二者是契合的。高考分?jǐn)?shù)是考生進(jìn)入高校最重要、最直接的依據(jù),所以基于情境測(cè)評(píng)得到的分?jǐn)?shù)及其使用也應(yīng)當(dāng)指向高校學(xué)習(xí),指向國(guó)家選才。在這樣的前提下,測(cè)評(píng)情境應(yīng)當(dāng)適應(yīng)高校對(duì)人才培養(yǎng)的要求,適應(yīng)國(guó)家經(jīng)濟(jì)社會(huì)發(fā)展對(duì)多樣化、高素質(zhì)人才的需求,這對(duì)現(xiàn)實(shí)性情境來(lái)說(shuō)是很艱難的任務(wù)。
四是測(cè)評(píng)的準(zhǔn)確度,即構(gòu)念是否受到干擾而“測(cè)不準(zhǔn)”。一個(gè)測(cè)評(píng)項(xiàng)目可以描述為“成績(jī)需求—項(xiàng)目開(kāi)發(fā)—項(xiàng)目實(shí)施—閱卷評(píng)分—成績(jī)使用”這樣的流程,任何一個(gè)環(huán)節(jié)出現(xiàn)差錯(cuò)都會(huì)導(dǎo)致效度的降低?,F(xiàn)實(shí)性測(cè)評(píng)情境追求復(fù)雜多變的時(shí)空和社會(huì)條件,對(duì)命題必然提出更高的要求。如2020年高考全國(guó)Ⅰ卷的寫(xiě)作試題,要求考生基于“ 班級(jí)計(jì)劃舉行讀書(shū)會(huì),圍繞上述材料展開(kāi)討論”的情境寫(xiě)一篇發(fā)言稿。所謂“ 討論”,指就某一問(wèn)題交換意見(jiàn)或進(jìn)行辯論,一般是有來(lái)有往而往復(fù)推進(jìn)的,那么班級(jí)同學(xué)在讀書(shū)會(huì)上發(fā)表的觀點(diǎn)就成為現(xiàn)實(shí)情境中極為重要的一部分,他們的觀點(diǎn)和意見(jiàn)應(yīng)該是“我”思考和發(fā)言的起點(diǎn),“我”的“感受和思考”理應(yīng)包括與同學(xué)的商量、辯駁,而這種動(dòng)態(tài)語(yǔ)境在紙筆考試中是很難呈現(xiàn)的。
另外,命題還要避免那些阻礙考生答題的無(wú)關(guān)因素,如與本試題測(cè)試目標(biāo)無(wú)關(guān)的本學(xué)科的其他知識(shí)或外學(xué)科知識(shí)、能力的需求。前述試題要求就“ 齊桓公、管仲和鮑叔三人,你對(duì)哪個(gè)感觸最深”寫(xiě)發(fā)言稿,那么考生對(duì)這三人性格人品、事跡經(jīng)歷的了解,自然成為“ 感觸”的生發(fā)點(diǎn),關(guān)于這三人的事跡在現(xiàn)實(shí)性任務(wù)中提供了極其有限的資料,對(duì)該三人事跡的了解甚至可以看成與寫(xiě)作能力相關(guān)性不強(qiáng)的干擾因素。
還有閱卷信度的問(wèn)題。仍以作文為例,考生寫(xiě)完一篇作文,其語(yǔ)言能力的表現(xiàn)已經(jīng)完成,按理說(shuō)閱卷者應(yīng)當(dāng)給出準(zhǔn)確的分?jǐn)?shù),但要做到這一點(diǎn)并不容易?,F(xiàn)實(shí)性測(cè)評(píng)情境對(duì)閱卷提出了更高、更為細(xì)致的要求,在現(xiàn)實(shí)性情境下,閱卷者不僅要看考生寫(xiě)作的內(nèi)容形式,還要看考生能否全面考慮到某言說(shuō)者以什么身份、在什么場(chǎng)合或平臺(tái)、為了什么目的、以什么文體、對(duì)誰(shuí)說(shuō)了什么,并且要對(duì)這些現(xiàn)實(shí)性情境的要素在賦分上作出符合效度的分配,這對(duì)目前的閱卷現(xiàn)實(shí)提出了巨大的挑戰(zhàn)。
把“ 真實(shí)”理解為“ 現(xiàn)實(shí)性”,容易只關(guān)注測(cè)評(píng)情境的現(xiàn)實(shí)程度,而忽視情境與所測(cè)建構(gòu)間的聯(lián)系。對(duì)測(cè)評(píng)情境現(xiàn)實(shí)性的追求不是增高而是降低了構(gòu)念效度,這是我們需要警惕的。基于效度視域?qū)ΜF(xiàn)實(shí)性測(cè)評(píng)情境的考量,越來(lái)越多的研究者對(duì)“ 真實(shí)”的這種理解尤其是對(duì)大規(guī)模高利害考試中的“ 現(xiàn)實(shí)性情境”的應(yīng)用有了自覺(jué)的反思。今年高考作文試題中,現(xiàn)實(shí)性交際情境的寫(xiě)作任務(wù)比往年有所減少,可能也是對(duì)現(xiàn)實(shí)性測(cè)評(píng)情境反思的體現(xiàn)。
四、效度視域下“有效”的測(cè)評(píng)情境
王寧教授在談到對(duì)“ 真實(shí)”的理解時(shí)指出,所謂“ 真實(shí)”是“ 這種語(yǔ)境對(duì)學(xué)生而言是真實(shí)的,是他們?cè)诶^續(xù)學(xué)習(xí)和今后生活中能夠遇到的,也就是能引起他們聯(lián)想,啟發(fā)他們往下思考,從而在這個(gè)思考過(guò)程中獲得需要的方法,積累必要的資源,豐富語(yǔ)言文字運(yùn)用的經(jīng)驗(yàn)”,她把“ 真實(shí)情境”概括為“ 從所思所想出發(fā),以能思能想啟迪,向應(yīng)思應(yīng)想前進(jìn)”。[15]如果“ 真實(shí)”一詞容易引起誤會(huì),我們可以在教學(xué)中突出課程標(biāo)準(zhǔn)在詮釋三類(lèi)情境時(shí)使用的“ 有意義”這一語(yǔ)詞。類(lèi)推到測(cè)評(píng)中,則只要測(cè)評(píng)情境不違背基本的日常邏輯,能有效地服務(wù)于測(cè)試構(gòu)念,達(dá)到期待的測(cè)試效果,這樣的情境都可以稱為“有效”的情境。
這種效度視域下對(duì)測(cè)評(píng)情境“ 有效”的追求,強(qiáng)調(diào)在情境中解決評(píng)價(jià)任務(wù)所需的思維方式或素養(yǎng)與目標(biāo)情境中的思維方式或素養(yǎng)的相似性,而不強(qiáng)調(diào)情境或任務(wù)本身的相似性。以文言實(shí)詞解釋的測(cè)評(píng)為例,以下幾種測(cè)評(píng)情境的設(shè)置在效度上都是可接受的。
1. 寫(xiě)出“ 民用不擾,而物生亦遂”中的“ 遂”字在句中的意思。
2. 為“ 民用不擾,而物生亦遂”中的“ 遂”字選擇釋義正確的一項(xiàng)是( )
A. 通達(dá)B. 因循C. 稱心D. 長(zhǎng)成
3. 為“ 民用不擾,而物生亦遂”中的“ 遂”字選擇釋義正確的一項(xiàng)是( )
A. 通達(dá)?!痘茨献印罚骸澳苤筚F,何往而不遂?”
B. 因循。南朝梁丘遲《與陳伯之書(shū)》:“ 若遂不改,方思仆言?!?/p>
C. 稱心。唐杜甫《羌村三首》之一:“ 世亂遭飄蕩,生還偶然遂?!?/p>
D. 長(zhǎng)成?!秶?guó)語(yǔ)》:“犠牲不略,則牛羊遂?!?/p>
4. 小明在讀到所給文本“民用不擾,而物生亦遂”一句時(shí)無(wú)法理解句中的“遂”字便去查字典,字典呈現(xiàn)如下,請(qǐng)你為小明推薦一個(gè)恰當(dāng)?shù)牧x項(xiàng)。
A. 通達(dá)。《淮南子》:“能知大貴,何往而不遂?”
B. 因循。南朝梁丘遲《與陳伯之書(shū)》:“若遂不改,方思仆言?!?/p>
C. 稱心。唐杜甫《羌村三首》之一:“世亂遭飄蕩,生還偶然遂。”
D. 長(zhǎng)成。《國(guó)語(yǔ)》:“犠牲不略,則牛羊遂?!?/p>
完成例題1 所需的思維與“ 通過(guò)文言文閱讀,梳理文言詞語(yǔ)在不同上下文中的詞義和用法”相似,完成例題2 所需的思維與“ 學(xué)生借助工具書(shū)獨(dú)立研讀文本”相似,例題3 呈現(xiàn)了接近借助工具書(shū)研討文本的現(xiàn)實(shí)生活的情境,例題4則是對(duì)現(xiàn)實(shí)生活情境的全真模仿。四道題所設(shè)置的情境在現(xiàn)實(shí)性即與現(xiàn)實(shí)生活的距離上各有不同,卻都能有效測(cè)評(píng)對(duì)文言文詞語(yǔ)的理解。李衛(wèi)東指出,簡(jiǎn)單情境、良性結(jié)構(gòu)的問(wèn)題和任務(wù)雖然不能促成深度理解和運(yùn)用,但也是不可缺少的,是認(rèn)知學(xué)習(xí)的基礎(chǔ)[16]。在測(cè)評(píng)中,簡(jiǎn)單情境也是可接受的,是不可缺少的,這與高考以文字來(lái)呈現(xiàn)情境并要求考生在有限的時(shí)間內(nèi)完成任務(wù)的特點(diǎn)也是一致的。
不過(guò),既然測(cè)評(píng)構(gòu)念是核心素養(yǎng),而核心素養(yǎng)是應(yīng)對(duì)復(fù)雜、綜合的真實(shí)情境的品質(zhì),所以它也更適宜在復(fù)雜的綜合的不良結(jié)構(gòu)的情境中加以測(cè)評(píng)。不良結(jié)構(gòu)的情境任務(wù)沒(méi)有暗示確保取得成功的策略或方法,這類(lèi)情境是模糊的,在解決方案提出前需要進(jìn)一步定義或明確。因此,這類(lèi)問(wèn)題或疑問(wèn)更多需要的不是知識(shí),而是良好的判斷力和想象力,這也更多地指向核心素養(yǎng)[17]。因此,評(píng)判測(cè)試情境質(zhì)量高下的關(guān)鍵是情境的復(fù)雜或綜合程度,而不是情境的現(xiàn)實(shí)性程度。
高考是大規(guī)模高利害考試,涉及的人數(shù)眾多,影響范圍廣,對(duì)考生個(gè)人命運(yùn)和社會(huì)發(fā)展都有極其重要的影響。這要求高考有較高的效度。效度視域下高考中的情境測(cè)評(píng)應(yīng)當(dāng)具有以下特點(diǎn):以核心素養(yǎng)為測(cè)評(píng)構(gòu)念,情境的設(shè)置應(yīng)當(dāng)有助于而非干擾核心素養(yǎng)的準(zhǔn)確測(cè)評(píng),情境相關(guān)的要求應(yīng)當(dāng)在評(píng)價(jià)標(biāo)準(zhǔn)中得以體現(xiàn)并在實(shí)踐中可操作;高考的目的是為高校和國(guó)家選才育才,所以高考的分?jǐn)?shù)解釋?xiě)?yīng)當(dāng)以此為既定用途,分?jǐn)?shù)的使用應(yīng)當(dāng)與高校和國(guó)家對(duì)人才的要求一致;注重情境的典型性、代表性,完成情境任務(wù)所用思維特質(zhì)可類(lèi)推到其他情境;注重情境的復(fù)雜性、綜合性,完成情境任務(wù)所用思維應(yīng)該有質(zhì)和量的保障,并且追求這些思維特質(zhì)的綜合貫通。