徐 鷹
(華南理工大學(xué),廣州,510641)
《Routledge語言測(cè)試手冊(cè)》評(píng)介
徐 鷹
(華南理工大學(xué),廣州,510641)
Fulcher,G.&F.Davidson.2012.The Routledge Handbook of Language Testing.London &New York:Routledge.ISBN:978-0-415-57063-3(hbk).pp.■+536.
自2010年以來,Routledge出版公司陸續(xù)推出了一系列應(yīng)用語言學(xué)手冊(cè)叢書,其中《語言測(cè)試手冊(cè)》于2012年出版。該手冊(cè)的兩位編者都是國際語言測(cè)試界的權(quán)威學(xué)者。Fulcher現(xiàn)為英國萊斯特大學(xué)教授,擔(dān)任國際語言測(cè)試界權(quán)威期刊《語言測(cè)試》(Language Testing)的主編;Davidson現(xiàn)為美國伊利諾伊大學(xué)教授。他們?cè)?jīng)一起合作撰寫過一本教材《語言測(cè)試與評(píng)估:高級(jí)讀本》(Fulcher &Davidson 2007)。該教材由Routledge出版公司于2007年出版,屬于該公司應(yīng)用語言學(xué)系列教材之一。它的出版產(chǎn)生了巨大反響,被譽(yù)為語言測(cè)試專業(yè)師生必讀教材(Brown 2011)。《語言測(cè)試手冊(cè)》是《語言測(cè)試與評(píng)估:高級(jí)讀本》的延續(xù),面向語言測(cè)試的開發(fā)者、使用者、研究者以及相關(guān)政策制定者,是一本語言測(cè)試研究的必備參考書。
全書共分為九大部分,每部分包括三到五章,共三十四章。
第一部分主題是效度以及效度驗(yàn)證,這是所有語言測(cè)試研究的核心。第1章首先對(duì)效度概念的變遷進(jìn)行了回顧和批判,然后從哲學(xué)本體論和認(rèn)識(shí)論的角度對(duì)效度、構(gòu)念、語言能力發(fā)展等核心問題進(jìn)行了闡述。第2章對(duì)基于論證的效度驗(yàn)證模式進(jìn)行了系統(tǒng)闡述,并以做事測(cè)試為例演示了如何構(gòu)建解釋性論證,以及如何在效度論證中檢驗(yàn)其推理和假設(shè)的“連貫性”(coherence)和“或然性”(plausibility)等關(guān)鍵問題。第3章對(duì)測(cè)試和評(píng)估中對(duì)弱勢(shì)考生的“調(diào)節(jié)幫助”(accommodation)的效度問題進(jìn)行了探討。
第二部分討論課堂評(píng)估和反撥效應(yīng)。第4章認(rèn)為,課堂評(píng)估與傳統(tǒng)測(cè)試研究在方法論和哲學(xué)背景上有顯著差異,課堂評(píng)估的目的在于促學(xué),其理論框架是社會(huì)文化理論和建構(gòu)主義理論。第5章對(duì)反撥效應(yīng)的研究現(xiàn)狀進(jìn)行了分析,發(fā)現(xiàn)考試影響是多因素共同作用的結(jié)果,其中教師態(tài)度和信念作用明顯。但目前相關(guān)實(shí)證研究之間欠缺連貫性和系統(tǒng)性,亟待理論化。第6章對(duì)學(xué)習(xí)二/外語的小學(xué)生的評(píng)估進(jìn)行了分析,并提出了“幫助任課教師成為評(píng)估者”的觀點(diǎn)。第7章對(duì)建立在社會(huì)文化理論框架下的動(dòng)態(tài)評(píng)估理論進(jìn)行了詳細(xì)介紹,認(rèn)為該理論旨在實(shí)現(xiàn)評(píng)、教結(jié)合,未來研究重點(diǎn)在于如何實(shí)現(xiàn)評(píng)估過程的標(biāo)準(zhǔn)化。第8章對(duì)基于課堂的診斷評(píng)估進(jìn)行了闡述,介紹了診斷評(píng)估的目的、診斷推理的來源以及評(píng)估后效等特征,并對(duì)評(píng)估標(biāo)準(zhǔn)的詳細(xì)度、診斷信息內(nèi)容類別、認(rèn)知診斷建模以及診斷評(píng)估中的師生主體性等內(nèi)容進(jìn)行了探討。
第三部分討論語言測(cè)試的社會(huì)使用。第9章以美國航空英語考試為例,說明如何設(shè)計(jì)具有特定目的和高風(fēng)險(xiǎn)的語言測(cè)試。第10章介紹語言測(cè)試研究中的一個(gè)冷門領(lǐng)域:對(duì)交際障礙考生的語言測(cè)試。第11章從人類遷徙、公民身份政策的歷史變遷出發(fā),探討了語言測(cè)試如何服務(wù)移民、入籍以及避難等政治目的。第12章討論了語言測(cè)試的社會(huì)維度,重點(diǎn)分析了語言知識(shí)構(gòu)念如何影響測(cè)試開發(fā)和分?jǐn)?shù)解釋,以及測(cè)試使用對(duì)個(gè)人、機(jī)構(gòu)和組織產(chǎn)生的后果。
第四部分涉及測(cè)試設(shè)計(jì)細(xì)則。第13章以準(zhǔn)則參照測(cè)試為例,強(qiáng)調(diào)了測(cè)試設(shè)計(jì)細(xì)則的重要性,認(rèn)為它是測(cè)試開發(fā)和效度論證的核心組件,是生產(chǎn)試題的“模具”(mould)。第14章以TOEFL iBT考試和TOEIC口語和寫作考試為例,詳細(xì)說明了以證據(jù)為中心的測(cè)試設(shè)計(jì)(ECD)的關(guān)鍵原則、主要成分以及操作流程。第15章以口語能力面試(OPI)任務(wù)為例,對(duì)做事測(cè)試中的主張、證據(jù)和推理進(jìn)行了討論,重點(diǎn)論述了測(cè)試目標(biāo)域分析和抽樣、任務(wù)難度分析、評(píng)分標(biāo)準(zhǔn)構(gòu)建以及評(píng)分人差異處理等問題。
第五部分介紹試題命制和任務(wù)設(shè)計(jì)。第16章從心理測(cè)量學(xué)、真實(shí)性、系統(tǒng)性、批判性等視角出發(fā),回顧了試題編寫的不同方法,描述了命題者的情況,認(rèn)為有必要加強(qiáng)對(duì)他們的研究。第17章對(duì)綜合性寫作任務(wù)從任務(wù)對(duì)比、任務(wù)特征、綜合性寫作任務(wù)和語言能力之間關(guān)系以及該任務(wù)所測(cè)構(gòu)念進(jìn)行了評(píng)述,重點(diǎn)是寫作構(gòu)念界定、綜合性寫作任務(wù)類型、閱讀文本選取、任務(wù)指令編寫和評(píng)分標(biāo)準(zhǔn)開發(fā)等問題。第18章闡釋了考試策略和測(cè)試任務(wù)設(shè)計(jì)的關(guān)系,核心問題是確定考試策略是否屬于所測(cè)構(gòu)念。
第六部分主題是原型題實(shí)驗(yàn)和現(xiàn)場(chǎng)實(shí)驗(yàn)。第19章認(rèn)為原型題實(shí)驗(yàn)是大規(guī)模前測(cè)或試測(cè)前的必要階段,能有效解決新題型開發(fā)中的許多問題。第20章以某個(gè)學(xué)術(shù)寫作測(cè)試為例,在“測(cè)試使用論證”(Bachman &Palmer 2010)的框架下討論了“實(shí)際使用前測(cè)試”(Pre-operational testing),具體包括考題試測(cè)和現(xiàn)場(chǎng)實(shí)驗(yàn)兩個(gè)階段。第21章以詞匯測(cè)試為例,詳細(xì)說明了試測(cè)的過程。
第七部分討論測(cè)量理論和實(shí)踐。第22章對(duì)經(jīng)典測(cè)試?yán)碚撨M(jìn)行了回顧,重點(diǎn)是項(xiàng)目分析、信度計(jì)算、測(cè)量的標(biāo)準(zhǔn)誤以及效度分析等內(nèi)容,并對(duì)測(cè)試研究者提出了七點(diǎn)忠告。第23章通過一份樣本數(shù)據(jù)介紹了項(xiàng)目反應(yīng)理論的基本觀點(diǎn)以及各種參數(shù)模型,并重點(diǎn)介紹了多層面Rasch模型。第24章從哲學(xué)高度對(duì)信度概念進(jìn)行了重新審視,重點(diǎn)是信度同一致性、誤差、概推性(generalizability)、可靠性(dependability)之間的關(guān)系,并從“特質(zhì)說”(traitbased reasoning)出發(fā)闡述了信、效度之間的關(guān)系。第25章對(duì)概化理論及其常用工具進(jìn)行了詳細(xì)介紹,并對(duì)分?jǐn)?shù)差異的本質(zhì)進(jìn)行了深入探討。第26章從歷史和哲學(xué)的視角對(duì)評(píng)分標(biāo)準(zhǔn)的類型、構(gòu)建方法和特點(diǎn)進(jìn)行了全面、細(xì)致地分析,重點(diǎn)探討了基于不同方法的評(píng)分標(biāo)準(zhǔn)的優(yōu)、缺點(diǎn),同時(shí)論述了評(píng)分標(biāo)準(zhǔn)和語言習(xí)得的關(guān)系、評(píng)分標(biāo)準(zhǔn)描述語的模糊性、測(cè)試重點(diǎn)以及推理在評(píng)分標(biāo)準(zhǔn)解釋中的核心地位。
第八部分的主題是施測(cè)和培訓(xùn)。第27章從質(zhì)量管理視角(包括質(zhì)量控制和質(zhì)量保證兩種活動(dòng))討論了如何對(duì)測(cè)試循環(huán)的各個(gè)階段控制誤差,從而強(qiáng)化測(cè)試的效度論證。第28章在效度理論的框架下討論了口語測(cè)試中的對(duì)話人培訓(xùn)以及做事測(cè)試(包括口語測(cè)試和寫作測(cè)試)中的評(píng)分人培訓(xùn)。第29章對(duì)計(jì)算機(jī)輔助語言測(cè)試(CALT)進(jìn)行了探討,并以TOEFL iBT和CBT考試為例重點(diǎn)討論了計(jì)算機(jī)的強(qiáng)大功能和提高分?jǐn)?shù)意義的關(guān)系。第30章對(duì)計(jì)算機(jī)作文自動(dòng)評(píng)分的效度進(jìn)行了充分而深入的回顧,并從分?jǐn)?shù)的準(zhǔn)確性、概推性、意義性和有用性等角度提出了關(guān)于自動(dòng)評(píng)分效度驗(yàn)證的一系列關(guān)鍵問題。
第九部分的主題是道德和語言政策。第31章深入討論了道德規(guī)范的概念和作用。第32章闡述了測(cè)試中的“公正”(fairness)的含義。第33章在回顧歐洲語言能力等級(jí)共同量表(CEFR)和美國外語教學(xué)委員會(huì)(ACTFL)語言能力量表/美國外交學(xué)院(FSI)口語能力等級(jí)量表的基礎(chǔ)上,對(duì)現(xiàn)有語言能力量表的優(yōu)、缺點(diǎn)進(jìn)行了深入的闡述。第34章對(duì)測(cè)試的誤用現(xiàn)象進(jìn)行了剖析。
本手冊(cè)對(duì)語言測(cè)試與評(píng)估領(lǐng)域的主要研究內(nèi)容做了全面審視。兩位編者通過精心選擇各章主題界定了語言測(cè)試的研究范圍,進(jìn)而確立了語言測(cè)試作為一門獨(dú)立學(xué)科的地位。縱觀全書,本手冊(cè)具有以下幾個(gè)鮮明特點(diǎn):
(1)內(nèi)容豐富,結(jié)構(gòu)嚴(yán)謹(jǐn)
本手冊(cè)既包括當(dāng)前語言測(cè)試領(lǐng)域討論的常規(guī)話題,也包括一些相對(duì)非主流,但卻意義重大的研究分支,如第3章關(guān)于測(cè)試中對(duì)弱勢(shì)考生的調(diào)節(jié)幫助的效度問題;第10章關(guān)于交際障礙癥考生的語言測(cè)試以及第27章關(guān)于試題命制和施測(cè)過程中的質(zhì)量管理等。這些主題的選取結(jié)合了國際語言測(cè)試界的研究現(xiàn)狀,體現(xiàn)了學(xué)科發(fā)展的前沿和動(dòng)態(tài),有效地界定了語言測(cè)試作為一門獨(dú)立學(xué)科的研究范圍和研究范式,為廣大語言測(cè)試研究者提供了重要參考和有益啟示。需要特別指出的是,就國內(nèi)語言測(cè)試研究現(xiàn)狀而言,本手冊(cè)中的不少主題(例如第三、六、八和九部分)的研究還相對(duì)單薄,國內(nèi)權(quán)威學(xué)術(shù)期刊難以見到相關(guān)的文章。因此,本手冊(cè)有助于拓展國內(nèi)語言測(cè)試研究者的學(xué)術(shù)視野。
本手冊(cè)一共由38位國際語言測(cè)試界的頂尖學(xué)者共同完成,他們中既有權(quán)威學(xué)者(如Michael Kane、Alan Davies、Dianne Wall等),也有在某個(gè)領(lǐng)域作出重大突破的后起之秀(如Eunice Jang、Xiaoming Xi等)。每一章體例大致相同,包括導(dǎo)入、前期研究視角、重點(diǎn)研究問題、當(dāng)前研究及貢獻(xiàn)、未來研究方向、深度閱讀文獻(xiàn)以及核心參考文獻(xiàn)等七部分。從結(jié)構(gòu)上看,每一章的作者在回顧前期研究的基礎(chǔ)上,首先提出了該領(lǐng)域的關(guān)鍵問題,并對(duì)當(dāng)前研究中的熱點(diǎn)、難點(diǎn)、不足和主要研究方法進(jìn)行了討論,然后對(duì)未來該領(lǐng)域的發(fā)展進(jìn)行了展望,最后提供了該領(lǐng)域深度閱讀文獻(xiàn)和核心參考文獻(xiàn),為讀者清楚地描繪了學(xué)科發(fā)展方向。此外,各章節(jié)的安排也體現(xiàn)了編者們的獨(dú)具匠心,基本沿襲了《語言測(cè)試與評(píng)估:高級(jí)讀本》的體例,以效度和效度驗(yàn)證為中心,由內(nèi)而外,一步步向語言測(cè)試學(xué)科的各相關(guān)領(lǐng)域推進(jìn)。各部分和各章節(jié)環(huán)環(huán)相扣、邏輯嚴(yán)密。這種編排也反映了該手冊(cè)的編寫理念同《語言測(cè)試與評(píng)估:高級(jí)讀本》一脈相承,反映了語言測(cè)試研究的實(shí)用主義(pragmatism)和效果驅(qū)動(dòng)(effect-driven testing)理念(Brown 2011:146)。兩位編者明確指出,本手冊(cè)第一部分對(duì)效度和效度驗(yàn)證的討論是所有語言測(cè)試設(shè)計(jì)和研究活動(dòng)的核心,以目標(biāo)驅(qū)動(dòng)(purpose-driven)的測(cè)試研究就是要確定和研究能構(gòu)建某一測(cè)試的證據(jù),從而保證該測(cè)試的分?jǐn)?shù)解釋同目標(biāo)決策相關(guān)。因此,在具體安排上,首先由第1章作者Carol Chapelle深入細(xì)致地回顧了當(dāng)代效度理論的四種主要觀點(diǎn):Lado(1961)對(duì)效度的原初定義、Messick(1989)的整體效度觀、Bachman和Palmer(1996)的測(cè)試有用性以及Kane(2006)的效度論證。然后,第2章作者M(jìn)ichael Kane對(duì)解釋性論證在效度論證中的重要作用進(jìn)行了闡述。毋庸置疑,這兩章為整個(gè)手冊(cè)奠定了扎實(shí)的理論基礎(chǔ),從而將看似千差萬別的不同研究主題有機(jī)編排成脈絡(luò)分明的章節(jié)。
(2)觀點(diǎn)鮮明,互為補(bǔ)充
本手冊(cè)每一部分至少包括三章。作者們從各個(gè)獨(dú)特視角對(duì)同一個(gè)主題進(jìn)行闡述,為深化讀者對(duì)該領(lǐng)域的認(rèn)識(shí)提供了寶貴材料,滿足了語言測(cè)試作為一門新興學(xué)科亟需建立統(tǒng)一學(xué)科集體意識(shí)的迫切需求,充分體現(xiàn)了兩位編者的理念:“通往知識(shí)與進(jìn)步的唯一途徑是通過討論并測(cè)試不同的觀點(diǎn)”(16)。以第二部分課堂評(píng)估和反撥效應(yīng)為例,作者們選取了不同的理論視角,圍繞課堂評(píng)估“促學(xué)”的作用和定位進(jìn)行闡述。相關(guān)各章節(jié)聯(lián)系緊密,如第5、7、8章在不同的理論框架下都對(duì)反撥效應(yīng)展開了討論。這種安排既為讀者全面深刻地理解課堂評(píng)估和反撥效應(yīng)奠定了堅(jiān)實(shí)的基礎(chǔ),同時(shí)也為其汲取百家之長,培養(yǎng)自身創(chuàng)造性、批判性思維提供了條件。
(3)立論深刻,例證翔實(shí)
本手冊(cè)各章作者站在哲學(xué)和歷史的高度,對(duì)語言測(cè)試各個(gè)領(lǐng)域的發(fā)展進(jìn)行回顧和展望,因此得出的結(jié)論富有洞見和啟發(fā),如第28章作者Annie Brown在對(duì)評(píng)分人培訓(xùn)研究進(jìn)行展望時(shí)提出,未來研究應(yīng)包含不同培訓(xùn)方法效果對(duì)比以及評(píng)分人如何處理反饋信息等內(nèi)容。這種敏銳的視野體現(xiàn)了學(xué)者們?cè)鷮?shí)的理論基礎(chǔ)、清晰的學(xué)科發(fā)展思路以及豐富的科研實(shí)踐經(jīng)驗(yàn)。此外,為了更好地詮釋核心觀點(diǎn),各章節(jié)都提供了具體實(shí)例,增強(qiáng)了全書的可讀性和實(shí)用性??偠灾?,本手冊(cè)的作者們對(duì)某一話題專業(yè)論述以及提供的豐富信息對(duì)廣大語言測(cè)試研究者提供了絕好的學(xué)習(xí)典范。
本手冊(cè)也有少許遺憾。(1)本手冊(cè)包括九部分,基本對(duì)應(yīng)《語言測(cè)試與評(píng)估:高級(jí)讀本》的導(dǎo)入部分的十個(gè)單元,唯獨(dú)缺少第三單元(構(gòu)念和理論模型)。由于語言使用具有復(fù)雜性和多變量特征,目前學(xué)界對(duì)于語言能力的本質(zhì)屬性仍存在爭(zhēng)議。盡管Kane的解釋性論證能在某種程度上規(guī)避構(gòu)念定義這個(gè)棘手的問題,但是鑒于語言能力在語言測(cè)試中的核心地位以及手冊(cè)和教材的緊密聯(lián)系,這部分應(yīng)該在手冊(cè)中占有一席之地。(2)部分章節(jié)安排的位置不太恰當(dāng),如第12章作者Richard Young對(duì)于語言測(cè)試社會(huì)維度的探討關(guān)涉的內(nèi)容繁多,既對(duì)語言測(cè)試所測(cè)的構(gòu)念從社會(huì)語境視角進(jìn)行了細(xì)致分析,又對(duì)語言測(cè)試如何在社會(huì)活動(dòng)中對(duì)個(gè)人以及社會(huì)整體產(chǎn)生的作用進(jìn)行了描述。這一章可以視為第一部分效度和效度論證的內(nèi)容。(3)某些研究熱點(diǎn)如二語語用能力測(cè)試沒有提及,有興趣的讀者可參考Roever(2011)。此外,對(duì)于英語作為通用語(English as a Lingua Franca)、英語的各類變體以及非英語的其他語言(如漢語)的測(cè)試也只字未提。對(duì)于一個(gè)學(xué)科的手冊(cè)而言,有必要對(duì)這些重要新興領(lǐng)域的研究現(xiàn)狀和進(jìn)展加以描述。
總而言之,本手冊(cè)學(xué)術(shù)價(jià)值極高,值得向廣大讀者推薦。
Bachman,L.F.&A.S.Palmer.1996.Language Testing in Practice[M].Oxford:Oxford University Press.
Bachman,L.F.&A.S.Palmer.2010.Language Assessment in Practice:Developing Language Assessments and Justifying Their Use in the Real World[M].Oxford:Oxford University Press.
Brown,A.2011.Book review of Language Testing and Assessment:An Advanced Resource Book.[J].Language Testing(1):145-48.
Fulcher,G.&F.Davidson.2007.Language Testing and Assessment:An Advanced Resource Book[M].London&New York:Routledge.
Kane,M.T.2006.Validation[A].In R.L.Brennan(ed.).Educational Measurement[C].Westport:Praeger.17-64.
Lado,R.1961.Language Testing[M].New York:McGraw-Hill.
Messick,S.1989.Validity[A].In R.L.Linn(ed.).Educational Measurement[C].New York:Macmillan.13-103.
Roever,C.2011.Testing of second language pragmatics:Past and future[J].Language Testing(4):463-81.
(責(zé)任編輯 甄鳳超)
徐鷹,華南理工大學(xué)外國語學(xué)院副教授、博士。主要研究方向?yàn)檎Z言測(cè)試。電子郵箱:xuying@scut.edu.cn
*本文系廣東省教育科研項(xiàng)目(編號(hào)2013JK013)、廣東省哲學(xué)社科規(guī)劃學(xué)科共建項(xiàng)目(編號(hào)GD14 XWW21)、廣東教育教學(xué)成果獎(jiǎng)(高等教育)培育項(xiàng)目以及華南理工大學(xué)校級(jí)教改項(xiàng)目(編號(hào)X2 WY-Y1141940)的部分研究成果。