開啟語言評估與測試的大門
——《探索語言評估與測試:行動中的語言》評介
郭凱金檀
(東北大學,沈陽,110819)
Green, A. 2014.ExploringLanguageAssessmentandTesting:LanguageinAction. London & New York: Routledge.ⅱ+269 pp. ISBN 978-0-415-59723-4.
作者簡介:郭凱,東北大學外國語學院語言測試研究中心研究助理。主要研究方向為語言測試與評估。電子郵箱:tokaiguo@gmail.com
金檀,東北大學外國語學院英語系副教授、語言測試研究中心主任。主要研究方向為語言測試與評估。電子郵箱:alextanjin@gmail.com
*本文受到國家社科基金重點項目“基于語料庫的大學英語語言能力標準特征參數研究”(編號13AYY005)的資助。
1. 引言
無論是在大規(guī)模測試還是在實際課堂教學中,語言測試與評估都在檢驗學習者掌握程度和教師教學成果中起到重要作用。Anthony Green是目前語言評估與測試領域內極具影響力的人物之一,他曾在牛津大學、布魯克斯大學和北倫敦大學教授語言評估課程,目前的研究興趣包括評估與學習之間的關系和實際測試開發(fā)過程等。他于2014年推出的新作《探索語言評估與測試:行動中的語言》(ExploringLanguageAssessmentandTesting:LanguageinAction)是繼其《語言功能的重新審視》(LanguageFunctionsRevisited,2012)之后,又一部語言測試與評估領域專著,對普及語言教師的測試與評估素養(yǎng)將產生積極作用,值得國內讀者研讀。
2. 簡介
近些年來,語言測試領域中最具代表性的專著教材當屬Bachman和Palmer(2010)和Fulcher和Davidson(2007)。前者屬于語言測試與評估領域的偏學術型教材,主要面向的讀者群體為博士生和語言測試研究者,后者則屬于該領域的高級教程,主要面向的讀者群體為具備一定能力背景知識的研究生,這兩本專著教材均適合用于具備一定語言測試與評估基礎的讀者來閱讀和學習?!短剿髡Z言評估與測試:行動中的語言》一書則不同,作為語言測試領域的基礎性入門讀物,本書的讀者群體主要為該領域的初學者,可作為語言學專業(yè)高年級本科生和研究生的基礎教程。因此,本書采用案例式導入,將基礎性與趣味性相結合,側重基礎概念的講解、理論知識的應用以及歷史背景的介紹,作者深入淺出地講解基礎概念,使讀者更容易接受和理解,并使讀者具備一定的實踐應用能力,也增強了讀者對語言測試發(fā)展歷史的了解。
全書分為三部分,共七章。第一部分(第1~4章)概述了語言評估的基本概念、操作目的、制定要求以及具體實踐。第二部分(第5~6章)從輸入和產出兩方面介紹對語言技能的評估。第三部分(第7章)回顧了語言評估的發(fā)展歷史,并展望了其未來的發(fā)展趨勢。這樣的結構框架安排使讀者在掌握基礎知識的前提下,對語言評估的發(fā)展史有所了解,加深了對語言評估的理解。
在第1章“認清語言評估本身”中,作者概述了語言評估的基本概念以及在教育情境中,語言教學、語言學習與語言評估三者之間的相互依賴關系。作者認為,廣義上的語言評估是以聽到或讀到的語言片段為證據來對語言產出者進行判斷,但本書所探討的語言評估更加注重語言知識的掌握與語言能力的運用。由此,作者對語言評估進行了簡單定義:“通過獲得證據來對一個人的語言知識和語言能力進行推斷”(Green 2014:5)。其中,語言知識包括對外語單詞的識別、外語句子的翻譯以及語法規(guī)則的了解等,語言能力則更多強調在實際生活中對所學語言的使用。作者認為語言評估應該是對這兩者的綜合判斷。由于語言教學、語言學習和語言評估三者是一個不可分離的整體,教師不僅應了解語言評估是如何制定、評分和解釋的,還應具備獨立完成這一系列任務的能力。在語言教學和學習方面,語言評估的重要性體現在兩個方面:第一,語言評估可以為教師提供信息,幫助他們做出正確的決定,以提高教學質量。教師一旦缺少了評估所提供的反饋信息,或者因評估不當獲得錯誤的反饋信息,教學活動和學習活動便會受到影響。第二,除了學習者自身通過對教師的模仿來進行語言學習以外,教師也可以通過觀察學習者的學習情況并提供反饋信息來幫助學習者進行語言學習。
在掌握語言評估基本概念的基礎上,第2章“語言評估的目的”闡述了人們對語言進行評估的目的,說明了語言評估與評估結果實際應用之間的緊密聯(lián)系。研究者們通常通過語言評估來收集兩類數據:一類是與語言學習的進展程度有關的數據;另一類是與語言能力能否滿足具體需要有關的數據。根據收集數據類型,語言評估目的又可分為兩種,一種用來檢驗學習者的學習成果和學習進度;另一種是用來檢驗學習者在具體情境中對所學語言的應用能力。根據目的的不同,作者將語言評估分為“教育評估”與“水平評估”。教育評估主要應用于課堂教學,評估內容為學習者所學(或將要學習的)知識,主要實施者為教師。水平評估通常考察的是學習者在特定環(huán)境中對語言的使用能力以及其語言水平能否滿足某種特定需求,比如開展工作、學習學術課程、出國旅游及移民等,其主要實施者是國家政府部門或者國際性學術組織。在學習者的學習成果和應用能力得到檢驗之后,評估結果在實際教學和學習中能夠得到充分運用才是評估另一意義所在。在教學過程中,教師可以通過評估來激勵學習者,通過表揚學習者的進步程度,對其學習成果給予肯定,來激發(fā)學習者的學習興趣和熱情。在學習者的學習過程中,評估能夠在其不同階段發(fā)揮作用。
第3章“語言評估的實踐”主要討論如何提高評估的有效性,作者建議應從“設計”(Planning)、“反思”(Reflection)、“提高”(Improvement)、“合作”(Cooperation)以及“證據”(Evidence)五個方面加以努力。我們應將評估看做是一個連續(xù)的、不斷重復的循環(huán)活動,由此,作者引入了評估循環(huán)模型這一概念,它將整個評估設計的流程分成七個不同階段,各個階段之間相互聯(lián)系、相互作用,共同構成一個不可割裂的循環(huán)過程,每個階段都有不同的執(zhí)行者。第一階段,主要執(zhí)行者為“評估設計師”(Designer),根據評估目的列出所要評估的知識、能力以及技巧,并設計將如何對此進行評估。第二階段,“制作人”(Producer)擔任主要角色,根據設計師的設計來制定評估形式和評分程序。第三階段,“組織者”(Organiser)決定整個評估的控制和管理方式。第四階段,“管理者”(Administrator)根據前三個階段制定的設計方案和指導方針來執(zhí)行評估,并針對評估效果進行報告。第五階段,“考生”(Assessee)參與評估,其表現被記錄在案。第六階段,“評分者”(Scorer)將考生表現與評分工具對比,對考生表現進行打分工作。第七階段,“使用者”(User)將考生得分作為決策基礎進行決策。到此,一個完整的評估流程得以完成。各環(huán)節(jié)作為整體的有機部分,任何一個環(huán)節(jié)的失誤都會影響其他環(huán)節(jié)的發(fā)展,只有保證每個環(huán)節(jié)的有效性,才能實現整個評估系統(tǒng)的有效性。
第4章“有效評估系統(tǒng)的特質”描述了有用的評估應具備的品質和特點,這四個基本特質是“可行性”(Practicality)、“可靠性”(Reliability)、“有效性”(Validity)以及“積極后效”(Beneficial Consequences)。(1)可行性是指開展評估所需資源與現有資源之間的差距(Bachman & Palmer 2010),這里的資源主要包括時間、工具、資金以及專業(yè)知識等,兩者之間的差距越小,評估的可行性越大,越容易實現;反之,則越小,越難實現??尚行允撬性u估實施的最基本要求,如果沒有足夠的資源,任何評估都將無法開展。(2)可靠性是指評估結果是否有用、可信、站得住腳。語言能力是一個不穩(wěn)定的、不確定的概念,在不同環(huán)境下,我們很難將人們的語言能力進行對比,于是,應該根據使用語言的社會目的的差異將語言能力分類進行評判。同時,評判過程中也不可避免地會存在大量不確定因素或測量誤差,因此,要求我們從測量工具、具體情況、不同考生等多個方面來減小誤差,從而保證評估的可靠性。(3)有效性是指評估結果對評估目的的反饋程度以及理論和實踐證據對評估結果的支持程度,它經常被認為是好的評估的必要條件。好的評估應該實現最初的評估目的,達到理想的評估效果。(4)積極后效指的是評估對所評估的語言知識、語言能力和語言技巧本身的影響,對評估所涉及的個人的影響,甚至是對整個社會的影響。一個真正有用的評估對每個所涉及的個人甚至是整個社會群體的有利影響應大于不利影響。任何一個評估都不能夠完全滿足可行性、可靠性、有效性和積極后效這四個重要特征,但可通過優(yōu)化與合理使用所有資源來達到最佳評估效果。
第5章“輸入性技能的評估”主要探討對“輸入性技能”(Receptive Skills)的評估與測試,這里的輸入性技能是指學習者的閱讀技能和聽力技能。對這兩種能力進行評估的目的是為了考察學習者應用其語言能力對文字和口頭輸入內容的理解水平,這些輸入內容常常為考生在語言學習過程中或日常生活中會遇到的問題和內容。通過對考生輸入性技能的評估,評估使用者可以了解學習者在學習外語過程中在讀和聽兩方面所面臨的主要困難,并幫助他們采取措施,進行解決。作者提出,無論是在大規(guī)模的語言測試還是在課堂教學評估中,評估設計者首先應該明確的是所要評估的閱讀能力和聽力能力,有目的的展開評估工作。在本章中,作者分別介紹了閱讀和聽力的種類和過程,以及如何選擇合適的輸入內容來對學習者的輸入性技能進行評估。然而,應當指出,學習者的理解技能是不能夠被直接觀察的,僅僅通過看別人讀一段文章或聽一段新聞,我們很難了解其對輸入內容的理解程度。因此,評估設計者只能通過設計其他評估方式來找到評估學習者輸入性技能的證據,這可能包括讓學習者根據指令來說或寫。
第6章“輸出性技能的評估”與第5章對應,主要探討對“輸出性技能”(Productive Skills)的評估與測試,這里的輸出性技能是指學習者的口語技能和寫作技能。在積累了一定的語言知識、具備了一定的語言技能之后,學習者需要利用所學語言來傳達個人思想,輸出所要表達的內容,這時,學習者的說和寫的技能則更為重要。在語言的輸出過程中,說話的人或寫作的人需要將想要表達的信息內容通過具體形式表現出來,然而,其信息內容對聽者或讀者來說是未知信息,因此,說話的人或寫作的人就需要在具備一定的語法、詞匯、語篇以及音韻知識的基礎上,按照一定的目標設定、交流策略將想要傳達的信息內容清楚表達出來,使聽者或讀者明白其表達用意。因此,學習者的輸出性技能直接影響其思想的傳達。對輸出性技能進行評估的目的是了解學習者是否具備完成現實任務的能力,如寫一篇技術報告、做一次有效果的演講等。
本書的第一部分和第二部分向讀者介紹了語言測試與評估的基本概念和兩種技能評估的實際操作,使讀者大致了解語言評估基礎知識和相關應用,在第三部分,即第7章“語言評估的發(fā)展”中,作者進一步向讀者介紹語言評估的發(fā)展歷史及發(fā)展脈絡,并分析其未來發(fā)展趨勢,并分析了語言評估發(fā)展不同時期激烈爭論的話題。具體來說,作者將歷史追溯到大約五十年前在華盛頓召開的學術會議,主要介紹近五十年來測試領域的發(fā)展、語言教育目標的變化、評估與教學間的關系、語言熟練度的本質以及技術性改變等問題,其中涵蓋了綜合性測試的出現、分數解釋方法的發(fā)展、語言交流能力的評估以及語言評估的道德影響等多方面內容,并在最后部分展望了語言評估未來的發(fā)展,為讀者開辟了一條深入研究和探索語言評估之路。
3. 簡評
正如本書前言中所說,本書為應用語言學方向的本科生與研究生而設計,目的是為他們開啟應用語言學領域的大門,使其對語言評估與測試擁有初步了解。作者在書中通過列舉具體實例來闡述基本概念問題,使讀者在了解概念的基礎上,能夠在模擬實踐中加以應用。通覽全書,作者確實達到了預期的寫作目的。作為一本語言測試與評估領域的基礎性讀物,本書具有問題驅動式設計、案例結合式講授以及任務實踐式應用等諸多特點:
第一,問題驅動式設計。作為一本語言測試與評估領域的基礎性讀物,在結構設計上,本書將基礎性與趣味性相結合。例如,在本書的第一章中,作者首先為讀者提出幾個反思問題,引起讀者關于本章節(jié)內容的思考,將讀者的自身經歷與理論知識相結合,使讀者能夠通過對實踐經驗的思考,帶著問題在接下來的內容中尋找答案,這種問題式驅動設計能夠很好地達到激發(fā)讀者閱讀興趣的目的。
第二,案例結合式講授。在介紹具體理論知識之前,作者會列舉實際生活中的具體事例,使讀者擁有一個熟悉的情境,在這個情境中,作者通過類比來講解理論知識,使讀者明白如何評價語言評估的質量,這種基礎概念講解與現實案例相結合的講授方式更易于讀者的理解和掌握。除此之外,作者在語言使用方面多采用通俗易懂的詞匯,在內容講解時多采用圖文并茂的方式,以幫助讀者的思考和理解。
第三,任務實踐式應用。本書在理論知識講解的基礎上,更多強調理論與實踐相結合,培養(yǎng)讀者將理論知識應用到具體實踐情境中的能力,為此,作者在每部分的講解中根據所講解的理論知識為讀者提出了相應的讀者任務。例如,在本書的第三章中,作者在講解評估循環(huán)模型概念時,為讀者提出了設計評估流程、列出主要活動和每個環(huán)節(jié)涉及到的相關人員的任務,使讀者不局限于對理論知識本事的掌握,同時也能具備實踐應用的能力。
作為語言評估與測試領域的基礎性入門讀物,本書也還存在一些不足之處。例如,本書對網上評卷(Onscreen Marking)(Coniam 2009)和自動評分(Automated Scoring)(Williamson,Xi & Breyer 2012)等新興信息科學技術的介紹略顯不足。
本書內容由淺入深,例證豐富多彩,語言通俗易懂,以趣味性和基礎性相結合的方式向讀者介紹了該領域的發(fā)展歷史和基礎知識,為語言測試與評估領域未來的發(fā)展提供了一定的理論參考,對其實踐操作也具有一定的指導意義。對于該領域的初學者來說,這是一本不可多得的好書。
參考文獻
Bachman, L. F. & A. S. Palmer. 2010.LanguageAssessmentinPractice[M]. Oxford: Oxford University Press.
Coniam, D. 2009. A comparison of onscreen and paper-based marking in the Hong Kong pulic examination system [J].EducationalResearchandEvaluation15: 243-63.
Fulcher, G. & F. Davidson. 2007.LanguageTestingandAssessment:AnAdvancedResourceBook[M]. London & New York: Routledge.
Green, A. 2014.ExploringLanguageAssessmentandTesting:LanguageinAction[M]. London & New York: Routledge.
Williamson, D. M., X. Xi & F. J. Breyer. 2012. A framework for evaluation and use of automated scoring [J].EducationalMeasurement:IssuesandPractice31: 2-13.
(責任編輯玄琰)
Abstracts of Major Papers in This Issue
Transitivity Shifts of Chinese Ascriptive Clauses in Translation, by ZHAO Jing, p. 8
In systemic functional linguistics, Chinese ascriptive clause refers to a kind of relational clause without a verbal phrase. It could be further divided into three types: the one with nominal as predicate, with adjective as predicate, and with subject-predicate phrase as predicate. This paper is mainly concerned with the features of Chinese ascriptive clauses and the transitivity shifts caused during the process of translation, including process type shifts, process deletion, transitivity scale moderation and the employment of metaphorical transitivity expressions. Those shifts are caused by either language structure, or distinctive status of nominals and adjectives in Chinese and English, or the need to optimize discourse. Languages have different ways of construing experience. The transference of experiential function does not guarantee the matching of transitivity types. Translation should conform to the features of construing experience in the target language.
Research Methods of Sound Change: Current Situation and Future Development, by QIU Chun’an, p. 13
The paper deals with the research approaches of sound change in Chinese dialects. The traditional methods are as follows, i.e., descriptive and comparative method, the integration of text-research method and historical-comparative method, lexical diffusion theory, overlapped theory, and historical strata analysis. The article also discusses the future developments of sound change, i.e., equilibrium-punctuation, phonetic typology, geographical linguistics, experimental phonetics, and variation sociolinguistics. The author holds that these methods are complementary to each other.
Evaluative Analysis of Projections in English and Chinese Academic Book Review, by ZHOU Hui & LIU Yongbing, p. 18
Based on an analysis of the use of projections in English and Chinese academic book reviews in Applied Linguistics, this study aims to explore the evaluative meanings in the review discourses from a cross-cultural perspective. The quantitive and textual analyses of the corpus data reveals that compared with English academic book review, there exists a marked difference in a less frequent use of projections in Chinese book reviews, specifically, in the categories of Author’s Acts and Writer’s Stance, and that a reduced interpersonal investment is made in Chinese book reviews with a preference for the experiential meaning potential, in contrast with the evaluative meaning potential. These differences are interpreted in reference to the nature of academic culture, interpersonal relations in the disciplinary community and the authorial voice.
Reflection of Teaching Reform of General Linguistics at Beijing Normal University, by PENG Xuanwei & YU Li, p. 29
Here a general description of the course reform of General Linguistics at Beijing Normal University is reported. First, a three-level course goal, namely, knowledge, skill and ability is introduced. Then, a practical reform scheme is put forward consisting of five aspects: teaching and learning content, methodology, experiential subjects, procedure and assessment, the focus of which lies in a three-subject interactive model with a question-oriented route: teacher, assistant and student. Finally, objective descriptions from students’ responses are presented. Remaining issues are also laid out for further thinking.
A Study of Chinese Relatives Produced by L2 Learners:A Typological Perspective, by LI Jinman, p. 34
As shown by typological observations, Chinese relative clause (RC) is prenominal, which is typologically rare in Verb-Object languages. Thus Chinese RC might be a difficult structure to acquire for learners whose first language does not have this type of word order. Based on a comparative corpus analysis of Chinese RCs produced by English, Japanese, and Korean learners, this study investigated the commonalities and differences between the distributions of Chinese RCs produced by the three groups of learners. The learner corpus data show that the distributional patterns of Chinese RCs produced by these second language learners, regardless of their first language, conform in varying degrees to typological generalizations derived from natural language observations as well as some minor disparities.
Uncovering Phrase Teaching Design via Meta-linguistic Sequences in English Textbooks: A Co-selection Perspective, by LIANG Hongmei, p. 40
The present paper, within the framework of co-selection theory, sets out to uncover features of phrase teaching design in three phrase-centered English textbooks by analyzing the meta-linguistic sequences in the textbooks. By applying the working model of extended units of meaning to analyzing the co-text of the “word” type words, the study works out the meaningful patterns of the meta-linguistic sequences in the textbooks which either highlight the four aspects of phrase knowledge or represent the two levels of cognitive demands on phrase exercises. Significance of the present research lies in the fact that the descriptive mechanism of co-selection analysis manifests itself as a powerful way to uncover features of a specific pedagogic approach embedded in English textbooks by retrieving recurrent patterns of meta-linguistic sequences.
A Study of China’s MTI Learner Translator Corpus Construction and Research, by ZHOU Qinqin, p. 56
This paper, resting on the systematic review and evaluation of corpus-based translation studies at home and abroad in the past two decades, sets out to propose that China’s MTI Learner Translator Corpus Construction be a strategic option that serves MTI translation pedagogy and the training of translation talents. This study puts forwards some prospect for the linguistic as well as translation research, and elaborates on the research approaches and methodology employed in this study, with a view of expanding the scope of translation studies and generating the paradigm of interdisciplinarity.
An Integrated Approach to Text-oriented Translation and Translation Teaching, by FENG Quangong, p. 63
Text-oriented translation requires that text should be treated as an organic whole and that a translator should follow the wholeness and harmony principles with great textual awareness when translating a text. Translation teaching should also be text-oriented or take a relatively independent text as the unit of teaching, and analyze the translation from a larger perspective. Relevant theoretical resources should be integrated into text-oriented translation teaching, such as rhetoric, writing, translation techniques and theories, contrast and comparison between English and Chinese languages, so that the students’ translation competence will be improved and their understanding of translation will be deepened.
Reconstructed Classics: Compensating Translation ofAhQZhengZhuan’s Style, by CUI Yanqiu, p. 68
Among the five translations of Lu Xun’sAhQZhengZhuan, Mr. and Mrs. Yang Xianyi’s version is widely acknowledged; William A. Lyell’s version is characterized by detailed notes and explanatory translation with a clear purpose of cultural dissemination; while Julia Lovell’s translation published in 2009 is recommended as “the most accessible” byTIMEmagazine. The translators, in different times, with different cultural identity and purposes of translation, convey the fiction’s style differently in register, temporal and spatial traits, narration, ways of humor and irony. Comparing with the Yangs’ faithful translation, Lyell and Lovell make creative attempts in representing Lu Xun’s style, some of which are successful. With the aim of Chinese literature going global, target readers’ reception and cultural dissemination should be important factors in translation criticism.