戴一飛
(教育部考試中心,北京 100084)
黨的十九大報告指出,建設(shè)教育強國是中華民族偉大復(fù)興的基礎(chǔ)工程,必須把教育事業(yè)放在優(yōu)先位置。當前,我國教育改革框架的“四梁八柱”已經(jīng)搭建,教育改革進入“全面施工內(nèi)部裝修”階段[1],教育轉(zhuǎn)向內(nèi)涵式發(fā)展。改革開放之后,我國各級教育考試機構(gòu)逐漸從教育行政機關(guān)脫離,向?qū)I(yè)化機構(gòu)轉(zhuǎn)型發(fā)展,在考試招生制度改革等一系列重大教育改革舉措中發(fā)揮著重要作用。30多年來,各級教育考試機構(gòu)在專業(yè)化程度上有了較大提升,尤其是在命題、考務(wù)、信息和評價4個主要業(yè)務(wù)環(huán)節(jié)[2],已基本實現(xiàn)“讓專業(yè)的人做專業(yè)的事”,落實了考試招生制度改革中“加強考試管理,完善專業(yè)考試機構(gòu)功能,提高服務(wù)能力和水平”[3]的要求。我國正在從教育大國向教育強國邁進,人民對教育質(zhì)量和教育公平有更高期待,教育信息化水平在不斷提升,這些都要求教育考試機構(gòu)進一步加強專業(yè)化建設(shè),注重內(nèi)涵式發(fā)展,把握新時代的機遇。
美國教育考試服務(wù)中心(Educational Testing Service,ETS)是世界著名的專業(yè)化教育考試評價機構(gòu),在考試技術(shù)的運用和教育評價觀念的引領(lǐng)方面一直處于領(lǐng)先水平。該機構(gòu)于2000年設(shè)立了首個研究講席(Research Chair),開啟了在教育考試機構(gòu)內(nèi)部建立講席,推進和確??荚嚠a(chǎn)品有效公平且具備創(chuàng)新性的管理模式和學(xué)術(shù)傳統(tǒng)。截至目前,ETS共設(shè)立了5個研究講席,研究方向各有側(cè)重。本文擬通過介紹ETS設(shè)立的研究講席及講席專家,剖析將研究型大學(xué)基層學(xué)術(shù)活動組織形式——講席制,應(yīng)用于專業(yè)化考試機構(gòu)的合理性,以及這種制度設(shè)計對于我國教育考試機構(gòu)建設(shè)和評價事業(yè)發(fā)展的啟示。
講席制(Chair System)是以教授為核心的權(quán)威型學(xué)術(shù)活動組織運行機制,萌芽于中世紀,因使用教師授課的座椅(Cathedra)隱喻講席教職(Professional Chair)而得名。19世紀初,以德國柏林大學(xué)為代表的現(xiàn)代研究型大學(xué),將講席制繼承下來,并發(fā)揚光大。這種以教授為學(xué)術(shù)工作中心的高等教育內(nèi)部組織機制,對于包括美國在內(nèi)的西方各國的大學(xué)產(chǎn)生了深遠影響。2000年,為歡迎教育測量學(xué)家霍蘭德(Paul W.Holland)重返ETS工作,ETS為其設(shè)立了首個研究講席,并以現(xiàn)代測量學(xué)之父——洛德(Frederick M.Lord)的名字命名,稱之為洛德講席(Frederic M.Lord Chair)①洛德于2000年去世,該講席的設(shè)立也有緬懷這位測量學(xué)巨擘之意。。從此,以設(shè)立研究講席的形式,表彰和致敬為ETS的考試與評價事業(yè)作出卓越貢獻的研究者及其成就,被作為一項傳統(tǒng)建立起來。通過設(shè)置洛德講席,ETS向外界釋放出一個強烈信號,即該機構(gòu)對于測量與統(tǒng)計理論的高度重視,在其看來,將測量與統(tǒng)計應(yīng)用于教育考試與評價是專業(yè)化考試機構(gòu)安身立命的根基所在。
霍蘭德之所以能夠成為ETS歷史上首位講席專家,在于他直接影響和塑造了ETS今日所秉持的測試理念與工作機制。他曾于1986年被ETS任命為首席杰出科學(xué)家,隨后執(zhí)教于加州大學(xué)伯克利分校的教育研究生院(Graduate School of Education)和統(tǒng)計學(xué)系?;籼m德將統(tǒng)計學(xué)思維運用到考試產(chǎn)品的研發(fā)和應(yīng)用當中,其在社會網(wǎng)絡(luò)(social networks)、因果推理(causal inference)、項目反應(yīng)理論(Item Response Theory)、等值以及項目功能差異(DIF)等方面的理論建樹,至今仍在指導(dǎo)教育測量界的實踐[4]。
霍蘭德退休4年后,洛德講席的殊榮授予了馬里蘭大學(xué)的榮譽教授梅斯雷弗(Robert J.Mislevy)。梅斯雷弗是ETS“以證據(jù)為中心的測試框架”(Evidence-Centered Design,ECD)的主要設(shè)計者和提出者②ECD起初是ETS于1997年設(shè)立的一個研發(fā)項目,由梅斯雷弗(Robert J.Mislevy)、斯坦伯格(Linda S.Steinberg)以及阿蒙德(Russell G.Almond)3人負責(zé)。該項目最直接的理論基礎(chǔ)來自梅斯雷弗本人。,該測試框架的最大貢獻在于實現(xiàn)了用完整而清晰的證據(jù)推理取代長期“統(tǒng)治”命題環(huán)節(jié)的經(jīng)驗與直覺(hunch)[5]。梅斯雷弗早年間曾在洛德研究團隊工作,參與過美國國家教育進展測評項目(National Assessment of Educational Progress,NAEP),認知科學(xué)與心理測量學(xué)對其影響巨大。梅斯雷弗一直致力于將認知心理學(xué)、測試設(shè)計原理、統(tǒng)計方法、證據(jù)推理以及軟件開發(fā)等結(jié)合起來開展研究,以應(yīng)對計算機技術(shù)發(fā)展對新測試環(huán)境提出的挑戰(zhàn)。目前,ECD已成為美國教育評價領(lǐng)域主要的應(yīng)用模型之一,也是指導(dǎo)ETS開發(fā)和實施具體考試評價產(chǎn)品的平臺[6]。
公平性與有效性是衡量一項考試設(shè)計水平的2個重要方面,二者相輔相成??荚囀且婚T關(guān)于公平與公正的學(xué)問,好比法官斷案,須以事實為根據(jù)、以法律為準繩。作為西方法律文化符號之一的正義女神,之所以要被“蒙眼,因為司法純靠理智,不靠誤人的感官印象”[7]??荚嚕绕涫且恍└呃Φ慕逃荚?,決定著考生的前程,考試本身的公平與否,關(guān)乎切身利益。效度,是一項考試究竟能否以及能夠在多大程度上測量出人們想要測出的東西,如同在法庭上講事實、擺道理,當事人到法院,討的是一個“說法”,法官只能依據(jù)確鑿的證據(jù)和完整的因果證據(jù)鏈,明理斷案,讓當事人感受到司法的公正。對于考生而言,成績單好比是“判決書”,只有有效地反映“當事人”的心理狀態(tài),才能體現(xiàn)出考試的公平。因此,公平性與有效性是考試的基本屬性,缺一不可,這也正是ETS繼洛德講席之后設(shè)立戈登講席和梅西克講席的原因。
ETS于2003年設(shè)立了第2個講席——戈登講席(Edmund W.Gordon Chair),以著名非洲裔心理學(xué)家戈登(Edmund W.Gordon)的名字命名。戈登本人被譽為“本時代心理學(xué)界的領(lǐng)軍人物”“最杰出的黑人心理學(xué)家”[8],他是美國啟智計劃(Head Start)的創(chuàng)始人與設(shè)計者,是1965年美國初中級教育法案(the Elementary and Secondary Education Act of 1965)的起草者,他為推動美國的教育平權(quán)作出過巨大貢獻。ETS設(shè)立戈登講席是為了改善教育質(zhì)量與教育公平。首位擔任戈登講席的專家是ETS政策評估與研究中心(Policy Evaluation&Research Center)的高級副主席、兒童早期教育研究中心的負責(zé)人奈特斯(Michael T.Nettles),他是著名的教育政策研究專家,關(guān)注教育評價、學(xué)生表現(xiàn)與成就、教育公平等政策方面的研究。他本人曾親歷美國種族問題的變遷,著名的蓋爾案(Geier v.University of Tennessee)①一位名為蓋爾(Rita Sanders Geier)的非洲裔教師,因不滿田納西大學(xué)在聯(lián)邦政府宣布廢除種族隔離之后,仍在納什維爾市中心建立隔離校區(qū),將學(xué)校告上法庭,要求法院終止這種二元教育體制。歷史上,田納西大學(xué)是美國唯一一所由州政府資助的黑人大學(xué),其本部幾乎全部是非洲裔學(xué)生,建立隔離校區(qū)其實是給白人學(xué)生劃出一片“特區(qū)”。蓋爾案直到2001年才以雙方簽署同意判決書的形式宣告結(jié)束,州政府付出了7 700萬撥款的代價,用來提升田納西州高等教育學(xué)生與教員的多元化。就發(fā)生在奈特斯本科時就讀的田納西大學(xué)。他擅長通過長期的證據(jù)收集形成關(guān)于教育公平與質(zhì)量的研究報告。奈特斯目前最為關(guān)注的是,如何通過科學(xué)研究推動教育公平,減少針對少數(shù)族群的不利因素,彌合因地位和種族處于弱勢的兒童群體的成就差異。
2008年,為紀念梅西克(Samuel J.Messick)這位在ETS工作30余年的教育心理學(xué)家,ETS設(shè)立了以其名字命名的第3個講席——梅西克講席(Samuel J.Messick Chair)。梅西克1993年獲桑代克獎,是測試效度領(lǐng)域的世界級權(quán)威,他在效度“三分說”理論的基礎(chǔ)上,提出效度整體觀,深刻地影響了當今教育測量界對效度的認識,以其名字命名講席,體現(xiàn)了ETS對考試效度問題的高度關(guān)注。凱恩(Michael T.Kane)是首位梅西克講席專家,他同時也是梅西克思想衣缽的傳承者。第四版《教育測量》(Educational Measurement)中理論與原則部分的開篇作者正是凱恩,他以“效度驗證”(validation)為標題,闡釋效度理論,而第三版《教育測量》撰寫此部分的專家就是梅西克,只是當時還是以“效度”(validity)為標題?!靶Ф闰炞C”是對“效度”理論的發(fā)展和完善,凸顯了2位學(xué)術(shù)權(quán)威在效度理論方面的傳承關(guān)系。梅西克把效度問題落腳到“評價”(evaluation),凱恩則強調(diào)證據(jù)收集的過程,提出以論證為基礎(chǔ)的效度驗證路徑(The Argument-based Approach to Validation),并對效度驗證所包含的2種論證——解釋性論證(interpretative argument)和效度論證(validity argument)作了區(qū)分,指出效度驗證不是一個封閉體系,而是不斷收集多種證據(jù),在結(jié)論與證據(jù)之間來回審視的過程。
2010年,ETS以已故測量學(xué)家弗雷德里克森(Norman O.Frederiksen)的名字命名了第4個講席——弗雷德里克森講席(Norman O.Frederiksen Chair)。弗雷德里克森是建構(gòu)性題型(構(gòu)答反應(yīng))的積極倡導(dǎo)者,同時也是選擇題(multiple choice)的堅決反對者,他認為選擇性題型對于課堂教學(xué)產(chǎn)生的反撥效應(yīng)是負面的,并試圖將認知心理學(xué)應(yīng)用于測試當中,設(shè)計能夠?qū)€體以及學(xué)校產(chǎn)生積極影響的評價方式。在ETS工作的40多年里,弗雷德里克森始終在找尋測量知識與技能的替代性方案,倡導(dǎo)對傳統(tǒng)考試的革新。
貝內(nèi)特(Randy E.Bennett)是首位ETS弗雷德里克森講席專家,他本人目前擔任國際教育評價協(xié)會(IAEA)的主席,也是美國國家教育測量協(xié)會(NCME)的主席。貝內(nèi)特早年曾有一段在社區(qū)學(xué)校教授英語的經(jīng)歷,他在結(jié)束短暫職教之后,進入哥倫比亞大學(xué)師范學(xué)院攻讀碩士,研究閱讀與學(xué)習(xí)障礙問題,隨后繼續(xù)攻讀博士學(xué)位,關(guān)注教育測量和特殊教育。早年的經(jīng)歷使貝內(nèi)特成為了一名有著豐富基層教學(xué)經(jīng)驗的教育測量學(xué)家,他參與研發(fā)了ETS首個基于計算機的測試(CBT)——1986版的以計算機為基礎(chǔ)的分班測驗,這在當時是將計算機技術(shù)用于測試的革命性成果。隨后,貝內(nèi)特將關(guān)注點持續(xù)放在科技、認知心理學(xué)與測試相結(jié)合的領(lǐng)域,并于2007年啟動了CBAL計劃(the Cognitively Based Assessment of,for and as learning),該計劃關(guān)注基于理論的終結(jié)性與形成性評價,其主要目的是運用30年來學(xué)習(xí)科學(xué)的研究成果設(shè)計測試,讓人們看到未來的標準化考試是怎樣的。
在5個研究講席之中,新近設(shè)立的是2012年的泰勒講席(Ralph W.Tyler Chair)。泰勒(Ralph W.Tyler)被譽為“美國教育評價之父”(the father of educational evaluation and assessment),現(xiàn)代教育評價(evaluation)這一概念就是泰勒于1929年提出的,以區(qū)別于傳統(tǒng)的測驗(testing),他指出評價是一種過程,用來發(fā)現(xiàn)學(xué)生已經(jīng)學(xué)了什么及所具有的價值[9]。1963年,泰勒又提出“評量”(assessment)①評量,為臺灣地區(qū)學(xué)者譯法,大陸學(xué)者多采用“評價”,為與“評價”(evaluation)有所區(qū)分,筆者在此處采用“評量”。一詞,指一種特殊的評價,即對于不同年齡、不同背景兒童團體的整個學(xué)習(xí)狀況的評價,以區(qū)別人們常用的測驗(testing)和評價(evaluation)概念。泰勒曾是7位美國總統(tǒng)的教育顧問,是美國國家教育進展測評的創(chuàng)立者。
目前,泰勒講席授予了大規(guī)模測試的倡導(dǎo)者與實踐者基爾希(Irwin S.Kirsch)?;鶢栂S?984年起在ETS工作,曾在馬里蘭大學(xué)主修心理學(xué),后又拿到了特拉華大學(xué)測量與評價的博士學(xué)位。他一直致力于讀寫能力(literacy)的研究,并因此進入ETS。一開始他負責(zé)調(diào)研如何將測試與教學(xué)相結(jié)合的項目,后來逐漸產(chǎn)生對于讀寫能力測試的研究興趣,并開始接觸一些國家級的大規(guī)模測試,他還與加拿大的專家合作,分析研究他本人開發(fā)的針對讀寫能力的測試方法是否適用于加拿大的雙語環(huán)境。2005年,基爾希與來自加拿大統(tǒng)計局(Statistics Canada)的代表,帶著建立一個全新的國際成人測試的想法,共赴世界經(jīng)合組織(OECD),并最終促成了國際成人能力評估項目(The Program for the International Assessment of Adult Competencies,PIAAC)的誕生。基爾希所參與的大規(guī)模測試研究,并非升學(xué)或是選拔意義上的,而是體現(xiàn)了測試的診斷功能和矯正功能,目的是促進教學(xué)和協(xié)助教育水平的橫向比較,是在國際背景下追求測試的意義——促進教育和學(xué)習(xí),通過國際間協(xié)作設(shè)計出的大規(guī)模測試,回應(yīng)泰勒對于評價(evaluation)的認識,基于這一點,由基爾希擔任泰勒講席專家,實至名歸。
表1歸納了上述5個講席的創(chuàng)設(shè)時間和講席專家。
ETS的創(chuàng)始人昌西(Henry Chauncey)在機構(gòu)創(chuàng)建時,曾明確提出將科學(xué)研究放在事業(yè)發(fā)展的核心位置,允許和鼓勵學(xué)術(shù)自由,包容針對ETS考試的獨立見解和批評。他制定政策,要求在不影響考試安全的前提下,公開發(fā)表所有圍繞ETS考試產(chǎn)品的研究結(jié)果[10]10。在ETS專家講席制度的發(fā)展中,交織著3條線,一是人,二理論,三是考試評價服務(wù)產(chǎn)品。人,指的是被授予講席的諸位業(yè)界權(quán)威。ETS吸引和挽留了大批世界一流的教育家、心理學(xué)家、測量學(xué)家、統(tǒng)計學(xué)家,這些專家和學(xué)者的存在確保了ETS考試產(chǎn)品始終保持著較高的理論性、科學(xué)性和創(chuàng)新性。現(xiàn)任ETS研發(fā)部高級副總裁勞倫斯(Ida Lawrence)坦言:“創(chuàng)設(shè)這些講席,為的是吸引更多的學(xué)術(shù)大師,為的是留住那些優(yōu)秀的研究者?!薄笆沁@些講席專家,讓我們始終保持與未來同步,他們是ETS最寶貴的財富?!盵11]由于這些供職于ETS的業(yè)界權(quán)威同樣也是教育測量領(lǐng)域重大理論的提出者和發(fā)展者,他們可以直接將新理論應(yīng)用于教育考試評價工作當中,ETS的實踐又進一步深化了他們對于理論的理解,使得ETS成為一個能夠讓理論與實踐相統(tǒng)一的場域。教育考試評價產(chǎn)品是ETS提供的公共服務(wù),而這些產(chǎn)品背后是多年的研究開發(fā)。5個講席的每位專家都與目前ETS的考試評價服務(wù)有著直接關(guān)聯(lián),例如,洛德講席的統(tǒng)計測量思想是ETS考試評價產(chǎn)品的重要分析工具,梅西克講席則通過深化測試效度的理解,進一步提升考試評價產(chǎn)品的品質(zhì)。由于這些世界級權(quán)威的存在,使得ETS能夠深度參與世界教育考試評價活動,并在其中有著較大的話語權(quán)。我國教育考試機構(gòu)脫胎于行政機關(guān),盡管一直在完善專業(yè)化建設(shè),但其行政色彩依舊存在,長期以來的工作傳統(tǒng)使得我國教育考試機構(gòu)長于管理和執(zhí)行,政治意識和安全意識較強,但在專業(yè)化方面的確還有很多提升的空間。因此,ETS的講席制度至少可以從以下3個方面給予我國教育考試機構(gòu)的內(nèi)涵式發(fā)展一些啟發(fā)。
表1 ETS設(shè)立的5個講席的創(chuàng)設(shè)時間和講席專家
ETS研究講席的獲得者本身就是ETS事業(yè)發(fā)展的領(lǐng)航者。ETS每個測試產(chǎn)品或服務(wù)的研發(fā)與創(chuàng)新都離不開權(quán)威專家的指引。這些曾經(jīng)的或是現(xiàn)任的講席專家不僅是測量理論的締造者、教育測量界的執(zhí)牛耳者,而且是教育考試一線的實踐者,左右著世界教育測量學(xué)的走向。目前,國內(nèi)的教育考試機構(gòu)雖已初步實現(xiàn)在核心業(yè)務(wù)領(lǐng)域的人員專業(yè)化,但供職于機構(gòu)內(nèi)部的業(yè)界權(quán)威鳳毛麟角,更談不上引領(lǐng)世界教育測量的理論與實務(wù)。伴隨我國教育學(xué)與心理學(xué)領(lǐng)域研究水平的提高,國內(nèi)不少高等院校都開設(shè)有專門的教育測量課程,教育測量學(xué)方面的專家也有不少,每年能夠培養(yǎng)一定數(shù)量的教育測量專業(yè)研究生,教育考試機構(gòu)應(yīng)該盡可能地利用這些資源,引進專家進入機構(gòu)內(nèi)部或者建立長期的合作機制,與此同時,還應(yīng)建立人才培養(yǎng)機制,例如與高校建立相關(guān)學(xué)科在讀學(xué)生的實習(xí)平臺,盡早培養(yǎng)專業(yè)人才。
近年來,我國高等院校中教育測量的科研資源豐富、成果豐碩,但理論聯(lián)系實踐不足;教育考試機構(gòu)忙于日常工作,留給思考與研究的時間有限,造成了理論和實踐“兩張皮”的問題。鑒于此,筆者建議:第一,國內(nèi)教育考試機構(gòu)應(yīng)該盡快形成權(quán)威專家引領(lǐng)事業(yè)發(fā)展機制,通過與國內(nèi)外業(yè)界權(quán)威建立聯(lián)系,創(chuàng)設(shè)客座教授講席,在一些高利害考試的研發(fā)方面,積極聽取專家意見;第二,與世界著名教育考試評價機構(gòu)建立長期的人員培訓(xùn)機制,促進業(yè)務(wù)溝通和學(xué)術(shù)交流;第三,與國內(nèi)有教育測量專業(yè)的高校建立長期實習(xí)合作機制,搭建教育人才培養(yǎng)平臺。
樹立由權(quán)威專家引領(lǐng)教育考試機構(gòu)事業(yè)發(fā)展的觀念,其本質(zhì)是與以行政思路管理教育考試機構(gòu)相區(qū)別,后者在頂層設(shè)計和追求實效方面的確有優(yōu)勢,但要實現(xiàn)教育內(nèi)涵式發(fā)展,專業(yè)化教育考試機構(gòu)離不開權(quán)威專家的引領(lǐng)。
教育考試評價領(lǐng)域的每一次重大理論創(chuàng)新,都在不斷提升人們對于教育考試評價問題的認識。19世紀末至20世紀中葉,心理學(xué)和統(tǒng)計學(xué)的理論融合使數(shù)據(jù)統(tǒng)計與應(yīng)用成為教育測量主要的研究范式。20世紀初,圍繞相關(guān)和回歸分析技術(shù)的第一代測量理論——經(jīng)典測量理論迅速發(fā)展起來,教育測量逐漸演變?yōu)閹в袧庵財?shù)理統(tǒng)計色彩的應(yīng)用學(xué)科[12]。20世紀后半葉,項目反應(yīng)理論和概化理論的提出,擴充了教育測量理論,并直接服務(wù)于教育測量形式的變化,即利用計算機技術(shù)讓計算機輔助測試成為可能。在認識論層面,評價理論的提出也大大擴展了人們對于教育測量的理解。20世紀70年代,教育評價理論進入“第四代評價”,著重強調(diào)評價的民主協(xié)商和主體參與性,對評價存在的“排斥價值的多元性”“過分推崇科學(xué)范式”“官僚主義傾向嚴重”作出修正,認為評價應(yīng)該為促進被評價者的發(fā)展服務(wù)[13]。當前,認知心理學(xué)、社會心理學(xué)與教育測量的結(jié)合也在加深,考試評價機構(gòu)開始避免向分數(shù)的使用者僅僅提供一個“總分”,而是提供描述性的成績報告,并為此開展認知診斷方面的研究[14]。
當前,計算機技術(shù)和網(wǎng)絡(luò)技術(shù)迅猛發(fā)展,對現(xiàn)有的教育測量手段和方式都提出了新的挑戰(zhàn),教育考試評價領(lǐng)域充滿著不確定性,既有理論如何升級換代是擺在所有教育考試機構(gòu)面前的難題。客觀地講,教育考試評價此前的幾次重要理論飛躍,我國教育考試機構(gòu)的參與度并不高,這與當時我國教育整體水平落后的實際情況有一定關(guān)系;然而,大數(shù)據(jù)時代的到來,或為我國的教育考試機構(gòu)提供后發(fā)優(yōu)勢。大數(shù)據(jù)技術(shù)的運用將幫助教育考試從單一考試向多元評價躍升。有關(guān)專家指出,未來的招生評價將不再是基于某一時間橫斷面的信息,借助于大數(shù)據(jù)和云資源,招生機構(gòu)可以收集到考生各方面的資料,從而獲得申請者全方位的、立體的信息,這些信息無疑將成為決策更可靠的依據(jù)[15]。過去10年,我國的互聯(lián)網(wǎng)發(fā)生了翻天覆地的變化,大有引領(lǐng)世界互聯(lián)網(wǎng)發(fā)展之勢,其背后是高度發(fā)達的互聯(lián)網(wǎng)技術(shù)及對大數(shù)據(jù)處理的強大能力。這些客觀條件將成為我國各級教育考試機構(gòu)彌補考試數(shù)據(jù)分析利用這一短板,加快大數(shù)據(jù)和教育考試深度融合,搶占未來考試與評價事業(yè)戰(zhàn)略制高點的強大助力。當然,要抓住機遇,理論必須先行,教育考試機構(gòu)需要盡快形成由理論驅(qū)動教育考試服務(wù)水平升級的理念。
1937年,在ETS即將創(chuàng)立之時,測試界權(quán)威專家布雷漢姆(Carl Campbell Brigham)表示出強烈反對,一度令ETS的創(chuàng)立中斷。身為美國“高考”——學(xué)術(shù)潛能考試(Scholastic Aptitude Test,SAT)之父的布雷漢姆認為:“設(shè)立一個強大的(考試)機構(gòu)……將嚴重扼制科研,挫傷創(chuàng)新積極性,會把現(xiàn)有的測試方法,甚至現(xiàn)有的測試形式,想當然地作為正確的做法加以貫徹……如果老師都要求自己的學(xué)生圍著這些新出現(xiàn)的考試打轉(zhuǎn),如果教學(xué)遭到相關(guān)繁文縟節(jié)的綁架,教育無疑會受到考試的嚴重干擾?!盵16]他進一步指出,任何一所機構(gòu)的建立,只要其擁有實施考試的權(quán)力,都將不可避免地把注意力放在市場推廣,而非客觀公正地研究考試的有效性,實實在在推動教育的進步。布雷漢姆在《錯誤研究》(A Study of Error)一書中指出,學(xué)生在解答試題時所犯的錯誤將為改善教學(xué)提供依據(jù)和基礎(chǔ)[10]9,而他提倡建立的,正是如今被大家所熟知的形成性評價(formative assessment)。時隔70多年,這段教育考試史上的小插曲依舊耐人尋味。布雷漢姆的發(fā)難極具針對性,而且直指教育考試機構(gòu)的核心問題——機構(gòu)的合法性、科學(xué)研究的動力、創(chuàng)新的價值、測試方式方法的選擇以及教育考試機構(gòu)存在的依據(jù)。他提出了一個非常重要的觀點——“考試的使命在于促進教育的進步”。他早已發(fā)覺教育考試機構(gòu)存在的意義,不是充當職業(yè)的分配器和幫助人們追逐“遠大前程”的捷徑,而是服務(wù)教育本身,成為教育的一部分。在西方民主教育的觀念中,教育的目的是使人成為更好的自己,解放和實現(xiàn)自我。ETS創(chuàng)立之初所設(shè)計的著名測試,如SAT、GRE、LSAT等,的確順應(yīng)了那個時代的要求,完成了打破當時美國階層固化的任務(wù)。之后,ETS也在不斷探索如何能夠更好地服務(wù)教育,并逐步實現(xiàn)從服務(wù)高校選拔精英到服務(wù)申請者和招生者的第三方考試評價平臺,再到關(guān)注學(xué)習(xí)診斷,改善教學(xué),促進終身學(xué)習(xí)的評價方式提供者。ETS不斷地使自己的考試評價更加接近教育本身。
我國的教育考試機構(gòu)要為建設(shè)中國特色現(xiàn)代考試招生制度服務(wù)?!秶鴦?wù)院關(guān)于深化考試招生制度改革的實施意見》指出:“堅持育人為本,遵循教育規(guī)律。把促進學(xué)生健康成長成才作為改革的出發(fā)點和落腳點,扭轉(zhuǎn)片面應(yīng)試教育傾向,堅持正確育人導(dǎo)向,踐行社會主義核心價值觀,深入推進素質(zhì)教育,培養(yǎng)德智體美全面發(fā)展的社會主義建設(shè)者和接班人?!边@其中就蘊含著我國考試招生制度應(yīng)當遵循的價值內(nèi)容:“育人”是根本,立德樹人是核心任務(wù)。與西方國家有所不同的是,我們需要解決好“為誰培養(yǎng)人,培養(yǎng)什么人,怎樣培養(yǎng)人”的問題,需要將社會主義核心價值觀融入到考試評價工作當中。過去,在世界教育考試評價的舞臺上,西方發(fā)達國家所確立的價值觀長期占據(jù)主要地位,也左右著教育測量理論和實踐的走向。未來,伴隨我國教育事業(yè)的進一步發(fā)展、教育強國地位的確立,我國教育考試評價能否實現(xiàn)世界范圍內(nèi)的價值引領(lǐng),也將成為我國教育考試機構(gòu)在內(nèi)涵式發(fā)展過程中所面臨的挑戰(zhàn)。