凱西·奧尼爾 馬青玲
這個(gè)故事開始于1983年,美國(guó)一家瀕臨??碾s志《美國(guó)新聞》決定開展一個(gè)規(guī)模龐大的項(xiàng)目:評(píng)估全美1800所學(xué)院和大學(xué),按優(yōu)秀度為這些學(xué)校做一個(gè)排名。如果進(jìn)展順利,這個(gè)項(xiàng)目的成果會(huì)成為一個(gè)有用的工具,可以用于指導(dǎo)數(shù)百萬(wàn)年輕人做好人生中第一個(gè)重大的選擇。對(duì)于許多人來(lái)說(shuō),這個(gè)選擇將決定他們的職業(yè)道路、終身的好友圈,通常還包括終身伴侶。此外,雜志編輯也希望這個(gè)大學(xué)排名項(xiàng)目能帶動(dòng)雜志銷量——沒準(zhǔn)在推出大學(xué)排名的那一周里,《美國(guó)新聞》的銷量能追上《時(shí)代》和《新聞周刊》呢!
但是,要基于什么數(shù)據(jù)進(jìn)行大學(xué)排名呢?起初,《美國(guó)新聞》的工作人員完全依靠他們寄給各大學(xué)校長(zhǎng)的調(diào)查問卷所得到的反饋結(jié)果進(jìn)行評(píng)分。結(jié)果,斯坦福大學(xué)位居全美綜合性大學(xué)之首,阿默斯特學(xué)院則是排名第一的文科學(xué)院。排名結(jié)果雖然很受讀者歡迎,但也令很多大學(xué)的校領(lǐng)導(dǎo)憤怒。雜志社收到了排山倒海般的投訴,內(nèi)容都是控訴排名結(jié)果有失公正的。許多大學(xué)的校長(zhǎng)、在校學(xué)生和已畢業(yè)的校友堅(jiān)持認(rèn)為自己的學(xué)校應(yīng)該獲得更高的排名,雜志社應(yīng)該再去仔細(xì)研究一下有關(guān)的數(shù)據(jù)。
接下來(lái)的幾年,《美國(guó)新聞》的編輯一直在思考他們具體可以測(cè)量什么數(shù)據(jù)。許多模型誕生了,但其中大量的評(píng)估因素僅僅來(lái)自直覺。模型確立的過程并不嚴(yán)謹(jǐn),統(tǒng)計(jì)分析也缺少根據(jù),模型建立的依據(jù)僅僅是人們憑空想象的對(duì)教育而言最重要的因素,然后,去尋找可以測(cè)量的相關(guān)變量,最后隨意地在公式中賦予每個(gè)變量一定的權(quán)重,模型就完成了。
在大部分領(lǐng)域,模型確立的過程通常是比較嚴(yán)謹(jǐn)?shù)?。比如,農(nóng)業(yè)學(xué)科的研究者會(huì)比較投入(土壤、陽(yáng)光和化肥)和產(chǎn)出(收獲后,具有特定特征的農(nóng)作物的產(chǎn)量)。然后,他們就可以按照目標(biāo),比如一定的成本、口感或者營(yíng)養(yǎng)價(jià)值等進(jìn)行下一步的試驗(yàn)和優(yōu)化。但是,《美國(guó)新聞》的編輯所做的是“教育優(yōu)秀度”排名,這是比糧食成本或者每個(gè)麥粒的蛋白質(zhì)含量更加抽象、模糊的價(jià)值。這些編輯沒有直接的方法來(lái)量化4年的大學(xué)學(xué)習(xí)過程是如何影響某一個(gè)學(xué)生的,更不用說(shuō)數(shù)千萬(wàn)個(gè)學(xué)生了。他們不可能測(cè)量一個(gè)學(xué)生在4年大學(xué)生活中的學(xué)習(xí)、幸福、信心、友誼等全部方面。美國(guó)前總統(tǒng)林登·約翰遜對(duì)高等教育的定位是:“高等教育是深化自我實(shí)現(xiàn)、擴(kuò)大個(gè)人生產(chǎn)力和增加個(gè)人回報(bào)的途徑”,但不管是其中的哪一條都不適合放在大學(xué)排名模型中。
《美國(guó)新聞》的編輯只是挑選了一些和評(píng)估目標(biāo)看似相關(guān)的變量。他們研究了高中生的SAT(學(xué)業(yè)能力傾向測(cè)驗(yàn))成績(jī)、學(xué)校的學(xué)生教師比和錄取率。他們統(tǒng)計(jì)了順利進(jìn)入大二的新生占總數(shù)的百分比和順利畢業(yè)的學(xué)生占總數(shù)的百分比。他們計(jì)算仍在世的已畢業(yè)校友為母校捐款的人數(shù)占總數(shù)的百分比,依據(jù)是他們給母校捐款很可能表明他們喜歡母校的教育。排名結(jié)果中占3/4權(quán)重的分?jǐn)?shù)都來(lái)自一種算法,這種算法就包含以上那些變量;另外占1/4權(quán)重的分?jǐn)?shù)則來(lái)自全美各地的大學(xué)校長(zhǎng)的主觀評(píng)價(jià)。
當(dāng)這一排名發(fā)展成全美標(biāo)準(zhǔn)時(shí),惡性循環(huán)出現(xiàn)了
《美國(guó)新聞》第一次依據(jù)數(shù)據(jù)確定的大學(xué)排名于1988年出爐,當(dāng)這一排名發(fā)展成全美標(biāo)準(zhǔn)時(shí),惡性循環(huán)出現(xiàn)了。排名會(huì)自行鞏固,如果一所大學(xué)在《美國(guó)新聞》所發(fā)布的排名中名次靠后,它的聲譽(yù)就會(huì)下降,生源情況就會(huì)惡化。優(yōu)秀的學(xué)生會(huì)避開這所大學(xué),優(yōu)秀的教授也一樣。已畢業(yè)的校友將減少捐款。由此,這所學(xué)校的排名就會(huì)繼續(xù)下跌。簡(jiǎn)單來(lái)說(shuō),排名決定了大學(xué)的命運(yùn)。
以前,大學(xué)有各種方法可以宣揚(yáng)學(xué)校教育的成功,許多是靠傳聞逸事。例如,某些教授得到了眾多學(xué)生的一致好評(píng);一些學(xué)生在畢業(yè)后走上了杰出的職業(yè)之路,成為外交官或者成功的企業(yè)家;還有一些學(xué)生出版了一流的小說(shuō)。這些正面事跡經(jīng)由口口相傳廣為人知,學(xué)校的聲譽(yù)也由此提升。但是,麥卡利斯特學(xué)院就比里德學(xué)院好嗎?或者艾奧瓦大學(xué)就比伊利諾伊大學(xué)好嗎?這很難說(shuō)。不同的大學(xué)就像不同類型的音樂或者不同的飲食習(xí)慣,對(duì)于某所大學(xué)的評(píng)價(jià)眾說(shuō)紛紜,好壞兩方面都可以列出充分的理由。而現(xiàn)在,大學(xué)的整體聲譽(yù)被一組數(shù)字蒙上了陰影。
如果你站在大學(xué)校長(zhǎng)的角度思考這件事情,你會(huì)發(fā)現(xiàn)大學(xué)排名其實(shí)是很糟糕的。毫無(wú)疑問,絕大多數(shù)校長(zhǎng)珍惜自己的大學(xué)經(jīng)歷,因?yàn)閺哪撤N程度上來(lái)說(shuō),正是大學(xué)經(jīng)歷激勵(lì)他們攀登學(xué)術(shù)階梯,成為一所大學(xué)的校長(zhǎng)。但是現(xiàn)在,這些正處在事業(yè)高峰期的校長(zhǎng)需要投入巨大的精力提高與學(xué)校教育優(yōu)秀度有關(guān)的15個(gè)考核項(xiàng)的分?jǐn)?shù),而這15個(gè)考核項(xiàng)是由一個(gè)二流雜志社的一組編輯定義的。他們就好像又回到了學(xué)生時(shí)代,每天都在祈求老師給高分。如果《美國(guó)新聞》發(fā)表的大學(xué)排名只在小范圍內(nèi)流行,倒也不會(huì)造成什么麻煩。但是,這個(gè)排名的影響力發(fā)展迅速,很快成為一個(gè)全美標(biāo)準(zhǔn)。教育界一下子緊張起來(lái),迅速給大學(xué)校長(zhǎng)和學(xué)生都設(shè)定了嚴(yán)格的任務(wù)清單?!睹绹?guó)新聞》的大學(xué)排名模型規(guī)模巨大,造成了大范圍的損害,導(dǎo)致了幾乎是無(wú)盡的惡性循環(huán)。
一些大學(xué)的校領(lǐng)導(dǎo)想盡一切辦法提高排名。貝勒大學(xué)設(shè)立獎(jiǎng)金激勵(lì)大一新生再次參加SAT考試,希望再考一次能提高他們的成績(jī)以及貝勒大學(xué)的排名。有些名校,包括賓夕法尼亞州的巴克內(nèi)爾大學(xué)和加利福尼亞州的麥肯納學(xué)院,則給《美國(guó)新聞》反饋了假數(shù)據(jù),夸大了其學(xué)校新生的入學(xué)分?jǐn)?shù)。2011年,位于紐約的愛納學(xué)院承認(rèn)其學(xué)校教師幾乎捏造了所有的數(shù)據(jù):考試成績(jī)、錄取率和畢業(yè)率、新生保留率、師生比和校友捐贈(zèng)額。但謊言起效了,至少在一段時(shí)間之內(nèi)。據(jù)《美國(guó)新聞》估算,假數(shù)據(jù)將愛納學(xué)院從東北地區(qū)大學(xué)排名第50名提升至第30名。
更多的校領(lǐng)導(dǎo)則試圖尋找一種更常規(guī)的方式來(lái)提高他們的學(xué)校排名——努力提升學(xué)校在影響最終分?jǐn)?shù)的每一個(gè)變量上的表現(xiàn)。他們可能會(huì)認(rèn)為這是效率最高的資源利用方式。畢竟,只要他們努力去迎合《美國(guó)新聞》的模型,得到更高的排名,他們就能籌集到更多的資金,吸引來(lái)更優(yōu)秀的學(xué)生和教授,然后進(jìn)一步提高排名。除此之外,還有別的選擇嗎?
大學(xué)為了排名展開“軍備競(jìng)賽”,但排名模型把成本排除在算法外
羅伯特·莫爾斯從1976年起就在《美國(guó)新聞》雜志社工作,他是這個(gè)大學(xué)排名項(xiàng)目的組織者,他在采訪中稱進(jìn)行大學(xué)排名有利于推動(dòng)大學(xué)制定更有意義的目標(biāo)。如果他們能因此致力于提高畢業(yè)率或者把學(xué)生分成更小的班級(jí)上課以提高教學(xué)效果,那就說(shuō)明排名是件好事情。他承認(rèn)雜志社拿不到與大學(xué)教育優(yōu)秀度最相關(guān)的數(shù)據(jù),即每個(gè)學(xué)校學(xué)生的學(xué)習(xí)內(nèi)容。但是,基于替代變量建立的《美國(guó)新聞》大學(xué)排名模型也足夠反映問題了。
但是,當(dāng)你基于替代變量建立模型時(shí),鉆模型的漏洞會(huì)變得容易很多。這是因?yàn)樘娲兞勘绕鹚淼膹?fù)雜事實(shí)更容易操控。舉個(gè)例子,假設(shè)有一個(gè)網(wǎng)站要聘用一個(gè)社交媒體專家,人事經(jīng)理決定選定一個(gè)變量——重點(diǎn)考慮推特粉絲數(shù)排名靠前的應(yīng)聘者。推特粉絲數(shù)是社交媒體參與度的標(biāo)志之一,沒錯(cuò)吧?但是想象一下,應(yīng)聘者很快就會(huì)無(wú)所不用其極地增加推特粉絲。有人會(huì)花費(fèi)19.95美元直接“購(gòu)買”大量由機(jī)器操控的粉絲。因?yàn)槿藗冦@了招聘系統(tǒng)的漏洞,替代變量失去了效力。
在《美國(guó)新聞》大學(xué)排名事件中,從高中畢業(yè)生到大學(xué)校友再到公司的人力資源部,人們很快接受了該排名是大學(xué)教育質(zhì)量的一個(gè)體現(xiàn)。因此,各個(gè)大學(xué)只能選擇配合,他們不得不努力提高排名所涉及的每一個(gè)考核項(xiàng)的分?jǐn)?shù)。其實(shí),許多學(xué)校最焦慮的是那不能控制的占排名結(jié)果1/4權(quán)重的因素,即聲譽(yù)分?jǐn)?shù),來(lái)自各個(gè)大學(xué)、學(xué)院的校領(lǐng)導(dǎo)給出的問卷調(diào)查反饋。
2008年,沃思堡市的得克薩斯基督教大學(xué)(TCU)排名猛降。三年前,該校的名次是97,之后三年名次遞降為105、108和113。該校的校友和支持者為此感到很憤怒,校長(zhǎng)維克多·博西尼也因此陷入尷尬境地。他堅(jiān)稱得克薩斯基督教大學(xué)在每個(gè)指標(biāo)上的表現(xiàn)都在進(jìn)步,“我們的新生保留率在提高,我們的籌款等所有方面都在改善”。
博西尼的申辯有兩個(gè)問題。首先,《美國(guó)新聞》排名模型并不是對(duì)各個(gè)大學(xué)進(jìn)行孤立的判斷。即使是各指標(biāo)分?jǐn)?shù)均有所提升的學(xué)校在排名中也會(huì)落后于其他分?jǐn)?shù)提升得更快的學(xué)校。用學(xué)術(shù)術(shù)語(yǔ)來(lái)說(shuō),《美國(guó)新聞》的評(píng)估模型是一種分布模型。這導(dǎo)致了一場(chǎng)學(xué)校間的“軍備競(jìng)賽”。另一個(gè)問題是,得克薩斯基督教大學(xué)無(wú)法控制占1/4權(quán)重的聲譽(yù)分?jǐn)?shù)。招生主任雷蒙德·布朗指出,聲譽(yù)是模型中權(quán)重最大的變量,“這很荒謬,因?yàn)樗耆侵饔^的”。新生招生主管威斯·瓦戈納則指出,為了提高聲譽(yù)分?jǐn)?shù),各大學(xué)都在紛紛為自己打廣告。
盡管如此,得克薩斯基督教大學(xué)仍然決定著手提升那可控的占3/4權(quán)重的分?jǐn)?shù)。這所大學(xué)發(fā)起了一個(gè)2.5億美元的籌款活動(dòng)。到2009年,學(xué)校已募集到4.34億美元,遠(yuǎn)遠(yuǎn)超過目標(biāo)額度。由于籌款額是排名的指標(biāo)之一,僅此一項(xiàng)成績(jī)就提升了排名。得克薩斯基督教大學(xué)花費(fèi)了其中的大部分資金用于校園設(shè)施改善,其中1億美元用于興建中央商場(chǎng)和學(xué)生活動(dòng)中心,努力讓得克薩斯基督教大學(xué)的校園看上去更具吸引力。這些做法本身沒有什么不對(duì),但其初衷是迎合《美國(guó)新聞》的排名模型。
也許更重要的是,得克薩斯基督教大學(xué)興建了一個(gè)其時(shí)最高水準(zhǔn)的體育訓(xùn)練場(chǎng)館,并將大量的資源投入到足球項(xiàng)目之中。在接下來(lái)的幾年里,得克薩斯基督教大學(xué)的角蛙足球隊(duì)成為國(guó)家強(qiáng)隊(duì)。2010年,他們?cè)诿倒灞闱蛸愔写驍×死吓茝?qiáng)隊(duì)威斯康星隊(duì),取得了全美總冠軍。
這次勝利為得克薩斯基督教大學(xué)帶來(lái)了所謂的“弗洛特爾效應(yīng)”(the Flutie effect)。1984年,在一場(chǎng)極為精彩的大學(xué)橄欖球比賽上,波士頓大學(xué)隊(duì)的四分衛(wèi)道格·弗洛特爾在最后一秒完成了一個(gè)扭轉(zhuǎn)敗局的超長(zhǎng)距傳球,打敗了邁阿密大學(xué)隊(duì)。弗洛特爾由此成為一個(gè)傳奇。這場(chǎng)比賽結(jié)束后的兩年內(nèi),波士頓大學(xué)的大學(xué)申請(qǐng)率上漲了30%。喬治城大學(xué)也曾擁有帶來(lái)過同樣的宣傳效果的傳奇。該校由帕特里克·尤因帶領(lǐng)的籃球隊(duì)三次打進(jìn)全美錦標(biāo)賽??磥?lái),贏得體育比賽是吸引學(xué)生申請(qǐng)某所大學(xué)的關(guān)鍵因素。當(dāng)大批體校的高三學(xué)生在電視上觀看大學(xué)體育比賽時(shí),球隊(duì)實(shí)力強(qiáng)勁的學(xué)校對(duì)他們形成了極大的吸引力。這些學(xué)生會(huì)為自己是該校的學(xué)生、身著寫有該校校名的隊(duì)服而感到驕傲。這些大學(xué)接到的入學(xué)申請(qǐng)因此暴漲。隨著更多的學(xué)生申請(qǐng)入學(xué),招生處就可以提高入學(xué)門檻,以提高大學(xué)新生的SAT平均分,而這有助于提高大學(xué)排名。另外,學(xué)校拒絕的申請(qǐng)學(xué)生越多,其錄取率就越低,對(duì)排名就越有利。
得克薩斯基督教大學(xué)的策略奏效了。到2013年,該大學(xué)已成為得克薩斯州學(xué)生選擇度排名第二的大學(xué),排在第一的是著名的休斯敦萊斯大學(xué)。這一年,得克薩斯基督教大學(xué)的新生高考和入學(xué)考試平均成績(jī)均達(dá)到史上最高水平,其在全美的排名也因此大幅上升。2015年,該校全美排名76,也就是說(shuō),僅用了7年時(shí)間,該校就上升了37個(gè)名次。
現(xiàn)在,我們終于發(fā)現(xiàn)《美國(guó)新聞》大學(xué)排名模型最大的缺陷是什么了。我們不能說(shuō)《美國(guó)新聞》的編輯為評(píng)判“教育優(yōu)秀度”選擇的替代變量是無(wú)效的,但他們犯下的更大的錯(cuò)誤來(lái)自他們沒有納入考慮的變量:學(xué)雜費(fèi)、學(xué)生助學(xué)金。這些變量被該排名模型遺漏了。
這引出了我們將會(huì)頻繁討論的一個(gè)關(guān)鍵問題:建模者的目標(biāo)是什么?在大學(xué)排名這個(gè)案例里,你需要站在1988年《美國(guó)新聞》編輯們的角度來(lái)考慮。當(dāng)他們?cè)诮⒌谝粋€(gè)統(tǒng)計(jì)模型的時(shí)候,他們?cè)趺粗肋@一模型是否有效?首先,如果模型能反映一些已有定論的大學(xué)排名,這就表明其有一定的可信度。比如,如果哈佛大學(xué)、斯坦福大學(xué)、普林斯頓大學(xué)和耶魯大學(xué)在大學(xué)排名模型中位居前列,這就在一定程度上證實(shí)了《美國(guó)新聞》編輯設(shè)計(jì)出的大學(xué)排名模型是有效的。而要建立這樣一個(gè)模型,他們只需要去研究那些一流高校,思考這些大學(xué)的特殊之處是什么就可以了。優(yōu)秀大學(xué)的共同點(diǎn)是什么?這些學(xué)校與其隔壁鎮(zhèn)的保底學(xué)校差距何在?他們發(fā)現(xiàn):優(yōu)秀大學(xué)的新生SAT成績(jī)都很高,而且絕大部分都能順利畢業(yè);已畢業(yè)的校友都很有錢,會(huì)不斷給學(xué)校捐款;等等。就這樣,《美國(guó)新聞》的大學(xué)排名項(xiàng)目組通過分析名牌大學(xué)的優(yōu)勢(shì),建立了一個(gè)測(cè)量教育優(yōu)秀度的評(píng)估指標(biāo)體系。
現(xiàn)在,如果該項(xiàng)目組將教育成本納入算法,則其模型輸出也許會(huì)發(fā)生奇怪的變化——學(xué)費(fèi)便宜的大學(xué)很可能因此闖入優(yōu)秀大學(xué)之列,而這一結(jié)果將遭到廣泛的質(zhì)疑。由于公眾可能會(huì)把《美國(guó)新聞》最終公布的大學(xué)排名看得特別重要,因此采取保守、常規(guī)的算法,保證一流大學(xué)位于排名輸出結(jié)果的前列,是一種更安全的做法。當(dāng)然,高成本也許正是優(yōu)秀的代價(jià),這也不是沒道理。
《美國(guó)新聞》的排名模型把成本排除在算法外,這就好像是給大學(xué)校長(zhǎng)們遞了一本鍍金支票簿。后者要遵循的唯一指令,就是最大限度地提高15個(gè)考核指標(biāo)的評(píng)分,而降低成本則不在其列。事實(shí)上,提高學(xué)費(fèi)反而能讓他們有更多的資源用于提升考核項(xiàng)目的表現(xiàn)。
從此,學(xué)費(fèi)一路飆升。從1985-2013年,高等教育的學(xué)費(fèi)上漲了5倍以上,差不多是通貨膨脹率的4倍。為了吸引頂尖的學(xué)生,各大學(xué)都像得克薩斯基督教大學(xué)一樣,紛紛開始大力投入校園基礎(chǔ)建設(shè),建造有玻璃墻的學(xué)生中心、豪華的宿舍,以及帶攀巖墻和漩渦浴缸的健身房等。從表面來(lái)看,這對(duì)學(xué)生來(lái)說(shuō)是好事,這些設(shè)施可以豐富他們的大學(xué)體驗(yàn)——前提是他們不需要以助學(xué)貸款的形式承擔(dān)這些費(fèi)用,償還助學(xué)貸款的壓力可能會(huì)跟隨學(xué)生幾十年的時(shí)間。不過我們不能把一切都?xì)w咎于《美國(guó)新聞》的大學(xué)排名。我們整個(gè)社會(huì)不僅認(rèn)同了大學(xué)教育是必不可少的這一觀念,而且欣然接受了排名靠前的學(xué)校的文憑能幫助學(xué)生快速進(jìn)入特權(quán)階層這一事實(shí)?!睹绹?guó)新聞》的排名模型以由此而生的恐懼和焦慮為養(yǎng)分,成長(zhǎng)為一個(gè)龐然大物。排名模型有力地刺激了各方在教育上的不斷投資,而飆升的學(xué)費(fèi)則被忽視了。
(摘自2018年9月21日《文匯報(bào)》)