張 興
《美國新聞與世界報道》(U.S.News&WorldReport)1948年由《美國新聞》《世界報道》《美國周刊》三種雜志合并而成,目前為僅次于《時代》和《新聞周刊》的第三大新聞雜志。1983年,該雜志第一次推出針對美國本科院校的最好大學(xué)排名,獲得了很好的市場反響。從那以后,該雜志發(fā)布了一系列排行榜。最好研究生院、最好高中、最好醫(yī)院、汽車排行榜等不斷被推出,排名范圍從教育領(lǐng)域擴大到日常生活領(lǐng)域。目前,各種類型的排行榜已經(jīng)成為該雜志的特色內(nèi)容。
在這些排名中,1983年發(fā)布的“美國本科院校最好大學(xué)排名”(以下簡稱“美新大學(xué)排名”)歷史最長、影響最廣。它被認為是大學(xué)排名領(lǐng)域的分水嶺,也是大學(xué)排名史上的里程碑,對全球各國大學(xué)排名產(chǎn)生了巨大影響[1]。另外,該排名的排名方法已經(jīng)發(fā)展成為一套完整的排名體系,注重主觀指標與客觀指標的結(jié)合,具有一定的研究和借鑒意義[2]。
美新大學(xué)排名對它所評估的學(xué)院和大學(xué)進行了分類,同時,它還包括性價比最高大學(xué)排名、本科教學(xué)最佳大學(xué)排名、次優(yōu)學(xué)生可選擇的頂尖大學(xué)排名、傳統(tǒng)黑人大學(xué)排名等具有明確方向的排名信息,可以滿足不同客戶個性化的需求[3]。國內(nèi)文獻較多關(guān)注該排名的優(yōu)點,對該排名的不足討論較少,且多為理論分析,缺乏證據(jù)支持;國外文獻以批評為主,且多為實證分析。任何一個排名都不是完美的,本研究將分別從指標體系、數(shù)據(jù)計算以及動機和結(jié)果層面梳理美國最好大學(xué)排名存在的問題,以更客觀、更全面地評價大學(xué)排名。
美新大學(xué)排名通常于每年8月發(fā)布,該排名誕生之初并不具備完整的評估指標體系,最初三期以大學(xué)校長的主觀調(diào)查為依據(jù),并不包括客觀評估指標。直至1988年,才正式推出兼具主觀評價和客觀指標的評估指標體系。從1998年開始,排名評估指標體系的一級指標相對固定,二級指標或計算方法不斷調(diào)整。本研究以最新的2019年指標體系為例進行分析,如表1所示。
表1 2019年美新大學(xué)排名評估指標體系
學(xué)術(shù)聲譽指標在所有指標中占20%權(quán)重,對于不同類型的高校有不同的二級指標。高中輔導(dǎo)員評價得分在2011年首次被引入評價指標體系,用于評價全國性大學(xué)、全國性文理學(xué)院的學(xué)術(shù)聲譽。根據(jù)2019年的指標體系,在全國性大學(xué)、全國性文理學(xué)院的學(xué)術(shù)聲譽調(diào)查中,相同類型高校的校長、教務(wù)長、招生院長(或同等職務(wù))等學(xué)術(shù)同行評價和高中輔導(dǎo)員評價分別占15%和5%的權(quán)重,地區(qū)性大學(xué)和地區(qū)性學(xué)院的學(xué)術(shù)聲譽則只包括學(xué)術(shù)同行評估得分。
研究者對該指標的批評集中在學(xué)術(shù)聲譽不能客觀反映各高校的教學(xué)質(zhì)量。結(jié)構(gòu)方程模型評估的結(jié)果發(fā)現(xiàn),同行評估聲譽在很大程度上受已發(fā)布的大學(xué)排名的影響,與組織質(zhì)量和績效的變化無關(guān)[4]。也有研究發(fā)現(xiàn),相對于畢業(yè)生的表現(xiàn)而言,一所高校的聲譽實際上與政府人均教師經(jīng)費支出相關(guān)性更大[5]。換句話說,該排名的目的是幫助學(xué)生選擇學(xué)校和判斷學(xué)校的教學(xué)質(zhì)量,但事實上,該排名中使用的聲譽指標無法實現(xiàn)上述目標。
教學(xué)成效是2019年新增的一級指標,用以衡量高校教育成果,包含社會流動性、畢業(yè)率和保留率、畢業(yè)率表現(xiàn)3個二級指標,社會流動性為新增,故現(xiàn)有文獻主要關(guān)注后兩個指標。研究者普遍認為,學(xué)術(shù)領(lǐng)導(dǎo)者應(yīng)該支持提高學(xué)生的保留率和畢業(yè)成績,故畢業(yè)率和保留率相關(guān)指標本身有意義。高保留率和較好的畢業(yè)成績不僅可以通過提高學(xué)生的教育經(jīng)歷和經(jīng)濟支持來實現(xiàn),還可以通過降低學(xué)生的學(xué)業(yè)要求來實現(xiàn),但是排名數(shù)據(jù)只關(guān)注了保留率和畢業(yè)成績的最終結(jié)果,而沒有關(guān)注實現(xiàn)的方法[6]。
教師資源指標包括班級規(guī)模、教師薪資水平、有本學(xué)科最高學(xué)位的全職教師的比例、師生比和全職教師占比5個二級指標,研究者批評較多的是教師薪資水平指標。
在微觀層面,阿斯丁(Astin)的實證研究發(fā)現(xiàn),教師薪酬指標更多地反映教師的科研活動,該指標甚至與學(xué)生的科研學(xué)習(xí)呈負相關(guān)[7]。在宏觀層面,埃倫伯格(Ehrenberg)指出該排名使用的教師平均薪資指標沒有考慮由于教師的專業(yè)領(lǐng)域和年齡分布不同產(chǎn)生的平均工資差異[6]。在另一篇文章中他指出,教師工資指標可能促使大學(xué)持續(xù)增加教師工資,這可能是過去20年中私立研究型大學(xué)相對于公立研究型大學(xué)教師工資上漲的部分原因[8]。
學(xué)生的選拔性指標包含學(xué)生入學(xué)考試成績和原高中班級前10%新生比例2個二級指標,它們均受到了諸多批評。
入學(xué)考試成績對低收入和少數(shù)群體不公平。許多機構(gòu)早在20世紀90年代早期就對這一指標不再作強制要求,另外,排名中強調(diào)的標準化測試成績可能對低收入和代表性不足的少數(shù)群體學(xué)生申請者不公平,各高校也希望在更廣泛的范圍內(nèi)評判入學(xué)申請者,并鼓勵高中學(xué)生花時間準備測試之外的其他活動[8]。同樣,這些戰(zhàn)略性招生政策可能會傷害低收入申請者,他們在標準化考試中得分相對較低,并且經(jīng)濟條件通常不允許他們提前招生[9]。標準化測試不能代表學(xué)生的整體質(zhì)量,只根據(jù)排名作出的錄取決定沒有關(guān)注學(xué)生的整體素質(zhì)[10],比如領(lǐng)導(dǎo)力這樣難以量化但已經(jīng)被證明與學(xué)校成功有關(guān)的質(zhì)量因素就沒有被考慮到[11]。
學(xué)生選拔性中包含的第二個指標是進入高中排名前10%的學(xué)生的比例,這一標準對那些在競爭激烈學(xué)校就讀的學(xué)生不利[6]。此外,除了少數(shù)地區(qū),許多高中不再對學(xué)生進行排名。根據(jù)2005年調(diào)查數(shù)據(jù),康奈爾大學(xué)的新生中排名前10%的一年級新生占80%,但35%的康奈爾大學(xué)新生所在的高中沒有進行排名[8]。
財務(wù)資源指標衡量生均經(jīng)費資源,占10%權(quán)重。生均經(jīng)費資源是一項典型的高校投入指標,相關(guān)研究認為,投入指標對學(xué)生學(xué)習(xí)產(chǎn)生的作用是高等教育中最大的謎團之一。特倫齊尼(Terenzini)和帕斯卡雷拉(Pascarella)在控制了學(xué)生進入學(xué)校時的特征、能力、背景等因素之后發(fā)現(xiàn),學(xué)生的成長與這些投入指標之間沒有關(guān)系[12]。瑞恩(Ryan)的研究報告也指出,教學(xué)、學(xué)術(shù)支持和學(xué)生服務(wù)支出對于學(xué)生學(xué)習(xí)和發(fā)展密切相關(guān)的學(xué)生參與度沒有顯著影響[13]。除此之外,給學(xué)生帶來的經(jīng)濟壓力是該指標的另一個問題。高校為了排名更靠前,不敢輕易降低每名學(xué)生的支出增長率,這不利于本科學(xué)費的減少。簡而言之,該排名鼓勵高?;ǜ噱X,這對低收入家庭的學(xué)生不利[6]。
校友捐贈指標指校友的平均捐贈率,占5%權(quán)重。校友捐贈率是一項容易被操控的指標,越來越多的大學(xué)為了提高排名而操縱此項數(shù)據(jù)[14]。例如,南加利福尼亞大學(xué)沒有26%校友的聯(lián)系信息,因此便沒有將這部分計入報告的校友捐贈率。該校捐贈主管稱,學(xué)校的目標是提高捐贈率,而不是捐贈總額。研究者認為,為了提高排名而向每位校友索要1美元以提高捐贈率的做法是沒有意義的。
美新大學(xué)排名的指標體系始終在不斷變化和完善。自發(fā)布排名以來,指標系統(tǒng)出現(xiàn)了許多重要的轉(zhuǎn)折點。盡管如此,該排名仍然存在數(shù)據(jù)不準確、指標不全面、指標體系頻繁改變和權(quán)重任意分配等問題。
由于美新大學(xué)排名的公式是公開的,各高校能夠很容易地操縱他們的一些措施,以便在關(guān)鍵指標上獲得更高的分數(shù),例如,入學(xué)選擇性、生均財務(wù)資源、全職教師工資等指標,排名數(shù)據(jù)的可靠性不夠。埃倫伯格(Ehrenberg)觀察到,為提高排名,康奈爾大學(xué)在計算校友捐贈比例之前清除未順利畢業(yè)的校友,這一變化提高了康奈爾的校友捐贈率,即使它與康奈爾大學(xué)的基本學(xué)術(shù)質(zhì)量沒有關(guān)系[6]。
排名的巨大影響力和大學(xué)校長對排名的過度關(guān)注,使各高校很有可能通過操縱制度的各個方面來“操控數(shù)據(jù)”[15-16]。雖然大學(xué)校長公開宣稱美新大學(xué)排名不能充分衡量大學(xué)質(zhì)量,但他們努力從幕后最優(yōu)化他們的排名[6]。比如在聲譽調(diào)查中,許多校長和教務(wù)長因不想?yún)⒓印斑x美比賽”而拒絕填寫,但是其中一部分可能出于自身利益,故意將與他們關(guān)系密切的大學(xué)評價得非常差[6]。霍斯樂(Hossler)、波洛克(Pollock)和斯特克洛(Stecklow)提出,有證據(jù)表明大學(xué)提供了不準確的數(shù)據(jù)來提高排名,比如偽造考試成績和錄取數(shù)據(jù)等[17-19]。
大學(xué)排名經(jīng)常因指標使用不完整而受詬病,諸多研究者對美新大學(xué)排名指標的全面性進行了研究。瓜里諾(Guarino)構(gòu)建了貝葉斯?jié)撛谧兞磕P停l(fā)現(xiàn)學(xué)生擇校是衡量大學(xué)“質(zhì)量”的主要指標[20]。美新大學(xué)排名對相關(guān)指標給予了一定重視,不過該排名對學(xué)業(yè)優(yōu)秀的學(xué)生群體(在該學(xué)者提出的模式中,該變量本身就是一個應(yīng)該予以重視的潛在變量)和與之相關(guān)的其他質(zhì)量指標不夠重視。韋伯斯特(Webster)采用主成分回歸分析法對大學(xué)排名11個指標的相關(guān)貢獻度進行了實證研究[1],發(fā)現(xiàn)11個指標之間存在嚴重的多重共線性。因此,在此基礎(chǔ)上賦予各指標的權(quán)重不能準確反映每個指標對排名的貢獻。
美新大學(xué)排名在20世紀90年代多次改變排名方法(指標或指標權(quán)重),即使高校教育質(zhì)量沒有發(fā)生變化,學(xué)校的排名也會與之前不同。1998年之后,一級指標在一定時期內(nèi)透明且相對穩(wěn)定,但這些指標的計算方法既不一貫,也不完全透明[21]。指標體系的頻繁改變和權(quán)重的隨意分配是兩個不可分割的問題,正如薩爾米(Salmi)和薩羅揚(Saroyan)在研究中指出的那樣,權(quán)重分配的主觀性和隨意性是該排名的根本缺陷[22]。在權(quán)重分配時,排名毫無理性地為了強調(diào)某些指標而賦予相應(yīng)權(quán)重,而不是根據(jù)指標的重要性賦予權(quán)重[17]。在結(jié)果上,排名相差若干名的學(xué)校在各項數(shù)據(jù)的對比上也可能沒有顯著差異[20]。針對這個問題,埃倫伯格(Ehrenberg)也指出該排名方法的微小變化如何導(dǎo)致大學(xué)的排序發(fā)生重大變化,比如加利福尼亞理工學(xué)院從1998年的第9位躍升至1999年秋季美國新聞排名的第1位的主要原因就是排名計算方法的變化[23]。迪切夫(Dichev)進行時間序列數(shù)據(jù)的實證研究后發(fā)現(xiàn),隨著時間的推移,大學(xué)排名得分中只有10%的變化來自大學(xué)質(zhì)量的變化,其余的變化主要是來自計算方式的變化[24]。
《美國新聞與世界報道》是世界規(guī)模最大的新聞雜志之一,是典型的商業(yè)機構(gòu)。作為商業(yè)機構(gòu),該公司以營利為最終目標,但是當(dāng)大學(xué)排名涉及商業(yè)利益時,可能會給消費者帶來像“商業(yè)廣告”一樣的誤導(dǎo)。國內(nèi)學(xué)者李函穎和劉寶存指出該排名的商業(yè)化邏輯:大學(xué)排名作為一件商品,如果其連續(xù)兩年的排名結(jié)果完全保持不變,消費者就沒有購買的必要[2]。也就是說,如果排行榜的結(jié)果不發(fā)生變化,該排名的銷量就會急劇下降,這將帶來嚴重的經(jīng)濟損失。埃倫伯格(Ehrenberg)意識到了同樣的問題,并指出這可能是該排名指標體系、指標權(quán)重或計算方法經(jīng)常改變的內(nèi)在原因[6]。
大學(xué)排名是否能夠真正反映各高校教育質(zhì)量一直是研究者關(guān)心的問題?,F(xiàn)有研究表明,美新大學(xué)排名和質(zhì)量之間存在脫節(jié)。在方法上,該排名無法有效衡量各高校的質(zhì)量。同時,排名行為本身擴大了學(xué)校之間微不足道的差異并創(chuàng)造以前根本不存在的差異,無法真正反映大學(xué)的質(zhì)量[25]。許多實證研究支持了此觀點。14所公立研究型大學(xué)的全國學(xué)生參與度調(diào)查(NSSE)分數(shù)與該排名比較的數(shù)據(jù)發(fā)現(xiàn),排名標準與學(xué)生接受的教育質(zhì)量關(guān)系不大[26];研究者對Wabash系統(tǒng)和該排名數(shù)據(jù)的分層線性模型發(fā)現(xiàn),排名并不能預(yù)測學(xué)生是否參與良好實踐[16]??死锼雇蟹?Christopher)通過建立貝葉斯層次潛在特征模型,并使用包括美新排名在內(nèi)的全球八個大學(xué)排名的數(shù)據(jù),發(fā)現(xiàn)現(xiàn)有排名在測量大學(xué)質(zhì)量上有很大誤差,排名100與排名30、排名300與排名250的大學(xué)在質(zhì)量上很難區(qū)分。在這八個排名中,美新大學(xué)排名是最不準確的排名之一,這可能是因為使用了大量無關(guān)緊要的指標[27]。
高等教育的價值一直是高等教育界爭論不休的話題。高等教育發(fā)展離不開一定的價值導(dǎo)向,高等教育實踐也必須遵循一定的價值取向,并表現(xiàn)為一個價值實現(xiàn)的過程[28]。即便不爭論高等教育人才培養(yǎng)、科學(xué)研究與社會服務(wù)三大職能孰輕孰重,單純追求“排名靠前”不應(yīng)該是一個高等教育機構(gòu)的價值追求。
然而,在排名影響下,高校管理人員感受到了以排名為導(dǎo)向作出決策的壓力,而不是以質(zhì)量為導(dǎo)向的趨勢[29],這就容易引發(fā)一系列不合理決策,比如,“通過經(jīng)濟行為與排名公司搞好關(guān)系”“賄賂評估人員”“片面強調(diào)畢業(yè)率而忽視畢業(yè)生質(zhì)量”“強制校友捐贈”,甚至數(shù)據(jù)造假。在排名影響下,學(xué)術(shù)機構(gòu)紛紛試圖改變他們的行為以提升排名,其中一些行為可能在教育上有意義,其中一些可能在教育上沒有任何意義,甚至不符合國家的高等教育體系的整體利益[6]。
《美國新聞與世界報道》大學(xué)排名在美國和全世界的大學(xué)排行榜中有非常重要的地位,推動了世界上其他大學(xué)排名實踐和高等教育評估理論的發(fā)展,對學(xué)生及家長、高校、政府部門都有不可磨滅的影響。但不可忽視的是,該排行不是完美的,國內(nèi)外研究者尤其是國外研究者指出了該排名存在的許多問題,涉及該排名的指標體系、數(shù)據(jù)來源、計算方法等方方面面。學(xué)生在使用時要理性對待,各國在借鑒時也要理性分析。
秦 云紋