劉少雪(上海交通大學 高等教育研究院,上海 200240)
?
高等教育評價中的“數(shù)字陷阱”
劉少雪
(上海交通大學 高等教育研究院,上海 200240)
摘 要:高等教育是育人的事業(yè),其核心任務很難用具體數(shù)字來表達。數(shù)字化的描述和評價方法客觀上為人們提供了更直接的考察高等教育及其價值體現(xiàn)的視角,但工具理性自身帶有漠視人的情感和精神價值的弊端,也會將高等教育核心使命零碎化、淺表化,對人們全面認識和評價高等教育帶來一定的負面影響。本文通過三個具體案例,分析了數(shù)字化形式表述高等教育所可能帶來的問題,進而認為,數(shù)字化指標可以用來解釋高等教育質量,但其使用需要設置若干前提條件,包括數(shù)字指標的解釋力、指標間的邏輯關系、數(shù)據(jù)來源的真實性等;缺乏合理性和真實性的數(shù)據(jù),對高等教育質量評價則是失真的、無效的,甚至是有害的。
關鍵詞:數(shù)字;指標;高等教育質量
高等教育是育人的事業(yè),關系到人類的長遠進步、現(xiàn)實發(fā)展和文明承續(xù),因此,無論何時何地,培養(yǎng)人、探索未知和傳承人類文明都是高等教育的根本任務。與可衡量的其他物質存在不同,高等教育的核心任務因為與“人”、“文明”和“未知”有關,因此很難用衡量其他物質存在通常用的具體數(shù)字表達,案例陳述往往成為人們描述和評價高等教育的主要方式。但隨著現(xiàn)代工具理性在社會各方面的運用和滲透,效率和數(shù)字亦越來越成為人們衡量和描述高等教育的重要方式。數(shù)字化的描述和評價方法客觀上能夠為人們提供更直接的考量高等教育及其價值體現(xiàn)的視角,但不可避免地,由工具理性自身帶有的漠視人的情感和精神價值的弊端,也體現(xiàn)在其可能導致將高等教育核心使命的描述零碎化、淺表化、庸俗化,對人們準確認識和評價高等教育帶來負面影響。本文試圖從一些具體的案例出發(fā),闡釋僅僅運用數(shù)字方式分析高等教育質量所可能存在的不足。
當前,國內用數(shù)字方式來分析和表達高等教育發(fā)展的成果很多,本研究選取目前較為普遍的就業(yè)與專業(yè)設置、學生評教與教學質量、量化指標考核與科研發(fā)展等三個方面的一些典型案例進行關注和分析。
(一)就業(yè)與專業(yè)設置
進入新世紀后,我國高等教育快速從精英化階段步入大眾化階段。2014年的高等教育毛入學率已經達到37.5%,普通高校在校生規(guī)模達到2500萬人以上[1],這也意味著每年會有數(shù)以百萬計的高等學校畢業(yè)生進入勞動力市場。因此,每到畢業(yè)季,關于大學生就業(yè)的話題就會牽動社會各方面的注意力。為此,若干機構以不同形式發(fā)布了與大學生就業(yè)相關的數(shù)據(jù)和排名,也都會有不同的高?;驅I(yè)成為輿論“討伐”的中槍者。那么,這些數(shù)據(jù)排名是否科學合理呢?現(xiàn)以麥可思公司發(fā)布的《中國大學生就業(yè)報告》(2013年和2014年)為例分析說明。
《中國大學生就業(yè)報告》顯示,2013、2014年我國高校本科畢業(yè)生半年內的平均就業(yè)率分別為91.8%和92.6%;從專業(yè)角度看,兩個年份中排名最高和最低的十個本科專業(yè)分別可見表1和表2。
表1 2013年高校畢業(yè)生就業(yè)率最高和最低的10個本科專業(yè)[3]
表2 2014年就業(yè)率最高和最低的10個本科專業(yè)
從表中可以看出:
第一,2013、2014年我國高等學校本科畢業(yè)生半年內的平均就業(yè)率為92%左右。這個數(shù)字是否屬于國家、社會和高??梢越邮艿乃??從我國高等教育發(fā)展歷史可知,自新中國成立后到20世紀90年代中期,我國高等學校畢業(yè)生一直實行計劃分配制度,高校畢業(yè)生畢業(yè)后都能夠獲得安排工作崗位(個別不服從分配的除外)。實行畢業(yè)生自主進入勞動力市場、雙向選擇就業(yè)制度后,沒有人能夠保證所有的高等學校畢業(yè)生都能夠在短期內找到滿意的工作崗位—這是市場運行的基本規(guī)律。但由于新中國成立后上大學—畢業(yè)—工作之間的密切聯(lián)系,畢業(yè)生家長和畢業(yè)生本人對畢業(yè)后的就業(yè)狀態(tài)抱有較高期望;另一方面我國人口基數(shù)和高等學校學生規(guī)模大,即使畢業(yè)生中出現(xiàn)小部分不能立即就業(yè)的群體時,其絕對數(shù)量也相當可觀,因此易于激發(fā)社會多方面的反應;第三則是由于近年來的經濟轉型發(fā)展,勞動力市場的人才需求與高校畢業(yè)生的專業(yè)技能難以一一對應,使得社會對高校的人才培養(yǎng)工作頗有微詞??梢哉f,在諸多因素的影響下,高校畢業(yè)生就業(yè)成為近年來的敏感話題。值得注意的是,即使在高等教育發(fā)達國家,高等學校畢業(yè)生的就業(yè)率也達不到100%,這其中既有勞動力市場的因素,也有畢業(yè)生自身的原因。例如,美國國家科學基金會2006年的畢業(yè)生調查顯示,學士和碩士畢業(yè)生參加工作的比例為85%;勞工部委托人口調查局在2007年的調查中發(fā)現(xiàn),在24歲及以下青年中,具有學士以上學位的就業(yè)率最高,男性為88.1%,女性為90%,具有副學士學位和接受一定高等教育的青年的就業(yè)率居次,男性為85.4%,女性為75.1%。[2]英國高等教育統(tǒng)計局發(fā)布的《大學畢業(yè)生追蹤調查》顯示,2011年英國高等教育畢業(yè)生全職工作的比例也只有73.4%。[3]如果僅從就業(yè)率的數(shù)據(jù)上看,我國高校畢業(yè)生的就業(yè)率水平明顯高出美、英兩國。那么,這是否意味著我國高校畢業(yè)生的就業(yè)率已經很高?我們是否可以對此表示滿意?或者我們對此還有其他要求和期望?
第二,表1和表2顯示的2013和2014年高校本科畢業(yè)生半年內的就業(yè)率最高和最低的差距分別是13和12.3個百分點。在平均就業(yè)率達到92%左右的水平上,最高和最低之間10%的差距,其實質性內涵應如何解釋?特別是在2013和2014年就業(yè)率最高和最低的專業(yè)排名榜單中,就業(yè)率最高和最低的專業(yè)重合率都不高(50%),兩年都列入最高前10位的專業(yè)有建筑學、安全工程、護理學、工程管理和礦物加工工程等5個專業(yè);都列入最低名單的專業(yè)有法學、生物技術、音樂表演和應用物理學等4個專業(yè)。另外,教育部于2014年也公布了2012、2013年就業(yè)率較低的15個本科專業(yè)[4],這15個專業(yè)與前面的兩年的最低專業(yè)名單重合率也不高,在三個名單中都出現(xiàn)的專業(yè)只有1個(音樂表演),出現(xiàn)兩次的專業(yè)有3個(生物科學、動畫和表演)。依此來分析,我國高等學校設置的專業(yè)中,是否真正存在就業(yè)率低的專業(yè)?教育部對高等學校專業(yè)設置有要求,即需要“有穩(wěn)定的社會人才需求”[5],在巨大的畢業(yè)生就業(yè)壓力下,要對畢業(yè)生就業(yè)率低的專業(yè)設置預警制度。如果用明確數(shù)字表達出來的就業(yè)率排名結果不一致,甚至差別明顯,這樣的統(tǒng)計或排名結果是否可信?高校是否可據(jù)此調整和設置專業(yè)?這里同樣有2011年英國高等教育統(tǒng)計局發(fā)布的《高校畢業(yè)生就業(yè)去向調查》作對比,該報告顯示,80.5%的英國高校學生畢業(yè)生從事的是與其專業(yè)相關的工作,66.3%的畢業(yè)生認為大學教育體現(xiàn)了其自身的價值。[6]我國高校不同專業(yè)畢業(yè)生的就業(yè)率數(shù)字可否用來判斷學生的就業(yè)去向,或者是否能夠體現(xiàn)高等學校的教育價值?顯然目前的數(shù)字很難達到這樣的目的。
(二)A大學的本科課程教學學生評教情況
教學活動是“良心活”,教師的能力、技巧和投入對教學活動的成效影響很大。教師是影響教學活動成效的重要因素,但不是唯一因素,學生的投入和準備、教學內容與難度、培養(yǎng)體系的設計、教學制度安排等都會影響教學活動效果,因此,考察教學活動效果本身就是一件很復雜的事情。
近年來高等教育領域中的量化指標評估趨勢,也影響到了教學領域,不少高校嘗試對教師教學活動進行數(shù)字化評估,學生評教是其中的典型做法。學生評教起源于20世紀的美國。“我國高校學生參與教師教學評價,始于20世紀80年代中期。這段時間部分高校開始引入學生參與評價教學的評價方式,后逐漸為在多數(shù)高校得到認可和應用?!保?]13本案例選取的A高校于本世紀初開始將學生評教作為監(jiān)督和考核教師教學活動成效的一種方式。學生評教自被引入后,不斷遭受教師的質疑,校方也曾多次改進評教體系和內容,但在教師晉升或獎勵時,學生的評教結果還是會發(fā)揮一定作用。A大學2014—2015學年第一學期開設的3 034門次本科生課程的學生評教結果呈現(xiàn)如下。①A大學本科課程教學學生評教情況的所有數(shù)據(jù)和問卷內容均來源于A大學教務處組織的2014—2015學年度的本科課程教學學生評教結果(供內部使用)。除了選課人數(shù)少于10人,或參評學生少于50%的課程外,2 823門次課程得到有效評價。在滿分為100分的評價規(guī)則下,最高評教課程得分為98.2分,最低為38.4分;所有課程得分的平均數(shù)為85.2分,標準差為6.3;有2084門次課程得分超過平均分(占73.8%);得分最集中的區(qū)間在85~95分之間,超過2/3的課程集中在這個區(qū)間(具體情況見表3)。
表3 A大學本科生課程的學生評教結果分布表
從表3的數(shù)據(jù)中,會有這樣的疑問產生:
第一,全校的本科生課程評教分數(shù)平均分超過85分,是否意味著A大學的本科生課程教學已經達到令人滿意的程度?實際上,關于A大學本科課程教學的滿意度曾經有一個參考數(shù)據(jù)(研究經過信度和效度檢驗合格,但因為非學術原因不能公開發(fā)表),即通過對該校某個本科2+2項目(在A校和其國外合作大學分別學習過2年)的學生調查結果表明,學生對A大學專業(yè)培養(yǎng)的滿意度明顯不如對國外合作大學的滿意度高。調查學生對A大學的課程體系、教學內容、教材與參考書、教學方法、師資配備、教學效果、教學組織與管理等均有40%左右的“不滿意”或“很不滿意”;相反,對國外合作大學的上述方面僅在“教學方法”和“師資配備”兩個方面分別有1.5%的“不滿意”,沒有“很不滿意”的選項。兩種來源不同的數(shù)據(jù)有如此明顯的差距,作為學校的管理者和教師,更應該相信哪個數(shù)據(jù)?
第二,評教課程的最高分與最低分之間的差距達60分,是哪些因素導致了如此大的差距?是授課教師,還是授課內容,抑或是授課方式導致學生對某門課程的評價如此低?經過仔細查看,發(fā)現(xiàn)最高得分(98.2分)的3門次課程和最低得分(38.4分)的1門課程都是外語類課程,除其中1門最高得分課程是英語課程外,其余3門都是法語課程。在全部有效評價的課程中,法語類課程共有37門,其中“法語寫作”課程開設3門次,且評教得分均處于同類課程中的最低得分(分別為71、65.2和38.4分),其余法語類課程的得分均在85分以上。這里的疑問是,在法語類課程中,不同課程得分差別巨大,是否與課程內容及難度相關?但同為“法語寫作”課程,不同班級的評教分數(shù)差別很大,那么根源在任課教師還是選課學生?另外,從目前的數(shù)據(jù)中可以看出,在3門次的“法語寫作”課程中,最高得分的課程在全部課程排名中已經處在最后2%的水平上,更不用說最低得分的課程就是全部評教課程的最低分。那么從管理部門的角度,如何看待這門課程?從任課教師的角度,又如何評價這門課程?從課程設置本身,這門課程是否有存在的價值和必要?如何在師生間溝通處理好設與不設之間的平衡?……由此可以引出的問題很多,但僅從上面的數(shù)據(jù)中是看不出來的。
圖1 A大學本科課程評教分數(shù)聚集圖
第三,評教分數(shù)呈現(xiàn)嚴重偏正態(tài)分布(見圖1),這個結果是否意味著這次評教本身不夠嚴謹有效?按照教育統(tǒng)計學規(guī)律,正常的評教成績分布直方圖,如基本呈正態(tài)分布狀,會比較有效地反映學生對學校開設課程的評價情況,即評教效果是好的,基本上可以信任;現(xiàn)在的評教結果呈嚴重偏態(tài),峰值處與得分最集中的課程數(shù)不能重合,說明評教的效果不理想。通過考察學生評教的問卷內容,其中“理論教學”類課程的評教內容主要關注三方面內容:課程內容、課程及任課教師等。由此提出的問題是,以這樣三個問題來評價教師的教學工作,依據(jù)是什么?這三個指標之間的關聯(lián)性如何?它們是否可以反映教師的工作投入和狀態(tài)?問卷內容是否進行過可靠性檢驗?與學校的本科課程教學目的、人才培養(yǎng)目標是否匹配?評教指標體系是否能夠規(guī)避評教過程中的干擾性因素?如果所有這些問題都不能在評教之前就得到解答,評教結果自身及其應用都是值得商榷的。
綜合上面的分析,由于A大學沒有提供學生評教的信效度檢驗,影響了評教結果的真實可靠性,難以反映A大學本科生對學校開設課程的態(tài)度和真實評價。因此,從嚴格意義上說,這樣的評價是沒有意義的。但對于管理者和教師來說,這些有先天缺陷的分數(shù)又是有意義的——因為它們可能會被運用到學校對學院和教師的考核評價中,甚至可能在教師的聘任與職務晉升等關鍵性事項中發(fā)揮作用。這樣的數(shù)字確實會在高等教育管理中產生“陷阱”作用。
(三)C大學在不同年代對教師的考核要求及科研成果比較
近年來,對教師進行以量化指標為核心的考核,成為國內高校的普遍做法。具體的量化指標在不同高校之間會有差異,但宗旨都是把高校教師的工作分成若干不同的方面并指標化。表4反映了C大學自20世紀80年代以來對教師考核變化要求。
表4 C大學在三個不同年份對教師的考核要求①若無特別說明,表4、5、6中涉及C大學的材料數(shù)據(jù),均整理自其公開出版物和部分內部資料。
可以看出,自20世紀80年代中期以來,C大學對教師的年度任務考核內容已發(fā)生顯著變化。20世紀80年代,學校對教師的教學工作量要求很明確,7門次的標準班級授課任務是教師工作量的主干;科研工作有時間要求,但工作內容比較靈活,除了常規(guī)的調查研究、撰寫論文外,“科技文件材料整理歸檔、成果鑒定、成果推廣、技術后勤、課題組長組織工作等”也可以納入到教師的科研工作量計算。由此可以看出,這一時期學校對教師的科研工作要求比較寬松,基本尊重教師的自主選擇。相比80年代,90年代的教學工作量要求依然繁重,平均增加0.5門次的授課任務;同時,科研工作要求也比80年代聚焦,最明顯的是有了發(fā)表論文或其他成果形式的明確要求,但成果體現(xiàn)依然允許有多種選擇。到21世紀,教師的教學任務量明顯降低,但科研工作的要求更加集中明確,包括論文方面有了數(shù)量和發(fā)表刊物等級的要求,項目或獎勵有來源等級,著作也有出版社等方面的明確要求或限制。由之可以清楚看出,C大學對教師的考核要求越來越明確、集中,并向越來越數(shù)字化的方向轉變。
學校的考核要求,一定會轉化到教師的實際工作中。在不同時期的要求中,教學工作量都是“硬任務”,且教學工作量的安排,并不完全取決于教師自身,因此,一般在學期/年初,教師的教學工作會被首先落實??蒲泄ぷ鞯谋憩F(xiàn)、類型、成果等工作,與教師個體的能動水平有明顯關系。在考核要求相對模糊階段,教師的科研工作可能會表現(xiàn)為多種方式,“成果效率”可能不高;但在精準要求階段,完成考核任務成為教師第一要務,效率可能會有明顯提高。表5是對C大學在這三個時期教師科研產出的簡單對比。
表5 C大學在三個年份的科研產出比較表
從表5中看出,C大學在這三個階段以論文和項目為指標的科研產出有明顯進步。其中,20世紀90年代與80年代相比,80年代師均發(fā)表論文不到1篇,承擔的科研項目數(shù)也很少(0.5項);到90年代初,師均論文數(shù)略有降低(0.02篇),但承擔項目數(shù)有明顯進步(1.56倍),再考慮到這一時期教師的教學工作量增加,可以說這一時期的教師科研產出還是有明顯進步的。但更大的進步體現(xiàn)在2014年的數(shù)據(jù)上,其中,論文和項目數(shù)比前面兩個年份都是呈倍數(shù)增長,如對1985年論文和項目數(shù)都超過2.5倍以上,對1993年則是論文數(shù)超過近3倍、項目數(shù)超過1.2倍。這充分證明了數(shù)字化的考核要求對教師的科研產出有相當明顯的正面影響。
從表5的數(shù)據(jù)中,還可以發(fā)現(xiàn)反映科研質量的另外一個指標——獲獎成果——在三個不同年份的變化。在三個年份中,1985年的師均科研成果獲獎數(shù)最高,其后的兩個年份沒有明顯變化。進一步查閱相關材料,發(fā)現(xiàn)1985—1990年間是C大學迄今為止獲得科研成果獎勵項目數(shù)量最多、等級最高的輝煌時期。相對來說,2014年C大學教師發(fā)表了更多學術論文,承擔了更多項目,但教師的獲獎量不僅沒有提高,反而有所下降。由此產生的疑問是:論文發(fā)表和承擔項目的數(shù)量和級別是否能夠反映一所大學的科研能力和水平?如果能,那么為什么以反映質量為核心的師均成果獎勵數(shù)沒有隨著教師科研產出數(shù)量的增加而提高?如果不能,為什么當前我國的大學普遍采用以論文和項目數(shù)來表示大學的科研能力?發(fā)表和承擔項目的數(shù)量及級別在用于評價大學和教師的科研能力時應該發(fā)揮什么作用?比較C大學三個時期的考核要求,1984年對教師的科研考核指標最軟、最難以考量和把握,教師發(fā)表的論文和承擔的項目數(shù)也最少,但科研成果的師均獲獎率最高,甚至后面還有一段時間成果獲獎的輝煌期。這對C大學來說意味著什么?2014年時學校對教師的科研工作任務要求最明確,教師和管理者都很容易把握這些指標,其后的教師科研表現(xiàn)也基本實現(xiàn)了校方的預期,但成果的質量并沒有同步得到社會和同行的認可。那么這是不是大學期望的結果?另外,大學教師除了可以羅列出教學時數(shù)和發(fā)表論文、承擔項目外,大學內的很多其他諸如教學改革、調查研究、與外界溝通交流,特別是需要直指人心、打動學生的思想教育工作等,都需要教師較多的精力、時間和精神投入。如果大學把教師的工作都以數(shù)字指標來標示的話,那么這些難以用數(shù)字精確衡量的精神和文化層面的工作是否還需要教師承擔?如果大學和教師不能繼續(xù)承擔此類工作,大學與研究機構之間是否還有區(qū)別?大學及大學校園存在的價值意義,培養(yǎng)學生、學術研究及推動科學進步在當下的意義史無前例的重大,但若因此而忽略了其在傳承和發(fā)揚人類文明、承擔改良社會風氣之先的重任,大學的意義會黯淡許多。但傳承人類文明、改良社會風氣的責任,過程比結果重要,且很難用結果替代過程,因此非常有必要讓大學和教師能夠感受到適度的寬松和信任,既能由此體現(xiàn)出大學對教師和學生、大學教師職業(yè)的信任和尊重,也是大學能夠獲得更多教育成果及存在價值的基本前提。
高等教育作為教育的一部分,樹立百年育人、長期教育的觀念和情懷至關重要。數(shù)字性指標能夠在某個或某些方面幫助人們直觀地考察高等教育質量的部分表現(xiàn),但如果過分依賴數(shù)字性指標評價高等教育質量,則還有很多重要問題需要討論清楚。
第一,評價中所選取的數(shù)字指標,是否有科學合理的依據(jù)?簡單地說,不同的指標只能反映高等教育質量的某一或某幾個方面,因此,不同的高等教育質量評價,只能根據(jù)目的需要選取不同的指標及指標體系。因此,服務于不同目的的指標選取,即使合理,也只能保證其合理性在評價某一或某幾個方面時的有限范圍。從這個意義來說,任何時候選取科學合理的指標都是合理使用數(shù)字性指標的第一步。但如何選擇科學合理的指標?選擇時是否有合理的規(guī)則和流程?如何評價考察選取的指標是否合理科學?這些則是指標使用前需要解決的關鍵問題。以上面提到的就業(yè)率為例。這個就業(yè)率所表述的是學生在畢業(yè)后半年內是否簽訂了工作協(xié)議,因此其核心內涵為是否有工作協(xié)議,但工作協(xié)議不反映畢業(yè)生正在或將要從事工作的性質、類型,以及畢業(yè)生對該工作的滿意度等,也反映不出畢業(yè)前學生所學專業(yè)對其從事的工作是否有價值、價值有多大。用沒有反映學生專業(yè)價值的工作協(xié)議來評價不同學科專業(yè)的就業(yè)率,沒有邏輯意義,因此也難有衡量價值。用文章數(shù)和項目數(shù)來考核教師的合理性同樣值得懷疑。在近年來大學普遍采用量化考核指標后,我國大學的學術發(fā)表能力和國際影響力不斷提高,但論文泡沫、論文槍手、學術造假等與考核指標密切相關的質疑聲不斷;大學教師作為職業(yè)化“寫手”(論文和項目申請書)的素質和能力也有明顯提高,但大學中另一核心群體——學生——被教師關注的越來越少,質疑高等教育質量的外部聲音越來越多,這也是就業(yè)率、學生評教等數(shù)字性指標能夠有市場需求的原因所在。借用克拉克?科爾所說的“高等教育越來越少只是為成人就業(yè)做準備,而越來越多成為一個人整個一生的一部分”[7]264來評價畢業(yè)生就業(yè)率與高校專業(yè)設置的問題,高等學校不應該也不需要把就業(yè)率與專業(yè)設置聯(lián)系在一起。
第二,數(shù)字本身是否真實可靠?無論是就業(yè)率統(tǒng)計,還是學生評教,都需要大范圍收集有效數(shù)據(jù)。但目前的數(shù)據(jù)發(fā)布者都沒有對數(shù)據(jù)來源的可靠性進行說明。在我國高等教育領域真實數(shù)據(jù)獲取有很多現(xiàn)實障礙的情況下,采用不同方式獲取大規(guī)模數(shù)據(jù)是不可避免的,但越是在這種情況下,越需要對所獲得的數(shù)據(jù)進行可靠性分析。特別當這些數(shù)據(jù)指標有可能被應用到評價個人或群體時(如就業(yè)率可能會影響到高校的專業(yè)設置、學生和家長專業(yè)選擇,學生評教結果可能會影響到教師考核及晉升等),真實可靠是影響數(shù)據(jù)意義的核心因素。高等教育質量是一個內涵極其豐富的概念,對其能夠產生影響的因素也很多,人們對好的高等教育質量有若干共識,不理想的高等教育質量可能是受多種不同因素共同影響的結果,僅靠某些因素分析就對高等教育質量進行評價和判斷的做法是危險的。富有大學管理經驗的克拉克?科爾還說過:“即使意圖再好,成績難以界定,也不易估價。這是為什么在美國高等教育機構教師的晉升中至少有半數(shù)(也許多至四分之三)的教師以資歷取代成績的一個理由。鑒于極少合適的績效,又缺乏明顯的高績效的證據(jù),至少全體教師的一半(多半在研究型大學和優(yōu)秀的文理學院以外)只根據(jù)資歷晉升?!保?]173大學教師是一群以傳承文化、探索未知為基本使命的知識精英,他們之間的共性要遠遠少于他們之間的個性差別,而且正是因為他們之間是不同的,他們才有可能共處一個校園。承認了他們之間的差別,就難以對不同的人、不同的工作進行精確評價和比較,以模糊代替精確是科爾管理大學的明智選擇。
第三,精確的數(shù)字化模式是否適合高等教育質量管理?精確管理最先出現(xiàn)在企業(yè)管理中,它對提高企業(yè)的生產效率、降低成本等方面富有成效。但與企業(yè)相比,高等學校承擔了育人、探索未知、服務社會、傳承文明等多項使命,因此決定了高等學校的發(fā)展是多目標性的,其質量維度也是多向的;更由于高等教育是以人(包括教師和學生)、文明、科學等為核心要素,就決定了高等教育難以套用精確管理的模式去進行質量管理,簡單地說,高等教育質量管理需要更加復雜的系統(tǒng)管理模式。但“隨著系統(tǒng)復雜性的增加,我們做出關于系統(tǒng)行為的精確而有意義的陳述的能力將降低,越過一定閾值,精確性和有意義(或適用)幾乎成為相互排斥的特性”[8]30,以簡單的數(shù)字化指標來判斷和指揮高等教育的做法從管理學的意義上說是不適宜的。
由于高等教育目標和使命的多元化,決定了高等教育質量的測量和評價是個復雜工程,用數(shù)字化指標解釋高等教育質量,需要若干的前提條件,包括指標對高等教育質量的解釋力、指標間的邏輯關系、數(shù)據(jù)來源的真實性等。缺乏合理性和真實性的數(shù)據(jù),對高等教育質量評價則是失真的、無效的,甚至是有害的。因此,防止高等教育質量評價中的“數(shù)字陷阱”,對于高等教育研究者來說是非常急迫而且相當艱巨的任務。
參考文獻
[1]中華人民共和國教育部.2014年全國教育事業(yè)發(fā)展統(tǒng)計公報[EB/OL].(2015-07-30)[2015-10-10].http://www.moe.gov.cn/jyb_xwfb/gzdt_gzdt/s5987/201507/t20150730_196698.html.
[2]王曉陽,方軍.美國聯(lián)邦政府對高校畢業(yè)生就業(yè)市場的培育與引導[J].世界教育信息,2009,(1).
[3]Chris Havergal.Graduate unemployment back to pre-recession levels[EB/OL].(2015-08-27)[2015-10-10].https://www.timeshighereducation.com/news/graduate-unemployment-back-pre-recession-levels.
[4]晉浩天.教育部公布近兩年就業(yè)率較低的本科專業(yè)名單[EB/OL].(2014-10-16)[2015-10-10].http://www.jyb.cn/high/gdjyxw/201410/t20141016_601306.html.
[5]教育部.普通高等學校本科專業(yè)設置管理規(guī)定[EB/OL].(2012-09-14)[2015-10-10].http://www.moe.gov.cn/s78/A08/gjs_left/moe_1034/s3881/201305/t20130523_152287.html.
[6]王麗榮.中美高校學生評教指標體系的比較研究[D].濟南:山東大學,2008.
[7]克拉克?科爾.高等教育不能回避歷史——21世紀的問題[M].王承緒,譯.杭州:浙江教育出版社,2001.
[8]馬驥良.札德的科學思想和方法[M].西安:陜西師范大學出版社,1992.
[責任編輯:羅雯瑤]
Misleading Quantitative Evaluation in Higher Education
LIU Shao-xue
(Graduate School of Higher Education,Shanghai Jiaotong University,Shanghai 200240,China)
Abstract:The core missions of higher education as an undertaking of talent development cannot be simply evaluated in quantitative terms,though quantitative evaluation and description may sometimes offer straightforward insight into higher education and into its expression of values.However,due to the failure of instrumental reason tofully consider human emotional and spiritual values,the quantitative approach to higher education may lead to segmented and superficial misunderstandings of the core missions of higher education,and therefore inaccurate evaluation of higher education.Through an analysis of three cases,the paper discusses the possible problems caused by the quantitative description of higher education.It argues that though quantitative indicators may help interpret education quality,the use of these indicators needs a number of preconditions,including the insightful interpretation of the indicators,the relationship among different indicators,the authenticity of the data sources,etc.The illegitimate and invalid data may lead to misleading assessment of higher education.
Key words:data;indicator;quality of higher education
中圖分類號:G640
文獻標識碼:A
文章編號:2095-7068(2016)01-0028-08
收稿日期:2015-12-22
作者簡介:劉少雪(1967—),女,山東萊陽人,博士,上海交通大學高等教育研究院教授,主要從事高等教育研究。