原青林,王艷玲
(1.肇慶學院外國語學院,廣東肇慶526061;2.肇慶學院圖書館,廣東肇慶526061)
國外高校學生評價結果對教學評價的積極作用探析
原青林1,王艷玲2
(1.肇慶學院外國語學院,廣東肇慶526061;2.肇慶學院圖書館,廣東肇慶526061)
學生評教是學生對接受的教育質量發(fā)表意見的機會,也是教師反思自身教學實踐的良機。目前,學生評教的結果受到多種外部因素的制約,應當從多個層面對原始評價成績進行分析,求得客觀公平的最終結果,并據此向被評價教師提出建言,以此促進教師個體的專業(yè)發(fā)展,并最終達到提升高校教學質量的目的。在高校學生評教方面,國外一些大學的做法值得借鑒。
國外高校;學生評教;多層分析
自從系統(tǒng)的學生評教實施以來,就一直伴隨著關于其有效性和適用性的各種爭論。從世界范圍看,關于學生評教的早期考釋可以上溯至20世紀20年代,當時的文獻強調了在大學教育層面廣泛實行學生評教的必要性和復雜性,并重點關注了下列問題:學生能否對教師的教學水平作出準確和恰當?shù)呐袛??學生評教采用的問卷調查本身是否具有較高的有效性?諸如班級規(guī)模、課程性質、課程層次、教師資歷等外部因素在多大程度上對學生評教結果產生影響。學生評教中暴露的種種弊端也引發(fā)了各種爭論,并且往往成為大學教師用來貶低學生評教作用和價值的工具。正如一些論者所言,收集和統(tǒng)計學生評教結果的弊端主要在于它們被誤解和誤用的方式上,而最常見的誤用就是直接報告學生評教的原始成績和學生對教師的主觀評語,自以為使用者具備有效解釋這些評價結果的資格和能力。在規(guī)范性或比較信息缺失的情況下,被評價的教師很可能過分在意學生的某些反饋意見。如果評教結果被一些學生管理部門所公布,編者或起草者的主觀偏見可能會歪曲和誤導評定等級的含義;如果管理者僅將這些評定等級用于懲罰目的,教師們勢必會對它們的可信度產生懷疑,甚至設法阻止對它們的使用。
這一審慎的考慮本質上又回到了如何對教育各領域質量進行測評的更加寬泛的辯論,這種辯論發(fā)生在教育的各個層面,從學前教育直至高等教育。根本的問題在于,以學生的知識吸收量作為測量教師教學輸入的尺度是不恰當?shù)?。相反,教學是教師、學生、管理者、家庭成員和伙伴群體之間的一種共同建構[1]36-39。因此,無論從質量上還是從數(shù)量上都難以對教師的貢獻作出準確的評估。雖然數(shù)量可以通過師生互動的時間作出測評,但又難以測評學生在互動期間的專心或投入程度。關于教師質量的言論更是莫衷一是,不過可以理出兩條主線:一是專注于各種可測性課堂互動,例如采用學生表現(xiàn)測評,包括標準化測試、學生評價、學生滿意度問卷調查,以及家長和其他利益相關者問卷調查;二是專注于反思性實踐者的專業(yè)實踐文獻。實踐可以被界定為以下活動:與理論相對的行動、一種習慣性行動、一種旨在提高自身技術水平的重復性練習等。然而有趣的是,只有其中一個定義是明確關乎提升實踐者技能的,而這種技能的提升又成為專業(yè)實踐證書隱含的根本目的[2]135-152。
一些西方論者認為,教學實踐不僅是一種產出活動,更是一種共建活動,并且可以通過成人教育理論的思維變化來解釋:這種思維變化就是主張教師應從一個靜態(tài)輸入者(a static input)轉變?yōu)橐粋€適應課堂變化的動態(tài)促進者(a dynamic facilitator)。作為教師,我們希圖培養(yǎng)學生應有的技能,但我們首先應當在教學反饋的回應中探尋適當?shù)呐囵B(yǎng)方法。另一些論者則更加重視反思型教學的重要性,即主張對程式化的學生反饋進行改造和擴圍。對于高校教師個人來說,無論其學生滿意度和教學業(yè)績如何,都需要運用一種理論框架對學生的反饋信息進行分析。這種新的理論框架亦可對某一階段內的發(fā)展和調整結果進行動態(tài)評價,其主要優(yōu)勢之一就在于可用來對授課者相對業(yè)績的動態(tài)性進行獨立分析。
從國外關于教師評價的文獻中可以看出,大學教學的復雜性、大學教師所處的背景及其在批判性反思中的角色成為共同關注的主題。高等教育日趨復雜,高校教師的壓力越來越大,這是毫無疑問的。其原因之一是,新自由主義意識形態(tài)成為諸多現(xiàn)行教育政策的基礎,因而往往將教育視為一種產品,如同生產流程中的工業(yè)產品,使教學更加趨于一種管理方法或管理研究方法,試圖創(chuàng)造某種形式的輸入/輸出模式或質量評價[3]417-428。例如,新西蘭的現(xiàn)行政策正在關注重構學校教師薪水制度,以強化優(yōu)質教育和提供專業(yè)領導[4]。其結果是,被視為高校院系中主要業(yè)績指標的項目愈加成為教學測評的主要觀測點。在眾多國家的高校里,決策者和管理者的關注點已經從科研測評轉向教學測評。雖然學生評教只是此類評價方式的一部分,但已成為其主要方式之一。
眾所周知,通過學生評教可以從學生角度發(fā)現(xiàn)教師哪些方面有成績,哪些方面存在不足。發(fā)現(xiàn)的依據就是學生提供的評價得分和主觀評語。但這些評價得分和主觀評語未必是客觀公正的。為了避免它們可能存在的片面性,必須對影響學生評教結果的一切外在因素進行考量。常見的外在因素包括以下一些方面,它們皆會對學生評教的結果產生一定程度的影響。
(一)教師方面
如教師的性別、年齡和資歷、教育培訓背景、教學方法和教學經驗等,特別是教師的培訓背景、運用的教學方法以及教學經驗,直接影響教師的教學效果,進而直接影響學生評教的結果。
(二)學生方面
如學生處于什么樣的學習階段?學生對教師執(zhí)教的課程是否有先前興趣?教師執(zhí)教班級的規(guī)模和不同班級的出勤率如何?學生對教師有沒有偏見?這些因素都會在不同程度上影響學生評教的結果;三是課程方面:如教師執(zhí)教的課程的類別和性質,必修課與選修課、公共基礎課和專業(yè)方向課等不同類別和性質的課程獲得的評教成績差別很大;四是調查問卷:學生評教采用的調查問卷本身如果具有較高的有效性和標準化程度,其所反映的評教結果便具有較高的分析和參考價值。
這些外在因素涉及四個變量:教師、學生、課程和調查問卷本身。任何一個變量都會影響學生評教的結果。在現(xiàn)實的學生評教中,往往有多個變量共同對評教結果產生影響。就調查問卷的有效性而言,為了保證評教結果的科學性和指導性,評價表里的問題必須具備較高的有效性和標準化程度。這就要求調查問卷的問題必須采用專家研制的規(guī)范性評價指標。下列是新西蘭名校奧克蘭大學(University of Auckland)和奧克蘭理工大學(Auckland University of Technology)學生評教調查問卷中的一些問題,值得我們參考[5]323-339。
1.本教師是否具有親和力,平易近人。
2.本教師是否組織到位,備課充分。
3.本教師的熱情和激情是否有助于你的學習。
4.本教師的解釋和舉例是否對你學習有幫助。
5.本教師是否向學生尋求反饋并作出回應。
6.本教師能否有效運用學科知識指導你學習。
7.本教師是否在課堂上對你的理解做出評價,對你的進步給予建設性的反饋。
8.本教師能否清晰地傳達評價要求。
9.本教師對你是否很尊重。
10.本教師能否有效地進行溝通。
11.本教師是否為你創(chuàng)設了利好的學習環(huán)境。
12.本教師是否幫助你學會對自己的學習負責。
13.本教師總體上是不是一位高效教師。
可以看出,這些問題不僅充分體現(xiàn)了當前公認的教育理念和主張,而且皆為具體明確的問題,學生憑借自己的感知力和聽課經歷即可予以作答,從而確保他們具備作出準確判斷的能力。因此,這些問題具備較高的有效性和標準化程度。此外,在上列問題中,1~5和13是兩所大學學生評教問卷中共有的問題,6~7和11~12來自奧克蘭理工大學的問卷,8~10來自奧克蘭大學的問卷。由于兩所大學的性質不同,奧克蘭大學的問題更加關注作為獨立實體的教師的所作所為,而不太關注這種作為對學生產生的影響。而奧克蘭理工大學的問題則更加關注教師如何培養(yǎng)學生管理自己學習的能力,這是一種共同建構(co-construction)的方法。
學生評教調查問卷中其他一些必要的問題如下[6]559-590:
1.本教師課程是否有助于你的未來專業(yè)發(fā)展。
2. 在本教師的課堂上,你是否有機會展示自己的知識和能力。
3. 本教師能否清晰地講解課程要點。
4. 本教師的課程內容是否具有激勵性。
5. 本教師能否寬容地對待學生的不同觀點。
6. 在本教師的課堂上,學生們是否有許多主動表現(xiàn)的機會。
7.本教師是否對所布置的作業(yè)都有清晰說明。
8.本教師是否鼓勵學生在課堂上進行思想的交流。
9. 本教師安排的課堂討論和布置的作業(yè)是否有助于你對教材的理解。
10. 本教師能否照顧到學生間的個體差異。
其他因素不同程度地與學生的上課興趣和對課程的預期成績有關。關于學生上課興趣和課程預期成績與學生評教成績相關度的研究結果早已見諸于國外文獻。例如,美國教育論者馬什(H. W. Marsh)和鄧肯(M. Dunkin)曾經指出,有兩個變量直接影響學生評教成績:一是學生對課程的先前興趣;二是學生對課程的預期成績。前者是學生評教成績的一個基本解釋變量,其影響力超過任何一個考慮到的背景變量。后者也對學生評教結果產生直接影響,學生評教成績隨著課程預期成績的提升而提升。
就兩者的復雜關系和影響而言,有研究表明,先前興趣與教學效果、特別是與學習成績,有正相關的關系,這種正相關又在學生評教中得到了反映。有人將先前興趣和上課理由作為外源變量來對待,認為其對學生評教的影響力可以被學生的預期成績和課業(yè)負擔所調解。而先前興趣又與預期成績及課業(yè)負擔有正相關。先前興趣不僅通過預期成績對學生評教產生間接影響,而且對預期成績這一變量本身產生直接的正面影響[7]98。也有人在對學生評教的結構模型的檢測中,將課程興趣、成績平均績點、年級和班級規(guī)模視為外源變量,認為它們對學生評教產生直接影響,并通過預期成績和課業(yè)負擔對同一變量產生間接影響。他們的研究結果表明,課程興趣與學生所處的年級和課業(yè)負擔有正相關,與班級規(guī)模有負相關,并對預期成績和學生總體評教成績產生正面影響[8]49-64。
就后者而言,學界對課程預期成績和學生評教成績的正相關做出了不同的解釋。有人認為,預期成績與學生評教成績之間的正相關是由于教師給分寬松造成的。也有人認為,預期成績更高反映了學習更努力,進而導致學生評教成績更高。有人用事實證明了學生、教師及課程變量與課程預期成績之間的關系,認為預期成績與教師教學經驗之間有一定的關系。也有人認為,年級較高的班級和規(guī)模較小的班級對課程成績的期望值較高,對教師教學效果的評價也會更高。而年級較低和規(guī)模較大的班級對課程成績的期望值較低,因而對教師教學效果了解不深或關注不夠,其評教成績往往較低,甚至作出有偏見的和不公平的評價。
教師的性別、年齡和資歷以及教育培訓背景和教學方法等因素皆與教師的屬性有關,它們都是影響學生評教結果的一些變量??疾爝@些變量的研究結果表明,教齡在3年以下、經驗不足的教師和教齡在8年以上、雖有豐富教學經驗但已顯現(xiàn)職業(yè)倦怠的教師的評教成績不及教齡為4至7年、既有一定教學經驗也有較強教學熱情的教師的評教成績好。也有證據表明,學生往往對具有教育培訓背景的教師評價較高[9]187-198。就教師的資歷和學生評教成績的關系而言,助理教授、副教授和教授的學生評教得分差別不大,但在進階課程或高級課程的評價中,教學助理的得分最低,而副教授的得分最高。此外,對于助理教授和副教授而言,男性教師的平均得分和女性教師的平均得分完全相同,但對于教學助理和教授而言,女性教師的得分高于男性教師的得分。
總之,在學生評教過程中,影響評價結果的因素和多維的和多層次的。為了保證評價結果的客觀性和公正性,一方面要設法對有關的變量加以控制,盡可能保證學生評教在相同條件和相同情境下進行;另一方面在分析學生提供的評價成績和主觀評語時,必須充分考慮各種因素對其產生的影響,最終作出客觀公正的評價結果。
如前所述,學生評教成績受到教師、學生、課程特點和調查問卷本身等多個變量的制約,故而必須對學生的原始評價成績進行多維和多層的分析,形成客觀公正的最終結果,并據此向被評價教師提出建言。關于這一問題,我們不妨關注一下西方學界的一些研究結果。例如,德國教育論者德雷克塞爾和林德曼(M. Dresel & H. Rindermann)的研究就如何通過建言方法的實施提升高校全職教師教學質量的問題進行了考究。該研究采用的是一種多層方法,涉及學生、課程和教師三個層面,每個層面可能出現(xiàn)的偏見和不公平影響均已得到控制。研究結果表明,根據第一次學生評課結果向被評價教師提出建言,可以使他們的第二次學生評教成績得到實質性提高。由此可言,根據學生評教結果向大學教師提出建言不失為一種有效方法,它能夠使教學質量得到長期改進。這一點亦適用于建言期間沒有直接涉及的課程[10]717-737。換言之,向教師建言是一種長效機制;其效應可以有效地遷移到不同的教學環(huán)境中。因此,我們可以將之描述為一種旨在提升高等教育質量的有效干預。
從方法論的視角看,德雷克塞爾和林德曼的研究旨在考查和證明三層分析模式是否適用于從大學生課程評價中所收集的數(shù)據資料。有四種研究結果可以支撐這一結論:1.在不同課程之間,偏見和不公平影響的力量和方向存在差異。2.課程特有的偏見和不公平變量的意義存在差異,基于這種差異可以對兩個跨層級互動進行觀測。這表明,學生層面的偏見和不公平變量的誤導性影響可以被課程層面的偏見和不公平變量所緩解。3.研究結果表明,偏見和不公平變量可以同時對若干個分析層級產生影響。4.有證據表明,不僅學生特點的課程均值而且課程參與者中間相關特點的多樣性皆可以對學生評教的結果產生影響——這種影響很少有人研究過[11]22-35。這四種研究結果表明,在對學生評課的數(shù)據進行分析時,應當考慮其在多個層面上的表征。此外,三層模式在檢驗向教師建言的效果時同樣是有用的。它不僅有助于保證出勤相異課程學生評價結果的可比性,而且可以調節(jié)包括課程和學生獨立樣本以及教師(執(zhí)教多門課程)非獨立樣本在內的復雜的數(shù)據結構。
高校的教學評價比較復雜,因為與中小學相比,高校更加要求教師應當成為學者和研究者,同時更加主張學生的獨立學習能力和反思能力。所以,高校的學生評教結果易于受到多種外在因素的制約和影響。單從一個層面去評價和分析教師的教學效果或單從一個層面去報告學生評教的結果,都不能保證其客觀公正性,必須全面分析從多個層面表現(xiàn)出來的評價結果,考慮和排除各種外在因素的影響,得出客觀公正的最終評價結果,并據此向被評價教師提出有效的建言。此外,高校的學生評教結果應當主要用于建設性目的,成為持續(xù)提高教師個人和院系教學質量的形成性指南。對它的使用不應成為一種終結性過程,也不應當直接與晉級和加薪掛鉤,因為那樣可能會導致一種反向激勵。例如,通過降低學生的期望值可以提升其評教成績;同樣,通過降低院系的教學質量要求亦可提高教師的績效水平??傊瑢W生評教的最終目的在于提高教學質量,而不在于評價結果本身。就高校學生評教的客觀性和有效性而言,國外一些大學的做法著實值得借鑒。
[1]Peeters A R. Flanders: Improving Inclusion Policies and Services. In Learning with Other Countries:International Models of Early Education and Care[M]. London: National Day Care Trust,2005:36-39.
[2]Urban M. Dealing with Uncertainty: Challenges and Possibilities for the Early Childhood Profession[J]. European Early Childhood Education Research Journal,2008,16 (2):135-152.
[3]Langbein L. Management by Results: Student Evaluation of Faculty Teaching and the Mis-measurement of Performance[J]. Economics of Education Review.2008,27 (4):417-428.
[4]Ministry of Education. Investing in Educational Success-The Learning and Achievement Challenge. Wellington,NZ: Office of the Minister of Education [EB/OL]. http://www.minedu.govt.nz/ the Ministry/ EducationInitiatives/ InvestingInEducationalSuccess/KeyInformation.aspx,2014.
[5]Hedges M R,Webber J D. Using student evaluations to improve individual and department teaching qualities[J]. Research in Post-Compulsory Education,2014,19:3,323-339.
[6]Nasser F,Hagtvet A K. Multilevel Analysis of the Effects of Student and Instructor/Course Characteristics on Student Ratings[J]. Research in Higher Education,2006,5:559-590.
[7]M Dresel,H Rindermann. Counseling University Instructors Based on Student Evaluations of Their Teaching Effectiveness: A Multilevel Test of its Effectiveness Under Consideration[J]. .Research in Higher Education,2011(5): 98
[8]Worthington A C. The impact of student perceptions and characteristics on teaching evaluations: A case study in finance education[J]. Assessment & Evaluation in Higher Education,2002,27(1):49-64.
[9]Nasser F,F(xiàn)resko B. Faculty views of student evaluation of college teaching[J]. Assessment & Evaluation in Higher Education,2002,27(2):187-198.
[10]Dresel M,Rindermann H. Counseling University Instructors Based on Student Evaluations of Their Teaching Effectiveness: A Multilevel Test of its Effectiveness Under Consideration of Bias and Unfairness Variables [J]. Res High Educ,2011,52:717-737.
[11]K. Smimou & D. W. Dahl. On the Relationship Between Students’Perceptions of Teaching Quality,Methods of Assessment,and Satisfaction [J]. Journal of Education for Business,2012,87(1): 22-35.
On the Positive Function of Student Evaluations of Teaching Effectiveness in Universities
YUAN Qing-lin1,WANG Yan-ling2
(1.college of Foreign Languages,Zhaoqing University,Zhaoqing Guangdong 526061;2.Library of Zhaoqing University,Zhaoqing Guangdong 526061)
Student evaluation of teaching effectiveness is an opportunity for students to voice their views on the quality of teaching that they receive,and for instructors to reflect on their teaching practices.Yet,student evaluations may be influenced by various external factors,so the original evaluation results should be analyzed on multiple levels,so that the final results can be objective and valid,and can be used as a basis for counseling instructors.This can contribute to the professional development of individual instructors and in turn improve the teaching quality of universities.In this respect,the advanced experience of some foreign universities is really worth learning.
foreign universities;student evaluation of teaching effectiveness;multilevel analysis;effective counseling
G647
A
1673—8861(2016)04—0143—05
[責任編輯]張琴芳
2016-10-10
原青林(1959-),男,河南輝縣人,肇慶學院外國語學院教授,博士。主要研究方向:外國教育、英語教育。
2012年度廣東省高等教育教學改革項目(2012299)。