楊建芹
(大連教育學院 學習質(zhì)量監(jiān)測中心,遼寧 大連 116021)
?
獨立樣本t檢驗在學生學業(yè)質(zhì)量評價中的應用
楊建芹*
(大連教育學院 學習質(zhì)量監(jiān)測中心,遼寧 大連 116021)
文章介紹了差異性比較的一種科學的檢驗方法以及具體的應用案例。
獨立樣本t檢驗;學業(yè)質(zhì)量評價;差異性比較
考試測驗作為教育教學評價的一種手段,已經(jīng)被廣泛地應用于學校的日常教學評價與大規(guī)模人才選拔考試中。在考試成績統(tǒng)計與分析中,平均分是衡量一個學?;虬嗉壗虒W的主要考核指標,但目前平均分差異性的比較還存在一些問題。一些從事成績分析與管理的教師在作成績對比分析時,通常簡單地根據(jù)各學科考試分數(shù)的高低評價教師的教學業(yè)績,不做統(tǒng)計檢驗就得出結論,這種評價是不科學的。在學業(yè)質(zhì)量評價過程中,兩個平均分的差異是“顯著”還是“不顯著”,只有進行科學地統(tǒng)計檢驗,才能客觀地分析兩個均值間的差異。
對學校兩個不同班級的考試平均分進行比較,可以采用獨立樣本t檢驗進行統(tǒng)計分析。比較兩個獨立樣本的平均分,就是確定兩個樣本平均分差異是由抽樣誤差引起的,還是兩個總體平均分的確存在差異。
在假設檢驗中使用獨立樣本t檢驗之前,有三個前提假設必須滿足:一是每個樣本的觀察值必須是獨立的;二是樣本來自的兩個總體必須是正態(tài)分布的;三是樣本來自的兩個總體必須有相同的方差。[1]一般情況下,對于大樣本(通常指樣本容量大于或等于30)而言,前兩個前提基本都能滿足。當有理由懷疑總體不是正態(tài)時,作為補償,應當選用相對較大的樣本。第三個前提又叫方差的同質(zhì)性,這個前提非常重要,因為違背這個前提,不能對獨立測量實驗數(shù)據(jù)進行任何有意義的解釋。
為了驗證兩個考生群體的平均分差異是不是顯著,可以利用兩個獨立樣本t檢驗進行統(tǒng)計推斷,如果滿足獨立樣本t檢驗的三個前提假設,接下來可分五步進行。第一步,建立零假設和非零假設;第二步,確定意義水平α(考試數(shù)據(jù)分析解釋中,一般選擇α=0.05,少數(shù)情況下選擇0.01);第三步,計算檢驗統(tǒng)計量的值;第四步,對于自由度為df的t統(tǒng)計檢驗量,利用計算機獲得概率p值;第五步:判斷結果。如果用統(tǒng)計軟件SPSS,這一比較過程會更加便捷。下面通過例1來說明,根據(jù)SPSS的輸出結果如何判定獨立樣本t檢驗的第三個前提假設是否滿足,以及對獨立樣本t檢驗結果的解讀。通過例2進一步說明獨立樣本t檢驗在學生成績差異性比較中應用的必要性。
1.班級學業(yè)成績差異性比較
例1:在一次高三模擬考試中,某學校的高三四班(66人)和七班(67人)理科數(shù)學的平均成績分別為101.34分和95.52分,有些人認為兩個班級平均成績相差5.82分,差異顯著,這樣的評價是否科學?
分析:由于四班和七班的數(shù)學成績可看成是兩個獨立的樣本,且測試成績可近似認為服從正態(tài)分布,由此可知,前兩個前提條件都是滿足的,利用SPSS進行分析可得到獨立樣本t檢驗結果,如表1所示。
在Levene's Test for Equality of Variances(Levene方差齊性檢驗)和Equal variances assumed(假設方差相等)下顯著性水平Sig=0.08>0.05,表示兩個樣本的方差是齊性的,這表明獨立樣本t檢驗應用的第三個前提條件也是滿足的。因為方差是齊性的,由表1的第一行可得,顯著性水平Sig=0.101>0.05表明檢驗不顯著,即該學校高三年級四班和七班的成績沒有顯著差異。兩班的平均成績差異可能是由偶然的隨機因素造成的。我們通常認為的成績相差五六分就差異顯著是不科學的。因為影響學生成績的因素較多,不能簡單地比較考試成績平均分的高低,還需要判斷兩個班平均成績的差異是由偶然的隨機因素造成的,還是由平時的課堂教學效果造成的,亦或是教師的教學質(zhì)量引起的。
表1 獨立樣本t檢驗結果表
2.學校學業(yè)成績差異性比較
例2:對大連市某個區(qū)的四所學校某次物理考試成績進行差異顯著性檢驗,獨立樣本t檢驗分組統(tǒng)計表和結果表匯總在表2中。
表2 不同學校物理考試成績基本統(tǒng)計量和t檢驗相關結果
由表2第一組數(shù)據(jù)可知,編碼為18和19的兩所學校平均分相差1.754分。由獨立樣本t檢驗結果可知,校正t=1.763,校正自由度(df)=644.054,顯著性水平Sig=0.078>0.05,表明檢驗結果不顯著,兩所學校的中考物理成績沒有顯著差異。而由第二組數(shù)據(jù)可知,編碼為93和68的兩所學校平均分相差1.743分。校正t=2.345,校正自由度(df)=476.094,顯著性水平Sig=0.019<0.05,第二組的兩所學校的中考物理成績有顯著差異。由表2的數(shù)據(jù)可以看出,第一組的兩所學校和第二組的兩所學校同樣是平均分相差兩分,但第一組的兩所學校中考物理成績并沒有顯著性差異,而第二組的兩所學校中考物理成績卻有顯著性差異,第一組的兩所學校的成績差異可能是由偶然的隨機因素造成的,而第二組的兩所學校的成績差異可能受到諸如成績分布狀況的影響,單單比較兩個數(shù)值的大小是沒有意義的。
由以上的兩個例子可以看出,在評價學生的學業(yè)質(zhì)量狀況時,盡管平均分是一個非常重要的指標,而且比較起來也很直觀,但直接比較并不科學,我們應該借助于科學的統(tǒng)計方法,綜合考慮影響成績的諸多因素,來客觀地分析兩個平均分之間的差異。而不能僅憑感覺來對不同學校,不同班級的學生成績進行簡單排名。
[1]劉紅云.應用心理統(tǒng)計學[M].北京:北京師范大學出版社,2015:172-173.
[責任編輯:知然]
On Application of Independent Sample T Test in Quality Evaluation of Students'Academic Achievements
YANG Jian-qin
(Study Quality Monitoring Center,Dalian Education University,Dalian,116021,China)
This paper introduces a scientific test method for difference comparison and provides specific application cases.
independent sample t test;quality evaluation of academic achievements;difference comparison
G424.74
A
1008-388X(2016)02-0052-02
2016-01-18
楊建芹(1981-),女,山東臨沂人,小學高級教師。