錢永江
摘要衡量一所學(xué)校教學(xué)質(zhì)量在區(qū)域中的比重,僅僅依靠平均分、錄取率、排名占比等系列指標(biāo),往往帶有一定的片面性,學(xué)生起始基礎(chǔ)水平的不平衡因素等不可忽略,兩配對樣本的非參數(shù)檢驗、兩樣本T檢驗等兩種評價方式能夠客觀反映出學(xué)校教學(xué)質(zhì)量的對比變化,可以很好地反映一段時期學(xué)校的教學(xué)水平,有利于教育管理者科學(xué)評價學(xué)校教學(xué)質(zhì)量。
關(guān)鍵詞 教學(xué)水平 教學(xué)質(zhì)量 配對檢驗 非參數(shù)檢驗
中圖分類號:G424文獻(xiàn)標(biāo)識碼:ADOI:10.16400/j.cnki.kjdk.2021.16.047
ComparativeEvaluationofTeachingQualityinPrimaryandSecondarySchools
QIAN Yongjiang
(Sucheng Teachers Development Center, Suqian, Jiangsu 223800)
AbstractTo measure a school teaching quality in the area, just rely on average, acceptance rate,and ranking of series of indicators, often with a certain one-sidedness, students start foundation level imbalance factors cannot be ignored, two matching samples of nonparametric test,two sample T test and other two kinds of evaluation method can objectively reflect the contrast changesin thequality of schoolteaching, it can wellreflecttheteachinglevel of aschool inaperiod oftimeand is conduciveto the scientific evaluation ofschool teachingqualitybyeducationaladministrators.
Keywordsteaching level; teaching quality; paired test; nonparametric test
0引言
教學(xué)質(zhì)量是衡量學(xué)校辦學(xué)水平的一個重要指標(biāo),如何評價一個學(xué)校的教學(xué)質(zhì)量、衡量學(xué)校教學(xué)質(zhì)量在區(qū)域中的水平位次顯得尤為重要。以往的研究成果,往往注重闡述如何提升教學(xué)質(zhì)量,而如何評價教學(xué)質(zhì)量的研究成果相對較少。實際中,高考一本達(dá)線人數(shù)、錄取率、四星級中學(xué)達(dá)線人數(shù)、平均分、排名前100名學(xué)生占比等等,這些指標(biāo)常常被一些學(xué)校、甚至一些教育管理部門用來展示、評價、考核學(xué)校的教學(xué)質(zhì)量。事實上,這些指標(biāo)是往往是片面的,因為一些學(xué)校常常存在提前招生、優(yōu)生選拔等情況,一部分家庭經(jīng)濟(jì)條件相對優(yōu)越、基礎(chǔ)水平及學(xué)習(xí)習(xí)慣相對較好的學(xué)生,也往往選擇教學(xué)質(zhì)量相對“較好”的學(xué)校就讀。一般情況下,基礎(chǔ)較好的學(xué)生經(jīng)過一段時間的學(xué)習(xí),理論上都能取得較好的成績。這些“優(yōu)秀”的學(xué)生常常在平均分、排名等情況下提前占據(jù)先發(fā)優(yōu)勢,倘若不排除此類干擾因素的影響,不能正確評價不同學(xué)校的辦學(xué)水平,不能發(fā)出正確的評價導(dǎo)向,對學(xué)校整體教學(xué)質(zhì)量的評價就只能淪為對個別“優(yōu)秀”學(xué)生的教學(xué)質(zhì)量的評價,因此客觀真實評價學(xué)校的教學(xué)質(zhì)量顯得很有必要。杜治漢[1]雖然提出了兩種教學(xué)質(zhì)量評價方法,但沒有解決有干擾因素下如何實現(xiàn)客觀的教學(xué)質(zhì)量評價。本文借鑒張[2]的假設(shè)檢驗的思想,提出兩種種客觀的教學(xué)質(zhì)量評價方法,即兩配對樣本的非參數(shù)檢驗評價和兩樣本T檢驗評價,以便很好的處理“相關(guān)因素”的干擾,能夠真實客觀比較學(xué)校教學(xué)質(zhì)量的差異情況,發(fā)出正確的教學(xué)質(zhì)量評價導(dǎo)向,良性促進(jìn)區(qū)域?qū)W校教學(xué)質(zhì)量的提高。
1兩配對樣本的非參數(shù)檢驗在教學(xué)質(zhì)量對比中的實際應(yīng)用
1.1基本思想
比如甲乙兩所初中學(xué)校,甲學(xué)校初一入學(xué)時有所選拔,正常的話,甲學(xué)校的歷年平均分、三年后四星級高中達(dá)線人數(shù)一般會高于沒有選拔的乙學(xué)校,但這不能說明甲學(xué)校的教學(xué)質(zhì)量好于乙學(xué)校的,有些時候兩所學(xué)校的教學(xué)質(zhì)量與顯現(xiàn)的結(jié)果反而相反,乙學(xué)校的教學(xué)質(zhì)量反而高于甲學(xué)校的教學(xué)質(zhì)量。如果學(xué)校有選拔的學(xué)生,同等教學(xué)質(zhì)量下,這部分學(xué)生的干擾因素應(yīng)與剔除,當(dāng)然剔除不是刪掉,基礎(chǔ)好,正常情況下應(yīng)該一直保持,當(dāng)然不排除個例。對于一所學(xué)校,倘若所有的初一新生按基礎(chǔ)成績(如語數(shù)外的綜合成績)的高低排一隊,自然,這所學(xué)校的學(xué)生名次靠前的肯定會多一些,假如這所學(xué)校與其他學(xué)校的教學(xué)質(zhì)量水平基本一樣,總體上,三年后再次考試摸底,若重新再排一次隊,這所學(xué)校名次的大致排序不應(yīng)有大的出入,倘若這所學(xué)校的教學(xué)質(zhì)量明顯高于其他學(xué)校,重排的隊伍里,這所學(xué)校將有更多的學(xué)生名次靠前,打亂原有的排隊順序;反之若這所學(xué)校的教學(xué)水平明顯低于其他學(xué)校,打亂原有的排隊順序,重排的隊伍里,這所學(xué)校將有更多的學(xué)生名次后退。排除干擾因素,從名次的排隊順序變化里挖掘信息,找到可以量化的統(tǒng)計量,以此正確評估這所學(xué)校在區(qū)域內(nèi)的教學(xué)質(zhì)量水平是否提升情況,兩配對樣本的非參數(shù)檢驗可以很好的解決此類問題。
1.2基本知識
要研究一所學(xué)校一段時期前后的教學(xué)質(zhì)量變化情況,在教學(xué)成績分布不太清楚的情況下,可以通過兩配對樣本的符號秩檢驗進(jìn)行分析,以此判斷分析這所學(xué)校一段時期前后的教學(xué)成績的分布是否存在顯著差異。例如要研究三年前后教學(xué)成績在區(qū)域內(nèi)排名情況,可以收集學(xué)校教學(xué)三年前后的成績及排名情況,這樣便得到兩個配對的教學(xué)成績。
1.3實際應(yīng)用
收集初中階段學(xué)校甲學(xué)校新初一年級的學(xué)生入學(xué)成績,學(xué)生成績可以是小學(xué)六年級畢業(yè)時的考試成績,也可以是統(tǒng)一的摸底監(jiān)測成績,記做初始成績,同時跟蹤觀測三年后的學(xué)習(xí)成績,記作最終成績,當(dāng)然最終成績也可以是一年后或某一時期后的成績,此時的評價結(jié)果將為此評價時期的結(jié)果。記下初始成績中甲學(xué)校的學(xué)生成績在區(qū)域內(nèi)學(xué)生成績中降序排序號,同時記錄最終成績中甲的學(xué)生成績在區(qū)域?qū)W生成績中降序排序號,以相同學(xué)生名單為關(guān)鍵字,初始成績排名(降序)序號在前,最終成績排名(降序)序號在后,建立配對數(shù)據(jù)庫。后列與前列做差,然后取絕對值升序排序,可得相應(yīng)差值的秩。利用SPSS[3]統(tǒng)計軟件,依次點擊確認(rèn)“分析-非參數(shù)檢驗—舊對話框-2個相關(guān)樣本”,可得秩表1和檢驗統(tǒng)計量表2。
由表1知,甲學(xué)校共415名學(xué)生參與配對檢驗,最終成績排名低于起始成績排名的學(xué)生有242個,秩平均值211.48,起始成績排名低于最終成績排名的學(xué)生有172個,秩平均值201.9,未變化的學(xué)生1名。
由表2知,檢驗統(tǒng)計量Z的觀測值為-3.377,對應(yīng)的概率值為0.001,若選擇顯著性水平為0.05,顯然0.001遠(yuǎn)遠(yuǎn)小于0.05,因此拒絕原假設(shè),認(rèn)為甲學(xué)校的教學(xué)水平發(fā)生顯著變化。由于負(fù)秩的平均值201.90小于正秩的平均值211.48,負(fù)秩的總和34726小于正秩的總和51179,因此有理由認(rèn)為,甲的最終成績排名明顯低于起始成績排名,學(xué)校的教學(xué)水平在區(qū)域內(nèi)呈下降態(tài)勢。
2抽樣對比檢驗在教學(xué)質(zhì)量評價對比中的應(yīng)用
2.1基本思想
甲乙兩所初中學(xué)校,三年前各招收一批學(xué)生,兩所學(xué)校都按各自施教區(qū)招生,在沒有確定的分析前,兩所學(xué)校的學(xué)生基礎(chǔ)水平是否一樣需要分析確定;事實上,很多家長常常選擇購買“較好學(xué)?!敝苓叺男^(qū)住房,此種情況下兩所學(xué)校的學(xué)生入學(xué)基礎(chǔ)水平一般會有所不同。另外,也存在一所學(xué)校存在提前招收“優(yōu)質(zhì)”學(xué)生、另一所學(xué)校進(jìn)行提前“選拔”等情況;主觀上,自然認(rèn)為兩所學(xué)校的學(xué)生基礎(chǔ)水平有所不同。如何選擇一種客觀公正的教學(xué)質(zhì)量評價辦法,排除干擾因素,比較兩所學(xué)校辦學(xué)水平的差距,顯得非常重要。一般情況下,兩所學(xué)??沙闃舆x取部分大體相當(dāng)?shù)膶W(xué)生,跟蹤調(diào)查,三年后可比較這些具有相同起點的學(xué)生的最終成績,進(jìn)而判斷兩所學(xué)校在這三年內(nèi)的辦學(xué)水平情況;因為只有基礎(chǔ)起點相同的學(xué)生做比較,才有可比性,才能以最終成績作為評判兩所學(xué)校的教學(xué)質(zhì)量水平高低的依據(jù)。合理的處理方法:第一步,兩所學(xué)校初一新生入學(xué)時,不妨以六年級的學(xué)生畢業(yè)考試成績?yōu)榛A(chǔ),或者是初一入學(xué)時區(qū)域內(nèi)一次監(jiān)測考試成績?yōu)榛A(chǔ),各從甲、乙兩所學(xué)校的學(xué)生成績中,隨機(jī)抽取一定比例的樣本,比方說從甲學(xué)校選取150名學(xué)生的監(jiān)測成績,從乙選取180名學(xué)生的監(jiān)測成績,兩部分學(xué)生成績做兩獨立樣本的T檢驗,以此確定兩樣本的均值是否存在顯著差異,倘若不存在顯著差異,即認(rèn)為從甲乙兩所學(xué)校各抽取的學(xué)生的基礎(chǔ)水平相當(dāng)、起點相同,然后以150名及180名學(xué)生為觀測樣本對象,三年后中考時或者一段時間后,再取得這兩部分學(xué)生的成績,研究判斷其是否存在顯著差異,進(jìn)而比較這個時期內(nèi)兩所學(xué)校的教學(xué)質(zhì)量水平的高低,對學(xué)校的辦學(xué)水平作出評價。評價哪個時期、如何選取,通常根據(jù)便利原則選取即可,但必須收集到一段時期前后初試、最終的兩次成績。最終成績確定時,繼續(xù)對這兩批學(xué)生成績做兩獨立樣本的T檢驗,可以判斷兩所學(xué)校的教學(xué)成績是否存在顯著差異,當(dāng)然這就需要借助數(shù)理統(tǒng)計中樣本選取及兩樣本T檢驗的知識。
2.2兩樣本T檢驗及樣本選取
學(xué)生成績選取:學(xué)生成績選取就是根據(jù)分析的需要,從已有的學(xué)生成績數(shù)據(jù)庫中隨機(jī)選取一部分?jǐn)?shù)據(jù)參與分析,SPSS統(tǒng)計軟件可以實現(xiàn)隨機(jī)選取、設(shè)定條件選取、精確選取等任意一種方式。若采用隨機(jī)選取模式,則可選取一定比例的學(xué)生成績進(jìn)行研究,若所選成績符合要求,則所選學(xué)生可作為監(jiān)測對象,后續(xù)這部分學(xué)生的相應(yīng)成績作為最終目標(biāo)樣本。若隨機(jī)選取方式中所選取的學(xué)生成績較難符合要求,此時可設(shè)定條件方式選取符合達(dá)標(biāo)的樣本,比方說兩所學(xué)校各分別選取150名、180名學(xué)生成績在200分-260分之間的學(xué)生。具體基本操作步驟為:第一,SPSS中選擇菜單“數(shù)據(jù)+選擇個案”;第二,選擇“隨機(jī)個案樣本”確定個數(shù)。如果一開始想排除較高成績以及較低成績的影響,可以選擇“如果條件滿足”,例如輸入“成績》=200 and成績《=260”點擊確定即可,這樣操作可以使選中的學(xué)生成績范圍基本鎖定在固定的范圍內(nèi)。如果符合此條件學(xué)生的人數(shù)較多,可以重復(fù)第二步操作選取一定數(shù)量樣本;如果接下來通過所做的兩所學(xué)校教學(xué)成績的T檢驗實驗數(shù)據(jù)不滿足要求,可以重新選取兩所學(xué)校的學(xué)生成績。
2.3實際應(yīng)用
初一入學(xué)時,甲學(xué)校有415名學(xué)生,乙學(xué)校有307名學(xué)生。兩所學(xué)校的所有學(xué)生入學(xué)成績各單獨存放一個文件。利用SPSS隨機(jī)選取,首先選取甲學(xué)校40%的學(xué)生成績175個,選取乙學(xué)校60%的學(xué)生成績的185個。此時甲乙兩學(xué)校的學(xué)生成績以分組、成績兩個變量組成一個文件數(shù)據(jù)。利用SPSS[3]統(tǒng)計軟件,依次進(jìn)行“分析-比較均值—獨立樣本T檢驗”,將變量“成績”送到選擇的檢驗變量窗口中,點擊確認(rèn)即可,此時SPSS會自動計算F統(tǒng)計量,并計算在總體方差相等和不相等下的T統(tǒng)計量的觀測值以及各自的雙尾概率P的值,得到如下組統(tǒng)計表3和獨立樣本檢驗表4。
由表3知,甲學(xué)校的平均值為265.569,標(biāo)準(zhǔn)差為25.8469,乙學(xué)校的平均值為229.743,標(biāo)準(zhǔn)差為3.5473。
由表4知,F(xiàn)檢驗統(tǒng)計量為36.636,概率P值為0.000,若選擇顯著性水平為0.05,顯然0.000遠(yuǎn)遠(yuǎn)小于0.05,因此拒絕原假設(shè),認(rèn)為甲學(xué)校的教學(xué)水平與乙學(xué)校的教學(xué)成績總體方差有顯著差距,此時應(yīng)看表4的第二行T的檢驗結(jié)果,由于T的觀測值為-8.846,概率P值為0.000,若選擇顯著性水平為0.05,顯然0.000小于0.05,因此拒絕原假設(shè),認(rèn)為甲學(xué)校的教學(xué)水平與乙學(xué)校教學(xué)水平的平均值有顯著差距。鑒于所選的樣本存在明顯差距,因此上述所選甲學(xué)校的175名學(xué)生成績與乙學(xué)校的185名學(xué)生成績不在同一檔次,不應(yīng)認(rèn)為具有相同的起點,選擇這些學(xué)生作為監(jiān)測對象不符合要求,需重新選取。這時可重復(fù)操作選取一次樣本,若不符合要求,可改為設(shè)定條件方式選取符合要求的樣本,不再重復(fù)。若樣本符合要求,相應(yīng)學(xué)生可作為監(jiān)測對象,其后續(xù)的監(jiān)測最終學(xué)習(xí)成績可以作為衡量教學(xué)水平差異的有效樣本。正如剛才兩獨立樣本T檢驗操作,只要對所得最終成績的新樣本做SPSS統(tǒng)計分析,即依次點擊“分析-比較均值—獨立樣本T檢驗”,做兩獨立樣本的T檢驗即可,如上述表4分析,可以比較兩所學(xué)校教學(xué)質(zhì)量水平是否存在顯著性差異。
2.4說明
評價甲乙兩所學(xué)校教學(xué)水平的高低,一開始可以選取兩所學(xué)校各一部分學(xué)生,總體均值上若無顯著差異,說明選擇的兩部分學(xué)生基礎(chǔ)基本在同一個檔次,這些學(xué)生可以作為跟蹤調(diào)對象,一段時間的學(xué)習(xí)后,可以獲得相應(yīng)學(xué)校相應(yīng)學(xué)生的監(jiān)測成績,對這些成績進(jìn)行兩獨立樣本的T檢驗,若顯著性概率小于給定的水平0.05,說明這段時間的教學(xué),兩學(xué)校存在顯著差距,若甲的平均值高于乙的,則說明甲的教學(xué)質(zhì)量明顯好于乙的教學(xué)質(zhì)量;反之若乙的平均值高于甲的,則說明乙的教學(xué)質(zhì)量明顯好于甲的教學(xué)質(zhì)量。需要說明的是,如果一開始,甲的學(xué)生基礎(chǔ)水平就遠(yuǎn)遠(yuǎn)高于乙的基礎(chǔ)水平,此種情況的結(jié)果往往是無法找到起始成績相同的兩批學(xué)生,因為生源大不同,甲乙兩學(xué)校沒有可比性;另外,本文中是假設(shè)兩樣本的學(xué)習(xí)成績都是服從正態(tài)分布為基礎(chǔ)的,事實上也大都服從正態(tài)分布,倘若認(rèn)為此種假設(shè)分布沒有經(jīng)過論證,也可采用兩獨立樣本的非參數(shù)檢驗代替兩獨立樣本的T檢驗,檢驗效果基本一致。
3結(jié)論應(yīng)用
利用兩種方式的對比評價,可以摒棄平均分、錄取率、排名占比等系列指標(biāo)的片面性,可以將基礎(chǔ)水平不同的學(xué)生都納進(jìn)監(jiān)測范圍,不但不會影響對學(xué)校教學(xué)水平的客觀評價,反而更加客觀反映出學(xué)校教學(xué)水平在區(qū)域內(nèi)的比重,更好地反映出學(xué)校教學(xué)水平在總體中的變化情況,有利于教育管理者科學(xué)評價學(xué)校教學(xué)水平。這一評判方法可以用于集團(tuán)化辦學(xué)中某一集團(tuán)整體辦學(xué)水平在某年度或某時間段的整體變化情況,有利于評判各集團(tuán)的進(jìn)步與否情況,進(jìn)而及時調(diào)整施策,提高集團(tuán)化辦學(xué)整體水平;另外此方法還應(yīng)用于分析各班級在一定時間段內(nèi)的教學(xué)水平的總體變化情況。
宿遷市中小學(xué)教學(xué)研究微型課題SQWK2020-128
參考文獻(xiàn)
[1]杜治漢.中小學(xué)教師教學(xué)質(zhì)量評價方法研究[J],軟件導(dǎo)刊(教育技術(shù)),2013(5):51-53.
[2]張曉華.探析假設(shè)檢驗在高校英語教學(xué)改革中的應(yīng)用[J],常州信息職業(yè)技術(shù)學(xué)院學(xué)報,2013(1):49-51,60.
[3]薛薇.SPSS統(tǒng)計分析方法及應(yīng)用(第4版)[M].北京:電子工業(yè)出版社,2017:158-164,97-105.