羅杰 馮超
關(guān)鍵詞:教育質(zhì)量指數(shù);影響因素;PCA;BP神經(jīng)網(wǎng)絡;BPEQI
1引言
小學教育作為中國教育的組成部分,已被列入國家教育的重中之重[1]。保證小學教育的質(zhì)量,是實現(xiàn)“科教興國”戰(zhàn)略的基礎保障。2001年,在《國務院關(guān)于基礎教育改革與發(fā)展的決定》文件中提出,“改革考試評價和招生選拔制度”“建立對地區(qū)和學校實施素質(zhì)教育的評價機制”。由此可見,建立一套完善的小學教育質(zhì)量評價體系,量化教育質(zhì)量評價指數(shù),一直以來都是國家教育發(fā)展的戰(zhàn)略需求。
目前,國際教育指數(shù)體系主要包括3類:世界銀行發(fā)行的《世界發(fā)展報告》、聯(lián)合國教科文組織的教育指數(shù)體系、經(jīng)濟合作與發(fā)展組織的教育指數(shù)體系[2],這些指數(shù)體系過于寬泛,并且難以適用于不同地區(qū)的教育評價。針對不同地區(qū)情況和我國基本國情,適用的指數(shù)有人口文盲率、入學率、專任教師崗位合格率等。然而,分散而龐雜的指數(shù)體系難以給教育質(zhì)量直觀的評價,并且不同指數(shù)之間缺乏邏輯關(guān)系,難以建立理論框架。因此,一種基于經(jīng)濟學基尼系數(shù)的指數(shù)體系被應用到教育質(zhì)量評價中[3]。這種基于基尼系數(shù)的質(zhì)量評估局限于評價分配體系的公平程度,難以為小學教育質(zhì)量評價提供多角度的指數(shù)。
為了彌補上述小學教育質(zhì)量評價體系中的缺陷,本文綜合考慮不同地區(qū)小學校數(shù)、教學點數(shù)、班數(shù),學生數(shù)、教職工數(shù)、專任教師學歷情況、專任教師年齡結(jié)構(gòu)、圖書館數(shù)量等因素,提出了一種基于主成分分析(Principle Component Analysis)與BP神經(jīng)網(wǎng)絡(Backpropagation neural network)模型的量化指數(shù)PBEQI(Principle Component Analysis and Back propagationneural network Education Quality Index),來評價我國不同地區(qū)的小學教育質(zhì)量,為我國教育質(zhì)量評估提供新的理論框架與應用參考。
2影響因素相關(guān)性分析
影響小學教育質(zhì)量因素眾多,本文調(diào)研了全國31個省份的小學教育情況,考慮的影響因素主要有:小學招生數(shù)、各年級在校生數(shù)、小學學校數(shù)、教學點數(shù)、各年級班數(shù)、專任教師數(shù)、行政人員數(shù)、教輔人員數(shù)、工勤人員數(shù)、代課教師數(shù)、兼任教師數(shù)、教師學歷分布(研究生畢業(yè)、本科畢業(yè)、專科畢業(yè)、高中階段畢業(yè)、高中)、教師專業(yè)技術(shù)職務分布(中學高級、小學高級、小學一級、小學二級、小學三級、未定職級)、小學辦學條件(教室、實驗室、圖書館、微機室、體育館、教師辦公室、教工宿舍、學生宿舍、食堂、廁所)。
在眾多影響小學教育質(zhì)量的因素中,許多因素之間存在強烈的相關(guān)關(guān)系。圖1為統(tǒng)計了31個省份小學教室面積與實驗室面積的散點圖,圖中每個點對應一個省份,每個點對應的橫縱坐標分別表示該省份小學教室總面積與實驗室總面積,可以看出,所有的3 1個點均勻分布在黑色的直線附近,這表明小學教室面積(S1)與實驗室面積(S2)線性相關(guān),通過教室面積可以推算出實驗室面積,推算式為:
在統(tǒng)計學中,互相關(guān)矩陣與協(xié)方差矩陣能夠刻畫任意2種變量之間的關(guān)系。然而,影響小學教育質(zhì)量因素間的相關(guān)關(guān)系十分復雜,可能存在2種或3種因素的共同作用下,與另1種影響因素相關(guān)。例如,學生數(shù)與專任教師數(shù)二者共同作用下與教室面積相關(guān)。顯然,互相關(guān)系數(shù)或者互相關(guān)矩陣難以描述多種因素之間的相關(guān)性。在數(shù)據(jù)挖掘領域可用主成分分析(PCA)來分析不同影響因素之間的線性相關(guān)關(guān)系。利用PCA對影響小學教育質(zhì)量的因素進行降維,首先將31個省份的70種影響因素組合成待降維的矩陣,其次將其中心化(減去均值),并計算協(xié)方差矩陣,然后對協(xié)方差矩陣進行特征分解,得到特征向量,最后取特征向量前若干行組成降維后的矩陣,以保留95%的信息。實驗表明,通過對影響小學教育質(zhì)量的因素利用PCA進行降維,包含有70種影響因素的數(shù)據(jù)降維到6維,并且這6維保留全部信息的95%,這6種新“構(gòu)造”出來的影響因素并非原來的影響因素,而是70種影響因素的線性組合。換言之,大量的影響因素是線性相關(guān)的,這也符合最初對影響因素之間高相關(guān)性的推斷。
3評價指數(shù)建立
由第2節(jié)可以得到剔除冗余后所構(gòu)造出的6種新的影響因素,這6種影響因素將用于評價指數(shù)的建立??v觀文獻,評價指數(shù)的提出往往是給不同影響因素分配不同權(quán)重,重要的影響因素分配大的權(quán)重,這種分配方式本質(zhì)上是一種線性模型的理念。然而,實際的教育質(zhì)量評估系統(tǒng)十分復雜,利用線性模型顯然難以刻畫出影響因素與教育質(zhì)量之間的關(guān)系。因此,利用非線性模型來構(gòu)建小學教育評價指數(shù)體系,有著非常堅實的理論依據(jù)與實際價值。在機器學習領域,最經(jīng)典的非線性模型是BP神經(jīng)網(wǎng)絡。對于BP網(wǎng)絡,首先需要利用訓練數(shù)據(jù)訓練網(wǎng)絡,得到模型的各個參數(shù):然后利用測試數(shù)據(jù)對模型進行測試;如果測試精度達標,最后就可以利用訓練好的模型進行預測,得出小學教育質(zhì)量評價指數(shù)。在教育質(zhì)量評價指數(shù)體系構(gòu)建中.BP網(wǎng)絡的輸人為PCA降維后的6種影響因素的值,輸出為評價指數(shù)。為了獲取訓練數(shù)據(jù)中的基準評價指數(shù),可以參考文獻[4]。表1列出了教育質(zhì)量最好的前3個省份教育質(zhì)量指數(shù)與本文預測教育質(zhì)量指數(shù)PBEQI。
根據(jù)表1可知,前3個省份的教育質(zhì)量指數(shù)預測效果較好,所構(gòu)建的PBEQI指數(shù)能夠較好地刻畫地區(qū)的小學教育質(zhì)量。
4結(jié)束語
本文研究小學教育質(zhì)量指數(shù)框架的構(gòu)建,并提出了一種新型的指數(shù)PBEQI。影響小學教育質(zhì)量的70種因素從中國教育部網(wǎng)站獲取,通過PCA降維得到保留原數(shù)據(jù)95%信息的新的影響因素;將降維后的因素輸入到BP神經(jīng)網(wǎng)絡中進行訓練,得到最優(yōu)的網(wǎng)絡模型,并通過測試驗證了模型的準確性,最終構(gòu)建出一套完整的小學教育質(zhì)量指數(shù)體系框架。該框架能夠很好地應用到不同地區(qū)的小學教育質(zhì)量評價中,對于中等教育和高等教育的教育質(zhì)量評價,同樣有借鑒意義。