郭蘭蘭 付政慶 衣秋杰
摘? 要:多元統(tǒng)計(jì)分析是統(tǒng)計(jì)學(xué)中的一個(gè)主成分分析法在學(xué)生成績分析與評(píng)價(jià)中的應(yīng)用重要分支,其在教育教學(xué)中的應(yīng)用較少,卻已被證實(shí)具有良好的效果。文章的研究是采用主成分分析的方法,對(duì)某高校學(xué)生專業(yè)成績進(jìn)行系統(tǒng)綜合分析,在成績平均分的基礎(chǔ)上做進(jìn)一步評(píng)價(jià)和分類。利用主成分分析法對(duì)綜合評(píng)價(jià)后的學(xué)生進(jìn)行分類,不但對(duì)綜合信息有宏觀的了解,還能夠進(jìn)一步分析信息的背景,為教育過程中的決策活動(dòng)提供更準(zhǔn)確信息。
關(guān)鍵詞:成績;主成分分析;SPSS
中圖分類號(hào):G642? ? ? ?文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2096-000X(2021)03-0088-04
Abstract: Multivariate statistical analysis is an important branch of Statistics.It has less application in education and teaching, but it has been proven to have good results. Principal component analysis is an important method in multivariate statistical analysis. The purpose of this study is to use a principal component analysis method to systematically analyze student achievement and further evaluate and classify students' scores on the basis of average scores. Using principal component analysis to classify students after comprehensive evaluation, not only has a macro understanding of the comprehensive information, but also can further analyze the background of the information and provide more accurate information for decision-making activities in the education process.
Keywords: achievement; principal component analysis; SPSS
引言
在高等教育教學(xué)過程中,教學(xué)與考試都是非常重要且相互聯(lián)系不可分割的,考試本身也可以看做一種教學(xué)活動(dòng)[1]。各個(gè)高校都非常重視使用考試手段對(duì)教育質(zhì)量進(jìn)行檢測和監(jiān)控,規(guī)范和引導(dǎo)教師的教學(xué)行為;激勵(lì)學(xué)生努力地學(xué)習(xí)、培養(yǎng)他們分析問題和解決問題的能力[2]。因此,考試成績是能夠體現(xiàn)學(xué)生在校學(xué)習(xí)情況的主要因素。而對(duì)于階段性的評(píng)價(jià),經(jīng)過分析后得到一些對(duì)以后非常有用的信息,所以對(duì)學(xué)生成績進(jìn)行分析評(píng)價(jià)有著重要的意義[3]。采用多元統(tǒng)計(jì)分析的方法對(duì)這些信息認(rèn)真研究,可以充分挖掘考試結(jié)果的數(shù)據(jù),得到隱藏在學(xué)生考試成績中的有用信息,為提高教學(xué)質(zhì)量提供重要的依據(jù)[4]。本文中,運(yùn)用主成分分析法對(duì)某高校數(shù)學(xué)專業(yè)學(xué)生的成績進(jìn)行深入分析,得到了影響學(xué)生成績的幾個(gè)關(guān)鍵因素,并在此基礎(chǔ)上對(duì)學(xué)生的學(xué)習(xí)特點(diǎn)進(jìn)行了深入研究。
一、統(tǒng)計(jì)分析方法
在對(duì)實(shí)際問題的研究過程中,影響因素往往不止一個(gè),為了更加全面系統(tǒng),通常這些因素都要考慮,這些因素即為研究的指標(biāo)[5]。每個(gè)指標(biāo)或者因素都可以不同程度上反映問題的某些信息,這導(dǎo)致所反映的信息就會(huì)產(chǎn)生一定的重合,即各個(gè)原始指標(biāo)之間往往會(huì)有一定的相關(guān)性。采用統(tǒng)計(jì)方法分析多指標(biāo)問題時(shí),指標(biāo)個(gè)數(shù)太多使問題的復(fù)雜程度大大增加。在研究實(shí)際問題時(shí),盡量通過較少的指標(biāo)反映問題盡量多的信息[6]。
主成分分析法的基本思想為:對(duì)問題的原始指標(biāo)做線性組合形成綜合指標(biāo),按方差大小進(jìn)行排序,選取前幾個(gè)綜合指標(biāo),依次定義為第一、第二、第三主成分等等。這些主成分間是線性無關(guān)的。這樣處理,既能降低問題的復(fù)雜度,又能從原始數(shù)據(jù)中進(jìn)一步挖掘?qū)嶋H問題的某些新信息[7-8]。
在實(shí)際問題中,為了降低分析的難度,提高分析效率,通常不直接對(duì)原始指標(biāo)(p個(gè))構(gòu)成的隨機(jī)向量x=(x1,x2,…,xp)進(jìn)行分析,而是先對(duì)向量做線性變換,把原來的隨機(jī)向量變換成新的綜合變量y1,y2,…,yp。變量y1,y2,…,yp之間相互獨(dú)立,并且其方差依次遞減。下面用兩個(gè)向量對(duì)問題進(jìn)行說明,考慮通過線性變換,將x1,x2進(jìn)行線性組合,得到兩個(gè)新的變量y1,y2。從幾何角度來看,就是將坐標(biāo)系逆時(shí)針旋轉(zhuǎn)?茲角度,得到新坐標(biāo)軸y1和y2,具體坐標(biāo)旋轉(zhuǎn)公式如下[9]
式中,U為旋轉(zhuǎn)變換矩陣,由(1)可知它是正交陣,即滿足式(2):
(2)
經(jīng)過這樣的旋轉(zhuǎn)之后,樣品點(diǎn)在y1軸上的離散程度最大,變量y1代表的原始數(shù)據(jù)的信息是最多的。同理,可以得到y(tǒng)2,取定一個(gè)閾值,當(dāng)小于這個(gè)閾值時(shí),可認(rèn)為y2所包含信息可以忽略不計(jì),這樣就達(dá)到了降維的目的。
二、算法的設(shè)計(jì)和實(shí)現(xiàn)
從相關(guān)系數(shù)矩陣開始,求解主成分的步驟:
(1)標(biāo)準(zhǔn)化各觀測變量數(shù)據(jù)。
(2)求各觀測變量標(biāo)準(zhǔn)化后的相關(guān)系數(shù)矩陣。
(3)根據(jù)矩陣知識(shí)|?籽-?姿I|=0求解相關(guān)系數(shù)矩陣的特征根。
(4)求解各特征根對(duì)應(yīng)的特征向量?籽?滋i=?姿i?滋i。
其中,第一主成分的系數(shù)向量為最大特征值對(duì)應(yīng)的特征向量;第二主成分的系數(shù)向量為第二大特征值對(duì)應(yīng)的特征向量,同理可以得到其他系數(shù)。
三、實(shí)驗(yàn)及分析
數(shù)據(jù)為高校數(shù)學(xué)學(xué)院本科數(shù)學(xué)系2013級(jí)1班30名畢業(yè)生的12門課程的考試成績。原始數(shù)據(jù)來自班級(jí)成績表,即學(xué)生考試成績。將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化并計(jì)算相關(guān)矩陣得到(如表1)。
由輸出結(jié)果的相關(guān)矩陣可以看出,此高校12門課程之間存在顯著相關(guān)性,由此,可以采用主成分分析的方法進(jìn)一步研究(如表2)。
由輸出結(jié)果公因子方差看出,表2中最后一列的數(shù)據(jù)除數(shù)學(xué)專題討論在55.4%之外,其他都在70%~90%之間,表明提取的主成分對(duì)每個(gè)變量的解釋程度都很高。
碎石圖是將特征根按從大到小排列而成的折線圖。前四個(gè)特征根變化明顯,從第五個(gè)特征根開始變得比較平緩,所以本文提取4個(gè)主成分。
由輸出結(jié)果圖的總方差可以得到,前4個(gè)主成分y1,y2,y3,y4的方差之和占總方差的比例達(dá)到了76.584%。所以,前四個(gè)主成分就可以基本保留了原來指標(biāo)的信息,這樣以來,就由原來的12個(gè)減少為4個(gè)新指標(biāo),從而起到了降維的作用(如表3)。
成分矩陣得到的數(shù)值為主成分與原始變量之間的相關(guān)系數(shù),相關(guān)系數(shù)絕對(duì)值的大小代表了相關(guān)程度,可以由此數(shù)據(jù)得到每一個(gè)主成分所代表的原始變量的信息,在此基礎(chǔ)上對(duì)主成分進(jìn)行命名。本實(shí)驗(yàn)中,第一主成分幾乎涵蓋了所有原始變量,命名為“學(xué)生的出勤率”,第二主成分涵蓋了概率論與數(shù)理統(tǒng)計(jì),隨機(jī)過程,數(shù)學(xué)專題討論和拓?fù)鋵W(xué)四個(gè)變量,可以命名為“數(shù)學(xué)專業(yè)課”,第三個(gè)主成分主要涵蓋了數(shù)據(jù)庫原理,數(shù)理方程,現(xiàn)代數(shù)學(xué)和操作系統(tǒng)四個(gè)變量,可以命名為“計(jì)算機(jī)應(yīng)用課”,第四個(gè)主成分主要涵蓋數(shù)學(xué)模型,組合數(shù)學(xué),數(shù)值分析和離散數(shù)學(xué)四個(gè)變量,可以命名為“數(shù)學(xué)基礎(chǔ)課”。
由上表中成分得分系數(shù)矩陣可以得到主成分表達(dá)式。標(biāo)準(zhǔn)化后的原始變量記為zx1,zx2,zx3,zx4,zx5,zx6,zx7,zx8,zx9,zx10,zx11,zx12,本實(shí)驗(yàn)得到的4個(gè)主成分記為f1,f2,f3,f4,主成分表達(dá)式如下:
由表格可看出:
(1)學(xué)號(hào)4,7,9,10,17,30的同學(xué)成績?yōu)閮?yōu)秀;
(2)學(xué)號(hào)1,2,14,15,19,20,21,22,23的同學(xué)成績?yōu)榱己?
(3)學(xué)號(hào)3,5,6,8,11,12,13,16,18,24,25,26,27,28,
29的同學(xué)成績較差。
從表4可以得到,經(jīng)過主成分分析后,新得到的綜合排名與原來按照平均分進(jìn)行排名基本相符,但對(duì)于個(gè)別同學(xué)來說,排名也存在變化。如17號(hào)同學(xué)按平均分排名為第8,主成分分析后,綜合得分排名為第3。該同學(xué)在前三個(gè)主成分上得分均為正,所以綜合得分較高。在計(jì)算機(jī)相關(guān)課程這個(gè)成分方面,得分尤其高,說明該同學(xué)可以考慮從事計(jì)算機(jī)相關(guān)的工作。
所以,根據(jù)各主成分的綜合得分進(jìn)行排名,可以更加全面的學(xué)生情況,而且了解學(xué)生的優(yōu)勢??梢杂嗅槍?duì)性地指導(dǎo)學(xué)生,達(dá)到揚(yáng)長避短的效果。
四、結(jié)論
將主成分分析的思想和方法用到學(xué)生成績的評(píng)價(jià)中,采用實(shí)際數(shù)據(jù),得到第一主成分為“學(xué)生的出勤率”,反映了學(xué)生對(duì)學(xué)習(xí)重要性的認(rèn)同程度。第二主成分為“數(shù)學(xué)專業(yè)課”,反映了數(shù)學(xué)專業(yè)自身特點(diǎn)而與其他專業(yè)有所區(qū)別。第三主成分為“計(jì)算機(jī)應(yīng)用課”,反映了實(shí)際應(yīng)用能力。第四主成分為“數(shù)學(xué)基礎(chǔ)課”,反映了數(shù)學(xué)專業(yè)的基礎(chǔ)學(xué)科起到主導(dǎo)作用,反映了學(xué)生學(xué)習(xí)數(shù)學(xué)的能力。
采用多元統(tǒng)計(jì)分析的方法來評(píng)價(jià)學(xué)生的成績,而不是單一的依據(jù)分?jǐn)?shù)。綜合權(quán)衡學(xué)生在4個(gè)主成分上的得分情況來進(jìn)行排名,更加公正客觀的掌握學(xué)生專業(yè)知識(shí)的掌握情況,進(jìn)而有針對(duì)性的指導(dǎo)學(xué)生的專業(yè)學(xué)習(xí)。
參考文獻(xiàn):
[1]何曉群.多元統(tǒng)計(jì)分析[M].北京:中國人民大學(xué)出版社,2012.
[2]吳海英,張杰.學(xué)生成績排名的綜合評(píng)價(jià)模型[J].大學(xué)數(shù)學(xué),2006,22(4):142-145.
[3]楊淑菊.主成分分析法在學(xué)生成績?cè)u(píng)價(jià)中的應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2012(16):103-112.
[4]王吉權(quán),邱立春,王英,等.主成分分析法在高校學(xué)生質(zhì)量綜合評(píng)價(jià)中的應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2010(13):25-31.
[5]劉慶曉,楊平華.統(tǒng)計(jì)方法在學(xué)生成績綜合評(píng)價(jià)上的應(yīng)用[J].統(tǒng)計(jì)與管理,2016(6):19-20.
[6]胡蓉,李澤妤,牟唯嫣.主成分分析在教學(xué)質(zhì)量分析中的應(yīng)用[J].統(tǒng)計(jì)學(xué)與應(yīng)用,2018,7(2):263-270.
[7]孫果,馬艷英.主成分分析在大學(xué)生成績中的研究與應(yīng)用[J].吉林工程技術(shù)師范學(xué)院學(xué)報(bào),2017,33(6):96-98.
[8]王劍宇,湯鳳香.基于排名的變量型主成分分析法在學(xué)生綜合成績?cè)u(píng)價(jià)中的應(yīng)用[J].佳木斯大學(xué)學(xué)報(bào)(自然科學(xué)版),
2018,36(5):777-780.
[9]謝威,陳聰,李淑鳳.主成分分析在大學(xué)生綜合能力評(píng)價(jià)中的應(yīng)用[J].牡丹江師范學(xué)院學(xué)報(bào)(自然科學(xué)版),2015(2):16-18.