郝佳睿(廣東食品藥品職業(yè)學(xué)院,廣州 510520)
?
主成分分析在計算機(jī)模塊教學(xué)評價中的應(yīng)用
郝佳睿
(廣東食品藥品職業(yè)學(xué)院,廣州510520)
摘要:
關(guān)鍵詞:
考試是教學(xué)工作中的一個重要環(huán)節(jié),也是衡量學(xué)生學(xué)習(xí)水平和教師教學(xué)水平的重要手段和方法。但目前大部分教師對學(xué)生考試成績?nèi)鄙僬J(rèn)真的研究,考試成績上報教務(wù)處系統(tǒng)就等于考試工作的結(jié)束,沒有進(jìn)行或只是粗略地進(jìn)行考試分析,而未真正進(jìn)行客觀的分析和評價。針對這種情況,我們嘗試對學(xué)院《計算機(jī)應(yīng)用基礎(chǔ)》期末考試結(jié)果進(jìn)行定量分析,從分析中獲得可靠的反饋信息。
《計算機(jī)應(yīng)用基礎(chǔ)》考試內(nèi)容主要有以下六個模塊:計算機(jī)基礎(chǔ)知識、中文Windows 7操作系統(tǒng)、Word2010文字處理軟件、Excel2010電子表格軟件、PowerPoint2010演示文稿軟件、網(wǎng)絡(luò)基礎(chǔ)與Internet應(yīng)用等內(nèi)容。鑒于計算機(jī)教學(xué)的模塊化特點(diǎn),我們在進(jìn)行成績分析的時候不僅要考慮總評成績,還要考慮到各模塊得分的情況。而各個模塊之間又有一定量的聯(lián)系,模塊之間有或多或少的相同知識點(diǎn),如:Word和Excel中文字的編輯、格式設(shè)置、文件的保存等都大致相同。所以我們在進(jìn)行成績分析時不僅僅要考慮各模塊的得分對總評的貢獻(xiàn)情況,還要考慮到各模塊之間的相關(guān)程度。因此本文中利用主成分分析法將六個相互關(guān)聯(lián)的模塊轉(zhuǎn)換為2個互不相關(guān)的主要成分(主要成分對總評成績的貢獻(xiàn)率達(dá)到86%),并得到了各個模塊在主成分中所占的比重,進(jìn)而按照主成分分析方法對成績進(jìn)行綜合排名。
主成分的基本思想:將原來p個具有一定相關(guān)性的指標(biāo)重新組合成一組新的互相無關(guān)的綜合指標(biāo)來代替原來的指標(biāo)。也即是將原來相關(guān)的p個指標(biāo)的線性組合作為新的綜合指標(biāo)。使新的指標(biāo)盡可能多地包含原來指標(biāo)的信息。具體做法如下:
首先,選取原指標(biāo)的一個線性組合記為F1,即第一個綜合指標(biāo),使Var(F1)達(dá)到最大(Var(F1)越大,說明F1包含的綜合信息越多),則F1稱為第一主成分。如果第一主成分包含的原信息量沒有達(dá)到一定的要求(一般要求累計貢獻(xiàn)率達(dá)到80%以上),再選取原指標(biāo)的第二個線性組合來有效地反映原信息,記為F2,要求:F1中已有的信息將不出現(xiàn)在F2中,也即要求Var(F1,F(xiàn)2)=0,將F2稱為第二主成分。以此類推,可以構(gòu)造出第三主成分,…,第p個主成分。主成分的線性變換為:其中A=(aij)pp=(a1,a2,…,ap),Rai=λiai,為相關(guān)系數(shù)
矩陣,a1i,a2i,…,api(i=1,2,…,p)為X的協(xié)方差陣的特征根λi(i=1,2,…,p)所對應(yīng)的特征向量,λ1≥λ2≥…λp≥0。
以廣東食品藥品職業(yè)學(xué)院2014級《計算機(jī)應(yīng)用基礎(chǔ)》期末考試成績?yōu)槔?,運(yùn)用主成分分析法對24位任課教師教學(xué)能力進(jìn)行評價?,F(xiàn)將任課教師所教56個教學(xué)班級的學(xué)生成績總分和各個模塊的得分進(jìn)行平均計算,得到24名任課教師所教班級的平均分,如表1所示:
表1 各教師教學(xué)成績
記:x1:計算機(jī)基礎(chǔ)成績,x2:Windows成績,x3:Word成績,x4:Excel成績,x5:網(wǎng)絡(luò)成績,x6:PowerPoint成績。
由于各個模塊的分值在總分中所占的比例不同,我們首先對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,使數(shù)據(jù)量綱相同,以便于較準(zhǔn)確地進(jìn)行分析。標(biāo)準(zhǔn)化后的數(shù)據(jù)如表2所示。
表2 標(biāo)準(zhǔn)化成績
通過主成分分析得到標(biāo)準(zhǔn)化后數(shù)據(jù)各變量之間的相關(guān)系數(shù)矩陣,如表3所示??梢钥闯鯳ord和Excel之間的相關(guān)性最高,為0.985,這與實(shí)際情況也是相符合的,因?yàn)閃ord和Excel中有很多相似的知識,如新建文件、文件復(fù)制保存、文檔的編輯等。同時,Word和網(wǎng)絡(luò)、Excel和網(wǎng)絡(luò)、Windows操作系統(tǒng)和Word、Excel之間也有較高的相關(guān)性,說明它們之間有較多類似的知識點(diǎn)。而基礎(chǔ)知識和各模塊之間的相關(guān)程度差距不大,這與基礎(chǔ)知識綜合考查各模塊理論知識是相符的。
表4中為主成分分析得到的數(shù)據(jù)的特征根和主成分Fi(i=1,2…,6)的方差,以及Fi(i=1,2…,6)的累積貢獻(xiàn)率。在主成分的提取原則上,通常提取特征值大于1的前m個主成分且使選取的主成分的累積貢獻(xiàn)率達(dá)到80%以上,如果特征值小于1則說明該主成分對信息的解釋力度較小,還不如直接引入一個原變量的解釋力度大。如果累積貢獻(xiàn)率小于80%則提取的主成分又不足以包含原變量的信息。在計算機(jī)成績分析中前兩個特征根均大于1,λ1=4.163,λ2=1.002,且累積貢獻(xiàn)率為86.076%,故選取前兩個主成分F1,F(xiàn)2。
表5為初始因子載荷矩陣,每一個載荷量表示主成分與對應(yīng)變量的相關(guān)系數(shù)。從中可知:Windows操作系統(tǒng)、Word、Excel、PowerPoint、網(wǎng)絡(luò)在第一主成分上有較高的載荷,說明第一主成分基本反映了這些模塊的信息;基礎(chǔ)知識在第二主成分上有較高的成分,說明第二主成分基本包含了基礎(chǔ)知識的信息。所提取的兩個主成分可以基本反映全部指標(biāo)的信息。所以我們用兩個新的變量來代替原來的變量。并且第一主成分是操作部分的反映,第二主成分是基礎(chǔ)知識的反映,符合實(shí)際情況。
以表5中第一主成分與原各變量的相關(guān)系數(shù)(表5中第一列數(shù)據(jù))除以第一特征根的平方根(即)(λ1=4.163)),可以得到第一特征根所對應(yīng)的特征向量(即第一主成分與原變量間的線性系數(shù))。以第二主成分與原標(biāo)準(zhǔn)化變量的相關(guān)系數(shù)(表5種第二列數(shù)據(jù))除以第二特征根的平方根(即:)=1.002)),可得到第二特征根所對應(yīng)的特征向量(即第二主成分與原標(biāo)準(zhǔn)化變量的線性系數(shù))。由此可以得到:
表5 初始因子載荷矩陣
表3 各模塊之間的相關(guān)系數(shù)矩陣
表4 方差分解主成分提取分析表
F1=0.1000ZX1+0.4587ZX2+0.4685ZX3+0.4828ZX4+ 0.3642ZX5+0.4411ZX6
F2=0.9520ZX1+0.0310ZX2-0.0689ZX3-0.0819ZX4+ 0.1728ZX5-0.2268ZX6
分別計算第一、二特征根在所提取的所有特征根和中所占的比例:r1=λ1/(λ1+λ2)=0.806,r1=λ1/(λ1+λ2)= 0.194,進(jìn)而可得到主成分對原標(biāo)準(zhǔn)化變量的綜合線性模型:
F =0.2653ZX1+0.3758ZX2+0.3643ZX3+0.3732X4+ 0.3270ZX5+0.3115ZX6
從模型中可以看出基礎(chǔ)知識模塊在總評成績中所占的比重較小,這與基礎(chǔ)知識模塊得分率比其他模塊得分率較低相符。
根據(jù)主成分線性模型計算各教師所教班級的教學(xué)成績的主成分值,并對其進(jìn)行排名比較,即可得到各教師的綜合評價比較,見表6。從中可以看到:利用主成分進(jìn)行綜合比較與按照平均分進(jìn)行比較得到的結(jié)果基本一致,最多相差兩個名次,這可以從實(shí)際數(shù)據(jù)中得到原因,如教師18,如果按照平均分進(jìn)行排名是第一位,而按照主成分分析則為第三位,這是由于教師18的總成績與教師6的總成績本來就相差較小。教師18的基礎(chǔ)知識成績與教師6的基礎(chǔ)知識成績的差距大于其他模塊的平均差距,而基礎(chǔ)知識主要體現(xiàn)在第二主成分中,其他模塊主要體現(xiàn)在第一主成分中,但第二主成分在總評中所占的比重較小,第一主成分所占的比重較大,所以按主成分分析教師18位次低于教師6。其他的差異也可以從原數(shù)據(jù)中找到原因。
教學(xué)評價是研究教師的教和學(xué)生的學(xué)的價值的過程,目的是為了檢查教師教學(xué)效果,了解學(xué)生學(xué)習(xí)成績,為教學(xué)改革提供依據(jù),以進(jìn)一步提高教學(xué)質(zhì)量,促進(jìn)教學(xué)目標(biāo)的實(shí)現(xiàn)。本文應(yīng)用多元統(tǒng)計中的主成分分析法對學(xué)生期末考試成績的原始數(shù)據(jù)進(jìn)行分析處理,得到教師教學(xué)成績綜合排名,為教學(xué)研究和綜合量化管理提供科學(xué)的依據(jù)。
表6 各教師教學(xué)成績的綜合比較
參考文獻(xiàn):
[1]張文霖.主成分分析在SPSS中的操作應(yīng)用[J].理論與方法,2005(12):31-34.
[2]揚(yáng)宇音,趙雅明,曲立敏.因子分析法在大學(xué)生綜合排名中的應(yīng)用[J].貴州工業(yè)大學(xué)學(xué)報,2005,34(1):9~12.
[3]高惠璇.應(yīng)用多元統(tǒng)計分析[M].北京:北京大學(xué)出版社,2005.
[4]何曉群.多元統(tǒng)計分析[M].北京:中國人民大學(xué)出版社,2004:143-146.
[5王學(xué)民.應(yīng)用多元分析[M].上海:上海財經(jīng)大學(xué)出版社,2004:236-237.
[6]宇傳華.SPSS與統(tǒng)計分析[M].北京:電子工業(yè)出版社,2007.
[7]范賀方,樊順厚等.主成分分析法在學(xué)生成績分析中的應(yīng)用[J].理論前沿,2009(34):79-80
[8]張紹璞.基于主成分分析中的幾類問題的計算公式及結(jié)論.天津科技大學(xué)學(xué)報,2010(4),25(2):76-78.
[9]周春生.主成分分析在大學(xué)生成績影響因素研究中的應(yīng)用[J].現(xiàn)代計算機(jī),2013(6):12-14.
郝佳睿(1988-),男,軟件設(shè)計師,碩士,從事領(lǐng)域?yàn)橛嬎銠C(jī)教學(xué)及計算機(jī)應(yīng)用
The Usage of Principal Component Analysis in Computer Module Teaching Evaluation
HAO Jia-rui
(Guangdong Food and Drug Vocational College,Guangzhou 510520)
Abstract:
The Computer Application Foundation as a compulsory course for students majoring in non- computer,its teaching content mainly has six modules.The characteristics of the modular teaching for computer,tries to use the method of principal component analysis to comparative analyze the final exam,puts forward the main factors that influence the general performance,and the evaluation method of how various impact factors contribute to the general performance.Ranking the teaching effect and comparing the average score are almost the same effect.
Keywords:
《計算機(jī)應(yīng)用基礎(chǔ)》作為一門非計算機(jī)專業(yè)學(xué)生的必修課,其教學(xué)內(nèi)容主要有六個模塊。針對計算機(jī)模塊化教學(xué)的特點(diǎn),嘗試采用主成分分析的方法對期末考試成績進(jìn)行對比分析,提出對總評成績的主要影響因子,以各影響因子對總成績貢獻(xiàn)的大小為評判方法,對教師的教學(xué)效果進(jìn)行排名,并與按平均分進(jìn)行排名對比,效果基本一致。
主成分分析;計算機(jī)模塊;影響因子;累計貢獻(xiàn)率
基金項目:
廣東食品藥品職業(yè)學(xué)院基金項目(No.2012YR001)
文章編號:1007-1423(2016)14-0064-05
DOI:10.3969/j.issn.1007-1423.2016.14.014
作者簡介:book=68,ebook=69
收稿日期:2016-03-10修稿日期:2016-04-15
Principal Component Analysis;Computer Module;Impact Factor;Cumulative Contribution Rate