陸冷飛
摘 要:大數(shù)據(jù)時代,高校越來越重視從海量的學生成績數(shù)據(jù)中分析挖掘出有用的信息,為高校的人才培養(yǎng)模式改革、教學改革、管理決策等提供有力的數(shù)據(jù)支撐。本文從高校學生成績分析的現(xiàn)狀出發(fā),基于大數(shù)據(jù)挖掘理念,將多元統(tǒng)計方法引入高校成績分析,介紹了相關分析、因子分析、聚類分析等方法在高校成績分析中的應用,建立了高校多維成績分析模型,并以中國藥科大學2014級藥物化學專業(yè)的成績分析為例詳細闡述了該模型的應用。
關鍵詞:多元統(tǒng)計;數(shù)據(jù)挖掘;成績分析;分析模型
中圖分類號:G424.7 文獻標志碼:A 文章編號:1673-8454(2017)09-0062-04
高校學生成績一直是直接評價學生學業(yè)水平的重要指標,也是間接評價高校教師教學效果及高校教學管理水平的指標之一。目前各高校常用的成績分析主要集中于課程成績總分、平均分、及格率、優(yōu)秀率、方差、成績分布曲線(柱狀)圖等簡單的一些分析與統(tǒng)計,對學生的評價一般采取各科成績加權平均后再排名,這些統(tǒng)計與排名能從一定程度上反映課程的教學情況及學生學習效果,但是學科的多樣性、題目的難易程度、題目分值高低、教學方式、學生自身等因素對學生取得的成績存在不同程度的影響,因此傳統(tǒng)的成績分析是比較片面和籠統(tǒng)的,不能全面反映學生各學科學習的優(yōu)劣,以及學生學習的效果。本文基于大數(shù)據(jù)挖掘的理念,在成績分析中引入多元統(tǒng)計分析的常用方法,構建了較為全面的高校成績分析通用模型,基于該模型和大數(shù)據(jù)挖掘方法的應用使成績分析比傳統(tǒng)方法更全面、更具有指導意義。
一、成績分析的常用方法
因學生成績數(shù)據(jù)量巨大,要從海量的成績數(shù)據(jù)中挖掘出隱藏、有用的信息,需采用基于大數(shù)據(jù)挖掘的數(shù)據(jù)分析方法,才能有效全面地反映學生的學習情況。常用的可應用于成績分析的方法主要有相關性分析、因子分析、聚類分析等多元統(tǒng)計分析方法。
1.相關性分析
相關性分析,百度百科中的解釋是研究樣本對象之間是否存在某種依存關系,并對具體有依存關系的現(xiàn)象探討其相關方向以及相關程度,是研究隨機變量之間相關關系的一種統(tǒng)計方法。根據(jù)相關分析的定義、特點以及學生成績影響因素的多樣性,可以利用相關分析方法進行學生成績與各影響因素之間相關性的分析,揭示各因素對學生成績的影響規(guī)律,根據(jù)發(fā)現(xiàn)的規(guī)律,通過對影響因素的正向干預,提高學生學習效果,促進學生學業(yè)的發(fā)展。
2.因子分析
因子分析是根據(jù)相關性大小把變量分組,使同組內的變量之間相關性較高,但不同組變量相關性較低,每組變量代表一個基本結構,這個基本結構稱為公共因子。對于所研究的問題就可試圖用最少個數(shù)不可測的所謂公共因子的線性函數(shù)與特殊因子之和來描述原來觀測的每一變量。[1]由此可知,分析得出的公共因子跟原始因子是關系緊密的,公共因子能反映絕大部分原始信息,通過提取公共因子,從而簡化對事物的認識與分析。在成績分析中,比如一個學生某學科的成績非常好,則其他成績也非常好,這些課程之間就存在一種隱藏的共性因子關系。各專業(yè)培養(yǎng)方案設置是否合理,培養(yǎng)了學生哪些方面的能力,采用因子分析方法就能方便地得出結論,從而使對學生的評價更加合理、簡單、清晰易懂。
3.聚類分析
聚類分析是一種探索性的分析方法。它是將一批樣本或變量按照它們在性質上的親疏程度加以分類,實質是按照距離遠近將數(shù)據(jù)分為若干個類別, 以使類別內數(shù)據(jù)的差異盡可能小、類別間的差異盡可能大。[2]比如可以采用聚類分析方法對學生成績進行聚類分析,根據(jù)結果反映每位學生在各方面的能力發(fā)展狀況——是否有偏科、是否有某些方面特長等,便于學校開展針對性的學生學業(yè)支持與輔導工作,幫助學生彌補不足,平衡各學科的學習。
二、高校多維成績分析模型
高校成績分析涉及的對象、因素紛繁復雜。學生成績一方面反映學生的學習行為及其知識掌握程度,另一方面反映專業(yè)課程設置及教師在課程教學過程中的知識傳授能力和教學質量。因此,為理清影響學生成績各因素之間的關系,明確高校成績分析的方向,筆者建立了如圖1所示的多維成績分析模型,學生成績分析工作可以從三個維度來進行,即以成績本身為中心的分析、以學生為中心的分析、以課程為中心的分析。
1.以成績?yōu)橹行牡姆治?/p>
以成績?yōu)橹行牡姆治鍪侵笇Τ煽冏陨淼慕y(tǒng)計規(guī)律性分析,主要是頻數(shù)和直方圖分析,包括峰度、偏度、最高分、最低分、平均分、標準差、方差、優(yōu)良中差的頻數(shù)、區(qū)分度等分析。從對某課程成績頻數(shù)和直方圖的一些分析,可以得出該課程學生成績的大致分布、試卷難易程度、區(qū)分度等信息,使教學單位對該門課程的教學有一個基本了解,為以后教學、考核評價的調整等提供決策依據(jù)。以成績?yōu)橹行牡姆治鍪悄壳案鞲咝W罨尽⒆畛R?guī)的成績分析模型,各高校一般明確規(guī)定教研室或任課教師在期末考試成績錄入之后,就要對課程成績進行頻數(shù)和直方圖的分析,結合試卷分析,最后得出結論并書面存檔。
2.以課程為中心的成績分析
課堂教學的四大要素是學生、教師、教學內容、教學媒體。課堂教學中課堂的組織形式、教師的教學、教學媒體的選擇等都是為課程內容服務的,即它們提供給學生學習的一切有利內容和條件。因此課堂教學中除學生之外的三大要素均可以歸納為課程這一要素,以課程為中心的成績分析是指從課程各要素出發(fā),采用大數(shù)據(jù)分析方法進行成績分析,包括分析課程知識點的難易程度不同、任課教師不同、上課對象不同、教學內容呈現(xiàn)的媒介不同、教師教學方法和教學模式不同、考試難度不同、評價方式不同(總結性評價還是過程性評價)等對學生課程成績或知識掌握程度的影響。
以課程為中心的成績分析模型能夠真實反映課程教學內容設置、教師教學方法、教學模式等因素對學生學習效果產(chǎn)生的影響,因此能夠為學校的專業(yè)培養(yǎng)方案設置以及課程內容改革、教學方法改革、師資配置等提供良好的決策參考。
3.以學生為中心的成績分析
以學生為中心的成績分析是指從學生角度出發(fā),分析學生個人特性、學習習慣等方面的特征和行為與課程成績之間的關系,以及學生個體各方面能力的發(fā)展情況。比如分析學生的個性、上網(wǎng)行為、圖書借閱行為等對課程成績的影響;學生的民族、地域、生源地分布與課程成績之間的關系、學生的學習過程努力程度、考勤等對課程成績的影響;分析學生所有課程成績之間的關系,找出公共能力因子,分析得出學生各項能力的發(fā)展,并根據(jù)其聚類結果對學生進行分類,評估每位學生各項能力(德智體)如研究能力、實踐能力、身體素質等的發(fā)展情況,分析專業(yè)培養(yǎng)方案設置的合理性,確定對學習困難生的幫扶輔導計劃等。
上述模型中三個維度的成績分析基本涵蓋了學生成績分析的各方面因素,它們各自側重點不同,可以單獨進行,也可以聯(lián)合進行。在實際的成績分析中,想要通過成績挖掘出教與學各方面較為全面的隱性知識,通常需要涉及多個維度的成績分析,它們相互聯(lián)系、相互影響。
三、以學生為中心的成績分析應用
以中國藥科大學2014級藥物化學專業(yè)34門必修課成績?yōu)槔M行成績分析,使用SPSS 22.0統(tǒng)計軟件,利用因子分析、聚類分析的統(tǒng)計方法對成績數(shù)據(jù)進行挖掘,旨在分析出有利于教學管理和學生評價的有效信息。
1.數(shù)據(jù)準備
以2014級藥物化學專業(yè)大一至大三共計6個學期的必修課成績及加權平均分為樣本,刪除幾名留級學生之后,共87名學生,35門必修課。課程包括程序設計語言、大學英語(一)、大學英語(二)、大學英語(三)、大學英語(四)、分析化學(上)、分析化學(下)、分析化學實驗(上)、分析化學實驗(下)、高等數(shù)學(一)、高等數(shù)學(二)、計算機應用基礎、馬克思主義基本原理概論、毛澤東思想和中國特色社會主義理論體系概論、生物化學與分子生物學、生物化學與分子生物學實驗、數(shù)理統(tǒng)計、思想道德修養(yǎng)與法律基礎、體育(一)、體育(二)、體育(三)、體育(四)、無機化學、無機化學實驗、物理化學(上)、物理化學(下)、物理化學實驗、物理學(一)、物理學(二)、物理學實驗、有機化學(一)、有機化學(二)、有機化學實驗(一)、有機化學實驗(二)、中國近現(xiàn)代史綱要。成績?yōu)槿笨嫉目颇恳?分計。
2.因子分析
用SPSS22.0打開學生成績表,進入“分析-降維-因子分析”菜單,在打開的界面中分別設置相關參數(shù)。相關性矩陣選擇“KMO和Bartlett的球形度檢驗”,因子分析抽取方法采用“主成分”分析方法,提取特征值大于1的因子旋轉方法選擇“最大方差法”并輸出旋轉解和載荷圖,最后將因子得分保存為變量,確定后得到以下輸出及分析結果。
(1)因子分析的可行性分析。如表1所示,KMO的結果為0.858,接近1,說明成績變量間存在較強的相關性;Bartlett球形檢驗結果P值為0,小于0.01,因此該樣本適合做因子分析。
(2)采用主成分分析法進行抽取和最大方差法旋轉后得到的總方差解釋矩陣結果如表2所示,共提取了8個特征值大于1的因子,累計方差貢獻率72.165%,說明35門必修課共抽取了8個公共因子,這8個因子能解釋原始變量72.165%的信息。
(3)根據(jù)旋轉后的成分矩陣(略)中各門必修課在各因子上載荷值的大小,可以分析得出各因子所代表的學生習得的潛在能力,即教學培養(yǎng)學生各方面的能力。物理學(一)、物理學(二)、數(shù)理統(tǒng)計、高等數(shù)學(一)、高等數(shù)學(二)、有機化學(一)、有機化學(二)、分析化學(上)、分析化學(下)、無機化學、物理化學(上)、物理化學(下)、生物化學與分子生物學等課程在第一個因子上載荷值較高,反映的是學生在物理、數(shù)學等學科基礎之上向專業(yè)基礎能力發(fā)展的課程,可以將第一個因子命名為專業(yè)基礎能力因子;大學英語(一)、大學英語(二)、大學英語(三)、大學英語(四)在第二個因子上載荷值較高,可以命名為英語能力因子;物理學實驗、有機化學實驗(—)、有機化學實驗(二)、分析化學實驗(上)、分析化學實驗(下)、生物化學與分子生物學實驗、無機化學實驗、物理化學實驗等實驗類課程在第三和第四個因子上載荷值較高,同樣的實驗課分布在2個因子上,可能是因為實驗的性質、內容或考核評價的方式差異導致的,可以將第三、四個因子合并命名為專業(yè)實踐操作能力因子;馬克思主義基本原理概論、毛澤東思想和中國特色社會主義理論體系概論、中國近現(xiàn)代史綱要課程在第五個因子上載荷值較高,可以命名為人文社科素養(yǎng)因子;體育(二)、體育(四)在第六個因子,體育(一)、體育(三)在第七個因子上載荷值較高,可以合并命名為身體素質能力因子;第八個因子只有思想道德修養(yǎng)與法律基礎載荷值較高,可以命名為學生的思想修養(yǎng)與法律能力因子。至此我們可以得出中國藥科大學2014級藥物化學專業(yè)前3年的培養(yǎng)方案,從6個方面培養(yǎng)學生的能力,可以看出該專業(yè)的前3年培養(yǎng)方案較為全面地培養(yǎng)了學生德智體各方面的能力,能讓學生得到均衡發(fā)展。
在以上分析的基礎上,可以根據(jù)表2旋轉載荷平方和里的方差貢獻率以及綜合因子得分公式計算得出每位學生的綜合因子得分,根據(jù)得分進行綜合排名,可以與傳統(tǒng)的加權平均分排名進行對比,從中可發(fā)現(xiàn)傳統(tǒng)排名無法反映出來的一些問題,因篇幅所限,此過程不再贅述。
3.聚類分析
在上述因子分析過程中,得到了8個反應學生成績信息的公共因子,利用保存的8個公共因子得分系數(shù)進行聚類分析,將學生進行快速聚類,可根據(jù)最終分類進一步對學生的學業(yè)發(fā)展提供針對性的指導。
在SPSS 22.0軟件中,選擇“分析-分類-K平均值聚類”,進入操作界面,選擇因子分析過程中保存的8個公共因子,最大迭代次數(shù)輸入20,統(tǒng)計選項選擇初始聚類中心和ANOVA表,保存每位學生的聚類及距離為變量。分別以K=2、3、4、5進行快速聚類分析,根據(jù)各輸出結果中ANOVA表中的F值和顯著性檢驗值對比分析,當K=3時,各類別之間的差異性最顯著,因此將此樣本分為3類比較合適。當K=3時,最終聚類中心如表3所示,每個類別中的個案數(shù)量如表4所示。
從表3、表4可以分析得出,第一類學生共45人,這類學生除人文社科素養(yǎng)能力、身體素養(yǎng)能力較弱之外,其他各方面的能力發(fā)展較為均衡,基本上不存在太多偏科現(xiàn)象,各學科均衡發(fā)展,屬于穩(wěn)定發(fā)展型人才,應該繼續(xù)保持,建議適當加強人文社科素養(yǎng)、身體素養(yǎng)方面的培養(yǎng)。第二類學生共32人,這類學生與第一類學生恰好相反,人文社科素養(yǎng)與身體素養(yǎng)能力較強,但專業(yè)基礎能力、實踐操作能力等一般,需加強專業(yè)學科、英語能力等方面的學習。第三類學生人數(shù)較少,共10人,這類學生存在較明顯的偏科現(xiàn)象,除專業(yè)基礎能力的學科較好之外,其他各項能力方面的課程成績一般,尤其英語能力、實踐操作能力、身體素養(yǎng)能力等較差,需加強這方面課程的學習,建議校學生學業(yè)指導中心重點關注這類學生,提供必要的學業(yè)指導和支持,以促進他們能夠均衡發(fā)展。
四、結束語
信息化時代,通過建立多維成績分析模型,采用大數(shù)據(jù)挖掘方法,對學生成績進行全面的多元統(tǒng)計分析,可以避免傳統(tǒng)成績分析存在的問題。多維成績分析模型在高校中的應用,能使學校及時掌握學生的學習狀態(tài)及能力發(fā)展水平,發(fā)現(xiàn)和解決教師教學和學生學習中潛在的問題,為教師開展課程內容、教學模式改革,考核評價方式改革,管理部門的教學管理、人才培養(yǎng)方案改革,學風建設,學業(yè)支持與輔導等工作提供數(shù)據(jù)支撐,從而提高高校教學質量和人才培養(yǎng)質量。
參考文獻:
[1]李新蕊.主成分分析、因子分析、聚類分析的比較與應用[J].山東教育學院學報,2007(6):24.
[2]田宏,于曉秋.因子分析與聚類分析在學生成績綜合評價中的應用[J].牡丹江師范學院學報(自然科學版),2009(3):9.
(編輯:王天鵬)