賀路路 阮曉龍
摘? 要: 分析學生成績有利于優(yōu)化課程設置,有利于提升教學質量。由于學生成績具有多主體性和時序性等特征,大多數(shù)分析工具和展示方式均存在分析因子難以結合,異常數(shù)據(jù)分析缺乏針對性等現(xiàn)象。因此,本文提出從課程、學生和教師等任意主體出發(fā),采用真實教學數(shù)據(jù)進行分析。即,設計分析模型并邀請教學人員對其進行修正,再利用可視化圖表庫ECharts對分析結果進行直觀展示。通過對近五年的學生成績進行分析與可視化展示,可直觀地看到學生學習過程中以及教學過程中存在的優(yōu)勢與不足。
關鍵詞: 成績分析; 課程教學; 教學質量; ECharts; 教學數(shù)據(jù)
中圖分類號:G642.1? ? ? ? ? ? 文獻標志碼:A? ? ?文章編號:1006-8228(2019)09-50-03
Research on data analysis model and visualization of college students'examination achievements
He Lulu, Ruan Xiaolong
(College of Information Technology, Henan University of Traditional Chinese Medicine, Zhengzhou City, Henan Province, 450046)
Abstract: The analysis of students' scores is conducive to optimizing the curriculum and improving the quality of teaching. Due to the multi-subjectivity and time series of students' performance, most of the analysis tools and display methods are difficult to combine the analysis factors and lack of pertinence in the analysis of abnormal data. Therefore, starting from any subject such as curriculum, student and teacher, this paper uses real teaching data to analyze. That is, design the analysis model and inviting the teaching staff to revise it, and then display the analysis results intuitively with charting and visualization library ECharts. Through the analysis and visualization of students' achievements in the past five years, the advantages and disadvantages of students' learning process and teaching process can be seen intuitively.
Key words: score analysis; curriculum teaching; teaching quality; ECharts; teaching data
0 引言
高校畢業(yè)生出現(xiàn)與其能力、素質不匹配的問題日漸突出[1],對其成績分析不足,挖掘不夠的問題也大量存在。如何展現(xiàn)這些數(shù)據(jù)所蘊含的價值,是教學信息化的重要研究方向之一[2]。
對成績的分析多采用Excel等簡單工具,僅獲得平均分、標準差、方差等內(nèi)容,并未對學生成績進行深入挖掘。結果簡單,很難促進教學進步,指導進一步教學進程。因此,建立一套能夠促進學生成長、促進素質提高的制度迫在眉睫,也已成為本科教學改革的重要任務。
結合我院實際情況,本文擬通過交叉分析模型來科學展示學生的成績,期望能夠幫助院系管理者發(fā)現(xiàn)學生成績的特點,更全面地展示教學效果、促進我院學生綜合素質得到進一步的發(fā)展。
1 數(shù)據(jù)可視化技術
1.1 什么是數(shù)據(jù)可視化
簡單的說,數(shù)據(jù)可視化就是按照既定方式對數(shù)據(jù)進行挖掘處理,并按照一定的方式/方法將數(shù)據(jù)呈現(xiàn)出來,幫助管理者更好地發(fā)現(xiàn)問題、解決問題,體現(xiàn)數(shù)據(jù)的巨大價值。
1.2 數(shù)據(jù)可視化的優(yōu)點
⑴ 高速信息傳播
人腦接收視覺信息的速度通常比文字信息快10倍。相比那些紛繁復雜的報告、電子表格,使用圖形化方式來總結、展示復雜數(shù)據(jù)中所蘊含的重要信息,可有效提升信息展示效果,直觀查看數(shù)據(jù)的內(nèi)在聯(lián)系,可視化可以更快地幫助管理者理清事務本質,緊抓工作內(nèi)涵。
⑵ 多維數(shù)據(jù)顯示
數(shù)據(jù)地可視化,可以是二維,也可以是三維,對之進行排列、組合、分析、挖掘即可發(fā)現(xiàn)數(shù)據(jù)中隱含的規(guī)律及價值[3]。
⑶ 直觀信息呈現(xiàn)
數(shù)據(jù)可視化,通常使用較少的圖形來展示復雜的邏輯關系,甚至單個圖形也可深入挖掘數(shù)據(jù)內(nèi)涵。豐富且有意義的圖形有助于教師了解學生狀態(tài),可更有針對性地幫助學生,同時也可減輕教師的工作量,使之管理效率得到提高。
2 數(shù)據(jù)預處理
本分析中的學生成績來源于河南中醫(yī)藥大學信息技術學院近10年的積累,其中存在許多缺失數(shù)據(jù)、不規(guī)范數(shù)據(jù)、不標準數(shù)據(jù)[4],因此對數(shù)據(jù)進行預處理,特別是缺失值、異常值、冗余值等內(nèi)容操作很有必要,這樣的清洗過程,有利于保證成績數(shù)據(jù)的真實性和可用性。
預處理操作如下,首先將學生成績中標記“沒寫”、“缺考”、“入伍”、“休學”、“緩考”、“無理論成績”等進行格式化,并清除無效數(shù)據(jù)。之后再對數(shù)據(jù)得含義進行解讀,數(shù)據(jù)中的字段內(nèi)容如表1所示。
基于河南中醫(yī)藥大學信息技術學院的學生成績數(shù)據(jù)與數(shù)據(jù)含義創(chuàng)建數(shù)據(jù)存儲模型,并將清洗后的數(shù)據(jù)存儲至數(shù)據(jù)庫中。
3 學生成績的總體分析
本數(shù)據(jù)分析中參與學生1927名,參與專業(yè)8個,參與年級10個,參與班級39個,參與課程433個,共50萬余條。本文從不同角度對學生成績數(shù)據(jù)進行分析后,建立了多個角度、多個體系地分析模型,可全面呈現(xiàn)本院系的學生成績。
3.1 學生成績整體分析
⑴ 分析方式
學生成績整體分析的目的是了解學生最終考試的整體情況。首先將成績劃分為0-59分,60-69分,70-79分,80-89分,90-100分五個區(qū)間,然后統(tǒng)計每個區(qū)間、每個人、每個課程成績,得到學生成績的最終區(qū)間分布。
⑵ 分析結果
整體分析的結果如圖1所示,可以看出學生成績呈正態(tài)分布,符合教學規(guī)律,多數(shù)處在70-79分和80-89分的區(qū)間內(nèi),80-89分區(qū)間內(nèi)的學生最多,為32974人課,0-59分區(qū)間內(nèi)學生最少,為2623人課。
3.2 各年級學生平均分分析
⑴ 分析方式
從各年級學生成績平均分中,可看出每個年級的整體情況,與其他年級對比后,可查看院系各專業(yè)課程的教學情況。
⑵ 分析結果
學生成績平均分歷年變化不大,在78.68分上下,略有浮動;專科學生平均分歷年變化較本科生來大,在76.07分上下,如圖2所示。
3.3 各年級學生成績分布分析
⑴ 分析方式
從各年級學生成績,可獲取優(yōu)秀、良好、中等、及格、不及格人數(shù)的分布情況,有利于了解各年級學生的綜合素質。
⑵ 分析結果
通過分析,可看出各年級學生成績呈正態(tài)分布,集中在中等、良好部分。同時各年級的優(yōu)秀率相對高于不及格率,如圖3所示。
3.4 所有學生成績分布分析
⑴ 分析方式
對所有學生的成績進行分析匯總后,可利用散點圖繪制出學生成績的分布區(qū)間。
⑵ 分析結果
通過分析可看出,學生成績多分布在75分-85分之間,絕大部分學生的成績大于60分,在75分-85分之間,極少部分學生成績小于60分,如圖4所示。
4 學生成績的專業(yè)分析
4.1 各專業(yè)學生成績分布分析
⑴ 分析方式
從各專業(yè)學生成績分布中,可看出每個專業(yè)的教學質量[5]。統(tǒng)計各專業(yè)的人數(shù)、總分、課程數(shù),算出每個專業(yè)的優(yōu)秀、良好、中等、及格、不及格人數(shù),對展示各專業(yè)的學習效果來講也很重要[6]。
⑵ 分析結果
可以看出,各專業(yè)學生成績的分布類似,各專業(yè)相差不大,較多的學生分布在中等、良好部分,少數(shù)學生不及格,少數(shù)學生優(yōu)秀,如圖5所示。
4.2 各專業(yè)成績優(yōu)秀率分析
⑴ 分析方式
從各專業(yè)成績優(yōu)秀率分析當中,可看出各專業(yè)的優(yōu)秀情況。先統(tǒng)計出各個專業(yè)的學生人數(shù),再統(tǒng)計出優(yōu)秀學生人數(shù),就可進行簡單計算。
⑵ 分析結果
通過分析可知,計算機網(wǎng)絡技術專業(yè)成績優(yōu)秀率達0.27,其他專業(yè)優(yōu)秀率都在0.13左右,計算機信息管理專業(yè)優(yōu)秀率最低。如圖6所示。
5 結束語
利用可視化技術,將數(shù)據(jù)挖掘分析的思想與信息技術學院實際情況相結合后,為教學工作提供了大量有用信息。所使用分析模型均根據(jù)信息技術學院的教學特點來設計,所呈現(xiàn)的分析結果具有較高的參考意義[7],這可為教學改革與教學質量提升提供了有力數(shù)據(jù)支撐。從分析結果可以看出,目前學院學生在學習過程中以及教師在教學過程中存在的優(yōu)勢與不足[8],這也是本次研究的重要意義所在。
參考文獻(References):
[1] 方錦雯,姚壹壹,蔡軍偉,鞏學梅.學生成績分析中最優(yōu)試卷樣本量確定的研究[J].寧波工程學院學報,2018.3:63-68
[2] 范雙南,趙輝煌,肖四喜,鄒祎.基于主成分分析的《計算機基礎》課程學生平時成績綜合評價[J].輕工科技,2018.10:175-176
[3] 張濠天,張文卿,王元元,施月霞,曾南焱.關聯(lián)規(guī)則挖掘在成績分析中的應用[J].中國高新區(qū),2018.10:47.
[4] 龔玉玲,徐曉棟.基于SAS的學生成績混合正態(tài)分布的研究[J].江蘇科技信息,2018.35(1):69-71
[5] 陳卓.基于SPSS的學生成績影響因素分析[J].電子制作,2017.20:43-44,54.
[6] 閆波,趙德成,王璐環(huán).哪些因素在影響中國學生學習成績?——基于PISA2015中國四省(市)學生數(shù)據(jù)的多水平分析[J].中小學管理,2017.10:9-12
[7] 劉鐘情.數(shù)據(jù)挖掘在體育院校計算機等級考試成績分析中的應用研究[J].江漢大學學報(自然科學版),2016.44(4):377-381
[8] 張維國.基于數(shù)據(jù)挖掘的在線考試系統(tǒng)設計與實現(xiàn)[J].計算機時代,2015.12:41-44