楊彩 侯峰
摘? 要: 從海量的大數(shù)據(jù)中挖掘出潛在的有價(jià)值的信息并進(jìn)行可視化分析已成為研究的熱點(diǎn)。文章根據(jù)成績(jī)大數(shù)據(jù),從班級(jí)、課程等多維度進(jìn)行成績(jī)可視化分析,為教學(xué)管理者提供學(xué)生學(xué)習(xí)情況分析服務(wù)。經(jīng)研究發(fā)現(xiàn),成績(jī)的可視化分析不僅能為管理者提供精準(zhǔn)的教學(xué)支持,還能使學(xué)生及時(shí)發(fā)現(xiàn)學(xué)業(yè)問(wèn)題。
關(guān)鍵詞: 大數(shù)據(jù); 多維度; 可視化分析; 精準(zhǔn); 教學(xué)支持
中圖分類號(hào):TP391.9????????? 文獻(xiàn)標(biāo)識(shí)碼:A? ???文章編號(hào):1006-8228(2021)01-54-03
Research on the big data based visualized analysis of achievement
Yang Cai1, Hou Feng2
(1. Information Management Center, Zhengzhou University of Light Industry, Zhengzhou, Henan 450000, China;
2. School of Energy and Power Engineering, Zhengzhou University of Light Industry)
Abstract: Mining potential valuable information from massive big data and making visualized analysis has become a research hotspot. According to the achievement big data, this paper makes visualized analysis on students' learning achievement from the dimensions of class, curriculum and the others, so as to provide teaching managers with the analyzing service of students' learning situation. It is found that the visualized analysis of achievement can not only provide precision teaching support for managers, but also enable students to find problems in learning timely.
Key words: big data; multi-dimensional; visualized analysis; precision; teaching support
0 引言
“大數(shù)據(jù)”是指大量的結(jié)構(gòu)化和非機(jī)構(gòu)化的數(shù)據(jù),它無(wú)法用常規(guī)的軟件進(jìn)行處理,需要新的處理手段來(lái)處理這些海量的、高速增長(zhǎng)的數(shù)據(jù)[1]。
大數(shù)據(jù)技術(shù)主要包括海量數(shù)據(jù)的獲取以及數(shù)據(jù)統(tǒng)計(jì)分析和挖掘兩部分內(nèi)容[2]。大數(shù)據(jù)在各行各業(yè)發(fā)揮著重要作用,而如何利用大數(shù)據(jù)技術(shù)來(lái)提高高校教學(xué)管理者的教學(xué)管理水平是高校面臨的一個(gè)重大課題。運(yùn)用大數(shù)據(jù)技術(shù)可以挖掘出現(xiàn)實(shí)生活中不易察覺(jué)的較為深層次的信息,通過(guò)這些信息,進(jìn)而為人們提供決策支持[3]。
大數(shù)據(jù)技術(shù)[4]可運(yùn)用在學(xué)生成績(jī)的分析過(guò)程中,通過(guò)大數(shù)據(jù)技術(shù),可快速準(zhǔn)確地對(duì)學(xué)生成績(jī)進(jìn)行可視化分析,從而對(duì)學(xué)生的學(xué)業(yè)提供幫助及指導(dǎo)。同時(shí),根據(jù)可視化分析,可為教學(xué)管理者提供教學(xué)管理依據(jù)。截至到目前,將大數(shù)據(jù)技術(shù)運(yùn)用在學(xué)生可視化成績(jī)分析的學(xué)者越來(lái)越多,其已成為學(xué)習(xí)方法評(píng)價(jià)的有效手段。以往的學(xué)習(xí)成績(jī)分析往往是根據(jù)傳統(tǒng)的統(tǒng)計(jì)知識(shí)進(jìn)行簡(jiǎn)單的統(tǒng)計(jì)圖分析,或者采用常見(jiàn)分析工具SPSS、SAS等進(jìn)行分析[5]。本文依據(jù)大數(shù)據(jù)技術(shù),從班級(jí)、課程等多維度進(jìn)行成績(jī)的相關(guān)性、詞云分析等其他指標(biāo)分析,通過(guò)一系列的可視化分析進(jìn)而為教學(xué)管理者及學(xué)生提供服務(wù)基礎(chǔ)。
1 數(shù)據(jù)準(zhǔn)備
1.1 數(shù)據(jù)抽取
本文所采用的數(shù)據(jù)選取某高校一個(gè)學(xué)院全部本科生的期末成績(jī)作為基礎(chǔ)數(shù)據(jù)集。從教務(wù)系統(tǒng)中抽取某學(xué)院在2018-2019學(xué)年第二學(xué)期的期末考試必修課成績(jī)數(shù)據(jù)信息,數(shù)據(jù)信息包括:學(xué)生基本信息表、班級(jí)信息表、課程成績(jī)信息表。其中,涵蓋了該校某學(xué)院的15級(jí)、16級(jí)、17級(jí)、18級(jí)學(xué)生,共1227個(gè)學(xué)生,24個(gè)班級(jí),30門(mén)課程,46名教師信息。學(xué)生課程成績(jī)基本信息主要包括各個(gè)考試科目的平時(shí)成績(jī)、期末卷面成績(jī),總評(píng)成績(jī)等信息。
1.2 數(shù)據(jù)預(yù)處理
對(duì)抽取的數(shù)據(jù)進(jìn)行探索分析,發(fā)現(xiàn)抽取的數(shù)據(jù)集存在缺失值數(shù)據(jù),數(shù)據(jù)缺失的原因一方面可能是授課老師還未在教務(wù)系統(tǒng)中錄入學(xué)生成績(jī),另一方面可能是在數(shù)據(jù)抽取過(guò)程中而導(dǎo)致的缺失,缺失值往往不能忽略處理,而處理缺失值最常用的方法有三大類:刪除記錄、數(shù)據(jù)插補(bǔ)和不處理[6]。本文采用拉格朗日插值法對(duì)抽取的缺失值數(shù)據(jù)集進(jìn)行差值處理,補(bǔ)全缺失數(shù)據(jù)。
2 數(shù)據(jù)可視化分析
本文實(shí)驗(yàn)采用BI分析平臺(tái),從各個(gè)維度對(duì)學(xué)生成績(jī)進(jìn)行分析,具體分析內(nèi)容為:分別以學(xué)院的班級(jí)、課程為指標(biāo)對(duì)平時(shí)成績(jī)、期末卷面成績(jī)、總評(píng)成績(jī)進(jìn)行可視化分析;另外,對(duì)總評(píng)成績(jī)的不及格率按照課程為粒度做詞云分析,通過(guò)分析進(jìn)而為學(xué)生學(xué)業(yè)提供指導(dǎo)建議,為教學(xué)管理者提供決策支持。
2.1 分析不同班級(jí)成績(jī)?cè)u(píng)定情況
通常,課程的總評(píng)成績(jī)包括平時(shí)成績(jī)和考試成績(jī)兩部分,一般情況下總評(píng)成績(jī)是二者的加權(quán)之和。用[total]表示總評(píng)成績(jī),[tp]表示平時(shí)成績(jī),[tk]表示考試成績(jī),[wp]和[wk]分別表示[tp]和[tk]的權(quán)重,其中[wp+wk=1],那么,總評(píng)成績(jī)的公式表示如下[7]:
[total=wp*tp+wk*tk]
為了更直觀的分析課程成績(jī)?cè)u(píng)定特點(diǎn),本文引用了學(xué)生成績(jī)?cè)u(píng)定指標(biāo),用[pk]表示,用平時(shí)成績(jī)與期末考試成績(jī)的比值作為評(píng)定指標(biāo)的依據(jù),如以下公式所示:
[pk=tptk]
若[pk=1],表示平時(shí)成績(jī)與考試成績(jī)基本相同;若[pk>1],表示平時(shí)成績(jī)明顯高于考試成績(jī),若[pk<1],表示平時(shí)成績(jī)明顯低于考試成績(jī),[pk]越小,表示平時(shí)成績(jī)?cè)降陀诳荚嚦煽?jī)[7]。
將學(xué)生的平時(shí)成績(jī)、期末考試成績(jī)、總評(píng)成績(jī)進(jìn)行歸一化處理(即將平時(shí)成績(jī)、期末考試成績(jī)、總評(píng)成績(jī)除以一百),在引入學(xué)生成績(jī)?cè)u(píng)定指標(biāo)時(shí),分析不同學(xué)生班級(jí)的成績(jī)?cè)u(píng)定情況,如圖1所示。
從圖1可看出,每個(gè)班級(jí)的成績(jī)?cè)u(píng)定指標(biāo)基本都大于1,說(shuō)明平時(shí)成績(jī)普遍高于期末考試成績(jī),且大多數(shù)班級(jí)的成績(jī)?cè)u(píng)定指標(biāo)介于1.4至1.6之間,還有少部分班級(jí)的成績(jī)?cè)u(píng)定指標(biāo)介于1.2至1.4之間。從歸一化的成績(jī)亦可反映上述問(wèn)題,平時(shí)成績(jī)的趨勢(shì)線高于總評(píng)成績(jī)高于期末成績(jī)。圖1可以清晰的反映每個(gè)班級(jí)的成績(jī)?cè)u(píng)定指標(biāo)規(guī)律。
2.2 基于雷達(dá)圖分析不同課程的成績(jī)分析趨勢(shì)
以每個(gè)課程的成績(jī)作為樣本畫(huà)雷達(dá)圖,得到雷達(dá)圖如圖2所示,從雷達(dá)圖的橫縱軸兩個(gè)維度進(jìn)行分析,橫向比較不同課程成績(jī)的分布區(qū)域,了解每門(mén)課程的教學(xué)狀態(tài);縱向可看出平時(shí)、期末、總評(píng)成績(jī)的走勢(shì),便于任課老師針對(duì)性的開(kāi)展教學(xué)工作。
從圖2可以看出,雖然平時(shí)成績(jī)高于總評(píng)成績(jī),但是總評(píng)成績(jī)的走勢(shì)基本和期末成績(jī)的走勢(shì)保持一致,說(shuō)明期末成績(jī)?cè)诳傇u(píng)成績(jī)中占據(jù)重要部分,學(xué)生在注重平時(shí)成績(jī)的同時(shí),更應(yīng)該重視期末成績(jī)。
2.3 以課程為粒度分析期末卷面成績(jī)和總評(píng)成績(jī)間的關(guān)系
以課程為粒度比較不同課程間的總評(píng)成績(jī)和期末卷面成績(jī)間的關(guān)系如圖3所示。其中,橫軸是課程期末卷面成績(jī),縱軸是課程總評(píng)成績(jī),對(duì)兩者進(jìn)行相關(guān)性分析,用實(shí)線標(biāo)示二者之間的關(guān)系。同時(shí),分別標(biāo)示出期末卷面成績(jī)和總評(píng)成績(jī)的最低值、平均值、最高值及及格線。
從圖3的對(duì)角實(shí)線可以看出,總評(píng)成績(jī)隨著期末成績(jī)的增大而增大,即總評(píng)成績(jī)與課程期末卷面成績(jī)呈線性相關(guān)性,因此,教師可以此鼓勵(lì)學(xué)生重視期末成績(jī)。根據(jù)圖5中期末成績(jī)和總評(píng)成績(jī)的及格線可發(fā)現(xiàn),期末成績(jī)不及格而總評(píng)成績(jī)及格的課程,如圖3中三角形狀標(biāo)示的課程,針對(duì)這部分課程,教學(xué)管理者可考慮,看該課程是否存在放水可能。對(duì)于總評(píng)成績(jī)和卷面成績(jī)?cè)诰狄韵禄蛞宰蟮恼n程表示這些課程的成績(jī)低于全部課程的整體均值水平,針對(duì)這些課程的教學(xué)管理者也應(yīng)重點(diǎn)關(guān)注,教學(xué)管理者甚至可采取相應(yīng)的措施來(lái)提升這些課程的成績(jī)。
2.4 基于詞云的課程不及格率分析
假設(shè)某班級(jí)學(xué)生總?cè)藬?shù)為[Ni],其總評(píng)成績(jī)不及格的人數(shù)為[Bi],那么該班級(jí)總評(píng)成績(jī)不及格率[Pi]可用公示表示如下:
[Pi=NiBi]
以班級(jí)為粒度將總評(píng)成績(jī)不及格率用詞云進(jìn)行呈現(xiàn),如圖4,其中字體越大越明顯的班級(jí)表示不及格率越高,字體越小越不明顯的班級(jí)表示不及格率越小。
從圖4可直觀的反映出,字體較大較明顯的即為不及格率較高的班級(jí),對(duì)于不及格率相對(duì)較低的班級(jí)字體較小。通過(guò)詞云可視化分析,教學(xué)管理者針對(duì)不及格率較高的班級(jí)可有的放矢的采取教學(xué)管理策略,積極采取應(yīng)對(duì)措施,提高教學(xué)質(zhì)量。
3 結(jié)束語(yǔ)
本文通過(guò)對(duì)學(xué)生成績(jī)可視化分析,教學(xué)管理者可找出班級(jí)低于平均分的班級(jí),對(duì)這些班級(jí)負(fù)責(zé)人進(jìn)行適當(dāng)提示,班級(jí)負(fù)責(zé)人采取給學(xué)生談話、做思想工作等措施,形成良好的學(xué)習(xí)氛圍;教學(xué)管理者還可找到課程低于平均分的任課老師,可采取某些激勵(lì)措施,爭(zhēng)取提高其所代課程的成績(jī);還可以使教學(xué)管理者更好的了解學(xué)生的學(xué)業(yè)情況,使學(xué)生的學(xué)業(yè)管理工作順利開(kāi)展。同時(shí),讓學(xué)生對(duì)自己的學(xué)業(yè)情況有所了解,能促進(jìn)學(xué)生及時(shí)、積極的應(yīng)對(duì)學(xué)業(yè)問(wèn)題。對(duì)于教學(xué)管理者如何制定長(zhǎng)期有效的措施來(lái)促進(jìn)教學(xué)和學(xué)生的學(xué)業(yè)發(fā)展還需要進(jìn)一步研究。
參考文獻(xiàn)(References):
[1] 劉祥鵬.基于學(xué)生過(guò)去的學(xué)習(xí)成績(jī)預(yù)測(cè)并改善未來(lái)學(xué)習(xí)成績(jī)的大數(shù)據(jù)服務(wù)[J].科技展望,2015.27.
[2] 陸萬(wàn)萬(wàn).一種基于大數(shù)據(jù)的案件信息智能分析系統(tǒng)[J].計(jì)算機(jī)應(yīng)用與軟件,2018.9:153-156
[3] 吳雪峰,馬路.數(shù)據(jù)挖掘技術(shù)及在制造業(yè)的應(yīng)用[J].計(jì)算機(jī)應(yīng)用與軟件,2017.10:77-83
[4] 何琰.大數(shù)據(jù)技術(shù)在審計(jì)中的應(yīng)用[J].鄭州輕工業(yè)學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版),2016.17(3):67-71
[5] 余水發(fā),張惠鋒,傅海婷等.基于統(tǒng)計(jì)圖表的學(xué)生考試成績(jī)可視化分析[J].教育教學(xué)論壇,2015.8:77-79
[6] 黃炎,王紫玉,黃方亮.數(shù)據(jù)挖掘技術(shù)在高校學(xué)生成績(jī)分析中的應(yīng)用與研究[J].蘭州文理學(xué)院學(xué)報(bào)(自然科學(xué)版),2016.29(3):64-68
[7] 苑俊英,陳海山,常超等.高級(jí)語(yǔ)言程序設(shè)計(jì)課程成績(jī)分析[J].教育現(xiàn)代化,2019.17:86-90
收稿日期:2020-08-24
基金項(xiàng)目:河南省科技攻關(guān)項(xiàng)目(202102310232)
作者簡(jiǎn)介:楊彩(1990-),女,河南南陽(yáng)人,碩士,初級(jí)工程師,主要研究方向:教育信息化、數(shù)據(jù)挖掘、計(jì)算機(jī)技術(shù)。