肖自乾 陳經(jīng)優(yōu)
摘要:目前越來(lái)越多的教師選擇“互聯(lián)網(wǎng)+”線上線下相結(jié)合的模式開展教學(xué)活動(dòng),如何利用信息化技術(shù)進(jìn)一步優(yōu)化學(xué)情分析以提高教學(xué)質(zhì)量是我們需要面對(duì)的問(wèn)題。文章以智慧樹在線教學(xué)平臺(tái)學(xué)生平時(shí)各方面表現(xiàn)數(shù)據(jù)為研究基礎(chǔ),通過(guò)大數(shù)據(jù)聚類分析對(duì)學(xué)生進(jìn)行分類,直觀呈現(xiàn)不同學(xué)生群體特點(diǎn),便于教師有針對(duì)性地提出相應(yīng)教學(xué)策略。
關(guān)鍵詞:智慧樹;聚類;K-均值;可視化;離散點(diǎn)
中圖分類號(hào):TP301 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)19-0028-02
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
1 引言
隨著信息技術(shù)的發(fā)展,教學(xué)模式的不斷改革創(chuàng)新,越來(lái)越多的教師選擇“互聯(lián)網(wǎng)+”線上線下相結(jié)合的教學(xué)模式。目前市場(chǎng)上涌現(xiàn)出眾多網(wǎng)絡(luò)課程互動(dòng)平臺(tái),相關(guān)企業(yè)機(jī)構(gòu)也在積極探索不斷優(yōu)化線上線下的教學(xué)設(shè)計(jì)。本文以智慧樹在線教學(xué)平臺(tái)學(xué)生平時(shí)各方面表現(xiàn)數(shù)據(jù)為研究基礎(chǔ),通過(guò)大數(shù)據(jù)聚類分析對(duì)學(xué)生進(jìn)行分類,呈現(xiàn)不同學(xué)生群體特點(diǎn),便于教師有針對(duì)性地提出相應(yīng)教學(xué)策略,從而優(yōu)化教學(xué)方式方法,提升教學(xué)效果。
2 聚類分析算法
聚類是統(tǒng)計(jì)數(shù)據(jù)分析的一門技術(shù),在許多領(lǐng)域受到廣泛應(yīng)用,包括機(jī)器學(xué)習(xí),數(shù)據(jù)挖掘,模式識(shí)別,圖像分析以及生物信息。聚類是把相似的對(duì)象通過(guò)靜態(tài)分類的方法分成不同的簇或者更多的子集,同一個(gè)簇或子集中的所有對(duì)象都有相似的特點(diǎn)或?qū)傩訹1]。
2.1 K-均值算法
K-均值算法是在信號(hào)處理中常使用的一種向量量化方法,目前在數(shù)據(jù)挖掘等領(lǐng)域應(yīng)用較為廣泛,如游客客戶分類等應(yīng)用場(chǎng)景。它是一種基于相似性的無(wú)監(jiān)督學(xué)習(xí)算法,在判定兩個(gè)樣本相似性時(shí)通常需要定義一個(gè)距離函數(shù)。K-均值算法的目標(biāo)是將把n個(gè)點(diǎn)劃分到k個(gè)簇中,使得每個(gè)點(diǎn)都屬于離他最近的均值(此即簇的質(zhì)心)對(duì)應(yīng)的簇,每個(gè)簇的中心是通過(guò)計(jì)算簇中所含值的均值得到的,并以之作為聚類的標(biāo)準(zhǔn)[2]。
2.2 本課題數(shù)據(jù)分析流程
本課題研究中,首先我們應(yīng)用肘部法則對(duì)數(shù)據(jù)進(jìn)行分析,得到不同k值時(shí)的平均畸變程度,一般我們會(huì)選擇平均畸變程度最大的k值進(jìn)行聚類分析;然后是根據(jù)得到的k值進(jìn)行聚類分析,在這里我們使用的是MachineLearning開源庫(kù)中的KMeans算法,算法流程在這里就不再詳細(xì)闡述;緊接著我們將聚類得到的數(shù)據(jù)進(jìn)行降維處理,并可視化呈現(xiàn),同時(shí)我們還對(duì)離群點(diǎn)進(jìn)行統(tǒng)計(jì),以便于我們對(duì)數(shù)據(jù)做更全面的分析;最后是根據(jù)得到的各簇質(zhì)心繪制雷達(dá)圖.呈現(xiàn)不同學(xué)生類別的表現(xiàn)情況。
3 網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)學(xué)生數(shù)據(jù)
智慧樹平臺(tái)中導(dǎo)出的平時(shí)成績(jī)由視頻資源學(xué)習(xí)、非視頻資源學(xué)習(xí)、簽到、測(cè)試、討論答疑、頭腦風(fēng)暴、投票問(wèn)卷、作業(yè)/小組任務(wù)、課堂表現(xiàn)、被老師點(diǎn)贊加分等構(gòu)成,加權(quán)比例可根據(jù)實(shí)際情況進(jìn)行調(diào)整。現(xiàn)將成績(jī)項(xiàng)分為四部分,即:自學(xué)、守紀(jì)、實(shí)踐以及互動(dòng),本文的數(shù)據(jù)分析將圍繞這四個(gè)維度進(jìn)行[3]。為避免每個(gè)指標(biāo)數(shù)據(jù)取值范圍差異過(guò)大的問(wèn)題,需要進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理,得到成績(jī)表如下:
4 數(shù)據(jù)分析及結(jié)論
4.1 確定k值
根據(jù)肘部法則對(duì)學(xué)生成績(jī)數(shù)據(jù)進(jìn)行分析,計(jì)算不同k值時(shí)的平均畸變程度,如圖1所示。
從圖1可以看出,隨著k值的變化平均畸變程度也在不斷變化,在當(dāng)前的樣本數(shù)據(jù)分析中當(dāng)k值為3時(shí),平均畸變程度最大,因此我們用k值為3進(jìn)行聚類分析。
4.2 聚類結(jié)果可視化
選取k值為3時(shí)聚類結(jié)果可視化如圖2所示,聚類分析數(shù)據(jù)結(jié)果見(jiàn)表2聚類分析后數(shù)據(jù)。
4.3 雷達(dá)圖展示
雷達(dá)圖是以從同一點(diǎn)開始的軸上表示的三個(gè)或更多個(gè)定量變量的二維圖表的形式顯示多變量數(shù)據(jù)的圖形方法。雷達(dá)圖主要應(yīng)用于企業(yè)經(jīng)營(yíng)狀況——收益性、生產(chǎn)性、流動(dòng)性、安全性和成長(zhǎng)性的評(píng)價(jià)[4]。各類學(xué)生雷達(dá)圖呈現(xiàn)如圖3所示。
4.4 離群點(diǎn)分析
本課題研究采用基于距離的離群點(diǎn)檢測(cè),這些離群點(diǎn)往往代表學(xué)生可能具有比較特殊的特點(diǎn),因此我們需要對(duì)這些情況進(jìn)行詳細(xì)分析[5]。離群點(diǎn)分析如圖4所示。
4.5 結(jié)果分析
首先從聚類結(jié)果來(lái)看,“0”類學(xué)生在雷達(dá)圖中顯示最為全面,各方面表現(xiàn)均較為良好;“1”類學(xué)生在實(shí)踐和互動(dòng)兩方面表現(xiàn)差強(qiáng)人意;“2”類學(xué)生則各方面表現(xiàn)均較差,特別是在自學(xué)方面。其次從離群點(diǎn)分析來(lái)看,3個(gè)離群點(diǎn)均屬“1”類學(xué)生,通過(guò)對(duì)比發(fā)現(xiàn),其中一個(gè)學(xué)生在自學(xué)、實(shí)踐以及互動(dòng)方面均較差,但在守紀(jì)方面做得較好,其他2位學(xué)生在四個(gè)方面的表現(xiàn)非常不均衡,但同時(shí)也存在很大的提高潛力,教師在教學(xué)過(guò)程中多加關(guān)注、指導(dǎo)將會(huì)有很大進(jìn)步。
5 結(jié)語(yǔ)
本課題通過(guò)對(duì)學(xué)生平時(shí)表現(xiàn)數(shù)據(jù)進(jìn)行聚類分析,將具備相似特點(diǎn)的學(xué)生聚成一類,教師則可以通過(guò)特點(diǎn)分析找出適合的教育教學(xué)方法,逐步促進(jìn)學(xué)生各方面的改進(jìn)和提高,同時(shí)對(duì)于一些具備特定特點(diǎn)的學(xué)生則可以更加明確的掌握,以便幫助其逐步改進(jìn)。
參考文獻(xiàn):
[1]王川,張珍文,安帥,聚類支持下決策樹模型在動(dòng)車組空調(diào)故障檢測(cè)中的應(yīng)用[J].中國(guó)新技術(shù)新產(chǎn)品,2018(13):15-16.
[2]張興強(qiáng).基于快速局部均值估計(jì)的噪聲水平估計(jì)算法及其應(yīng)用研究[D].南昌大學(xué),2017.
[3]楊洪琴,楊輝.大數(shù)據(jù)視域下大學(xué)生移動(dòng)學(xué)習(xí)探究——基于智慧樹平臺(tái)的公選課應(yīng)用分析[J].四川職業(yè)技術(shù)學(xué)院學(xué)報(bào),2019,29(03):115-122.
[4]劉香榮.基于HMM的管道安全監(jiān)測(cè)DAS信號(hào)時(shí)序信息挖掘與識(shí)別方法[D].電子科技大學(xué),2019.
[5]鄧玉潔,基于聚類的離群點(diǎn)分析方法研究[D].重慶大學(xué),2012.
【通聯(lián)編輯:王力】
基金項(xiàng)目:海南省教育廳科學(xué)研究項(xiàng)目:K-means聚類算法在旅游業(yè)游客細(xì)分中的應(yīng)用研究(Hnky2016-66);海南自然科學(xué)基金項(xiàng)目:基于MapReduce的改進(jìn)樸素貝葉斯算法在社交網(wǎng)絡(luò)數(shù)據(jù)挖掘中的研究及應(yīng)用(618MS078)
作者簡(jiǎn)介:肖自乾(1982-),男,四川省自貢市人,碩士,海南軟件職業(yè)技術(shù)學(xué)院副教授,主要研究方向?yàn)樗惴ㄔO(shè)計(jì)、大數(shù)據(jù)技術(shù);陳經(jīng)優(yōu)(1983-),女,海南省東方市人,碩士,海南軟件職業(yè)技術(shù)學(xué)院副教授,主要研究方向?yàn)樗惴ㄔO(shè)計(jì)、軟件設(shè)計(jì)。