• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于CART決策樹的計算機網(wǎng)絡(luò)課程學(xué)生成績分析

      2019-02-26 06:45:38劉一帆
      計算機教育 2019年12期
      關(guān)鍵詞:小類決策樹計算機網(wǎng)絡(luò)

      劉一帆,詹 靜,2,范 雪

      (1.北京工業(yè)大學(xué) 計算機學(xué)院,北京 100124;2.可信計算北京市重點實驗室,北京 100124)

      0 引言

      隨著中國教育規(guī)模日益增長,讓高校教育方法得到更有針對性的改善是目前教育領(lǐng)域的重要任務(wù)。教學(xué)信息管理系統(tǒng)在普及過程中積累了較多的學(xué)生信息數(shù)據(jù),但一般只進行簡單的數(shù)據(jù)備份存儲、查詢工作,沒有進一步剖析數(shù)據(jù)背后的價值。一些學(xué)者將數(shù)據(jù)挖掘技術(shù)應(yīng)用于教育數(shù)據(jù)的處理,期望通過分析影響學(xué)生成績的內(nèi)在因素改進教學(xué)工作。目前教育數(shù)據(jù)分析常用的方法有分類算法、聚類算法等。

      計算機網(wǎng)絡(luò)課程內(nèi)容具有知識點多、交叉關(guān)聯(lián)多,很多知識點需要同時具備工程經(jīng)驗才能更好理解的特點。由于課程內(nèi)容自身比較復(fù)雜,學(xué)生有一定的畏難情緒,對學(xué)習(xí)效率和對專業(yè)學(xué)習(xí)興趣產(chǎn)生了不利影響。為了提高學(xué)生對計算機網(wǎng)絡(luò)知識的學(xué)習(xí)效果,筆者利用CART 決策樹算法對學(xué)生的計算機網(wǎng)絡(luò)相關(guān)課程成績深入分析,找出影響學(xué)生網(wǎng)絡(luò)課程學(xué)習(xí)成績的主要因素,建立合理的成績分類模型,以便協(xié)助教師發(fā)現(xiàn)不同學(xué)生的學(xué)習(xí)特征,從而正確地評價、引導(dǎo)學(xué)生,使學(xué)生得到更好的學(xué)習(xí)效果。

      1 研究現(xiàn)狀

      決策樹算法是應(yīng)用比較廣的分類算法之一,最典型的算法是由Quinlan 提出的ID3 算法,該算法使用信息增益度量屬性進行分類,將決策樹和信息論聯(lián)系起來[1]。由于ID3 的構(gòu)造效果不夠理想,只能處理離散的數(shù)據(jù),Quinlan 又提出了C4.5 算法,對ID3 進行了改進,選擇信息增益率最大的屬性作為分類屬性[2]。文獻[3]根據(jù)決策樹算法分析了影響高校英語四級成績的諸多因素,對這些因素按照數(shù)據(jù)挖掘思想生成了規(guī)則集,為提高教學(xué)質(zhì)量奠定了基礎(chǔ)。文獻[4-5]使用決策樹算法,找出了影響學(xué)生成績的因素,提出改進的教學(xué)方法。文獻[6]使用決策樹模型預(yù)測學(xué)生是否能通過等級考試,并驗證了其準確率。文獻[7]使用K-means 聚類算法對考試成績進行等級劃分,然后用R-C4.5 算法構(gòu)造了決策樹,減少了決策樹中無意義的分支,找出了影響成績的主要因素。文獻[8]使用Weka 作為實驗平臺,使用C4.5 等多種算法對學(xué)生的專業(yè)課程成績信息建模,通過學(xué)生前期基礎(chǔ)課程的學(xué)習(xí)情況預(yù)測專業(yè)能力是否能達到標準。文獻[9]采用決策樹算法記錄了學(xué)生的學(xué)習(xí)情況,提供了個性化指導(dǎo)建議。文獻[10]以學(xué)生定型數(shù)據(jù)為研究對象,比較了各決策樹算法的性能,實驗說明CART 的分類精度更高。文獻[11]對數(shù)學(xué)和系統(tǒng)分析與設(shè)計兩個擁有1 000 名學(xué)生的數(shù)據(jù)集進行了學(xué)習(xí)行為分析和預(yù)測,發(fā)現(xiàn)CART 是預(yù)測兩門學(xué)科成績的最佳分類器。

      2 CART決策樹算法概述

      CART 是一種決策樹學(xué)習(xí)算法,使用基尼指數(shù)(Gini_index)選擇劃分屬性,計算方式如公式(1)所示。其中,Gini 值越小,表示數(shù)據(jù)集純度越高,劃分效果越好。

      其中,D 為數(shù)據(jù)集,pi是類別i 出現(xiàn)在D 中的概率,a 為待劃分的屬性,v 為屬性a 可取的值,Dv為數(shù)據(jù)集中取值為v 的樣本。CART 算法生成的決策樹為二叉樹,分割步驟如下。

      (1)對于二叉樹每一個節(jié)點選擇Gini 值最小的屬性作為分割點。

      (2)在最優(yōu)屬性的所有取值中選擇對該節(jié)點最優(yōu)的分割點,作為該節(jié)點的分割規(guī)則。

      (3)重復(fù)上述步驟,對分割出來的左右節(jié)點繼續(xù)進行分割,直到所有的樣本基本都屬于同一類別停止分割。

      3 數(shù)據(jù)處理

      使用的數(shù)據(jù)集為計算機學(xué)院信息安全專業(yè)2013 級2 個班(班號分別為130721、130722)、2014 級1 個班(班號為140721)、2015 級1 個班(班號為150743)本科生的基本信息和學(xué)習(xí)數(shù)據(jù),共124 人。

      CART 決策樹輸入屬性包括分組角色(組長與非組長)、性別、民族(漢與非漢)、理論努力程度、實踐努力程度5 個。

      前3 個屬性原始數(shù)據(jù)為文本類型,將其轉(zhuǎn)換為數(shù)值類型,擔(dān)任實驗組長則該值為1,非組長為0,性別為男值為1,性別為女值為0,少數(shù)民族值為1,漢族值為0。

      理論和實踐努力程度分別表示學(xué)生平時理論和實踐學(xué)習(xí)的努力程度,具體計算如公式(3)和(4)所示。

      其中,Stheory為理論努力程度,Sexperiment為實踐努力程度,Tattempt為在線練習(xí)作業(yè)嘗試次數(shù),Tvisit為在線練習(xí)系統(tǒng)的訪問次數(shù),score 為實驗加分,seq()為從高到低排序函數(shù),n 為學(xué)生總數(shù)。

      CART 決策樹訓(xùn)練樣本的分類等級即學(xué)生成績等級。本文根據(jù)成績排名進行劃分,排名前20%學(xué)生為A,中間60%學(xué)生為B,后20%學(xué)生為C。

      按照公式(3)及(4)計算,可得到學(xué)生學(xué)習(xí)數(shù)據(jù),部分學(xué)生的學(xué)習(xí)數(shù)據(jù)示例見表1。其中前5 列為輸入屬性,最后一列為訓(xùn)練樣本的分類等級。

      表1 部分學(xué)生學(xué)習(xí)數(shù)據(jù)示例

      4 基于CART決策樹的學(xué)生成績建模

      根據(jù)第2 節(jié)所述CART 決策樹算法對上述學(xué)生成績進行建模,發(fā)現(xiàn)在不做任何限制的情況下可得到9 層決策樹模型,但分類準確率較低(采用十折交叉驗證的方法準確率為68%)。因此,通過調(diào)整屬性和樹深度的方法對決策樹進行進一步優(yōu)化。

      首先,計算各屬性權(quán)重,計算方法如公式(5)所示。

      其中,a 為屬性,nodea為以a 為劃分屬性的節(jié)點個數(shù),total_node 為決策樹中除葉節(jié)點之外的節(jié)點總數(shù)。

      由表2 可看出,分組角色、民族兩個屬性的權(quán)重值都在5%以下,對學(xué)生最終成績的影響較小,故只保留性別、理論努力程度、實踐努力程度3 個屬性。

      表2 各屬性權(quán)重 %

      然后,計算不同深度CART 決策樹的分類準確率。當深度為4 的時候準確率為78.2%,此后再增加深度時,準確率提高幅度不再顯著,見圖1。

      綜上所述,將決策樹屬性限制為性別、理論努力程度、實踐努力程度3 個屬性,深度設(shè)置為4,得到基于CART 決策樹的學(xué)生成績模型,見圖2。

      圖1 不同深度CART 樹的分類準確率

      5 基于決策樹分類規(guī)則的學(xué)生成績及教學(xué)建議分析

      首先,根據(jù)屬性對學(xué)生成績影響程度進行分析。屬性剪枝后,實踐努力程度、理論努力程度和性別對學(xué)生成績的影響分別為61.5%,30.8%和7.7%,不同屬性的相對影響力與剪枝前一致??芍獙嵺`努力程度對學(xué)生成績影響確實最大。這也驗證了計算機網(wǎng)絡(luò)課程對工程實踐能力的要求較高的特點。因此,在計算機網(wǎng)絡(luò)類課程教學(xué)過程中有必要加強實驗指導(dǎo)和效果跟蹤,從而最大限度提高學(xué)生成績。

      其次,根據(jù)決策樹分類規(guī)則進行分析。分類規(guī)則及符合規(guī)則的樣本比例見表3,其中A、B、C 等級比例與第3 節(jié)預(yù)設(shè)比列略有差別,分別為22%,51.5%,26.5%,這是因為學(xué)生成績模型準確率未達到100%所致。

      1)A 類學(xué)生分類規(guī)則分析及教學(xué)建議。

      A 類學(xué)生人數(shù)占總樣本的22%,其共同特點是實踐努力程度較高(>0.694)。在此前提下,理論努力程度和性別差異對學(xué)生成績影響極小。這也比較符合教學(xué)事實,因為實踐的基礎(chǔ)是理論,事實上,實踐能讓學(xué)生能夠再次理解和掌握理論知識點。

      因此,A 類學(xué)生分類規(guī)則非常符合第一點根據(jù)屬性對學(xué)生成績影響程度提出的教學(xué)建議,即應(yīng)通過在計算機網(wǎng)絡(luò)類課程教學(xué)過程中加強實驗指導(dǎo)和效果跟蹤提高學(xué)生的學(xué)習(xí)能力和效果,并且這對培養(yǎng)高水平學(xué)生非常重要。

      2)B 類學(xué)生分類規(guī)則分析及教學(xué)建議。

      B 類學(xué)生人數(shù)占樣本的51.5%,共分為5 個小類。其中前兩小類與A 類同學(xué)特點類似,后兩小類與C 類學(xué)生特點類似。中間小類學(xué)生人數(shù)較多,比較有代表性。

      第1 小類只有1 位(比例為0.8%)實踐和理論努力程度都較高(0.796 <實踐努力程度≤0.881,理論努力程度>0.763),但綜合成績未得到A 的學(xué)生,經(jīng)查可能存在臨場發(fā)揮問題。

      第2 小類有6 位(比例為4.8%)實踐努力程度較高(0.769 <努力程度≤0.796)的同學(xué)。經(jīng)查屬于“搭便車”類型學(xué)生,因與實踐能力較強的學(xué)生同組,實驗分相對較高,但獨立能力不強。

      第3 小類學(xué)生(比例為40.3%)最多(0.286<實踐努力程度≤0.694)其他屬性對其成績影響極小。這進一步說明了實驗對網(wǎng)絡(luò)課程學(xué)習(xí)的重要性。

      第4 小類學(xué)生(比例為4%)是實踐努力程度不高,但理論努力程度相對較高(實踐努力程度≤0.286,理論努力程度>0.362,性別為女)的女生得到了B,而同等努力程度的男生成績則為C,經(jīng)查證可能因為這些學(xué)生比較重視復(fù)習(xí)查漏補缺。

      圖2 基于Cart決策樹的學(xué)生成績建模

      表3 決策樹分類規(guī)則及符合規(guī)則的樣本比例

      第5 小類學(xué)生只有2 位(比例為1.6%),實踐和理論努力程度都相對較低。

      因此,從B 類學(xué)生分類規(guī)則可以得到如下3 個啟示及教學(xué)建議:實驗是區(qū)分A 類和B 類學(xué)生的關(guān)鍵環(huán)節(jié),加強實驗指導(dǎo)和效果跟蹤可以得到更好的學(xué)習(xí)效果;在實驗環(huán)節(jié)中,教師應(yīng)注意辨別“搭便車”現(xiàn)象,對這類學(xué)生加強啟發(fā)和檢查,使他們得到更好的學(xué)習(xí)效果;在復(fù)習(xí)環(huán)節(jié)加強與學(xué)生的互動,提高學(xué)生的復(fù)習(xí)效果。

      3)C 類學(xué)生分類規(guī)則分析及教學(xué)建議。

      C 類學(xué)生人數(shù)占樣本的26.5%,其共同特點是實踐和理論努力程度都不高。

      因此,在教學(xué)過程中應(yīng)及早發(fā)現(xiàn)和干預(yù)該類學(xué)生的學(xué)習(xí),在保證基礎(chǔ)知識學(xué)習(xí)的情況下提高他們的學(xué)習(xí)興趣和效果。

      6 結(jié)語

      針對計算機網(wǎng)絡(luò)基礎(chǔ)相關(guān)課程進行了基于CART 決策樹的數(shù)據(jù)分析,生成了計算機網(wǎng)絡(luò)課程學(xué)生成績分類模型,經(jīng)過十折交叉驗證模型的準確率為78.2%。分析發(fā)現(xiàn)如下4 條計算機網(wǎng)絡(luò)相關(guān)課程教學(xué)建議:首先,在計算機網(wǎng)絡(luò)課程中,影響學(xué)生成績的主要因素是實踐努力程度,并且是培養(yǎng)高水平學(xué)生的關(guān)鍵環(huán)節(jié)。因此應(yīng)在計算機網(wǎng)絡(luò)類課程教學(xué)過程中大力加強實驗指導(dǎo)和效果跟蹤。第二,在實驗環(huán)節(jié)中應(yīng)注意辨別“搭便車”現(xiàn)象,對這類學(xué)生加強啟發(fā)和檢查,使他們真正得到更好的學(xué)習(xí)效果。第三,在復(fù)習(xí)環(huán)節(jié)應(yīng)加強與學(xué)生的互動,提高其復(fù)習(xí)效果。第四,教學(xué)過程中應(yīng)及早發(fā)現(xiàn)和干預(yù)實驗和理論學(xué)習(xí)都不積極的學(xué)生,在保證基礎(chǔ)知識學(xué)習(xí)的情況下提高他們的學(xué)習(xí)興趣和效果。

      下一步研究方向包括:①本模型主要考慮學(xué)生的平時努力因素,還可進一步考慮加入期末復(fù)習(xí)評價因素;②近年來實施的小班教學(xué)模式導(dǎo)致樣本數(shù)據(jù)量不夠大,需要繼續(xù)研究大樣本下的模型是否有明顯波動。

      猜你喜歡
      小類決策樹計算機網(wǎng)絡(luò)
      一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
      計算機網(wǎng)絡(luò)環(huán)境下混合式教學(xué)模式實踐與探索
      電子制作(2018年16期)2018-09-26 03:27:08
      決策樹和隨機森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      計算機網(wǎng)絡(luò)信息安全及防護策略
      電子制作(2018年12期)2018-08-01 00:47:58
      浙江配電網(wǎng)物資標準化研究與應(yīng)用
      基于決策樹的出租車乘客出行目的識別
      計算機網(wǎng)絡(luò)技術(shù)的應(yīng)用探討
      基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
      計算機網(wǎng)絡(luò)維護工作的思考
      河南科技(2014年19期)2014-02-27 14:15:24
      小類:年輕人要多努力
      大學(xué)(2008年10期)2008-10-31 12:51:10
      山阳县| 湾仔区| 泰宁县| 建瓯市| 双柏县| 巴楚县| 伊春市| 青铜峡市| 平原县| 阿拉善右旗| 大安市| 潮州市| 关岭| 张家口市| 垦利县| 梅州市| 昭通市| 吐鲁番市| 巨鹿县| 高邑县| 武强县| 二连浩特市| 永川市| 当雄县| 永宁县| 景宁| 澄城县| 曲靖市| 九龙县| 峨眉山市| 比如县| 会东县| 宜昌市| 孟津县| 张家港市| 和顺县| 离岛区| 运城市| 洛南县| 城固县| 衡阳县|