明巧英, 劉淑婷(西安翻譯學(xué)院, 西安 710105)
決策樹在學(xué)生成績影響因素分析中的應(yīng)用
明巧英, 劉淑婷
(西安翻譯學(xué)院, 西安 710105)
學(xué)生的學(xué)習(xí)成績是評估教學(xué)質(zhì)量的重要依據(jù),但影響學(xué)生成績的因素很多。利用數(shù)據(jù)挖掘的核心技術(shù)之一決策樹,找出影響學(xué)生成績的潛在因素,并有針對性地采取措施,有利于提高教育教學(xué)質(zhì)量。
決策樹; 成績分析; 解決對策
Abstract: Students’ achievement is the basic index for the evaluation of teaching quality. However, it may be subject to a lot of influencing factors. Implementing Decision Tree, one of the core technologies of Data Mining, this paper aims to explore the potential factors affecting students’ achievement, taking targeted measures to improve education and teaching quality.
Keywords: Decision Tree; Achievement Analysis; Coping Measures
隨著社會的發(fā)展,高校的招生規(guī)模也不斷的擴(kuò)大,除了學(xué)生數(shù)量增加外,影響學(xué)生成績的因素也在增加。在我國目前的教育行業(yè)中,學(xué)生成績是衡量學(xué)生對所學(xué)知識掌握程度的重要標(biāo)準(zhǔn),因此不可忽視。所以說對學(xué)生成績的影響因素的分析尤為重要,利用一定的技術(shù)分析學(xué)生的日常行為、教務(wù)管理系統(tǒng)中的數(shù)據(jù)等,獲取其中隱含的有價值的信息,找出課程成績和各種相關(guān)因素之間的內(nèi)在聯(lián)系,利于教學(xué)相關(guān)部門、教師正確制定相關(guān)措施,利于教學(xué)質(zhì)量的提高,最大程度地增強(qiáng)教學(xué)效果。
本文主要介紹數(shù)據(jù)挖掘中的決策樹技術(shù)在學(xué)生成績影響因素分析中的挖掘分析,全面了解影響學(xué)生成績的因素,幫助教師教學(xué),給教學(xué)管理者提供決策依據(jù)。數(shù)據(jù)挖掘就是對數(shù)據(jù)庫或巨大的數(shù)據(jù)集進(jìn)行分析,挖掘出未知的、隱含的、用戶感興趣的和有潛在價值的信息及規(guī)則,能為用戶提供決策的依據(jù)。決策樹技術(shù)是數(shù)據(jù)挖掘的核心技術(shù)之一,樹中的非葉節(jié)點對應(yīng)著數(shù)據(jù)集中的某屬性,葉節(jié)點則對應(yīng)著分類的結(jié)果。從根節(jié)點開始到任一葉節(jié)點為止,對應(yīng)著一條分類規(guī)則,因此整個決策樹就對應(yīng)著一組析取表達(dá)式規(guī)則,可以If-Then形式表現(xiàn)。總之,決策樹以樹型結(jié)構(gòu)表達(dá)最終的分類結(jié)果,便于使用者理解。
2.1 確定分析對象
以筆者2015—2016學(xué)年第二學(xué)期所授的《網(wǎng)頁設(shè)計》課程為例,分析的對象是電子商務(wù)專業(yè)2015級的學(xué)生。主要挖掘?qū)W生的非智力因素、課程測試成績、課程設(shè)計等方面的數(shù)據(jù),通過分析數(shù)據(jù),依據(jù)分析結(jié)果,使教師能及時地采取有效的教學(xué)方法指導(dǎo)教學(xué),提高教學(xué)質(zhì)量。
2.2 數(shù)據(jù)的采集
本研究的數(shù)據(jù)主要有兩個來源:一部分是回收統(tǒng)計調(diào)查問卷的結(jié)果;另一部分是學(xué)生的考核成績、課程設(shè)計完成情況(來自于教務(wù)管理系統(tǒng)),如表1~表3所示。
2.3 數(shù)據(jù)的處理
數(shù)據(jù)收集完成以后,需要處理才能進(jìn)行挖掘,主要是因為在這些數(shù)據(jù)中可能含有噪聲(無效的或置信度低)數(shù)據(jù),處理噪聲數(shù)據(jù)后,才能建立出高準(zhǔn)確率的數(shù)據(jù)模型。
在調(diào)查問卷中,為了方便被調(diào)查者作答,文字描述用選項的方式來表現(xiàn)(即選擇ABCD項),而此時又需要把這些選項重新用文字描述表示出來(即將收集來的ABCD選項還原為“是”、“否”等文字)。
學(xué)生成績表中的缺考、休學(xué)等記錄,要進(jìn)行清理刪除,因為這種情況屬于數(shù)據(jù)缺失,是無效的,清理后確保表格數(shù)據(jù)的完整性。
表1 問卷調(diào)查的部分題目
表2 課程測試的部分?jǐn)?shù)據(jù)
表3 課程設(shè)計的部分?jǐn)?shù)據(jù)
根據(jù)實際情況,把學(xué)生成績的評價指標(biāo)分為四個等級,優(yōu)秀:85分以上,含85;良好:70—84;合格:60—69;不合格60分以下。
2.4 構(gòu)建決策樹模型
分別以末考成績、平時成績、課程設(shè)計、問卷調(diào)查分析結(jié)果為根結(jié)點,計算其信息增益,信息增益中末考成績最大,所以以末考成績作為根結(jié)點構(gòu)建學(xué)生成績分析決策樹,如圖1所示。
2.5 決策樹模型分析及解決對策
決策樹最大的優(yōu)點是可直接提取分類規(guī)則,并以IF…THEN的形式表示出來。觀察圖1的決策樹,把其轉(zhuǎn)換成如下的分類規(guī)則:
規(guī)則1:IF末考成績=“優(yōu)秀”AND平時成績>=“良好”AND課程設(shè)計>=“良好”AND問卷分析>=“合格”THEN總成績=“優(yōu)秀”;
圖1 學(xué)生成績分析決策樹
規(guī)則2:IF末考成績=“優(yōu)秀”AND平時成績>=“良好”AND課程設(shè)計=“合格”AND問卷分析>=“良好”THEN總成績=“優(yōu)秀”;
通過規(guī)則1和2發(fā)現(xiàn):基礎(chǔ)知識和非智力因素都比較好的學(xué)生,只要平時刻苦努力,該門課程的綜合成績自然是優(yōu)秀。
規(guī)則3:IF末考成績>=“合格”AND平時成績=“不合格”AND課程設(shè)計>=“合格”AND問卷分析>=“合格”THEN總成績>=“合格”;
通過規(guī)則3發(fā)現(xiàn):基礎(chǔ)知識和非智力因素都比較好的一部分學(xué)生,由于平時的自我管理松懈,導(dǎo)致成績平平。對這部分學(xué)生應(yīng)加強(qiáng)平時的教育管理,可使其更優(yōu)秀。
規(guī)則4:IF末考成績=“不合格”AND平時成績>=“合格”AND課程設(shè)計>=“合格”AND問卷分析<=“合格”THEN總成績=“不合格”;
通過規(guī)則4發(fā)現(xiàn):這類學(xué)生基礎(chǔ)一般,動手能力較好,學(xué)習(xí)踏實認(rèn)真,但是心理素質(zhì)差,學(xué)習(xí)方法不當(dāng),導(dǎo)致綜合成績不合格,對于這類學(xué)生首先要進(jìn)行心理素質(zhì)的教育和鍛煉,其次要幫助學(xué)生改變學(xué)習(xí)方法。
規(guī)則5:IF末考成績=“不合格”AND平時成績>=“合格”AND課程設(shè)計=“不合格”AND問卷分析=“不合格”THEN總成績=“不合格”;
通過規(guī)則5發(fā)現(xiàn):這類學(xué)生平時的學(xué)習(xí)態(tài)度是值得肯定的,但由于基礎(chǔ)和多方面的非智力因素差,導(dǎo)致綜合成績不合格,解決辦法是平時多鼓勵學(xué)生,有針對性的做一些訓(xùn)練。
數(shù)據(jù)挖掘是深層次的數(shù)據(jù)信息分析方法,是一種決策支持過程。本文建立了學(xué)生成績分析決策樹模型,提出了影響學(xué)生成績的分類規(guī)則,利用這些規(guī)則,可以幫助教師有針對性地教學(xué)和管理學(xué)生,以達(dá)到提高教學(xué)質(zhì)量的目的,為培養(yǎng)合格的人才打下堅實的基礎(chǔ)。
[1] 商俊燕,陸兵,柏倩然.決策樹C4.5算法在學(xué)生成績分析中的應(yīng)用[J].微型電腦應(yīng)用,2015,31(04):43-43-44.
[2] 李巧君,李偉.數(shù)據(jù)挖掘技術(shù)在學(xué)生成績分析中的應(yīng)用研究[J].微型電腦應(yīng)用,2015,31(04):35-35,36.
[3] 雷燕瑞.數(shù)據(jù)挖掘技術(shù)在高職成績分析中的應(yīng)用[J].軟件,2013,34(12):70-171.
[4] 王平霞,郝志廷.決策樹技術(shù)在高職院校學(xué)生成績分析中的應(yīng)用研究[J].電腦知識與技術(shù),2013,9(13):2960-2963.
TheApplicationofDecisionTreeintheInfluencingFactorAnalysisofStudents'Achievement
Ming Qiaoying, Liu Shuting
(Xi'an FanYi University, 710105)
TP311
A
2016.11.30)
“決策樹技術(shù)在高職類學(xué)生成績分析中的研究及應(yīng)用”課題(16B01)
明巧英(1981-),女,西安人,講師,工程碩士研究生,研究方向:數(shù)據(jù)挖掘. 劉淑婷(1984-),女,西安人,講師,工程碩士研究生,研究方向:網(wǎng)絡(luò)工程.
1007-757X(2017)09-0039-02