• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)據(jù)挖掘技術(shù)在高職院校教學管理中的應用

      2018-10-29 11:09米保全
      軟件導刊 2018年8期
      關(guān)鍵詞:Apriori算法關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘

      米保全

      摘要:職業(yè)教育是我國教育改革與發(fā)展的重點之一,教學管理是提升高職院校教學質(zhì)量的關(guān)鍵環(huán)節(jié)。為了提高高職院校教學質(zhì)量和教學水平,應用大數(shù)據(jù)挖掘技術(shù)對教學數(shù)據(jù)進行分析。首先采用Apriori算法對學生成績表、課堂考勤表進行數(shù)據(jù)處理,然后挖掘隱藏在學習成績和考勤數(shù)據(jù)中的規(guī)律,分析各學期不及格科目、出勤情況與畢業(yè)狀態(tài)之間的關(guān)聯(lián)規(guī)則。通過結(jié)果分析與評估,為任課教師和教學管理部門提供指導,幫助科學規(guī)劃各學期教學管理重點,進一步改進教學管理水平,提高教學質(zhì)量。

      關(guān)鍵詞:高職院校;數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;Apriori算法; 教學管理

      DOIDOI:10.11907/rjdk.181499

      中圖分類號:TP319

      文獻標識碼:A 文章編號:1672-7800(2018)008-0178-04

      英文摘要Abstract: Vocational education is one of the key points of educational reform and development in China.Teaching management is the key link to improve the teaching quality in higher vocational colleges.In order to improve teaching quality and teaching level of higher vocational colleges,this paper adopts big data mining technology to analyze teaching data.Firstly,it adopts the Apriori algorithm to deal with the students' scores and the attendance tables.Then,by excavating the laws hidden in the academic achievement and attendance data,we analyse the association rules among the failed subjects,attendance rates and the states of graduation.Through analysis and evaluation results,it can provide guidance for teachers and teaching management staff,and help to make scientific planning of the priorities of teaching management in every semester,and further improve the levels of teaching management and teaching quality.

      英文關(guān)鍵詞Key Words:higher vocational colleges; data mining; association rules; Apriori algorithm; teaching management

      0 引言

      隨著我國制造業(yè)的轉(zhuǎn)型升級,作為培養(yǎng)技能型人才的高職院校,承擔著越來越重要的任務和使命。然而,由于高職院校學生來源的差異,教學質(zhì)量成為教育界經(jīng)常思考的問題。目前國內(nèi)高職院校招生有普通高考、分段考試、自主招生、綜合評價等多種方式。由于國家對職業(yè)教育的日益重視,高職院校面臨空前發(fā)展機遇。同時,隨著在校生人數(shù)的不斷攀升,學生素質(zhì)卻呈現(xiàn)逐年下降趨勢,考試不及格的學生越來越多。盡管對學生的評價需要多元考評方式,但考試成績?nèi)匀蛔鳛楹饬繉W生學習水平、約束學生行為的主要手段,在保證教學穩(wěn)定有序開展、提高學生學業(yè)和技能水平中仍然發(fā)揮著重要作用[1]。

      為了改進教學模式,提高教學質(zhì)量,教學管理者和研究人員提出了許多新思路。文獻[2]對我國高校當前的教學日常管理進行深入分析,并提出改進建議。文獻[3]提出在“互聯(lián)網(wǎng)+”背景下,應用O2O模式改進高校教學管理模式的思路,通過APP軟件對學生成績、出勤情況、教學評價等進行管理,提高教學效果。文獻[4]應用數(shù)據(jù)挖掘等方法,通過對學生在線學習的學業(yè)成績進行挖掘,分析影響成績的主要因素,并建立分類預測模型。文獻[5,6]通過對學生成績數(shù)據(jù)挖掘,分析學生行為與課業(yè)成績之間的關(guān)系,為進一步通過干預學生行為提高成績采取有力措施。文獻[7]設計了基于數(shù)據(jù)挖掘的學生成績管理系統(tǒng),實現(xiàn)對學校、教師、學生、成績等信息的管理。關(guān)聯(lián)規(guī)則挖掘是最主要的數(shù)據(jù)挖掘方法之一,Agrawal等[8]最早提出用于關(guān)聯(lián)規(guī)則挖掘的Apriori算法。文獻[9]在教學管理中應用Apriori算法對學生作弊行為進行分析,并提出通過改進考試手段和方式提高教學質(zhì)量的方法。文獻[10]應用Apriori算法通過對學生考試成績的挖掘,分析了大學課程中不同學科之間的關(guān)聯(lián)關(guān)系,用以改進教學計劃和課程體系建設。文獻[11,12]應用數(shù)據(jù)挖掘技術(shù)處理和分析教學數(shù)據(jù),為教學改革提供了理論依據(jù)。

      以上方法從不同角度,通過對高校教學數(shù)據(jù)的處理和分析,為教學管理提供了指導和建議。但是,高職院校作為培養(yǎng)應用型技術(shù)人才的主陣地,與普通本科院校相比,在教學管理和培養(yǎng)模式上還存在一定差異。本文針對高職院校教學管理中存在的不足,應用數(shù)據(jù)挖掘技術(shù),對學生成績表、課堂考勤表進行數(shù)據(jù)處理,挖掘隱藏在學習成績和考勤數(shù)據(jù)中的規(guī)律,分析各學期不及格科目、出勤情況與畢業(yè)狀態(tài)之間的關(guān)聯(lián)規(guī)則。通過結(jié)果分析與評估,為教學管理水平的提高和改進提供參考。

      1 教學管理現(xiàn)狀

      計算機和通信技術(shù)的發(fā)展,使高職院校的辦公和教務管理實現(xiàn)了信息化、數(shù)字化。但是,大多院校對于信息化應用只停留在提高工作效率上,而忽視了對信息化和數(shù)字化帶來的各種大數(shù)據(jù)(如學籍數(shù)據(jù)、成績數(shù)據(jù)、招生數(shù)據(jù)、就業(yè)數(shù)據(jù)等)的處理[13]。若能從這些大數(shù)據(jù)中挖掘出學生學習狀態(tài)、日常行為和學習成績之間的潛在關(guān)系,從而有針對性地加強教學管理,將會更加有效地促進教學管理工作,提高教學質(zhì)量。

      在已有的高職院校電子教務系統(tǒng)中,大多教師和教務管理部門的數(shù)字化應用只停留在對原始數(shù)據(jù)的增、刪、改、查上,沒有更加深入地分析數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系[14]。在學習成績、課堂考勤等數(shù)據(jù)中,存在著一定的關(guān)聯(lián)關(guān)系,如能深入分析這些數(shù)據(jù)中所隱藏的重要信息,將會根據(jù)數(shù)據(jù)間的聯(lián)系找到規(guī)律性,為提高教學效果提供指導。信息技術(shù)和辦公自動化的發(fā)展普及,為智能分析學習成績等各種數(shù)據(jù)數(shù)據(jù)提供了便利[15]。數(shù)據(jù)挖掘技術(shù)作為一種快速分析工具,能從海量、隨機、模糊、不完整的數(shù)據(jù)中,提取并發(fā)現(xiàn)其隱藏的深層次有用信息[16]。該技術(shù)可以從關(guān)系數(shù)據(jù)庫、數(shù)據(jù)倉庫以及文本等各種各樣的數(shù)據(jù)源中想方設法地去獲得像分類模型、聚類模型、關(guān)聯(lián)模型等知識模型。采用數(shù)據(jù)挖掘技術(shù)能快速發(fā)現(xiàn)教務系統(tǒng)中各項數(shù)據(jù)間的聯(lián)系,對有價值的結(jié)果進行分析與評估,為提高教學管理水平和教學質(zhì)量提供參考。

      2 數(shù)據(jù)挖掘算法

      數(shù)據(jù)挖掘(data mining),一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中的信息的過程。數(shù)據(jù)挖掘通常與計算機科學有關(guān),通常采用數(shù)據(jù)庫理論、機器學習、統(tǒng)計學、在線分析處理、專家系統(tǒng)和模式識別等多種方法實現(xiàn)上述目標[17]。目前,數(shù)據(jù)挖掘已廣泛應用在金融、商業(yè)、工業(yè)等領域。近年來,教育信息化和數(shù)字化校園的發(fā)展與普及,數(shù)據(jù)挖掘技術(shù)在教育領域也受到普遍關(guān)注。

      可以將數(shù)據(jù)挖掘的系統(tǒng)描述為:首先從數(shù)據(jù)庫中得到源數(shù)據(jù),然后將源數(shù)據(jù)進行預處理,轉(zhuǎn)化為可進行挖掘操作的目標數(shù)據(jù),再使用決策樹、遺傳算法、神經(jīng)網(wǎng)絡等方法對目標數(shù)據(jù)進行挖掘處理,最后對挖掘的信息數(shù)據(jù)進行科學評估[18]。其系統(tǒng)模型如圖1所示。數(shù)據(jù)挖掘的常用方法有關(guān)聯(lián)分析、聚類分析、回歸分析、分類分析、特征分析和序列模式分析等。

      2.1 關(guān)聯(lián)規(guī)則的基本概念

      關(guān)聯(lián)規(guī)則(association rule),又稱作購物籃分析,用來發(fā)現(xiàn)事物之間的聯(lián)系,可以用它從某一事情推測出另一事情的發(fā)生,從中分析出事物發(fā)展的規(guī)律,主要用于分析不同變量間的關(guān)聯(lián)程度[19]。

      設I={i1,i2,…,im}為m個不同商品項目的數(shù)據(jù)項集(itemset),簡稱為項集。用T表示事務(transaction),事務T為項的集合,可以描述為T是I中一組項目的集合,即T有一個唯一事務的標識TID。將事務T的集合用D表示。

      若項集XI且XT,則X∩Y=Φ。在事務數(shù)據(jù)庫中,支持度(support)可以描述為事務集中包含X和Y的事務數(shù)之比,記作support(XY);將包含X和Y的事務數(shù)與包含X的交易數(shù)之比用置信度(confidence)表示,記作confidence(XY)。

      根據(jù)以上分析和計算,最后產(chǎn)生的強關(guān)聯(lián)規(guī)則就是符合用戶給定的最小支持度和最小置信度。在關(guān)聯(lián)規(guī)則挖掘過程中,主要有兩個階段:①迭代挖掘所有頻繁項集;②由頻繁集產(chǎn)生強關(guān)聯(lián)規(guī)則。在以上兩個階段,核心部分均是挖掘頻繁項集[21]。

      2.2 Apriori算法

      Apriori算法是最經(jīng)典的關(guān)聯(lián)分析挖掘算法,使用一種逐層搜索的迭代方式實現(xiàn)[21]。該算法用k-項集逐步探索(k+1)-項集,從而遍歷數(shù)據(jù)集中的頻繁項集。Apriori算法的基本思想是:首先列出所有的項集,通過計算項集支持度,篩選出大于等于minsup的項集;然后由在上一步中找到的規(guī)則,使用連接步生成下一步項集,通過剪枝步利用Aprioride的性質(zhì)產(chǎn)生候選項集,剔除不滿足條件的候選項集。按迭代方式逐層進行,當產(chǎn)生的項集集合成為空集時,該算法終止執(zhí)行,找出所有頻繁項集。Apriori算法的過程分為兩個步驟:①迭代檢索存在的所有頻繁項集,即滿足支持度高于設定的閾值的項集;②根據(jù)第一步檢索出的頻繁項集,構(gòu)造出關(guān)聯(lián)規(guī)則,該規(guī)則滿足最小信任度的閾值。本文采用Apriori算法對學生成績進行關(guān)聯(lián)規(guī)則分析,應用算法挖掘分析學生每學期不及格科目門次與能否按期畢業(yè)之間的關(guān)聯(lián)關(guān)系,具體挖掘過程如圖2所示。

      3 學生成績關(guān)聯(lián)分析

      3.1 挖掘?qū)ο蟠_定

      教學管理部門每年對學生成績進行統(tǒng)計管理,并且任課教師在提交班級學生成績記錄時,會提交學生上課考勤表。根據(jù)統(tǒng)計結(jié)果和經(jīng)驗觀察,推斷學生能否按期正常畢業(yè)和不同學期不及格科目數(shù)的關(guān)聯(lián)規(guī)則;另外,學生能否按期正常畢業(yè)可能與不同學期上課缺勤次數(shù)存在關(guān)聯(lián)關(guān)系。因此,挖掘?qū)W生的缺勤狀況和補考科目數(shù),有針對性地制定不同學期的教學管理重點。

      3.2 源數(shù)據(jù)獲取

      統(tǒng)計學生歷年成績表,對每個學生的補考科目數(shù)按學年進行歸納。根據(jù)學生上課考勤表,統(tǒng)計各個學期每位學生的缺勤次數(shù)。

      3.3 數(shù)據(jù)預處理

      將學生不及格科目數(shù)和上課缺勤次數(shù)進行數(shù)據(jù)預處理,分別按數(shù)據(jù)清理和數(shù)據(jù)變換兩個步驟進行預處理。

      (1) 數(shù)據(jù)清理。該階段主要消除源數(shù)據(jù)中的冗余、噪聲、重復數(shù)據(jù)。在不及格科目中,可能存在個別學生因請假、患病等原因無法正常參加考試而辦理了緩考手續(xù),導致部分課程出現(xiàn)不及格或空數(shù)據(jù)的現(xiàn)象。這些數(shù)據(jù)會影響結(jié)果分析的準確性,需要刪除。對于考勤結(jié)果,需要將請假、參加公益活動、參與比賽等情況按正常出勤對待。

      (2)數(shù)據(jù)變換。為了便于數(shù)據(jù)挖掘的實施,使用統(tǒng)一的格式表示成績數(shù)據(jù)和考勤數(shù)據(jù)。使用關(guān)聯(lián)規(guī)則挖掘邏輯性數(shù)據(jù),對于高職學生3年的學習成績數(shù)據(jù),分別用A、B、C、D、E表示5個學期,其后的數(shù)字表示本學期不及格科目數(shù),如A2表示某學生第一學期有兩門課程不及格,第六學期為畢業(yè)設計,用T表示合格、F表示不合格;用Y表示按期正常畢業(yè),N表示無法正常畢業(yè),如表1所示。對于上課考勤數(shù)據(jù),分別用A、B、C、D、E、F表示6個學期,后邊數(shù)字表示本學期缺勤次數(shù),其中0表示沒有缺勤,1表示缺勤1次,2表示缺勤2次,3表示缺勤3次及以上,Y表示畢業(yè)狀態(tài)為正常畢業(yè),N表示無法正常畢業(yè),如表2所示。

      3.4 關(guān)聯(lián)規(guī)則生成

      在Apriori算法執(zhí)行過程中,多次掃描經(jīng)過轉(zhuǎn)換處理的邏輯數(shù)據(jù)表,用以尋找所有頻繁項集。先對頻繁1-項集進行連接并處理,然后得到頻繁2-項集,對其連接處理、分析得到候選3-項集的子集。判斷子集中有無非頻繁子項集,將其非頻繁子項集剪掉,剩下的均為候選3-項集的頻繁子項集。再對數(shù)據(jù)表進行掃描,刪除小于最小支持度閾值計數(shù)的候選項集并得到頻繁3-項集。反復掃描處理,最后得到頻繁k-項集。算法執(zhí)行結(jié)束后,得到每學期不及格科目數(shù)與畢業(yè)狀態(tài)之間的關(guān)聯(lián)規(guī)則,如圖3所示。用相同方法,得到每學期缺勤次數(shù)與畢業(yè)狀態(tài)之間的關(guān)聯(lián)規(guī)則,如圖4所示。

      4 結(jié)果分析

      本文取100為事務數(shù),設置最小支持度的值為40%,最小置信度的值為20%,分析以上挖掘結(jié)果,根據(jù)關(guān)聯(lián)規(guī)則可得到結(jié)果,如圖4所示。

      4.1 不及格科目數(shù)與畢業(yè)狀態(tài)的關(guān)聯(lián)規(guī)則結(jié)果

      通過不及格科目數(shù)與畢業(yè)狀態(tài)的關(guān)聯(lián)規(guī)則的分析結(jié)果可以看出,第一學期沒有不及格門次的學生,能按期畢業(yè)的學生比例占80%,而第一學期有兩門以上不及格門次的學生,不能按期畢業(yè)的學生比例高達89%。由此可以看出,第一學期學生的學習狀態(tài)對學生3年的影響非常關(guān)鍵,在教學管理中,第一學期是重點。另外,最后一學期的畢業(yè)設計十分重要,畢業(yè)設計完成的學生,能正常畢業(yè)的比例達90.9%,而畢業(yè)設計沒有完成的學生,不能正常畢業(yè)的比例達94.7%。

      可見,在第一學期,學生剛剛踏入大學校門,對大學學習規(guī)律、課程設置、教學規(guī)律缺乏一定的認識,需要一個逐步適應的過程。在這個階段,需要任課教師和教學管理部門認真思考,改進教學方式,在加強管理的同時,采用引導、幫助、鼓勵等手段,使學生盡快從高中階段的學習模式順利過渡到大學模式,實現(xiàn)從督促學習到自主學習的轉(zhuǎn)變,為后續(xù)學習建立良好的開端。在最后一學期,學生面臨找工作的壓力,部分學生會過早步入社會,淡化甚至放棄自己完成學業(yè),因此需要及早進行教育,穩(wěn)定學生的心態(tài),使能按期順利完成學業(yè)。

      4.2 缺勤次數(shù)與畢業(yè)狀態(tài)的關(guān)聯(lián)規(guī)則結(jié)果

      通過不及格科目數(shù)與畢業(yè)狀態(tài)的關(guān)聯(lián)規(guī)則結(jié)果可以看出,第一學期沒有缺勤的學生,能按期畢業(yè)的學生比例達88%,而第一學期有3次以上缺勤的學生,不能按期畢業(yè)的比例高達95%。同時,第一學期缺勤多的學生,后續(xù)每學期缺勤的比例也比較高。由圖4可以看出,最后一學期不缺勤的同學,能正常畢業(yè)的比例達93%,有3次以上缺勤的學生,不能按期畢業(yè)的比例高達96%。

      因此,第一學期是教學管理的最關(guān)鍵點,需要全方位的協(xié)調(diào)配合,從學習、紀律、作息等多方面加強管理和監(jiān)督,促進學生養(yǎng)成良好的學習和生活習慣。到了最后一學期,部分學生由于各種原因造成較多科目成績不及格,但在該學期都相應安排清考,不缺勤的學生能在完成畢業(yè)設計的同時,認真復習并按時參加考試,因此大多能按期畢業(yè)。因此需要對畢業(yè)季的學生嚴格考核,加強管理,采取提前預警、及早宣傳教育等方式,使之趁早解決遺留問題,圓滿完成最后的學習任務。

      5 結(jié)語

      教學管理是學校的重點工作,需常抓不懈,不斷改進。本文應用數(shù)據(jù)挖掘技術(shù)手段,對學生的成績、出勤與畢業(yè)狀態(tài)之間的相關(guān)度進行了分析。通過對教學數(shù)據(jù)挖掘結(jié)果的分析與評估,

      使教學管理者能準確把握三者之間的聯(lián)系和規(guī)律,有針對性地加強日常教學管理,進而減少不能按期畢業(yè)學生的比例。同時,為任課教師和教學管理部門提供科學依據(jù),對制定課程設置、培養(yǎng)方案、教學管理和工作重點提供指導。該方法的應用和結(jié)果評估分析,將有效提升高職院校的教學管理和科學決策水平,從而進一步提高教學質(zhì)量。

      參考文獻:

      [1] 陳子健,朱曉亮.基于教育數(shù)據(jù)挖掘的在線學習者學業(yè)成績預測建模研究[J].中國電化教育,2017(12):75-81.

      [2] 陳軍濤.高校教學管理制度相關(guān)問題研究[J].長春師范大學學報,2016(12):105-108.

      [3] 魏宇辰.“互聯(lián)網(wǎng)+”時代下O2O教學管理工作方式探討[J].中國教育信息化,2016(15):46-48.

      [4] 陳子健,朱曉亮.基于教育數(shù)據(jù)挖掘的在線學習者學業(yè)成績預測建模研究[J].中國電化教育,2017(12):75-81.

      [5] 崔仁桀.數(shù)據(jù)挖掘在學生專業(yè)成績預測上的應用[J].軟件,2016,37(1):24-27.

      [6] 胡在林.關(guān)聯(lián)規(guī)則和決策樹組合算法在學生成績分析中的應用與研究[D].青島:青島理工大學,2017.

      [7] 閆金奎.基于數(shù)據(jù)挖掘的高校學生成績管理系統(tǒng)的設計與實現(xiàn)[D].天津:天津大學,2016.

      [8] AGRAWAL R,SRIKANT R.Fast algorithms for mining association rules[C].Proceedings of International Conference on Very Large Databases,1994:487-499.

      [9] 馮俊,胥莉,閔蘭.基于Apriori算法的高校學生考試作弊動機分析與應對[J].西南師范大學學報:自然科學版,2017,42(2):174-180.

      [10] 趙峰,劉博妍.基于改進Apriori算法的大學生成績關(guān)聯(lián)分析[J].齊齊哈爾大學學報:自然科學版,2018(1):11-15.

      [11] SATYANARAYANA A,KING B.Teaching Data Mining in the Era of Big Data[C].Angola:Asee 2013 Conference,2013.

      [12] DESAI A,SHAH N,DHODI M.Student profiling to improve teaching and learning:a data mining approach[C].Amity:International Conference on Data Science and Engineering,2017.

      [13] 朱正茹,徐春林,史娟榮.高職院校教學管理與實施的現(xiàn)狀、問題與對策[J].高等職業(yè)教育,2017,26(2):17-21.

      [14] 周慶,牟超,楊丹.教育數(shù)據(jù)挖掘研究進展綜述[J].軟件學報,2015,26(11):3026-3042.

      [15] 林倩瑜.關(guān)聯(lián)規(guī)則挖掘算法研究綜述[J].軟件導刊,2012,11(6):27-29.

      [16] HAN J,KAMBER M,PEI J.數(shù)據(jù)挖掘概念與技術(shù)(第3版)[M].范明,等,譯.北京:機械工業(yè)出版社,2012.

      [17] ANJEWIERDEN A,KOLLOFFEL B,HULSHOF C.Towards educational data mining:using data mining methods for automated chat analysis to understand and support inquiry learning processes[C].Amsterdam:Intemational Workshop on Applying Data Mining in e-Learning,2007.

      [18] 閆金奎.基于數(shù)據(jù)挖掘的高校學生成績管理系統(tǒng)的設計與實現(xiàn)[D].天津:天津大學,2016.

      [19] 紀雅楠.數(shù)據(jù)挖掘技術(shù)在高校成人教育學生成績分析中的應用研究[D].青島:中國海洋大學,2010.

      [20] 何芬.數(shù)據(jù)挖掘技術(shù)在教學管理中的研究與應用[D].武漢:武漢理工大學,2010.

      [21] 李雄飛.數(shù)據(jù)挖掘與知識發(fā)現(xiàn)[M].北京:高等教育出版社,2003.

      (責任編輯:江 艷)

      猜你喜歡
      Apriori算法關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
      基于Hadoop平臺的并行DHP數(shù)據(jù)分析方法
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      永春县| 酉阳| 彰化县| 霍邱县| 清徐县| 襄樊市| 静宁县| 丰宁| 临安市| 宁安市| 孟连| 淳安县| 济宁市| 柯坪县| 乌审旗| 恩施市| 五大连池市| 乌拉特前旗| 都匀市| 福建省| 伊宁市| 磐安县| 甘洛县| 江孜县| 益阳市| 信宜市| 大方县| 康马县| 虞城县| 铜山县| 庄浪县| 萨嘎县| 郎溪县| 汝南县| 抚远县| 禄丰县| 宾川县| 乐平市| 张家港市| 瓦房店市| 广饶县|