• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于改進Apriori算法的高校學生成績預警系統(tǒng)的研究

      2018-09-10 21:10:21都娟翟社平
      現(xiàn)代信息科技 2018年2期
      關(guān)鍵詞:學生成績Apriori算法關(guān)聯(lián)規(guī)則

      都娟 翟社平

      摘 要:高校學生成績預警系統(tǒng)是高校教務系統(tǒng)的重要構(gòu)成部分,研究高校學生成績預警問題在理論層面和實踐層面均具有重要價值。一般而言,成績預警涉及多種技術(shù),而關(guān)聯(lián)算法是最為核心的技術(shù)之一。作為關(guān)聯(lián)算法中應用最為廣泛的Apriori算法本身具備一定的缺陷性,本文將在闡述Apriori算法的基本特點及其缺陷的基礎(chǔ)上,提出改進的Apriori算法,利用改進的Apriori算法對學生成績進行挖掘分析,發(fā)現(xiàn)不同學科之間的關(guān)聯(lián)關(guān)系,并給老師及管理決策者提供指導,幫助老師及時調(diào)整課程內(nèi)容,對可能出現(xiàn)不及格的部分學生提出警告,督促他們學習,提高教學質(zhì)量。

      關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;Apriori算法;學生成績

      中圖分類號:TP311.13 文獻標識碼:A 文章編號:2096-4706(2018)02-0108-03

      Research on Early Warning System of College Student Achievement Based on Improved Apriori Algorithm

      DU Juan,ZHAI Sheping

      (Xi'an University of Post and Telecommunications,School of Computer Science&Technology,Xi'an 710121,China)

      Abstract:The early warning system of college students achievement is an important part of the college teaching system,it has a great value to study the problem of early warning of college students'achievement,both in theory and practice. In general,early warning of achievement involves a variety of technologies. The association algorithm is one of the most important contents. As the most widely used Apriori algorithm,the Apriori algorithm has certain defects. In this paper,on the basis of expounding the basic characteristics and defects of the Apriori algorithm,we will put forward an improved Apriori algorithm,and use the improved Acriori algorithm to mine students 'achievements,find out the relationship between different disciplines,and provide guidance to teachers and management decision makers,help teachers adjust the content of the curriculum in time,warn some students who may fail,urge them to study and improve the quality of teaching.

      Keywords:data mining;association rules;apriori algorithm;student performance

      0 引 言

      危機預警通常無法科學地計算和評估,其一直被視為極具社會價值,極具教育理論與實踐的研究價值的課題。數(shù)據(jù)挖掘技術(shù)的提出及其在危機管理和危機預警領(lǐng)域的運用,提供了強有力的支持,使得危機預警的分析過程更為順暢、預測結(jié)果更加準確。關(guān)聯(lián)規(guī)則的挖掘是數(shù)據(jù)挖掘的重要內(nèi)容之一,其展現(xiàn)的是數(shù)據(jù)間的關(guān)聯(lián)關(guān)系,且表達簡潔,利于理解,它主要是從事務數(shù)據(jù)庫或關(guān)系數(shù)據(jù)庫中發(fā)現(xiàn)同時滿足最小支持度和置信度的項目集或者屬性之間的關(guān)聯(lián)關(guān)系、相關(guān)關(guān)系。Apriori算法是一種使用逐層搜索迭代的布爾型關(guān)聯(lián)規(guī)則挖掘頻繁項集的算法。本文介紹了數(shù)據(jù)挖掘技術(shù)中較為經(jīng)典的Apriori算法及其存在的主要缺陷,提出了改進的Apriori算法并利用改進的Apriori算法分析高校學生成績之間的關(guān)聯(lián)關(guān)系。

      1 Apriori算法及其不足

      Apriori算法一直被視為是應用最為廣泛的關(guān)聯(lián)規(guī)則挖掘算法。一般而言,我們在理解Apriori算法時,認為Apriori算法的主要思想是運用數(shù)理統(tǒng)計中的概率知識對數(shù)據(jù)布爾型關(guān)聯(lián)規(guī)則進行一定程度的挖掘。在利用Apriori算法繼續(xù)計算時,首先分層原始結(jié)構(gòu)數(shù)據(jù),而后利用同樣的方法來對各層的數(shù)據(jù)進行處理。一般而言,在運用Apriori算法時,需要遵循兩個步驟:第一步,挖掘過程,即從數(shù)據(jù)庫中挖掘全部的頻繁項集;第二步,則是以第一步挖掘到的頻繁項集為基礎(chǔ),最終獲得滿足條件的關(guān)聯(lián)規(guī)則。Apriori算法作為一種經(jīng)典的布爾型關(guān)聯(lián)規(guī)則算法,過程相對復雜,需要多次逐層在數(shù)據(jù)庫中進行搜查,并借助頻繁項集的先驗知識對其中的頻繁集進行多次迭代,直到不存在頻繁集為止。

      但是,這種算法依然存在一定的缺陷。其缺陷集中體現(xiàn)在幾個方面:一是增加算法的計算復雜度。一般而言,Apriori算法主要受到四個方面因素的影響,即支持度閾值、事務數(shù)、項數(shù)以及事務平均寬度。在Apriori算法中,支持度閾值的降低,會在一定程度上導致頻繁項集的增加,勢必會增加計算的難度和復雜性。原因在于當頻繁項集增多時,對其計數(shù)的候選項集會隨之增多,頻繁項集最大長度相應增加,造成算法需要進行的掃描的次數(shù)也隨之增加。二是,事務數(shù)。當在利用Apriori算法對項集的支持度進行計算時,需要對數(shù)據(jù)集進行反復的掃描。這種情況下,事務數(shù)隨之增加,對應的需要運行的時間也會增長。三是,候選剪枝方法增加計算量。此外,Apriori算法的不足還體現(xiàn)在增加計算量和I/O開銷等方面。

      2 改進的Apriori算法

      網(wǎng)絡環(huán)境下,先進的現(xiàn)代信息技術(shù)和網(wǎng)絡技術(shù)的運用不斷地推進著高校信息化建設的進程,為高校教務系統(tǒng)的管理和運行提供了良好的技術(shù)保障。與此同時,伴隨著高校信息化建設進程的推進,高校教務系統(tǒng)中產(chǎn)生的數(shù)據(jù)也在快速地增加。在教務系統(tǒng)的實際運用中,用戶只具備基本的操作權(quán)限,且系統(tǒng)中的各類數(shù)據(jù)的存在價值與關(guān)聯(lián)關(guān)系無法得到有效的挖掘。在分析系統(tǒng)中數(shù)據(jù)的關(guān)聯(lián)性、挖掘其價值時,傳統(tǒng)的Apriori算法本身存在一定的缺陷。因此,有必要對Apriori算法予以改進。將學生所學課程進行分類,形成多個子數(shù)據(jù)庫,各子數(shù)據(jù)庫中包含其下屬分類涵蓋的課程的成績。在挖掘各個子數(shù)據(jù)庫的頻繁項集時,主要采用的是垂直數(shù)據(jù)格式。在分別進行關(guān)聯(lián)規(guī)則的挖掘的基礎(chǔ)上,整合所獲得的規(guī)則結(jié)果。改進的Apriori算法描述如下:

      一是通過預處理對數(shù)據(jù)庫進行壓縮。學生成績系統(tǒng)中包含著海量的學生成績數(shù)據(jù),通過對其成績數(shù)據(jù)庫進行預處理,將其壓縮為成績事務數(shù)據(jù)庫。

      二是將學生所修課程根據(jù)課程內(nèi)容的差別進行分類,劃分為三大子數(shù)據(jù)庫。各子數(shù)據(jù)庫分別包含了對應類別所有課程的課程成績。

      三是在第二步分類的基礎(chǔ)上,有針對性地生成對應的三組頻繁項目集。(1)首先,對數(shù)據(jù)庫進行一次掃描,打亂后重新建立,將事務項目數(shù)據(jù)庫調(diào)整后建立為項目事務數(shù)據(jù)庫。對項目數(shù)據(jù)進行充分統(tǒng)計,做到不遺漏,對于某些未達到最小支持度的項集應當刪除。(2)用Apriori算法中的連接功能,算得項目事務數(shù)據(jù)庫中項的交集,再將新的數(shù)據(jù)重建為新的數(shù)據(jù)庫,最后得出N-項頻繁項集。

      四是充分整合所有子數(shù)據(jù)庫中的頻繁項集,獲取其對應的每個關(guān)聯(lián)規(guī)則的置信度,根據(jù)最小置信度閾值得到全部的強關(guān)聯(lián)規(guī)則,形成一個全局的候選頻繁項目集,最后在系統(tǒng)中將這些數(shù)據(jù)進行更新。

      3 改進的Apriori算法在學生成績預警中的應用

      3.1 基于關(guān)聯(lián)規(guī)則挖掘的學生成績預警模型

      利用優(yōu)化后的關(guān)聯(lián)規(guī)則來對學生的各科成績數(shù)據(jù)進行整合,尋找其關(guān)聯(lián)關(guān)系,為教師和教學管者提供科學的參考意見。首先,如果某一科目的成績大多數(shù)學生獲得的分數(shù)較低,教師可以改善教學方法或者教學內(nèi)容,達到提高學生成績的目的;其次,如果一些學生的成績不理想,教師應當參考成績數(shù)據(jù)尋找原因,對學生進行指導和警示;最后,利用成績數(shù)據(jù)來建立成績預警模型,如圖1所示。

      3.2 數(shù)據(jù)清理與轉(zhuǎn)換

      原始數(shù)據(jù)中包含了不同的專業(yè)、年級、課程等大量成績數(shù)據(jù),這些數(shù)據(jù)在記錄中難免會存在一些錯誤,如有些課程之間本來就沒有關(guān)聯(lián)度,所以要尋找方法將這部分冗余數(shù)據(jù)挖掘出來并將其刪除。例如,統(tǒng)計和記錄計算機專業(yè)學生的高等數(shù)學、C語言等9門課程的成績,將其作為挖掘?qū)ο蟆λ蟹謹?shù)進行離散化處理,將成績分別歸類為不及格、及格、良好、優(yōu)秀這4個等級。

      3.3 規(guī)則分析

      在Matlab2014a環(huán)境下,分別運用優(yōu)化前的Apriori算法和優(yōu)化后的Apriori算法對預處理的成績數(shù)據(jù)進行挖掘,采用不同的支持度和置信度,挖掘出不同的關(guān)聯(lián)規(guī)則。在本文中,挑選了部分挖掘出的關(guān)聯(lián)規(guī)則,如表1所示,現(xiàn)將這些規(guī)則進行分析。

      根據(jù)表中列出的關(guān)聯(lián)規(guī)則可知,從規(guī)則1、5可以看到,當高數(shù)及格時,C語言、C++處在及格線附近或者不及格的位置。

      從規(guī)則2、6、7中可以看到,數(shù)學類課程的成績與語言類和專業(yè)課的成績有一定關(guān)聯(lián)性,這是由于數(shù)學類課程是基礎(chǔ)課程,該課程可以提高學生的邏輯思維能力,語言類編程課程的學習通常是基于邏輯思維來學習的,所以當數(shù)學類的課程成績較差時,后續(xù)的語言類課程也會學不好或者出現(xiàn)不及格的現(xiàn)象。

      從規(guī)則3中可以看到,當C語言成績及格時,很有可能出現(xiàn)數(shù)據(jù)庫原理不及格的現(xiàn)象。所以,老師應對處在及格線邊緣的同學,及時提出警示并對其進行指導幫助。

      從規(guī)則7、8中可以看到,當數(shù)學類課程處于不及格邊緣時,專業(yè)課成績很有可能也會不及格。此時,教師可以采取一定措施調(diào)整學生對各科目的學習力度,提高學生弱勢學科成績。

      從規(guī)則2、4中可以看出,當基礎(chǔ)課程如高數(shù)、Java等成績較好時,后續(xù)的專業(yè)課程成績?nèi)鏜atlab很有可能是優(yōu)秀。

      從以上對關(guān)聯(lián)規(guī)則的分析可知,學校應根據(jù)實際情況對學生因材施教,提高學生基礎(chǔ)課程的成績,并對不同課程設置不同的學習難度,做到合理教學,有針對性地加強學生薄弱課程的學習,提高教學的整體效果。

      3.4 性能分析

      本文提出的基于改進Apriori算法的學生成績預警模型,由于其在尋找頻繁項集時只需掃描一次數(shù)據(jù)庫,每生成一次頻繁項集,對應就減少一部分數(shù)據(jù)庫,最終節(jié)省了內(nèi)存空間,提高了算法效率。當最小支持度較高時,相應的候選集也會減少,這樣就節(jié)約了掃描數(shù)據(jù)庫的時間,所以傳統(tǒng)算法與改進后的算法兩者的時間開銷差別也縮小;當最小支持度較低時,利用傳統(tǒng)的算法在尋找時會生成很多冗余的候選項集,損耗了多余的時間,導致兩種算法的時間開銷差別變大。

      4 結(jié) 論

      本文中,研究的立足點在于高校學生所修各門課程之間存在前后順序關(guān)系,課程之間存在著內(nèi)在的聯(lián)系,且其中一門課程掌握的具體程度可能會對其他課程的學習產(chǎn)生一定影響。本文提出運用關(guān)聯(lián)原則中的一些技術(shù)來對成績系統(tǒng)中的大量數(shù)據(jù)進行一定程度的挖掘,并從數(shù)據(jù)當中獲得可用規(guī)則,立足Apriori算法的特點及不足,提出了改進的Apriori算法,對高校學生成績預警系統(tǒng)中的數(shù)據(jù)進行處理、挖掘,最終獲得管理原則,形成對課程學習的有效預警。針對不同情況的學生應給予不同的指導,對可能出現(xiàn)不及格情況的學生應當及時做出預警,深入研究造成學生某學科不及格的主要原因,并積極利用成績預警系統(tǒng)中反饋的信息輔助教師對教學活動、教學內(nèi)容以及教學計劃進行安排,確??梢约皶r給予對應的學生以針對性的輔導,促進學生學習成績的提升,實現(xiàn)高校培育優(yōu)秀人才的最終目標。

      參考文獻:

      [1] 王華,劉萍.改進的關(guān)聯(lián)規(guī)則算法在學生成績預警中的應用 [J].計算機工程與設計,2015,36(3):679-682+752.

      [2] 白金,劉琳婧,周江輝.學生成績的動態(tài)預警模型 [J].科教導刊(上旬刊),2015(2):150-152.

      [3] 李昊,周振華.基于數(shù)據(jù)挖掘的高校學生成績預警系統(tǒng) [J].大慶石油學院學報,2011,35(4):91-95+2.

      [4] 潘潔珠.基于數(shù)據(jù)挖掘的預警技術(shù)研究 [D].合肥:合肥工業(yè)大學,2007.

      [5] 姜晚云.關(guān)聯(lián)規(guī)則在學生成績管理中的應用研究 [D].合肥:合肥工業(yè)大學,2006.

      [6] 牛猛.利用Apriori算法對醫(yī)學生成績進行課程關(guān)聯(lián)性分析 [J].河北工程大學學報(社會科學版),2015,32(2):115-117+124.

      [7] 陳甲華.基于改進Apriori算法的大學成績關(guān)聯(lián)規(guī)則——某大學信管專業(yè)的實證研究 [J].電子技術(shù)與軟件工程,2017(8):177-178.

      猜你喜歡
      學生成績Apriori算法關(guān)聯(lián)規(guī)則
      淺析數(shù)據(jù)挖掘技術(shù)在學生管理系統(tǒng)中的應用
      東方教育(2016年20期)2017-01-17 20:57:58
      基于Hadoop平臺的并行DHP數(shù)據(jù)分析方法
      基于Apriori算法的高校學生成績數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘分析
      基于云平臺MapReduce的Apriori算法研究
      關(guān)聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
      數(shù)據(jù)挖掘在高校課堂教學質(zhì)量評價體系中的應用
      高職數(shù)學分層教學學生成績評價的數(shù)學模型
      關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進
      中國市場(2016年36期)2016-10-19 04:10:44
      基于關(guān)聯(lián)規(guī)則的計算機入侵檢測方法
      Excel+VBA開發(fā)之《學生成績管理系統(tǒng)》的設計與實現(xiàn)
      汶上县| 容城县| 蓬莱市| 大安市| 洛南县| 华安县| 林芝县| 武川县| 英山县| 墨竹工卡县| 泰顺县| 东平县| 安庆市| 霍邱县| 韶山市| 双桥区| 大竹县| 巩留县| 萨嘎县| 吕梁市| 安吉县| 郯城县| 崇义县| 周宁县| 沾化县| 安仁县| 湟中县| 穆棱市| 大兴区| 鄄城县| 南城县| 高淳县| 搜索| 呼伦贝尔市| 安福县| 长沙县| 巩义市| 阿拉善盟| 肇州县| 呼玛县| 台北县|