• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于改進(jìn)Apriori算法的高校課程預(yù)警規(guī)則庫(kù)構(gòu)建①

      2021-08-02 11:09:16汗古麗力提甫
      關(guān)鍵詞:項(xiàng)集置信度事務(wù)

      任 鴿,吳 猛,汗古麗·力提甫,楊 勇

      (新疆師范大學(xué) 計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,烏魯木齊 830054)

      高校學(xué)生成績(jī)一直是直接評(píng)價(jià)學(xué)生學(xué)業(yè)水平的重要指標(biāo),也是間接評(píng)價(jià)高校教師教學(xué)效果及高校管理水平的指標(biāo)之一[1].隨著高校學(xué)生成績(jī)信息量的不斷增加,對(duì)學(xué)生成績(jī)進(jìn)行簡(jiǎn)單的統(tǒng)計(jì)、對(duì)比等信息處理方式難以滿(mǎn)足學(xué)生和教育工作者的實(shí)際需求,學(xué)生成績(jī)預(yù)警研究已成為當(dāng)今高校信息管理領(lǐng)域研究的熱點(diǎn)[2–5].

      成績(jī)預(yù)警是指通過(guò)對(duì)學(xué)生課程成績(jī)進(jìn)行分析,挖掘各門(mén)課之間的聯(lián)系,基于已有的成績(jī)數(shù)據(jù),對(duì)學(xué)生未來(lái)的成績(jī)走向進(jìn)行預(yù)警.挖掘課程之間的相互聯(lián)系,構(gòu)建完善的預(yù)警規(guī)則庫(kù)是學(xué)生成績(jī)預(yù)警研究中的關(guān)鍵點(diǎn)[6–9].高校課程之間具有很強(qiáng)的關(guān)聯(lián)性[10],這種關(guān)聯(lián)性體現(xiàn)在專(zhuān)業(yè)知識(shí)體系構(gòu)建以及知識(shí)傳授的前后次序.挖掘深層次的課程關(guān)聯(lián)關(guān)系,可以為學(xué)生成績(jī)的預(yù)警分析提供決策支持,對(duì)高校提高教學(xué)管理水平具有重要應(yīng)用價(jià)值.

      關(guān)聯(lián)規(guī)則挖掘[11]是數(shù)據(jù)挖掘中一種重要的數(shù)據(jù)分析方法,這其中經(jīng)典的Apriori 算法[12]可有效地從某一任務(wù)的事務(wù)集中挖掘出客戶(hù)感興趣且富有價(jià)值的隱藏規(guī)則.近年來(lái),將Apriori 算法應(yīng)用在高校成績(jī)預(yù)警分析中成為一個(gè)研究熱點(diǎn),何楚等[13]采用Apriori 算法和FP-growth 算法挖掘?qū)W生成績(jī)的頻繁規(guī)則并結(jié)合基于圖論的譜聚類(lèi)算法對(duì)規(guī)則中涉及的公共課與專(zhuān)業(yè)課進(jìn)行分類(lèi),提出基于課程關(guān)聯(lián)分類(lèi)模型的學(xué)生成績(jī)預(yù)測(cè),研究方法新穎,但僅采用支持度與置信度進(jìn)行規(guī)則挖掘,沒(méi)有剔除某些有較強(qiáng)干擾性的規(guī)則;郭鵬等[14]在對(duì)學(xué)生成績(jī)進(jìn)行聚類(lèi)離散化后,再引入興趣度挖掘課程間的關(guān)聯(lián)規(guī)則,其側(cè)重點(diǎn)在于不同等級(jí)成績(jī)之間的課程規(guī)則挖掘,而非針對(duì)不及格課程之間的規(guī)則挖掘;王華等[15]為減少Apriori 算法的I/O 負(fù)載,利用交集操作記錄頻繁項(xiàng)集從而降低時(shí)間代價(jià),不足點(diǎn)在于受限Matlab 平臺(tái);劉華婷等[16]針對(duì)Apriori 算法的效率問(wèn)題提出采用線性表進(jìn)行數(shù)據(jù)存儲(chǔ),利用Apriori 算法中的超集定理判斷非頻繁項(xiàng)集,從而在掃描速度上進(jìn)行優(yōu)化,加快算法的時(shí)間效率,遺憾的是該研究?jī)H在單一且規(guī)模較小的數(shù)據(jù)集上進(jìn)行了效率測(cè)試;袁路妍等[17]通過(guò)減少Apriori 算法中挖掘頻繁項(xiàng)集的比較次數(shù),以提升算法的效率,該法所挖掘出的規(guī)則在度量上仍只采用了支持度與置信度;趙峰等[18]借鑒分治算法的思想,提出將事務(wù)集中的課程進(jìn)行預(yù)分類(lèi),再得到各自類(lèi)別的頻繁項(xiàng)集進(jìn)行規(guī)則挖掘,雖避免了掃描整個(gè)事務(wù)集,但仍無(wú)法保證規(guī)則的有效性.

      綜上,Apriori 算法在高校成績(jī)預(yù)警應(yīng)用中的基本思想:一是對(duì)課程或?qū)W生成績(jī)本身進(jìn)行類(lèi)別處理,再通過(guò)引入一種新的參數(shù)對(duì)挖掘出的規(guī)則進(jìn)行有效性度量;二是針對(duì)Apriori 算法自身存在的運(yùn)行效率缺陷提出改進(jìn),加強(qiáng)Apriori 算法的適用性.對(duì)此,本研究在傳統(tǒng)的Apriori 算法之上提出利用提升度篩選出彼此關(guān)聯(lián)程度較高的課程規(guī)則,再引入興趣度針對(duì)預(yù)警規(guī)則庫(kù)所需求的課程規(guī)則進(jìn)行篩選,最終得到興趣度較高的關(guān)聯(lián)規(guī)則構(gòu)建課程預(yù)警規(guī)則庫(kù),相比較傳統(tǒng)Apriori 算法,本研究提出的算法能大大降低了冗余規(guī)則數(shù)量,縮短算法運(yùn)行時(shí)間,提高規(guī)則挖掘的效率.

      1 高校課程預(yù)警規(guī)則分析方法

      1.1 相關(guān)定義

      定義1.項(xiàng).

      定義集合I={i1,i2,···,im} 表示由m個(gè)元素組成的一個(gè)有限集合.設(shè)相關(guān)問(wèn)題數(shù)據(jù)集D是本問(wèn)題的事務(wù)集合:D={T1,T2,···,Tn},它是由個(gè)n事務(wù)T組成.現(xiàn)規(guī)定D集中某一元素Ti由 一或多個(gè)I集中的元素ij構(gòu)成,即T?I且T≠?,i=1,2,···,n;j=1,2,···,m.

      定義2.候選項(xiàng)集.

      由一或多個(gè)項(xiàng)組成的集合 {i1,i2,···,ik}稱(chēng)為候選項(xiàng)集,包含k個(gè)項(xiàng)的候選項(xiàng)集稱(chēng)為k候選項(xiàng)集,如A={面向?qū)ο蟪绦蛟O(shè)計(jì)(及格)、軟件工程(及格)}是一個(gè)2—候選項(xiàng)集,且A?T.

      定義3.頻繁項(xiàng)集Lk.

      若該候選項(xiàng)集A的絕對(duì)支持度support(A)滿(mǎn)足算法中預(yù)設(shè)定的最小支持度閾值supmin,也即support(A)≥supmin時(shí),則稱(chēng)該項(xiàng)集A為頻繁項(xiàng)集,包若A中含個(gè)k項(xiàng)則稱(chēng)為頻繁k項(xiàng)集Lk;當(dāng)時(shí)k≥2,可挖掘Lk中不同項(xiàng)之間的關(guān)聯(lián)規(guī)則.

      定義4.關(guān)聯(lián)規(guī)則.

      本算法中所有的關(guān)聯(lián)規(guī)則都是由頻繁k-項(xiàng)集Lk得到的,例如頻繁2—項(xiàng)集={面向?qū)ο蟪绦蛟O(shè)計(jì)(及格)、軟件工程(及格)}同時(shí)又滿(mǎn)足Apriori 算法的最小置信度閾值confmin,則A可產(chǎn)生一條由蘊(yùn)含式表示的規(guī)則:{面向?qū)ο蟪绦蛟O(shè)計(jì)(及格) ?軟件工程(及格)},其中“面向?qū)ο蟪绦蛟O(shè)計(jì)(及格)”為規(guī)則的前件,“軟件工程(及格)”為規(guī)則的后件.規(guī)則的支持度計(jì)算公式如下:

      其中,count(X∪Y)表示X與Y的并集在事務(wù)集D中的計(jì)數(shù),count(D)表示事務(wù)集D中事務(wù)數(shù).規(guī)則的置信度計(jì)算公式如下:

      支持度與置信度是對(duì)規(guī)則篩選最重要的兩種度量,規(guī)則的支持度反映所發(fā)現(xiàn)規(guī)則的價(jià)值性及在事務(wù)集中出現(xiàn)的頻率,置信度則反映了規(guī)則的確定性[19].

      1.2 傳統(tǒng)的Apriori 算法課程預(yù)警規(guī)則挖掘算法

      傳統(tǒng)的Apriori 算法課程預(yù)警關(guān)聯(lián)規(guī)則挖掘利用逐層迭代的搜索方法,即由生成的頻繁k—項(xiàng)集確定頻繁(k+1)項(xiàng)集的思想.傳統(tǒng)的Apriori 算法課程預(yù)警規(guī)則挖掘的算法流程如圖1,其主要步驟為兩個(gè)階段.

      圖1 課程預(yù)警關(guān)聯(lián)規(guī)則挖掘算法

      第1 階段,算法執(zhí)行后掃描事務(wù)集D,記錄每個(gè)項(xiàng)的頻數(shù),并根據(jù)最小支持度閾值篩選出符合要求的候選頻繁項(xiàng)集,記為L(zhǎng)1;然后利用L1找出滿(mǎn)足最小支持度閾值頻繁2-項(xiàng)集,記為L(zhǎng)2,如此反復(fù)迭代,直到?jīng)]有滿(mǎn)足最小支持度閾值的頻繁k-項(xiàng)集.

      第2 階段,再次掃描所有的頻繁k-項(xiàng)集,k=1,2,···;利用第1 階段中得到的支持度數(shù)據(jù)計(jì)算每一個(gè)頻繁k-項(xiàng)集的置信度,將滿(mǎn)足最小置信度閾值的頻繁k-項(xiàng)集挖掘篩選出符合課程預(yù)警的規(guī)則,進(jìn)行構(gòu)建規(guī)則庫(kù).

      1.3 改進(jìn)的Apriori 課程預(yù)警關(guān)聯(lián)規(guī)則算法

      1.3.1 增強(qiáng)冗余規(guī)則篩選機(jī)制

      傳統(tǒng)的關(guān)聯(lián)規(guī)則挖掘算法使用支持度-置信度框架作為篩選依據(jù),但支持度-置信度框架存在一定的缺陷.其中支持度的缺點(diǎn)是顯而易見(jiàn)的,在事務(wù)集中會(huì)有許多潛在的有意義的模式由于其頻繁項(xiàng)集Lk支持度小而被忽略或者產(chǎn)生一些冗余的規(guī)則;而置信度的缺陷卻比較特殊,它主要在于忽視了規(guī)則后件的項(xiàng)集在事務(wù)集中的支持度.因此,通過(guò)傳統(tǒng)的Apriori 算法生成的預(yù)警規(guī)則庫(kù)會(huì)出現(xiàn)很多無(wú)用、冗余的關(guān)聯(lián)規(guī)則,對(duì)成績(jī)預(yù)警分析產(chǎn)生干擾,降低預(yù)測(cè)的準(zhǔn)確性,因而需要對(duì)預(yù)警關(guān)聯(lián)規(guī)則作進(jìn)一步地度量分析,從而篩選出合適的預(yù)警規(guī)則.對(duì)此,本研究在支持度-置信度框架基礎(chǔ)上引入提升度Lift[20]、興趣度Interest[21]對(duì)挖掘關(guān)聯(lián)規(guī)則算法進(jìn)行改進(jìn).

      提升度方面,某一頻繁k項(xiàng)集生成的某規(guī)則{X?Y}的提升度被定義為:

      當(dāng)該條規(guī)則的Lift值小于1 時(shí)表示X和Y是負(fù)相關(guān)的,一個(gè)出現(xiàn)可能導(dǎo)致另一個(gè)不出現(xiàn);當(dāng)值Lift近似等于1 時(shí)表示X和Y是獨(dú)立的,彼此之間無(wú)相關(guān)性;當(dāng)Lift值大于1 時(shí)表示表示X和Y是正相關(guān)的,其中一個(gè)的出現(xiàn)會(huì)蘊(yùn)涵另一個(gè)的出現(xiàn).提升度越高則表示由規(guī)則前件主導(dǎo)與規(guī)則后件共同出現(xiàn)的程度越高,反之提升度越小時(shí)則二者互斥的程度越高.

      興趣度方面,本研究引入基于差異思想的興趣度[22,23].某一頻繁k項(xiàng)集生成的某規(guī)則{X?Y}的興趣度的定義如下:由該條規(guī)則{X?Y}的置信度與規(guī)則后件的支持度之間的差值作為分子;分母則取該條規(guī)則{X?Y}的置信度與規(guī)則后件支持度的最大值,也即引入了一個(gè)標(biāo)準(zhǔn)化因子,整體上使得該條規(guī)則的興趣度絕對(duì)值小于1.

      區(qū)別于提升度篩選前后件關(guān)聯(lián)程度較高的規(guī)則,興趣度可對(duì)某頻繁k-項(xiàng)集產(chǎn)生的正反面規(guī)則篩選得到用戶(hù)更感興趣的規(guī)則.如對(duì)于某一頻繁2-項(xiàng)集A={面向?qū)ο蟪绦蛟O(shè)計(jì)(及格)、軟件工程(及格)},由于前后件的不同可產(chǎn)生兩條規(guī)則:{面向?qū)ο蟪绦蛟O(shè)計(jì)(及格) ?軟件工程(及格)}、{軟件工程(及格) ?面向?qū)ο蟪绦蛟O(shè)計(jì)(及格)},根據(jù)前文興趣度的定義,二者的興趣度值顯然不一;那么,通過(guò)興趣度閾值就可篩選出以“面向?qū)ο蟪绦蛟O(shè)計(jì)(及格)”為前件的預(yù)警規(guī)則.引入興趣度的目的在于可選擇某些不及格的重點(diǎn)課程作為前件,挖掘出相關(guān)預(yù)警規(guī)則,從而摒棄某些興趣度不高的規(guī)則.

      1.3.2 計(jì)算候選集頻數(shù)優(yōu)化策略

      在Apriori 算法中,由頻繁項(xiàng)集Lk?1自連接得到候選集Ck的過(guò)程中,存在兩大缺陷:一是由于Lk?1中存在很多不必作自連接的項(xiàng)集,導(dǎo)致產(chǎn)生冗余Ck;二是需要多次掃描數(shù)據(jù)庫(kù)確定候選項(xiàng)集支持度[24].針對(duì)上述問(wèn)題,提出一種計(jì)算候選集頻數(shù)優(yōu)化策略.

      首先通過(guò)矩陣運(yùn)算的方法獲得頻繁一項(xiàng)集L1,并對(duì)L1進(jìn) 行預(yù)剪枝得到L1,然后利用Apriori 算法的自連接性質(zhì)對(duì)L1,進(jìn)行操作生成候選二項(xiàng)集C2.在計(jì)算候選二項(xiàng)集C2的支持度計(jì)數(shù)之前,首先要根據(jù)L1明 確Ix和Iy中的最小項(xiàng),接下來(lái)在搜索頻繁項(xiàng)集時(shí)候只需要掃描特定分支即含有最小項(xiàng)事務(wù)結(jié)點(diǎn)鏈而不是整個(gè)數(shù)據(jù)庫(kù),并結(jié)合該節(jié)點(diǎn)處標(biāo)記flagi=(x,y)中y的數(shù)值,即可得到C2的計(jì)數(shù),最后對(duì)C2進(jìn)行剪枝得到頻繁二項(xiàng)集L2,對(duì)獲得的頻繁二項(xiàng)集L2作同樣的操作就可以快速計(jì)算出C3支持度計(jì)數(shù),節(jié)省了空間和時(shí)間資源.

      1.3.3 基于矩陣的存儲(chǔ)方式改進(jìn)

      將事務(wù)數(shù)據(jù)庫(kù)D轉(zhuǎn)換為矩陣,每一事務(wù)以矩陣的行來(lái)表示行緯度,事務(wù)中的項(xiàng)用列表示列維度,當(dāng)要對(duì)數(shù)據(jù)進(jìn)行挖掘時(shí)就可以直接調(diào)用轉(zhuǎn)換為矩陣中的信息,在行列指定的位置處若存在數(shù)據(jù)則為1,否則記為0,刪除事務(wù)長(zhǎng)度小于最小置信度的行與列,免去了對(duì)D再次掃描的過(guò)程,節(jié)省了I/O的開(kāi)銷(xiāo)與時(shí)間.

      改進(jìn)Apriori的課程預(yù)警關(guān)聯(lián)規(guī)則算法偽代碼如算法1.

      算法1.改進(jìn)的課程預(yù)警關(guān)聯(lián)規(guī)則算法輸入:事務(wù)集D,最小支持度,最小置信度,最小提升度,最小興趣度R supmincon fmin LiftminInterestmin輸出:預(yù)警規(guī)則列表1)掃描事務(wù)集D,生成候選項(xiàng)集矩陣 并計(jì)算其support;C1supminL1 C1 2)將候選項(xiàng)集的support 與 進(jìn)行比較,生成頻繁項(xiàng)集 ;?3)for(k=2;Lk?1≠;k++):4)剪枝并生成新的候選項(xiàng)集 ;Ck Ck 5)再次掃描事務(wù)集D,計(jì)算的support;supmin 6)將Ck的support 與 比較,生成頻繁項(xiàng)Lk;7)輸出頻繁項(xiàng)集列表L;8)for(k=2;k<=len(L);k++)://遍歷頻繁項(xiàng)集列表L Lkcon fmin 9)提取每一個(gè)并計(jì)算置信度;并與 比較后篩選;LkLiftmin 10)計(jì)算每一個(gè)的提升度Lift,與 比較后篩選;LkInterestmin 11)計(jì)算每一個(gè)的興趣度Interest,與 比較后篩選;LkRk 12)由篩選后的生成預(yù)警規(guī)則 ;13)輸出預(yù)警規(guī)則列表R.

      2 實(shí)驗(yàn)結(jié)果與分析

      2.1 實(shí)驗(yàn)環(huán)境與數(shù)據(jù)來(lái)源

      本研究的實(shí)驗(yàn)硬件環(huán)境為Intel Core i7 處理器、16 GB內(nèi)存,1 TB 硬盤(pán);操作系統(tǒng)選用Mac OS 系統(tǒng);選用Python 3.7 并在Jupyter notebook 開(kāi)發(fā)環(huán)境上對(duì)實(shí)驗(yàn)進(jìn)行編程實(shí)現(xiàn).

      實(shí)驗(yàn)數(shù)據(jù)來(lái)源于新疆師范大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院畢業(yè)學(xué)生的19 門(mén)基礎(chǔ)課與核心專(zhuān)業(yè)課的成績(jī),共3000 條記錄,部分原始數(shù)據(jù)如表1所示.

      表1 部分原始數(shù)據(jù)

      2.2 數(shù)據(jù)的清洗

      由于部分原始數(shù)據(jù)中出現(xiàn)了不同專(zhuān)業(yè)間相關(guān)開(kāi)設(shè)的課程名稱(chēng)前后不一致的現(xiàn)象,必須對(duì)其進(jìn)行一致化處理:如高等數(shù)學(xué)(1)與高等數(shù)學(xué)(I)統(tǒng)稱(chēng)為高等數(shù)學(xué)一、面向?qū)ο蟪绦蛟O(shè)計(jì)(Java)與面向?qū)ο蟪绦蛟O(shè)計(jì)統(tǒng)稱(chēng)為面向?qū)ο蟪绦蛟O(shè)計(jì),計(jì)算機(jī)網(wǎng)絡(luò)與計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)統(tǒng)稱(chēng)為計(jì)算機(jī)網(wǎng)絡(luò).

      本研究主要挖掘是專(zhuān)業(yè)課程的相關(guān)關(guān)系,特別是不同學(xué)期開(kāi)始的專(zhuān)業(yè)基礎(chǔ)課與核心專(zhuān)業(yè)課程之間的聯(lián)系,可將原始數(shù)據(jù)中與專(zhuān)業(yè)無(wú)關(guān)的公共類(lèi)、博雅類(lèi)課程進(jìn)行剔除,僅選取如高等數(shù)學(xué)、數(shù)據(jù)結(jié)構(gòu)、Web 技術(shù)與應(yīng)用等19 門(mén)學(xué)科課程作為研究對(duì)象.

      對(duì)于某些學(xué)生成績(jī)大面積缺失的,則采取舍棄該樣本,若學(xué)生出現(xiàn)補(bǔ)考成績(jī)的需進(jìn)行成績(jī)的一致性處理.對(duì)于某些學(xué)生出現(xiàn)某科科目成績(jī)出現(xiàn)空值的情形,則采用該學(xué)科的均值成績(jī)填充.

      2.3 數(shù)據(jù)的離散化

      課程成績(jī)本身也就是一種離散化數(shù)據(jù),若將課程成績(jī)的分值直接作為Apriori 算法的事務(wù)集進(jìn)行輸入,其挖掘出來(lái)的規(guī)則適用性較低且模型效率低.由于考試方式、考試難度、評(píng)卷的標(biāo)準(zhǔn)存在差異性,課程成績(jī)的分布有可能相對(duì)集中在某一個(gè)小區(qū)間內(nèi),而非在各個(gè)分值區(qū)間中呈現(xiàn)出相似的密度.本研究針對(duì)事務(wù)集中550 條記錄,決定采用基于單值的劃分方法,設(shè)定課程成績(jī)區(qū)間,劃分課程成績(jī)等級(jí),以便于更好的挖掘課程之間的聯(lián)系.所得的成績(jī)等級(jí)劃分表如表2.

      表2 成績(jī)等級(jí)劃分表

      2.4 預(yù)警規(guī)則挖掘?qū)Ρ葘?shí)驗(yàn)及分析

      為驗(yàn)證改進(jìn)算法的效率,分別采用傳統(tǒng)Apriori 算法,MIFP-Apriori[24],RCM-Apriori[25],與本文提出的算法進(jìn)行預(yù)警規(guī)則的挖掘,對(duì)效率進(jìn)行對(duì)比.在事務(wù)集為3000的數(shù)據(jù)集上,選用最小值支持度閾值0.1,最小置信度閾值0.4的進(jìn)提升度閾值1.4、興趣度閾值0.1 執(zhí)行算法實(shí)驗(yàn),4 種算法所挖掘出的無(wú)用冗余規(guī)則條數(shù)和運(yùn)行時(shí)間見(jiàn)表3,由表3可以看出本文提出的改進(jìn)的Apriori 算法可以大大降低冗余規(guī)則條數(shù),算法運(yùn)行時(shí)間也得到縮短,提高了預(yù)警規(guī)則的挖掘效率.

      表3 預(yù)警規(guī)則挖掘?qū)Ρ葘?shí)驗(yàn)

      為進(jìn)一步測(cè)試在不同事務(wù)集大小下的各算法執(zhí)行效率,將事務(wù)集按照500~3000 進(jìn)行遞增,考察不同數(shù)據(jù)規(guī)模下算法的運(yùn)行時(shí)間,實(shí)驗(yàn)結(jié)果如圖2所示.

      圖2 不同數(shù)據(jù)規(guī)模下4 種算法性能比較

      由圖2可以看出,當(dāng)數(shù)據(jù)規(guī)模較小時(shí),4 種算法的執(zhí)行時(shí)間相差不大.當(dāng)數(shù)據(jù)規(guī)模逐漸增加時(shí),傳統(tǒng)的Apriori 算法斜率增加比較明顯,執(zhí)行時(shí)間最長(zhǎng),本文提出的算法在候選項(xiàng)集生成,冗余規(guī)則篩選,存儲(chǔ)方式等方面進(jìn)行了優(yōu)化,曲線斜率比其他3 種算法小,運(yùn)行時(shí)間最短,并且性能穩(wěn)定.

      本文提出的改進(jìn)的Apriori 算法在剔除掉無(wú)關(guān)的1324 條冗余規(guī)則后,共挖掘到有效規(guī)則430 條.部分規(guī)則如表4所示.

      表4 部分課程預(yù)警規(guī)則表

      表4中第2 條規(guī)則{頁(yè)設(shè)計(jì)基礎(chǔ)(不及格) ?('Web技術(shù)與應(yīng)用(不及格)}揭示了Web 技術(shù)與應(yīng)用的與前導(dǎo)課網(wǎng)頁(yè)設(shè)計(jì)基礎(chǔ)存在緊密聯(lián)系,若學(xué)生出現(xiàn)《網(wǎng)頁(yè)設(shè)計(jì)基礎(chǔ)》課程不及格時(shí),那么很有可能在學(xué)習(xí)《Web技術(shù)與應(yīng)用》課程時(shí)成績(jī)同樣會(huì)不及格.再如第4 條規(guī)則{離散數(shù)學(xué)(不及格) ?(數(shù)據(jù)結(jié)構(gòu)(不及格))},離散數(shù)學(xué)作為數(shù)據(jù)結(jié)構(gòu)的重要基礎(chǔ)之一,一旦學(xué)生出現(xiàn)離散數(shù)學(xué)不及格的情況,則有大概率發(fā)生數(shù)據(jù)結(jié)構(gòu)同樣不及格的情況.

      3 結(jié)束語(yǔ)

      高校課程預(yù)警規(guī)則庫(kù)可以為學(xué)生成績(jī)預(yù)警提供決策支持,本文對(duì)學(xué)生成績(jī)進(jìn)行預(yù)處理后,采用Apriori算法,重點(diǎn)挖掘不及格課程之間的關(guān)聯(lián)關(guān)系,構(gòu)建基礎(chǔ)預(yù)警規(guī)則庫(kù),挖掘強(qiáng)關(guān)聯(lián)關(guān)系的課程,擴(kuò)充基礎(chǔ)預(yù)警規(guī)則庫(kù),采用多種方式對(duì)冗余規(guī)則進(jìn)行過(guò)濾,確保預(yù)警規(guī)則庫(kù)的有效性.挖掘出的課程預(yù)警規(guī)則,可為課程成績(jī)的預(yù)測(cè),高校教學(xué)方案的設(shè)計(jì)提供數(shù)據(jù)支撐,有助于提升高校的教學(xué)質(zhì)量.

      猜你喜歡
      項(xiàng)集置信度事務(wù)
      “事物”與“事務(wù)”
      基于分布式事務(wù)的門(mén)架數(shù)據(jù)處理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
      硼鋁復(fù)合材料硼含量置信度臨界安全分析研究
      河湖事務(wù)
      正負(fù)關(guān)聯(lián)規(guī)則兩級(jí)置信度閾值設(shè)置方法
      置信度條件下軸承壽命的可靠度分析
      軸承(2015年2期)2015-07-25 03:51:04
      關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
      卷宗(2014年5期)2014-07-15 07:47:08
      一種頻繁核心項(xiàng)集的快速挖掘算法
      SQLServer自治事務(wù)實(shí)現(xiàn)方案探析
      多假設(shè)用于同一結(jié)論時(shí)綜合置信度計(jì)算的新方法?
      荣成市| 高淳县| 沈阳市| 丰镇市| 佛山市| 沁源县| 乌拉特中旗| 景泰县| 五河县| 德安县| 博湖县| 乐至县| 宁海县| 玛沁县| 分宜县| 竹北市| 南丰县| 柞水县| 新巴尔虎右旗| 密云县| 龙口市| 兴业县| 方山县| 河津市| 芦溪县| 西峡县| 若尔盖县| 芒康县| 阿合奇县| 大化| 桦川县| 松阳县| 莱州市| 仪征市| 通辽市| 若尔盖县| 苏尼特右旗| 沅陵县| 崇义县| 天祝| 新龙县|