• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      關(guān)聯(lián)規(guī)則算法在計(jì)算機(jī)等級考試成績分析中的應(yīng)用

      2021-05-14 13:57:32鄭秀月
      關(guān)鍵詞:總成績題型數(shù)據(jù)挖掘

      鄭秀月

      (福州黎明職業(yè)技術(shù)學(xué)院,福建 福州 350001)

      一、關(guān)聯(lián)規(guī)則

      (一)關(guān)聯(lián)規(guī)則

      關(guān)聯(lián)規(guī)則作為數(shù)據(jù)挖掘過程中不可或缺的算法規(guī)則,是當(dāng)前在數(shù)據(jù)挖掘領(lǐng)域被普遍采用的甚至有可能是使用最為頻繁、應(yīng)用范圍最為廣泛、研究最為深入的數(shù)據(jù)挖掘手段之一。

      關(guān)聯(lián)規(guī)則的挖掘一般可以通過兩步程序來完成。第一步,定義高頻項(xiàng)和高頻項(xiàng)集合。高頻項(xiàng)為所有出現(xiàn)頻率相對高的項(xiàng);所有高頻項(xiàng)的集合即為高頻項(xiàng)集,也就是支持度大于用戶給定的最低支持度的所有項(xiàng)的集合[1]。第二步,尋找高度關(guān)聯(lián)的規(guī)則。即從高頻度集合中找出確信度高的規(guī)則,也就是確信度比用戶給定的最低確信度大的規(guī)則[2]。

      (二)Apriori 算法

      Apriori 算法的重要之處在于其能影響高頻度集合的產(chǎn)生的準(zhǔn)確度,是人們在運(yùn)用數(shù)據(jù)挖掘技術(shù)尋找關(guān)聯(lián)規(guī)則時(shí)最早使用的算法之一。通過采用對支持度按照相應(yīng)規(guī)則進(jìn)行“剪枝”的技術(shù),可以達(dá)到減少候選高頻度集合產(chǎn)生的目的。

      該算法通過逐層剖析的方法尋找出關(guān)聯(lián)規(guī)則,基本思想如下[3]:

      第一步,規(guī)則A->B 是高確信度且B 只含一個(gè)項(xiàng),則將類似的所有規(guī)則均提取出來。

      第二步,將通過前一步驟篩選出來的規(guī)則的結(jié)果進(jìn)行整合后重新生成候選規(guī)則。

      第三步,刪除確信度低于最低確信度的規(guī)則,以達(dá)到滿足高度關(guān)聯(lián)規(guī)則的原則。

      二、改進(jìn)的Apriori 算法

      Apriori 算法是在分析支持度和確信度的基礎(chǔ)上運(yùn)算得出結(jié)論的,并未考慮所找出的不同規(guī)則對用戶的影響程度,所找到的很多規(guī)則往往對用戶的影響并不大,因此,這里引入了第三個(gè)參數(shù)影響度。

      具體操作過程如下:對根據(jù)Apriori 算法產(chǎn)生的規(guī)則分別計(jì)算確信度和影響度,對于規(guī)則X->Y,影響度(RI)的公式如式1 所示。

      其中,P(X )、P(Y )、P(XY )分別表示X、Y 以及X 和Y 同時(shí)出現(xiàn)的概率,經(jīng)改進(jìn)后挖掘出的關(guān)聯(lián)規(guī)則除滿足支持度和確信度分別大于它們相應(yīng)的最小閾值外,還應(yīng)滿足影響度大于最小影響度閾值。

      三、改進(jìn)算法的應(yīng)用

      由于考試中部分題型是平時(shí)的練習(xí)原題,這里不加以考慮,本文以福州黎明職業(yè)技術(shù)學(xué)院2017—2019 學(xué)年部分學(xué)生在福建省計(jì)算機(jī)一級等級考試中的成績和學(xué)生是否為學(xué)生干部、理論知識、操作能力(Word、Excel、PowerPoint)、錄入題的得分情況為研究對象,采用關(guān)聯(lián)規(guī)則中著名的Apriori 算法對它們進(jìn)行挖掘計(jì)算,得出以上各因素對總成績優(yōu)秀率的影響。生成的成績表中列字段分別為姓名、性別、專業(yè)、年級、準(zhǔn)考證號、理論知識、Word 得分、Excel 得分、PowerPoint 得分、錄入題得分、是否為學(xué)生干部和總成績等數(shù)據(jù)。

      (一)數(shù)據(jù)預(yù)處理

      本文運(yùn)用以下方法對上述收集到的成績表數(shù)據(jù)進(jìn)行預(yù)處理:一是將成績表中少量屬性值為空的記錄采用平均值填充法;二是將缺考學(xué)生的數(shù)據(jù)剔除;三是將表中對挖掘結(jié)果不產(chǎn)生影響的字段剔除,如姓名、性別、專業(yè)、年級。經(jīng)過預(yù)處理后,剩下2500 條記錄。

      (二)數(shù)據(jù)轉(zhuǎn)換

      將上述預(yù)處理后學(xué)生的成績數(shù)據(jù)轉(zhuǎn)換為0、1、2 表示。具體的轉(zhuǎn)換規(guī)則如下:

      計(jì)算機(jī)等級考試成績的證書分為兩個(gè)級別:優(yōu)秀、合格??偡执笥诘扔?5 分為優(yōu)秀用2 表示,60到84 分之間的為合格用1 表示,小于60 分的不達(dá)標(biāo)用0 表示。

      將是否為學(xué)生干部、理論知識、Word、Excel、PowerPoint、錄入題等題型的得分情況也參照總成績正確率大于85%為優(yōu)秀,正確率在60%~85%為合格,否則為不達(dá)標(biāo)的方法進(jìn)行等級劃分。劃分后選擇題的3 個(gè)檔分別為:25.5~30、18~24 以及小于24;理論知識3 個(gè)檔分別為22~26、16~21 以及小于16;Word 和 Excel 的 3 個(gè)檔分別為 12~14、9~11 以及小于9;PowerPoint 的 3 個(gè)檔分別為劃分 9~11、6.5~8 以及小于8;錄入題的3 個(gè)檔分別為5、3~4、0~2。查找高頻度集合時(shí),用布爾型0與1表示更為方便,因此,將字段理論知識、Word、Excel、PowerPoint、錄入題、是否為學(xué)生干部、總成績分別用A、B、C、D、E、F、G 表示,A0 表示理論知識為不達(dá)標(biāo),A1 表示理論知識為合格,A2 表示理論知識為優(yōu)秀;運(yùn)用同一方式表示B、C、D、E、G;F0 表示非學(xué)生干部,F(xiàn)1 表示學(xué)生干部。經(jīng)轉(zhuǎn)換后最終生成的學(xué)生成績?nèi)绫? 所示。

      表1 經(jīng)處理后的學(xué)生成績表

      (三)實(shí)施數(shù)據(jù)挖掘

      通過預(yù)處理上述2500 名學(xué)生的成績數(shù)據(jù),事先假定確信度為0.5,假定影響度為1.2,假定最低的支持度為0.2,對上述轉(zhuǎn)換后的數(shù)據(jù)實(shí)施關(guān)聯(lián)規(guī)則挖掘。

      首先,為找出影響成績優(yōu)秀的關(guān)鍵原因,從表1 中篩選出成績優(yōu)秀的記錄,刪除其余的記錄。

      其次,分析上一步驟產(chǎn)生的成績優(yōu)秀的數(shù)據(jù),分別運(yùn)算得出各種影響因素不同等級的支持度計(jì)數(shù)填入1-集合的數(shù)據(jù)表F1 中。這里只將支持度高于最低支持度的記錄添加到F1 表中。

      再次,對F1 表進(jìn)行自然連接分析并按規(guī)則制作出候選1-集合,并根據(jù)相應(yīng)的支持度運(yùn)用“剪枝”技術(shù)制作出2-集合。以次類推制作出高頻率K-集合[4]。

      最后,計(jì)算根據(jù)上述步驟產(chǎn)生的各高頻度集合的非空子集的支持度、確信度和影響度,并與事先假定的最低的支持度、最低的確信度和最低的影響度分別進(jìn)行比較,保留滿足最低的支持度和最低的確信度的記錄[5],最終產(chǎn)生高度關(guān)聯(lián)規(guī)則。經(jīng)過數(shù)據(jù)挖掘得到關(guān)聯(lián)規(guī)則如表2 所示。

      表2 關(guān)聯(lián)規(guī)則表

      (四)結(jié)果分析

      由表2 可以得出:理論知識和Word 得分同時(shí)為優(yōu)秀時(shí),總成績有75%優(yōu)秀的可能性;理論知識、PowerPoint 的得分優(yōu)秀同時(shí)為學(xué)生干部時(shí),總成績有95%優(yōu)秀的可能性;理論知識成績?yōu)楹细?、Excel 得分為優(yōu)秀時(shí),總成績有90%優(yōu)秀的可能性;理論知識、Word 和Excel 得分均為優(yōu)秀時(shí),總成績有80%優(yōu)秀的可能性;Excel 和總成績優(yōu)秀時(shí),理論知識優(yōu)秀、PowerPoint 得分良好的可能性有80%;Excel 得分優(yōu)秀時(shí),Word 和錄入題得分同時(shí)優(yōu)秀的可能性為90%;總成績優(yōu)秀而且為學(xué)生干部時(shí),理論知識為優(yōu)秀同時(shí)PowerPoint 得分為合格的可能性為95%;總成績?yōu)閮?yōu)秀時(shí),理論知識為合格同時(shí)Excel 得分優(yōu)秀的可能性為92%。

      通過上述數(shù)據(jù)挖掘過程,找出隱含在其中的一些有意義的規(guī)則,如不同題型間得分的關(guān)聯(lián),是否為學(xué)生干部對Word、Excel、PowerPoint得分的影響,某些題型得分的優(yōu)秀對總分的影響程度。針對如何提高優(yōu)秀率,提出以下建議:

      首先,理論知識掌握的優(yōu)良程度對總分是否優(yōu)秀起著決定性作用。因此,教師在教學(xué)過程中要重視理論知識的教學(xué)并提示學(xué)生予以正確對待。

      其次,學(xué)生干部經(jīng)常會(huì)幫助院部、系部整理一些文檔,Office 部分的三種題型相對掌握都挺好,能直接決定成績的優(yōu)良,所以要鼓勵(lì)學(xué)生課后對課堂所學(xué)的操作知識多加練習(xí),做到熟能生巧。

      再次,Excel 作為試卷中最難的一部分,此題的得分情況能客觀體現(xiàn)學(xué)生的計(jì)算機(jī)操作水準(zhǔn)。數(shù)據(jù)挖掘的結(jié)論顯示,如果學(xué)生對這部分知識掌握較好,Word 和PowerPoint 得分也相對較高,其總成績基本是優(yōu)秀的。教師通過觀察學(xué)生對Excel 的掌握程度就能快速找出基礎(chǔ)薄弱的學(xué)生,并可針對其理論缺陷加以重點(diǎn)輔導(dǎo)。同時(shí),可以提醒在該環(huán)節(jié)中得分高的學(xué)生要重點(diǎn)關(guān)注理論知識的學(xué)習(xí),爭取在等級考試中獲得更突出的成績。

      (五)結(jié)果評價(jià)

      將總成績?yōu)閮?yōu)秀的100條數(shù)據(jù)用于測試,得出結(jié)論是否為學(xué)生干部、理論知識、Excel 得分是影響總成績的關(guān)鍵因素,從而驗(yàn)證了上述Apriori 算法產(chǎn)生的高度關(guān)聯(lián)規(guī)則是可信的。

      結(jié)語

      本文主要針對Apriori 算法中未考慮所產(chǎn)生的規(guī)則對用戶影響程度的問題,提出了影響度閾值的改進(jìn)算法。并將改進(jìn)的算法應(yīng)用到計(jì)算機(jī)一級等級考試成績分析中,從試卷題型等因素與總成績之間的關(guān)系角度進(jìn)行數(shù)據(jù)挖掘,找出影響學(xué)生成績的關(guān)鍵因素,為教師改進(jìn)教學(xué)方法提供參考,以此實(shí)現(xiàn)提高教師教學(xué)質(zhì)量并提高學(xué)生的計(jì)算機(jī)等級考試成績優(yōu)秀率的目的。

      猜你喜歡
      總成績題型數(shù)據(jù)挖掘
      離散型隨機(jī)變量??碱}型及解法
      巧妙構(gòu)造函數(shù) 破解三類題型
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      一次函數(shù)中的常見題型
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      隨機(jī)抽樣題型“曬一曬”
      謝文駿與劉翔110m欄分段成績與總成績的灰色關(guān)聯(lián)度對比分析
      體育科研(2016年5期)2016-07-31 17:44:26
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      飛鏢比賽
      飛鏢比賽
      讀寫算(上)(2015年25期)2015-09-10 12:15:02
      仁布县| 新龙县| 修水县| 沁阳市| 壤塘县| 基隆市| 唐河县| 科技| 沙坪坝区| 玉田县| 界首市| 宁陵县| 永城市| 湘阴县| 雅江县| 磐石市| 唐河县| 正定县| 苏尼特右旗| 望都县| 容城县| 海南省| 台前县| 双流县| 乐陵市| 天镇县| 莎车县| 米易县| 松江区| 军事| 铜陵市| 精河县| 方城县| 治多县| 元氏县| 麦盖提县| 贵港市| 长宁县| 安康市| 离岛区| 浑源县|