• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于關(guān)聯(lián)規(guī)則的計算機等級考試成績挖掘研究

      2021-12-18 12:40:17全同貴
      電腦知識與技術(shù) 2021年31期
      關(guān)鍵詞:關(guān)聯(lián)規(guī)則數(shù)據(jù)倉庫數(shù)據(jù)挖掘

      全同貴

      摘要:隨著大數(shù)據(jù)時代的快速發(fā)展,數(shù)據(jù)挖掘輔助教育決策成為了熱門的研究課題。全國計算機等級考試,積累了大量報名、學(xué)習(xí)、考試相關(guān)數(shù)據(jù)。該文基于湖南省某高校2247個學(xué)生真實的數(shù)據(jù),采用Clementine數(shù)據(jù)挖掘工具中的Apriori模型,進行學(xué)生成績關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘;研究結(jié)果表明,學(xué)生參加考前操作考試訓(xùn)練、課前觀看視頻預(yù)習(xí)對提高計算機過級成績至關(guān)重要。研究進一步發(fā)現(xiàn)學(xué)生程序?qū)W習(xí)興趣度對過級成績有較弱的影響。本來興趣應(yīng)該是強關(guān)聯(lián)項,可是在應(yīng)試教育下,目標(biāo)才是學(xué)生學(xué)習(xí)的壓力,動力來自壓力。這為深化素質(zhì)教育改革提供了參考依據(jù)。

      關(guān)鍵詞: 數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;NCRE;數(shù)據(jù)倉庫

      中圖分類號:G642 ? ? ? ?文獻標(biāo)識碼:A

      文章編號:1009-3044(2021)30-0041-03

      Research on Mining Computer Rank Examination Score of College Students Based on Apriori Model

      QUAN Tong-gui

      (Hunan University of Medicine, Huaihua 418000, China)

      Abstract: With the rapid development of the era of big data, data mining has become a hot research topic in the decision-making of supplementary education. National computer level examination, accumulated a large number of registration, study, examination-related data. Based on the real data of 2247 students in a university in Hunan Province, this paper uses the Apriori model in the Clementine data mining tool to do data mining on the rules of student achievement association. The study further found that students' interest in program learning had a weak effect on grade achievement. Originally, interest should be a strong correlation, but in test-based education, the goal is the pressure of students to learn, motivation from pressure. This provides a reference for deepening the reform of quality education..

      Key words: data mining; association rules; NCRE; the data warehouse

      1 引言

      數(shù)據(jù)在當(dāng)今信息化時代以幾何級數(shù)爆炸增長,面對海量積累的歷史數(shù)據(jù)[1],如何發(fā)現(xiàn)隱藏其中的有用的規(guī)律、規(guī)則、模式、約束等知識,以服務(wù)于決策,數(shù)據(jù)挖掘 (Data Mining, DM) 因運而生,它是通過一定算法從海量數(shù)據(jù)中發(fā)現(xiàn)隱藏的模式和知識的過程[2], 自誕生以來,在國內(nèi)外迅速發(fā)展,方興未艾,正逐步解決從海量的歷史數(shù)據(jù)中挖掘知識為科學(xué)決策服務(wù),在銀行、醫(yī)療、教育等領(lǐng)域已得到了廣泛的應(yīng)用[3]。

      全國計算機等級考試,積累了大量報名、學(xué)習(xí)、考試相關(guān)數(shù)據(jù)。如何利用這些數(shù)據(jù)分析出影響學(xué)習(xí)效果的主要因素,以期幫助學(xué)校管理者調(diào)整決策、老師改進教學(xué)、學(xué)生明確不足是一個非常有意義的研究問題。數(shù)據(jù)挖掘運行在數(shù)據(jù)倉庫的平臺上[4]。本研究首先建立學(xué)生成績數(shù)據(jù)倉庫結(jié)合高校教務(wù)管理系統(tǒng)學(xué)生成績相關(guān)數(shù)據(jù)庫、調(diào)查問卷、拷貝相關(guān)文件、整理歷史資料等多個異構(gòu)數(shù)據(jù)源,補全數(shù)據(jù)。在已有數(shù)據(jù)倉庫的基礎(chǔ)上,基于湖南省某高校2247個學(xué)生真實的數(shù)據(jù),采用Clementine數(shù)據(jù)挖掘工具中的Apriori模型[5],進行學(xué)生成績關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘,實驗表明:⑴全體學(xué)生中48.865%的學(xué)生觀看了視頻預(yù)習(xí)、參加考前操作考試訓(xùn)練且通過了過級考試。觀看了視頻預(yù)習(xí)且參加考前操作考試訓(xùn)練的學(xué)生99.636%通過了過級考試。⑵全體學(xué)生中58.879%的學(xué)生參加了考前操作考試訓(xùn)練且通過了過級考試。參加考前操作考試訓(xùn)練的學(xué)生96.145%通過了過級考試。⑶全體學(xué)生中57.677%的學(xué)生觀看了視頻預(yù)習(xí)且通過了過級考試。觀看了視頻預(yù)習(xí)的學(xué)生92.901%通過了過級考試。是否參加考前操作考試訓(xùn)練、是否課前觀看視頻預(yù)習(xí)對提高計算機過級成績至關(guān)重要。在全國高校促進大學(xué)生自主學(xué)習(xí)具有很好的推廣意義

      2 學(xué)生成績數(shù)據(jù)倉庫構(gòu)建

      2.1 數(shù)據(jù)采集

      猶如巧婦難為無米之炊,沒有數(shù)據(jù)采集就不能做數(shù)據(jù)預(yù)處理。本文中,學(xué)生基本信息:學(xué)號,教師號,課程號,姓名,身份證號、平時成績、應(yīng)用基礎(chǔ)成績直接來源于教務(wù)管理系統(tǒng)。VB過級成績由省教育廳考試中心下發(fā)。諸如算法初步高考題是否得分、是否課前觀看教學(xué)視頻預(yù)習(xí)、程序?qū)W習(xí)興趣度、是否參加題庫訓(xùn)練、是否購買資料等等,通過調(diào)查問卷獲得,并及時輸入電腦。課外上機時間,每個學(xué)生都有一個賬號,在多媒體閱覽室復(fù)制每個學(xué)期末的匯總數(shù)據(jù)。教師基本信息:教師號,課程號,教師姓名,職稱,學(xué)歷,授課班級號等,來源于教務(wù)系統(tǒng)。課程基本信息:課程號,教師號,課程名稱,課程類型,學(xué)分等,同樣來自教務(wù)系統(tǒng)。關(guān)于調(diào)查問卷的統(tǒng)計工作,為了節(jié)約時間,使表格填寫規(guī)范,盡量減少缺失值與噪聲數(shù)據(jù),用Excel編制調(diào)查問卷表,由任課老師利用上計算機實驗課時間在學(xué)校機房的局域網(wǎng)上組織學(xué)生填寫。為了避免學(xué)生隨心所欲填寫調(diào)查問卷,利用Excel數(shù)據(jù)有效性檢查,將Salgorithm、Sview、Strain、Sbuy設(shè)置成選擇序列“是/否”,Sxqd設(shè)置為選擇序列“愛好/一般/反感”,這樣可以有效地避免了無效數(shù)據(jù)的產(chǎn)生。

      2.2數(shù)據(jù)清洗

      教務(wù)管理系統(tǒng)積累的數(shù)據(jù)以及外界補充的數(shù)據(jù),來源不同,具有不完整性和不一致性,可能有缺失值,或者含有噪音,不能直接進行數(shù)據(jù)挖掘。數(shù)據(jù)清洗是獲得高質(zhì)量數(shù)據(jù)的必經(jīng)之路,是數(shù)據(jù)挖掘的前奏[6]。以數(shù)據(jù)缺失處理為例處理具有大量缺失值的列的方法是直接刪除。通過Clementine的Filter節(jié)點把具有大量缺失值的字段Salgorithm過濾掉。操作界面如圖1所示,運行結(jié)果如圖2所示。

      2.3 數(shù)據(jù)集成

      使用Clementine對數(shù)據(jù)庫中學(xué)生成績做數(shù)據(jù)集成。以集成具有相同結(jié)構(gòu)的兩個表的記錄合并為例,把全校以班為單位的工作表文件合并成一個總文件。Clementine操作節(jié)點設(shè)計界面如圖3所示,運行結(jié)果如圖4所示,此時記錄數(shù)為60,字段數(shù)不變。

      3 學(xué)生計算機等級考試成績挖掘

      3.1 提出問題

      制約學(xué)習(xí)成績好壞的因素有哪些?

      1)興趣是學(xué)習(xí)的動力,對程序設(shè)計感興趣,是否意味著計算機等級考試穩(wěn)操勝券呢?

      2)是否購買教育部考試中心指定的教材、資料,影響學(xué)生過級嗎?

      3)是否在課前觀看計算機新課教學(xué)視頻預(yù)習(xí),影響過級嗎?

      4)是否參加考前操作考試訓(xùn)練,影響過級嗎?

      5)女生編程學(xué)習(xí)不如男生,所以女生考試通過率低,對嗎?

      想要回答這些與學(xué)生成績相關(guān)的問題,僅僅靠統(tǒng)計手段是很難回答問題的,必須借助于數(shù)據(jù)挖掘技術(shù)。關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘?qū)Υ罅繕颖具M行關(guān)聯(lián)分析后得到的強關(guān)聯(lián)規(guī)則可以探討性地回答上述問題。

      3.2 學(xué)生成績挖掘方案與步驟

      大學(xué)生計算機等級考試成績挖掘的方案以教務(wù)系統(tǒng)數(shù)據(jù)庫為基礎(chǔ),通過調(diào)查問卷、復(fù)制相關(guān)數(shù)據(jù)文件等措施,補充完善數(shù)據(jù),建立健全學(xué)生成績數(shù)據(jù)庫。以學(xué)生成績數(shù)據(jù)庫為對象,應(yīng)用SPSS Clementine 12.0 中的Apriori模型作為數(shù)據(jù)挖掘工具[7],對影響成績的幾個可能的因素進行關(guān)聯(lián)分析,找出強關(guān)聯(lián)規(guī)則,指導(dǎo)教學(xué)活動。

      1)確定分析對象與目標(biāo)。本實驗確定討論“算法初步高考題是否得分字段Salgorithm”“程序?qū)W習(xí)興趣度字段Sxqd”“是否購買教材資料字段Sbuy”“是否在課前觀看教學(xué)視頻預(yù)習(xí)字段Sview”“是否參加考前操作考試訓(xùn)練字段Strain”“性別字段Ssex”共五個因素對“是否過級字段Spass”有沒有強關(guān)聯(lián)關(guān)系。

      2)數(shù)據(jù)準(zhǔn)備。經(jīng)過數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理建立學(xué)生成績數(shù)據(jù)倉庫。選擇湖南省某高校2247個學(xué)生的統(tǒng)考成績,數(shù)據(jù)預(yù)處理后得到供關(guān)聯(lián)分析的文件2012ncreA.xls。

      3)選定模型。從Clementine提供數(shù)據(jù)挖掘模型中選擇Apriori模型。

      4)建立模型。

      3.3 模型評估與挖掘結(jié)果分析

      根據(jù)建立好的模型,把Salgorithm、Sxqd、Sbuy、Sview、Strain、Ssex六個字段的方向設(shè)為In,把Spass字段設(shè)為Out,其余無關(guān)字段設(shè)為None。設(shè)置Apriori結(jié)點模型參數(shù)Min_sup=40%、Min_conf=75%如圖5所示,執(zhí)行數(shù)據(jù)流,得到可視化結(jié)果。如圖6所示。

      從圖6可視化挖掘結(jié)果輸出關(guān)聯(lián)規(guī)則可以得出如下結(jié)論:

      結(jié)論1:全體學(xué)生中48.865%的學(xué)生觀看了視頻預(yù)習(xí)、參加考前操作考試訓(xùn)練且通過了過級考試。觀看了視頻預(yù)習(xí)且參加考前操作考試訓(xùn)練的學(xué)生99.636%通過了過級考試。

      結(jié)論2:全體學(xué)生中58.879%的學(xué)生參加考前操作考試訓(xùn)練且通過了過級考試。參加考前操作考試訓(xùn)練的學(xué)生96.145%通過了過級考試。

      結(jié)論3:全體學(xué)生中57.677%的學(xué)生觀看了視頻預(yù)習(xí)且通過了過級考試。觀看了視頻預(yù)習(xí)的學(xué)生92.901%通過了過級考試。

      調(diào)整Apriori結(jié)點模型選項設(shè)置,將Min_sup降低到32%,Min_conf不變,執(zhí)行數(shù)據(jù)流,得到一個新的關(guān)聯(lián)規(guī)則,Salgorithm^Strain Spass,Support=33.912%,Confidence=96.457%如圖7所示,可得出如下結(jié)論:

      結(jié)論4:全體學(xué)生中33.912%的學(xué)生算法高考題得分、參加考前操作考試訓(xùn)練且通過了過級考試。算法高考題得分且參加考前操作考試訓(xùn)練的學(xué)生99.636%通過了過級考試。

      調(diào)整Apriori結(jié)點模型選項設(shè)置,將Min_sup降低到28%和10%,Min_conf不變。執(zhí)行數(shù)據(jù)流,得到一個新的關(guān)聯(lián)規(guī)則,如圖8所示,可得出如下結(jié)論:

      結(jié)論5:“程序?qū)W習(xí)興趣度”對過級成績有較弱的影響。

      結(jié)論6:性別和“是否購買資料”是不會影響過級的。

      3.4 挖掘結(jié)論

      結(jié)論1~3充分說明:是否參加考前操作考試訓(xùn)練、是否課前觀看視頻預(yù)習(xí)對提高計算機過級成績至關(guān)重要。對于操作考試訓(xùn)練,很多同學(xué)臨考前,重理論,輕操作,是考試掛科的一個重要原因。紙上得來終覺淺,要知此事須躬行。應(yīng)讓學(xué)生在學(xué)習(xí)過程中充分認識到程序設(shè)計是一門理論和實踐并重的學(xué)科。同時,要注意循序漸進。平時只聽課,不參加操作考試訓(xùn)練,臨考前匆匆忙忙做幾套卷,是不會僥幸過關(guān)的。

      結(jié)論4:“算法高考題是否得分”對過級成績有一定的影響。由于大學(xué)程序設(shè)計教學(xué)實行的是零起點教學(xué),“算法高考題是否得分” 對過級成績影響應(yīng)該不大。結(jié)論有一定偏差。究其原因,“算法高考題是否得分”很可能是間接反映了學(xué)生的學(xué)習(xí)能力,從而對過級成績有一定影響?;蛘?,數(shù)據(jù)在調(diào)查問卷填寫時,出現(xiàn)偏差。通過這個問題,拓寬來看中國的計算機教育,小學(xué)信息技術(shù)課與中學(xué)脫節(jié),中學(xué)計算機教學(xué)與大學(xué)不接軌,浪費了中國青少年多少寶貴的青春年華。能否在大學(xué)程序設(shè)計課的教學(xué)計劃里,安排幾個課時,先復(fù)習(xí)中學(xué)所學(xué)的算法初步,教學(xué)承前啟后,不再做沒有意義的重復(fù)教學(xué),留出時間多訓(xùn)練一下學(xué)生的編程技能。

      結(jié)論5:“程序?qū)W習(xí)興趣度”對過級成績有較弱的影響。本來,興趣是學(xué)習(xí)成績的強關(guān)聯(lián)項,可是在應(yīng)試教育下,目標(biāo)才是學(xué)生學(xué)習(xí)的壓力,壓力轉(zhuǎn)化為動力。這個結(jié)論說明:我們的大學(xué)計算機教學(xué)及過級考試仍然是典型的應(yīng)試教育模式。這個研究結(jié)論為深化中國素質(zhì)教育改革提供了理論參考依據(jù)。

      結(jié)論6:性別和“是否購買資料”是不會影響過級的。這很好地回答了兩個問題:⑴女生不用擔(dān)心性別差異影響計算機學(xué)習(xí),造成不必要的心理恐慌。⑵在多媒體學(xué)習(xí)的時代,應(yīng)當(dāng)盡量少用紙質(zhì)教材、資料,多建設(shè)共享的電子教材,逐步取消紙質(zhì)書籍,允許學(xué)生自主選擇購買教材,把高年級學(xué)生的教材回收再利用。

      4 總結(jié)

      本文以教務(wù)管理系統(tǒng)為基礎(chǔ),采用調(diào)查問卷、從學(xué)生檔案管理系統(tǒng)轉(zhuǎn)錄、復(fù)制學(xué)生課外上機記錄數(shù)據(jù)庫、收集省教育廳考試中心轉(zhuǎn)發(fā)的歷屆NCRE考試成績表文件等形式建立健全學(xué)生成績數(shù)據(jù)庫,經(jīng)數(shù)據(jù)清理和集成后,創(chuàng)建學(xué)生成績分析數(shù)據(jù)倉庫。然后根據(jù)數(shù)據(jù)倉庫中的相關(guān)數(shù)據(jù)選擇可能影響學(xué)習(xí)成績的因素六個:課前是否看視頻預(yù)習(xí)、是否參加考前操作卷的訓(xùn)練、算法初步高考題是否得分、性別、興趣度、是否購買資料,以基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘算法對2247名學(xué)生的計算機等級考試成績進行挖掘,探討了影響學(xué)生成績的因素。實驗分析結(jié)果可以作為教師教學(xué)過程的指導(dǎo)和學(xué)生學(xué)習(xí)過程的建議?;跀?shù)據(jù)挖掘的影響學(xué)生成績因素的分析研究還存在很多問題。在今后的研究中,進一步完善學(xué)校成績數(shù)據(jù)倉庫的建設(shè),?為每個學(xué)習(xí)者建立畫像,嘗試更多的數(shù)據(jù)挖掘方法以達到能更好的為教師提供教學(xué)反饋,為學(xué)習(xí)者提供學(xué)習(xí)反思。

      參考文獻:

      [1] 米允龍, 米春橋, 劉文奇. 海量數(shù)據(jù)挖掘過程相關(guān)技術(shù)研究進展[J]. 計算機科學(xué)與探索,2015,9(6):641-659.

      [2] 王麗珍, 周麗華, 陳紅梅. 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理及應(yīng)用[M]. 北京:科學(xué)出版社,2009.

      [3] 毛曉菊. 基于模糊關(guān)聯(lián)規(guī)則的海量數(shù)據(jù)挖掘方法研究[J]. 微電子學(xué)與計算機, 2018,35(2):89-93.

      [4] 李雯娟, 曾照芳, 陳睿. 基于醫(yī)學(xué)信息數(shù)據(jù)倉庫模型的數(shù)據(jù)挖掘[J]. 生物信息學(xué), 2009,7(2):146-149.

      [5] 朱晴. 融合關(guān)聯(lián)規(guī)則挖掘算法的信息化教學(xué)管理系統(tǒng)設(shè)計[J]. 現(xiàn)代電子技術(shù), 2020,43(23):159-163.

      [6] 張婷婷. 基于關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘技術(shù)在音樂分類中應(yīng)用[J]. 現(xiàn)代電子技術(shù), 2020,43(1):99-101,106.

      [7] 張靜端. 基于Clementine的數(shù)據(jù)挖掘技術(shù)對學(xué)科隱形關(guān)聯(lián)的研究——以東華大學(xué)紡織學(xué)科為例[J]. 現(xiàn)代情報, 2013,33(9):145-149.

      【通聯(lián)編輯:王力】

      猜你喜歡
      關(guān)聯(lián)規(guī)則數(shù)據(jù)倉庫數(shù)據(jù)挖掘
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      基于數(shù)據(jù)倉庫的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      分布式存儲系統(tǒng)在液晶面板制造數(shù)據(jù)倉庫中的設(shè)計
      電子制作(2016年15期)2017-01-15 13:39:15
      關(guān)聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
      數(shù)據(jù)挖掘在高校課堂教學(xué)質(zhì)量評價體系中的應(yīng)用
      探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉庫技術(shù)的應(yīng)用
      關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進
      中國市場(2016年36期)2016-10-19 04:10:44
      基于關(guān)聯(lián)規(guī)則的計算機入侵檢測方法
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      惠安县| 临高县| 象山县| 九龙坡区| 永平县| 沂水县| 山西省| 沈丘县| 乐业县| 普陀区| 太仆寺旗| 安达市| 辽阳县| 五原县| 盱眙县| 建平县| 高清| 望城县| 吉安市| 绩溪县| 尚义县| 日喀则市| 青川县| 广昌县| 汽车| 咸丰县| 铜山县| 皮山县| 宁海县| 建始县| 玛多县| 遂平县| 泽州县| 米林县| 三都| 湖南省| 资源县| 天津市| 浦城县| 古蔺县| 澎湖县|