• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)據(jù)挖掘技術(shù)在計算機等級考試成績中的分析研究

      2015-07-13 11:49曾斯
      電腦知識與技術(shù) 2015年13期
      關(guān)鍵詞:關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘

      曾斯

      摘要:利用數(shù)據(jù)挖掘技術(shù)分析某高職院校全國計算機等級考試成績,從中發(fā)現(xiàn)了影響考試成績的一些隱藏信息,得到的結(jié)論對于提高學生的考試通過率和教師今后的教學起著指導(dǎo)作用。

      關(guān)鍵詞:數(shù)據(jù)挖掘;等級考試;關(guān)聯(lián)規(guī)則

      中圖分類號:TP3911 文獻標識碼:A 文章編號:1009-3044(2015)13-0014-02

      Abstract: Analysis of data mining technology the National computer grade examination results of Vocational Colleges, Some of the hidden information that has been found to affect the results of the exam is found. The conclusion is of guiding function for improving students' examination pass rate and teachers' future teaching.

      Key words: data mining; grade examination; association rules

      1 引言

      隨著計算機技術(shù)的不斷發(fā)展,越來越多的高校開始重視計算機應(yīng)用基礎(chǔ)課程的教學,《計算機應(yīng)用基礎(chǔ)》作為一門必修的公共基礎(chǔ)課,很多高職院校對該課程的考核不再是采用單一的期末考試,而是把計算機等級考試成績列為對考核學生該課程的重要內(nèi)容和對教師教學效果的評價依據(jù)。以筆者所任職的學院為例,學院將全國計算機等級考試一級的通過率作為考核學生的《計算機應(yīng)用基礎(chǔ)》課程的成績,而且該證書也得到了很多用人單位的認可,也成為了學生畢業(yè)找工作的一個敲門磚,因此學院非常重視。鑒于各種原因,學生的通過率普遍不高,事實上,影響學生考試通過率的原因很多,本文就該問題引入了數(shù)據(jù)挖掘技術(shù),目的是從中找到影響學生成績的各種關(guān)聯(lián)因素,以此來制定整改措施,為后續(xù)的教學活動提供參考,從而提高學生計算機等級考試的通過率。

      2 數(shù)據(jù)挖掘技術(shù)

      數(shù)據(jù)挖掘技術(shù)是從海量的、不完整的、模糊的、有噪聲的以及隨機的原始數(shù)據(jù)中搜索出隱含在其中的,之前未知的而具有利用價值的信息的過程。如何對一些直觀的或隱含的海量數(shù)據(jù)進行分析,并且發(fā)現(xiàn)各數(shù)據(jù)間存在的聯(lián)系,提取出有用的模式,用以指導(dǎo)實際工作是數(shù)據(jù)挖掘技術(shù)的關(guān)鍵所在。由于數(shù)據(jù)挖掘技術(shù)的優(yōu)越性和不斷成熟,目前該技術(shù)已經(jīng)廣泛應(yīng)用到商業(yè)決策、生產(chǎn)控制、工程設(shè)計和金融業(yè)等多個領(lǐng)域。

      數(shù)據(jù)挖掘的分析方法有多種,關(guān)聯(lián)規(guī)則分析、聚類規(guī)則分析、預(yù)測分析、分類規(guī)則分析等都是常用的挖掘方法。

      數(shù)據(jù)挖掘的過程包括以下幾步:首先對數(shù)據(jù)進行收集和預(yù)處理,對其進行消噪,去掉錯誤或冗余數(shù)據(jù)等處理,使之成為目標數(shù)據(jù),為下一步的操作做準備,同時要確定挖掘方法;然后是數(shù)據(jù)變換,根據(jù)之前的挖掘算法建立分析模型;接下來是數(shù)據(jù)挖掘和模式評估,將上一步得到的經(jīng)過變換后的數(shù)據(jù)進行挖掘;最后是結(jié)果分析和知識同化,解釋并評估結(jié)果,將分析后得到的知識應(yīng)用到實際的案例中。在數(shù)據(jù)挖掘整個過程中,牽涉到了前期大量的準備與規(guī)劃工作,幾乎有80%的時間和精力花費在了數(shù)據(jù)的預(yù)處理階段,而且數(shù)據(jù)預(yù)處理階段得出的數(shù)據(jù)質(zhì)量的高低也直接決定了挖掘后的結(jié)果。因此,在進行數(shù)據(jù)挖掘分析之前,還是很有必要做好前期的準備工作。

      3 數(shù)據(jù)挖掘技術(shù)在計算機等級考試成績分析中的應(yīng)用

      本文挖掘的數(shù)據(jù)來源于作者所任教學校的幾次全國計算機等級考試一級成績。由于每次考試都產(chǎn)生幾千條數(shù)據(jù),久而久之,大量的數(shù)據(jù)存儲在教務(wù)系統(tǒng)中,并沒有得到充分的利用,如何利用好這些數(shù)據(jù)為以后的教學提供服務(wù)是數(shù)據(jù)挖掘的目的所在。在數(shù)據(jù)挖掘之前,需要對數(shù)據(jù)進行清理,比如對于一些缺考的學生,還有一些因漏答造成數(shù)據(jù)不完整的記錄等都需要將其清除掉。

      3.1應(yīng)用關(guān)聯(lián)規(guī)則分析教師的教齡、職稱、評教情況在計算機等級考試成績中的影響

      關(guān)聯(lián)分析是在當前教學活動中使用很頻繁的有效的方法。它用于發(fā)現(xiàn)數(shù)據(jù)庫中數(shù)值之間的相關(guān)性,從中找尋一些潛在的有用信息用于指導(dǎo)以后的教學工作。目前比較常用的關(guān)聯(lián)分析方法有關(guān)聯(lián)規(guī)則和序列模式。比如從海量的超市購物數(shù)據(jù)中發(fā)現(xiàn)有趣的關(guān)聯(lián)關(guān)系,可以幫助商家進行改變營銷策略,如促銷的時機、交叉銷售、貨架商品的擺放設(shè)計等。

      對于某些高職院校,由于取消了單一的期末考試,往往將學生英語過級和計算機等級考試的通過率作為評價教師教學效果的依據(jù)。通過運用關(guān)聯(lián)規(guī)則來分析學生的考試成績,挖掘出一些可能會影響學生過級率的一些相關(guān)因素,對今后的教學過程起著重要的指導(dǎo)作用?,F(xiàn)將我院計算機等級考試成績進行如下分析:

      隨機抽取本院擔任計算機教學的教師信息和學生計算機等級考試成績集成教師教學綜合信息表。然后將教師的教齡、職稱、評教情況、所教授對應(yīng)學生的成績錄入數(shù)據(jù)庫中,其他信息不做處理。為了簡化分析,接下來需要將數(shù)據(jù)進行抽象和離散化處理。優(yōu)秀的為3(90~100),良好的為2(80~89),及格的為1(60~79),不及格的為0(0~59)。教齡分為四個階段,分別用A1(1-5)、A2(6-10)、A3(11-20)、A4(21-30)表示,職稱分別用B1(初級)、B2(中級)、B3(副高)、B4(正高)表示,評教情況分別用C1(好)、C2(一般)、C3(較差)表示,D1(3,2,1,0)分別表示考試成績的等級。

      數(shù)據(jù)經(jīng)預(yù)處理后的視圖如下:

      根據(jù)關(guān)聯(lián)規(guī)則算法,先預(yù)設(shè)最小支持度以及最小可信度,得到如下結(jié)論:教師的教齡和職稱對于過級率的影響并不直接,而跟教師的評教情況卻不無關(guān)系,教師的評教情況越好,對應(yīng)的學生考試成績也就越好。因此,通過及時反饋學生對教師的教學評價,來加強教師的教學質(zhì)量,對提高學生等級考試成績是非常重要的。

      3.2 應(yīng)用聚類算法對等級考試試題進行分析

      眾所周知,計算機一級考試題型有以下6種:選擇題、Windows7操作題、文字處理、電子表格、演示文稿和網(wǎng)絡(luò)操作題。在這里將采用聚類算法中的K-Means算法對這6個屬性間的聚類分析進行挖掘。

      為了更好地進行聚類分析,首先需要對數(shù)據(jù)實行標準化。在實行標準化時需遵循的原則是:將每個題型的實際得分數(shù)除以該題型的總分,如對于文字處理題,某考生得分為20分,文字處理題的總分為25分,20/25=0.8。同樣的方法,由此得到最終的標準化值范圍是[0,1]。其次是對數(shù)據(jù)進行聚類分析,傳統(tǒng)的K-Means 算法采取的是隨機選擇初始聚類中心的原則,這就使得不同的初始聚類中心會造成聚類結(jié)果的差異和不穩(wěn)定。為了使聚類結(jié)果具有更好的穩(wěn)定性,現(xiàn)將學生的考試成績分布情況大致分為優(yōu)秀、良好、及格和不及格4個等級。通過不同的等級來確定該等級的初始聚類中心。最后是對生成的聚類結(jié)果進行分析。例如學生在網(wǎng)絡(luò)操作題上普遍得分率較高,在電子表格處理題上面得分率較低。通過分析教師能夠直觀的了解學生對各知識點的掌握程度,便于以后在實際的教學中做出針對性的改進。同時,教師也可根據(jù)各類學生的學習特點做合適的指導(dǎo),調(diào)整教學方法及相應(yīng)內(nèi)容,從而幫助學生順利通過考試。

      3.3 應(yīng)用分類算法分析影響計算機等級考試成績的其他因素,如有無計算機基礎(chǔ)、平時上機作業(yè)成績、是否參加了考前培訓(xùn)、學習興趣等

      所謂分類是對一個事件或者一組對象依據(jù)他們本身的特性來進行分類。分類的目的是找到一組能夠科學地描述數(shù)據(jù)典型特征的模型。以便將來能夠識別未來數(shù)據(jù)的類別或歸屬。使用分類模型不但可以分析現(xiàn)有的數(shù)據(jù),而且可以預(yù)測未來。分類和預(yù)測作為兩類主要的預(yù)測問題,根據(jù)它們的不同分別用于離散數(shù)據(jù)和連續(xù)數(shù)據(jù)的預(yù)測。對于影響計算機等級考試成績的諸多因素以及數(shù)據(jù)的特點,將應(yīng)用分類算法來對其各種影響因素來進行分析。分析的流程為:首先,采集數(shù)據(jù),主要包括的數(shù)據(jù)有以下幾個方面:學生基本信息(學號、姓名、性別、院系、班級);學生的學習情況信息(有無計算機基礎(chǔ)、是否參加了考前培訓(xùn)、學習興趣等);這些信息主要是通過對學生的問卷調(diào)查來獲得,成績(平時上機作業(yè)成績、等級考試成績)。其次,對獲取的數(shù)據(jù)預(yù)處理。在預(yù)處理之前需要對數(shù)據(jù)進行集成和清理,這一步的目的是為了填補一些遺漏的數(shù)據(jù),從而有利于將上述收集到的各種數(shù)據(jù)通過數(shù)據(jù)庫技術(shù)生成一個標準的學生成績數(shù)據(jù)庫。然后就是數(shù)據(jù)轉(zhuǎn)換,即對數(shù)據(jù)進行離散化操作。接著是數(shù)據(jù)消減,其目的是縮減挖掘數(shù)據(jù)的規(guī)模,但前提條件是不能影響最終的挖掘結(jié)果。最后是進行數(shù)據(jù)分類挖掘并產(chǎn)生分類規(guī)則。通過上述的幾個步驟可得出哪些因素是影響了學生考試成績的。

      如IF平時上機作業(yè)成績=優(yōu)秀 AND有無計算機基礎(chǔ)=有AND參加考前培訓(xùn)=是 THEN 等級考試通過率=96%

      IF平時上機作業(yè)成績=良好 AND有無計算機基礎(chǔ)=有AND參加考前培訓(xùn)=是THEN 等級考試通過率=75%

      IF平時上機作業(yè)成績=及格 AND有無計算機基礎(chǔ)=有AND參加考前培訓(xùn)=無 THEN 等級考試通過率=50%

      4 結(jié)束語

      本文利用了數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則分析、聚類算法和分類算法對全國計算機等級考試一級成績進行了分析,科學、客觀地找出了影響考試成績的一系列因素。其分析結(jié)果可以幫助學生發(fā)現(xiàn)《計算機應(yīng)用基礎(chǔ)》這門課程的某些薄弱環(huán)節(jié),對于以后提高學生的考試通過率提供了幫助。同時對于教師今后的教學方法的改進和學院對于等級考試的相關(guān)工作也起著指導(dǎo)作用。

      參考文獻:

      [1] 劉芳,林海霞.數(shù)據(jù)挖掘技術(shù)在高校計算機等級考試成績分析中的應(yīng)用[J].廣西輕工業(yè),2008(11).

      [2] 曾旭,司馬宇.K-Means算法在計算機等級考試成績分析中的應(yīng)用[J].軟件導(dǎo)刊,2012(12).

      [3] 袁小玲,李瑞. 數(shù)據(jù)挖掘技術(shù)在高職院校學生成績管理中的應(yīng)用分析與探究[J].網(wǎng)絡(luò)與信息工程, 2014(13).

      猜你喜歡
      關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      基于Apriori算法的高校學生成績數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘分析
      基于關(guān)聯(lián)規(guī)則和時間閾值算法的5G基站部署研究
      關(guān)聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
      數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
      關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進
      基于關(guān)聯(lián)規(guī)則的計算機入侵檢測方法
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      數(shù)據(jù)挖掘的分析與探索
      陆川县| 全椒县| 阿拉善右旗| 汶上县| 永和县| 民勤县| 阿拉善右旗| 南昌市| 将乐县| 平泉县| 林芝县| 大田县| 义乌市| 石棉县| 沛县| 上蔡县| 且末县| 稻城县| 武平县| 正安县| 道真| 武强县| 太湖县| 尼勒克县| 日照市| 定襄县| 盘山县| 巴楚县| 宜春市| 河南省| 内乡县| 京山县| 濮阳市| 遂平县| 开江县| 中方县| 修文县| 和林格尔县| 山西省| 禹城市| 河西区|