• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      K—means算法在計(jì)算機(jī)基礎(chǔ)分層教學(xué)中的應(yīng)用研究

      2014-11-17 01:44:28劉明綱
      新課程·中旬 2014年9期
      關(guān)鍵詞:數(shù)據(jù)挖掘分層教學(xué)聚類

      摘 要:探討了將K-means聚類算法應(yīng)用于計(jì)算機(jī)基礎(chǔ)課程分層教學(xué)學(xué)生入學(xué)基礎(chǔ)測(cè)試成績(jī)分析的過(guò)程中。針對(duì)K-means算法的特點(diǎn),對(duì)收集的學(xué)生成績(jī)參數(shù)進(jìn)行設(shè)定,并做一定的規(guī)范處理,然后對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。最后,使用K-means算法,對(duì)學(xué)生計(jì)算機(jī)基礎(chǔ)入學(xué)測(cè)試成績(jī)進(jìn)行層次劃分類別分析評(píng)價(jià)。

      關(guān)鍵詞:K臨近算法;數(shù)據(jù)挖掘;分層教學(xué);聚類

      一、數(shù)據(jù)挖掘概述

      數(shù)據(jù)挖掘,又稱為數(shù)據(jù)庫(kù)中知識(shí)發(fā)現(xiàn)(Knowledge Discovery from Database,簡(jiǎn)稱KDD),它是一個(gè)從大量不完全、有噪聲的數(shù)據(jù)中抽取挖掘出未知的、潛在有價(jià)值的模式或規(guī)律等知識(shí)的復(fù)雜過(guò)程。

      1.數(shù)據(jù)挖掘中的聚類算法

      現(xiàn)在的聚類算法主要有:基于密度和層次方法、基于劃分和模型方法等。

      (1)基于密度的方法(Density-Based Methods)

      基于密度的方法的重要特點(diǎn)在于:它的聚類準(zhǔn)則不是基于距離的,而是基于密度的。通過(guò)這種方法能避免基于距離的算法只能發(fā)現(xiàn)“類圓形”聚類的缺點(diǎn),并發(fā)現(xiàn)非“類圓形”的聚類結(jié)果。它的基本設(shè)計(jì)思想是:如果區(qū)域中的點(diǎn)的密度大于某個(gè)域值,那么就把這個(gè)樣本加到與之相近的聚類中。其代表算法有OPTICS算法、DBSCAN算法、DENCLUE算法等。

      (2)基于層次的方法(Hierarchical Methods)

      這種方法就是把數(shù)據(jù)庫(kù)劃分成多個(gè)層次,直到滿足某種條件為止。輸出為層次化的分類樹。自底向上的方法稱為凝聚的方法,最初將每個(gè)數(shù)據(jù)對(duì)象作單獨(dú)的一個(gè)組,然后合并相近的對(duì)象或組,直到所有的組合并為一個(gè)層次,或滿足某個(gè)終止條件。自頂向下的方法又稱為分裂的方法,最開始將所有的對(duì)象歸到一個(gè)層次,然后進(jìn)行迭代,通過(guò)迭代使一個(gè)類劃分成更小的類。直到最終每個(gè)對(duì)象在單獨(dú)的一個(gè)類中,或者達(dá)到一個(gè)終止條件。BIRCH算法、CURE算法、CHAMELEON算法等都屬于基于層次的算法。

      (3)基于劃分的方法(Partitioning Methods)

      劃分法,即給定一個(gè)有N個(gè)元組或者記錄的數(shù)據(jù)集,隨機(jī)構(gòu)造K個(gè)分組,每一個(gè)分組就代表一個(gè)聚簇,K

      對(duì)于給定的K,算法首先給出一個(gè)初始的分組方法,以后通過(guò)反復(fù)迭代的方法改變分組,使每一次改進(jìn)之后的分組方案都較前一次好,而所謂好的標(biāo)準(zhǔn)就是:同一組中的記錄越近越好,而不同分組中的記錄越遠(yuǎn)越好。使用這個(gè)基本思想的算法有:K均值算法、K中心點(diǎn)算法、CLARANS算法。

      2.K臨近算法

      K-means算法是一種最經(jīng)典,也是使用最廣泛的聚類方法。K-means的基本思想是:對(duì)于一個(gè)聚類任務(wù)指明聚成幾個(gè)類,然后隨機(jī)選擇K個(gè)聚類簇中心點(diǎn),迭代計(jì)算下面的過(guò)程直到所有簇中心收斂為止:

      STEP 1:對(duì)于每個(gè)對(duì)象,計(jì)算其與每個(gè)簇中心的相似度,把其歸入與其最相似的那一個(gè)簇中。

      STEP 2:更新簇中心,新的簇中心通過(guò)計(jì)算所有屬于該簇的對(duì)象的平均值得到。

      二、聚類算法的實(shí)施

      算法的實(shí)施步驟大體分為數(shù)據(jù)集成、數(shù)據(jù)清理、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)挖掘、知識(shí)獲取等過(guò)程。

      1.成績(jī)數(shù)據(jù)的集成

      數(shù)據(jù)集成的過(guò)程是對(duì)多個(gè)數(shù)據(jù)源進(jìn)行科學(xué)的數(shù)據(jù)合并。本研究中我們對(duì)2013級(jí)學(xué)生計(jì)算機(jī)應(yīng)用基礎(chǔ)入學(xué)測(cè)試成績(jī)數(shù)據(jù),進(jìn)行采集,數(shù)據(jù)來(lái)源于入學(xué)測(cè)試考試軟件隨機(jī)生成題庫(kù)對(duì)學(xué)生參與考試得出的詳細(xì)數(shù)據(jù)。

      我們認(rèn)為分層教學(xué)劃分層次的依據(jù)不能單單以入學(xué)測(cè)試的總成績(jī)?yōu)闇?zhǔn),為了更加了解學(xué)生對(duì)各個(gè)需要掌握的基本知識(shí)所屬章節(jié)知識(shí)的掌握情況,考試的基礎(chǔ)數(shù)據(jù)還需要包含章節(jié)知識(shí)的得分率等數(shù)據(jù)內(nèi)容。我們把主要數(shù)據(jù)放在學(xué)生成績(jī)分析基礎(chǔ)表里面。學(xué)生成績(jī)基礎(chǔ)表包含(學(xué)號(hào)、姓名、總成績(jī)、計(jì)算機(jī)基礎(chǔ)知識(shí)、計(jì)算機(jī)系統(tǒng)組成、字處理、演示文稿、電子表格、計(jì)算機(jī)網(wǎng)絡(luò)、計(jì)算機(jī)安全、文字錄入)等字段,別記錄了學(xué)生的總成績(jī)與各個(gè)章節(jié)內(nèi)容的得分情況。

      2.數(shù)據(jù)清理

      數(shù)據(jù)清理主要是填補(bǔ)遺漏數(shù)據(jù),在本研究中我們忽略學(xué)生姓名、考試時(shí)間等與數(shù)據(jù)分析無(wú)關(guān)的數(shù)據(jù)列成分。

      3.數(shù)據(jù)的轉(zhuǎn)換過(guò)程

      數(shù)據(jù)轉(zhuǎn)換的過(guò)程主要是為了對(duì)數(shù)據(jù)進(jìn)行規(guī)范化的操作,對(duì)數(shù)據(jù)的格式進(jìn)行統(tǒng)一規(guī)定,從而匹配數(shù)據(jù)挖掘算法。對(duì)學(xué)生成績(jī)進(jìn)行聚類分析的時(shí)候,學(xué)生各個(gè)章節(jié)的成績(jī)和總成績(jī)的數(shù)據(jù)類型都統(tǒng)一成數(shù)值類型。

      4.算法結(jié)果分析

      通過(guò)K-means算法的分析,我們得到的聚類1中成績(jī)偏低的學(xué)生有25個(gè),聚類2成績(jī)較好的學(xué)生有38個(gè),由此作為分層教學(xué)的分班依據(jù)。通過(guò)具體章節(jié)得分率的聚類選擇,能更好得出學(xué)生掌握計(jì)算機(jī)基礎(chǔ)知識(shí)的準(zhǔn)確數(shù)據(jù),如果單單以學(xué)生考試的總成績(jī)來(lái)作為分層教學(xué)的依據(jù),會(huì)造成分班的不合理。

      本文探討了K-means聚類算法,將此算法應(yīng)用于計(jì)算機(jī)基礎(chǔ)課程分層教學(xué)學(xué)生入學(xué)基礎(chǔ)測(cè)試成績(jī)分析中。首先在針對(duì)K-means算法的特點(diǎn),對(duì)收集的學(xué)生成績(jī)參數(shù)進(jìn)行設(shè)定做一定的規(guī)范處理,然后對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理,然后使用K-means算法,對(duì)學(xué)生計(jì)算機(jī)基礎(chǔ)入學(xué)測(cè)試成績(jī)進(jìn)行層次劃分類別分析評(píng)價(jià)。針對(duì)不同類別的學(xué)生,實(shí)施分層教學(xué),為實(shí)施好分層教學(xué)改革提供了數(shù)據(jù)和理論支持。

      參考文獻(xiàn):

      鐘志賢,曹東云.基于信息技術(shù)的反思學(xué)習(xí)[J].遠(yuǎn)程教育,2004(4):7-10.

      作者簡(jiǎn)介:劉明綱,性別,男,1978年10月出生,碩士,就職學(xué)校:成都市成都工業(yè)學(xué)院網(wǎng)絡(luò)中心,研究方向:數(shù)據(jù)挖掘,數(shù)據(jù)庫(kù)技術(shù)。

      猜你喜歡
      數(shù)據(jù)挖掘分層教學(xué)聚類
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      基于DBSACN聚類算法的XML文檔聚類
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      如何通過(guò)分層教學(xué)打造高中化學(xué)高效課堂
      考試周刊(2016年79期)2016-10-13 23:11:48
      分層教學(xué)在高中數(shù)學(xué)中的研究
      考試周刊(2016年77期)2016-10-09 10:59:20
      分層教學(xué),兼顧全體
      考試周刊(2016年76期)2016-10-09 08:38:18
      農(nóng)村學(xué)校數(shù)學(xué)分層教學(xué)的實(shí)踐策略
      成才之路(2016年26期)2016-10-08 11:17:59
      基于改進(jìn)的遺傳算法的模糊聚類算法
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
      白河县| 多伦县| 克什克腾旗| 商水县| 三台县| 鹤峰县| 诸暨市| 乐都县| 长宁县| 仪陇县| 广南县| 平昌县| 浪卡子县| 洪泽县| 潍坊市| 重庆市| 共和县| 黄浦区| 定西市| 砀山县| 鸡西市| 蒲江县| 深州市| 浠水县| 葫芦岛市| 阿拉善盟| 镇赉县| 江城| 常州市| 曲水县| 谢通门县| 陇南市| 建瓯市| 安溪县| 绥中县| 新晃| 紫金县| 确山县| 西昌市| 介休市| 甘孜县|