摘要:隨著數(shù)字化和信息化的不斷發(fā)展,傳統(tǒng)的教學(xué)模式已經(jīng)無法滿足現(xiàn)代教育發(fā)展的需求,搜集、整理大量教學(xué)數(shù)據(jù)信息需要新方法和新思路,傳統(tǒng)方法不僅消耗時(shí)間精力,操作也十分繁瑣,因此數(shù)據(jù)挖掘技術(shù)逐漸出現(xiàn)在人們的視線中。該文通過對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行分析,針對(duì)數(shù)據(jù)挖掘技術(shù)在學(xué)校教學(xué)過程中的應(yīng)用提出一些個(gè)人觀點(diǎn)。
關(guān)鍵詞:學(xué)校教學(xué);數(shù)據(jù)挖掘技術(shù);應(yīng)用
中圖分類號(hào):G632文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2012)17-4177-03
1數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘始于上世紀(jì)90年代,是一門發(fā)展速度較快的交叉學(xué)科,數(shù)據(jù)挖掘技術(shù)包括人工智能、神經(jīng)網(wǎng)絡(luò)、數(shù)理統(tǒng)計(jì)、模式識(shí)別、數(shù)據(jù)庫、粗糙集等技術(shù)學(xué)科,數(shù)據(jù)挖掘能夠從大量數(shù)據(jù)中挖掘到隱含的、未知的、用戶可能感興趣的、對(duì)決策存在潛在價(jià)值的知識(shí)及規(guī)則,數(shù)據(jù)挖掘過程又稱為知識(shí)發(fā)現(xiàn),基本功能主要為分類、估計(jì)、預(yù)測(cè)、關(guān)聯(lián)分組、聚類、建檔、描述等。數(shù)據(jù)挖掘的對(duì)象較多,主要包括數(shù)據(jù)庫、圖像等各種結(jié)構(gòu)化和非結(jié)構(gòu)化的信息、文本等,有時(shí)無法直接對(duì)其進(jìn)行分析,因此要通過以下步驟進(jìn)行:第一,選擇數(shù)據(jù)。數(shù)據(jù)挖掘過程中所有需要的數(shù)據(jù)來源可能都不相同,可以通過不同的異數(shù)數(shù)據(jù)源來獲取數(shù)據(jù);第二,預(yù)處理。在初始數(shù)據(jù)中,會(huì)有一些不符合形式處理或是出現(xiàn)偏差的例外,因此要對(duì)這些數(shù)據(jù)進(jìn)行修正和剔除,為后期數(shù)據(jù)處理的正確性奠定基礎(chǔ);第三,變換。將不同數(shù)據(jù)源獲得的數(shù)據(jù)轉(zhuǎn)換為同一種格式,可以利用編碼或是其他一些方式來簡化表示形式;第四,數(shù)據(jù)挖掘。利用數(shù)據(jù)挖掘算法,對(duì)變換之后的數(shù)據(jù)進(jìn)行挖掘并產(chǎn)生期望的挖掘結(jié)果;第五,解釋或評(píng)價(jià)。將數(shù)據(jù)挖掘之后的結(jié)果用適當(dāng)?shù)姆绞揭平唤o用戶。
數(shù)據(jù)挖掘技術(shù)的應(yīng)用十分廣泛,在電信業(yè)、農(nóng)業(yè)、工業(yè)、金融業(yè)等各個(gè)領(lǐng)域都得到了廣泛的應(yīng)用。數(shù)據(jù)挖掘方法主要為關(guān)聯(lián)規(guī)則、決策樹、聚類分析以及遺傳算法、神經(jīng)網(wǎng)絡(luò)等,關(guān)聯(lián)規(guī)則和決策樹是使用頻率最多、范圍最廣的兩種方法。關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘最先研究的問題之一,也是數(shù)據(jù)挖掘中最成熟、最主要的分析方法之一,能夠揭示出數(shù)據(jù)之間的隱含關(guān)系。關(guān)聯(lián)規(guī)則首先要對(duì)數(shù)據(jù)庫中的一組對(duì)象進(jìn)行關(guān)系分析,然后通過置信度和支持度來進(jìn)行篩選,最后得出被認(rèn)為具有價(jià)值的事實(shí)或是規(guī)律,例如購物籃的分析中,通過對(duì)銷售數(shù)據(jù)的分析發(fā)現(xiàn)一些客戶的購物習(xí)慣及規(guī)律。利用關(guān)聯(lián)規(guī)則最經(jīng)典的是由R . Agraw