• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于數(shù)據(jù)挖掘技術(shù)的學(xué)生信息系統(tǒng)開發(fā)

      2009-06-18 04:42:10徐成香
      新媒體研究 2009年16期
      關(guān)鍵詞:學(xué)號(hào)數(shù)據(jù)倉(cāng)庫(kù)字段

      徐成香

      [摘要]隨著學(xué)生信息數(shù)據(jù)的急劇膨脹,為了更好的進(jìn)行學(xué)生信息管理,提出基于數(shù)據(jù)挖掘技術(shù)的學(xué)生信息系統(tǒng)的開發(fā),并舉例說明如何利用數(shù)據(jù)挖掘技術(shù)和數(shù)據(jù)庫(kù)技術(shù)建立學(xué)生信息管理系統(tǒng),為相關(guān)專業(yè)人員提供參考。

      [關(guān)鍵詞]數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則模型

      中圖分類號(hào):TP3文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1671-7597(2009)0820057-01

      目前我國(guó)很多學(xué)校均建立了學(xué)生信息系統(tǒng),隨著時(shí)間的推移學(xué)生信息系統(tǒng)中相關(guān)的信息數(shù)據(jù)也急劇膨脹。如何運(yùn)用科學(xué)的技術(shù)和手段從海量數(shù)據(jù)中發(fā)現(xiàn)有用的信息并充分利用,發(fā)現(xiàn)各個(gè)學(xué)生的特點(diǎn),了解學(xué)生的學(xué)習(xí)規(guī)律,更好地管理學(xué)生信息,這是學(xué)校管理者企盼解決的深層問題。因此采用數(shù)據(jù)挖掘技術(shù)對(duì)學(xué)生數(shù)據(jù)進(jìn)行再次開發(fā)已成為新的趨勢(shì)。

      一、數(shù)據(jù)挖掘的概念[1]

      數(shù)據(jù)挖掘(DataMining,DM)是指從大量不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、有用的信息和知識(shí)的過程。其表現(xiàn)形式為概念(Concepts)、規(guī)則(Rules)、模式(Patterns)等形式。數(shù)據(jù)挖掘是現(xiàn)代科學(xué)技術(shù)相互滲透與融合的產(chǎn)物,融合了數(shù)理統(tǒng)計(jì)、人工智能、可視化技術(shù)、數(shù)據(jù)庫(kù)技術(shù)和計(jì)算機(jī)技術(shù)等領(lǐng)域的理論技術(shù)。

      二、學(xué)生信息數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)與建設(shè)

      數(shù)據(jù)挖掘是建立在數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)之上的。數(shù)據(jù)倉(cāng)庫(kù)概念是W.H.Inmon

      在《建立數(shù)據(jù)倉(cāng)庫(kù)》一書中提出的,數(shù)據(jù)倉(cāng)庫(kù)就是面向主題的、集成的、不可更新的(穩(wěn)定性)隨時(shí)間不斷變化(不同時(shí)間)的數(shù)據(jù)集合,用以支持經(jīng)營(yíng)管理中的決策制定過程[2]。數(shù)據(jù)準(zhǔn)備的好壞將影響到數(shù)據(jù)挖掘的效率和準(zhǔn)確度以及最終模型的有效性,數(shù)據(jù)準(zhǔn)備工作包括數(shù)據(jù)的選擇(選擇相關(guān)和合適的數(shù)據(jù))、探索(盡可能了解數(shù)據(jù),如分布情況和異常數(shù)據(jù)等)、修正(包括缺失數(shù)據(jù)的插值等)、變換(離散值數(shù)據(jù)與連續(xù)值數(shù)據(jù)之間的相互轉(zhuǎn)換,數(shù)據(jù)的分組分類,數(shù)據(jù)項(xiàng)之間的計(jì)算組合等)。

      學(xué)生信息數(shù)據(jù)庫(kù)中的數(shù)據(jù)表主要有:學(xué)生學(xué)籍信息表,主要字段有學(xué)生學(xué)號(hào)(ID)、姓名(name)、性別(sex)、出生日期(age)、家庭住

      址(address)等;學(xué)生班級(jí)信息表,主要字段有學(xué)號(hào)(ID)、班級(jí)(clas

      S)、職務(wù)(duty)等;學(xué)生成績(jī)表,主要字段有學(xué)號(hào)(ID)、課程號(hào)(cI

      D)、成績(jī)(result)等;學(xué)生選課表,主要字段有學(xué)號(hào)(ID)、選修課程號(hào)(xID)、任課教師(teacher)、成績(jī)(result)等;各學(xué)期成績(jī)匯總表,主要字段有學(xué)號(hào)(ID)、課程1成績(jī)(result1)、課程2成績(jī)(result

      2)、課程3成績(jī)(result3)、總成績(jī)(results)、名次(rank)等。

      三、數(shù)據(jù)挖掘在學(xué)生信息管理系統(tǒng)開發(fā)中的應(yīng)用

      (一)建立挖掘數(shù)據(jù)模型及數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理是對(duì)數(shù)據(jù)源進(jìn)行加工,檢查數(shù)據(jù)的完整性及數(shù)據(jù)的一致性,對(duì)其中的噪音數(shù)據(jù)進(jìn)行平滑,對(duì)丟失的數(shù)據(jù)進(jìn)行填補(bǔ),消除“臟”數(shù)據(jù),消除重復(fù)記錄等,使之符合數(shù)據(jù)挖掘的要求。它的主要工作有檢查拼寫錯(cuò)誤、去掉重復(fù)的記錄、補(bǔ)上不完全的記錄、推導(dǎo)計(jì)算缺失數(shù)據(jù)、完成數(shù)據(jù)類型轉(zhuǎn)換。數(shù)據(jù)變換的主要目的是精減數(shù)據(jù)維數(shù),即從初始特征中找出真正有用的特征以減少數(shù)據(jù)挖掘時(shí)要考慮的特征或變量個(gè)數(shù)。

      (二)數(shù)據(jù)挖掘的算法[3]。由于學(xué)生信息系統(tǒng)有多個(gè)不同的應(yīng)用目標(biāo),以查詢不同的結(jié)果。因此要有與其相對(duì)應(yīng)的挖掘任務(wù)和定制數(shù)據(jù)庫(kù),針對(duì)這些數(shù)據(jù)庫(kù)有很多的數(shù)據(jù)挖掘算法。而每個(gè)算法都會(huì)提出一些諸如置信度、感興趣度、新穎度等統(tǒng)計(jì)屬性作為對(duì)產(chǎn)生模式的評(píng)估標(biāo)準(zhǔn),從而進(jìn)一步?jīng)Q定對(duì)模式的取舍,提高找出有興趣模式的效率。這里用最佳的數(shù)據(jù)挖掘方法進(jìn)行計(jì)算,這些算法包括:人工神經(jīng)網(wǎng)絡(luò)、決策樹、遺傳算法、鄰近算法等。

      (三)數(shù)據(jù)挖掘結(jié)果與分析。根據(jù)數(shù)據(jù)方面處理結(jié)果,設(shè)最小支持度為0.2,最小置信度設(shè)為0.4,利用關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘Apriori算法處理數(shù)據(jù)并得出關(guān)聯(lián)規(guī)則。

      是否為班干部+學(xué)習(xí)成績(jī),進(jìn)行挖掘,挖掘結(jié)果如下:

      [是否為班干部=“是”=>學(xué)習(xí)成績(jī)=“優(yōu)”] 0.588

      [是否為班干部=“是”=>學(xué)習(xí)成績(jī)=“一般”] 0.450

      [是否為班干部=“否”=>學(xué)習(xí)成績(jī)=“優(yōu)”] 0.500

      [是否為班干部=“否”=>學(xué)習(xí)成績(jī)=“一般”] 0.655

      結(jié)果表明:在班級(jí)擔(dān)任一定職務(wù)的學(xué)生并沒有因?yàn)閷W(xué)生工作耽誤學(xué)習(xí),相反,班干部的學(xué)習(xí)成績(jī)要比普通同學(xué)的學(xué)習(xí)成績(jī)好。班干部經(jīng)常和老師聯(lián)系,在老師身上學(xué)到很多知識(shí),并且任職班干部要給普通學(xué)生作表率。因此,班主任及任課教師要重視班干部,但不能忽視普通學(xué)生,要經(jīng)常找普通學(xué)生談心,以提高他們的學(xué)習(xí)成績(jī)。

      實(shí)踐經(jīng)歷+學(xué)習(xí)成績(jī),進(jìn)行挖掘,挖掘結(jié)果如下:

      [實(shí)踐經(jīng)歷=“多”=>學(xué)習(xí)成績(jī)=“優(yōu)”] 0.670

      [實(shí)踐經(jīng)歷=“中”=>學(xué)習(xí)成績(jī)=“良”] 0.498

      [實(shí)踐經(jīng)歷=“少”=>學(xué)習(xí)成績(jī)=“中”] 0.680

      結(jié)果表明:社會(huì)實(shí)踐及參加活動(dòng)多的學(xué)生的學(xué)習(xí)成績(jī)要好,而社會(huì)實(shí)踐及參加活動(dòng)少的學(xué)生的學(xué)習(xí)成績(jī)一般。作為學(xué)校的管理者,應(yīng)該多舉行有意義的活動(dòng),豐富學(xué)生的學(xué)校生活,提高他們的社會(huì)實(shí)踐能力,為以后步入社會(huì)奠定良好的基礎(chǔ)。

      四、數(shù)據(jù)挖掘技術(shù)應(yīng)用過程中要注意的問題

      盡管數(shù)據(jù)挖掘有如此多的優(yōu)點(diǎn),但數(shù)據(jù)挖掘也面臨著許多的問題,隨著這些問題的解決,也為數(shù)據(jù)挖掘的未來的發(fā)展提供了更大的空間。

      1.數(shù)據(jù)挖掘的基本問題就在于數(shù)據(jù)的數(shù)量和維數(shù),數(shù)據(jù)結(jié)構(gòu)也因此顯得非常復(fù)雜。海量的數(shù)據(jù)一方面提供了挖掘的基礎(chǔ)和前提,但同時(shí)維數(shù)的增加也會(huì)給數(shù)據(jù)挖掘的實(shí)現(xiàn)帶來難度。如何進(jìn)行探索,選擇元數(shù)據(jù),選擇分析變量,也就成為首要解決的問題。

      2.面對(duì)如此大的數(shù)據(jù),數(shù)據(jù)中隱含一定的變化趨勢(shì),對(duì)數(shù)據(jù)進(jìn)行抽樣,怎么抽樣,抽取多大的樣本,又怎樣評(píng)價(jià)抽樣的效果,這些都是決定挖掘效果好壞的關(guān)鍵。

      3.數(shù)據(jù)挖掘的結(jié)果是不確定的。不同的人對(duì)同樣的數(shù)據(jù)進(jìn)行挖掘,可能產(chǎn)生不同的結(jié)果,甚至差異很大,要和專業(yè)知識(shí)相結(jié)合才能對(duì)其做出判斷,這就涉及到可靠性的問題。需要建立有效的評(píng)估體系來評(píng)價(jià)。

      五、結(jié)束語

      學(xué)校作為科學(xué)技術(shù)的傳播地,學(xué)生的管理和建設(shè)對(duì)學(xué)校的可持續(xù)發(fā)展具有深遠(yuǎn)的影響。數(shù)據(jù)挖掘技術(shù)是一個(gè)研究活躍的領(lǐng)域,利用數(shù)據(jù)挖掘技術(shù)對(duì)學(xué)生信息積累的大量數(shù)據(jù)進(jìn)行挖掘,挖掘出具有管理和決策的信息,使學(xué)校切實(shí)做到“以學(xué)生為本”,管理進(jìn)一步走向規(guī)范化、科學(xué)化、現(xiàn)代化。

      參考文獻(xiàn):

      [1]范明、孟小峰,數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2007.

      [2]耿曉中、張冬梅,數(shù)據(jù)挖掘綜述[J].長(zhǎng)春師范學(xué)院學(xué)報(bào)(自然科學(xué)版),2006.6,Vol.25,No.3,24~27.

      [3]李國(guó)杰,數(shù)據(jù)挖掘綜述[J].廣東輕工職業(yè)技術(shù)學(xué)院學(xué)報(bào),2006.3,Vol.5,No.1,19~21.

      [4]夏瑞麗,淺談數(shù)據(jù)挖掘[J].科技創(chuàng)新導(dǎo)報(bào),2008(24).

      猜你喜歡
      學(xué)號(hào)數(shù)據(jù)倉(cāng)庫(kù)字段
      圖書館中文圖書編目外包數(shù)據(jù)質(zhì)量控制分析
      我們來打牌
      基于數(shù)據(jù)倉(cāng)庫(kù)的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
      嘗試親歷的過程,感受探究的快樂
      分布式存儲(chǔ)系統(tǒng)在液晶面板制造數(shù)據(jù)倉(cāng)庫(kù)中的設(shè)計(jì)
      電子制作(2016年15期)2017-01-15 13:39:15
      探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的應(yīng)用
      學(xué)生學(xué)號(hào)的妙用
      基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)分析探索與實(shí)踐
      CNMARC304字段和314字段責(zé)任附注方式解析
      與56號(hào)說再見
      琼结县| 雅江县| 眉山市| 静安区| 徐州市| 隆德县| 化隆| 博客| 临漳县| 集贤县| 涟水县| 繁昌县| 颍上县| 上栗县| 大港区| 柳河县| 汪清县| 榆树市| 通榆县| 曲阳县| 渭源县| 饶阳县| 云龙县| 扎赉特旗| 闽清县| 台北市| 泾源县| 常宁市| 锦屏县| 会同县| 马山县| 丰顺县| 灵宝市| 栾川县| 明溪县| 游戏| 揭阳市| 孙吴县| 永善县| 准格尔旗| 卢氏县|