王瑩
摘 要:本文主要介紹了如何利用數(shù)據(jù)倉庫技術(shù)建立學(xué)生成績管理數(shù)據(jù)倉庫,應(yīng)用SQL Server 2008中的聯(lián)機(jī)分析處理技術(shù),從不同的維度觀察對成績有影響的因素,并通過建立決策樹挖掘模型對學(xué)生成績進(jìn)行定性分析,用于指導(dǎo)學(xué)校決策者制定修改人才培養(yǎng)方案和指導(dǎo)學(xué)生更加有效的學(xué)習(xí)。
關(guān)鍵詞:數(shù)據(jù)倉庫 數(shù)據(jù)挖掘 維度 決策樹
如今人們利用信息技術(shù)生產(chǎn)和收集大量的數(shù)據(jù),要想高效地管理、組織這些數(shù)據(jù)并對其進(jìn)行分析并不是一件易事。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)在這方面得到了廣泛的應(yīng)用,數(shù)據(jù)挖掘能從存放在數(shù)據(jù)倉庫中的大量數(shù)據(jù)中挖掘出隱藏的有用知識。
一、利用數(shù)據(jù)倉庫技術(shù)管理學(xué)生成績的意義
學(xué)生是學(xué)校的核心,其學(xué)習(xí)成績作為一種總結(jié)性評價(jià),能反映出他們的知識掌握情況和相應(yīng)知識技能的獲得情況。諸多高校的教務(wù)數(shù)據(jù)倉庫中對學(xué)生成績的評定分兩種:定量評價(jià)和定性評價(jià)。定量評價(jià)也就是分?jǐn)?shù),定性評價(jià)一般分優(yōu)、良、中、差等四個(gè)級別。數(shù)據(jù)倉庫從定量的角度對學(xué)生成績進(jìn)行分析,能精確得到各個(gè)方面的數(shù)據(jù)。因此使用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)對學(xué)生成績進(jìn)行深層的分析,挖掘出隱藏在數(shù)據(jù)背后的規(guī)律或模式,根據(jù)挖掘結(jié)構(gòu)提出一些指導(dǎo)性建議,從而更好地指導(dǎo)教師教學(xué),提高教學(xué)效率,提高學(xué)生的成績。
二、如何利用數(shù)據(jù)倉庫技術(shù)管理學(xué)生成績
在學(xué)生成績管理中有各種類型的數(shù)據(jù),先要對這些數(shù)據(jù)進(jìn)行預(yù)處理,使它們符合教學(xué)決策所需的數(shù)據(jù),然后把學(xué)生成績分析作為本論文研究的主題創(chuàng)建學(xué)生成績數(shù)據(jù)倉庫,并從同一個(gè)班的不同門課程和同門課程在不同的專業(yè)與不同的教師教授下的效果比較進(jìn)行分析研究。
把教務(wù)處的數(shù)據(jù)抽取出來后,通過還原數(shù)據(jù)庫還原到SQL Server 2008中,從里面挑選出有關(guān)學(xué)生、教師、課程信息等關(guān)聯(lián)的表(共計(jì)11個(gè)),把這些表導(dǎo)入到學(xué)生成績數(shù)據(jù)庫中。
該次課題必須保證所有的學(xué)生有課程平均學(xué)分成績,如該生辦理了退學(xué)或者休學(xué)手續(xù),則刪除該生的所有信息,如該教師沒有擔(dān)任教學(xué)任務(wù),則刪除該教師的相關(guān)信息。
例如,筆者使用了如下SQL語句來刪除無成績的學(xué)生記錄:
Delete from Cj_BjxsCJB where zcj is null
對數(shù)據(jù)進(jìn)行篩選和連接,例如:
在學(xué)生成績(XsCj) 事實(shí)表里,筆者使用如下SQL語句:
Insert into XsCj
Select xnxqh, zcj,kcbm,xf,xs,kcbm,xh,kcxzcode,kcflcode,khfscode,jsbh
from Cj_XsCj where kcbm in (select kcbm from Curriculum)
and xh in (select xh from Xj_YxjJbxx )
在專業(yè)(ZhuanYe)維表里,筆者使用的SQL語句如下:
Insert into ZhuanYe
Select zybh,zymc,yxbh from Major
學(xué)生(Student)維表里的SQL語句是:
Update Student set bjbh=BanJi.bjbh
from BanJi where zybh in ( select zybh from BanJi, Xj_YxjJbxx
where BanJi.bjmc= Xj_YxjJbxx.bjmc )
在SQL Server Business Intelligence Development Studio開發(fā)環(huán)境中新建一個(gè)名為“學(xué)生成績”的SSAS項(xiàng)目,以數(shù)據(jù)倉庫“學(xué)生成績”為數(shù)據(jù)源新建數(shù)據(jù)源學(xué)生成績.ds、數(shù)據(jù)源視圖學(xué)生成績.dsv和多維數(shù)據(jù)集學(xué)生成績.cube。
該課題初步實(shí)現(xiàn)了在高校教學(xué)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用,但仍然有許多問題:在數(shù)據(jù)預(yù)處理方面工作量比較大,還不夠完善,需要找尋其他數(shù)據(jù)庫工具人工完成;在其他應(yīng)用方面,學(xué)校教學(xué)管理中的許多領(lǐng)域還有待進(jìn)一步探討,比如學(xué)生成績的分析、學(xué)生信息管理、學(xué)生心理分析、教學(xué)質(zhì)量評估等。
參考文獻(xiàn):
[1]陳文偉,黃金才.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)[M].北京:人民郵電出版社,2004.
[2]Jiawei HAN,Mieheline Kamber.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2004.
[3]朱得利.SQL Server 2005 數(shù)據(jù)挖掘與商業(yè)只能完全解決方案[M].北京:電子工業(yè)出版社,2007.
[4]邱文教,潘曉卉.數(shù)據(jù)挖掘技術(shù)在教務(wù)管理中的應(yīng)用[J].安徽工業(yè)大學(xué)學(xué)報(bào)(社會科學(xué)版),2006.
[5]楊穎,鄧慧,賴思渝.數(shù)據(jù)倉庫技術(shù)在高校學(xué)生成績管理中的應(yīng)用[J].西南民族大學(xué)學(xué)報(bào),2009.
(作者單位:江蘇省鎮(zhèn)江技師學(xué)院)