文/惠州商貿(mào)旅游高級職業(yè)技術(shù)學(xué)校 趙敏
隨著信息技術(shù)的發(fā)展,數(shù)據(jù)庫技術(shù)被越來越廣泛的應(yīng)用到了各個領(lǐng)域中,越來越多的數(shù)據(jù)形成了每個領(lǐng)域特有的海量數(shù)據(jù)庫,人們迫切需要在這些海量的數(shù)據(jù)中尋找到有價值的信息,數(shù)據(jù)挖掘技術(shù)就應(yīng)運而生了。在中職學(xué)校中學(xué)生的學(xué)籍檔案管理工作也是一個面對海量數(shù)據(jù)的工作,數(shù)據(jù)挖掘技術(shù)對于中職的學(xué)籍檔案管理工作來說,是一種可以化繁瑣為簡單的技術(shù),對于工作效率的提高以及工作準(zhǔn)確度的保證都有很重要的意義,因此在很多中職學(xué)校中,數(shù)據(jù)挖掘技術(shù)都被作為了其學(xué)生學(xué)籍檔案管理研究工作的重點。
數(shù)據(jù)挖掘是人們基于長期的對數(shù)據(jù)庫技術(shù)進行研發(fā)和利用所產(chǎn)生的,不僅能夠查閱和遍歷之前的數(shù)據(jù),也能夠?qū)㈦[藏在以前的數(shù)據(jù)中的關(guān)聯(lián)找出來,以便于促進信息的傳遞。市場上對于數(shù)據(jù)挖掘技術(shù)的應(yīng)用軟件有很多種類,主要類型有:
數(shù)據(jù)挖掘技術(shù)中一個比較重要的分析方法是傳統(tǒng)統(tǒng)計分析技術(shù),主要包括回歸分析和相關(guān)分析等。它的應(yīng)用模式是:客戶提出一種假設(shè),系統(tǒng)通過利用數(shù)據(jù)來對這種假設(shè)進行驗證。但是這種技術(shù)只有在經(jīng)過了專業(yè)的培訓(xùn)之后才能夠進行操作,并且用戶需要在數(shù)據(jù)探索時重復(fù)的進行操作才可以完成,這是它的最大弊端。
作為知識工程領(lǐng)域中的一種簡單知識表示法,決策樹技術(shù)采用的是將每個事例都進行逐步的分類,再將這些分類應(yīng)用于各種類別的表示中的方法,使得分類規(guī)則直觀、簡單、便于理解。但是,決策樹技術(shù)應(yīng)用的范圍卻很窄,僅限應(yīng)用于分類技術(shù)。
這是一種針對于專業(yè)領(lǐng)域來進行專門性應(yīng)用的一種系統(tǒng)。例如,將技術(shù)分析法應(yīng)用到金融市場的分析中。
將預(yù)定函數(shù)基礎(chǔ)作為實施基礎(chǔ)的非線性回歸法,主要的運行目的是尋找目標(biāo)度量和其他多變量之間存在的依賴關(guān)系。非線性回歸法比較適合應(yīng)用于金融市場和醫(yī)療診斷中,能夠提供比較可信的結(jié)果。
這種方法的運行思路很簡單。當(dāng)需要對未來進行預(yù)測,或者是需要做一個正確的決策之前使用這種方法,系統(tǒng)會自動找到與之相類似的事例,同時也會選擇出適合操作的方案進行解決。這種推理方法如果應(yīng)用到求解的問題中回去的很好的效果。但是,也有其固有的缺陷,主要表現(xiàn)在系統(tǒng)不能夠?qū)⒅暗慕?jīng)驗進行匯總或者是生成一個完整的模塊。
學(xué)生的學(xué)籍檔案是指其從剛?cè)雽W(xué)一直到畢業(yè)參加工作的在校期間的整個學(xué)習(xí)過程的原始記錄,形成于學(xué)生在學(xué)校期間的考試成績、實習(xí)實錄以及社會實踐等所有的教學(xué)活動,是具有保存價值和利用價值的材料、文件。中職學(xué)校學(xué)生的學(xué)籍檔案內(nèi)容是根據(jù)國家教委的《普通高等學(xué)校檔案管理辦法》、《中華人民共和國檔案法》以及學(xué)校的實際情況來確定的,基本包括:
1.新生的名冊和學(xué)校的招生計劃等;
2.在校學(xué)生的名冊、學(xué)生的學(xué)籍卡片、學(xué)生學(xué)籍的變更素材、學(xué)生的考試成績卡片等;
3.學(xué)生參加職業(yè)技能培訓(xùn)的實況和所獲證書的統(tǒng)計表;
4.每個學(xué)年的學(xué)生實習(xí)計劃、學(xué)生所在實習(xí)單位的實習(xí)合同、學(xué)生實習(xí)情況報告、學(xué)生撰寫的實習(xí)報告以及學(xué)生的實習(xí)成績;
5.學(xué)生在學(xué)校的獎懲情況,證明學(xué)生獎懲情況的材料;
6.學(xué)生的畢業(yè)證書和資料登記表;
7.學(xué)生畢業(yè)分配單位的統(tǒng)計表、學(xué)生與就業(yè)單位簽約的就業(yè)合同;
8.擴展材料,包括學(xué)生畢業(yè)后的調(diào)查跟蹤統(tǒng)計,用人單位對于畢業(yè)生質(zhì)量的意見、畢業(yè)生對于社會滿意度的調(diào)查情況以及優(yōu)秀畢業(yè)生的典型事跡等。
1.多變性。中職學(xué)生的學(xué)籍檔案在學(xué)校形成的周期比較長,在這個長期形成的期間,學(xué)籍的情況是在不停的發(fā)展變化著的。例如:學(xué)生考試成績不合格但是經(jīng)過補考變成了及格;有的學(xué)生受到了處分,但是在畢業(yè)之前又被撤銷了處分;有的學(xué)生經(jīng)歷了由休學(xué)到復(fù)學(xué)的過程等。這些變化在學(xué)籍中都要有及時的記載,必須要保證學(xué)籍所反映的乃是學(xué)生最真實的情況。
2.頻繁使用性。學(xué)生的學(xué)籍檔案在中職學(xué)校的檔案中是最具有頻繁使用性的,無論是學(xué)生應(yīng)征入伍、證書丟失或者是報考高級學(xué)歷、出國深造等都需要利用學(xué)籍檔案。
3.復(fù)雜性。學(xué)生學(xué)籍檔案的內(nèi)容是十分復(fù)雜的,它包含著中職學(xué)生在學(xué)校期間的各種表現(xiàn)以及其他有關(guān)學(xué)生的情況等。
4.保密性。學(xué)籍所記錄的學(xué)生信息是具有一定的保密性的,很多都屬于個人隱私,如身份證號、出生日期以及成績等,都要在一定范圍內(nèi)進行保密,也是受到法律保護的。
數(shù)據(jù)采集是數(shù)據(jù)挖掘技術(shù)的一個基礎(chǔ)工作步驟,指的是在度數(shù)據(jù)庫中的多種類的數(shù)據(jù)進行充分合理的分析之后建立一個模型,這個模型要求能偶對已知數(shù)據(jù)集的類別和概念進行描述,同時能夠?qū)y試的樣本進行比較,比較的對象是之前獲得的類型、模型預(yù)測類別等,當(dāng)一個通過學(xué)習(xí)來獲得的模型具有足夠的準(zhǔn)確性,并且其準(zhǔn)確性被充分的認可的時候就可以利用其來對未來的對象進行預(yù)測和分析。以中職學(xué)生的學(xué)籍檔案為例,就是學(xué)校檔案管理者把發(fā)放到學(xué)生手中的調(diào)查問卷進行收集并輸入至數(shù)據(jù)庫中,主要收集的是學(xué)生的姓名、性別以及年齡、所學(xué)專業(yè)等。數(shù)據(jù)采集工作是數(shù)據(jù)挖掘技術(shù)中作為重要的一個步驟,必須要加以重視。首先,要進行數(shù)據(jù)的收集、集成;其次,要對數(shù)據(jù)進行和整合和描述;最后,要選擇符合實際情況的數(shù)據(jù)挖掘方法,將所遇到的問題盡量轉(zhuǎn)換為數(shù)據(jù)挖掘類型的問題。數(shù)據(jù)挖掘的主要任務(wù)有直接數(shù)據(jù)挖掘、間接數(shù)據(jù)挖掘,這兩種類型有著本質(zhì)的區(qū)別。
所謂的建模是指:選用恰當(dāng)?shù)奶幚矸椒ê陀嬎惴椒▉矸治鱿嚓P(guān)數(shù)據(jù),然后得到數(shù)據(jù)挖掘模型。好的模型不需要與已有的數(shù)據(jù)完全相同,但是要保證這個模型能夠很好的預(yù)測未來。不同類型的模型所對應(yīng)的問題的解決是有所不同的。例如:分類模型,主要代表是聚類模型、決策樹模型,主要是針對事件、對象進行的歸類工作;非線性回歸指的是根據(jù)具有已知值的變量對未來出現(xiàn)的其他變量進行預(yù)測;所謂的時間序列指的是用一個變量過去的值對其未來的值進行預(yù)測。作為數(shù)據(jù)挖掘的中心環(huán)節(jié),建型和評估有很重要的作用。
把數(shù)據(jù)挖掘知識進行歸檔,并將其報告給所需群體,然后根據(jù)結(jié)果來采取必要的行動,以便于消除與之前知識之間的沖突,同時將數(shù)據(jù)挖掘的知識應(yīng)用到應(yīng)用系統(tǒng)之中。
數(shù)據(jù)挖掘技術(shù)是現(xiàn)在中職院校的學(xué)生學(xué)籍檔案管理工作的一個有力的管理工具,不但能夠提高學(xué)籍檔案管理工作的效率,還能夠提高學(xué)校教務(wù)系統(tǒng)對于學(xué)生的管理質(zhì)量,對促進學(xué)校的發(fā)展和維護學(xué)生利益都是有很大幫助的。
[1]李玉萍.高校學(xué)籍檔案管理的問題與對策分析[J].齊齊哈爾醫(yī)學(xué)院學(xué)報,2008,(17):2134-2136.
[2]李容.客戶檔案管理中的知識挖掘研究[D].蘇州大學(xué),2009.
[3]王耀,鄭玲.數(shù)據(jù)挖掘在教務(wù)管理中的應(yīng)用[J].電子商務(wù),2013,(03):88-89.
[4]柯雯歡,黎瑾.論高校學(xué)籍檔案數(shù)字化的管理[J].劍南文學(xué)(經(jīng)典教苑),2012,(11):341.
[5]寶莉.學(xué)籍管理初探[J].內(nèi)蒙古電大學(xué)刊,2006(14).
[6]彭皖民.基于用戶檔案管理的數(shù)據(jù)挖掘分析[J].河南科技,2008(4).