劉占波 閆實(shí) 王曉麗
摘? 要: 隨著科學(xué)技術(shù)的快速發(fā)展以及數(shù)據(jù)挖掘技術(shù)的不斷改進(jìn),各個(gè)學(xué)校的教學(xué)管理系統(tǒng)中都已存儲(chǔ)了大量的數(shù)據(jù)信息,本文主要對(duì)目前教師在教學(xué)評(píng)價(jià)中的現(xiàn)狀進(jìn)行了研究,并以教學(xué)評(píng)價(jià)的體系為數(shù)據(jù)挖掘的基礎(chǔ)平臺(tái),利用數(shù)據(jù)挖掘技術(shù)對(duì)教師教學(xué)相關(guān)的數(shù)據(jù)進(jìn)行挖掘和分析。重點(diǎn)對(duì)數(shù)據(jù)挖掘技術(shù)在教師教學(xué)評(píng)價(jià)中的應(yīng)用進(jìn)行研究,從而可促進(jìn)學(xué)校教學(xué)的質(zhì)量,對(duì)教師教學(xué)評(píng)價(jià)有重大的意義。
關(guān)鍵詞: 教師;教學(xué)評(píng)價(jià);數(shù)據(jù)挖掘
【Abstract】: With rapid development of science and technology, continuous improvement of data mining technology, teaching management system of each college has stored a large amount of data information. The article mainly researches current situation of teaching evaluation of teachers, mines and analyzes teaching data of teachers with data mining technology based on data mining basic platform of teaching evaluation system,mainly researches? application of data mining technology in teaching evaluation of teachers, to promote teaching quality of colleges, which is of great significance to teaching evaluation of teachers.
【Key words】: Teacher; Teaching evaluation; Data mining
0? 引言
隨著新一代社交網(wǎng)絡(luò)、數(shù)字城市等大規(guī)?;ヂ?lián)網(wǎng)應(yīng)用的迅猛發(fā)展。大數(shù)據(jù)的特點(diǎn)為:(1)彈性服務(wù)。(2)按需服務(wù)。(3)資源池化。(4)服務(wù)可計(jì)費(fèi)。(5)泛在接入。大數(shù)據(jù)主要就是云架構(gòu)計(jì)算技術(shù),并且云架構(gòu)計(jì)算是分布式計(jì)算、互聯(lián)網(wǎng)技術(shù)以及大規(guī)模資源管理等技術(shù)的發(fā)展與融合,其應(yīng)用和研究涉及資源虛擬化、信息安全、海量數(shù)據(jù)處理等亟待處理的重要問題。隨著科學(xué)技術(shù)的快速發(fā)展以及數(shù)據(jù)挖掘技術(shù)的不斷改進(jìn),各個(gè)學(xué)校的教學(xué)管理系統(tǒng)中都已存儲(chǔ)了大量的數(shù)據(jù)信息,對(duì)存儲(chǔ)的大量的數(shù)據(jù)信息都是進(jìn)行簡(jiǎn)單的數(shù)字處理,不能對(duì)這些數(shù)據(jù)進(jìn)行更深入的研究和分析[1]。
本文主要對(duì)目前教師在教學(xué)評(píng)價(jià)中的現(xiàn)狀進(jìn)行了研究,并以教學(xué)評(píng)價(jià)的體系為數(shù)據(jù)挖掘的基礎(chǔ)平臺(tái),利用數(shù)據(jù)挖掘技術(shù)對(duì)教師教學(xué)相關(guān)的數(shù)據(jù)進(jìn)行挖掘和分析,對(duì)教師教學(xué)評(píng)價(jià)有重大的意義。
1? 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘主要就是云架構(gòu)計(jì)算技術(shù),并且云架構(gòu)計(jì)算是分布式計(jì)算、互聯(lián)網(wǎng)技術(shù)以及大規(guī)模資源管理等技術(shù)的發(fā)展與融合,其應(yīng)用和研究涉及資源虛擬化、信息安全、海量數(shù)據(jù)處理等亟待處理的重要問題。數(shù)據(jù)挖掘系統(tǒng)的結(jié)構(gòu)如圖1所示:
數(shù)據(jù)挖掘其可用于發(fā)現(xiàn)的模式類型主要有以下6種:
(1)挖掘中的頻繁項(xiàng)集的關(guān)聯(lián)以及相關(guān)模式。
(2)概念和類相關(guān)的描述,主要包含特征化和區(qū)分兩個(gè)方面。
(3)通過聚類對(duì)已有的數(shù)據(jù)進(jìn)行類標(biāo)記和分析。
(4)對(duì)數(shù)據(jù)進(jìn)行聚類和預(yù)測(cè),通過對(duì)比分析建立一個(gè)概念模型。
(5)對(duì)建立的模型進(jìn)行演變分析,模擬數(shù)據(jù)的演變過程。
(6)對(duì)數(shù)據(jù)中的表現(xiàn)異類的數(shù)據(jù)進(jìn)行深入的分析,即對(duì)離群點(diǎn)進(jìn)行分析。
2? 利用數(shù)據(jù)挖掘技術(shù)進(jìn)行教師教學(xué)評(píng)價(jià)研究的流程
Romero等研究學(xué)者認(rèn)為在教師教學(xué)評(píng)價(jià)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用會(huì)是一個(gè)十分重要的循環(huán)迭代,通過數(shù)據(jù)挖掘技術(shù)將得到的教師教學(xué)評(píng)價(jià)相關(guān)的知識(shí)進(jìn)入評(píng)價(jià)系統(tǒng)的循環(huán)中,并且通過改進(jìn)學(xué)習(xí)系統(tǒng)、支持決策以及改善學(xué)習(xí)者的學(xué)習(xí)等過程,而不是簡(jiǎn)單的將數(shù)據(jù)轉(zhuǎn)換為教師簡(jiǎn)單的評(píng)價(jià)過程[2-4]。
各個(gè)學(xué)校的教學(xué)管理系統(tǒng)中都已存儲(chǔ)了大量的數(shù)據(jù)信息,對(duì)存儲(chǔ)的大量的數(shù)據(jù)信息都是進(jìn)行簡(jiǎn)單的數(shù)字處理,通過對(duì)這些數(shù)據(jù)進(jìn)行更深入的研究和分析,主要對(duì)目前教師在教學(xué)評(píng)價(jià)中的現(xiàn)狀進(jìn)行了研究,并以教學(xué)評(píng)價(jià)的體系為數(shù)據(jù)挖掘的基礎(chǔ)平臺(tái),采用數(shù)據(jù)挖掘技術(shù)對(duì)教師教學(xué)評(píng)價(jià)的研究過程中主要的流程包括數(shù)據(jù)收集、確定數(shù)據(jù)挖掘目的、數(shù)據(jù)的挖掘以及模式評(píng)估與知識(shí)表示等四個(gè)部分。數(shù)據(jù)挖掘的過程主要包括以下幾個(gè)方面:
(1)根據(jù)已知的條件,確定數(shù)據(jù)挖掘目的。
(2)需要挖掘數(shù)據(jù)的準(zhǔn)備,即對(duì)數(shù)據(jù)的清洗、數(shù)據(jù)的篩選等步驟。
(3)根據(jù)選定的算法對(duì)已有的數(shù)據(jù)進(jìn)行挖掘。
(4)依據(jù)上述挖掘的結(jié)果,對(duì)數(shù)據(jù)挖掘的模式評(píng)估與知識(shí)進(jìn)行表示。
大數(shù)據(jù)與實(shí)際生產(chǎn)應(yīng)用緊密結(jié)合,并且其研究領(lǐng)域廣泛。通過對(duì)已有大數(shù)據(jù)體系結(jié)構(gòu)以及關(guān)鍵技術(shù)的研究,對(duì)大數(shù)據(jù)還可以從以下兩個(gè)方面進(jìn)行深入的研究:一方面,通過拓展大數(shù)據(jù)的外沿,比如將大數(shù)據(jù)與移動(dòng)互聯(lián)網(wǎng)領(lǐng)域以及科學(xué)計(jì)算相結(jié)合,來拓展新的大數(shù)據(jù)應(yīng)用模式;另一方面,通過討論大數(shù)據(jù)模型的缺陷來挖掘大數(shù)據(jù)的內(nèi)涵,比如以大規(guī)模程序調(diào)試診斷以及端到云的海量數(shù)據(jù)傳輸為例來分析云架構(gòu)技術(shù)面臨的挑戰(zhàn)。
移動(dòng)互聯(lián)網(wǎng)的飛速發(fā)展極大的豐富了大數(shù)據(jù)的外部應(yīng)用,使得大數(shù)據(jù)和移動(dòng)互聯(lián)網(wǎng)的聯(lián)系十分密切。由于移動(dòng)設(shè)備在接入方式上和硬件配置上的特殊性,使得對(duì)于大數(shù)據(jù)和移動(dòng)互聯(lián)網(wǎng)的關(guān)系研究十分重要。下面對(duì)移動(dòng)互聯(lián)網(wǎng)中移動(dòng)設(shè)備的資源以及網(wǎng)絡(luò)接入問題進(jìn)行更為深入的探討[5-6]。
2.1? 有限的移動(dòng)設(shè)備資源
往往需要在瀏覽器端解釋的如JavaScript、Ajax等執(zhí)行腳本程序才能訪問基于Web門戶的大數(shù)據(jù)服務(wù),這樣會(huì)消耗較多的移動(dòng)設(shè)備的計(jì)算能源與資源,并且移動(dòng)設(shè)備運(yùn)行平臺(tái)具有更新速度快以及種類繁多等特點(diǎn),從而為移動(dòng)設(shè)備定制客戶端成為不可能的事件。因此,為大數(shù)據(jù)平臺(tái)設(shè)計(jì)相對(duì)應(yīng)的訪問接口非常迫切。
2.2? 網(wǎng)絡(luò)接入問題
應(yīng)用需求動(dòng)態(tài)的調(diào)整系統(tǒng)規(guī)模,使得系統(tǒng)的運(yùn)行成本降低,對(duì)于大數(shù)據(jù)的分布式應(yīng)用,開發(fā)者需要考慮資源回收以及動(dòng)態(tài)分配的問題,但這個(gè)過程很容易發(fā)生死鎖、資源泄露等問題。同時(shí)上述大規(guī)模各領(lǐng)域的應(yīng)用對(duì)于大數(shù)據(jù)平臺(tái)的搭建帶來了難題,因?yàn)槠涫沟么髷?shù)據(jù)平臺(tái)的搭建過程更為繁瑣和復(fù)雜。因此,需要不斷開發(fā)新的應(yīng)用模型以及適合大數(shù)據(jù)的實(shí)用工具來解決這些問題顯得更為迫切。
3? 支持向量機(jī)SVM算法在教師教學(xué)評(píng)價(jià)中的應(yīng)用
3.1? 支持向量機(jī)SVM算法
3.2? 支持向量機(jī)SVM算法在教師教學(xué)評(píng)價(jià)中的應(yīng)用
在應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行教師教學(xué)評(píng)價(jià)研究的過程中,本文在實(shí)驗(yàn)過程中使用Weka中的J48聚類器進(jìn)行教師測(cè)評(píng)結(jié)果信息表的挖掘,詳細(xì)過程為:
(1)啟動(dòng)軟件進(jìn)入Explorer界面,打開己經(jīng)進(jìn)行預(yù)處理(離散化)后的數(shù)據(jù)表格,選擇preprocess選項(xiàng)卡,觀察數(shù)據(jù)表中數(shù)據(jù)情況,其中包含625條數(shù)據(jù)信息,4個(gè)屬性,具體如圖2所示。
在結(jié)果窗口中單擊右鍵,可以看到支持向量機(jī)SVM算法在教師教學(xué)評(píng)價(jià)中的應(yīng)用的圖像,能夠?qū)垲惤Y(jié)果一目了然,本文方法對(duì)目前教師在教學(xué)評(píng)價(jià)中的現(xiàn)狀進(jìn)行了研究,并以教學(xué)評(píng)價(jià)的體系為數(shù)據(jù)挖掘的基礎(chǔ)平臺(tái),利用數(shù)據(jù)挖掘技術(shù)對(duì)教師教學(xué)相關(guān)的數(shù)據(jù)進(jìn)行挖掘和分析具有很好的效果[7-9]。
4? 總結(jié)
科學(xué)技術(shù)的快速發(fā)展以及數(shù)據(jù)挖掘技術(shù)的不斷改進(jìn),各個(gè)學(xué)校的教學(xué)管理系統(tǒng)中都已存儲(chǔ)了大量的數(shù)據(jù)信息,對(duì)存儲(chǔ)的大量的數(shù)據(jù)信息都是進(jìn)行簡(jiǎn)單的數(shù)字處理[10-13],通過對(duì)這些數(shù)據(jù)進(jìn)行更深入的研究和分析,主要對(duì)目前教師在教學(xué)評(píng)價(jià)中的現(xiàn)狀進(jìn)行了研究,并以教學(xué)評(píng)價(jià)的體系為數(shù)據(jù)挖掘的基礎(chǔ)平臺(tái),利用數(shù)據(jù)挖掘技術(shù)對(duì)教師教學(xué)相關(guān)的數(shù)據(jù)進(jìn)行挖掘和分析,對(duì)教師教學(xué)評(píng)價(jià)有重大的意義。
參考文獻(xiàn)
毛伊敏, 彭喆, 陳志剛, 等. 基于不確定決策樹聚類算法在滑坡危險(xiǎn)性預(yù)測(cè)的應(yīng)用[J]. 計(jì)算機(jī)應(yīng)用研究, 2014, 31(12): 3646-3650.
彭喆. 基于不確定的數(shù)據(jù)挖掘聚類算法在滑坡災(zāi)害預(yù)測(cè)的應(yīng)用[D]. 江西理工大學(xué), 2015.
Han J, Kamber M. 數(shù)據(jù)挖掘概念與技術(shù)[M]. 范明, 孟小峰, 譯. 北京: 機(jī)械工業(yè)出版社, 2001.
劉述昌, 張忠林. 基于中心向量的多級(jí)聚類KNN算法研究[J]. 計(jì)算機(jī)工程與科學(xué), 2017, 39(9): 1758-1764.
Fabrizio S. Machine learning in automated text categori zation[J]. ACM Computing Surveys, 2002, 34(1): 1-47.
Romdhani S, Torr P, Scholkopf B, et al. Efficient face detection by a cascaded support-vector machine expansion[J]. Pattern Recognition, 2004, 3175: 62-70.
Chen Guang-xi, Xu Jian, Cheng Yan. Cluster method of support vector machine to solve large-scale data set classi fication[J]. Computer Science, 2009, 36(3): 184-188. (in Chinese).
García V, Alejo R, Sánchez J S, et al. Combined effects of class imbalance and class overlap on instance-based classifi cation[A] // Intelligent Data Engineering and Auto mated Learning–IDEAL 2006[M]. Berlin, Heidelberg: Springer, 2006: 371-378.
Xia Zhan-guo, Xia Shi-xiong, Cai Shi-yu, et al. Semi-Supervised gaussian process classification algorithm addressing the class imbalance [J]. Journal on Communi cations, 2013, 34(5): 42-51.
Cao Yong. Research of chinese web text classification[D]. Xiamen: Xiamen University, 2007. (in Chinese).
GILLEN A, BROUSSARD F W, PERRY R, et al. Optimizing infra- structure: the relationship between it labor costs and best practices for managing the windows desktop[EB/OL]. http: //download. microsoft. com/ download/a/4/4/a4474b0c- 57d8-41a2-afe6-32037fa93ea6/IDC_windesktop_IO_whitepaper. pdf 2007.
MELL P, GRANCE T. The NIST Definition of Cloud Computing[R]. National Institute of Standards and Tech nology, 2011.
卓廣平. 高效數(shù)據(jù)挖掘算法在大規(guī)模數(shù)據(jù)集中的應(yīng)用研究[J]. 軟件, 2014, 35(08): 72-74.