施勇
(淮南師范學(xué)院網(wǎng)絡(luò)信息中心,安徽 淮南 232038)
基于數(shù)據(jù)挖掘的高校數(shù)字化校園平臺(tái)應(yīng)用研究
施勇
(淮南師范學(xué)院網(wǎng)絡(luò)信息中心,安徽 淮南 232038)
利用大數(shù)據(jù)的技術(shù)與思想,處理數(shù)據(jù)挖掘利用、數(shù)據(jù)質(zhì)量等問(wèn)題,能推動(dòng)高校建立較為完備的數(shù)據(jù)采集體系、數(shù)據(jù)質(zhì)量的規(guī)范管理、數(shù)據(jù)安全與隱私保護(hù);分析高校數(shù)字化校園平臺(tái)大數(shù)據(jù),將助力提升高校的軟實(shí)力,為學(xué)校的決策分析提供參考,提升廣大師生數(shù)字化校園平臺(tái)的高效服務(wù)體驗(yàn)。
大數(shù)據(jù);數(shù)據(jù)挖掘;數(shù)字化校園;
目前國(guó)內(nèi)高校正如火如荼地實(shí)施“十三五”信息化規(guī)劃,從近十年的數(shù)字化校園平臺(tái)的期刊文獻(xiàn)研究,到上海復(fù)旦大學(xué)、南京理工大學(xué)、常熟理工學(xué)院等類(lèi)似高校的實(shí)地訪談,調(diào)研數(shù)據(jù)表明信息化建設(shè)的主要工作已經(jīng)轉(zhuǎn)向高等院?!按髷?shù)據(jù)挖掘”、“數(shù)據(jù)倉(cāng)庫(kù)”、“決策與分析”、“智慧校園”、“碎片化服務(wù)”①凌曉東:《SOA綜述》,《計(jì)算機(jī)應(yīng)用與軟件》2007年第10期。的建設(shè)上來(lái)。而這些都是基于“數(shù)字化校園”概念發(fā)展而來(lái),而審視國(guó)內(nèi)高校信息化建設(shè)現(xiàn)狀,文章指出信息化建設(shè)發(fā)展的方向在數(shù)字化校園平臺(tái)建設(shè)的基礎(chǔ)上,以數(shù)據(jù)挖掘?yàn)樽ナ症凇陡叩仍盒4髷?shù)據(jù)挖掘與決策分析體系的應(yīng)用研究》,《現(xiàn)代教育技術(shù)》2016年第8期。,開(kāi)展數(shù)字化校園平臺(tái)的應(yīng)用研究。
何為數(shù)字化校園平臺(tái)?筆者認(rèn)為,現(xiàn)有校園從宏觀角度來(lái)看,應(yīng)該包括實(shí)體校園和虛擬校園。③楊嬌:《制約數(shù)字化校園建設(shè)發(fā)展的幾個(gè)問(wèn)題》,《電子技術(shù)與軟件工程》2016年第9期。而虛擬校園的核心思想就是數(shù)字化的機(jī)房、數(shù)字化的軟件、數(shù)字化的教師、數(shù)字化的課程平臺(tái)、數(shù)字化的后勤設(shè)備等等,這些就構(gòu)成了一個(gè)數(shù)字化的校園,而這個(gè)基礎(chǔ)平臺(tái)就是數(shù)字化校園平臺(tái),它依托現(xiàn)代計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)、物聯(lián)網(wǎng)技術(shù)、數(shù)據(jù)挖掘技術(shù)④Azuaje F.Witten IH,Frank E:“Data Mining:Practical Machine Learning Tools and Techniques”. Biomedical Engineering Online,2006,Vol.5,pp.1-2.,實(shí)現(xiàn)的功能較多,把平時(shí)我們構(gòu)想的和不敢想象的功能現(xiàn)實(shí)化,實(shí)現(xiàn)了高等院校圍繞整個(gè)教育過(guò)程的全方位的信息化。
數(shù)字化校園是一個(gè)有機(jī)整體,它包括師生、各種網(wǎng)絡(luò)設(shè)施、各種應(yīng)用級(jí)別的系統(tǒng)、各種數(shù)據(jù)庫(kù)、各種終端處理設(shè)備等多個(gè)元素;它所涉及的層面包括學(xué)校領(lǐng)導(dǎo)層、中間管理層、基礎(chǔ)業(yè)務(wù)層;它用來(lái)促進(jìn)高校教學(xué)管理、師生服務(wù)、智能化終端服務(wù)等。
高校進(jìn)行數(shù)字校園建設(shè)有著自己的定位,數(shù)字化校園平臺(tái)不應(yīng)只涉及如上內(nèi)容,還應(yīng)包括高校至上而下的全體層面的信息化理念,學(xué)校的領(lǐng)導(dǎo)決策與辦學(xué)定位,信息化發(fā)展規(guī)劃設(shè)計(jì),以及它所帶來(lái)的具有信息化推動(dòng)作用的周邊輻射。⑤徐宗本,馮芷艷,郭迅華,等:《大數(shù)據(jù)驅(qū)動(dòng)的管理與決策前沿課題》,《管理世界》2014年第11期。
當(dāng)前高校大數(shù)據(jù)擁有著“海量”、“高增長(zhǎng)率”、“多樣化”等信息特點(diǎn)。面對(duì)學(xué)校數(shù)據(jù)的大幅膨脹和快速積累,高校如何更好地利用好校內(nèi)數(shù)據(jù)信息,深入挖掘數(shù)據(jù)之間的關(guān)聯(lián)性與交互性,大幅釋放出數(shù)據(jù)空間與數(shù)據(jù)潛力①王錚:《基于Hadoop的分布式系統(tǒng)研究與應(yīng)用》,吉林大學(xué),2014年;劉同,真溱,湯珊紅:《填補(bǔ)情報(bào)信息收集和分析之間的“鴻溝”》,《情報(bào)理論與實(shí)踐》2016年第4期。,為高校提供更為強(qiáng)大的洞察力、決策力以及管理的流程、手段、效率等方面的優(yōu)化能力,這將是高校信息化管理人員、業(yè)務(wù)部門(mén)管理人員和相關(guān)業(yè)務(wù)人員需要進(jìn)一步研究的重點(diǎn)課題。
經(jīng)調(diào)研,國(guó)內(nèi)部分高校在2000年初就已初步實(shí)施數(shù)字化校園建設(shè),歷經(jīng)十幾年時(shí)間的沉淀積累,信息化建設(shè)取得了一定的成績(jī)?;A(chǔ)平臺(tái)及應(yīng)用系統(tǒng)的建設(shè)尤為成熟,比如人事管理系統(tǒng)(基礎(chǔ)數(shù)據(jù)平臺(tái)、人事考核平臺(tái)、薪酬管理平臺(tái))、學(xué)工管理系統(tǒng)(就業(yè)管理平臺(tái)、學(xué)生管理平臺(tái)、生涯測(cè)評(píng)管理系統(tǒng))等,統(tǒng)一身份認(rèn)證平臺(tái)、統(tǒng)一的綜合信息門(mén)戶平臺(tái)、共享數(shù)據(jù)中心平臺(tái)等都陸續(xù)建立完善起來(lái),這些構(gòu)成了大數(shù)據(jù)平臺(tái)的基礎(chǔ)業(yè)務(wù)應(yīng)用平臺(tái),為學(xué)校自身的教育信息化、教育智能化、教育個(gè)性化提供了便捷。②游慧:《數(shù)據(jù)挖掘在個(gè)性化學(xué)習(xí)系統(tǒng)中的運(yùn)用》,《微機(jī)發(fā)展》2005年第6期。
為進(jìn)一步深化高校教育信息化建設(shè),建立高校的業(yè)務(wù)決策方案,提供中長(zhǎng)期發(fā)展規(guī)劃,當(dāng)前高校的信息化建設(shè)必須重視以上內(nèi)容,將涉及到的問(wèn)題進(jìn)行深入研究。
高校數(shù)字化校園平臺(tái)中擁有海量的有待于進(jìn)一步挖掘的數(shù)據(jù)。教師和學(xué)生從進(jìn)入學(xué)校到離開(kāi)學(xué)校形成了整個(gè)“全生命周期”,全校教師與學(xué)生在整個(gè)“全生命周期”內(nèi)產(chǎn)生了大量的數(shù)據(jù),這些構(gòu)成了高校大數(shù)據(jù)的基礎(chǔ),包括教學(xué)數(shù)據(jù)、學(xué)習(xí)數(shù)據(jù)、獎(jiǎng)懲助貸數(shù)據(jù)、團(tuán)學(xué)信息、學(xué)生組織、競(jìng)賽等其他相關(guān)信息。所有這些綜合起來(lái)的信息,需要對(duì)其基礎(chǔ)數(shù)據(jù)進(jìn)行存儲(chǔ)、分析、挖掘,開(kāi)展有效的管理,并加以充分利用,使它們?yōu)楦咝=虒W(xué)、管理、服務(wù)等環(huán)節(jié)服務(wù)。
(一)開(kāi)展大數(shù)據(jù)主題查詢
數(shù)據(jù)挖掘(Data mining)在處理海量數(shù)據(jù)集方面具有極大的優(yōu)勢(shì),技術(shù)手段目前較為成熟。③江綿康:《“數(shù)字城市”的理論與實(shí)踐》,華東師范大學(xué)碩士學(xué)位論文,2006年。采用數(shù)據(jù)挖掘技術(shù),對(duì)高校基礎(chǔ)數(shù)據(jù)建立不同的主題,同時(shí)為方便主題的管理,而對(duì)主題建立不同的類(lèi)別④石麗梅:《基于SOA構(gòu)建數(shù)字化校園主題數(shù)據(jù)庫(kù)的研究與應(yīng)用》,內(nèi)蒙古工業(yè)大學(xué),2009年。,以淮南師范學(xué)院數(shù)字化校園平臺(tái)為例,具體包含的主題查詢類(lèi)別和子類(lèi)別概括如下:
(1)校情類(lèi)主題:包括組織機(jī)構(gòu)信息查詢、班級(jí)信息查詢和專(zhuān)業(yè)信息查詢,主要提供全校通用性質(zhì)的公共信息查詢。
(2)教工類(lèi)主題:包括教職工基礎(chǔ)數(shù)據(jù)查詢、學(xué)歷學(xué)位信息查詢、專(zhuān)業(yè)技術(shù)職務(wù)查詢、獎(jiǎng)勵(lì)情況查詢、懲處情況查詢、家庭成員情況查詢、工作簡(jiǎn)歷查詢、崗位證書(shū)信息查詢、國(guó)內(nèi)進(jìn)修情況查詢等,主要提供教工視角的各類(lèi)基本信息的查詢。
(3)學(xué)生類(lèi)主題:包括基礎(chǔ)信息查詢、學(xué)歷學(xué)位查詢、課程成績(jī)查詢、學(xué)生收費(fèi)查詢、獎(jiǎng)學(xué)金助學(xué)金查詢、助學(xué)貸款查詢、勤工助學(xué)查詢、學(xué)籍異動(dòng)查詢、困難補(bǔ)助查詢、本專(zhuān)科錄取查詢,主要提供學(xué)生視角的各類(lèi)基本信息的查詢。
(4)教學(xué)類(lèi)主題:包括所帶課程基本信息查詢、課程計(jì)劃查詢、教學(xué)規(guī)劃查詢、教師課表與學(xué)生課表查詢、教工監(jiān)考信息查詢、學(xué)生考試情況查詢等,主要提供教學(xué)相關(guān)的各類(lèi)信息的查詢。
(5)科研類(lèi)主題:包括科研項(xiàng)目基本信息查詢(縱向與橫向)、科研項(xiàng)目支撐經(jīng)費(fèi)查詢、科技著作信息查詢、鑒定成果信息查詢、專(zhuān)利成果信息查詢等,主要提供與科研相關(guān)的各類(lèi)信息的查詢。
(6)圖書(shū)類(lèi)主題:包括教職工和學(xué)生圖書(shū)借閱信息查詢、圖書(shū)違章信息查詢、圖書(shū)到期提醒查詢、新到圖書(shū)查詢等,主要提供與圖書(shū)相關(guān)的各類(lèi)信息的查詢。
(二)進(jìn)行大數(shù)據(jù)統(tǒng)計(jì)分析
針對(duì)現(xiàn)有的高校數(shù)據(jù)信息,進(jìn)行大數(shù)據(jù)統(tǒng)計(jì)分析,概括為:
(1)教職工情況分析:包括教職工人員概況、教職工情況詳情、教師人員概況、教師情況詳情、專(zhuān)任教師人員詳情和專(zhuān)任教師情況詳情,提供教職工相關(guān)的多種維度的統(tǒng)計(jì)分析圖表展現(xiàn)。
(2)學(xué)生情況分析:包括專(zhuān)業(yè)人數(shù)統(tǒng)計(jì)、學(xué)生人員概況、學(xué)生情況明細(xì)和學(xué)生收費(fèi)完成率分析,提供學(xué)生相關(guān)的多種維度的統(tǒng)計(jì)分析圖表展現(xiàn)。
(3)學(xué)科專(zhuān)業(yè)統(tǒng)計(jì)分析:包括各二級(jí)學(xué)院(系)歷年專(zhuān)業(yè)建設(shè)情況,對(duì)比情況,提供專(zhuān)業(yè)相關(guān)的多種維度的統(tǒng)計(jì)分析圖表展現(xiàn)。(參見(jiàn)圖1)
(4)科研情況分析:包括科研項(xiàng)目數(shù)量分析與項(xiàng)目趨勢(shì)分析、科研發(fā)表成果數(shù)量分析、科研獲獎(jiǎng)數(shù)量分析、發(fā)表成果趨勢(shì)分析,提供科研相關(guān)的多種維度的統(tǒng)計(jì)分析圖表展現(xiàn)。
(5)圖書(shū)情況分析:提供圖書(shū)相關(guān)的多種維度的統(tǒng)計(jì)分析圖表展現(xiàn)。支持多種展現(xiàn)形式,包括柱狀圖、餅狀圖、折線圖等,用戶也可自主選擇展現(xiàn)的形式。
圖1 專(zhuān)業(yè)建設(shè)統(tǒng)計(jì)分析圖示
研究設(shè)計(jì)了高校主題數(shù)據(jù)一般報(bào)表生成流程圖,如下:
圖2 高校主題數(shù)據(jù)報(bào)表生成流程
(三)提供大數(shù)據(jù)驅(qū)動(dòng)決策支撐
在高校的大數(shù)據(jù)中,包含了高??傮w概況、高?;A(chǔ)校情到每一個(gè)師生圖書(shū)借閱情況、每餐在校消費(fèi)情況等數(shù)據(jù),覆蓋了從大層面到各個(gè)點(diǎn)的多個(gè)方面的數(shù)據(jù)。通過(guò)對(duì)這些數(shù)據(jù)的分析為發(fā)展規(guī)劃等提供決策支持。①王連軍,張寶東:《高校學(xué)生消費(fèi)差異分析——基于基尼系數(shù)分解理論的實(shí)證研究》,《統(tǒng)計(jì)與信息論壇》2007年第2期。
1.以人為本的建立數(shù)據(jù)處理機(jī)制
高校信息化建設(shè)要實(shí)現(xiàn)以人為本,注重人文關(guān)懷和生態(tài)建設(shè),圍繞“人”來(lái)建立學(xué)校數(shù)據(jù)收集、應(yīng)用機(jī)制②顏雪松,蔡之華:《一種基于Apriori的高效關(guān)聯(lián)規(guī)則挖掘算法的研究》,《計(jì)算機(jī)工程與應(yīng)用》2002年第10期。,依托師生產(chǎn)生的數(shù)據(jù)進(jìn)行分析才能是有源之水,反哺可行。大數(shù)據(jù)驅(qū)動(dòng),需要建立信息化數(shù)據(jù)服務(wù)綜合平臺(tái),整合跨部門(mén)、跨業(yè)務(wù),統(tǒng)一數(shù)據(jù)源,將“前端界面”與“后端邏輯”進(jìn)行分離,綜合業(yè)務(wù)數(shù)據(jù)采集入口;抽取與師生相關(guān)的各類(lèi)數(shù)據(jù),還通過(guò)多個(gè)方面聯(lián)系多個(gè)業(yè)務(wù)主管部門(mén),如教務(wù)、學(xué)工、人事等,建立數(shù)據(jù)決策中心。
2.?dāng)?shù)據(jù)標(biāo)準(zhǔn)化、碎片化、流程化處理
數(shù)據(jù)共享庫(kù)中的數(shù)據(jù)必須建立在一個(gè)統(tǒng)一的標(biāo)準(zhǔn)之上,這個(gè)是數(shù)字化校園建設(shè)初期和后期一直需要直面正視和處理的問(wèn)題,這樣對(duì)原有的應(yīng)用系統(tǒng)和新建的應(yīng)用系統(tǒng)來(lái)說(shuō)就免去了數(shù)據(jù)多樣化背后的數(shù)據(jù)清洗。③朱力緯,劉麗勤,王?。骸陡咝;诖髷?shù)據(jù)時(shí)代的數(shù)字化校園建設(shè)探討》,《華東師范大學(xué)學(xué)報(bào)》(自然科學(xué)版)2015年第1期。碎片化有著自身的定位,碎片本身有著兩個(gè)特點(diǎn),一是細(xì)小的數(shù)據(jù)單元,二是多樣性。信息化服務(wù)隨著高校的發(fā)展而不斷演化,碎片化服務(wù)在數(shù)據(jù)業(yè)務(wù)之間相互支撐,可以打破固定的業(yè)務(wù)邏輯關(guān)系,相互獨(dú)立但是又可以相互整合,碎片化為業(yè)務(wù)流程梳理和重組打下基礎(chǔ),這些構(gòu)建了大數(shù)據(jù)的基礎(chǔ)處理單元,又為數(shù)字化校園平臺(tái)的深入應(yīng)用開(kāi)拓新的發(fā)展方向。
3.?dāng)?shù)字化校園平臺(tái)場(chǎng)景應(yīng)用
數(shù)字化校園平臺(tái)應(yīng)用場(chǎng)景范圍是廣泛的,對(duì)高校中日常場(chǎng)景進(jìn)行模擬分析,可以提煉出可供分析的、有價(jià)值的校園網(wǎng)用戶個(gè)人行為數(shù)據(jù),對(duì)這些用戶行為大數(shù)據(jù)展開(kāi)分析,將分析結(jié)果用于學(xué)校綜合評(píng)估、發(fā)展指導(dǎo)使用。④廖姍姍:《校園網(wǎng)用戶管理在大數(shù)據(jù)時(shí)代下的應(yīng)用研究》,《數(shù)字技術(shù)與應(yīng)用》2016年第1期。比如師生各校車(chē)時(shí)間與班次分析;生活貧困生評(píng)定分析;校內(nèi)人員聚集分散安防分析等。校內(nèi)綜合應(yīng)用存在的困惑、業(yè)務(wù)流程發(fā)展的趨勢(shì)均可在充分應(yīng)用數(shù)據(jù)挖掘技術(shù)的基礎(chǔ)上找到相應(yīng)的突破口、創(chuàng)新點(diǎn),從而最終在整體上、全方位地實(shí)現(xiàn)高校各方面資源的優(yōu)化管理與合理配置,持續(xù)提升學(xué)校數(shù)字化校園平臺(tái)建設(shè)的效益。
綜上所述,針對(duì)目前高校數(shù)字化校園建設(shè)實(shí)際情況,充分發(fā)掘和分析高校大數(shù)據(jù)的價(jià)值,能夠更加全面地認(rèn)識(shí)校內(nèi)各類(lèi)人員活動(dòng)和物資配置,有效的提高數(shù)據(jù)管理質(zhì)量,提升高校工作效率。采用大數(shù)據(jù)挖掘思想和技術(shù),可以將學(xué)校信息化管理服務(wù)的水平和建設(shè)能力提高到一個(gè)新的臺(tái)階上。
Research on the application of digital campus platform based on Data Mining
SHI Yong
using the technology and the idea of big data,using the data processing quality,data mining, data acquisition and promote the establishment of a relatively complete system of colleges and universities, standardize the management of data quality,data security and privacy protection;analysis of university digital campus platform big data,will help enhance the soft power of colleges and universities,to provide reference for the decision-making of school analysis,enhance the efficient service digital campus platform of teachers and students experience.
big data;data mining;digital campus
G40-057
A
1009-9530(2017)01-0129-03
2016-10-13
安徽高校人文社會(huì)科學(xué)重點(diǎn)研究項(xiàng)目“高校校園網(wǎng)入侵防御及應(yīng)急策略研究”(SK2016A0860)
施勇(1984-),男,淮南師范學(xué)院網(wǎng)絡(luò)信息中心教師,教育技術(shù)學(xué)碩士研究生,主要從事高校信息化建設(shè)。
淮南師范學(xué)院學(xué)報(bào)2017年1期