林勤 陳長輝 賈志偉
摘? 要:隨著教育信息化進程的不斷推進,海量的教育基礎數(shù)據(jù)應運而生,各高職院校越發(fā)關注及重視如何利用這些“數(shù)字資產(chǎn)”為師生創(chuàng)建一個更加個性化的校園服務體系。運用基于大數(shù)據(jù)的教育分析平臺及真實的院校業(yè)務數(shù)據(jù),構建以學生為對象的多維度行為分析模型,并以廣州某高職院校建設實施為例,從學生概況分析、學生行為分析、學生綜合預警等維度向校方呈現(xiàn)精準、個性特征明顯的學生綜合畫像,為學生的個性化學習生活提供導向依據(jù)。
關鍵詞:教育大數(shù)據(jù);行為畫像;智慧校園
中圖分類號:TP391;G434? ? ? 文獻標識碼:A 文章編號:2096-4706(2021)05-0019-05
Application Exploration of Behavior Portrait Analysis of Higher Vocational College Students Based on Big Data Modeling
LIN Qin,CHEN Changhui,JIA Zhiwei
(Education Technology and Information Center,Guangzhou Panyu Polytechnic,Guangzhou? 511483,China)
Abstract:With the continuous advancement of the process of education informatization,a large amount of basic educational data has emerged after with it. Higher vocational colleges pay more and more attention to how to use these “digital assets” to create a more personalized campus service system for teachers and students. Using the education analysis platform based on big data and real business data of campus,then constructs a multi-dimensional behavior analysis model with students as the object. And also taking the construction and implementation of a higher vocational college in Guangzhou as an example,from the aspects of student profile analysis,student behavior analysis and student comprehensive warning,this paper presents the school with accurate and obvious personality characteristics of studentscomprehensive portrait,which provides guidance for studentspersonalized learning and life.
Keywords:education big data;behavior portrait;smart campus
0? 引? 言
大數(shù)據(jù)時代的來臨,對教育行業(yè)而言,是一個重要的契機。國務院關于印發(fā)《國家教育事業(yè)發(fā)展“十三五”規(guī)劃的通知》明確指出,鼓勵學校利用大數(shù)據(jù)技術開展對教育教學活動和學生行為數(shù)據(jù)的收集、分析和反饋,為推動個性化學習和針對性教學提供支持[1]。雖然高校在時代進步與社會發(fā)展中充當著推動者的角色,同時在人才培育、知識探索、科技研發(fā)及服務社會等方面起著主導及決定性的作用,但在大數(shù)據(jù)應用方面反而一直滯后于傳統(tǒng)的商務領域,實際上各高職院校已擁有數(shù)量龐大的教育基礎數(shù)據(jù),如何讓這些“數(shù)字資產(chǎn)”進一步為學校辦學及管理提供更好的應用價值,已成為各院校的研究重點。
1? 大數(shù)據(jù)與行為畫像
大數(shù)據(jù)是個抽象的概念,它是指社會生產(chǎn)生活中與管理服務過程中形成的無法通過常規(guī)工具進行采集、管理、處理的海量數(shù)據(jù)集合,須借助新型技術進行提取整合,交叉分析,最終具有強精準性、指向性、決策性的信息資產(chǎn)。它具有典型的:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)5V特點(由IBM提出)。行為記錄是指由時間、人物、地點及事件等元素標簽所組成的具體的數(shù)據(jù)記錄,通過對大量的行為記錄進行分析便可以描繪出該人物的信息全貌,即行為畫像。
2? 教育大數(shù)據(jù)應用現(xiàn)狀
2.1? 應用的現(xiàn)狀
隨著研究的開展及技術的成熟,大數(shù)據(jù)應用已漸漸在人們的生活中嶄露頭角,如電商購物平臺利用用戶查閱及購物記錄大數(shù)據(jù),分析出用戶的消費喜好而進行產(chǎn)品推送;又如醫(yī)院通過大數(shù)據(jù)可預知區(qū)域性流行病的范圍及周期,提前做好應診及進藥措施等,這些正是挖掘、運用大數(shù)據(jù)的價值體現(xiàn)。事實上,我國的高校也在不斷地嘗試用大數(shù)據(jù)分析挖掘技術解決在實際辦學中遇到的問題,如上海東華大學利用學校資產(chǎn)信息進行數(shù)據(jù)分析,從而了解學校的設備使用情況并以此制定采購計劃、預算等,大多數(shù)普通高校對大數(shù)據(jù)技術的應用還停留在理論研究上,但隨著現(xiàn)代高校信息化建設的不斷發(fā)展推進,如教務、人事、科研、圖書,特別是一卡通等各類管理應用系統(tǒng)的相繼完善并不斷標準化、體系化,使得有效、穩(wěn)定、規(guī)范的數(shù)據(jù)來源成為可能,結合信息安全與云計算的支撐,普通高校也已逐步具備大數(shù)據(jù)技術應用的環(huán)境基礎[2]。如果能利用上述這些大數(shù)據(jù)海量、多維度、準確及高可塑性等優(yōu)點,加強對這些數(shù)據(jù)的研究與分析,并通過建立數(shù)據(jù)模型找出數(shù)據(jù)間的相互關系及規(guī)律,可實現(xiàn)提升教學、辦公、管理、科研等各方面能力的應用分析結論,最終為學校的發(fā)展及規(guī)劃提供決策導向。
2.2? 面臨的問題
隨著國家教育現(xiàn)代化目標的不斷提高,傳統(tǒng)教育管理方式短板也日益突出,如教育與管理數(shù)據(jù)的非實時性,導致預測和評估的滯后;數(shù)據(jù)分析偏宏觀,導致缺乏對個體層面發(fā)展的關注等,而這些方面的問題又直接影響著學校的辦學發(fā)展及學生的個性化成長,具體表現(xiàn)為:
(1)在當今的信息社會大環(huán)境下,高校學生在校園日常生活場景中極易受到不同信息資訊、生活氛圍及思維引導的影響,進而產(chǎn)生潛移默化的變化,迷失正當?shù)膶W習、生活目標,而且大部分學生及校方很難及時察覺并進行干預,一旦出現(xiàn)不可逆轉(zhuǎn)的事件時,為時已晚。
(2)相比以往,當代的高校學生展現(xiàn)出了極具特色的個性化發(fā)展趨勢,按部就班的傳統(tǒng)教育模式已嚴重地制約了學生的學習成長,特別是在校園信息化高速發(fā)展的今天,這種采用單一引導及復印式的教學管理方式更加顯得格格不入。
(3)雖然與大數(shù)據(jù)應用相結合可以為高校的個性化教學及智慧管理提供可能,但在近些年的教育大數(shù)據(jù)應用與實踐建設過程中,仍存在著數(shù)據(jù)標準不統(tǒng)一、信息系統(tǒng)孤島嚴重及實際運用落地難等問題[3]。
3? 智慧校園大數(shù)據(jù)基礎平臺
為解決上述問題,首先需要搭建大數(shù)據(jù)基礎平臺,借助各高職院校已具備的良好的計算及存儲資源,利用云計算靈活的部署模式,采用Hadoop+分布式數(shù)據(jù)庫并行的大數(shù)據(jù)架構體系[4],參照教育部教育管理信息化標準,對各信息化業(yè)務系統(tǒng)的主要結果數(shù)據(jù)進行整合、清洗、歸管以及質(zhì)量把控等環(huán)節(jié)處理,如圖1所示,對全校的數(shù)據(jù)資源進行管控和運營,充分發(fā)揮數(shù)據(jù)資產(chǎn)的優(yōu)勢,用于師生管理、教學、科研、資產(chǎn)及相關應用分析模塊,服務于學校辦學管理的各個方面。如對學生學習行為數(shù)據(jù)的分析,了解學生的學習進度、學習效果以及可能的就業(yè)方向等,這些數(shù)據(jù)展示給學生,讓其可以調(diào)整自己的工作學習安排;這些數(shù)據(jù)展示給教師,將對教學創(chuàng)新提供最為直接的依據(jù);這些數(shù)據(jù)整合給學校,將可以為學生提供更具個性的智慧校園服務等。
平臺通過擴展和封裝Hadoop來實現(xiàn)對大數(shù)據(jù)的存儲、分析的支撐,同時實現(xiàn)對于非結構、半結構化數(shù)據(jù)處理、復雜的ETL流程、復雜的數(shù)據(jù)挖掘和計算模型處理,在構建統(tǒng)一數(shù)據(jù)標準的同時完成基礎核心的元數(shù)據(jù)管理平臺及數(shù)據(jù)共享交換平臺的建設,在此基礎上將學校教務、一卡通、圖書、學工等系統(tǒng)的主要基礎數(shù)據(jù)匯聚到平臺里,結合數(shù)據(jù)建模,從中構建出一個可多維度展示個體學生行為的數(shù)據(jù)分析模型(即行為畫像分析模型)。
4? 學生行為畫像分析模型
行為畫像的分析其實也是一項數(shù)據(jù)挖掘工作,該分析從學生的角色出發(fā),基于個性化差異,對相關業(yè)務系統(tǒng)元數(shù)據(jù)通過因子分析、聚類分析、交叉分析以及組合分析等手段進行分析,來挖掘出每位學生的學習、生活、消費、行跡、興趣愛好等具有明顯個體特征性的標簽信息,構建一個多維度、準確且全面的學生綜合行為畫像分析模型,如圖2所示。
模型中所有分析維度的特征指標均由各業(yè)務系統(tǒng)提供數(shù)據(jù)來源,根據(jù)各高校主流信息系統(tǒng)相關樣本數(shù)據(jù)的特征,采用K近鄰算法(k-Nearest Neighbors algorithm,k-NN)擬合模型進行建模分析,實現(xiàn)快速精準的多維度分析結果展示[5],從而解決智慧校園大環(huán)境下的學生個性化成長及高學智慧化辦學服務中所遇到的困境與瓶頸。
5? 應用分析的效果呈現(xiàn)
本文以廣州某高職院校為例,通過上述大數(shù)據(jù)平臺的實踐建設,對該校32個在用業(yè)務系統(tǒng)的近7 800萬條信息記錄做作數(shù)據(jù)處理及數(shù)據(jù)倉庫建設,由于部分原始數(shù)據(jù)有可能涉及學生隱私內(nèi)容,因此,所有數(shù)據(jù)在清洗入倉時已做脫敏處理,保證數(shù)據(jù)信息的安全,其中由2 300萬條相關信息記錄構成學生行為畫像分析模型元數(shù)據(jù),對這些元數(shù)據(jù)進行流程化處理后,便可進行學生層面的分析與展示。
5.1? 學生畫像分析
該分析基于數(shù)據(jù)倉庫數(shù)據(jù)抽取模型,分析每名在校學生的個人基本屬性、綜合指標表現(xiàn)等個體特征及分項排名,如圖3所示。
所展示的分析結果十分有助于校方及老師對每一位學生有一個準確的了解,知道如何去針對不同的學生或整體學生的學習概況而進行教學方法的調(diào)整及學習方法的引導,同時有針對性地為學生提供感興趣的課內(nèi)課外學習資源,助力學生的個性化學習成長;最重要的是讓學生本人對自己有一個客觀的認識,更清晰地定位在校學習、生活以及就業(yè)等工作,并及時了解自己在各個階段所出現(xiàn)的細微變化,通過自我肯定或反思,主動調(diào)整至最佳狀態(tài)。
5.2? 學生行為分析
該分析分為上網(wǎng)行為分析及行為軌跡分析兩部分:
(1)上網(wǎng)行為分析是通過學生校園網(wǎng)的上網(wǎng)記錄日志數(shù)據(jù),對學生的上網(wǎng)進行分析,針對學生的日上網(wǎng)時長、流量、終端類型、接入地點等指標,展開其在年級、學院、時段等不同維度的分析;而對于網(wǎng)絡應用類型及偏好分析則通過網(wǎng)絡行為審計數(shù)據(jù)來實現(xiàn)。這些分析結果便于學校引導學生合理使用網(wǎng)絡,同時干預沉溺網(wǎng)絡的行為。
(2)行為軌跡分析通過挖掘?qū)W生在校的所有含地理位置痕跡的數(shù)據(jù)(主要有校園Wi-Fi認證接入、時長及漫游記錄,輔以一卡通及門禁記錄等),分析得出學校各個樓宇的各時間段的人流密度情況,以及各類群體和具體個人的行為軌跡規(guī)律,如圖4所示。這有助于學校有針對性的加強人流密集區(qū)的安保措施,另外,在當前疫情期間,可依此對學生在上、下課以及用餐高峰期時進行錯峰安排。
5.3? 精準助學分析
精準助學的主要對象是家庭經(jīng)濟貧困學生,根據(jù)對全體在校學生一卡通消費數(shù)據(jù)的統(tǒng)計及聚類分析,得出在校學生整體的消費水平及頻次概況,從中得知貧困學生群體與正常學生群體之間的消費差距及在校消費穩(wěn)定性上的不同,如圖5所示,從而開展相關工作[6]。精準助學分析不僅可以驗證已列入貧困助學學生的實際經(jīng)濟情況,也可以發(fā)現(xiàn)其他因故而沒有申請或申請不通過的貧困學生,學??梢来酥鲃訉@類學生進行心理疏導或助學關注,避免出現(xiàn)其他問題;同時可以作為助學申評結果的有效依據(jù),確保貧困學生有基本的生活質(zhì)量并能順利完成學業(yè)。
5.4? 學生綜合預警
高職院校的生源寬泛,生活行為習慣參差不齊,管理難度較大,潛藏著很多管理盲區(qū)隱患,然而傳統(tǒng)的校園管理或信息化手段并未對學生異常行為進行有效的主動式預警,而無法及時掌握學生的各種動態(tài),使學校在學生管理方面處于被動地位。學生綜合預警分析功能是利用學生的學業(yè)成績、一卡通消費記錄、門禁考勤記錄等校務管理信息,以及圖書館借閱數(shù)據(jù)、校園網(wǎng)使用數(shù)據(jù)等建立聚類及關聯(lián)分析模型,并設置預警閾值,針對學生的學業(yè)情況、考勤情況、用網(wǎng)情況及可能出現(xiàn)的失聯(lián)情況等進行危機預警,告知學生本人可能產(chǎn)生的不良后果并進行提醒或警告,以警代罰,實現(xiàn)對學生的全方位科學化的管理和教育。
5.5? 學生在校分析報告
該分析用于呈現(xiàn)在校學生每個階段時間內(nèi)及整個大學學習生涯內(nèi)的表現(xiàn)情況,利用大數(shù)據(jù)微觀鉆取到學生在校期間各方面的“蛛絲馬跡”,并且和同年校內(nèi)其他學生進行對比分析,科學宏觀地展示學生學業(yè)、綜合素質(zhì)、日常生活等整體行為全貌。這不僅方便學生有針對性的自我補差提優(yōu),更方便家長對孩子在整個大學生涯各個階段的行為表現(xiàn)有一個清楚的認識;同時也可作為畢業(yè)時校方就業(yè)推薦及綜合評價的優(yōu)差依據(jù)。
6? 結? 論
本文所提出的基于大數(shù)據(jù)分析平臺的高職院校學生行為畫像模型應用,只是大數(shù)據(jù)在高職院校中針對學生管理方面的一個應用實例,利用Hadoop+KNN技術可實現(xiàn)快速及準確處理的優(yōu)點,通過建模,聚類關聯(lián)挖掘出數(shù)據(jù)倉庫中學生相關的多維度畫像數(shù)據(jù)呈現(xiàn),便于學校為學生的個性化學習及未來就業(yè)提供實質(zhì)的科學分析以及智慧服務。同理,利用該數(shù)據(jù)分析平臺強大的數(shù)據(jù)處理能力以及精準的分析建模構建教師分析、學情分析、科研分析、就業(yè)分析、資產(chǎn)分析等模塊功能,全方位為學校的辦學、管理以及發(fā)展規(guī)劃提供科學的數(shù)據(jù)依據(jù)及決策,助力高職院校在新時代教育大背景下的良性發(fā)展。
參考文獻:
[1] 國務院.國務院關于印發(fā)國家教育事業(yè)發(fā)展“十三五”規(guī)劃的通知 [J].中華人民共和國國務院公報,2017(5):43-74.
[2] 董瀟瀟,胡延,陳彥萍.基于校園數(shù)據(jù)的大學生行為畫像研究與分析 [J].計算機與數(shù)字工程,2018,46(6):1200-1204+ 1262.
[3] 李有增,曾浩.基于學生行為分析模型的高校智慧校園教育大數(shù)據(jù)應用研究 [J].中國 電化教育,2018(7):33-38.
[4] 葛蘇慧,萬泉,白成杰.基于Hadoop的高校學生行為預警決策系統(tǒng)研究 [J].計算機應用與軟件,2021,38(1):6-12.
[5] 楊光瑩,杜敏,楊東梅等.基于校園行為數(shù)據(jù)分析的學生畫像系統(tǒng)初步構建研究 [J].教育教學論壇,2020(41):44-45.
[6] 李豐.大數(shù)據(jù)技術在高校學生助學金評比中的應用 [J].計算機教育,2017(5):154-157.
作者簡介:林勤(1983—),男,漢族,廣東汕頭人,網(wǎng)絡工程師,學士學位,研究方向:網(wǎng)絡管理與技術;陳長輝(1980—),男,漢族,廣東湛江人,高級實驗師,碩士,研究方向:網(wǎng)絡信息安全、大數(shù)據(jù)應用及安全;賈志偉(1983—),男,漢族,河南南陽人,網(wǎng)絡工程師,學士學位,研究方向:網(wǎng)絡規(guī)劃與管理。