龔群子,熊風
(廣東農(nóng)工商職業(yè)技術(shù)學院 外語學院,廣東 廣州 510507)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,大數(shù)據(jù)作為當下最熱門的概念之一,已經(jīng)廣泛應(yīng)用于咨詢服務(wù)業(yè)、金融業(yè)和健康醫(yī)療業(yè)等領(lǐng)域。它的應(yīng)用不僅改善了客戶體驗,提高了運營效率,而且推動了技術(shù)革新。近年來,大數(shù)據(jù)的應(yīng)用開始傳導到職業(yè)教育,我國職業(yè)教育強調(diào)工學結(jié)合、校企合作,與社會各領(lǐng)域的聯(lián)系十分緊密,這種緊密的聯(lián)系已經(jīng)突破了傳統(tǒng)的物理形態(tài),并逐步上升到了虛擬的數(shù)據(jù)的交換和學習。在職業(yè)教育中應(yīng)用大數(shù)據(jù)已成為新的趨勢:一方面,社會運行產(chǎn)生的大量數(shù)據(jù)可以為職業(yè)教育的改革提供決策依據(jù),另一方面,職業(yè)教育自身產(chǎn)生的大量數(shù)據(jù)也為優(yōu)化人才培養(yǎng)和辦學模式提供了支撐。
大數(shù)據(jù)作為一個新的概念,其產(chǎn)生的時間并不長。上世紀60-70 年代全球產(chǎn)生了第一個數(shù)據(jù)中心,并發(fā)展出了區(qū)域型數(shù)據(jù)庫;到2005 年,隨著Facebook、Youtube 等一些網(wǎng)絡(luò)應(yīng)用的興起,出現(xiàn)了Hadhoop 等這類能夠?qū)Υ罅繑?shù)據(jù)進行分布式處理的軟件框架;再到后來,隨著互聯(lián)網(wǎng)Web2.0 的興起,傳統(tǒng)的關(guān)系數(shù)據(jù)庫已經(jīng)顯得力不從心,因此NoSQL非關(guān)系型數(shù)據(jù)庫開始流行。[1]技術(shù)上的革新使得數(shù)據(jù)的獲取、儲存和分析變得更加容易,而人類的數(shù)據(jù)每天都在保持海量式的增長,大量數(shù)據(jù)的產(chǎn)生使數(shù)據(jù)處理變得十分必要,通過數(shù)據(jù)的分析與管理,可以實現(xiàn)我們的很多目標,數(shù)據(jù)來源越可靠,數(shù)據(jù)量越多,得到的答案就越準確,各行各業(yè)已開始普遍運用大數(shù)據(jù)。
國外學者很早就對大數(shù)據(jù)的特點做了研究:Yang[2]認為大數(shù)據(jù)與數(shù)據(jù)無關(guān),大數(shù)據(jù)側(cè)重的是一整套分析大量快速增加的數(shù)據(jù)的方法。Ben[3]研究了大數(shù)據(jù)的基本特性,分別是:Volume(大量)、Velocity(高速)、Veracity(多樣)、Verification(可靠)和Value(價值),同時,他還認為大數(shù)據(jù)的應(yīng)用有三個階段,分別是:數(shù)據(jù)收集、數(shù)據(jù)分析和數(shù)據(jù)應(yīng)用。Manyika,Chui and Brown[4]研究了2000—2008 年美國不同產(chǎn)業(yè)應(yīng)用大數(shù)據(jù)的排名,以及大數(shù)據(jù)的應(yīng)用與各自產(chǎn)業(yè)生產(chǎn)率之間的關(guān)系,發(fā)現(xiàn)在咨詢服務(wù)業(yè)、金融業(yè)、健康醫(yī)療和石油業(yè)使用大數(shù)據(jù)能極大地提高行業(yè)的生產(chǎn)率(見圖1)。
現(xiàn)代職業(yè)教育不僅需要利用大數(shù)據(jù),而且其自身也產(chǎn)生了大數(shù)據(jù)。特別是隨著精品資源課、MOOC、微課和虛擬仿真實驗等信息化教學手段的普及,職業(yè)院校能利用和產(chǎn)生的大數(shù)據(jù)呈現(xiàn)指數(shù)級增長。參考Daniel and Butson[5]設(shè)計的高等教育大數(shù)據(jù)框架圖,考慮到我國職業(yè)教育的特點,筆者設(shè)計出了我國職業(yè)院校的數(shù)據(jù)庫框架圖(見圖2),其數(shù)據(jù)庫可以分為:行政部門數(shù)據(jù)庫、學生數(shù)據(jù)庫、教師數(shù)據(jù)庫、課程數(shù)據(jù)庫、科研數(shù)據(jù)庫和實習就業(yè)數(shù)據(jù)庫。這些數(shù)據(jù)庫的數(shù)據(jù)來源大致表現(xiàn)為:財務(wù)數(shù)據(jù)、人事數(shù)據(jù)、教務(wù)數(shù)據(jù)、新生入學的信息采集、選課和考勤、信息化教學、科研統(tǒng)計和就業(yè)率等。各數(shù)據(jù)庫是互聯(lián)互通的,以此實現(xiàn)對數(shù)據(jù)的高效傳遞、對學校工作的過程化管理和基于數(shù)據(jù)的科學化決策。
圖1 大數(shù)據(jù)的特點和應(yīng)用
圖2 職業(yè)院校的數(shù)據(jù)庫框架圖
大數(shù)據(jù)在職業(yè)教育的應(yīng)用是一個系統(tǒng)工程,包含多個子數(shù)據(jù)庫的建設(shè)和各部門數(shù)據(jù)的互聯(lián)互通。筆者以其中最重要的部分,即教學為例,進行大數(shù)據(jù)的應(yīng)用設(shè)計。在教學系統(tǒng)使用大數(shù)據(jù)技術(shù),首先可以實現(xiàn)數(shù)據(jù)的共享,使職業(yè)教育突破傳統(tǒng)校園的限制,將課堂教育變?yōu)榫€上教育,將學生群體擴大為在線學習者,同時還能兼顧教學效率和教育公平;其次可以實現(xiàn)教學的過程化管理,不僅可以豐富教學內(nèi)容和教學手段,還可以對每一個學習者的學習過程和學習效果進行監(jiān)控、管理和反饋;最后可以實現(xiàn)教學精準反饋,基于數(shù)據(jù)的分析可以讓教師掌握每一個學習者的學習狀態(tài),教師在進行教學決策和調(diào)整教學策略時將變得更加精準。
對于大數(shù)據(jù)在高校教學中應(yīng)實現(xiàn)的目標,Li and Zhai[6]認為,高校教學不能僅僅停留在電子化教學的階段,還應(yīng)該包含教學和實踐活動的數(shù)據(jù)捕捉、記錄和模擬,同時還要打破數(shù)據(jù)記錄和數(shù)據(jù)分析的鴻溝。參考這一思路,筆者設(shè)計了職業(yè)院校教學系統(tǒng)的大數(shù)據(jù)應(yīng)用(見圖3),整個系統(tǒng)分為四大系統(tǒng):
1.評估系統(tǒng)
評估系統(tǒng)包含了課程資源、教學互動、在線考勤、在線考試、隨機點名、在線作業(yè)、調(diào)查問卷、投票、在線提問、虛擬實訓、自動記錄等模塊,這些模塊將貫穿在學生課前預習—課中教學—課堂實訓—課后測試的過程中,在整個過程中,學生和教師會利用現(xiàn)有數(shù)據(jù),并產(chǎn)生新的數(shù)據(jù)。
2.數(shù)據(jù)采集系統(tǒng)
前面系統(tǒng)產(chǎn)生的所有數(shù)據(jù),將會被數(shù)據(jù)采集系統(tǒng)捕捉、整合、轉(zhuǎn)換和儲存。有些數(shù)據(jù)可能是垃圾數(shù)據(jù)或無效信息,有些數(shù)據(jù)可能還隱藏在深處,需要進一步挖掘。為保證采集數(shù)據(jù)的質(zhì)量,需要選擇可靠的數(shù)據(jù)采集技術(shù),對大數(shù)據(jù)進行過濾和挖掘。
3.分析系統(tǒng)
分析系統(tǒng)在整個系統(tǒng)中起著十分重要的作用,前期采集的數(shù)據(jù)需要在這個系統(tǒng)中分析和處理。分析子系統(tǒng)應(yīng)該包含一個標準的數(shù)據(jù)庫和一個結(jié)果數(shù)據(jù)庫。標準數(shù)據(jù)庫是參考系,通過將結(jié)果數(shù)據(jù)庫的數(shù)據(jù)與標準數(shù)據(jù)庫的數(shù)據(jù)做對比,可以得出相關(guān)結(jié)論。結(jié)果數(shù)據(jù)庫應(yīng)該包含兩類數(shù)據(jù):一類是不需要加工的直接數(shù)據(jù)(如分數(shù)、考勤),另一類是需要處理加工的間接數(shù)據(jù)(如上課的態(tài)度、小組角色)。后一類數(shù)據(jù)需要通過一定的技術(shù)進行數(shù)據(jù)挖掘和加工才能跟標準數(shù)據(jù)庫的數(shù)據(jù)做對比和分析。
4.反饋系統(tǒng)
反饋系統(tǒng)包含了課前教學診斷、課中教學診斷和課后教學診斷三大模塊,通過可視化的手段進行反饋。課前教學診斷可以通過課前的預習測試等實現(xiàn);課中的教學診斷可以通過隨機提問等實現(xiàn);課后的教學診斷可以通過課后作業(yè)等實現(xiàn)。通過診斷,相關(guān)信息將以可視化的方式及時地傳輸給師生,可視化的方式可以是電子評估報告等形式。師生在得到這些診斷數(shù)據(jù)后,可以基于數(shù)據(jù)做出對自己最優(yōu)的決策,比如教師是否要降低教學難度,學生是否要花更多時間進行預習等。
為實現(xiàn)圖3 中的設(shè)計,必須明確整個教學系統(tǒng)中數(shù)據(jù)流的流向,為此設(shè)計了職業(yè)院校大數(shù)據(jù)教學的數(shù)據(jù)流程圖(見圖4)?,F(xiàn)代職業(yè)教育的特色在于,其教學除了傳統(tǒng)的課堂教學外,還安排有大量的實訓教學和頂崗實習。在數(shù)據(jù)流的流向上,必須將這些課堂內(nèi)和課堂外學習活動的數(shù)據(jù)全部進行收集。同時為滿足未來職業(yè)教育對大數(shù)據(jù)的高速傳輸、高速儲存和高速處理的需要,建立云計算平臺是必不可少的。
圖3 職業(yè)院校教學系統(tǒng)的大數(shù)據(jù)應(yīng)用設(shè)計
圖4 職業(yè)院校大數(shù)據(jù)教學的數(shù)據(jù)流程圖
職業(yè)院校大數(shù)據(jù)教學的數(shù)據(jù)流程圖包含五個數(shù)據(jù)流向:教師對學生進行教學;教學過程中產(chǎn)生的數(shù)據(jù)被捕捉、挖掘和存儲;課堂教學及實訓實習的數(shù)據(jù)被保存于數(shù)據(jù)庫和云系統(tǒng);大數(shù)據(jù)通過數(shù)據(jù)庫和云系統(tǒng)進行篩選、分析和預測;教師在獲得分析和預測結(jié)果后,對教學進行評估和改進。
1.云計算與大數(shù)據(jù)相結(jié)合
有研究表明,人類所產(chǎn)生的數(shù)據(jù)量每兩年就會翻倍,[7]隨著時間的發(fā)展,各職業(yè)院校數(shù)據(jù)中心的存儲容量和處理能力將很難滿足大數(shù)據(jù)的應(yīng)用需求。而云計算能將計算任務(wù)分布在大量計算機構(gòu)成的資源池上,使各種應(yīng)用系統(tǒng)能根據(jù)需求獲取計算能力、存儲空間和各種軟件服務(wù),[8]這種超大規(guī)模、高擴展性和高可靠性的特點必將使其在未來廣泛應(yīng)用于職業(yè)院校。
2.數(shù)據(jù)存儲與數(shù)據(jù)分析并重
當前,我國職業(yè)教育在應(yīng)用大數(shù)據(jù)時,普遍比較重視數(shù)據(jù)的共享、獲取和存儲,但是忽視了數(shù)據(jù)的分析和預測,產(chǎn)生了數(shù)據(jù)存儲與數(shù)據(jù)分析的鴻溝,這使得大數(shù)據(jù)應(yīng)用于職業(yè)教育的效果大打折扣。大量數(shù)據(jù)的存儲必須進過篩選和分析才能為師生提供可視化的反饋,從而改進學校的辦學質(zhì)量??梢灶A期,未來職業(yè)教育在應(yīng)用大數(shù)據(jù)時會從簡單的數(shù)據(jù)收集和存儲變?yōu)楦訌娬{(diào)數(shù)據(jù)的挖掘和分析,在這個過程中,數(shù)據(jù)分析軟件和技術(shù)將得到重視。
1.網(wǎng)絡(luò)與數(shù)據(jù)安全
大數(shù)據(jù)在我國職業(yè)教育中的應(yīng)用處于起步階段,很多職業(yè)院校并沒有為數(shù)據(jù)的搜集、存儲和使用建立專門的規(guī)章制度和管理辦法。Slade and Prinsloo[9]指出很多高等教育機構(gòu)只是建立了常規(guī)的知識產(chǎn)權(quán)保護和數(shù)據(jù)隱私保護政策,這些政策不足以應(yīng)付大數(shù)據(jù)時代的挑戰(zhàn)。例如在我國,隨著線上教學的普遍開展,部分線上教學軟件不斷爆出安全問題,有的是因為學校內(nèi)部監(jiān)控疏忽或內(nèi)部人員人為導致,有的則是黑客攻擊所致。如何從外部防御威脅,從內(nèi)部加強風險控制,使數(shù)據(jù)能追責溯源是亟待解決的問題。
2.數(shù)據(jù)的質(zhì)量
大數(shù)據(jù)給職業(yè)教育帶來的影響完全取決于所搜集的數(shù)據(jù)的質(zhì)量,而收集高質(zhì)量的數(shù)據(jù)并不容易:首先,衡量職業(yè)院校辦學模式和人才質(zhì)量的很多數(shù)據(jù)并不是簡單的數(shù)字,而是結(jié)構(gòu)性的數(shù)據(jù),需要進一步處理才能使用;其次,收集而來的數(shù)據(jù)有時候是垃圾數(shù)據(jù)和無效信息,需要進一步篩選,有時候也會出現(xiàn)數(shù)據(jù)的丟失;最后,高校內(nèi)部部門眾多,而數(shù)據(jù)的收集和處理需要跨越多個部門,這使得協(xié)調(diào)與合作變得費時。對于高等教育數(shù)據(jù)的質(zhì)量問題,國外學者也做了相關(guān)研究,其中Becker[10]指出,高校數(shù)據(jù)的收集需要三個層面的交互:地點、樣本和時效,這三個層面會影響數(shù)據(jù)的質(zhì)量;Daniel and Butson 認為,大數(shù)據(jù)在高校內(nèi)部的增長速度是非常快的,而且形式多樣,而且很多是跨部門的數(shù)據(jù),這使得數(shù)據(jù)的回溯和整合非常困難。[5]
大數(shù)據(jù)與職業(yè)教育相結(jié)合是不可避免的趨勢,在職業(yè)教育中合理地設(shè)計和應(yīng)用大數(shù)據(jù),將會使職業(yè)院校在人才培養(yǎng)、辦學模式和決策水平上產(chǎn)生正面效應(yīng)。大數(shù)據(jù)在職業(yè)教育中的應(yīng)用屬于系統(tǒng)工程,其建設(shè)和使用涉及多個部門和多個子系統(tǒng),在應(yīng)用流程上包含了數(shù)據(jù)的搜集和存儲、數(shù)據(jù)的挖掘和分析,以及基于數(shù)據(jù)的決策和反饋,較為復雜。然而,大數(shù)據(jù)在我國職業(yè)教育中的應(yīng)用目前還處于起步階段,要探索的問題還很多,例如怎樣使云計算與大數(shù)據(jù)相結(jié)合、怎樣進行有效的數(shù)據(jù)分析、網(wǎng)絡(luò)安全如何保護、如何提高數(shù)據(jù)質(zhì)量等。對這些問題的研究將有力地推動我國職業(yè)教育的發(fā)展。