張力瑋 郭偉
編者按:2018年4月13日,教育部印發(fā)《教育信息化2.0行動計劃》,提出要實施“教育治理能力優(yōu)化行動”,充分利用云計算、大數(shù)據(jù)、人工智能等新技術,構建全方位、全過程、全天候的支撐體系,助力教育、管理和服務的改革發(fā)展。為了解大數(shù)據(jù)在教育領域的應用情況及發(fā)展?jié)摿?,本刊對首都師范大學遠程教育研究所所長、數(shù)字化學習實驗室主任方海光教授進行了專訪。方海光教授兼任國家新聞出版廣電總局融合發(fā)展重點實驗室學術委員會主任、北京師范大學智慧學習研究院智慧學習首席研究員。
一、教育大數(shù)據(jù)是整個教育活動過程中
所產(chǎn)生的以及根據(jù)教育需要采集到的、
一切用于教育發(fā)展并可創(chuàng)造巨大潛在
價值的數(shù)據(jù)集合
《世界教育信息》:尊敬的方海光教授,您好!很高興您能接受我們的專訪。首先,請您談談什么是教育大數(shù)據(jù)。
方海光:大數(shù)據(jù)理念的傳播逐漸使其不再是“象牙塔”中的雕塑,也不再是信息技術(IT)精英們追蹤的并行算法的優(yōu)化,更不再是創(chuàng)業(yè)咖啡廳中談論的話題,今天的大數(shù)據(jù)的范疇和理解越來越普適化和大眾化,甚至最初提出大數(shù)據(jù)概念的企業(yè)和精英們都會愕然其遠遠“漂移”出最初他們的設想和規(guī)劃。這樣的發(fā)展就是最正確的發(fā)展方向,因為大數(shù)據(jù)在逐漸落地,逐漸走入大眾的生活,我們對大數(shù)據(jù)的理解也不再拘泥于初始的研究和技術的限制,經(jīng)過不斷的實踐總結而遵循的實事求是和與時俱進,才是理解大數(shù)據(jù)的最好出發(fā)點。
實際上,大數(shù)據(jù)被認為不僅僅是一種技術,也是一種能力,即從海量復雜的數(shù)據(jù)中尋找有意義關聯(lián)、挖掘事物變化規(guī)律、準確預測事物發(fā)展趨勢的能力;同時,它更是一種嶄新的思維方式,即讓數(shù)據(jù)開口說話,讓數(shù)據(jù)成為人類思考問題、決策行為的基本出發(fā)點。大數(shù)據(jù)經(jīng)過互聯(lián)網(wǎng)特別是移動互聯(lián)網(wǎng)的加速發(fā)展,正在演變?yōu)橐环N社會文化方式,即人人生產(chǎn)數(shù)據(jù)、人人共享數(shù)據(jù)、人人熱愛數(shù)據(jù)、人人管理數(shù)據(jù)的方式——這種文化正在潛移默化地影響著各個行業(yè)。教育領域雖然長期“保守”,但在大數(shù)據(jù)文化的沖擊下,總有一些先知先覺勇于創(chuàng)新的組織和學校在加速走向開放、執(zhí)著相信并熱烈擁抱大數(shù)據(jù)。
簡單地說,我們認為目前國內(nèi)外對教育大數(shù)據(jù)有兩種基本的定義,雖然界限不是特別的清晰,但是兩種定義的出發(fā)點對實踐的指導意義是完全不同的。
第一種教育大數(shù)據(jù)的定義是指大數(shù)據(jù)應用在教育行業(yè)中,可以翻譯為“Big Data in Education”(簡稱為BDE)。這種定義特指教育領域應用大數(shù)據(jù)技術和方法,它強調(diào)了大數(shù)據(jù)及大數(shù)據(jù)技術在教育行業(yè)中的應用,是一種技術引導教育變革的基本想法。
第二種教育大數(shù)據(jù)的定義是指教育行業(yè)中的大數(shù)據(jù),可以翻譯為“Educational Big Data”(簡稱為EBD)。這種定義特指教育領域的大數(shù)據(jù),即教育和學習過程中所伴隨的各類數(shù)據(jù)的總稱,它強調(diào)了教育行業(yè)本身特有的大數(shù)據(jù)帶來的新方法,是一種通過教育應用技術解決問題的基本想法。
無論是哪一種定義,教育大數(shù)據(jù)的根本目標是一致的,即整個教育活動過程中所產(chǎn)生的以及根據(jù)教育需要采集到的、一切用于教育發(fā)展并可創(chuàng)造巨大潛在價值的數(shù)據(jù)集合。教育大數(shù)據(jù)直接產(chǎn)生于各種教育活動(教學活動、管理活動、科研活動、校園活動等),每個教育利益相關者既是教育數(shù)據(jù)的生產(chǎn)者也是教育數(shù)據(jù)的消費者。
教育大數(shù)據(jù)具有明確的目標指向性,即指向教育發(fā)展,能在提升教育質量、促進教育公平、實現(xiàn)個性化學習、優(yōu)化教育資源配置、輔助教育科學決策等方面發(fā)揮有效作用。通過研究,我們認為,(教育大數(shù)據(jù)不僅僅是大數(shù)據(jù)在教育領域的應用;而是通過教育領域反向驅動大數(shù)據(jù)技術分化為獨立的分支),從而帶來了對傳統(tǒng)教育技術領域長期研究問題的新解決途徑,甚至可以跨越傳統(tǒng)個性化學習的精確邏輯推理過程而直接分析全樣本學習者特征。這樣來促進教育管理科學化變革、促進教學模式改革、促進個性化教育變革、促進教育評價體系改革、促進科學研究變革等。
二、教育大數(shù)據(jù)是指全學習過程數(shù)據(jù)、
教育大數(shù)據(jù)系統(tǒng)、共建共享思想
《世界教育信息》:那么,教育大數(shù)據(jù)可以分成幾個層面進行理解?
方海光:我們認為,無論是教育管理部門,還是校長、教師,以及學生和家長,都可以通過教育大數(shù)據(jù)獲得針對不同應用的個性化分析報告。通過教育大數(shù)據(jù)的分析來優(yōu)化教育機制,做出更科學的決策,這將帶來潛在的教育革命。誰能在其中把握好大數(shù)據(jù),誰就能在將來的競爭中贏得主動權。
一方面,在數(shù)字化課堂教學過程中,可以對學習過程進行數(shù)據(jù)形式化采集和描述,并基于課堂單元和學期單元進行學習過程的大數(shù)據(jù)挖掘和分析。教師通過這些數(shù)據(jù)和分析結果,可以即時進行教學控制和教學反思,從而提高課堂教學水平。學習者通過這些數(shù)據(jù)和分析結果,也可以盡快發(fā)現(xiàn)自己學習中的不足,進而提高學習水平。
另一方面,對于不同層面的決策者,教育大數(shù)據(jù)都會帶來驚喜。對于教育行政部門、學校而言,教育大數(shù)據(jù)將幫助他們在管理行為上做出更加科學而非經(jīng)驗判斷式的決策;對于教育研究者來說,他們能夠重新審視學生的需求,通過高新的技術以及細致的分析,探究怎樣的課程、課堂、教師能夠更加吸引學生;對于學生而言,新技術能夠解放他們本來就有的學習能力和天分,人力資本將成倍地增長。
總之,教育大數(shù)據(jù)將讓學習變成一種服務。我們對教育大數(shù)據(jù)有三個層次的理解:第一個層次,教育大數(shù)據(jù)是指全學習過程數(shù)據(jù);第二個層次,教育大數(shù)據(jù)是指教育大數(shù)據(jù)系統(tǒng);第三個層次,教育大數(shù)據(jù)是指共建共享思想。
也就是說,教育大數(shù)據(jù)是面向教育全過程的多種類型的全樣本的數(shù)據(jù)集合。教育大數(shù)據(jù)不僅是分析全過程學習數(shù)據(jù),還是建設教育大數(shù)據(jù)中心,更是一種共享的生態(tài)思想。
教育大數(shù)據(jù)和大數(shù)據(jù)一樣同樣具有4V特性①,傳統(tǒng)數(shù)據(jù)收集方法注重收集結構化數(shù)據(jù)(如學籍、財務、分數(shù)等),而常常忽略非結構化數(shù)據(jù)(如環(huán)境信息、個人化信息等)和一些暗含著數(shù)據(jù)的資源。與用傳統(tǒng)方法收集的教育數(shù)據(jù)相比,教育大數(shù)據(jù)有更強的實時性、連續(xù)性、綜合性和自然性,并使用不同的應用程序來分析和處理不同復雜程度和深度的數(shù)據(jù)。傳統(tǒng)教育數(shù)據(jù)收集的大多是階段性的數(shù)據(jù),而且大多在用戶知情的情況下收集,使用的分析方法也通常是簡單的統(tǒng)計分析方法。教育大數(shù)據(jù)收集的是整個教育教學過程中靜態(tài)和動態(tài)的所有數(shù)據(jù),可以在不影響教師和學生活動的情況下,連續(xù)記錄整個教學活動的所有數(shù)據(jù),如教學資料、互動反映和學生在每個知識點上停留的時間等。
教育大數(shù)據(jù)應用是一個生態(tài)環(huán)境,有提供技術的,有提供分析的。在技術產(chǎn)品之外,教育大數(shù)據(jù)的生態(tài)環(huán)境推廣模式也十分重要,如何與教育信息化建設相對接,如何與智慧教育相融合,這些都是亟待考慮的問題?;诮逃髷?shù)據(jù)的思想,可以產(chǎn)生一種不同于商業(yè)互聯(lián)網(wǎng)的模式,一種能夠平衡教育和技術使用的模式,特別是未來可以考慮的是數(shù)據(jù)分享、共建共享的模式。
教育資源的信息化共建共享,就是要通過互聯(lián)網(wǎng)把教育資源進行數(shù)據(jù)整合和優(yōu)化配置,讓優(yōu)質教育資源形成一種流動的良性循環(huán),讓分享和貢獻資源的渠道越來越多,讓學習資源發(fā)揮的效用越來越大,受用地域和受用人群越來越廣,最終形成一個互通有無、交流共享、共同提升的教育資源信息化共建共享群體生態(tài)環(huán)境。在這個群體生態(tài)環(huán)境中,學習者可以通過文字、圖片、音視頻等不同方式實現(xiàn)知識學習的目的,教學者可以通過多元數(shù)據(jù)庫工具、遠程教學平臺、多媒體教學設備實現(xiàn)教學管理的目的,并形成教育大數(shù)據(jù)支撐的個人學習反饋、學習中心匯聚分析、教育治理共享決策,從而構建更加人性化、個性化的交互式網(wǎng)絡學習環(huán)境,使得整體教育大數(shù)據(jù)生態(tài)環(huán)境良性發(fā)展起來。
三、教育數(shù)據(jù)挖掘技術、學習分析技術、
數(shù)據(jù)可視化技術、決策支持技術
是教育大數(shù)據(jù)的關鍵技術
《世界教育信息》:教育大數(shù)據(jù)存在哪些關鍵技術?
方海光:2012年,美國聯(lián)邦教育部發(fā)布了題為《通過教育數(shù)據(jù)挖掘和學習分析技術來提高教與學:問題簡述》的報告。該報告特別強調(diào)了教育數(shù)據(jù)挖掘和學習分析技術兩大類技術應用。根據(jù)該報告的觀點,在采集和處理教育數(shù)據(jù)后,就要對其進行深度價值挖掘,這里主要用的是教育數(shù)據(jù)挖掘和學習分析,之后教育大數(shù)據(jù)的需求和發(fā)展越來越系統(tǒng)化了。隨著近些年教育大數(shù)據(jù)積累、分析和挖掘應用增多,諸多新的主題成為發(fā)展的關鍵技術,例如:數(shù)據(jù)如何呈現(xiàn),數(shù)據(jù)如何進行科學治理,數(shù)據(jù)如何變現(xiàn),數(shù)據(jù)如何剖析。其中,數(shù)據(jù)可視化技術和決策支持系統(tǒng)也伴隨著教育大數(shù)據(jù)的發(fā)展成為主要關鍵技術之一。因此,我們認為目前教育大數(shù)據(jù)的關鍵技術主要包括四類:教育數(shù)據(jù)挖掘技術、學習分析技術、數(shù)據(jù)可視化技術、決策支持技術。
第一,教育數(shù)據(jù)挖掘技術是一個將來自各教育系統(tǒng)的原始數(shù)據(jù)轉換為有用信息的過程,這些有用信息可為教師、學生、家長、教育研究人員以及教育軟件系統(tǒng)開發(fā)人員所利用。傳統(tǒng)教育數(shù)據(jù)挖掘的多是結構化、單一對象的小數(shù)據(jù)集,其挖掘更側重根據(jù)先驗知識預先人工建立模型,然后依據(jù)既定模型進行分析。對于非結構化、多源異構的教育大數(shù)據(jù)集的分析,往往缺乏先驗知識,很難建立顯式的數(shù)學模型,這就需要發(fā)展更加立體化、全息高維的數(shù)據(jù)挖掘方法與技術。
第二,學習分析技術是指通過測量、收集、分析、匯報學習者和他們所處環(huán)境的數(shù)據(jù),以理解和優(yōu)化學習以及學習發(fā)生的環(huán)境。學習分析和教育數(shù)據(jù)挖掘密切相關,應用的分析方法也較為相似。學習分析是綜合運用信息科學、社會學、計算機科學、心理學和學習科學的理論和方法,通過對廣義教育大數(shù)據(jù)的處理和分析,利用已知模型和方法去解釋影響學習者學習的重大問題,評估學習者學習行為,并為學習者提供人為的適應性反饋。例如,教師和學校根據(jù)學習分析的結果,調(diào)整教學內(nèi)容、對有學習失敗風險的學生進行干預等。學習分析一般包括數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)分析、數(shù)據(jù)表示和應用服務五個環(huán)節(jié)。
第三,數(shù)據(jù)可視化是關于圖形或圖形格式的數(shù)據(jù)展示。在一個連貫而簡短的報告中體現(xiàn)大量的信息。數(shù)據(jù)可視化不僅涉及數(shù)據(jù)的使用,而且能可視化各種各樣的信息,你可以將自己的想法、猜想與他人交流。人類已經(jīng)使用數(shù)據(jù)可視化技術很長一段時間了,圖像和圖表已被證明是一種有效的方法來進行新信息的傳達與教學。信息的視覺化表達是一種古老的分享創(chuàng)意與體驗的方法。圖表和地圖是一些早期數(shù)據(jù)可視化技術的重要例證。有研究表明,80%的人還記得他們所看到的,但只有20%的人記得他們所閱讀的。數(shù)據(jù)可視化甚至可以把思想和事件傳給后代。技術的發(fā)展進一步提高了數(shù)據(jù)可視化帶給人們的機遇。
數(shù)據(jù)可視化的最重要益處是能夠幫助人們更快地理解數(shù)據(jù)。你可以在一個圖表中突出顯示一個大的數(shù)據(jù)量,并且人們可以快速地發(fā)現(xiàn)關鍵點。如果以書面形式呈現(xiàn),那么可能需要數(shù)小時來分析所有的數(shù)據(jù)及聯(lián)系。
此外,有效展示巨量數(shù)據(jù)的能力是數(shù)據(jù)可視化的另一個優(yōu)點。一張圖表可能會突出顯示一些不同的事項,人們可以在數(shù)據(jù)上形成不同的意見。這自然能為商業(yè)開辟新的途徑。人們或許能從數(shù)據(jù)中發(fā)現(xiàn)一些意想不到的東西。數(shù)據(jù)的可視化展示,提高了解釋信息的能力。從海量的數(shù)據(jù)和信息中尋找聯(lián)系并不容易,但是圖形和圖表可以在幾秒內(nèi)提供信息,一望便知。
第四,傳統(tǒng)的決策支持技術是輔助決策者通過數(shù)據(jù)、模型和知識,以人機交互方式進行半結構化或非結構化決策的計算機應用系統(tǒng)。它是管理信息系統(tǒng)向更高一級發(fā)展而產(chǎn)生的先進信息管理系統(tǒng)。它為決策者提供分析問題、建立模型、模擬決策過程和方案的環(huán)境,調(diào)用各種信息資源和分析工具,幫助決策者提高決策水平和質量。而教育決策支持技術則主要是利用分析模型分析教育管理信息系統(tǒng)里所有的教育大數(shù)據(jù),為教育決策者提供一些備選方案,以提高教育政策的質量,進行有效的計劃評價和監(jiān)督的技術應用。
四、技術挑戰(zhàn)和倫理道德、數(shù)據(jù)安全
和知識產(chǎn)權方面的挑戰(zhàn)需要進一步克服
《世界教育信息》:您認為在教育大數(shù)據(jù)發(fā)展的過程中,面臨哪些挑戰(zhàn)?
方海光:雖然教育大數(shù)據(jù)處于高速發(fā)展階段,很多技術還會層出不窮地從各個方面支持教育大數(shù)據(jù)發(fā)展,使得教育大數(shù)據(jù)呈現(xiàn)出各種特色應用和成果,但是,教育大數(shù)據(jù)還面臨諸多挑戰(zhàn)。
一方面,教育大數(shù)據(jù)在整體發(fā)展和實際應用過程中還存在很多技術挑戰(zhàn)。如:如何平衡學生的發(fā)展不確定性和教育大數(shù)據(jù)決策的指向性;如何平衡學習規(guī)律的研究和學生個人數(shù)據(jù)的隱私性;如何在數(shù)據(jù)采集、數(shù)據(jù)挖掘及學習分析的重要環(huán)節(jié)把握好數(shù)據(jù)源的真正內(nèi)涵;面對海量教育數(shù)據(jù),數(shù)據(jù)的存儲、處理和分析都存在技術挑戰(zhàn);另外,由于目前沒有統(tǒng)一的數(shù)據(jù)規(guī)范,不同系統(tǒng)之間的兼容也是一大問題。從全局考慮,我國的教育大數(shù)據(jù)系統(tǒng)應遵循頂層設計原則,由國家對數(shù)據(jù)格式、數(shù)據(jù)存儲等問題制定統(tǒng)一規(guī)范,下級企業(yè)、學校按照統(tǒng)一規(guī)范去設計自己的系統(tǒng),這樣可以從全局高度最大化地節(jié)省國家資源,這也帶來了更多的新的技術挑戰(zhàn)。
另一方面,教育大數(shù)據(jù)還存在倫理道德、數(shù)據(jù)安全和知識產(chǎn)權方面的挑戰(zhàn)。教育大數(shù)據(jù)關系著學習者和教育工作者的隱私權,其潛在的安全隱患無法用常用辦法評估,甚至無法通過獨立的方法進行評估。如果教育大數(shù)據(jù)處理不當,將導致嚴重的安全漏洞,甚至會影響區(qū)域教育政策的制定。此外,數(shù)據(jù)的權屬問題不是傳統(tǒng)的財產(chǎn)、知識產(chǎn)權等可以涵蓋的,數(shù)據(jù)可能成為國家間爭奪的資源。教育大數(shù)據(jù)是一種無形資產(chǎn),國家和教育部門不僅應當保障教育大數(shù)據(jù)不外泄、不被惡意使用,而且還要兼顧部分數(shù)據(jù)向公眾開放,發(fā)揮數(shù)據(jù)應用的社會價值。
五、教育大數(shù)據(jù)應用前景廣闊,
精準教育、精準教學、個性學習
必將給教育帶來根本性的變化
《世界教育信息》:在教育發(fā)展的新時代,教育大數(shù)據(jù)有哪些典型應用?
方海光:我們在日常生活中已經(jīng)習慣了一些教育大數(shù)據(jù)應用的場景。比如,在一個亞馬遜的學習網(wǎng)站,研究者可以通過大數(shù)據(jù)分析學習者在學哪一章節(jié),“你可以了解到他是否在回過頭再看之前的章節(jié),或者他在哪一個章節(jié)看的時間更多等”。教學者可以通過對學習者行為的分析,改善教材、改善學生學習的方法,使學生在整個教育環(huán)境中有更好的發(fā)展。
在個性化英語教育領域,傳統(tǒng)上教師需要花費大量時間分析個體學生的學情動態(tài),逐一制定相應的教學解決方案,因此,備課時間和教學成本較高。但“教育大數(shù)據(jù)”讓這一切變得更簡單了。以培生集團最新出版的全球少兒美語旗艦課程“Big English”為例,這套課程引入了首款應用于少兒英語學習領域的“My English Lab”在線學習輔導系統(tǒng),應用大數(shù)據(jù)技術全程實時分析學生個體和班級整體的學習進度、學情反饋和階段性成果,從而及時找到問題所在,對癥下藥,實現(xiàn)對學習過程和結果的動態(tài)管理。
近期以來,一個名為“Knewton”的自適應學習平臺逐漸被人們所熟知,它集數(shù)據(jù)科學、統(tǒng)計學、心理測量、內(nèi)容繪圖和機器學習于一身,旨在最大限度地實現(xiàn)個性化。平臺可以對學生的學習表現(xiàn)和活動完成質量給予及時反饋,以在正確的時間、基于正確的內(nèi)容提供合適的學習指導,來最大化學生獲得學習內(nèi)容的可能性;同時,基于給定活動的完成情況,自適應學習系統(tǒng)應能持續(xù)性地逐步引導學生進入下一個活動。“Knewton”系統(tǒng)無論最終成功與否,它都已成為教育大數(shù)據(jù)具體應用的一個典型自適應學習案例,具有很好的參考意義。
北京市在霧霾紅色預警期間,市教委提出中小學“停課不停學”,對于自覺和主動性較弱的基礎教育階段的學生來說,自學和家庭輔導英語有一定困難,教師教學也面臨挑戰(zhàn)。由于大數(shù)據(jù)時代在容量、速度、多樣性和價值等方面的突出特點,不僅為廣大師生提供海量資源,還可以提供個性化定制、學習行為記錄和課程詳情分析服務。大數(shù)據(jù)技術使得學習行為的記錄更加完整和精細化,它可以準確記錄每一位用戶使用學習資源的過程和細節(jié),例如:瀏覽資源的時間點、停留了多長時間、答對了多少道題、資源的回訪率等信息。教師可以通過這些大數(shù)據(jù)量化總體的學習狀況以及每個學生的學習進度,精準掌握總體和個體的學習情況和效果,從而調(diào)整自己的教學。教師可以利用大數(shù)據(jù)平臺在霧霾期間嘗試翻轉課堂,并結合大數(shù)據(jù)提供的信息進行教學分析及教學反思。
在學校大數(shù)據(jù)學情分析分級管理中,山西省太原十二中學通過全年級各班各學科教學情況、學生的學習情況,重新審視課堂和教學過程,為年級整體教育教學情況提供一個找出問題、分析問題、解決問題的依據(jù)。這樣的數(shù)據(jù)分析,不是為了評判一個教師的水平高或低、好或壞,而是要對教師的教學進行數(shù)據(jù)分析,幫助他們發(fā)現(xiàn)自己在教學中存在的問題,找出其所教授的不同班級的學習特點,不同學生的學習特點,以及所教授學科各知識點的落實情況,進一步提高教育的精準性,提高教師的教學效率和水平。
在學校大數(shù)據(jù)智慧治理決策中,遼寧省沈陽市第四十中學也在進行具有挑戰(zhàn)性的創(chuàng)新應用,將建校理念融入學校大數(shù)據(jù)平臺建設,將學生學習過程數(shù)據(jù)、測試數(shù)據(jù)、個人能力數(shù)據(jù)與學生畫像基礎數(shù)據(jù)進行綜合分析和挖掘,為學校教育教學科學決策、教師教學能力提升、學生個性化學習指導、家校協(xié)作共同體建設等多方面提供決策依據(jù),實現(xiàn)學??鐖鲇虻闹腔坌@建設新模式。
通過以上不同場景的應用案例,我們可以發(fā)現(xiàn)以往發(fā)現(xiàn)不了的教育教學規(guī)律,找到以往沒有辦法找到的學習薄弱環(huán)節(jié),解決以往教育教學過程中無法解決的問題,甚至可以指導教師更專業(yè)的職業(yè)成長,通過大數(shù)據(jù)跨場域整合實現(xiàn)深度融合的智慧校園創(chuàng)新特色應用。
因此,通過教育大數(shù)據(jù)帶來的精準教育、精準教學、個性學習必將給教育帶來根本性的變化,教育大數(shù)據(jù)讓教師的教學過程和學生的學習體驗變得更輕松、更有效。
注釋:
①4V特性指規(guī)模性(Volume)、多樣性(Varity)、高速性(Velocity)和價值性(Value)。
編輯 王昕 校對 許方舟