鄭慶華 董 博 錢步月 田 鋒 魏筆凡 張未展 劉 均
1(西安交通大學(xué)電子與信息工程學(xué)院 西安 710049)2(西安交通大學(xué)繼續(xù)教育學(xué)院 西安 710049)3(大數(shù)據(jù)算法與分析技術(shù)國(guó)家工程實(shí)驗(yàn)室(西安交通大學(xué)) 西安 710049)
教育信息化是信息化時(shí)代構(gòu)建學(xué)習(xí)型社會(huì)和終身學(xué)習(xí)體系的基本技術(shù)途徑,是《國(guó)家中長(zhǎng)期科學(xué)和技術(shù)發(fā)展規(guī)劃綱要(2006—2020)》和《國(guó)家中長(zhǎng)期教育改革和發(fā)展規(guī)劃綱要(2010—2020)》的戰(zhàn)略任務(wù)之一.回顧國(guó)內(nèi)外教育信息化的發(fā)展歷程,主要經(jīng)歷了數(shù)字化、網(wǎng)絡(luò)化、智能化3個(gè)階段的演進(jìn).
在20世紀(jì)70,80年代,隨著信息技術(shù),特別是個(gè)人電腦(PC)的出現(xiàn),國(guó)內(nèi)外首先出現(xiàn)了以計(jì)算機(jī)教育為著眼點(diǎn)的教育信息化熱潮.鄧小平同志在1984年的講話“計(jì)算機(jī)的普及要從娃娃抓起”深入人心.隨著信息技術(shù)發(fā)展與PC的進(jìn)一步普及,教育信息化進(jìn)入了教育資源數(shù)字化、教育管理信息化的時(shí)代,各種電化教育手段與電化教育館、廣播電視大學(xué)的出現(xiàn),正式標(biāo)志著教育信息化進(jìn)入了數(shù)字化時(shí)代.
20世紀(jì)90年代到本世紀(jì)初,隨著互聯(lián)網(wǎng)的高速發(fā)展,教育信息化逐步進(jìn)入了網(wǎng)絡(luò)化時(shí)代.遠(yuǎn)程教育、在線教育等網(wǎng)絡(luò)化教育手段成為了緩解教育數(shù)字鴻溝和教育公平問(wèn)題的重要途徑.1993年我國(guó)建成了中國(guó)教育與科研計(jì)算機(jī)網(wǎng)(Cernet);在國(guó)際上,Internet也在同一階段迅速成長(zhǎng)壯大,為開(kāi)展網(wǎng)絡(luò)化教育提供了重要的支撐平臺(tái).進(jìn)而,隨著智能終端與移動(dòng)互聯(lián)網(wǎng)的迅猛發(fā)展,具有4A特性(Anywhere,Anytime,Anyone,Anydevice)的移動(dòng)學(xué)習(xí),成為了網(wǎng)絡(luò)化時(shí)代教育信息化的主要特征之一.
2010年以后,隨著移動(dòng)互聯(lián)網(wǎng)、人工智能、云計(jì)算、大數(shù)據(jù)等技術(shù)的發(fā)展,教育信息化進(jìn)入了一個(gè)全新的階段,呈現(xiàn)出智能化、泛在化、個(gè)性化、開(kāi)放化、協(xié)同化的趨勢(shì).2011年大規(guī)模開(kāi)放在線課程(massive open online course, MOOC)在全球范圍內(nèi)推廣,隨之而來(lái)的是對(duì)教育信息化的智能需求與日俱增.人工智能與教育的深度融合已成為提升教育信息化發(fā)展水平和質(zhì)量的重要手段.2017年國(guó)務(wù)院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》中,明確指出“利用智能技術(shù)加快推動(dòng)人才培養(yǎng)模式、教學(xué)方法改革,構(gòu)建包含智能學(xué)習(xí)、交互式學(xué)習(xí)的新型教育體系.開(kāi)展智能校園建設(shè),推動(dòng)人工智能在教學(xué)、管理、資源建設(shè)等全流程應(yīng)用”,這標(biāo)志著教育信息化的智慧教育時(shí)代正式拉開(kāi)序幕.
智慧教育是指融合現(xiàn)代教育理論與大數(shù)據(jù)分析、人工智能等信息技術(shù)的新的教育信息化范式.當(dāng)前,國(guó)內(nèi)外對(duì)智慧教育尚未形成共識(shí),但是從不同角度指出了智慧教育應(yīng)具有的特點(diǎn).例如國(guó)內(nèi)學(xué)者祝智庭等人分析了“智慧”的內(nèi)涵,指出智慧教育中的學(xué)習(xí)時(shí)空環(huán)境應(yīng)具有感知、推理、輔助決策等智慧特性[1].楊現(xiàn)民則認(rèn)為智慧教育是依托新一代信息技術(shù)的物聯(lián)化、智能化、感知化、泛在化的教育信息生態(tài)系統(tǒng)[2].新加坡在iN2015計(jì)劃中明確了智慧教育的3個(gè)特點(diǎn),即泛在學(xué)習(xí)、交互式數(shù)字學(xué)習(xí)資源、適應(yīng)不同學(xué)習(xí)風(fēng)格的智能學(xué)習(xí)體驗(yàn)[3].
本文中,我們將智慧教育定義為基于新一代信息技術(shù)的教育信息化新范式,旨在通過(guò)教學(xué)、管理、評(píng)估、決策等教育全過(guò)程涉及的資源、行為、情境、管理等教育大數(shù)據(jù)進(jìn)行挖掘、分析、融合,建立具有智能導(dǎo)學(xué)、精準(zhǔn)推薦、精細(xì)評(píng)價(jià)等特點(diǎn)的學(xué)習(xí)生態(tài)系統(tǒng).
本文的貢獻(xiàn)主要有2個(gè)方面:
1) 在對(duì)國(guó)內(nèi)外智慧教育研究與應(yīng)用調(diào)研分析的基礎(chǔ)上,從3個(gè)層次建立了智慧教育的研究框架.最底層是教育大數(shù)據(jù)分析與挖掘,包括以教學(xué)行為等結(jié)構(gòu)化數(shù)據(jù)為對(duì)象的教育大數(shù)據(jù)分析,以及以非結(jié)構(gòu)化海量知識(shí)資源為對(duì)象的教育知識(shí)圖譜構(gòu)建,這是構(gòu)建智慧教育平臺(tái)的基礎(chǔ).中間層是針對(duì)教學(xué)中導(dǎo)學(xué)、推薦、答疑、評(píng)價(jià)等環(huán)節(jié)的4項(xiàng)關(guān)鍵技術(shù),包括學(xué)習(xí)路徑生成與導(dǎo)航、學(xué)習(xí)者畫像與個(gè)性化推薦、智能在線答疑以及精細(xì)化評(píng)測(cè).最上層則是主流的國(guó)內(nèi)外智慧教育平臺(tái).圍繞上述框架,對(duì)國(guó)內(nèi)外相關(guān)研究進(jìn)行對(duì)比分析,總結(jié)了其特點(diǎn)與存在的問(wèn)題.
2) 總結(jié)出當(dāng)前智慧教育研究4個(gè)方面的局限性.①如何應(yīng)對(duì)大規(guī)模學(xué)習(xí)者的在線輔導(dǎo);②如何對(duì)學(xué)習(xí)者、教師、環(huán)境等要素進(jìn)行精細(xì)化、全過(guò)程的評(píng)測(cè);③如何應(yīng)對(duì)有限認(rèn)知帶寬問(wèn)題導(dǎo)致的個(gè)體學(xué)習(xí)局限性;④如何通過(guò)分析教育大數(shù)據(jù)發(fā)現(xiàn)影響教學(xué)的潛在致因與規(guī)律.針對(duì)上述局限性,指出了智慧教育后續(xù)研究的4個(gè)方向,即在線智能學(xué)習(xí)助手技術(shù)、學(xué)習(xí)者智能評(píng)估指標(biāo)與方法、網(wǎng)絡(luò)化群體認(rèn)知模型以及教育大數(shù)據(jù)的因果關(guān)系發(fā)現(xiàn)方法.
結(jié)構(gòu)化的教育數(shù)據(jù)主要包括學(xué)習(xí)行為(如鼠標(biāo)點(diǎn)擊次數(shù)等)、學(xué)習(xí)效果(是否獲得證書等)以及學(xué)習(xí)者基本屬性(如年齡、性別等).近年來(lái),國(guó)內(nèi)外學(xué)者對(duì)大規(guī)模在線學(xué)習(xí)平臺(tái)(如Coursera,edX,Udacity等)的海量結(jié)構(gòu)化教育數(shù)據(jù)已開(kāi)展了分析研究工作.這些研究有助于揭示人類更深層次的認(rèn)知機(jī)理,挖掘有價(jià)值的學(xué)習(xí)規(guī)律與模式.當(dāng)前對(duì)教育數(shù)據(jù)的分析主要是相關(guān)性分析.相關(guān)性用于衡量變量間具有線性關(guān)系的程度,主要包括假設(shè)檢驗(yàn)、回歸分析等分析手段.
在假設(shè)檢驗(yàn)方面,典型研究工作如:Kizilcec等人[4]采用Fisher精確檢驗(yàn)對(duì)MOOC學(xué)習(xí)軌跡數(shù)據(jù)進(jìn)行了分析,并采用非監(jiān)督學(xué)習(xí)方法將學(xué)習(xí)模式分為Completing,Auditing,Disengaging,Sampling Learner四種類型,為理解在線學(xué)習(xí)者的學(xué)習(xí)持續(xù)性提供了依據(jù).Coetzee等人[5]也采用Fisher精確檢驗(yàn)分析了edX平臺(tái)上中“軟件工程”課程的行為數(shù)據(jù),發(fā)現(xiàn)學(xué)習(xí)者在論壇上的訪問(wèn)次數(shù)與學(xué)習(xí)成績(jī)之間存在正相關(guān)性.Wilkowski等人[6]采用T檢驗(yàn)分析了Google MOOC平臺(tái)上的行為數(shù)據(jù),發(fā)現(xiàn)了不同學(xué)習(xí)目標(biāo)下學(xué)習(xí)行為與課程完成率之間的相關(guān)性.
在回歸分析方面,典型研究工作如:Firmin等人[7]對(duì)3門MOOC課程進(jìn)行了邏輯回歸分析,發(fā)現(xiàn)學(xué)習(xí)者及格與否與個(gè)人努力程度相關(guān).Coffrin等人[8]根據(jù)學(xué)習(xí)者的交互數(shù)據(jù),運(yùn)用生存回歸方法對(duì)社交行為的中心度和課程學(xué)習(xí)的參與度進(jìn)行了分析,揭示了能夠預(yù)測(cè)MOOC學(xué)習(xí)流失率的顯著性指標(biāo).Ramesh等人[9]基于隨機(jī)邏輯回歸分析出學(xué)習(xí)持續(xù)性相關(guān)的行為特征,用以預(yù)測(cè)MOOC學(xué)習(xí)的完成率.He等人[10]采用邏輯回歸方法預(yù)測(cè)學(xué)生是否能完成課程學(xué)習(xí),并對(duì)邊界學(xué)生提供干預(yù).國(guó)內(nèi)蔣卓軒等人[11]結(jié)合邏輯回歸方法與相關(guān)圖方法分析Coursera上6門課程的學(xué)習(xí)行為數(shù)據(jù),挖掘出學(xué)習(xí)行為與學(xué)習(xí)間的相關(guān)性.
上述研究得到的相關(guān)性大都是類似“學(xué)習(xí)效果好壞與個(gè)人努力程度相關(guān)”的結(jié)論,對(duì)構(gòu)建當(dāng)前急需的智能化導(dǎo)學(xué)、推薦、評(píng)價(jià)等機(jī)制,還缺乏可操作性.而支撐這類機(jī)制的核心是在教育數(shù)據(jù)中蘊(yùn)含的因果關(guān)系.因果關(guān)系是指變量間的作用關(guān)系,一個(gè)變量的變化是由另一個(gè)變量觸發(fā).盡管相關(guān)性分析在因果關(guān)系挖掘中具有重要作用,但是相關(guān)性既非因果關(guān)系的必要條件,也非充分條件[12].與因果關(guān)系相比,相關(guān)性還很難作為決策的依據(jù).
隨著Linking Open Data等項(xiàng)目的全面展開(kāi),語(yǔ)義Web數(shù)據(jù)源的數(shù)量激增,大量RDF數(shù)據(jù)被發(fā)布.互聯(lián)網(wǎng)正從僅包含網(wǎng)頁(yè)和網(wǎng)頁(yè)之間超鏈接的文檔萬(wàn)維網(wǎng)(document Web)轉(zhuǎn)變成包含大量描述各種實(shí)體和實(shí)體之間豐富關(guān)系的數(shù)據(jù)萬(wàn)維網(wǎng)(data Web).知識(shí)圖譜(knowledge graph)旨在描述真實(shí)世界中存在的各種實(shí)體或概念以及它們之間的關(guān)聯(lián)關(guān)系.和傳統(tǒng)的Web頁(yè)面網(wǎng)絡(luò)相比,知識(shí)圖譜中的節(jié)點(diǎn)從網(wǎng)頁(yè)變成了各種類型的實(shí)體,而圖中的邊也由連接網(wǎng)頁(yè)的超鏈接(hyperlink)變成豐富的各種語(yǔ)義關(guān)系.研究機(jī)構(gòu)及商業(yè)公司以知識(shí)圖譜為基礎(chǔ)開(kāi)展大規(guī)模知識(shí)庫(kù)構(gòu)建,目前Google、百度和搜狗等公司均構(gòu)建了自己的知識(shí)圖譜,分別為Google Knowledge Graph、知心和知立方.知識(shí)圖譜不僅可以改進(jìn)搜索質(zhì)量,同時(shí)也可以直接回答問(wèn)題.
知識(shí)圖譜在檢索領(lǐng)域獲得廣泛應(yīng)用之后,逐步擴(kuò)展到教育、醫(yī)療等其他領(lǐng)域.教育知識(shí)圖譜可將分散、無(wú)序、海量的教育信息聚合成結(jié)構(gòu)化、優(yōu)質(zhì)的知識(shí),并智能地推薦給用戶,使用戶從海量信息的人工篩選中解脫出來(lái),快速進(jìn)行認(rèn)知升級(jí).如百度研制的百度教育知識(shí)圖譜主要用于K12教育市場(chǎng),將題目與知識(shí)點(diǎn)進(jìn)行對(duì)應(yīng),聚合相關(guān)知識(shí)點(diǎn)的多態(tài)優(yōu)質(zhì)資源,能夠支持并完成高效的人機(jī)交互.
知識(shí)圖譜的構(gòu)建過(guò)程是從原始數(shù)據(jù)出發(fā),采用一系列自動(dòng)或半自動(dòng)的數(shù)據(jù)挖掘技術(shù),從原始數(shù)據(jù)中提取出知識(shí)主題等節(jié)點(diǎn)及節(jié)點(diǎn)間語(yǔ)義或認(rèn)知關(guān)系.這是一個(gè)迭代更新的過(guò)程,每輪迭代包含2個(gè)基本階段:信息抽取和知識(shí)融合.教育知識(shí)圖譜的構(gòu)建也遵循這2個(gè)階段,差別主要是節(jié)點(diǎn)及節(jié)點(diǎn)間關(guān)系類型不同.
信息抽取從各種類型的數(shù)據(jù)源抽取構(gòu)建知識(shí)圖譜所需的各種候選實(shí)體(概念、知識(shí)主題)及節(jié)點(diǎn)間的關(guān)聯(lián)關(guān)系(包括語(yǔ)義關(guān)系、認(rèn)知關(guān)系等),形成一個(gè)個(gè)孤立的抽取圖譜(extracted graphs).知識(shí)圖譜主要來(lái)源于百科類網(wǎng)站和各種垂直站點(diǎn)的結(jié)構(gòu)化數(shù)據(jù),這類數(shù)據(jù)特點(diǎn)是質(zhì)量較高、更新較慢.比如Google的知識(shí)圖譜很大一部分來(lái)源于Freebase,Wikipedia和IMDB等網(wǎng)站.而另一方面,知識(shí)圖譜通過(guò)從各種半結(jié)構(gòu)化數(shù)據(jù)(如HTML表格)抽取相關(guān)實(shí)體的“屬性-值”對(duì)來(lái)豐富實(shí)體的描述.通過(guò)信息抽取得到的知識(shí)數(shù)據(jù)更大,并能及時(shí)發(fā)現(xiàn)最新的實(shí)體或事實(shí),但其質(zhì)量相對(duì)較差,存在一定的錯(cuò)誤.Cafarella等人[13-14]開(kāi)發(fā)了WebTables系統(tǒng),該系統(tǒng)使用分類技術(shù)從海量HTML頁(yè)面的150億表格中抽取了1.5億條的高質(zhì)量關(guān)系數(shù)據(jù).該系統(tǒng)后來(lái)被Google收購(gòu)用于構(gòu)建Google的知識(shí)圖譜.Venetis等人[15]開(kāi)發(fā)了一個(gè)用于HTML中海量表格的語(yǔ)義標(biāo)注系統(tǒng).該系統(tǒng)首先從Web上抽取得到含有噪音的類標(biāo)簽及它們之間的關(guān)系形成一個(gè)數(shù)據(jù)庫(kù),基于該數(shù)據(jù)庫(kù)及Web上觀察到的實(shí)例標(biāo)注表格的每個(gè)列,從而獲得表格的語(yǔ)義.Mintz等人[16]提出一種Distant Supervision的方法從Web抽取各種關(guān)系,該方法假定,如果已知2個(gè)實(shí)體存在特定的語(yǔ)義關(guān)系,那么包含實(shí)體對(duì)的句子在某種程度上就存在表征二者語(yǔ)義關(guān)系的作用.這種方法充分利用了現(xiàn)有的知識(shí)庫(kù),如Wikipedia、本體或者人工標(biāo)注的小規(guī)模實(shí)體對(duì),將這些高質(zhì)量關(guān)系實(shí)體對(duì)作為種子,從Web中挖掘包含已知實(shí)體對(duì)的大規(guī)模文本,作為自動(dòng)標(biāo)注的語(yǔ)料庫(kù),然后使用監(jiān)督學(xué)習(xí)解決關(guān)系抽取問(wèn)題.
為了形成一個(gè)完整的知識(shí)圖譜,還需要通過(guò)實(shí)體對(duì)齊(消歧)、模式層構(gòu)建、可信性驗(yàn)證等技術(shù)將這些信息孤島集成在一起.Bordes等人[17]基于深度學(xué)習(xí)技術(shù)將不同的符號(hào)框架嵌入(embed)到一個(gè)連續(xù)的向量空間中,從而可以方便地計(jì)算實(shí)體間語(yǔ)義相似度,進(jìn)而完成預(yù)測(cè)及檢索任務(wù).Google創(chuàng)建了名為 Knowledge Vault的知識(shí)圖譜[18],迄今已經(jīng)收集了16億件事實(shí),其中,2.71億件是“可信的事實(shí)”.微軟創(chuàng)建的Probase[19],從多達(dá)16億網(wǎng)頁(yè)數(shù)據(jù)中抽取出270萬(wàn)條核心概念、2000多萬(wàn)條概念間關(guān)系,是目前概念空間最大的知識(shí)庫(kù).
目前還沒(méi)有成熟的教育知識(shí)圖譜產(chǎn)品,研究機(jī)構(gòu)及商業(yè)公司側(cè)重于擴(kuò)展現(xiàn)有知識(shí)圖譜技術(shù),并研究基于知識(shí)圖譜的個(gè)性化資源推薦、導(dǎo)航學(xué)習(xí)、知識(shí)發(fā)現(xiàn)等技術(shù).
在線學(xué)習(xí)中主要包括導(dǎo)學(xué)、推薦、答疑、評(píng)價(jià)等教學(xué)環(huán)節(jié),以下對(duì)各個(gè)環(huán)節(jié)中的學(xué)習(xí)路徑生成與導(dǎo)航、學(xué)習(xí)者畫像與個(gè)性化推薦、智能答疑、精細(xì)化評(píng)估等關(guān)鍵技術(shù)進(jìn)行綜述.
學(xué)習(xí)路徑推薦是根據(jù)學(xué)習(xí)者的先驗(yàn)知識(shí)與學(xué)習(xí)目標(biāo),規(guī)劃一條由認(rèn)知關(guān)系組成的路徑,其核心問(wèn)題是如何自動(dòng)生成高效的學(xué)習(xí)路徑.目前,針對(duì)學(xué)習(xí)路徑推薦的研究仍然處于探索階段,針對(duì)不同的需求和應(yīng)用背景尚沒(méi)有公認(rèn)的權(quán)威經(jīng)典方法解決這一問(wèn)題.已有的代表性研究工作可以分為基于學(xué)習(xí)者特征、基于語(yǔ)義關(guān)系、基于認(rèn)知關(guān)系的3類學(xué)習(xí)路徑生成方法.
基于學(xué)習(xí)者特征的學(xué)習(xí)路徑生成方法是通過(guò)分析學(xué)習(xí)者在學(xué)習(xí)過(guò)程中表現(xiàn)出來(lái)的學(xué)習(xí)行為特點(diǎn)來(lái)完成學(xué)習(xí)路徑推薦.典型的研究有:Salehi與 Kamalabadi[20]提出了一種基于序列模式挖掘和多維屬性的協(xié)同過(guò)濾的新型推薦系統(tǒng)框架;Lin等人[21]開(kāi)發(fā)了基于決策樹(shù)的個(gè)性化創(chuàng)新學(xué)習(xí)系統(tǒng),為學(xué)習(xí)者提供個(gè)性化的學(xué)習(xí)路徑;Dwivedi等人[22]通過(guò)可變長(zhǎng)度遺傳算法,綜合考慮學(xué)習(xí)者的學(xué)習(xí)風(fēng)格和知識(shí)水平,為學(xué)習(xí)者提供有效的學(xué)習(xí)路徑;Basu等人[23]提出了一種基于用戶模型的系統(tǒng),該系統(tǒng)考慮了學(xué)習(xí)者的偏好、先前的表現(xiàn)、學(xué)分要求以及推薦學(xué)習(xí)路徑的時(shí)間等參數(shù).Bendahmane等人[24]提出了一種基于學(xué)習(xí)數(shù)據(jù)、學(xué)習(xí)者特征、期望和能力的方法CBA,通過(guò)對(duì)學(xué)習(xí)者進(jìn)行聚類和跟蹤,最后給出合適的學(xué)習(xí)路徑.Salehi等人[25]引入了學(xué)習(xí)者偏好樹(shù),將學(xué)習(xí)者所接觸材料的多維屬性、學(xué)習(xí)者評(píng)分、有序模式和順序模式組合到模型中.該模型使用混合、加權(quán)和級(jí)聯(lián)混合方法形成最終推薦的學(xué)習(xí)路徑.
以上6種方法都是從學(xué)習(xí)者的角度解決學(xué)習(xí)路徑推薦問(wèn)題,大多采用集體智慧或表現(xiàn)優(yōu)秀學(xué)習(xí)者的學(xué)習(xí)行為特征來(lái)提高生成的學(xué)習(xí)路徑的精確度和有效性.但是,這種思路需要花費(fèi)大量時(shí)間構(gòu)造優(yōu)秀學(xué)習(xí)者的先驗(yàn)知識(shí)庫(kù),而且可能會(huì)面臨優(yōu)秀學(xué)習(xí)者的日志缺失問(wèn)題;同時(shí)由于并未考慮學(xué)習(xí)者當(dāng)前的先驗(yàn)知識(shí)到學(xué)習(xí)目標(biāo)的必要性,以及不同學(xué)習(xí)者在學(xué)習(xí)過(guò)程中所表現(xiàn)的不同學(xué)習(xí)行為特征,因此,所推薦的學(xué)習(xí)路徑會(huì)或多或少地偏離學(xué)習(xí)者的原本需求,無(wú)法為學(xué)習(xí)者提供有針對(duì)性的指導(dǎo).
基于語(yǔ)義關(guān)系的學(xué)習(xí)路徑生成方法是利用知識(shí)元本身的語(yǔ)義信息指導(dǎo)學(xué)習(xí)路徑的推薦.典型的研究有:Chu等人[26]提出一種基于本體的學(xué)習(xí)路徑生成方法,該方法首先根據(jù)知識(shí)元之間的關(guān)系建立知識(shí)元本體庫(kù),進(jìn)而根據(jù)本體之間的關(guān)系指導(dǎo)學(xué)習(xí)路徑的推薦;Colace等人[27]提出了一種基于貝葉斯網(wǎng)絡(luò)生成學(xué)習(xí)路徑的方法,利用領(lǐng)域本體中的概念關(guān)系,將學(xué)習(xí)路徑推薦問(wèn)題視為一種排序約束滿足問(wèn)題;Tam等人[28]提出了明確的語(yǔ)義分析,然后通過(guò)概念聚類增強(qiáng)本體分析,并應(yīng)用優(yōu)化器來(lái)尋找所涉及的概念或模塊的最佳學(xué)習(xí)路徑.Tseng等人[29]構(gòu)建了自適應(yīng)學(xué)習(xí)的概念圖,并為個(gè)體學(xué)生提供了知識(shí)點(diǎn)推薦.以上方法大多缺失目標(biāo)知識(shí)元學(xué)習(xí)的必要條件,忽視了知識(shí)間認(rèn)知序關(guān)系對(duì)認(rèn)知的影響;此外,本體之間的聯(lián)系是多種多樣的,這種聯(lián)系不一定是認(rèn)知角度的學(xué)習(xí)先后順序,用這些各種各樣的聯(lián)系去建立學(xué)習(xí)路徑并不太合適.
基于認(rèn)知關(guān)系的學(xué)習(xí)路徑生成方法主要是通過(guò)知識(shí)圖譜解決大量的異質(zhì)學(xué)習(xí)資源導(dǎo)致學(xué)習(xí)者的知識(shí)迷失和認(rèn)知負(fù)載問(wèn)題.朱艷茹等人[30]在學(xué)生能力的引導(dǎo)下,構(gòu)建了一個(gè)能夠自動(dòng)診斷用戶學(xué)習(xí)能力的用戶模型,并為不同特征的學(xué)習(xí)者提供“最佳契合”的個(gè)性化學(xué)習(xí)路徑.趙琴等人[31]提出一種基于改進(jìn)蟻群優(yōu)化算法的微學(xué)習(xí)路徑推薦方法,該方法主要用于檢測(cè)學(xué)習(xí)者的知識(shí)水平、知識(shí)領(lǐng)域和學(xué)習(xí)目標(biāo)的學(xué)習(xí)遷移;Durand等人[32]提出一種基于圖論的學(xué)習(xí)路徑推薦系統(tǒng),用貪心算法求最短路徑的局部最優(yōu)解.這些學(xué)習(xí)路徑推薦方法不足之處在于:不能根據(jù)學(xué)習(xí)者的學(xué)習(xí)過(guò)程和學(xué)習(xí)能力提供多樣化的學(xué)習(xí).
精準(zhǔn)學(xué)習(xí)者畫像是現(xiàn)階段個(gè)性化教學(xué)的核心內(nèi)容,即如何有效地利用學(xué)習(xí)者的靜態(tài)和動(dòng)態(tài)信息來(lái)建立學(xué)習(xí)者畫像,為個(gè)性化教學(xué)提供基礎(chǔ).陳海建等人[33]結(jié)合學(xué)習(xí)者的基本信息、在線學(xué)習(xí)行為、課堂表現(xiàn)以及腦認(rèn)知實(shí)驗(yàn),利用標(biāo)簽化的形式進(jìn)行個(gè)性歸納和畫像,從而有效地服務(wù)于個(gè)性化教學(xué).何娟[34]利用用戶借用的圖書詞頻分析結(jié)合用戶靜態(tài)特征屬性,分別進(jìn)行單個(gè)、群組的用戶畫像的構(gòu)建,實(shí)現(xiàn)圖書的個(gè)性化推薦.黃文彬等人[35]采用頻繁模式挖掘、構(gòu)建概率矩陣、計(jì)算熵等方法,從用戶日志中所包含的地理位置信息中構(gòu)建移動(dòng)用戶行為畫像,分析移動(dòng)用戶群體行為及用戶間交互行為.楊捷[36]提出一種結(jié)合主題模型和用戶屬性的用戶畫像建模方法,并與因子分解機(jī)模型相結(jié)合,有效地解決了數(shù)據(jù)稀疏問(wèn)題.費(fèi)鵬[37]提出基于多粒度神經(jīng)網(wǎng)絡(luò)結(jié)合多種機(jī)器學(xué)習(xí)模型對(duì)文本特征進(jìn)行特征萃取的多視角融合框架來(lái)構(gòu)建用戶畫像.
在資源推薦方面,典型的推薦策略包括:基于內(nèi)容的推薦、協(xié)同過(guò)濾推薦、基于社交網(wǎng)絡(luò)的推薦、基于關(guān)聯(lián)規(guī)則的推薦、混合推薦等.
基于內(nèi)容的推薦方法是應(yīng)用于資源推薦領(lǐng)域最主要的推薦策略,最早應(yīng)用于信息獲取領(lǐng)域[38],主要思想是根據(jù)用戶的交互項(xiàng)目,選擇與用戶交互項(xiàng)目相似的項(xiàng)目作為推薦結(jié)果.梁婷婷等人[39]提出基于內(nèi)容過(guò)濾PageRank語(yǔ)義相似替換的Top-k學(xué)習(xí)資源推薦方法.該方法首先基于內(nèi)容的向量空間濾波建立學(xué)習(xí)資源過(guò)濾推薦模型,然后通過(guò)計(jì)算資源間匹配方式以取代語(yǔ)義相似性,從而避免多義詞或同義詞的漏檢問(wèn)題.
協(xié)同過(guò)濾推薦技術(shù)在個(gè)性化推薦領(lǐng)域是最成功的策略,適用于存在大量用戶行為數(shù)據(jù)或者具有大量資源信息時(shí)的學(xué)習(xí)資源推薦.駱金維等人[40]結(jié)合課程教學(xué)資源數(shù)據(jù)間的相關(guān)性及學(xué)習(xí)者行為數(shù)據(jù)給學(xué)習(xí)者進(jìn)行教學(xué)資源推薦,提高課程教學(xué)資源共享效應(yīng).
隨著在線教育的發(fā)展,基于社交網(wǎng)絡(luò)的推薦快速發(fā)展,Wan等人[41]在充分挖掘?qū)W習(xí)社群成員之間社會(huì)關(guān)系的基礎(chǔ)上,開(kāi)發(fā)了QSIA(questions sharing and interactive assignments)系統(tǒng)用于提升推薦效果和協(xié)作水平.賀超波等人[42]設(shè)計(jì)了一種基于興趣社區(qū)的學(xué)習(xí)資源推薦模式,首先通過(guò)構(gòu)建基于社交網(wǎng)絡(luò)的在線學(xué)習(xí)服務(wù)為學(xué)習(xí)用戶提供交流協(xié)作以及學(xué)習(xí)資源評(píng)價(jià)環(huán)境,然后利用興趣社區(qū)挖掘技術(shù)發(fā)現(xiàn)興趣高度相似的用戶群體,最后基于相似用戶群體對(duì)目標(biāo)用戶進(jìn)行學(xué)習(xí)資源推薦.
為實(shí)現(xiàn)精準(zhǔn)的學(xué)習(xí)資源推薦,需要整體考慮數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,對(duì)學(xué)習(xí)者、資源等進(jìn)行多維關(guān)聯(lián)分析,由此產(chǎn)生基于關(guān)聯(lián)規(guī)則的推薦.丁繼紅等人[43]引入張量理論構(gòu)建“學(xué)習(xí)者-資源”融合張量,利用高階奇異值分解算法挖掘?qū)W習(xí)者和資源的關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)學(xué)習(xí)者和資源之間的精準(zhǔn)匹配.多維關(guān)聯(lián)分析方法有利于大數(shù)據(jù)環(huán)境中對(duì)個(gè)性化學(xué)習(xí)資源的推薦,提高在線教育和個(gè)性化學(xué)習(xí)的質(zhì)量.
以上推薦策略都有各自的優(yōu)缺點(diǎn),而在實(shí)際應(yīng)用中可以針對(duì)具體問(wèn)題采用推薦策略的組合進(jìn)行推薦.通過(guò)組合不同的推薦策略,主要的混合方式可以分成2種:1)對(duì)推薦結(jié)果進(jìn)行組合[44];2)對(duì)推薦算法進(jìn)行組合[45-46].混合推薦模型是對(duì)多維度特征推薦的一種有效方法,依賴于大數(shù)據(jù)的支持[47].
智能答疑系統(tǒng)是將機(jī)器視為一個(gè)認(rèn)知主體的人機(jī)交互系統(tǒng),是人工智能領(lǐng)域的一個(gè)重要分支.隨著計(jì)算機(jī)硬件技術(shù)和移動(dòng)互聯(lián)網(wǎng)的迅猛發(fā)展,能夠有效處理非精確信息交互的、符合人類自然交互習(xí)慣的認(rèn)知型智能答疑系統(tǒng)受到了越來(lái)越多的關(guān)注,并在網(wǎng)絡(luò)自動(dòng)答疑、在線學(xué)習(xí)平臺(tái)、智能教師(intelligent tutor)、個(gè)性化學(xué)習(xí)助手等方面得到了廣泛應(yīng)用.目前,國(guó)內(nèi)外智能問(wèn)答系統(tǒng)的研究主要涉及問(wèn)題理解、對(duì)話管理、對(duì)話生成和對(duì)話評(píng)測(cè)4部分.
1) 問(wèn)題理解.目前自然語(yǔ)言處理領(lǐng)域主流的對(duì)話理解研究多是對(duì)問(wèn)句進(jìn)行關(guān)鍵詞提取和擴(kuò)充、語(yǔ)法分析、句法分析等,一般包括問(wèn)題分類(如what,when,who,where,why,how)[48-50]、關(guān)鍵詞提取和關(guān)鍵詞擴(kuò)展.通過(guò)確定問(wèn)題的類型,制定關(guān)鍵詞和答案抽取的規(guī)則,提取出關(guān)鍵詞后,依據(jù)問(wèn)題類型等因素對(duì)關(guān)鍵詞進(jìn)行適當(dāng)?shù)臄U(kuò)展,然后將關(guān)鍵詞提交到信息檢索模塊來(lái)查找相關(guān)文檔[51].基于語(yǔ)法、句法分析的問(wèn)題理解的方法也是一種重要的問(wèn)題理解方式,這類方法主要是以語(yǔ)義角色標(biāo)注為代表的基于語(yǔ)義表示模型的分析方法[52-53].國(guó)內(nèi)研究人員根據(jù)中文語(yǔ)言的獨(dú)有特點(diǎn)也提出了很多中文語(yǔ)義表示模型[54],例如漢語(yǔ)問(wèn)句語(yǔ)義組塊[55]、融合事件信息的復(fù)雜問(wèn)句分析方法[56]、基于句法分析樹(shù)的查詢語(yǔ)義圖語(yǔ)義理解方法[57]以及基于主題和焦點(diǎn)的問(wèn)句分析方法[58-60].此外,隨著深度學(xué)習(xí)的發(fā)展,基于詞向量的語(yǔ)義理解也逐漸得到關(guān)注[61-63].
2) 對(duì)話管理.對(duì)話管理通常包括問(wèn)答知識(shí)庫(kù)構(gòu)建、對(duì)話策略管理、搜索引擎3個(gè)核心功能.建立問(wèn)答知識(shí)庫(kù)并從中構(gòu)建高質(zhì)量的問(wèn)答模型是對(duì)話管理的核心問(wèn)題,同時(shí)還是人機(jī)對(duì)話順利進(jìn)行的必要保證.對(duì)知識(shí)庫(kù)進(jìn)行建模就是利用已有的大量問(wèn)題答案對(duì)、自由文本等語(yǔ)料構(gòu)建問(wèn)題答案之間的匹配模型.目前解決問(wèn)答匹配的方式主要是問(wèn)題建模、對(duì)答知識(shí)建模和答案建模,另一種技術(shù)路線則采用了Encoder-Decoder框架,通過(guò)構(gòu)建端到端(end-to-end)的深度學(xué)習(xí)模型[64-65],從海量對(duì)話數(shù)據(jù)中自動(dòng)學(xué)習(xí)提問(wèn)和回答之間的語(yǔ)義關(guān)聯(lián),達(dá)到對(duì)于任何用戶提問(wèn)都能夠自動(dòng)生成回復(fù)的目的.在對(duì)話管理策略功能方面,目前應(yīng)用的模型主要包括有限狀態(tài)機(jī)、填槽法、Markov決策過(guò)程(Markov decision process, MDP)、部分可觀察Markov決策過(guò)程(partially observable Markov decision processes,POMDP)、基于實(shí)例的、基于規(guī)劃的、貝葉斯網(wǎng)絡(luò)等近10種方法.而搜索引擎技術(shù)是問(wèn)答系統(tǒng)的重要支撐之一,智能答疑系統(tǒng)中的搜索引擎就是根據(jù)從用戶已輸入的自然語(yǔ)言中提取有用信息,使用不同的搜索技術(shù),在已有的數(shù)據(jù)庫(kù)、文本庫(kù)、模型庫(kù)或是網(wǎng)絡(luò)中搜索與用戶問(wèn)題最為相關(guān)的信息,并交給對(duì)話生成模塊以構(gòu)成對(duì)用戶問(wèn)題的回答.
3) 對(duì)話生成.在使用智能答疑系統(tǒng)進(jìn)行人機(jī)交互時(shí),生成語(yǔ)句通順流暢的類人(human-like)對(duì)話是交互能不斷進(jìn)行的前提.自然語(yǔ)言生成是根據(jù)對(duì)話管理部分產(chǎn)生的非語(yǔ)言信息,自動(dòng)生成面向用戶的自然語(yǔ)言反饋[66].近年來(lái),在智能答疑系統(tǒng)上的對(duì)話生成主要涉及檢索式和生成式[67-69]2類技術(shù).檢索式對(duì)話生成代表技術(shù)是在已有的對(duì)話語(yǔ)料庫(kù)中通過(guò)排序?qū)W習(xí)技術(shù)和深度匹配技術(shù)找到適合當(dāng)前輸入的最佳回復(fù).這種方法的局限是僅能以固定的語(yǔ)言模式進(jìn)行回復(fù),無(wú)法實(shí)現(xiàn)詞語(yǔ)的多樣性組合.生成式對(duì)話生成代表技術(shù)則是從已有的對(duì)話中學(xué)習(xí)語(yǔ)言的組合模式,通過(guò)類似機(jī)器翻譯中常用的“編碼-解碼”過(guò)程去逐字逐詞地生成一個(gè)回復(fù),這種回復(fù)有可能是從未在語(yǔ)料庫(kù)中出現(xiàn)的、自主“創(chuàng)造”的句子.
4) 對(duì)話評(píng)測(cè).評(píng)測(cè)一個(gè)任務(wù)驅(qū)動(dòng)的多輪對(duì)話系統(tǒng),主要涉及評(píng)測(cè)自然語(yǔ)言理解、對(duì)話狀態(tài)跟蹤[70-71]和對(duì)話策略[72-75]3個(gè)部分.自然語(yǔ)言理解是一個(gè)典型的分類問(wèn)題,可以通過(guò)準(zhǔn)確率、召回率和F-score等指標(biāo)進(jìn)行評(píng)測(cè).對(duì)話狀態(tài)跟蹤,作為輔助對(duì)話策略的一個(gè)中間環(huán)節(jié),業(yè)界已總結(jié)出一系列的評(píng)測(cè)標(biāo)準(zhǔn),詳情請(qǐng)參考?xì)v屆DSTC[76]公開(kāi)評(píng)測(cè).而對(duì)話策略的質(zhì)量通常需要通過(guò)對(duì)話系統(tǒng)的整體效果來(lái)體現(xiàn),其主要評(píng)測(cè)指標(biāo)是任務(wù)完成率和平均對(duì)話輪數(shù).
隨著計(jì)算機(jī)科學(xué)、自然語(yǔ)言處理以及人工智能技術(shù)的進(jìn)步,智能答疑系統(tǒng)也取得了巨大的發(fā)展和突破.但是,就目前智能答疑系統(tǒng)的應(yīng)用和發(fā)展來(lái)看,當(dāng)前的智能問(wèn)答系統(tǒng)仍存在諸多問(wèn)題,并且大都以“一問(wèn)一答”的單輪簡(jiǎn)單對(duì)話形式呈現(xiàn),多采用基于規(guī)則的和數(shù)據(jù)的信息檢索方式實(shí)現(xiàn),都比較短視,并沒(méi)有考慮前后多輪對(duì)話之間的連貫性,缺乏有效的知識(shí)支撐,在專業(yè)領(lǐng)域自然語(yǔ)言理解也存在諸多困難,而交互式多輪對(duì)話管理機(jī)制缺乏多學(xué)科融合和新技術(shù)的推動(dòng).對(duì)此,可以從智能答疑問(wèn)題的基本定義出發(fā),深入探索所研究問(wèn)題的背后機(jī)理,據(jù)此建立其數(shù)據(jù)與基本算法支撐,聚焦到解決問(wèn)題的核心算法與數(shù)學(xué)理論,構(gòu)建出以知識(shí)推理為支撐、深度學(xué)習(xí)語(yǔ)義驅(qū)動(dòng)的多輪對(duì)話系統(tǒng),以此解決目前智能答疑系統(tǒng)所面臨的挑戰(zhàn)和問(wèn)題.
精細(xì)化評(píng)估指以學(xué)習(xí)者、教師、教學(xué)環(huán)境等要素為對(duì)象對(duì)教學(xué)過(guò)程進(jìn)行精準(zhǔn)、細(xì)粒度、全過(guò)程的評(píng)估,主要包括過(guò)程性評(píng)估和終結(jié)性評(píng)估2方面.以對(duì)學(xué)習(xí)者的評(píng)估為例,過(guò)程性評(píng)估關(guān)注學(xué)生學(xué)習(xí)過(guò)程中的學(xué)習(xí)方式,通過(guò)對(duì)學(xué)習(xí)方式持續(xù)的過(guò)程性評(píng)估,將學(xué)習(xí)方式由表層式或成就式引導(dǎo)到深層式的方向上來(lái),從而形成“深層式學(xué)習(xí)方式—高層次學(xué)習(xí)結(jié)果—深層式學(xué)習(xí)方式”的良性互動(dòng)[77].終結(jié)性評(píng)估關(guān)注學(xué)生學(xué)習(xí)的結(jié)果,對(duì)其最終學(xué)習(xí)效果作出結(jié)論和判斷.
精細(xì)化評(píng)估一直是教育領(lǐng)域的研究熱點(diǎn),其應(yīng)用場(chǎng)景既包括在線教育又包括近年來(lái)興起的MOOC.例如國(guó)際計(jì)算機(jī)學(xué)會(huì)(ACM)規(guī)模化學(xué)習(xí)會(huì)議(Learning at Scale, 簡(jiǎn)稱L@S)每年都設(shè)立專門的分組(Session)研討評(píng)估技術(shù)的進(jìn)展.
在在線教育場(chǎng)景方面,典型研究工作如:Admiraal等人[78]提出了一種基于語(yǔ)義Web技術(shù)的在線教育評(píng)估框架,基于學(xué)習(xí)者動(dòng)態(tài)的學(xué)習(xí)過(guò)程評(píng)估學(xué)習(xí)者的知識(shí)水平.劉力紅等人[79]提出一種基于矩陣的二級(jí)模糊綜合評(píng)估模型,量化評(píng)估學(xué)習(xí)者的學(xué)習(xí)狀況.Ozkan等人[80]提出一種面向在線教育的六角形評(píng)估模型,從內(nèi)容質(zhì)量、學(xué)習(xí)者觀點(diǎn)等六個(gè)維度對(duì)在線學(xué)習(xí)環(huán)境進(jìn)行多元回歸分析.
在MOOC場(chǎng)景方面,典型研究工作如:Huisman等人[81]利用分層線性回歸的思想把學(xué)習(xí)者的終結(jié)性評(píng)估分為自我評(píng)估和同伴評(píng)估,并探討了學(xué)習(xí)者成績(jī)與其同伴自身能力水平的關(guān)聯(lián)性.Gamage等人[82]提出一種IPR(identified peer review)評(píng)價(jià)框架,通過(guò)設(shè)置激勵(lì)條件和隨機(jī)條件,識(shí)別出關(guān)聯(lián)性高的學(xué)習(xí)者進(jìn)行同伴評(píng)估,對(duì)比盲目同伴評(píng)審有更好的反饋結(jié)果.Alcarria等人[83]設(shè)計(jì)了一種強(qiáng)化的同伴評(píng)分算法,通過(guò)檢測(cè)并剔除異常反饋來(lái)糾正同伴評(píng)價(jià)偏差,以此提高同伴評(píng)估的效果.
上述研究從學(xué)習(xí)者、教師、教學(xué)環(huán)境等不同角度進(jìn)行評(píng)估,特別是在MOOC場(chǎng)景下關(guān)注同伴評(píng)估.但現(xiàn)有研究成果對(duì)構(gòu)建智慧教育的精細(xì)化評(píng)估還缺乏可操作性.首先,教師與學(xué)習(xí)者在空間上是分離的,他們之間缺少情感交流和反饋,不利于為學(xué)生找到適合自己的教學(xué)方式[84],盡管目前個(gè)性化推薦系統(tǒng)豐富多樣,但并未以精細(xì)化評(píng)估學(xué)習(xí)者的興趣為基礎(chǔ).其次,在線上授課系統(tǒng)中,學(xué)習(xí)者的積極性無(wú)法保證,具體體現(xiàn)在學(xué)習(xí)過(guò)程中學(xué)習(xí)者之間難以形成學(xué)習(xí)共同體,學(xué)習(xí)動(dòng)力不足[85].對(duì)此,綜合考慮學(xué)習(xí)者、教師、教學(xué)環(huán)境3方面的因素,在考慮學(xué)習(xí)者隱私的情況下捕獲并分析其學(xué)習(xí)環(huán)境[86-88],建立學(xué)習(xí)者與教師間的反饋機(jī)制與情感溝通,進(jìn)而實(shí)現(xiàn)精細(xì)化評(píng)估,是評(píng)估技術(shù)的一個(gè)重要發(fā)展方向.
對(duì)在線學(xué)習(xí)中的導(dǎo)學(xué)、推薦、答疑、評(píng)價(jià)4個(gè)教學(xué)環(huán)節(jié)涉及的關(guān)鍵技術(shù)進(jìn)行總結(jié),如表1所示:
Table 1 Representative Methods and Their Characteristics in the Four Processes of Teaching表1 教學(xué)4個(gè)環(huán)節(jié)的代表性方法與特征
Continued (Table 1)
近年來(lái),隨著移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等技術(shù)的發(fā)展,更得益于人工智能的浪潮,新興的教育平臺(tái)不斷地朝著更加智慧的方向發(fā)展.智慧教育平臺(tái)相對(duì)于傳統(tǒng)的教育平臺(tái),實(shí)現(xiàn)了人工智能技術(shù)與教育核心業(yè)務(wù)的深度融合,體現(xiàn)出智能化個(gè)性化學(xué)習(xí)服務(wù)、教育資源智能化組織管理、人機(jī)協(xié)同智能交互、教學(xué)過(guò)程與效果智能評(píng)測(cè)、智能化沉浸式學(xué)習(xí)環(huán)境等諸多鮮明特征.
基于學(xué)習(xí)者行為的智能分析,提供個(gè)性化的學(xué)習(xí)服務(wù),是智慧教育平臺(tái)的基本特征,可顯著提升平臺(tái)用戶的學(xué)習(xí)效率.國(guó)際上三大MOOC平臺(tái)Coursera[89],edX[90]和Udacity[91],及國(guó)內(nèi)的主流MOOC平臺(tái),如MOOC中國(guó)[92]、學(xué)堂在線[93]等,都已經(jīng)具備不同方式的個(gè)性化學(xué)習(xí)功能,包括通過(guò)收集數(shù)據(jù)分析學(xué)生的學(xué)習(xí)進(jìn)度和理解情況,提供與個(gè)人學(xué)習(xí)水平相當(dāng)?shù)淖鳂I(yè)、測(cè)試及分組任務(wù).此外,主流的學(xué)習(xí)管理系統(tǒng)(LMS)、課程管理系統(tǒng)(CMS)等,也均提供個(gè)性化的學(xué)習(xí)管理服務(wù).例如,世界上最知名的開(kāi)源學(xué)習(xí)管理系統(tǒng)Moodle平臺(tái)[94]已支持個(gè)性化的學(xué)習(xí)環(huán)境.而著名的商用系統(tǒng)Blackboard[95]也能夠提供個(gè)性化、基于能力的掌握式學(xué)習(xí)(mastery study).此外,在混合式教學(xué)領(lǐng)域,Edgenuity[96],Fuel Education[97]等均為面向K12混合學(xué)習(xí)的個(gè)性化智慧教育平臺(tái),使學(xué)生個(gè)性化地合理安排學(xué)習(xí)時(shí)間與內(nèi)容,顯著提升混合式學(xué)習(xí)的教學(xué)效果.
在教育資源的智能化組織管理領(lǐng)域,為了實(shí)現(xiàn)教育資源的有效組織,為個(gè)性化導(dǎo)航式學(xué)習(xí)及智能人機(jī)交互提供技術(shù)支持,知識(shí)圖譜技術(shù)已逐步地被采用.Yotta系統(tǒng)[98]側(cè)重于實(shí)現(xiàn)海量教育資源的有效組織與管理,基于碎片化資源聚合的“知識(shí)森林”,為學(xué)習(xí)者提供方便的學(xué)習(xí)導(dǎo)航服務(wù).網(wǎng)易云課堂[99]在其最新版本中,實(shí)現(xiàn)了基于“學(xué)習(xí)圖譜”關(guān)聯(lián)碎片化知識(shí)的功能.好未來(lái)K12智慧教育產(chǎn)品[100]構(gòu)建了跨年級(jí)的知識(shí)網(wǎng)絡(luò),用于個(gè)性化學(xué)習(xí)推薦以及評(píng)測(cè).乂學(xué)教育的松鼠AI智適應(yīng)學(xué)習(xí)系統(tǒng)[101]同樣構(gòu)建了以細(xì)粒度知識(shí)點(diǎn)為單位的知識(shí)圖譜,以助力自適應(yīng)學(xué)習(xí).在國(guó)外,MIT公開(kāi)課[102]、Khan Academy[103]均構(gòu)建了相應(yīng)的知識(shí)圖譜.其中,MIT公開(kāi)課進(jìn)一步將面向本科教育的課程圖譜可視化.
在人機(jī)協(xié)同的智能交互領(lǐng)域,隨著自然語(yǔ)言處理等相關(guān)技術(shù)的發(fā)展,AI虛擬教學(xué)助手逐步得到應(yīng)用,為學(xué)習(xí)者提供互動(dòng)的教學(xué)輔助手段,以提高課程的關(guān)注度與完成率.2016年美國(guó)佐治亞理工學(xué)院Ashok Goel教授使用的智能虛擬助教Jill Waston,實(shí)現(xiàn)97%的回答準(zhǔn)確率,該虛擬助教基于IBM Watson Assistant[104]平臺(tái)技術(shù)實(shí)現(xiàn),大幅度減輕教師教學(xué)壓力,同時(shí)幫助學(xué)習(xí)者進(jìn)行在線智能答疑,提高學(xué)習(xí)效率.在國(guó)內(nèi),學(xué)堂在線也發(fā)布了個(gè)性化的學(xué)習(xí)伴侶“小木”,在減輕教師教學(xué)負(fù)擔(dān)的同時(shí),幫助學(xué)習(xí)者提高學(xué)習(xí)的積極性.
在教學(xué)過(guò)程與效果的智能評(píng)測(cè)領(lǐng)域,一方面,眾多智慧教育平臺(tái)及應(yīng)用具備了面向教學(xué)過(guò)程的自動(dòng)化評(píng)測(cè),包括智能題庫(kù)、閱卷、作業(yè)批改等,以減輕教師的教學(xué)壓力,并及時(shí)反饋評(píng)測(cè)學(xué)生的學(xué)習(xí)狀態(tài).例如,科大訊飛的智慧教育系列產(chǎn)品[105]實(shí)現(xiàn)了面向英語(yǔ)教學(xué)的智能評(píng)分,能夠完成智能化的英文寫作批改與英語(yǔ)口語(yǔ)評(píng)測(cè).Khan Academy開(kāi)發(fā)的練習(xí)記錄系統(tǒng),對(duì)學(xué)生的學(xué)習(xí)狀況進(jìn)行評(píng)估測(cè)試,與同階段學(xué)生比較后進(jìn)行教學(xué)班級(jí)的重編.另一方面,基于教育大數(shù)據(jù)的深度分析,眾多智慧教育平臺(tái)及應(yīng)用同時(shí)也為教育管理者提供教學(xué)效果的精準(zhǔn)分析.例如,Blackboard提供抄襲檢測(cè)、電子檔案袋、自動(dòng)評(píng)分和重新分級(jí)、交互式評(píng)價(jià)和風(fēng)險(xiǎn)跟蹤等功能.好未來(lái)的智慧教育產(chǎn)品面向教育管理者,可預(yù)測(cè)學(xué)生的學(xué)習(xí)意愿,為培訓(xùn)機(jī)構(gòu)的管理運(yùn)行提供參考.
在智能化沉浸式學(xué)習(xí)環(huán)境的構(gòu)建領(lǐng)域,Agilix平臺(tái)[106]在混合與虛擬現(xiàn)實(shí)的沉浸式學(xué)習(xí)環(huán)境中,提供個(gè)性化服務(wù).Web Courseworks[107]通過(guò)AR,VR等技術(shù),基于3D視頻實(shí)現(xiàn)人機(jī)協(xié)同的智能交互.SkyClass[108]在提供基于Web的實(shí)時(shí)多媒體交互課堂的基礎(chǔ)上,引入了人臉檢測(cè)與增強(qiáng)現(xiàn)實(shí)的功能,既可以用于確認(rèn)學(xué)生身份,也可以通過(guò)AR提升學(xué)習(xí)者的興趣與沉浸感.在國(guó)外,谷歌的VR,AR教育產(chǎn)品Google Expeditions[109]允許教師引導(dǎo)學(xué)生瀏覽360度場(chǎng)景和3D對(duì)象,并智能顯示學(xué)生的興趣點(diǎn).
Table 2 Comparative Analysis of Mainstream Intelligence Education Platforms and Applications表2 主流智慧教育平臺(tái)及應(yīng)用對(duì)比分析
人工智能與互聯(lián)網(wǎng)教育的結(jié)合使得智慧教育平臺(tái)高速發(fā)展,主流智慧教育平臺(tái)及應(yīng)用對(duì)比分析如表2所示.然而,現(xiàn)有的智慧教育平臺(tái)依然存在諸多不足之處,如老師與學(xué)生、學(xué)生與學(xué)生之間的時(shí)空隔離,在線智能學(xué)習(xí)助手與虛擬導(dǎo)師還無(wú)法通過(guò)圖靈測(cè)試,網(wǎng)絡(luò)化群體學(xué)習(xí)環(huán)境下的協(xié)同認(rèn)知機(jī)理有待挖掘與利用等.
近年來(lái),在線智能學(xué)習(xí)已經(jīng)從計(jì)算機(jī)輔助教學(xué)、智能教學(xué)系統(tǒng)、智能教室逐漸演化為以學(xué)習(xí)者為中心,強(qiáng)調(diào)普適化、個(gè)性化的學(xué)習(xí)技術(shù).隨著人工智能技術(shù)的發(fā)展,如何在學(xué)習(xí)過(guò)程中通過(guò)學(xué)生與在線學(xué)習(xí)系統(tǒng)的交互,實(shí)現(xiàn)個(gè)性化的教學(xué)和輔導(dǎo)受到研究者們?cè)絹?lái)越多的關(guān)注.
在利用智能學(xué)習(xí)助手進(jìn)行學(xué)習(xí)的過(guò)程中,個(gè)體具有能力、背景、學(xué)習(xí)方式、學(xué)習(xí)目標(biāo)等各種差異性,即使是個(gè)體本身,在學(xué)習(xí)過(guò)程中,知識(shí)狀態(tài)也在不斷的變化,所以針對(duì)每個(gè)個(gè)體實(shí)現(xiàn)個(gè)性化的自適應(yīng)在線智能學(xué)習(xí)系統(tǒng)是必然發(fā)展趨勢(shì).未來(lái)的教育必須是個(gè)性化的,學(xué)生必將從與在線智能學(xué)習(xí)的交互中受益,但是在線智能學(xué)習(xí)中的人機(jī)交互(human-computer interaction, HCI)不僅僅是簡(jiǎn)單的界面交互,而是在學(xué)習(xí)的過(guò)程中學(xué)生與機(jī)器之間知識(shí)的連續(xù)傳授與更新[110].目前最新的認(rèn)知計(jì)算技術(shù)(cognitive computing, CC)在在線智能學(xué)習(xí)領(lǐng)域的應(yīng)用方面具有良好的前景,借助于其教育數(shù)據(jù)挖掘(educational data mining, EDM)、學(xué)習(xí)分析(learning analysis, LA)等相關(guān)的技術(shù),可以通過(guò)分析學(xué)習(xí)者的學(xué)習(xí)活動(dòng)中產(chǎn)生的數(shù)據(jù),為學(xué)生、教師和管理者提供實(shí)現(xiàn)其各自目標(biāo)的參考,并動(dòng)態(tài)追蹤學(xué)習(xí)者的學(xué)習(xí)活動(dòng),提供個(gè)性化的學(xué)習(xí)體驗(yàn),此類技術(shù)有望實(shí)現(xiàn)傳統(tǒng)以內(nèi)容為主的在線學(xué)習(xí)到以人為主的個(gè)性化學(xué)習(xí)的轉(zhuǎn)變.此外,在在線智能學(xué)習(xí)的過(guò)程中,如何評(píng)估學(xué)生的接受程度、學(xué)習(xí)狀態(tài)的變化以及如何更新知識(shí),是個(gè)性化自適應(yīng)在線智能學(xué)習(xí)實(shí)現(xiàn)智能化需要解決的重要問(wèn)題.隨著深度學(xué)習(xí)和大規(guī)模人工神經(jīng)網(wǎng)絡(luò)的蓬勃發(fā)展,人工智能時(shí)代的到來(lái)使教育具有可追蹤性和可預(yù)見(jiàn)性,通過(guò)進(jìn)行學(xué)生知識(shí)建模,如貝葉斯網(wǎng)絡(luò)的學(xué)生知識(shí)點(diǎn)追蹤模型(Bayesian knowledge tracing, BKT)[111]、基于神經(jīng)網(wǎng)絡(luò)的學(xué)生知識(shí)點(diǎn)追蹤模型(deep knowledge tracing, DKT)[112]、效果因素分析模型(performance factors analysis model, PFA)[113]等.通過(guò)相關(guān)的模型分析,可以對(duì)學(xué)生知識(shí)點(diǎn)的變化進(jìn)行追蹤,實(shí)時(shí)了解學(xué)生知識(shí)點(diǎn)的掌握情況,并根據(jù)學(xué)生的實(shí)踐和知識(shí)生成相關(guān)的問(wèn)題來(lái)評(píng)估每個(gè)學(xué)生的熟練程度,依照每個(gè)學(xué)生的知識(shí)結(jié)構(gòu)、智力與熟練程度來(lái)設(shè)計(jì)個(gè)性化的教程.
目前,研究者們?cè)谝延醒芯恐袑?duì)在線智能學(xué)習(xí)系統(tǒng)的知識(shí)建模方法、認(rèn)知計(jì)算技術(shù)和生物傳感技術(shù)的應(yīng)用方面已經(jīng)做了較為深入的探討,但是以人機(jī)互適應(yīng)學(xué)習(xí)、自主探索學(xué)習(xí)等核心技術(shù)為基礎(chǔ),以人類智能與機(jī)器智能協(xié)同互適應(yīng)學(xué)習(xí)為目標(biāo),個(gè)性化、高效的新型在線智能學(xué)習(xí)系統(tǒng)的構(gòu)建方式仍需繼續(xù)探索.
當(dāng)前,對(duì)于學(xué)習(xí)者的智能評(píng)估,傳統(tǒng)且普遍的方法是通過(guò)間接測(cè)量比如試卷檢測(cè)、問(wèn)卷調(diào)查等來(lái)判定學(xué)習(xí)者的能力、智力發(fā)展水平[114-115],但這種方式模糊且不精確.利用無(wú)線傳感、人機(jī)交互、虛擬現(xiàn)實(shí)等技術(shù),可實(shí)現(xiàn)實(shí)時(shí)監(jiān)測(cè)學(xué)習(xí)者學(xué)習(xí)狀態(tài),全方位多維度采集學(xué)習(xí)者第一、二課堂及生活數(shù)據(jù),以機(jī)器學(xué)習(xí)算法為支撐進(jìn)行全面且高效的學(xué)習(xí)者能力評(píng)估.然而其中還面臨一系列的挑戰(zhàn):1)數(shù)據(jù)的來(lái)源廣、維度高、規(guī)模大[116],使得評(píng)估指標(biāo)難提?。患夹g(shù)發(fā)展的不成熟使得數(shù)據(jù)采集存儲(chǔ)存在隱私泄露隱患[117].2)思維與能力具有復(fù)雜映射關(guān)系,且其各自本身具有不同層次,設(shè)計(jì)有效的測(cè)試方案是一大難題,同時(shí),結(jié)果的評(píng)價(jià)存在不可證實(shí)性.
圍繞上述難題,需要開(kāi)展的研究工作包括:1)采用數(shù)據(jù)降維去噪、多模態(tài)融合解決數(shù)據(jù)的規(guī)模大、維度高等問(wèn)題,同時(shí)采用互聯(lián)網(wǎng)+云計(jì)算、訪問(wèn)控制等方式進(jìn)行隱私保護(hù);2)針對(duì)不同背景的學(xué)習(xí)者,采用定量和定性結(jié)合、個(gè)體與整體結(jié)合的方式進(jìn)行測(cè)試,從能力與思維的不同側(cè)面全面綜合進(jìn)行評(píng)價(jià)方案的設(shè)計(jì).
人類個(gè)體存在有限認(rèn)知帶寬問(wèn)題,表現(xiàn)為獲取、處理、理解信息的能力受生理特點(diǎn)限制,例如:大腦同時(shí)處理最多4個(gè)概念,理解文本的速度低于60 bps,短期記憶(short-term memory, STM)僅能存儲(chǔ)7±2個(gè)信息塊.
網(wǎng)絡(luò)化群體智能(networked collective intelli-gence, NCI)是指網(wǎng)絡(luò)環(huán)境下個(gè)體通過(guò)以競(jìng)爭(zhēng)和合作等協(xié)同方式在完成特定任務(wù)過(guò)程中涌現(xiàn)出來(lái)的超越個(gè)體的智能.利用NCI能夠?qū)崿F(xiàn)網(wǎng)絡(luò)化群體認(rèn)知,是突破個(gè)體認(rèn)知局限的重要途徑.其難點(diǎn)在于:如何對(duì)NCI進(jìn)行建模與評(píng)測(cè)、如何發(fā)現(xiàn)影響NCI的關(guān)鍵因素.
需要開(kāi)展的研究工作包括4個(gè)方面:1)面向群體認(rèn)知的NCI協(xié)同學(xué)習(xí)模型(synergetics model);2)群體認(rèn)知行為對(duì)NCI的影響機(jī)理與關(guān)鍵因素;3)網(wǎng)絡(luò)化群體智能的涌現(xiàn)特性分析;4)基于NCI的知識(shí)聚合機(jī)理.
當(dāng)前對(duì)于教育大數(shù)據(jù)的分析,主要側(cè)重于相關(guān)性分析,對(duì)于因果關(guān)系分析的研究還非常薄弱,而后者是構(gòu)建智能化的導(dǎo)學(xué)、推薦、評(píng)價(jià)機(jī)制的重要依據(jù).然而,教育大數(shù)據(jù)的因果關(guān)系還面臨一系列技術(shù)難題:
1) 教育大數(shù)據(jù)包含了學(xué)習(xí)者、內(nèi)容、效果、行為等多個(gè)維度的變量.挖掘高維變量間的因果關(guān)系通常存在較高的復(fù)雜度.例如因果圖構(gòu)建的復(fù)雜度與變量個(gè)數(shù)呈指數(shù)函數(shù)關(guān)系[118].
2) 從高維的教育數(shù)據(jù)中識(shí)別出混淆因子(con-founder variables)和偏倚(selection bias)等隱變量也是一個(gè)難題.隱變量是指未能觀察或無(wú)法度量的變量[119],通常是事件的隱性致因,對(duì)于簡(jiǎn)化因果關(guān)系、提升其可解釋性具有重要作用.
圍繞上述難題,需要開(kāi)展的研究工作主要包括2個(gè)方面:1)針對(duì)教育數(shù)據(jù)的海量、高維和稀疏等特性,研究高效的因果圖生成方法,解決圖學(xué)習(xí)與方向?qū)W習(xí)中時(shí)空開(kāi)銷大的問(wèn)題;2)研究教育數(shù)據(jù)的隱變量識(shí)別問(wèn)題,并基于認(rèn)知科學(xué)分析因變量的可解釋性.
當(dāng)前,教育信息化經(jīng)歷了以解決教育資源及場(chǎng)景時(shí)空受限問(wèn)題的計(jì)算機(jī)輔助教學(xué)、網(wǎng)絡(luò)教育、MOOC等階段,逐步過(guò)渡到大數(shù)據(jù)、人工智能驅(qū)動(dòng)的智慧教育階段.由于具有智能導(dǎo)學(xué)、精準(zhǔn)推薦、定制輔導(dǎo)、精細(xì)評(píng)價(jià)等特點(diǎn),智慧教育成為國(guó)際上教育信息化發(fā)展的趨勢(shì),也成為一個(gè)熱點(diǎn)研究方向.本文在對(duì)國(guó)內(nèi)外智慧教育研究與應(yīng)用調(diào)研分析的基礎(chǔ)上,從教育大數(shù)據(jù)分析挖掘、主要教學(xué)環(huán)節(jié)的關(guān)鍵技術(shù)以及國(guó)內(nèi)外智慧教育平臺(tái)3個(gè)層次對(duì)國(guó)內(nèi)外相關(guān)研究進(jìn)行對(duì)比分析,總結(jié)了其特點(diǎn)與存在的問(wèn)題.本文進(jìn)一步分析了當(dāng)前智慧教育研究的局限性,總結(jié)了在線智能學(xué)習(xí)助手、學(xué)習(xí)者智能評(píng)估、網(wǎng)絡(luò)化群體認(rèn)知以及教育大數(shù)據(jù)的因果關(guān)系發(fā)現(xiàn)4項(xiàng)研究問(wèn)題,指出了智慧教育未來(lái)的研究趨勢(shì).