陳德鑫 占袁圓 楊兵
[摘? ?要] 隨著全球人工智能與教育大數(shù)據(jù)峰會(huì)的召開,多國學(xué)者探討了教育變革的新趨勢,印證了技術(shù)與教育深度融合會(huì)帶來更多的機(jī)遇和挑戰(zhàn)。其中,深度學(xué)習(xí)作為AI領(lǐng)域的熱點(diǎn)問題,將成為教育發(fā)展的關(guān)鍵。文章通過對(duì)相關(guān)研究進(jìn)行篩選統(tǒng)計(jì)研究,辨析不同領(lǐng)域深度學(xué)習(xí)的概念并簡要分析典型的深度學(xué)習(xí)模型及其應(yīng)用領(lǐng)域;以教育大數(shù)據(jù)挖掘的特點(diǎn)為基礎(chǔ),總結(jié)基于深度學(xué)習(xí)的教育大數(shù)據(jù)挖掘目的和流程;系統(tǒng)探討深度學(xué)習(xí)在教育大數(shù)據(jù)挖掘領(lǐng)域的四個(gè)應(yīng)用研究方向和主要應(yīng)用機(jī)構(gòu);最后,明確了教育大數(shù)據(jù)挖掘領(lǐng)域引入深度學(xué)習(xí)的重要意義,同時(shí),針對(duì)教育大數(shù)據(jù)挖掘所服務(wù)的對(duì)象和需要解決的問題,提出了深度學(xué)習(xí)技術(shù)在教育大數(shù)據(jù)挖掘領(lǐng)域進(jìn)一步發(fā)展的意見。
[關(guān)鍵詞] 深度學(xué)習(xí); 教育大數(shù)據(jù); 學(xué)習(xí)追蹤; 教學(xué)輔助; 學(xué)習(xí)行為
[中圖分類號(hào)] G434? ? ? ? ? ? [文獻(xiàn)標(biāo)志碼] A
[作者簡介] 陳德鑫(1989—),女,湖北武漢人。講師,博士,主要從事人工智能、教育大數(shù)據(jù)挖掘、情景感知計(jì)算研究。E-mail:202chendexin@163.com。
一、引? ?言
《中國基礎(chǔ)教育大數(shù)據(jù)發(fā)展藍(lán)皮書(2016—2017)》認(rèn)為,教育大數(shù)據(jù)挖掘是實(shí)現(xiàn)智慧教學(xué)的主要手段。教育大數(shù)據(jù)挖掘是指運(yùn)用相關(guān)大數(shù)據(jù)挖掘方法和技術(shù)對(duì)教育過程中產(chǎn)生的海量數(shù)據(jù)進(jìn)行處理、分析和建模,發(fā)現(xiàn)并解決教育過程中的問題,提高教育質(zhì)量[1-3]。隨著教育大數(shù)據(jù)挖掘研究的迅速發(fā)展以及相關(guān)學(xué)術(shù)會(huì)議、文獻(xiàn)期刊的增加,教育大數(shù)據(jù)挖掘的方法層出不窮。但傳統(tǒng)的數(shù)據(jù)挖掘方法存在的缺點(diǎn)仍有待解決,例如:樸素貝葉斯算法對(duì)數(shù)據(jù)輸入的表達(dá)形式很敏感;決策樹算法會(huì)忽視數(shù)據(jù)集之間的相關(guān)性,這些缺陷容易造成結(jié)果的偏差,影響教育大數(shù)據(jù)挖掘的準(zhǔn)確性。
研究者在教育領(lǐng)域中嘗試各種數(shù)據(jù)挖掘技術(shù),期望能夠發(fā)現(xiàn)更適用于精準(zhǔn)捕捉教育數(shù)據(jù)特征的技術(shù)。2017年的新媒體聯(lián)盟《地平線報(bào)告》中,來自世界各國的專家經(jīng)過探討都一致認(rèn)為,深度學(xué)習(xí)算法會(huì)對(duì)教育改革產(chǎn)生重大影響[4]。將深度學(xué)習(xí)技術(shù)應(yīng)用到教育大數(shù)據(jù)挖掘領(lǐng)域,能更好地描述教育數(shù)據(jù)的內(nèi)在信息,幫助教育研究者發(fā)現(xiàn)教育問題的關(guān)鍵。國外學(xué)者對(duì)于深度學(xué)習(xí)技術(shù)在教育大數(shù)據(jù)挖掘領(lǐng)域應(yīng)用的研究起步較早,Okoli和Schabram在2010年調(diào)查教育數(shù)據(jù)挖掘中使用深度學(xué)習(xí)技術(shù)情況的研究時(shí),已經(jīng)確定了深度學(xué)習(xí)技術(shù)可以幫助解決教育任務(wù)和教育數(shù)據(jù)挖掘中的研究問題[5]。國內(nèi)的研究起步則相對(duì)較晚,與教育數(shù)據(jù)挖掘相關(guān)的研究成果都主要致力于教育方面而非技術(shù)層面,關(guān)于深度學(xué)習(xí)技術(shù)在教育大數(shù)據(jù)挖掘領(lǐng)域的研究較少。本文通過闡述當(dāng)前深度學(xué)習(xí)技術(shù)在教育大數(shù)據(jù)挖掘領(lǐng)域的應(yīng)用情況,希望能為后續(xù)相關(guān)研究提供參考。
二、深度學(xué)習(xí)技術(shù)簡介
近年來,深度學(xué)習(xí)技術(shù)越來越廣泛地應(yīng)用到實(shí)際問題中,其價(jià)值得到了不同領(lǐng)域研究者的認(rèn)可。但人工智能領(lǐng)域和教育領(lǐng)域?qū)ι疃葘W(xué)習(xí)的定義有差異,本文首先探討人工智能領(lǐng)域和教育領(lǐng)域中深度學(xué)習(xí)概念的關(guān)系,并簡要分析數(shù)據(jù)挖掘中即人工智能領(lǐng)域典型的深度學(xué)習(xí)模型及其主要應(yīng)用。
(一)深度學(xué)習(xí)的概念
深度學(xué)習(xí)(Deep Learning)作為機(jī)器學(xué)習(xí)算法中的一項(xiàng)新技術(shù),于2006年被多倫多大學(xué)的Hinton教授提出[6]。深度學(xué)習(xí)的出現(xiàn)打破了神經(jīng)網(wǎng)絡(luò)發(fā)展的瓶頸,引起了學(xué)術(shù)界的重視。深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)是包括輸入層、隱藏層和輸出層的多層網(wǎng)絡(luò),它可以通過這種多層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)實(shí)現(xiàn)復(fù)雜函數(shù)的逼近。深度學(xué)習(xí)具備擬合任何復(fù)雜函數(shù)的特點(diǎn),不同的神經(jīng)網(wǎng)絡(luò)模型可以對(duì)不同類型的數(shù)據(jù)進(jìn)行特征提取,使得深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)對(duì)輸入數(shù)據(jù)有更強(qiáng)的識(shí)別能力。并且深度學(xué)習(xí)可以在隱藏層中存儲(chǔ)長期狀態(tài),這樣可以保存數(shù)據(jù)間的聯(lián)系。深度學(xué)習(xí)算法與其他的數(shù)據(jù)挖掘方法相比較,更具有靈活性和準(zhǔn)確性,它可以彌補(bǔ)許多數(shù)據(jù)挖掘方法的缺點(diǎn),其在語音識(shí)別、圖像識(shí)別、情感分析、學(xué)習(xí)預(yù)測、自然語言處理等多個(gè)領(lǐng)域發(fā)揮了重大作用。
除了人工智能(Artificial Intelligence,AI)領(lǐng)域中的深度學(xué)習(xí),在教育領(lǐng)域中也有深度學(xué)習(xí)的概念。1956年,布魯姆提出了“認(rèn)知有維度層次之分”的觀點(diǎn)[7]。1976年,針對(duì)淺層次的學(xué)習(xí),美國學(xué)者M(jìn)arton和S?覿lj?觟首次提出了關(guān)于高層次認(rèn)知方面的深度學(xué)習(xí)概念[8]。這里的深度學(xué)習(xí)是指對(duì)知識(shí)的深層次了解,使學(xué)習(xí)者開拓思維并注重學(xué)習(xí)者自身的思維養(yǎng)成。深度學(xué)習(xí)在教育領(lǐng)域受到了教育者的高度重視,每一個(gè)學(xué)習(xí)者通過深度學(xué)習(xí)都能在理解的基礎(chǔ)上更好地整合處理信息和學(xué)以致用,最終發(fā)散所學(xué)知識(shí)并提出更有創(chuàng)造性的觀點(diǎn)。
圖1? ?AI領(lǐng)域和教育領(lǐng)域中深度學(xué)習(xí)概念的關(guān)系
在教育數(shù)據(jù)挖掘領(lǐng)域中,無論是技術(shù)層面還是教育思維層面的深度學(xué)習(xí)都有著十分重要的作用。二者的研究范圍都是信息和知識(shí)的提取,它們的主要區(qū)別在于研究方向的不同。人工智能領(lǐng)域機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘中的深度學(xué)習(xí)與教育領(lǐng)域中的深度學(xué)習(xí)的關(guān)系如圖1所示,前者側(cè)重于教育智能化的研究,后者則側(cè)重于學(xué)習(xí)者本身對(duì)知識(shí)的掌握和運(yùn)用。通過深度學(xué)習(xí)技術(shù)驅(qū)動(dòng)學(xué)習(xí)者對(duì)知識(shí)更深層次的掌握,是將深度學(xué)習(xí)引入教育數(shù)據(jù)挖掘領(lǐng)域的研究意義。本文側(cè)重于AI領(lǐng)域的深度學(xué)習(xí)技術(shù)在教育大數(shù)據(jù)挖掘中的應(yīng)用分析,希望通過深度學(xué)習(xí)技術(shù)賦予教育大數(shù)據(jù)更多的價(jià)值。
(二)典型的深度學(xué)習(xí)模型
深度信念網(wǎng)絡(luò)(Deep Belief Networks,DBN)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)和遞歸神經(jīng)網(wǎng)絡(luò)(Recursive Neural Network,RNN)等是典型的、應(yīng)用較為廣泛的深度學(xué)習(xí)模型。
深度信念網(wǎng)絡(luò)是由若干個(gè)受限玻爾茲曼機(jī)和一層前饋神經(jīng)網(wǎng)絡(luò)組成,通過在各層之間進(jìn)行逐層訓(xùn)練,最終使輸出神經(jīng)元最大近似于輸入信號(hào)的分布[6]。卷積神經(jīng)網(wǎng)絡(luò)是一種深度前饋神經(jīng)網(wǎng)絡(luò),它由卷積層和池化層組成,其基本結(jié)構(gòu)分為特征提取層和特征映射層兩層[9]。CNN將原始信號(hào)作為輸入進(jìn)而減少了預(yù)處理的過程,其獨(dú)特的網(wǎng)絡(luò)結(jié)構(gòu)(利用權(quán)值共享降低模型復(fù)雜度),使得卷積神經(jīng)網(wǎng)絡(luò)得到了非常廣泛的應(yīng)用。循環(huán)神經(jīng)網(wǎng)絡(luò)的誕生是為了存儲(chǔ)輸入之間的聯(lián)系,以便模型更好地去理解事物。深度循環(huán)神經(jīng)網(wǎng)絡(luò)由輸入層、多個(gè)堆疊的隱藏層以及輸出層組成,通過在隱藏層的輸入中加入權(quán)重矩陣的值來達(dá)到循環(huán)運(yùn)算的目的[10]。長短時(shí)記憶網(wǎng)絡(luò)(Long Short Term Memory Networks,LSTM)是為了解決傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)存在梯度爆炸和梯度消失的問題而提出的特殊RNN,其通過新增的狀態(tài)來保存對(duì)長期數(shù)據(jù)的記憶,解決了長期依賴的問題,成為廣泛使用的RNN模型之一[11]。遞歸神經(jīng)網(wǎng)絡(luò)可以將信息循環(huán)傳遞,進(jìn)而更好地處理語義理解等方面的問題并進(jìn)行預(yù)測分析[12]。
隨著深度學(xué)習(xí)技術(shù)的發(fā)展,越來越多的深度學(xué)習(xí)模型被改進(jìn)或結(jié)合在一起解決更加復(fù)雜的問題。典型的深度學(xué)習(xí)模型的特點(diǎn)及適用范圍見表1,利用神經(jīng)網(wǎng)絡(luò)各模型的優(yōu)點(diǎn)構(gòu)建混合深度學(xué)習(xí)模型,更好地去處理問題是深度學(xué)習(xí)新的研究方向。
(三)深度學(xué)習(xí)技術(shù)的應(yīng)用
深度學(xué)習(xí)技術(shù)在問題的提取以及大數(shù)據(jù)的自動(dòng)化評(píng)估等方面具有非常良好的表現(xiàn)。隨著深度學(xué)習(xí)模型能力的逐漸強(qiáng)大,其對(duì)于數(shù)據(jù)的描述和解釋能夠更有層次化地展現(xiàn)出樣本特征。對(duì)于不同類型的數(shù)據(jù),在當(dāng)前一些領(lǐng)域中深度學(xué)習(xí)的應(yīng)用見表2。由于在教育活動(dòng)中產(chǎn)生的數(shù)據(jù)也可以按圖像、語音、文本這三個(gè)類型進(jìn)行分類,而基于深度學(xué)習(xí)技術(shù)在處理這些類型數(shù)據(jù)時(shí)優(yōu)越的表現(xiàn)力,可以將深度學(xué)習(xí)更好地應(yīng)用于教育數(shù)據(jù)挖掘領(lǐng)域。
三、基于深度學(xué)習(xí)技術(shù)的教育大數(shù)據(jù)挖掘
基于深度學(xué)習(xí)技術(shù)的教育大數(shù)據(jù)挖掘主要包含教育大數(shù)據(jù)的輸入、基于深度學(xué)習(xí)模型的教育大數(shù)據(jù)處理以及教育大數(shù)據(jù)挖掘結(jié)果的輸出。其中,教育大數(shù)據(jù)挖掘的特點(diǎn)決定教育大數(shù)據(jù)挖掘的輸入,而教育大數(shù)據(jù)挖掘的目的決定教育大數(shù)據(jù)挖掘結(jié)果的輸出,所使用的深度學(xué)習(xí)模型則根據(jù)不同模型的適用范圍由輸入和輸出共同決定。
(一)教育大數(shù)據(jù)挖掘的特點(diǎn)
教育數(shù)據(jù)挖掘是在大數(shù)據(jù)背景下理解教育問題的一個(gè)新方向。20世紀(jì)后期,教育領(lǐng)域開始引進(jìn)數(shù)據(jù)挖掘技術(shù),但數(shù)據(jù)的來源較少(一般來自調(diào)查問卷和信息管理軟件),且算法較為簡單,因此,研究非常受限制。21世紀(jì)以來,隨著科技的發(fā)展,教育數(shù)據(jù)采集越來越方便,且來源也更加廣泛。依據(jù)獲得數(shù)據(jù)的場合,教育大數(shù)據(jù)的來源可以分為四個(gè)方面:一是教育管理中的檔案數(shù)據(jù)庫,其記錄了學(xué)校、教師以及學(xué)生的基本信息;二是教學(xué)活動(dòng)過程中所產(chǎn)生的數(shù)據(jù),如學(xué)生的考試成績以及教師的授課評(píng)價(jià)等;三是學(xué)生成長過程中的行為記錄,如學(xué)生的閱讀記錄、健身記錄、興趣愛好等;四是教育科研活動(dòng)中的數(shù)據(jù),如研究課題、研究意義、論文發(fā)表情況等。在數(shù)據(jù)挖掘方面,挖掘方法也由之前較為單一的統(tǒng)計(jì)分析轉(zhuǎn)變?yōu)槔每梢暬⒕垲?、預(yù)測、文本挖掘以及本文所探討的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)等。
與傳統(tǒng)教育數(shù)據(jù)不同,教育大數(shù)據(jù)精準(zhǔn)涵蓋了與教育相關(guān)的所有記錄,具有數(shù)據(jù)量大、類型繁多、連續(xù)性強(qiáng)、價(jià)值密度低等特點(diǎn)。在教育大數(shù)據(jù)中,很多數(shù)據(jù)不能直接等同于教育信息,為了更好地挖掘教育大數(shù)據(jù)的內(nèi)涵,需要處理不同類型的數(shù)據(jù)。例如:校園的視頻監(jiān)控、拍照搜題以及在線學(xué)習(xí)中識(shí)別學(xué)習(xí)者的情緒等,需要使用圖像信息識(shí)別技術(shù);學(xué)生作業(yè)和考試分析、教育資源評(píng)價(jià)以及教師培訓(xùn)、備課輔助等,需要使用文本數(shù)據(jù)分析技術(shù);口語輔導(dǎo)軟件和學(xué)生演講的錄音識(shí)別需要使用語音數(shù)據(jù)分析技術(shù)。除此之外,一些更為復(fù)雜的高價(jià)值行為數(shù)據(jù)也可以劃分為圖像、語音、文本三類。鑒于深度學(xué)習(xí)在處理此三類數(shù)據(jù)時(shí)的優(yōu)異表現(xiàn)和良好應(yīng)用(見表2),為了更加精確和有效地發(fā)現(xiàn)教育問題的本質(zhì)進(jìn)而促進(jìn)智能教育的發(fā)展,很多學(xué)者將深度學(xué)習(xí)技術(shù)引入教育大數(shù)據(jù)挖掘領(lǐng)域。
(二)基于深度學(xué)習(xí)技術(shù)的教育大數(shù)據(jù)挖掘的目的
教育大數(shù)據(jù)挖掘面向的對(duì)象有學(xué)習(xí)者、教師、教育管理者以及教育研究者。如圖2所示,基于深度學(xué)習(xí)的教育大數(shù)據(jù)挖掘擬通過分類、預(yù)測、回歸、關(guān)聯(lián)規(guī)則挖掘等方法,為學(xué)習(xí)者制定合理的學(xué)習(xí)方案并輔助其進(jìn)行學(xué)習(xí);為教師提供學(xué)生狀態(tài)的監(jiān)測情況,便于教師及時(shí)對(duì)教案進(jìn)行調(diào)整并給出相應(yīng)的個(gè)性化指導(dǎo);為教育管理者提供連續(xù)的海量數(shù)據(jù),使他們能夠進(jìn)行全面的分析,從而規(guī)避片面性的決定,進(jìn)而為學(xué)生和教師提供更好的政策支持;為教育研究者預(yù)測教育發(fā)展趨勢,使研究追溯教育本質(zhì),為正確引領(lǐng)教育的發(fā)展方向給予更多科研成果支持。學(xué)習(xí)者、教師、教育管理者和教育研究者這四個(gè)群體都有其自身的變化過程,且不同群體之間相互關(guān)聯(lián)和影響,這些都是在教育大數(shù)據(jù)挖掘過程中表現(xiàn)出來的微觀層面的問題。同時(shí),在宏觀層面上,教育大數(shù)據(jù)挖掘能夠解決傳統(tǒng)
教育面臨的資源不協(xié)調(diào)、發(fā)展不均衡的問題。基于深度學(xué)習(xí)技術(shù)的教育大數(shù)據(jù)挖掘以微觀和宏觀的教育問題的本質(zhì)為導(dǎo)向,以期推動(dòng)教育事業(yè)走向智能化。
(三)基于深度學(xué)習(xí)技術(shù)的教育大數(shù)據(jù)挖掘流程
教育大數(shù)據(jù)的特征之一是復(fù)雜多樣性,即它可以從各種教育環(huán)境里不同對(duì)象的活動(dòng)中獲取。為了更好地從表征數(shù)據(jù)中提取有效、有價(jià)值的信息,基于深度學(xué)習(xí)技術(shù)的教育大數(shù)據(jù)挖掘的工作流程具體分為教育大數(shù)據(jù)獲取和預(yù)處理、深度學(xué)習(xí)模型對(duì)教育大數(shù)據(jù)的處理以及教育大數(shù)據(jù)挖掘應(yīng)用三個(gè)層次(如圖3所示)。
在教育大數(shù)據(jù)獲取和預(yù)處理中,根據(jù)數(shù)據(jù)的特點(diǎn),其采集和預(yù)處理的難度也在逐步增加。表現(xiàn)為量化結(jié)果的數(shù)據(jù)(如學(xué)生成績數(shù)據(jù))通常使用二維表存儲(chǔ),可直接進(jìn)行調(diào)用;而復(fù)雜的非結(jié)構(gòu)化數(shù)據(jù)(如學(xué)生行為數(shù)據(jù))的采集方式則較為多樣化,如使用物聯(lián)網(wǎng)感知技術(shù)、視頻監(jiān)控技術(shù)、智能錄播技術(shù)、在線學(xué)習(xí)與管理平臺(tái)技術(shù)等。針對(duì)教育大數(shù)據(jù)挖掘中不同服務(wù)對(duì)象的不同應(yīng)用目的,需要將原始數(shù)據(jù)進(jìn)行預(yù)處理。以數(shù)據(jù)生成和分類為目的,則需要使用有標(biāo)注的教育數(shù)據(jù)進(jìn)行有監(jiān)督學(xué)習(xí),即通過將教育數(shù)據(jù)分為訓(xùn)練集和驗(yàn)證集對(duì)模型進(jìn)行調(diào)參優(yōu)化以提高準(zhǔn)確率。以聚類和異常檢測為目的,可以采用無監(jiān)督學(xué)習(xí)自主識(shí)別模型規(guī)律,在大多數(shù)情況下也可以采用半監(jiān)督學(xué)習(xí),在降低成本的同時(shí)提高準(zhǔn)確率。對(duì)教育大數(shù)據(jù)進(jìn)行預(yù)處理后,需要對(duì)教育大數(shù)據(jù)集進(jìn)行變量轉(zhuǎn)換作為深度學(xué)習(xí)模型的輸入,即將圖像數(shù)據(jù)、文本數(shù)據(jù)、語音數(shù)據(jù)轉(zhuǎn)化為輸入向量。圖像數(shù)據(jù)主要利用一些軟件和工具進(jìn)行處理,如利用IMread函數(shù)把圖像轉(zhuǎn)化為矩陣向量,以此構(gòu)成特征圖作為深度學(xué)習(xí)模型的輸入。文本數(shù)據(jù)可以利用TF詞頻方法、TF-IDF詞頻—逆文檔頻率、One-hot以及Word2vec等方法進(jìn)行向量化,一般以一維向量的特征圖作為輸入。語音數(shù)據(jù)通過聲學(xué)特征提取,將每一幀波形變成一個(gè)多維的向量作為輸入。深度學(xué)習(xí)模型的輸出向量則以教育大數(shù)據(jù)挖掘的目的和服務(wù)的對(duì)象進(jìn)行向量輸出轉(zhuǎn)化。圖3所示的深度學(xué)習(xí)處理過程為通用的深度神經(jīng)網(wǎng)絡(luò)模型,在具體使用過程中應(yīng)根據(jù)教育大數(shù)據(jù)挖掘的目的和服務(wù)對(duì)象進(jìn)行深度學(xué)習(xí)模型選擇。
四、深度學(xué)習(xí)技術(shù)在教育大數(shù)據(jù)領(lǐng)域的應(yīng)用進(jìn)展
隨著深度學(xué)習(xí)技術(shù)在不同領(lǐng)域取得的巨大成功,近年國內(nèi)外越來越多的學(xué)者基于教育大數(shù)據(jù)的特點(diǎn)和挖掘目的將深度學(xué)習(xí)技術(shù)應(yīng)用到教育大數(shù)據(jù)挖掘領(lǐng)域。通過對(duì)相關(guān)文獻(xiàn)進(jìn)行整理和分析,基于深度學(xué)習(xí)的教育大數(shù)據(jù)挖掘的主要應(yīng)用研究方向涉及學(xué)生學(xué)習(xí)追蹤及表現(xiàn)預(yù)測、輔助教學(xué)、考試應(yīng)用、學(xué)生行為和心理識(shí)別等;微軟、谷歌、科大訊飛、IBM、百度、哈工大訊飛聯(lián)合實(shí)驗(yàn)室等主要機(jī)構(gòu)已將相關(guān)研究產(chǎn)品化。
(一)深度學(xué)習(xí)技術(shù)在教育大數(shù)據(jù)挖掘領(lǐng)域的應(yīng)用研究方向
本研究文獻(xiàn)檢索日期截至2018年6月30日,以深度學(xué)習(xí)、教育大數(shù)據(jù)、MOOC等為主要檢索主題詞,通過人工方式過濾掉教育領(lǐng)域關(guān)于高層次認(rèn)知思維上深度學(xué)習(xí)(即教育領(lǐng)域中非技術(shù)支持的深度學(xué)習(xí))的相關(guān)文章,共得到27篇文獻(xiàn)。其中,2015年5篇、2016年3篇、2017年14篇、2018年5篇,據(jù)此整理、分析出目前深度學(xué)習(xí)技術(shù)在教育大數(shù)據(jù)挖掘領(lǐng)域應(yīng)用的四個(gè)主要研究方向。
1. 基于深度學(xué)習(xí)的學(xué)生學(xué)習(xí)追蹤及表現(xiàn)預(yù)測
實(shí)時(shí)了解學(xué)生學(xué)習(xí)狀態(tài)并對(duì)學(xué)生的發(fā)展做出合理的預(yù)測,這對(duì)改善教學(xué)狀況、提高教學(xué)質(zhì)量有著十分重要的作用。由于影響學(xué)習(xí)狀況的因素十分復(fù)雜,傳統(tǒng)的建模方法不能很好地進(jìn)行學(xué)習(xí)追蹤,而深度學(xué)習(xí)技術(shù)可以利用任何可向量化的學(xué)生數(shù)據(jù)作為輸入且不需要特別的注解和標(biāo)記,這對(duì)于學(xué)生表現(xiàn)建模極具優(yōu)勢,因此,最終對(duì)學(xué)生績效的預(yù)測也十分準(zhǔn)確[22]。通過深度學(xué)習(xí)技術(shù)完成學(xué)生學(xué)習(xí)追蹤及表現(xiàn)預(yù)測,可以幫助教師與學(xué)生實(shí)現(xiàn)自動(dòng)反饋,因此,可以在教與學(xué)兩方面進(jìn)行同步改進(jìn)。基于深度學(xué)習(xí)的學(xué)生學(xué)習(xí)追蹤及表現(xiàn)預(yù)測相關(guān)研究見表3。已有研究主要從兩個(gè)方面展開:一是對(duì)學(xué)生平時(shí)的表現(xiàn)情況進(jìn)行數(shù)據(jù)建模來預(yù)測最終的學(xué)習(xí)表現(xiàn),如Kim等的GritNet模型(基于雙向長短時(shí)記憶模型)在收到某個(gè)給定學(xué)生8周數(shù)據(jù)后,在幾個(gè)星期內(nèi)提高學(xué)生畢業(yè)預(yù)測的準(zhǔn)確性[23];Okubo等使用循環(huán)神經(jīng)網(wǎng)絡(luò)挖掘教育系統(tǒng)中的日志數(shù)據(jù)預(yù)測學(xué)生最終成績,并通過實(shí)驗(yàn)證明RNN對(duì)最終成績的早期預(yù)測是有效的[24];Wang等將嵌入的程序輸入到一個(gè)循環(huán)的神經(jīng)網(wǎng)絡(luò)中,根據(jù)學(xué)生在完成一項(xiàng)練習(xí)時(shí)的連續(xù)快照分析他的學(xué)習(xí)能力,并在隨后的編程練習(xí)中預(yù)測學(xué)生的成果[25];Smith等構(gòu)建了基于深度學(xué)習(xí)的示意圖模型,利用學(xué)生繪制軌跡的時(shí)間和拓?fù)涮卣鱽眍A(yù)測學(xué)生的繪畫動(dòng)作[26];Piech等利用循環(huán)神經(jīng)網(wǎng)絡(luò)對(duì)一系列知識(shí)跟蹤數(shù)據(jù)集建模,預(yù)測學(xué)生學(xué)習(xí)情況[27]。二是用學(xué)生在其他環(huán)境中的表現(xiàn)來推測學(xué)生的學(xué)習(xí)認(rèn)知能力,如Min等基于深度學(xué)習(xí)提出一種新型評(píng)估框架,在一個(gè)基于游戲的學(xué)習(xí)環(huán)境中推斷學(xué)生的能力,對(duì)于準(zhǔn)確評(píng)估學(xué)習(xí)者的計(jì)算思維有很大幫助[28]。
2. 基于深度學(xué)習(xí)的教學(xué)輔助工具
新時(shí)代的教學(xué)模式擺脫了傳統(tǒng)的板書課堂,像線上學(xué)習(xí)、多媒體輔助教學(xué)、智能輔導(dǎo)系統(tǒng)等新技術(shù)帶來了更加豐富的學(xué)習(xí)體驗(yàn)。在基于深度學(xué)習(xí)的教學(xué)輔助工具的作用下,新時(shí)代的教學(xué)模式將得到進(jìn)一步豐富和改進(jìn)。表4列舉了深度學(xué)習(xí)技術(shù)下一些教學(xué)輔助工具的相關(guān)研究。近年來發(fā)展迅速的MOOC學(xué)習(xí)平臺(tái),在深度學(xué)習(xí)技術(shù)的支持下有三個(gè)方面的研究:一是通過模型預(yù)測輟學(xué)率來判斷學(xué)生是否會(huì)退出課程,如Xing等利用深度學(xué)習(xí)算法構(gòu)建輟學(xué)預(yù)測模型,進(jìn)一步預(yù)測個(gè)體學(xué)生的輟學(xué)概率[29];Wang等基于卷積神經(jīng)網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)的混合架構(gòu),提出了一種能夠自動(dòng)提取原始MOOC數(shù)據(jù)特征的模型,得到了與特征工程方法預(yù)測相似的結(jié)果[30]。二是有關(guān)MOOC論壇中的問題交流,如Lin等基于卷積神經(jīng)網(wǎng)絡(luò)對(duì)MOOC論壇中的討論主題進(jìn)行分類[31];Wei等針對(duì)不同課程中存在的偏差,提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)模型和長短期記憶模型的、名為ConvL的遷移學(xué)習(xí)框架,以自動(dòng)識(shí)別文本是否表達(dá)了困惑,并對(duì)帖子進(jìn)行情感極性分類,確定其需求緊急程度來及時(shí)地解決學(xué)習(xí)者的困惑[32]。三是MOOC平臺(tái)根據(jù)學(xué)生的特點(diǎn)推送個(gè)性化的教學(xué)資源,如Tang等使用長短時(shí)記憶模型預(yù)測學(xué)生的學(xué)習(xí)趨勢,為MOOC中尋找指導(dǎo)的學(xué)生提供廣泛的建議[33];在另一篇文章中,Tang等通過長短時(shí)記憶模型和遞歸網(wǎng)絡(luò)模型,根據(jù)學(xué)生的點(diǎn)擊流活動(dòng)預(yù)測學(xué)生行為,并在學(xué)習(xí)者陷入困難時(shí)向其提供資源[22]。除了MOOC平臺(tái)外,基于深度學(xué)習(xí)的教學(xué)輔助工具還以教學(xué)資源、科研論文、多媒體軟件、英語語音為挖掘?qū)ο?,如寇媛媛通過卷積神經(jīng)網(wǎng)絡(luò)模型表達(dá)教學(xué)資源的特征,實(shí)現(xiàn)精準(zhǔn)高效的移動(dòng)平臺(tái)教學(xué)資源推薦[34];Hassan等利用循環(huán)神經(jīng)網(wǎng)絡(luò)發(fā)現(xiàn)論文的連續(xù)和潛在語義特征,使研究人員用少量的時(shí)間找到滿意的研究文獻(xiàn)[35];劉瑞梅通過深度學(xué)習(xí)識(shí)別學(xué)習(xí)者對(duì)多媒體畫面的情感傾向,用以指導(dǎo)多媒體軟件制作,最終給用戶帶來更好的學(xué)習(xí)體驗(yàn)[36];陳嘉華基于深度學(xué)習(xí)進(jìn)行英語語音識(shí)別和發(fā)音質(zhì)量的研究,進(jìn)而有效地幫助學(xué)生進(jìn)行英語發(fā)音練習(xí)[37]。
3. 基于深度學(xué)習(xí)的考試應(yīng)用
考試作為考查學(xué)生學(xué)習(xí)成果的重要手段,在應(yīng)試教育中占有很高的地位,基于深度學(xué)習(xí)的考試應(yīng)用使考試更加便捷和高效。表5總結(jié)了深度學(xué)習(xí)技術(shù)支撐下的三個(gè)方面的考試應(yīng)用。一是作文自動(dòng)批改,如陳珊珊結(jié)合卷積神經(jīng)網(wǎng)絡(luò)模型和長短時(shí)記憶模型兩者的優(yōu)點(diǎn),設(shè)計(jì)并實(shí)現(xiàn)了作文自動(dòng)評(píng)分系統(tǒng),此系統(tǒng)在給出客觀評(píng)分的同時(shí),能夠?qū)ο鄳?yīng)的要點(diǎn)進(jìn)行反饋,最終讓用戶更好地理解作文的優(yōu)劣點(diǎn)[38];陳一樂通過卷積神經(jīng)網(wǎng)絡(luò)模型得到篇章表示,從而用篇章向量來完成評(píng)分任務(wù)實(shí)驗(yàn)[39];劉明楊利用深度學(xué)習(xí)中的受限玻爾茲曼機(jī)模型自動(dòng)學(xué)習(xí)作文的特征,并將其應(yīng)用到嶺回歸模型的訓(xùn)練和測試中,最終完成作文分?jǐn)?shù)預(yù)測[40]。二是數(shù)學(xué)自動(dòng)閱卷,如李磊在數(shù)學(xué)主觀題自動(dòng)閱卷中運(yùn)用深度學(xué)習(xí)技術(shù)的理念,基于此設(shè)計(jì)的系統(tǒng)對(duì)于提高閱卷效率以及減輕教師繁復(fù)的工作量有較大的幫助[41];劉逸雪等提出的基于Bi-LSTM的數(shù)學(xué)主觀題自動(dòng)閱卷方法,在客觀給出評(píng)分的同時(shí)提高教學(xué)效率[42]。三是以深度學(xué)習(xí)為基礎(chǔ)的智能命題考試建設(shè),試卷命題需要涵蓋所學(xué)知識(shí)點(diǎn)且還需要考察學(xué)生的綜合能力,而基于深度學(xué)習(xí)的智能命題可以通過組建題庫來很好地解決這一問題[43]。
4. 基于深度學(xué)習(xí)的學(xué)習(xí)者心理和行為分析
關(guān)注學(xué)生的心理活動(dòng)和行為表現(xiàn)能更好地引領(lǐng)其良好的自我意識(shí)和價(jià)值觀的形成?;谏疃葘W(xué)習(xí)的學(xué)習(xí)者心理和行為分析能夠幫助教師和教育管理者及時(shí)了解學(xué)習(xí)者的心理和行為,高效地給予其相應(yīng)的支持和幫助?;谏疃葘W(xué)習(xí)的學(xué)習(xí)者心理和行為分析研究總結(jié)見表6。Xiao等人通過深度信念網(wǎng)絡(luò)分析微博上大學(xué)生發(fā)布的經(jīng)歷文本,了解學(xué)生的身心發(fā)展和興趣愛好[44];廖鵬等人通過卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)學(xué)生課堂視頻中的目標(biāo)特征進(jìn)行提取,準(zhǔn)確識(shí)別學(xué)生的課堂異常行為,能夠讓教師及時(shí)發(fā)現(xiàn)學(xué)生存在的問題[45];曾志通過深度置信網(wǎng)絡(luò)挖掘大五人格特質(zhì)與人臉特征之間的關(guān)系,有效判斷學(xué)生的特質(zhì),進(jìn)而幫助教師對(duì)學(xué)生的潛力進(jìn)行挖掘[46]。
除了上述四個(gè)方面,基于深度學(xué)習(xí)的教育大數(shù)據(jù)挖掘還可以應(yīng)用到中文人物關(guān)系挖掘[47]和歷史知識(shí)庫標(biāo)注分類[48]等方面。隨著深度學(xué)習(xí)技術(shù)的日趨成熟和成功,其在教育大數(shù)據(jù)挖掘領(lǐng)域的研究內(nèi)容和研究范圍將不斷擴(kuò)展。
(二)深度學(xué)習(xí)技術(shù)在教育大數(shù)據(jù)挖掘領(lǐng)域的主要應(yīng)用機(jī)構(gòu)
以已有的理論研究為依托,一些機(jī)構(gòu)通過與高校合作或是自主研發(fā)將深度學(xué)習(xí)相關(guān)的技術(shù)應(yīng)用到教育大數(shù)據(jù)挖掘?qū)嵺`中,主要的應(yīng)用機(jī)構(gòu)及其產(chǎn)品見表7?;谏疃葘W(xué)習(xí)的教育大數(shù)據(jù)挖掘相關(guān)產(chǎn)品的研發(fā)主要集中在自然語言處理領(lǐng)域,即英語的聽說讀寫及翻譯;同時(shí)智能問答和搜索引擎等方面也是未來深度學(xué)習(xí)在教育大數(shù)據(jù)挖掘領(lǐng)域應(yīng)用研究的重點(diǎn)方向。
五、總結(jié)與展望
在實(shí)現(xiàn)教育現(xiàn)代化、智能化的過程中,深度學(xué)習(xí)技術(shù)具有不可替代的重要地位。盡管深度學(xué)習(xí)技術(shù)能給教育大數(shù)據(jù)挖掘帶來諸多幫助,但仍存在以下四個(gè)方面的問題有待進(jìn)一步研究:(1)教育大數(shù)據(jù)的質(zhì)量。教育大數(shù)據(jù)的復(fù)雜性和多樣性使其作為數(shù)據(jù)集來訓(xùn)練深度學(xué)習(xí)模型時(shí)存在很多問題,需要考慮數(shù)據(jù)的稀疏性、冗余性和缺失值。受限于現(xiàn)實(shí)條件,海量的教育數(shù)據(jù)無法做到在短時(shí)間內(nèi)高質(zhì)量的、全面的采集和處理,在分析過程中一些子目標(biāo)的缺失也會(huì)造成錯(cuò)誤的結(jié)果,所以提高教育大數(shù)據(jù)的質(zhì)量是影響深度學(xué)習(xí)技術(shù)在教育大數(shù)據(jù)挖掘領(lǐng)域應(yīng)用的關(guān)鍵。(2)深度學(xué)習(xí)技術(shù)的應(yīng)用范圍。從現(xiàn)有的研究中可以看到,使用深度學(xué)習(xí)技術(shù)進(jìn)行教育大數(shù)據(jù)挖掘的應(yīng)用范圍還很局限,基于深度學(xué)習(xí)的教育大數(shù)據(jù)挖掘的結(jié)果多服務(wù)于學(xué)習(xí)者和教師,而關(guān)于教育管理者在教育決策等方面的研究幾乎沒有。(3)基于深度學(xué)習(xí)的教育大數(shù)據(jù)挖掘的應(yīng)用的整體性。教育大數(shù)據(jù)挖掘的結(jié)果往往只被應(yīng)用于一個(gè)問題或一個(gè)層面的群體,不能很好地從整體層面去看待、解決問題。如何對(duì)資源進(jìn)行宏觀調(diào)控,把握好不同服務(wù)對(duì)象之間的相互影響,是解決教育均衡快速發(fā)展的前提。(4)深度學(xué)習(xí)模型結(jié)果的解釋。深度學(xué)習(xí)模型較難從外部理解其運(yùn)作,然而教育問題的研究除了追求挖掘模型性能的優(yōu)化,深度學(xué)習(xí)模型結(jié)果的教育解釋還需要深入探析。
由于國家對(duì)教育領(lǐng)域的發(fā)展十分重視,在未來,關(guān)于教育的需求一定是人們迫切關(guān)注的。我們已經(jīng)見證了深度學(xué)習(xí)巨大的魅力,相信隨著深度學(xué)習(xí)技術(shù)的逐漸成熟,它在教育大數(shù)據(jù)挖掘領(lǐng)域的進(jìn)一步發(fā)展能有效解決不足之處,可以在以下幾個(gè)方面做出努力:(1)產(chǎn)業(yè)專業(yè)化。培養(yǎng)一批掌握深度學(xué)習(xí)技術(shù)、懂得教育的人才,確定行業(yè)發(fā)展的重點(diǎn)方向,持續(xù)推進(jìn)教育大數(shù)據(jù)挖掘的有序發(fā)展。(2)極致體驗(yàn)。在學(xué)習(xí)分析與評(píng)測、在線與移動(dòng)學(xué)習(xí)環(huán)境構(gòu)建、虛擬與增強(qiáng)現(xiàn)實(shí)學(xué)習(xí)環(huán)境、教學(xué)知識(shí)可視化、教育智能體等教育信息科學(xué)與技術(shù)研究方向中,更多地去探索基于深度學(xué)習(xí)技術(shù)的教育大數(shù)據(jù)挖掘能帶來的幫助。(3)與教育管理者協(xié)同前進(jìn)。一方面通過教育大數(shù)據(jù)挖掘的結(jié)果指導(dǎo)管理者進(jìn)行精準(zhǔn)化管理,另一方面通過教育管理者實(shí)現(xiàn)多方平臺(tái)合作,發(fā)揮各方面的優(yōu)勢,同時(shí),推進(jìn)深度學(xué)習(xí)技術(shù)和教育應(yīng)用兩方面的進(jìn)步。相信未來在教育大數(shù)據(jù)挖掘領(lǐng)域,深度學(xué)習(xí)技術(shù)能為人們提供更多價(jià)值。
[參考文獻(xiàn)]
[1] 周慶,牟超,楊丹. 教育數(shù)據(jù)挖掘研究進(jìn)展綜述[J]. 軟件學(xué)報(bào),2015,26(11):3026-3042.
[2] BAKER R S,INVENTADO P S. Educational data mining and learning analytics[M] //Learning analytics. New York:Springer,2014:61-75.
[3] 舒忠梅,徐曉東. 學(xué)習(xí)分析視域下的大學(xué)生滿意度教育數(shù)據(jù)挖掘及分析[J]. 電化教育研究,2014(5):39-44.
[4] BECKER S A,CUMMINS M,DAVIS A,et al. NMC horizon report:2017 library edition[R]. Austin:The New Media Consortium,2017.
[5] OKOLI C,SCHABRAM K. A guide to conducting a systematic literature review of information systems research[J]. Ssrn electronic journal,2011,10:1-49.
[6] HINTON G E,OSINDERO S,TEH Y W. A fast learning algorithm for deep belief nets[J]. Neural computation,2006,18(7):1527-1554.
[7] 布盧姆. 教育目標(biāo)分類學(xué)[M]. 蔣小平,張琴美,羅晶晶,譯. 上海:華東師范大學(xué)出版社,1986.
[8] MARTON F,S?魧LJ?魻 R. On qualitative differences in learning:I—Outcome and process[J]. British journal of educational psychology, 1976,46(1):4-11.
[9] LECUN Y,BOTTOU L,BENGIO Y,et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998,86(11):2278-2324.
[10] KOUTNIK J,GREFF K,GOMEZ F,et al. A Clockwork RNN[J]. Computer science,2014:1863-1871.
[11] HOCHREITER S,SCHMIDHUBER J. Long short-term memory[J]. Neural computation,1997,9(8):1735-1780.
[12] POLLACK J B. The induction of dynamical recognizers[M]//Connectionist approaches to language learning. Boston:Springer,1991: 123-148.
[13] KRIZHEVSKY A,SUTSKEVER I,Hinton G E. ImageNet classification with deep convolutional neural networks[C]// Proceedings of International Conference on Neural Information Processing Systems. New York:Curran Associates Inc. 2012:1097-1105.
[14] 周凱龍. 基于深度學(xué)習(xí)的圖像識(shí)別應(yīng)用研究[D]. 北京:北京工業(yè)大學(xué),2016.
[15] BADRI H,YAHIA H,DAOUDI K. Fast and accurate texture recognition with multilayer convolution and multifractal analysis[C]// Proceedings of European Conference on Computer Vision. Cham:Springer,2014:505-519.
[16] 周燕. 基于語音稀疏表示的謊言檢測研究[D]. 蘇州:蘇州大學(xué),2017.
[17] 王冰倩. 基于深度學(xué)習(xí)的語音質(zhì)量評(píng)價(jià)方法研究[D]. 大連:大連理工大學(xué),2015.
[18] 李翔. 噪聲環(huán)境下基于深度學(xué)習(xí)的語音識(shí)別研究[D]. 武漢:武漢工程大學(xué),2017.
[19] 吳嘉偉. 電子病歷實(shí)體關(guān)系抽取研究[D]. 哈爾濱:哈爾濱工業(yè)大學(xué),2014.
[20] 梁軍,柴玉梅,原慧斌,等. 基于深度學(xué)習(xí)的微博情感分析[J]. 中文信息學(xué)報(bào),2014,28(5):155-161.
[21] 曹宇慧. 基于深度學(xué)習(xí)的文本情感分析研究[D]. 哈爾濱:哈爾濱工業(yè)大學(xué),2016.
[22] TANG S,PETERSON J C,PARDOS Z A. Deep neural networks and how they apply to sequential education data[C]// Proceedings of the Third (2016) ACM Conference on Learning @ Scale. New York:ACM,2016:321-324.
[23] KIM B H, VIZITEI E, GANAPATHI V.GritNet: student performance prediction with deep learning[EB/OL]. (2018-04-19) [2018-06-15].https://arxiv.org/pdf/1804.07405.pdf
[24] OKUBO F,YAMASHITA T,SHIMADA A,et al. A neural network approach for students' performance prediction[C]//Proceedings of the Seventh International Learning Analytics & Knowledge Conference. New York:ACM,2017: 598-599.
[25] WANG L,SY A,LIU L,et al.Deep knowledge tracing on programming exercises[C]//Proceedings of the Fourth(2017)ACM Conference on Learning@ Scale.New York:ACM,2017:201-204.
[26] SMITH A,MIN W,MOTT B W,et al. Diagrammatic student models:modeling student drawing performance with deep learning[C]//International Conference on User Modeling,Adaptation,and Personalization. Cham:Springer,2015:216-227.
[27] PIECH C,BASSEN J,HUANG J,et al. Deep knowledge tracing[J]. Computer science,2015,3(3):19-23.
[28] MIN W,F(xiàn)RANKOSKY M H,MOTT B W,et al. DeepStealth:leveraging deep learning models for stealth assessment in game-based learning environments[C]//Proceedings of the International Conference on Artificial Intelligence in Education. Cham:Springer,2015: 277-286.
[29] XING W,DU D. Dropout Prediction in MOOCs:using deep learning for personalized intervention[J]. Journal of educational computing research,2018,3:55-62.
[30] WANG W,YU H,MIAO C. Deep model for dropout prediction in MOOCs[C]//Proceedings of the 2nd International Conference on Crowd Science and Engineering. New York:ACM,2017: 26-32.
[31] LIN F,LEI W,LIU S,et al. Classification of discussion threads in MOOC forums based on deep learning[C]// Proceedings of the 2017 2nd International Conference on Wireless Communication and Network Engineering(WCNE 2017). Lancaster:DEStech Publications,2017:493-498.
[32] WEI X, LIN H,YANG L,et al. A convolution-lstm-based deep neural network for cross-domain MOOC forum post classification[J]. Information,2017,8(3):1-16.
[33] TANG S,PETERSON J C,PARDOS Z A. Modelling student behavior using granular large scaleaction data from a MOOC[EB/OL]. (2016-08-16) [2018-06-16]. https://arxiv.org/pdf/1608.04789.pdf
[34] 寇媛媛. 基于深度學(xué)習(xí)的在線教學(xué)推薦系統(tǒng)設(shè)計(jì)與研究[J]. 西安職業(yè)技術(shù)學(xué)院學(xué)報(bào),2017(3):11-14.
[35] HASSAN H A M. Personalized research paper recommendation using deep learning[C]// Proceedings of the 25th Conference on User Modeling,Adaptation and Personalization. New York:ACM,2017: 327-330.
[36] 劉瑞梅, 孟祥增. 基于深度學(xué)習(xí)的多媒體畫面情感分析[J]. 電化教育研究,2018,39(1):68-74.
[37] 陳嘉華. 基于深度學(xué)習(xí)的英語語音識(shí)別與發(fā)音質(zhì)量評(píng)價(jià)[D]. 廣州:廣東外語外貿(mào)大學(xué),2015.
[38] 陳珊珊. 自動(dòng)作文評(píng)分模型及方法研究[D]. 哈爾濱:哈爾濱工業(yè)大學(xué),2017.
[39] 陳一樂. 基于回歸分析的中文作文自動(dòng)評(píng)分技術(shù)研究[D]. 哈爾濱:哈爾濱工業(yè)大學(xué),2016.
[40] 劉明楊. 高考作文自動(dòng)評(píng)分關(guān)鍵技術(shù)研究[D]. 哈爾濱:哈爾濱工業(yè)大學(xué),2015.
[41] 李磊. 基于機(jī)器學(xué)習(xí)的中小學(xué)數(shù)學(xué)自動(dòng)閱卷系統(tǒng)研究與實(shí)現(xiàn)[D]. 桂林:廣西師范大學(xué),2017.
[42] 劉逸雪,盧雨軒,丁亮,等. 基于 Bi-LSTM 的數(shù)學(xué)主觀題自動(dòng)閱卷方法[J]. 管理觀察,2018 (2):109-113.
[43] 汪張龍. 人工智能技術(shù)在考試中的應(yīng)用[J]. 中國考試,2017(11):30-36.
[44] YU X,YU H,TIAN X Y,et al. Recognition of college students from Weibo with deep neural networks[J]. International journal of machine learning and cybernetics,2017,8(5):1447-1455.
[45] 廖鵬,劉宸銘,蘇航,等. 基于深度學(xué)習(xí)的學(xué)生課堂異常行為檢測與分析系統(tǒng)[J]. 電子世界,2018(8):97-98.
[46] 曾志. 基于人臉特征與深度學(xué)習(xí)的學(xué)生人格特質(zhì)分析[D]. 南昌:江西師范大學(xué),2017.
[47] 黃蓓靜. 深度學(xué)習(xí)技術(shù)在中文人物關(guān)系抽取中的應(yīng)用研究[D]. 上海:華東師范大學(xué),2017.
[48] 李依塵. 面向自動(dòng)問答的中學(xué)歷史知識(shí)庫構(gòu)建[D]. 哈爾濱:哈爾濱工業(yè)大學(xué),2017.