• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      國(guó)外基于數(shù)據(jù)挖掘的學(xué)習(xí)預(yù)警研究:回顧與展望

      2018-03-23 12:18肖巍倪傳斌李銳
      中國(guó)遠(yuǎn)程教育 2018年2期
      關(guān)鍵詞:數(shù)據(jù)挖掘預(yù)警預(yù)測(cè)

      肖巍 倪傳斌 李銳

      【摘 要】

      數(shù)據(jù)挖掘,又稱“數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)”,可通過一定的算法從大量數(shù)據(jù)中發(fā)現(xiàn)隱藏的模式與知識(shí)。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)挖掘技術(shù)為學(xué)習(xí)預(yù)警研究提供了新的視角與方法。結(jié)合文獻(xiàn)計(jì)量法和內(nèi)容分析法,從相關(guān)文獻(xiàn)的年度分布、學(xué)科分布、數(shù)據(jù)挖掘技術(shù)使用分布、研究熱點(diǎn)等方面對(duì)國(guó)外基于數(shù)據(jù)挖掘的學(xué)習(xí)預(yù)警研究進(jìn)行了系統(tǒng)性梳理,得出如下發(fā)現(xiàn):研究數(shù)量持續(xù)上升;研究話題得到來自不同學(xué)科學(xué)者的廣泛關(guān)注;挖掘技術(shù)以使用基本技術(shù)為主;研究熱點(diǎn)集中在預(yù)警指標(biāo)甄選、預(yù)警起始時(shí)間探測(cè)和預(yù)警模型效果評(píng)估三個(gè)方面。今后,研究者需要重視學(xué)習(xí)預(yù)警認(rèn)知基礎(chǔ)和運(yùn)作機(jī)制的探討,關(guān)注學(xué)習(xí)過程動(dòng)態(tài)指標(biāo),形成學(xué)科特異的研究范式,并進(jìn)一步推廣、發(fā)揮學(xué)習(xí)預(yù)警研究的應(yīng)用價(jià)值。通過回顧與展望,以期進(jìn)一步推動(dòng)國(guó)內(nèi)學(xué)習(xí)預(yù)警研究走向縱深,并促進(jìn)數(shù)據(jù)挖掘技術(shù)在教育技術(shù)領(lǐng)域的發(fā)展。

      【關(guān)鍵詞】 數(shù)據(jù)挖掘;學(xué)習(xí)分析;學(xué)習(xí)預(yù)警;預(yù)測(cè);分類;文獻(xiàn)計(jì)量;回顧;教育技術(shù)

      【中圖分類號(hào)】 G420 【文獻(xiàn)標(biāo)識(shí)碼】 A 【文章編號(hào)】 1009-458x(2018)2-0070-9

      一、選題緣起

      學(xué)習(xí)預(yù)警(early-warning for learning)指按照一定的標(biāo)準(zhǔn)綜合評(píng)估學(xué)生的背景信息、學(xué)習(xí)行為、考試成績(jī)等因素,按照評(píng)估結(jié)果向?qū)W生、教師等發(fā)出提示信號(hào),并及時(shí)提供有效且針對(duì)性強(qiáng)的干預(yù)建議(Macfadyen & Dawson, 2010)。構(gòu)建學(xué)習(xí)預(yù)警機(jī)制,既可為教學(xué)管理提供決策參考,又可為學(xué)生提供幫助和指導(dǎo);既是教學(xué)實(shí)踐的實(shí)際需求,又是教學(xué)研究中的一大熱點(diǎn)(Beck & Davison, 2001)。早期的學(xué)習(xí)預(yù)警研究大多基于思辨或依據(jù)期末成績(jī)等指標(biāo)進(jìn)行,存在指標(biāo)主觀單一、時(shí)間滯后等不足。近年來興起的數(shù)據(jù)挖掘技術(shù)則為學(xué)習(xí)預(yù)警研究提供了方法上新的切入點(diǎn),有力地推動(dòng)了學(xué)習(xí)預(yù)警研究的進(jìn)展。

      數(shù)據(jù)挖掘,又稱“數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)”,可通過一定的算法從大量數(shù)據(jù)中發(fā)現(xiàn)隱藏的模式與知識(shí)(Baker & Yacef, 2009)。數(shù)據(jù)挖掘的核心工作是建立模型。建立模型的常用方法有預(yù)測(cè)、聚類、關(guān)聯(lián)分析、時(shí)間序列分析等。相比描述統(tǒng)計(jì)、推斷統(tǒng)計(jì)等傳統(tǒng)的統(tǒng)計(jì)分析方法,數(shù)據(jù)挖掘在從大量的復(fù)雜數(shù)據(jù)中發(fā)現(xiàn)新模式與新知識(shí)時(shí)更有優(yōu)勢(shì)。

      從20世紀(jì)80年代起,數(shù)據(jù)挖掘技術(shù)開始應(yīng)用到教育教學(xué)領(lǐng)域,但相關(guān)成果不多。直到進(jìn)入21世紀(jì),在教育信息化的推動(dòng)下,數(shù)據(jù)挖掘技術(shù)才開始在教育教學(xué)領(lǐng)域大量推廣(Romero & Ventura, 2007; Pena-Ayala, 2014)。2012年美國(guó)教育部發(fā)布藍(lán)皮書《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》,2015年我國(guó)國(guó)務(wù)院發(fā)布的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》明確提出要建設(shè)教育文化大數(shù)據(jù),成立了“教育大數(shù)據(jù)應(yīng)用技術(shù)國(guó)家工程實(shí)驗(yàn)室”,標(biāo)志著教育數(shù)據(jù)挖掘在中美兩個(gè)大國(guó)都提高到了國(guó)家層面教育教學(xué)與人才培養(yǎng)的戰(zhàn)略高度。

      在“大數(shù)據(jù)時(shí)代”和“國(guó)家大數(shù)據(jù)”戰(zhàn)略背景下,亟待運(yùn)用數(shù)據(jù)挖掘技術(shù)豐富教育教學(xué)的研究手段并解決其中的實(shí)際問題。隨著數(shù)據(jù)挖掘技術(shù)在教育教學(xué)領(lǐng)域的推廣,該技術(shù)也開始應(yīng)用到學(xué)習(xí)預(yù)警研究當(dāng)中,并取得了大量成績(jī)。然而,在國(guó)內(nèi),學(xué)習(xí)預(yù)警研究尚處于起步階段,對(duì)學(xué)習(xí)預(yù)警研究的引介較多,實(shí)證研究較少。這些有限的實(shí)證研究大多在近幾年才出現(xiàn),研究主題也欠豐富(陳益均, 等, 2013; 孫力, 等, 2015, 2016; 施佺, 等, 2016; 賀超凱, 等, 2016; 尤佳鑫, 等, 2016; 胡祖輝, 等, 2017)。相比國(guó)外研究,國(guó)內(nèi)研究無論在廣度上還是深度上都需要加強(qiáng)。因此,本文通過對(duì)國(guó)外學(xué)習(xí)預(yù)警數(shù)據(jù)挖掘研究進(jìn)行回顧與展望,進(jìn)一步推動(dòng)國(guó)內(nèi)的學(xué)習(xí)預(yù)警研究走向縱深,并促進(jìn)數(shù)據(jù)挖掘技術(shù)在教育技術(shù)領(lǐng)域的發(fā)展。

      二、數(shù)據(jù)來源與方法

      選取Web of Science索引庫(kù)為文獻(xiàn)來源,以“educational data mining”“l(fā)earning analytics”“early warning”“academic performance prediction”“student retention”等為關(guān)鍵檢索詞,對(duì)過去十年(2007年-2017年3月)的相關(guān)文獻(xiàn)進(jìn)行檢索。由于會(huì)議論文(conference paper)一般篇幅較短,本研究不予考慮,只將期刊論文納入分析。剔除無關(guān)文獻(xiàn),并從有效文獻(xiàn)的參考文獻(xiàn)中繼續(xù)查找,最終得到有效文獻(xiàn)32篇。從數(shù)量看,學(xué)習(xí)預(yù)警數(shù)據(jù)挖掘研究尚未形成規(guī)模效應(yīng),其價(jià)值有待進(jìn)一步挖掘;從文獻(xiàn)質(zhì)量看,這些研究總體上較為嚴(yán)謹(jǐn),整體質(zhì)量較高,能夠反映學(xué)習(xí)預(yù)警數(shù)據(jù)挖掘研究的開展情況。

      對(duì)于這些文獻(xiàn),擬采用“先總后分”的方式進(jìn)行論述。具體地,首先采用文獻(xiàn)計(jì)量的方式對(duì)文獻(xiàn)的年度分布、學(xué)科分布、數(shù)據(jù)挖掘技術(shù)使用分布等方面的整體特點(diǎn)進(jìn)行梳理,然后采用內(nèi)容分析的方式對(duì)文獻(xiàn)的具體內(nèi)容進(jìn)行分析,歸納出研究熱點(diǎn)。

      三、結(jié)果分析與回顧

      (一)文獻(xiàn)分布特點(diǎn)

      1. 年度分布

      文獻(xiàn)的年度分布表明了研究的走勢(shì)。由圖1可見,基于數(shù)據(jù)挖掘的學(xué)習(xí)預(yù)警研究在第一個(gè)五年(2007-2011年)成果較少,偶有研究發(fā)表。但是在第二個(gè)五年(2012-2016年),相關(guān)研究的數(shù)量總體呈增長(zhǎng)趨勢(shì),在2015年和2016年兩年達(dá)到峰值,分別有8篇和7篇論文(由于2017年還未結(jié)束,這一年的3篇文獻(xiàn)未予顯示)。不難看出,論文數(shù)量的持續(xù)增長(zhǎng),表明數(shù)據(jù)挖掘技術(shù)在學(xué)習(xí)預(yù)警乃至教育領(lǐng)域不斷受到關(guān)注和重視。隨著大數(shù)據(jù)時(shí)代和“互聯(lián)網(wǎng)+”的到來,數(shù)據(jù)挖掘?qū)τ趶V大學(xué)者已經(jīng)不再是個(gè)陌生的名詞,而是不斷滲透到各個(gè)交叉學(xué)科領(lǐng)域。由于數(shù)據(jù)挖掘技術(shù)善于從大量的復(fù)雜數(shù)據(jù)中發(fā)現(xiàn)新模式與新知識(shí),故而特別適合研究復(fù)雜的教育教學(xué)現(xiàn)象。構(gòu)建學(xué)習(xí)預(yù)警機(jī)制正是數(shù)據(jù)挖掘技術(shù)在教育領(lǐng)域的具體應(yīng)用之一。今后,隨著數(shù)據(jù)挖掘技術(shù)的不斷普及,基于數(shù)據(jù)挖掘的學(xué)習(xí)預(yù)警研究有望持續(xù)走向縱深。

      2. 學(xué)科分布

      文獻(xiàn)發(fā)表期刊的學(xué)科分布表明了不同學(xué)科對(duì)學(xué)習(xí)預(yù)警這一研究問題的關(guān)注情況。對(duì)文獻(xiàn)所發(fā)表的期刊進(jìn)行歸納整理發(fā)現(xiàn)(見圖2):32篇論文發(fā)表在19種期刊,其中教育技術(shù)類8種,計(jì)算機(jī)類8種,教育類3種。這三類期刊分別發(fā)表了19篇、10篇和3篇論文。這表明,作為一個(gè)交叉研究領(lǐng)域,基于數(shù)據(jù)挖掘的學(xué)習(xí)預(yù)警研究受到了教育學(xué)、教育技術(shù)學(xué)、計(jì)算機(jī)科學(xué)等不同學(xué)科的廣泛關(guān)注。文獻(xiàn)作者的學(xué)科背景也能反映出學(xué)界對(duì)學(xué)習(xí)預(yù)警的關(guān)注情況。通過整理歸納通訊作者/第一作者所在的院系發(fā)現(xiàn)(見圖3):38%的作者為教育學(xué)背景,22%的作者為計(jì)算機(jī)背景,來自這兩個(gè)學(xué)科的作者占了一半以上。其余作者則來自管理學(xué)、經(jīng)濟(jì)學(xué)、信息科學(xué)、數(shù)學(xué)、心理學(xué)和工業(yè)工程等相近學(xué)科。這進(jìn)一步表明基于數(shù)據(jù)挖掘的學(xué)習(xí)預(yù)警研究受到了學(xué)界的廣泛關(guān)注。

      不同學(xué)科背景的學(xué)者在哪些期刊上發(fā)表研究則能反映不同學(xué)科之間的跨界與融合情況。期刊學(xué)科分布和作者學(xué)科分布的交叉列聯(lián)表(見表1)顯示:教育學(xué)和計(jì)算機(jī)背景的學(xué)者主要在教育技術(shù)類期刊發(fā)表論文,其他學(xué)科背景的學(xué)者在教育技術(shù)類期刊和計(jì)算機(jī)類期刊發(fā)表論文數(shù)量較為平均。由于教育數(shù)據(jù)挖掘是一個(gè)交叉領(lǐng)域,所以教育技術(shù)類期刊天然地成為相關(guān)研究發(fā)表的學(xué)術(shù)陣地。然而,應(yīng)當(dāng)看到,教育學(xué)背景的學(xué)者很少在計(jì)算機(jī)類期刊發(fā)文,計(jì)算機(jī)背景的學(xué)者也沒有在純教育類期刊發(fā)文。雖然學(xué)科之間的界限逐漸模糊,但距離深度的學(xué)科跨界與融合還有很長(zhǎng)的路要走。

      3. 數(shù)據(jù)挖掘技術(shù)使用分布

      數(shù)據(jù)挖掘的常用方法有預(yù)測(cè)/分類、聚類、關(guān)聯(lián)分析、時(shí)間序列分析等。預(yù)測(cè)/分類是根據(jù)輸入數(shù)據(jù)進(jìn)行學(xué)習(xí)訓(xùn)練建立模型,并對(duì)新數(shù)據(jù)進(jìn)行映射,預(yù)測(cè)它的取值(對(duì)于連續(xù)變量而言)或者所屬類別(對(duì)于離散變量而言)。聚類是通過捕獲數(shù)據(jù)的自然結(jié)構(gòu)將數(shù)據(jù)劃分成有意義或有用的群組或類別。關(guān)聯(lián)分析是通過頻繁項(xiàng)集的形式發(fā)現(xiàn)大型數(shù)據(jù)集中隱藏的有意義聯(lián)系。時(shí)間序列分析是對(duì)一系列時(shí)間點(diǎn)上的采樣數(shù)據(jù)進(jìn)行分析以發(fā)現(xiàn)其長(zhǎng)期趨勢(shì)和周期性變化特征。不同方法有各自不同的特點(diǎn)和使用范圍,需要根據(jù)具體研究加以采用。我們對(duì)文獻(xiàn)中使用到的數(shù)據(jù)挖掘方法進(jìn)行了統(tǒng)計(jì)。根據(jù)研究需要,很多研究者會(huì)采用不止一種方法,因此統(tǒng)計(jì)出的方法數(shù)量會(huì)超出文獻(xiàn)的數(shù)量。統(tǒng)計(jì)結(jié)果如圖4所示??梢钥吹?,預(yù)測(cè)/分類是學(xué)習(xí)預(yù)警數(shù)據(jù)挖掘研究中最常見的方法。這是學(xué)習(xí)預(yù)警研究的特點(diǎn)所決定的,因?yàn)閷W(xué)習(xí)預(yù)警的主要工作是預(yù)測(cè)某一課程最終的分?jǐn)?shù),或者根據(jù)某一課程是否能及格對(duì)學(xué)生進(jìn)行分類。此外,也有研究結(jié)合聚類、關(guān)聯(lián)分析、時(shí)間序列等多種方法解決學(xué)習(xí)預(yù)警問題。例如,先根據(jù)某些特征對(duì)學(xué)生進(jìn)行聚類,再對(duì)不同類別的學(xué)生能否及格進(jìn)行分類。

      由于預(yù)測(cè)/分類方法最為常見,使用最多,我們對(duì)文獻(xiàn)中使用的預(yù)測(cè)/分類技術(shù)進(jìn)行了統(tǒng)計(jì)(見圖5)。結(jié)果發(fā)現(xiàn):線性回歸和邏輯回歸的使用頻率最高,神經(jīng)網(wǎng)絡(luò)、決策樹和支持向量機(jī)的使用頻率次之,此外還有少量其他技術(shù)偶見使用。線性回歸和邏輯回歸是較為經(jīng)典和成熟的數(shù)據(jù)挖掘技術(shù),前者用于連續(xù)變量的預(yù)測(cè),后者用于離散變量的分類。神經(jīng)網(wǎng)絡(luò)是一種類似于大腦神經(jīng)突觸連接結(jié)構(gòu)的數(shù)學(xué)模型,具有并行分布式信息處理的能力,一般能達(dá)到較好的預(yù)測(cè)效果,具有較強(qiáng)的容錯(cuò)能力,但屬于內(nèi)部機(jī)制不透明的黑盒模型,其解釋性較弱。決策樹屬于白盒模型,通過從自變量中尋找最佳分割變量和最佳分割點(diǎn)將數(shù)據(jù)劃分為兩組,針對(duì)分組后的數(shù)據(jù)不斷重復(fù)上述步驟,直到滿足停止條件,并將探測(cè)過程以樹形結(jié)構(gòu)的形式呈現(xiàn)出來,其結(jié)果易于理解和解釋,但對(duì)缺失數(shù)據(jù)敏感。支持向量機(jī)以統(tǒng)計(jì)學(xué)中的VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理為基礎(chǔ),在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折中,其結(jié)構(gòu)簡(jiǎn)單,技術(shù)性能好,但同樣對(duì)缺失數(shù)據(jù)敏感。由于不同的技術(shù)有著各自的優(yōu)缺點(diǎn),研究者會(huì)根據(jù)研究需要選擇最為合適的技術(shù),通過多種技術(shù)構(gòu)建多個(gè)模型進(jìn)行評(píng)估,從中選出最優(yōu)模型。

      結(jié)合圖4和圖5可以發(fā)現(xiàn),盡管數(shù)據(jù)挖掘技術(shù)的使用分布較為廣泛,但所用的技術(shù)多為數(shù)據(jù)挖掘領(lǐng)域最基本的技術(shù)。對(duì)于目前數(shù)據(jù)挖掘領(lǐng)域的前沿技術(shù),如深度學(xué)習(xí)(deep learning)等,在學(xué)習(xí)預(yù)警領(lǐng)域尚未見應(yīng)用。此外,現(xiàn)在使用的技術(shù)也并非用于學(xué)習(xí)預(yù)警的專用技術(shù),不利于學(xué)習(xí)預(yù)警研究的深入和學(xué)科特異研究范式的構(gòu)建。今后,研究者應(yīng)當(dāng)嘗試使用新的前沿技術(shù),并開發(fā)適合學(xué)習(xí)預(yù)警的專用技術(shù)。

      (二)文獻(xiàn)研究熱點(diǎn)

      我們對(duì)文獻(xiàn)關(guān)鍵詞進(jìn)行了統(tǒng)計(jì)。由于有的關(guān)鍵詞意思相近,只是表述有細(xì)微差異,我們將這些相近的關(guān)鍵詞視作同一詞(如blended course和blended learning,data mining和data-mining)進(jìn)行合并整理,并制作出詞云圖(見圖6)。前十大關(guān)鍵詞分別為數(shù)據(jù)挖掘、預(yù)測(cè)、學(xué)習(xí)分析、在線學(xué)習(xí)、學(xué)業(yè)成就、學(xué)習(xí)管理系統(tǒng)、分類、留級(jí)、混合課堂和高等教育(見表2)。這十大關(guān)鍵詞從研究視角、研究?jī)?nèi)容、研究方法、數(shù)據(jù)來源、教學(xué)環(huán)境等不同方面勾勒出學(xué)習(xí)預(yù)警數(shù)據(jù)挖掘研究的全貌。研究視角方面,現(xiàn)有研究持有教育數(shù)據(jù)挖掘和學(xué)習(xí)分析兩種視角。這兩種視角互為補(bǔ)充,前者偏重?cái)?shù)據(jù)驅(qū)動(dòng),后者強(qiáng)調(diào)學(xué)習(xí)預(yù)警的現(xiàn)實(shí)解釋力度。研究?jī)?nèi)容方面,現(xiàn)有研究多關(guān)注學(xué)習(xí)成績(jī)和學(xué)生留級(jí),前者是通過對(duì)具體成績(jī)的預(yù)測(cè)實(shí)現(xiàn)預(yù)警,后者是通過對(duì)學(xué)生分類對(duì)劃入留級(jí)一類的學(xué)生進(jìn)行預(yù)警。研究方法方面,為了預(yù)測(cè)學(xué)習(xí)成績(jī)和成功劃分出留級(jí)的學(xué)生,現(xiàn)有研究多使用預(yù)測(cè)和分類兩種方法,前者適用于連續(xù)變量(如預(yù)測(cè)學(xué)習(xí)成績(jī)),后者適用于離散變量(如及格/不及格、留級(jí)/不留級(jí))。數(shù)據(jù)來源方面,現(xiàn)有研究多從學(xué)習(xí)管理系統(tǒng)(Learning Management System, LMS)獲取學(xué)生數(shù)據(jù)(如性別、專業(yè)、課程成績(jī)、績(jī)點(diǎn)等),表明現(xiàn)有的教育大數(shù)據(jù)得到了一定程度的挖掘,但更多數(shù)據(jù)來源(如學(xué)生社交平臺(tái)數(shù)據(jù)、學(xué)生上網(wǎng)數(shù)據(jù))并沒有進(jìn)入研究者的視野或得到充分利用。教學(xué)環(huán)境方面,多關(guān)注高等教育、在線學(xué)習(xí)和混合課堂,說明對(duì)信息化程度較高的大學(xué)教育以及獲取數(shù)據(jù)較為便利的網(wǎng)絡(luò)教學(xué)環(huán)境關(guān)注較多,而對(duì)中小學(xué)教育和傳統(tǒng)教學(xué)環(huán)境的關(guān)注可能不夠。

      結(jié)合文獻(xiàn)內(nèi)容進(jìn)行深度分析發(fā)現(xiàn):國(guó)際上基于數(shù)據(jù)挖掘的學(xué)習(xí)預(yù)警研究熱點(diǎn)可以歸結(jié)到橫截面、縱貫面和技術(shù)層面三個(gè)方面。這三個(gè)方面的研究呈遞進(jìn)關(guān)系,前者是后者的基礎(chǔ),后者是前者的深入。下面詳細(xì)討論。

      1. 橫截面:有效預(yù)警指標(biāo)的甄選

      在不考慮時(shí)間因素的橫截面(cross-sectional)上,研究熱點(diǎn)為有效預(yù)警指標(biāo)的甄選。由于學(xué)習(xí)預(yù)警的基本方法是通過一系列指標(biāo)對(duì)學(xué)生成績(jī)或?qū)W生是否及格/留級(jí)進(jìn)行預(yù)測(cè),因此,選擇有效的預(yù)警指標(biāo)是學(xué)習(xí)預(yù)警研究最為核心、最為基礎(chǔ)的研究問題之一。目前,研究者運(yùn)用決策樹、神經(jīng)網(wǎng)絡(luò)、邏輯回歸等預(yù)測(cè)和分類技術(shù)對(duì)采集到的數(shù)據(jù)進(jìn)行挖掘,業(yè)已探明一系列有效預(yù)警指標(biāo)。這些指標(biāo)可歸納為三類:第一類為人口統(tǒng)計(jì)學(xué)信息,如性別、專業(yè)、家庭經(jīng)濟(jì)狀況、父母文化程度、兄弟姐妹數(shù)量等;第二類為過去的學(xué)習(xí)成績(jī),如入學(xué)成績(jī)、績(jī)點(diǎn)等;第三類為當(dāng)前課程的學(xué)習(xí)過程,如教材學(xué)習(xí)情況、練習(xí)完成情況、網(wǎng)絡(luò)課堂登錄次數(shù)、發(fā)帖數(shù)、回帖數(shù)等。其中,人口統(tǒng)計(jì)學(xué)和過往學(xué)習(xí)成績(jī)兩類指標(biāo)為靜態(tài)指標(biāo),并非對(duì)學(xué)習(xí)過程的直接測(cè)量,只能通過一系列中介變量間接預(yù)測(cè)成績(jī);學(xué)習(xí)過程為動(dòng)態(tài)指標(biāo),通過評(píng)估學(xué)習(xí)過程中的實(shí)時(shí)動(dòng)態(tài)數(shù)據(jù)對(duì)學(xué)習(xí)結(jié)果進(jìn)行預(yù)警,可構(gòu)建“過程→結(jié)果”的因果鏈,具有較強(qiáng)的可解釋性。

      在實(shí)際研究當(dāng)中,研究者往往結(jié)合多類指標(biāo)共同預(yù)警,以達(dá)到比單一指標(biāo)更好的預(yù)警效果。這一點(diǎn)是由學(xué)習(xí)預(yù)警的理論基礎(chǔ)和方法基礎(chǔ)共同決定的。理論上,無論是學(xué)習(xí)者的背景信息、過去的學(xué)習(xí)成績(jī),還是當(dāng)前課程的學(xué)習(xí)過程,都會(huì)對(duì)學(xué)生最終的學(xué)習(xí)結(jié)果產(chǎn)生影響。只有從多個(gè)維度入手確定需要測(cè)量的指標(biāo),才能更加有效地預(yù)警。方法上,數(shù)據(jù)挖掘是一種數(shù)據(jù)驅(qū)動(dòng)的研究方法,要求盡可能利用現(xiàn)有數(shù)據(jù),挖掘出其中蘊(yùn)含的模式,而不一定局限于特定類別的數(shù)據(jù)。例如,Sen、Ucar和Delen(2012)對(duì)土耳其 5,000名中學(xué)生的人口統(tǒng)計(jì)學(xué)信息和過去的學(xué)習(xí)成績(jī)等數(shù)據(jù)進(jìn)行了挖掘,發(fā)現(xiàn)過去的考試經(jīng)驗(yàn)、是否獲得獎(jiǎng)學(xué)金、兄弟姐妹數(shù)量和上一年的平均績(jī)點(diǎn)分等指標(biāo)可以共同預(yù)警。Hachey、Wladis和Conway(2014)對(duì)某社區(qū)大學(xué)962名參加了在線課程學(xué)習(xí)的學(xué)生數(shù)據(jù)進(jìn)行挖掘,發(fā)現(xiàn)先前在線學(xué)習(xí)經(jīng)驗(yàn)比平均績(jī)點(diǎn)分的預(yù)測(cè)效果更好。

      同時(shí),應(yīng)該看到數(shù)據(jù)挖掘研究的特點(diǎn)是利用現(xiàn)有數(shù)據(jù),而不是根據(jù)一定的研究假設(shè)去專門采集數(shù)據(jù)。因此,如果現(xiàn)有數(shù)據(jù)有限,研究者通常只對(duì)該數(shù)據(jù)進(jìn)行挖掘。例如,Macfadyen和Dawson(2010)對(duì)學(xué)生在線行為數(shù)據(jù)進(jìn)行了挖掘,發(fā)現(xiàn)討論信息發(fā)布數(shù)量、郵件發(fā)送數(shù)量和完成的測(cè)驗(yàn)數(shù)量等指標(biāo)能有效預(yù)測(cè)期末成績(jī)。Romero、Lopez、Luna和Ventura(2013)研究了114名計(jì)算機(jī)專業(yè)的大一學(xué)生在線論壇的學(xué)習(xí)行為,發(fā)現(xiàn)發(fā)送消息的數(shù)量、單詞數(shù)、學(xué)生活躍中心度等指標(biāo)可以有效預(yù)測(cè)學(xué)生期末成績(jī)。這兩例研究都是從Moodle等在線學(xué)習(xí)平臺(tái)抓取學(xué)生的在線學(xué)習(xí)行為記錄,沒有專門采集學(xué)生的人口統(tǒng)計(jì)學(xué)信息等數(shù)據(jù),故只利用了學(xué)習(xí)過程數(shù)據(jù)進(jìn)行挖掘。

      2. 縱貫面:有效預(yù)警起始時(shí)間的探測(cè)

      在考慮時(shí)間因素的縱貫面(longitudinal)上,研究熱點(diǎn)為有效預(yù)警時(shí)間的探測(cè)。既然是預(yù)警,就需要及時(shí)發(fā)出預(yù)警信號(hào),在保證預(yù)警效果的前提下預(yù)警時(shí)間越早越好。在人口統(tǒng)計(jì)學(xué)信息、過去的學(xué)習(xí)成績(jī)、學(xué)習(xí)過程三類預(yù)警指標(biāo)中,學(xué)習(xí)過程數(shù)據(jù)具有動(dòng)態(tài)特性,若能跟蹤記錄學(xué)習(xí)過程數(shù)據(jù),就可以在學(xué)習(xí)過程中盡早預(yù)警。

      學(xué)者運(yùn)用縱貫研究設(shè)計(jì)和時(shí)間序列分析等技術(shù)發(fā)現(xiàn),在開課一段時(shí)間后即可進(jìn)行預(yù)警并干預(yù),無須等到結(jié)課后再補(bǔ)救。但是,對(duì)于最早從何時(shí)起可以獲得準(zhǔn)確有效的預(yù)警效果,學(xué)界的研究并不一致,從學(xué)期初到期中不等。例如,Lee、Sbeglia、Ha、Finch和Nehm(2015)跟蹤采集了287名美國(guó)大學(xué)本科生的課程形成性評(píng)估數(shù)據(jù),發(fā)現(xiàn)前兩周的課堂測(cè)驗(yàn)成績(jī)與期末成績(jī)相關(guān)性不高,但第三周的相關(guān)系數(shù)陡增,達(dá)到0.53,此后一直趨于穩(wěn)定。Marquez-Vera 等(2016)調(diào)查了419名墨西哥高一學(xué)生在一學(xué)期各個(gè)階段的數(shù)據(jù),發(fā)現(xiàn)在第二和第三階段(學(xué)期第4-6周)便已達(dá)到較好的預(yù)測(cè)效果。Huang 和Fang(2013)調(diào)查了323名本科生的績(jī)點(diǎn)、微積分、大學(xué)物理、動(dòng)力學(xué)期中考試成績(jī)等數(shù)據(jù),用以預(yù)測(cè)他們的工程動(dòng)力學(xué)課程成績(jī)。結(jié)果發(fā)現(xiàn),將期中考試成績(jī)加入預(yù)測(cè)模型可以達(dá)到更好的預(yù)測(cè)效果。由于該研究的學(xué)習(xí)過程數(shù)據(jù)僅有期中考試成績(jī)一項(xiàng),無法進(jìn)一步探究準(zhǔn)確的預(yù)警起始時(shí)間,但至少說明前半學(xué)期的表現(xiàn)可以有效預(yù)測(cè)期末成績(jī)。

      探測(cè)有效預(yù)警的起始時(shí)間對(duì)于教學(xué)有著重要的現(xiàn)實(shí)意義。比如,教學(xué)管理部門可以依據(jù)預(yù)警起始時(shí)間對(duì)選課系統(tǒng)進(jìn)行改進(jìn),為確定補(bǔ)退選截止日期提供更加科學(xué)合理的依據(jù)。選課系統(tǒng)可以根據(jù)學(xué)生形成性評(píng)估的表現(xiàn),提供即時(shí)排名,由學(xué)生決定是否繼續(xù)學(xué)習(xí)該課程。學(xué)生也可以通過預(yù)警系統(tǒng)提供的數(shù)據(jù)知曉自己在期末可能取得什么樣的成績(jī),從而采取相應(yīng)干預(yù)措施,如通知家長(zhǎng)、成立教師支持團(tuán)隊(duì)、提供個(gè)性化解決方案和學(xué)業(yè)警告等。

      3. 技術(shù)層面:預(yù)警模型效果評(píng)估

      若在技術(shù)層面對(duì)預(yù)警模型進(jìn)行對(duì)比和改進(jìn),就涉及到了模型效果評(píng)估的問題。模型對(duì)比,即結(jié)合多種技術(shù)進(jìn)行模型訓(xùn)練、測(cè)試與評(píng)估,綜合考慮準(zhǔn)確率(accuracy)、召回率(recall)、精度(precision)等多個(gè)評(píng)估指標(biāo),以及效率(efficiency)、可解釋性(interpretability)、可行性(deployability)等實(shí)際使用時(shí)需考慮的因素,對(duì)多個(gè)模型進(jìn)行對(duì)比,從中選出最優(yōu)模型(Romero, et al., 2013)。例如,Huang 等(2013)使用多元線性回歸、多層傳感網(wǎng)絡(luò)、徑向基函數(shù)網(wǎng)絡(luò)和支持向量機(jī)四種數(shù)學(xué)模型進(jìn)行期末成績(jī)預(yù)測(cè),發(fā)現(xiàn)四種模型的效果差異不大。Kotsiantis(2012)利用M5樹模型、M5規(guī)則樹模型、神經(jīng)網(wǎng)絡(luò)、線性回歸、局部加權(quán)線性回歸和支持向量機(jī)六種技術(shù)進(jìn)行預(yù)測(cè),發(fā)現(xiàn)M5規(guī)則樹模型準(zhǔn)確率最高,且可理解性最好。Sen 等(2012)對(duì)比了神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、決策樹和邏輯回歸以及四種預(yù)測(cè)/分類模型,發(fā)現(xiàn)決策樹模型的敏感度最高??傮w上,相比單一模型,模型對(duì)比可以發(fā)現(xiàn)潛在的更好的模型,獲得更好的預(yù)警效果。

      獲得更好效果的方法除了模型對(duì)比,還有模型改進(jìn),即通過算法優(yōu)化或利用現(xiàn)有模型組建新模型。Romero 等(2013)分別使用多種分類、聚類和關(guān)聯(lián)規(guī)則算法進(jìn)行挖掘,發(fā)現(xiàn)聚類與關(guān)聯(lián)規(guī)則相結(jié)合的算法比傳統(tǒng)的分類算法更具解釋力。Marbouti、Diefes-Dux和Madhavan(2016)調(diào)查了120名美國(guó)本科生的學(xué)習(xí)過程數(shù)據(jù),包括課堂測(cè)驗(yàn)、小組活動(dòng)、家庭作業(yè)、項(xiàng)目設(shè)計(jì)、書面考試等,使用邏輯回歸、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、k鄰近、決策樹和樸素貝葉斯六種模型進(jìn)行預(yù)測(cè),并結(jié)合兩種假負(fù)例最少(樸素貝葉斯、支持向量機(jī))和假正例最少(k鄰近)的模型構(gòu)建了一個(gè)組合模型,從而得到了最優(yōu)預(yù)測(cè)效果。Tsai、Tsai、Hung和Hwang(2011)使用三種聚類分析(k-均值聚類、自組織映射、二階聚類)根據(jù)性別、出生地、院系等數(shù)據(jù)對(duì)學(xué)生進(jìn)行聚類,再通過決策樹提取出有用的規(guī)則,對(duì)學(xué)生在一項(xiàng)計(jì)算機(jī)考試中不及格的概率進(jìn)行預(yù)測(cè),達(dá)到了較好的預(yù)警效果。Taylan和Karagozoglu(2009)利用模糊規(guī)則、神經(jīng)網(wǎng)絡(luò)、遺傳算法等技術(shù)構(gòu)建了一個(gè)預(yù)測(cè)學(xué)生學(xué)業(yè)表現(xiàn)的自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)模型,發(fā)現(xiàn)該模型的穩(wěn)健性和傳統(tǒng)統(tǒng)計(jì)模型相比無顯著差異,但對(duì)學(xué)業(yè)表現(xiàn)提供了一種更加自然的解釋途徑??傮w上,相比模型對(duì)比,模型改進(jìn)的預(yù)警效果往往更好,但其技術(shù)門檻往往也更高。

      相比指標(biāo)甄選和起始時(shí)間預(yù)測(cè),模型效果評(píng)估是學(xué)習(xí)預(yù)警研究中更加深入的問題。如果說預(yù)警指標(biāo)甄選和起始時(shí)間探測(cè)是學(xué)習(xí)預(yù)警的初步探索,那么模型效果評(píng)估就是在對(duì)這些初步探索進(jìn)行梳理和取舍的高級(jí)決策。如果可行,一項(xiàng)學(xué)習(xí)預(yù)警研究應(yīng)當(dāng)完整地包括這三個(gè)方面。例如:Hu、Lo和Shih(2014)首先通過數(shù)據(jù)預(yù)處理得到13個(gè)預(yù)警指標(biāo),包括4個(gè)時(shí)間相關(guān)指標(biāo)和9個(gè)時(shí)間無關(guān)指標(biāo)。然后,分別基于前4周、前8周和前13周的數(shù)據(jù)生成三個(gè)數(shù)據(jù)集,并分別使用C4.5、CART和邏輯回歸三種技術(shù)對(duì)這三個(gè)數(shù)據(jù)集進(jìn)行建模,得到9個(gè)模型。對(duì)這9個(gè)模型進(jìn)行基于I、II類錯(cuò)誤和準(zhǔn)確率的評(píng)估,淘汰邏輯回歸模型,保留C4.5和CART建立的6個(gè)模型。之后,對(duì)這6個(gè)模型分別用全部數(shù)據(jù)和不含時(shí)間相關(guān)指標(biāo)的數(shù)據(jù)進(jìn)行預(yù)測(cè),發(fā)現(xiàn)加入時(shí)間相關(guān)指標(biāo)的模型效果更好。最后,通過模型改進(jìn),發(fā)現(xiàn)集成了自適應(yīng)增強(qiáng)技術(shù)(AdaBoost)的CART模型效果最好。這一研究當(dāng)屬學(xué)習(xí)預(yù)警研究的典范。然而,現(xiàn)階段要求所有研究都如此完備不太現(xiàn)實(shí)。一方面,起始時(shí)間的預(yù)測(cè)往往需要縱貫設(shè)計(jì)和時(shí)間序列采樣,對(duì)研究投入要求較高,有的研究者可能難以承受;另一方面,模型評(píng)估的技術(shù)門檻較高,需要一定的數(shù)學(xué)和計(jì)算機(jī)基礎(chǔ),成為有些研究者的技術(shù)瓶頸。將來,隨著學(xué)習(xí)預(yù)警研究走向縱深,研究投入越來越大,跨學(xué)科人才和跨學(xué)科合作不斷增多,完備的學(xué)習(xí)預(yù)警研究必將不斷出現(xiàn)。

      四、研究不足與未來展望

      將新興的數(shù)據(jù)挖掘技術(shù)引入學(xué)習(xí)預(yù)警研究,使得學(xué)習(xí)預(yù)警這一古老的話題煥發(fā)出新的生命力,有望成為一個(gè)理論基礎(chǔ)寬厚、研究?jī)?nèi)容豐富、方法體系多樣、應(yīng)用前景廣闊的前沿交叉領(lǐng)域。然而,從現(xiàn)有文獻(xiàn)來看,學(xué)習(xí)預(yù)警研究在理論、內(nèi)容、方法和應(yīng)用方面均存在一些問題和不足。對(duì)這些問題和不足進(jìn)行分析和梳理,有利于更加精準(zhǔn)地把握該領(lǐng)域的研究現(xiàn)狀和展望其未來研究動(dòng)向,更加科學(xué)地利用數(shù)據(jù)挖掘技術(shù)進(jìn)行學(xué)習(xí)預(yù)警研究。

      (一)理論上,學(xué)習(xí)預(yù)警的認(rèn)知基礎(chǔ)和運(yùn)作機(jī)制尚待厘清

      理論研究是一個(gè)領(lǐng)域的基石,對(duì)該領(lǐng)域的研究發(fā)展有著引領(lǐng)作用。當(dāng)前,學(xué)習(xí)預(yù)警理論研究中亟待突破的一個(gè)關(guān)鍵點(diǎn)是厘清學(xué)習(xí)預(yù)警的認(rèn)知基礎(chǔ)和運(yùn)作機(jī)制:在內(nèi)部,從生理、心理、社會(huì)文化層面精準(zhǔn)把握學(xué)生的認(rèn)知活動(dòng);在外部,將認(rèn)知活動(dòng)放到學(xué)習(xí)預(yù)警的大環(huán)境中進(jìn)行討論,對(duì)學(xué)習(xí)預(yù)警的各個(gè)環(huán)節(jié)和組塊進(jìn)行構(gòu)建和優(yōu)化。將認(rèn)知視角與社會(huì)視角相結(jié)合,無疑會(huì)為學(xué)習(xí)預(yù)警研究奠定堅(jiān)實(shí)的理論基礎(chǔ)。然而,目前尚未見到學(xué)習(xí)預(yù)警的理論研究文獻(xiàn)。誠(chéng)然,部分學(xué)者在實(shí)證研究中進(jìn)行了理論探討,如Agudo-Peregrina等(2014)為了研究虛擬現(xiàn)實(shí)環(huán)境和在線學(xué)習(xí)環(huán)境下交互性(interaction)的預(yù)警效果,對(duì)交互性的定義和內(nèi)涵進(jìn)行了系統(tǒng)梳理和深入探討。但總體而言,學(xué)習(xí)預(yù)警理論研究并未取得實(shí)質(zhì)性突破。

      理論研究薄弱還與實(shí)證和方法上的欠缺有關(guān)。實(shí)證方面,雖然現(xiàn)有研究數(shù)量持續(xù)上升,但絕對(duì)數(shù)量仍然不多,未能對(duì)各種課堂環(huán)境和學(xué)科開展具化研究,無法給學(xué)習(xí)預(yù)警理論構(gòu)建提供堅(jiān)實(shí)的實(shí)證基礎(chǔ)。方法方面,現(xiàn)有研究多側(cè)重于純數(shù)據(jù)驅(qū)動(dòng),脫離教學(xué)環(huán)境和理論闡釋,在研究框架構(gòu)擬、數(shù)據(jù)采集和數(shù)據(jù)解釋等方面缺乏理論支撐。有的研究建立內(nèi)部不透明的黑盒模型,只能給出最終運(yùn)行結(jié)果,無法觀察內(nèi)部運(yùn)行過程。有的研究雖然采用內(nèi)部透明的白盒模型,但并未在教學(xué)理論的指導(dǎo)下系統(tǒng)地采集數(shù)據(jù),只是利用現(xiàn)有的零散數(shù)據(jù)進(jìn)行挖掘分析,導(dǎo)致對(duì)預(yù)警結(jié)果的闡釋牽強(qiáng)。缺乏理論指導(dǎo)的實(shí)證研究容易陷入“各自為戰(zhàn)”的局面,難以提供匯流式的證據(jù)支撐。

      厘清學(xué)習(xí)預(yù)警的認(rèn)知基礎(chǔ)和運(yùn)作機(jī)制,需從以下三個(gè)方面著手:理論方面,學(xué)習(xí)預(yù)警研究者應(yīng)當(dāng)積極借鑒教育心理學(xué)、社會(huì)心理學(xué)、學(xué)習(xí)科學(xué)等不同學(xué)科的理論和模型(如活動(dòng)理論、交互理論、形成性評(píng)估理論等),夯實(shí)學(xué)習(xí)預(yù)警研究的理論基礎(chǔ);實(shí)證方面,重視預(yù)警機(jī)制的教學(xué)環(huán)境差異,對(duì)不同課堂環(huán)境(網(wǎng)絡(luò)課堂、傳統(tǒng)課堂、混合課堂)和學(xué)科(生物、數(shù)學(xué)、計(jì)算機(jī)等)開展更加微觀、具化的研究,尤其要關(guān)注數(shù)據(jù)采集不便的主流教學(xué)環(huán)境——傳統(tǒng)課堂,以及技術(shù)手段偏弱的傳統(tǒng)文科課堂,在大量實(shí)證研究的基礎(chǔ)上進(jìn)行理論構(gòu)建;方法方面,選取內(nèi)部透明的白盒模型,結(jié)合具體理論或模型進(jìn)行挖掘,對(duì)挖掘結(jié)果進(jìn)行基于理論的闡釋,以增強(qiáng)結(jié)果的可解釋性。

      (二)實(shí)證上,學(xué)習(xí)預(yù)警指標(biāo)的甄選對(duì)動(dòng)態(tài)數(shù)據(jù)關(guān)注不夠

      現(xiàn)有研究對(duì)人口統(tǒng)計(jì)學(xué)信息和過去學(xué)習(xí)成績(jī)等靜態(tài)指標(biāo)關(guān)注較多,而對(duì)學(xué)習(xí)過程動(dòng)態(tài)指標(biāo)關(guān)注不夠。誠(chéng)然,靜態(tài)數(shù)據(jù)便于采集,也有一定的預(yù)測(cè)效力,但具有一定局限性。首先,靜態(tài)指標(biāo)已無法通過教學(xué)活動(dòng)和學(xué)生主觀努力加以改變。若過分依賴靜態(tài)指標(biāo),容易導(dǎo)致學(xué)生認(rèn)為自己的學(xué)習(xí)結(jié)果早已被這些無法改變的因素所決定,從而喪失學(xué)習(xí)積極性。例如,Hendel(2007)發(fā)現(xiàn)本科生的高中學(xué)校排名和學(xué)生所在族裔能顯著影響學(xué)生大一結(jié)束時(shí)的退學(xué)率。此類發(fā)現(xiàn)雖然具有統(tǒng)計(jì)學(xué)意義,卻難以對(duì)學(xué)習(xí)預(yù)警提供具有教學(xué)指導(dǎo)意義的反饋,因?yàn)閷W(xué)生無法通過改變自身高中學(xué)校或者族裔來降低退學(xué)的可能性。為了通過學(xué)習(xí)預(yù)警充分激發(fā)和調(diào)動(dòng)學(xué)生的學(xué)習(xí)積極性,在甄選指標(biāo)時(shí)應(yīng)當(dāng)更加關(guān)注學(xué)生在學(xué)習(xí)過程中可以通過自身努力加以改變的動(dòng)態(tài)指標(biāo)。其次,關(guān)注動(dòng)態(tài)指標(biāo)與學(xué)習(xí)的特點(diǎn)和評(píng)估機(jī)制相契合。從學(xué)習(xí)的特點(diǎn)看,學(xué)習(xí)不是簡(jiǎn)單的輸入-輸出線性過程,而是充滿倒退、停滯甚至跳躍式前進(jìn)的動(dòng)態(tài)系統(tǒng)行為(Larsen-Freeman, 1997)。因此,單純依靠靜態(tài)指標(biāo)無法監(jiān)測(cè)學(xué)習(xí)的動(dòng)態(tài)發(fā)展過程。從學(xué)習(xí)的評(píng)估機(jī)制看,對(duì)學(xué)習(xí)的評(píng)估必須通過觀察學(xué)生的學(xué)習(xí)行為表現(xiàn)來診斷其學(xué)習(xí)狀況,得出評(píng)估結(jié)果并加以解釋和使用,從而激發(fā)和調(diào)動(dòng)學(xué)生的學(xué)習(xí)意識(shí)和學(xué)習(xí)積極性(Lynch, 2016)。評(píng)估的目的不僅僅是為了測(cè)量,而是為了以評(píng)促學(xué)(Rea-Dickins, 2001)。因此,單純的靜態(tài)指標(biāo)無法滿足形成性評(píng)估的需求。綜上所述,只有對(duì)學(xué)習(xí)過程進(jìn)行動(dòng)態(tài)監(jiān)測(cè)與評(píng)估,才能更好地進(jìn)行學(xué)習(xí)預(yù)警。

      (三)方法上,學(xué)習(xí)預(yù)警尚未形成學(xué)科特異的數(shù)據(jù)挖掘研究范式

      學(xué)習(xí)預(yù)警研究領(lǐng)域的數(shù)據(jù)具有如下特點(diǎn):一是來源廣泛,可能來自網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)、教學(xué)管理系統(tǒng)、調(diào)查問卷、課堂測(cè)驗(yàn)等線上線下多種渠道;二是結(jié)構(gòu)各異,有結(jié)構(gòu)化數(shù)據(jù)(如問卷中的李克特量表),也有半結(jié)構(gòu)化(如問卷中的主觀性問題)甚至非結(jié)構(gòu)化的數(shù)據(jù)(如網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)中的圖片、視頻信息);三是缺失程度不同,有的數(shù)據(jù)可能較為完整(如教學(xué)管理系統(tǒng)中的學(xué)生個(gè)人信息),有的可能存在缺失(如測(cè)驗(yàn)中的空白題);四是樣本量可能相對(duì)較小,不能簡(jiǎn)單照搬金融、管理等領(lǐng)域基于大樣本的技術(shù);五是正、負(fù)例失衡且正例過少(一般情況下,能夠通過課程考試、無須預(yù)警的學(xué)生居多,而考試不及格、需要預(yù)警的學(xué)生占少數(shù)),容易導(dǎo)致模型擬合不足,加大了對(duì)需要預(yù)警的學(xué)生的識(shí)別難度。這些特點(diǎn)對(duì)數(shù)據(jù)挖掘技術(shù)提出了新的要求。進(jìn)行學(xué)習(xí)預(yù)警數(shù)據(jù)挖掘時(shí),既要遵循數(shù)據(jù)挖掘的一般工作流程和研究范式,又要結(jié)合學(xué)習(xí)預(yù)警的特點(diǎn)進(jìn)行改進(jìn),充分利用和整合各種渠道的數(shù)據(jù)開發(fā)專用數(shù)據(jù)挖掘技術(shù),逐漸形成學(xué)習(xí)預(yù)警乃至教育技術(shù)領(lǐng)域?qū)W科特異的數(shù)據(jù)挖掘研究范式。

      (四)應(yīng)用上,學(xué)習(xí)預(yù)警系統(tǒng)有待進(jìn)一步推廣,為學(xué)生精準(zhǔn)預(yù)警提供個(gè)性化服務(wù)

      基于學(xué)習(xí)預(yù)警研究成果,可以開發(fā)學(xué)習(xí)預(yù)警系統(tǒng),為教育政策制定、教學(xué)資源規(guī)劃和教學(xué)方法實(shí)施提供決策支撐,并為學(xué)生發(fā)現(xiàn)學(xué)習(xí)困難、改善學(xué)習(xí)狀態(tài)、提升學(xué)習(xí)效果提供幫助和指導(dǎo)。目前,國(guó)外已開發(fā)了一些學(xué)習(xí)預(yù)警系統(tǒng),如美國(guó)普渡大學(xué)的課程信號(hào)系統(tǒng)、亞利桑那州立大學(xué)的電子顧問、可汗學(xué)院的學(xué)習(xí)儀表盤等(王林麗, 等, 2016)。這些系統(tǒng)在教學(xué)實(shí)踐中的應(yīng)用又可以回饋、促進(jìn)學(xué)習(xí)預(yù)警研究的發(fā)展(Krume, et al., 2014)。然而,現(xiàn)有的學(xué)習(xí)預(yù)警系統(tǒng)在技術(shù)和應(yīng)用層面均存在不足。在技術(shù)層面,現(xiàn)有學(xué)習(xí)預(yù)警系統(tǒng)雖然較為豐富,但其底層技術(shù)并非學(xué)習(xí)預(yù)警專用技術(shù),仍以數(shù)據(jù)挖掘領(lǐng)域最基本的技術(shù)為主。在應(yīng)用層面,現(xiàn)有系統(tǒng)多為宏觀的通用平臺(tái),尚未做到針對(duì)每一門具體課程進(jìn)行專門預(yù)警。誠(chéng)然,為避免重復(fù)建設(shè),最理想的狀態(tài)是設(shè)計(jì)一套通用的預(yù)警模型和方法(Kotsiantis, 2012; 劉三女牙, 等, 2016)。然而,在現(xiàn)階段,學(xué)界對(duì)不同學(xué)科、不同課堂的微觀研究還未深入。只有當(dāng)特異化的微觀研究已經(jīng)很充分之后,才可能在此基礎(chǔ)上構(gòu)建一個(gè)統(tǒng)一的宏觀平臺(tái)。因此,在相當(dāng)長(zhǎng)的時(shí)期內(nèi)還應(yīng)以特異化的微觀研究為主,未來應(yīng)當(dāng)針對(duì)不同課堂和學(xué)科的特點(diǎn)開發(fā)個(gè)性化的學(xué)習(xí)預(yù)警系統(tǒng),為學(xué)生精準(zhǔn)預(yù)警提供個(gè)性化服務(wù),進(jìn)一步應(yīng)用學(xué)習(xí)預(yù)警研究的成果。

      五、結(jié)語(yǔ)

      本文通過對(duì)國(guó)外基于數(shù)據(jù)挖掘的學(xué)習(xí)預(yù)警研究文獻(xiàn)進(jìn)行了系統(tǒng)性梳理發(fā)現(xiàn):研究數(shù)量持續(xù)上升;研究話題得到來自不同學(xué)科學(xué)者的廣泛關(guān)注;挖掘技術(shù)以使用基本技術(shù)為主,尚未開發(fā)用于學(xué)習(xí)預(yù)警的專用技術(shù);研究熱點(diǎn)集中在預(yù)警指標(biāo)甄選、預(yù)警起始時(shí)間探測(cè)和預(yù)警模型效果評(píng)估三個(gè)方面。今后,研究者需要重視學(xué)習(xí)預(yù)警認(rèn)知基礎(chǔ)和運(yùn)作機(jī)制的探討,關(guān)注學(xué)習(xí)過程動(dòng)態(tài)指標(biāo),形成學(xué)科特異的研究范式,并進(jìn)一步推廣、發(fā)揮學(xué)習(xí)預(yù)警研究的應(yīng)用價(jià)值。

      我國(guó)是一個(gè)教育大國(guó)。在大數(shù)據(jù)時(shí)代,如何利用教育大數(shù)據(jù)改進(jìn)我們的教育教學(xué)?基于數(shù)據(jù)挖掘的學(xué)習(xí)預(yù)警研究無疑是一個(gè)值得關(guān)注的話題。國(guó)內(nèi)的學(xué)習(xí)預(yù)警研究近年來雖然有所發(fā)展,但總體上起步較晚,研究數(shù)量不多;研究主題欠豐富,主要集中在預(yù)警指標(biāo)甄選,對(duì)于預(yù)警起始時(shí)間探測(cè)和模型效果評(píng)估尚未涉及。相比國(guó)外研究,國(guó)內(nèi)研究無論在研究廣度還是深度上都需要極大加強(qiáng)。本文通過對(duì)國(guó)外基于數(shù)據(jù)挖掘的學(xué)習(xí)預(yù)警研究進(jìn)行回顧與展望,希冀進(jìn)一步推動(dòng)國(guó)內(nèi)的學(xué)習(xí)預(yù)警研究走向縱深,并促進(jìn)數(shù)據(jù)挖掘技術(shù)在教育技術(shù)領(lǐng)域的發(fā)展。

      [參考文獻(xiàn)]

      陳益均,殷莉. 2013. 基于數(shù)據(jù)挖掘的學(xué)生成績(jī)影響模型的研究[J]. 現(xiàn)代教育技術(shù),23(1):94-96.

      賀超凱,吳蒙. 2016. edX平臺(tái)教育大數(shù)據(jù)的學(xué)習(xí)行為分析與預(yù)測(cè)[J]. 中國(guó)遠(yuǎn)程教育(6):54-59.

      胡祖輝,施佺. 2017. 高校學(xué)生上網(wǎng)行為分析與數(shù)據(jù)挖掘研究[J]. 中國(guó)遠(yuǎn)程教育(2):26-32.

      劉三女牙,彭晛,劉智,等. 2016. 基于文本挖掘的學(xué)習(xí)分析應(yīng)用研究[J]. 電化教育研究(2):23-30.

      施佺,錢源,孫玲. 2016. 基于教育數(shù)據(jù)挖掘的網(wǎng)絡(luò)學(xué)習(xí)過程監(jiān)管研究[J]. 現(xiàn)代教育技術(shù),26(6):87-93.

      孫力,程玉霞. 2015. 大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)教育學(xué)習(xí)成績(jī)預(yù)測(cè)的研究與實(shí)現(xiàn)[J]. 開放教育研究,21(3):74-80.

      孫力,張凱,丁波. 2016. 基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)教育學(xué)習(xí)成績(jī)細(xì)分預(yù)測(cè)的研究與實(shí)現(xiàn)[J]. 中國(guó)遠(yuǎn)程教育(12):22-29.

      王林麗,葉洋,楊現(xiàn)民. 2016. 基于大數(shù)據(jù)的在線學(xué)習(xí)預(yù)警模型設(shè)計(jì)——“教育大數(shù)據(jù)研究與實(shí)踐專欄”之學(xué)習(xí)預(yù)警篇[J]. 現(xiàn)代教育技術(shù),26(7):5-11.

      尤佳鑫,孫眾. 2016. 云學(xué)習(xí)平臺(tái)大學(xué)生學(xué)業(yè)成績(jī)預(yù)測(cè)與干預(yù)研究[J]. 中國(guó)遠(yuǎn)程教育(9):14-20.

      Agudo-Peregrina, A. F., Iglesias-Pradas, S., Conde-Gonzalez, M. A. & Hernandez-Garcia, A. (2014). Can we predict success from log data in VLEs? Classification of interactions for learning analytics and their relation with performance in VLE-supported F2F and online learning. Computers in Human Behavior, 31, 542-550.

      Baker, R. S. & Yacef, K. (2009). The state of educational data mining in 2009: A review and future visions. Journal of Educational Data Mining,1(1), 3-17.

      Beck, H. P. & Davidson, W. D. (2001). Establishing an early warning system: Predicting low grades In college students from survey of academic orientations scores. Research in Higher Education, 42(6), 709-723.

      Hachey, A. C., Wladis, C. W. & Conway, K. M. (2014). Do prior online course outcomes provide more information than G.P.A. alone in predicting subsequent online course grades and retention? An observational study at an urban community college. Computers & Education 72, 59-67.

      Hendel, D. D. (2007). Efficacy of Participating in a First-Year Seminar on Student Satisfaction and Retention. Journal of College Student Retention, 8(4), 413 - 423.

      Hu, Y.-H., Lo, C.-L. & Shih, S.-P. (2014). Developing early warning systems to predict students online learning performance. Computers in Human Behavior 36, 469-478.

      Huang, S. & Fang, N. (2013). Predicting student academic performance in an engineering dynamics course: A comparison of four types of predictive mathematical models. Computers & Education, 61, 133-145.

      Kotsiantis, S. B. (2012). Use of machine learning techniques for educational proposes: a decision support system for forecasting students grades. Artificial Intelligence Review, 37(4), 331-344.

      Krumm, A. E., Waddington, R. J., Teasley, S. D. & Lonn, S. (2014). A learning management system-based early warning system for academic advising in undergraduate engineering. In J. A. Larusson & B. White (Eds.), Learning analytics: From theory to practice (pp. 103-119). New York: Springer.

      Larsen-Freeman, D. (1997). Chaos/complexity science and second language acquisition. Applied Linguistics, 18, 141-165.

      Lee, U. J., Sbeglia, G. C., Ha, M., Finch, S. J. & Nehm, R. H. (2015). Clicker score trajectories and concept inventory scores as predictors for early warning systems for large STEM classes. Journal of Science Education and Technology, 24(6), 848-860.

      Lynch, B. K. (2016). Language assessment and programme evaluation. Shanghai: Shanghai Foreign Language Education Press.

      Macfadyen, L. P. & Dawson, S. (2010). Mining LMS data to develop an “early warning system” for educators: A proof of concept. Computers & Education, 54(2), 588-599.

      Marbouti, F., Diefes-Dux, H. A. & Madhavan, K. (2016). Models for early prediction of at-risk students in a course using standards-based grading. Computers & Education, 103, 1-15.

      Marquez-Vera, C., Cano, A., Romero, C., Noaman, A. Y. M., Fardoun, H. M. & Ventura, S. (2016). Early dropout prediction using data mining: a case study with high school students. Expert Systems, 33(1), 107-124.

      Pena-Ayala, A. (2014). Educational data mining: A survey and a data mining-based analysis of recent works. Expert Systems with Applications, 41(4), 1432-1462.

      Rea-Dickins, P. (2001). Mirror, mirror on the wall: identifying processes of classroom assessment. Language testing, 18(4), 429-462.

      Romero, C. & Ventura, S. (2007). Educational data mining: A survey from 1995 to 2005. Expert Systems with Applications, 33(1), 135-146.

      Romero, C. & Ventura, S. (2013). Data mining in education. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 3(1), 12-27.

      Romero, C., Lopez, M. I., Luna, J. M. & Ventura, S. (2013). Predicting students' final performance from participation in on-line discussion forums. Computers & Education, 68, 458-472.

      Sen, B., Ucar, E. & Delen, D. (2012). Predicting and analyzing secondary education placement-test scores: A data mining approach. Expert Systems with Applications, 39(10), 9468-9476.

      Tsai, C.-F., Tsai, C.-T., Hung, C.-S. & Hwang, P.-S. (2011). Data mining techniques for identifying students at risk of filing a computer proficiency test required for graduation. Australasian Journal of Educational Technology, 27(3), 481-498.

      收稿日期:2017-06-24

      定稿日期:2017-09-19

      作者簡(jiǎn)介:肖巍,博士,副教授,碩士生導(dǎo)師,重慶大學(xué)外國(guó)語(yǔ)學(xué)院(401331)

      倪傳斌,博士,教授,博士生導(dǎo)師,副院長(zhǎng),南京師范大學(xué)外國(guó)語(yǔ)學(xué)院(210097)。

      李銳,博士后,華中科技大學(xué)外國(guó)語(yǔ)學(xué)院(430074)。

      責(zé)任編輯 韓世梅

      猜你喜歡
      數(shù)據(jù)挖掘預(yù)警預(yù)測(cè)
      無可預(yù)測(cè)
      選修2-2期中考試預(yù)測(cè)卷(A卷)
      選修2-2期中考試預(yù)測(cè)卷(B卷)
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      法國(guó)發(fā)布高溫預(yù)警 嚴(yán)陣以待備戰(zhàn)“史上最熱周”
      園林有害生物預(yù)警與可持續(xù)控制
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      機(jī)載預(yù)警雷達(dá)對(duì)IFF 的干擾分析
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      預(yù)警個(gè)啥
      松阳县| 巴中市| 定日县| 石楼县| 鹤壁市| 加查县| 湘西| 新营市| 鲁甸县| 大同县| 陇南市| 麻江县| 阿尔山市| 乌兰浩特市| 乐陵市| 连城县| 灌阳县| 五莲县| 尚志市| 察雅县| 婺源县| 社会| 建瓯市| 阳城县| 靖远县| 焦作市| 祁阳县| 孟津县| 湘阴县| 织金县| 台前县| 宁陕县| 府谷县| 汤原县| 曲松县| 烟台市| 会宁县| 聊城市| 浏阳市| 于田县| 渭源县|