• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      大數(shù)據(jù)背景下教育數(shù)據(jù)挖掘在學(xué)生在線學(xué)習(xí)行為分析中的應(yīng)用研究

      2017-05-08 21:11呂海燕周立軍張杰??
      計算技術(shù)與自動化 2017年1期
      關(guān)鍵詞:大數(shù)據(jù)

      呂海燕+周立軍+張杰??

      摘要:本文基于我院自行開發(fā)并已廣泛投入使用的計算機基礎(chǔ)信息化導(dǎo)學(xué)平臺中的日志數(shù)據(jù)。首先對平臺中學(xué)員登陸情況、資源瀏覽情況相關(guān)的數(shù)據(jù)進(jìn)行收集預(yù)處理;接下來對學(xué)員的登陸行為、和資源瀏覽情況進(jìn)行統(tǒng)計分析;在此基礎(chǔ)上,采用決策樹算法分析得到了對影響學(xué)員登陸行為及資源瀏覽行為的影響因素。依據(jù)分析結(jié)果,可使教育教學(xué)工作者基于學(xué)習(xí)者的學(xué)習(xí)情況來實現(xiàn)教學(xué)內(nèi)容組織、構(gòu)建教學(xué)模式等。

      關(guān)鍵詞:大數(shù)據(jù);信息化導(dǎo)學(xué)平臺;教育數(shù)據(jù)挖掘;登陸行為;資源瀏覽行為

      中圖分類號:TP311文獻(xiàn)標(biāo)識碼:ADOI:10.3969/j.issn.10036199.2017.01.027

      “數(shù)據(jù)驅(qū)動學(xué)校,分析變革教育”的大數(shù)據(jù)時代已經(jīng)來臨,利用教育數(shù)據(jù)挖掘技術(shù)和學(xué)習(xí)分析技術(shù),構(gòu)建教育領(lǐng)域相關(guān)模型,探索教育變量之間的相關(guān)關(guān)系,為教育教學(xué)決策提供有效支持將成為未來教育的發(fā)展趨勢。“大數(shù)據(jù)”的出現(xiàn),將掀起人類教與學(xué)的又一次變革。

      1教育數(shù)據(jù)挖掘及其價值

      教育數(shù)據(jù)挖掘是一個將來自各種教育系統(tǒng)的原始數(shù)據(jù)轉(zhuǎn)換為有用信息的過程,這些有用信息可為教師、學(xué)生及其家長、教育研究人員以及教育軟件系統(tǒng)開發(fā)人員所利用。[1]教育數(shù)據(jù)挖掘也可被看作是嵌入已有教育系統(tǒng)的一個新的模塊,并與教育系統(tǒng)中的各種要素產(chǎn)生良性互動,最終實現(xiàn)改進(jìn)教學(xué)的目的。[1]教育數(shù)據(jù)挖掘?qū)τ谖覀兘逃ぷ髡邅碇v,教育數(shù)據(jù)挖掘的作用主要是向我們提供更多更客觀的反饋信息,使我們能夠更好地調(diào)整和優(yōu)化教學(xué)策略、改進(jìn)教學(xué)過程、完善課程開發(fā),基于學(xué)習(xí)者的學(xué)習(xí)情況來實現(xiàn)教學(xué)內(nèi)容組織、創(chuàng)新以及構(gòu)建教學(xué)模式等。[2]根據(jù)數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域,可以將教育數(shù)據(jù)挖掘分為ELearning(教學(xué))數(shù)據(jù)挖掘、EManagement(管理)數(shù)據(jù)挖掘和EResearch(科研)數(shù)據(jù)挖掘。而在ELearning(教學(xué))數(shù)據(jù)挖掘領(lǐng)域.[3]本文,主要是從ELearning(教學(xué))數(shù)據(jù)挖掘應(yīng)用出發(fā),基于我院的信息化導(dǎo)學(xué)平臺日志數(shù)據(jù),對學(xué)員的學(xué)習(xí)行為進(jìn)行分析。

      2學(xué)生在線學(xué)習(xí)行為分析教育數(shù)據(jù)挖掘模式構(gòu)建

      學(xué)習(xí)者在線學(xué)習(xí)行為分析主要是基于網(wǎng)絡(luò)教學(xué)平臺對師生學(xué)習(xí)過程的記錄數(shù)據(jù),針對行為主體(教師、學(xué)生)的行為方式(登陸、瀏覽資源、在線交流等)、行為客體(各類資源、網(wǎng)路課程模塊等)的被使用情況以及行為發(fā)生時間進(jìn)行統(tǒng)計、可視化和各類挖掘,并結(jié)合師生的特征數(shù)據(jù)對影響在線學(xué)習(xí)行為的因素進(jìn)行挖據(jù)。

      教育數(shù)據(jù)挖掘模式為完成特定挖掘任務(wù)而建,是多種數(shù)據(jù)挖掘工具和算法的集成應(yīng)用。

      教育數(shù)據(jù)挖掘模式由“數(shù)據(jù)挖掘工作”“工具與算法”以及“數(shù)據(jù)”三要素構(gòu)成。[4]“工具與算法”為數(shù)據(jù)挖掘工作提供支撐,并產(chǎn)生相應(yīng)的“數(shù)據(jù)”,如圖1所示。這三個要素在時間上的展開將分別形成數(shù)據(jù)挖掘工作流、工具與算法流以及數(shù)據(jù)流。其中數(shù)據(jù)挖掘工作流包括數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、模式解釋評價與應(yīng)用等環(huán)節(jié)。其中,學(xué)習(xí)過程數(shù)據(jù)挖掘模式用于學(xué)習(xí)過程及學(xué)習(xí)行為分析,其挖掘模式如圖2所示。

      其中,在數(shù)據(jù)挖掘工作流的核心環(huán)節(jié),主要的數(shù)據(jù)挖掘任務(wù)有學(xué)習(xí)者登陸行為分析、學(xué)習(xí)資源瀏覽模式分析、學(xué)生行為影響因素分析等。

      3基于信息化導(dǎo)學(xué)平臺的學(xué)生學(xué)習(xí)行為影響因素分析

      計算機基礎(chǔ)課程信息化導(dǎo)學(xué)平臺,是我院自行開發(fā)并已廣泛投入使用的計算機類基礎(chǔ)課程在線自主學(xué)習(xí)平臺。該平臺具有較強的交互性、開放性、跟蹤性、反饋型,教學(xué)資源豐富多樣[5]。學(xué)員通過該平臺進(jìn)行自主學(xué)習(xí)過程中會產(chǎn)生大量的各種日志數(shù)據(jù),如學(xué)員的登陸行為數(shù)據(jù)信息、學(xué)員對各種資源的瀏覽情況的數(shù)據(jù)記錄等。本文主要采用網(wǎng)絡(luò)日志分析這一非反應(yīng)性研究方法及相關(guān)分析、差異檢驗、聚類分析等數(shù)據(jù)挖掘方法,對學(xué)員的在線學(xué)習(xí)網(wǎng)絡(luò)日志進(jìn)行細(xì)致深入的分析,以探索學(xué)員在線學(xué)習(xí)行為的內(nèi)在影響因素。

      3.1數(shù)據(jù)采集與預(yù)處理

      以15級學(xué)員為主,選取了學(xué)員的基本信息數(shù)據(jù)和在使用信息化導(dǎo)學(xué)平臺時產(chǎn)生的登陸、資源瀏覽、學(xué)習(xí)體驗等日志數(shù)據(jù),以及學(xué)員在使用形成性考試平臺時產(chǎn)生的考試數(shù)據(jù),共四份數(shù)據(jù)。將這些數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫,形成四張數(shù)據(jù)表。這四張數(shù)據(jù)表的關(guān)聯(lián)通過“學(xué)號”這一字段來建立。如圖3所示。經(jīng)過聯(lián)合查詢,對這四張數(shù)據(jù)表進(jìn)行交集運算,取得這四張表中共有的學(xué)員,共1265名。然后將這1265名學(xué)員對應(yīng)的基本信息數(shù)據(jù)、登陸數(shù)據(jù)、資源瀏覽數(shù)據(jù)和形成性測驗數(shù)據(jù)作為分析對象,進(jìn)行統(tǒng)計分析和數(shù)據(jù)挖掘。

      3.2學(xué)員學(xué)習(xí)登陸行為描述與影響因素分析

      在登陸行為數(shù)據(jù)表中,學(xué)生學(xué)號和登陸時間是兩個主要字段。本文不以學(xué)生的登陸次數(shù)為計數(shù)單位,而是以某個時間單位的登陸人數(shù)來統(tǒng)計。如果以登陸次數(shù)來統(tǒng)計可能會由于個別學(xué)員的反復(fù)登陸而造成學(xué)員學(xué)習(xí)強大的假象。因此,本文主要以登陸時間 “周”為分類字段統(tǒng)計學(xué)員的登陸率(登陸平臺的人數(shù)除以學(xué)員總數(shù));以學(xué)號為字段統(tǒng)計每個學(xué)員的登陸天數(shù)。本文以 2015年10月11日課程開學(xué)日所在周為第一周,該課程的持續(xù)周數(shù)15周。

      (1)以時間段“周”為單位統(tǒng)計,發(fā)現(xiàn)學(xué)員群體學(xué)習(xí)的周期

      對于學(xué)員個體而言,學(xué)習(xí)周期是不確定的。但是從教學(xué)這的角度來說,需要了解整個學(xué)員群體的學(xué)習(xí)周期,即通過登陸平臺的記錄,分析統(tǒng)計多長時間內(nèi)整個學(xué)生群體都會登陸參與學(xué)習(xí),以衡量群體在線學(xué)習(xí)開展的速度。作為教學(xué)者,需要了解,隨著學(xué)習(xí)時間的推移,有多少學(xué)生不再來學(xué)習(xí)了,以衡量群體在線學(xué)習(xí)終止的速度。通過對每周累計登陸率的統(tǒng)計分析得到學(xué)員的學(xué)習(xí)周期,如圖4所示。

      可以看出,到第5周,有40%的學(xué)員參與了在線學(xué)習(xí);第6周開始急劇增加;到最后一周,所有學(xué)員全部參與了在線學(xué)習(xí)。這說明,學(xué)員整體開展在線學(xué)習(xí)的速度是慢的,提醒教學(xué)者應(yīng)該加以干預(yù),如在第2周就應(yīng)該督促學(xué)員登陸導(dǎo)學(xué)平臺參與學(xué)習(xí)。作為教學(xué)者,也可 以此為參考對教學(xué)資源在時間上進(jìn)行合理分配。

      (2)影響學(xué)員登陸行為的影響因素分析

      Microsoft決策樹算法由Microsoft SQL Server Analysis Services提供的分類和回歸算法,用于對離散和連續(xù)屬性進(jìn)行預(yù)測性建模。對于離散屬性,該算法根據(jù)數(shù)據(jù)集中輸入列之間的關(guān)系進(jìn)行預(yù)測。決策樹根據(jù)向特定結(jié)果發(fā)展的趨勢進(jìn)行預(yù)測。對于連續(xù)屬性,該算法使用線性回歸確定決策樹的拆分位置。該算法原理是:通過在樹中創(chuàng)建一系列拆分來生成數(shù)據(jù)挖掘模型。這些拆分以“節(jié)點”來表示。每當(dāng)發(fā)現(xiàn)輸入列與可預(yù)測列密切相關(guān)時,該算法便會向該模型中添加一個節(jié)點。該算法確定拆分的方式不同,主要取決于它預(yù)測的是連續(xù)列還是離散列。為了提高效率,微軟決策樹采用了兩層結(jié)構(gòu),在建樹算法和數(shù)據(jù)庫直接設(shè)立了一個數(shù)據(jù)挖掘中間件,如圖5所示。

      綜合考慮學(xué)員的層次(本科、飛行員、士官)、專業(yè)、性別三種因素,本文采用Microsoft決策樹算法構(gòu)建挖掘結(jié)構(gòu)和挖掘模型,對學(xué)員的登陸行為(以天數(shù)為衡量單位)影響因素進(jìn)行分析。以層次、專業(yè)、性別為輸入值,以登陸天數(shù)為預(yù)測值,建立如下圖6所示的決策樹。

      其中的比例比為 登陸天數(shù) “ 不少于5天”的學(xué)員與 “少于5天”的學(xué)員的比例。通過分析結(jié)果可以看出,層次、專業(yè)、性別對登陸天數(shù)的影響程度是不一樣的。層次影響最強,其次是專業(yè),最后是性別。其中,飛行員、士官層次學(xué)員的登陸天數(shù)明顯低于本科層次學(xué)員;飛行員和士官層次之間,飛行員的登陸天數(shù)要高于士官層次學(xué)員;而在某個層次內(nèi),如本科層次,不同的專業(yè)之間學(xué)員的登陸天數(shù)差別也有明顯區(qū)別(由于保密原因,這里不便明確具體專業(yè)信息),而性別對登陸天數(shù)的影響最小。依據(jù)這些分析結(jié)果,教學(xué)者可以對不同層次、專業(yè)的學(xué)員在線學(xué)習(xí)行為進(jìn)行合理的引導(dǎo)和調(diào)整。如對于本科層次內(nèi),不同專業(yè)之間的登陸行為之所以有較大差別,是因為不同的專業(yè)由不同的學(xué)員隊進(jìn)行管理、其專業(yè)指向性也有所不同,因此學(xué)員的學(xué)風(fēng)有較大差別。學(xué)員管理者可以依據(jù)分析結(jié)果,對相應(yīng)的學(xué)員隊進(jìn)行有針對性的加強管理,以提高其學(xué)習(xí)效果。

      3.3學(xué)員資源瀏覽行為描述與影響因素分析

      計算機基礎(chǔ)課程信息化導(dǎo)學(xué)平臺中的學(xué)習(xí)資源豐富多樣。其中,課程包含了我院計算機基礎(chǔ)類的所有通識課程,主要有《大學(xué)計算機基礎(chǔ)》、《計算機程序設(shè)計》和《計算機硬件基礎(chǔ)》三門課程;課程的教學(xué)資源一般按照案例、章節(jié)和知識點進(jìn)行編排,資源類型有操作視頻演示、Flash動畫交互操作、類型豐富多樣的測試題等。通過學(xué)員對各門課程以及課程中相應(yīng)資源模塊的瀏覽日志進(jìn)行統(tǒng)計分析,以找到影響學(xué)員瀏覽行為的因素。統(tǒng)計分析結(jié)果如表1所示。

      可以看出,從各資源模塊的被使用程度和被學(xué)員的關(guān)注程度來看(主要通過“瀏覽頻次”和“學(xué)生參與率”反映),由高到低依次是課程各章節(jié)案例庫、視頻資源區(qū)、Flash動畫交互區(qū)、問題庫、輔助資料庫、常用軟件工具庫,這些恰好是這些資源模塊在課程首頁由上而下呈現(xiàn)的順序。這說明各課程模塊首頁的布局反映了學(xué)員的學(xué)習(xí)習(xí)慣,也可能是這種布局對各資源模塊的被使用程度產(chǎn)生了影響。對課程資源模塊設(shè)計的指導(dǎo)意義在于,要使某種資源得到學(xué)員的關(guān)注,應(yīng)將其置于相應(yīng)課程模塊首頁的顯著位置。

      從學(xué)員對課程各資源模塊的學(xué)習(xí)情況來看(主要通過“單個資源人均瀏覽頻次”),由高到低依次是Flash動畫交互區(qū)、問題庫、課程各章節(jié)案例庫、視頻資源庫、常用軟件工具庫、輔助資料庫。學(xué)員對Flash動畫交互區(qū)的學(xué)習(xí)程度最高的原因主要是,該模塊采用動畫以交互的方式讓學(xué)員學(xué)會相應(yīng)的操作,更能激發(fā)學(xué)員的學(xué)習(xí)興趣,吸引學(xué)員反復(fù)學(xué)習(xí)。學(xué)員訪問程度次高的是問題庫,說明學(xué)員有較強的通過常見問題庫來解答學(xué)習(xí)過程中各種疑問的需求。今后應(yīng)該進(jìn)一步豐富問題庫,并將問題庫的檢索區(qū)域置于課程首頁的顯著位置,以便及時方便地解答學(xué)員的各種疑惑,幫助學(xué)員完成相應(yīng)課程的學(xué)習(xí)。

      4結(jié)論

      本文通過對15級學(xué)員基于計算機基礎(chǔ)信息化導(dǎo)學(xué)平臺進(jìn)行在線學(xué)習(xí)時產(chǎn)生的登錄數(shù)據(jù)和資源瀏覽數(shù)據(jù)進(jìn)行統(tǒng)計、挖掘分析,發(fā)現(xiàn)了學(xué)員在線學(xué)習(xí)行為的一些基本特點及其影響因素。從群體角度看,在線學(xué)習(xí)行為在時間的分布上相對均衡,以周為時間段第6、7周的學(xué)員登錄率最高;從個體角度看,學(xué)員在線學(xué)習(xí)時間相對較少;影響學(xué)員在線學(xué)習(xí)時間投入的內(nèi)在因素有層次、專業(yè)及性別等因素,其中層次因素是最重要的因素。相同層次的學(xué)員,不同專業(yè)之間的學(xué)員在線學(xué)習(xí)投入的主要影響因素是其專業(yè),而這與其專業(yè)特點和所在學(xué)員管理隊有較大關(guān)系;學(xué)員對不同資源的學(xué)習(xí)程度的不同主要取決于資源在課程頁面上的分布、學(xué)習(xí)資源的特色及學(xué)員的自身需求,若想要某一類型的資源引起學(xué)員的足夠重視,可以首先將其置于課程首頁的顯著位置,同時要基于學(xué)員的興趣改進(jìn)資源的特色等。

      參考文獻(xiàn)

      [1]洪雪峰.教育數(shù)據(jù)挖掘下的學(xué)習(xí)效果探析[J].長沙鐵道學(xué)院學(xué)報:社會科學(xué)版,2014(5):196-198.

      [2]BIENKOWSKI M,F(xiàn)ENG M,MEANS B.Enhancing Teaching and Learning through Educational Data Miningand Learning Analytics:An Issue Brief[M].Washington,D.C,2012.

      [3]BAKER R S J.Data Mining for Education.International Encyclopedia of Education[M].3rd ed.Oxford,UK:Elsevier,2011.

      [4]RAMASWAMI M,BHASKARAN, CHAIDR A.Based Performance Prediction Model in Educational Data Mining[J].IJCSI International Journal of Computer Science Issues,2010(1):10-18.

      [5]呂海燕.基于“信息化導(dǎo)學(xué)平臺”的翻轉(zhuǎn)課堂教學(xué)模式[J].計算機教育,2016(2):73-78.

      [6]葛道凱,張少剛.教育數(shù)據(jù)挖掘方法與應(yīng)用[M].北京:科學(xué)出版社,2012.9.

      第36卷第1期2017年3月計算技術(shù)與自動化Computing Technology and AutomationVol36,No1Mar. 2 0 1 7第36卷第1期2017年3月計算技術(shù)與自動化Computing Technology and AutomationVol36,No1Mar. 2 0 1 7

      猜你喜歡
      大數(shù)據(jù)
      基于在線教育的大數(shù)據(jù)研究
      “互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品物流業(yè)的大數(shù)據(jù)策略研究
      大數(shù)據(jù)時代新聞的新變化探究
      淺談大數(shù)據(jù)在出版業(yè)的應(yīng)用
      “互聯(lián)網(wǎng)+”對傳統(tǒng)圖書出版的影響和推動作用
      大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
      基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
      數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
      英山县| 台山市| 巨野县| 馆陶县| 普兰县| 清丰县| 桑日县| 武夷山市| 隆林| 格尔木市| 卫辉市| 蓝田县| 漳浦县| 若尔盖县| 崇明县| 万州区| 洱源县| 浦东新区| 景东| 阜平县| 徐闻县| 万源市| 剑阁县| 大名县| 纳雍县| 新绛县| 灵丘县| 化德县| 呼和浩特市| 乌拉特后旗| 庄河市| 皋兰县| 安仁县| 淳安县| 赣榆县| 越西县| 隆尧县| 文山县| 华蓥市| 泰顺县| 于田县|