宋永生
摘要:網(wǎng)絡學習目前普遍存在缺乏學習氛圍、缺乏有效監(jiān)督、沒有根據(jù)學生的特點進行因材施教等問題。利用ASP.NET及SQL Server設計網(wǎng)絡學習平臺,通過Log4j記錄學生與學習平臺的交互,通過麥克風攝像頭及OBS軟件采集教師與學生的音視頻,利用深度學習技術挖掘分析音視頻中的語言和表情,幫助教師對眾多學習者進行察言觀色,及時了解學生的情況,調(diào)整教學內(nèi)容和進度,并對學生進行監(jiān)督。采用機器學習技術挖掘分析學生的基本信息、學習日志、課程評價、錯題及成績等數(shù)據(jù),為學生提供個性化的學習服務。
關鍵詞:學習平臺;深度學習;挖掘分析;機器學習;個性化
中圖分類號:TP31? ? ?文獻標識碼:A? ? ?文章編號:1009-3044(2018)36-0198-03
Abstract:At present, there are many problems in online learning, such as lack of learning atmosphere, lack of effective supervision, and lack of teaching students in accordance with their aptitude according to their characteristics. ASP.NET and SQL Server are used to design the network learning platform. Log4j is used to record the interaction between students and learning platform. Microphone cameras and OBS software are used to collect the audio and video of teachers and students. Deep learning technology is used to mine and analyze the language and expression in audio and video. It helps teachers to observe many learners. When understanding the situation of students, adjust the teaching content and progress, and supervise students. Using machine learning technology to mine and analyze students'basic information, learning logs, curriculum evaluation, wrong questions and scores, etc., to provide individual learning services for students.
Key words:Learning platform; Deep learning;Mining and analysis;Machine learning; Individual
目前主流網(wǎng)絡學習平臺為所有學生提供的是近乎一致的學習資源和課程安排。為了達到理想的學習效果,需要因材施教,根據(jù)學生的不同特點,制定不同的教學策略。傳統(tǒng)課堂上,教師通過察言觀色了解學生對自己所講內(nèi)容的掌握情況,學生們時而眉頭緊鎖,時而呆若木雞,時而興奮不已,時而漏出會意的微笑,這些表情特征反應了學生不同的心理特征。教師通過課堂互動提問及學生們的表情,可以及時了解學生對所講授內(nèi)容的掌握情況,及時調(diào)整教學策略和教學進度。通過考試,教師可以了解學生對所講授知識點的消化吸收情況。
網(wǎng)絡教育提高了知識的傳播速度,特別是近年來MOOC和SPOC等網(wǎng)絡學習平臺的飛速發(fā)展,更是加速了教育的發(fā)展,讓優(yōu)質(zhì)教學資源得到了共享。通過網(wǎng)絡學習平臺,偏遠山區(qū)的孩子們可以聆聽來自城市教學名師的所授課程,在一定程度上彌補了鄉(xiāng)村教育資源的不足。網(wǎng)絡學習更是讓城市中奔波于各個輔導班之間的孩子們在一定程度上得到了解脫,不用再為堵車和霧霾而煩惱。學生可以足不出戶,隨時隨地進行網(wǎng)絡學習。
1 網(wǎng)絡學習存在的問題
網(wǎng)絡學習的教學媒介從最初的文本文件、PPT課件,發(fā)展到音頻、視頻點播及視頻直播,形式愈發(fā)生動活潑,學生進行網(wǎng)絡學習的興趣也愈發(fā)濃厚。網(wǎng)絡學習取得了長足的進步,但其缺點也顯而易見。網(wǎng)絡學習缺乏學習氛圍和有效監(jiān)督,部分學生自制力不夠,容易走神,利用電腦上網(wǎng)、聊天甚至打游戲等。教師無法像在傳統(tǒng)課堂中那樣對學生進行察言觀色,及時掌握學生的學習情況。視頻點播教學中,教師和學生在教與學在時間和空間上分離,只有通過考試才能獲知學生的知識點掌握情況;一對多視頻直播教學中,教師專注于教學,無暇顧及大多數(shù)學生;在一對一視頻直播教學中,教師對學生的情況掌握稍好,但其人力成本較高。網(wǎng)絡學習中還存在師資不夠透明的問題,不少教育培訓機構(gòu)將普通教師包裝成名師,以次充好。
2 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是指從海量數(shù)據(jù)中提取前所未知、可能有用但隱藏的信息的過程。數(shù)據(jù)挖掘是基于統(tǒng)計學、機器學習、深度學習、數(shù)據(jù)庫等的交叉學科,涉及很多算法,有著廣泛的應用。根據(jù)數(shù)據(jù)挖掘方法來分,可分為機器學習方法、深度學習方法、統(tǒng)計方法和數(shù)據(jù)庫方法等。
學習平臺的數(shù)據(jù)挖掘研究目前主要集中于對日志數(shù)據(jù)、考試成績的挖掘研究。學生的學習行為研究較少,主要是由于很多學習平臺沒有采集相關數(shù)據(jù),日志所反應的學習行為過于片面。不少學習平臺由于當初設計上的缺陷,連日志數(shù)據(jù)都沒有收集,數(shù)據(jù)挖掘無從談起。為了讓學生取得更好的學習效果,需要設計一個便于數(shù)據(jù)挖掘的個性化學習平臺。個性化學習平臺需要采用諸多技術。
3 相關技術
3.1 ASP.NET
ASP.NET是Microsoft.NET Framework中一套用于生成Web應用程序和Web服務的技術,可以通過 HTML、CSS、JavaScript 以及服務器腳本來構(gòu)建網(wǎng)站。ASP.NET 支持Web Pages、MVC和Web Forms三種開發(fā)模式。
3.2 Log4j
Log4j是Apache基金會的一個開源日志項目。Log4j的日志信息可以輸出到文件、數(shù)據(jù)庫、控制臺等,還可以設置日志的輸出格式。只需通過一個配置文件即可靈活的配置Log4j,并可以選擇ALL、DEBUG、INFO、ERROR等多種日志記錄級別。Log4j提供了多種語言接口,可以在Java、C、C++、C#等程序中使用。
3.3 OBS、OpenCV及pydub
OBS是一款免費開源用于視頻錄制以及直播串流的軟件。利用OBS,可以在Windows、Linux、Mac等平臺上簡單快速的進行視頻直播及錄播。OpenCV是一個開源跨平臺的計算機視覺庫,提供了豐富的圖像和視頻處理API。pydub是Python的一個音頻處理庫,提供了簡單易用的音頻處理API。
3.4 XGBoost
XGBoost是華盛頓大學的Tianqi Chen 在Gradient Boosting Decision Tree基礎上提出[1]用于分類和回歸的算法庫。XGBoost是Gradient Boosting Machine的一個C++實現(xiàn)。在 GBDT 的基礎上,XGBoost對目標函數(shù)和損失函數(shù)進行了修改。XGBoost能夠自動利用CPU的多線程進行并行,同時在算法上加以改進提高了精度。XGBoost提供了Python和R等語言的接口。XGBoost能處理大規(guī)模數(shù)據(jù)且支持自定義損失函數(shù)等,常用于特征提取、分類及預測等。
3.5 Keras
Keras是用 Python 開發(fā)的開源深度學習庫,能夠以TensorFlow、Theano或CNTK作為后端引擎。TensorFlow最初是由Google開發(fā)的開源深度學習庫,功能強大,執(zhí)行效率高,并提供了Python、C++等多種語言編程接口。通過TensorFlow,Keras可以在CPU、GPU上無縫運行[2]。Keras簡單易用,利用Keras可以快速開發(fā)深度學習模型,支持卷積網(wǎng)絡和循環(huán)網(wǎng)絡以及兩者的組合,并能夠構(gòu)建任意深度的學習模型。
4 設計便于數(shù)據(jù)挖掘的學習平臺
利用ASP.NET與SQL Server設計開發(fā)學習平臺。學習平臺包括課程管理、資源管理、練習考試、選課評教、教師管理、學生管理、日志管理等模塊。日志管理模塊通過Log4j記錄學生進行網(wǎng)絡學習時產(chǎn)生的日志數(shù)據(jù)。選課評價模塊中,學生能夠自行選課和退課,并可以對教師進行評價和評分,讓好的老師脫穎而出,不好的淘汰。學習平臺上的資源主要是按照知識點錄制的短視頻,方便學生對知識點進行查漏補缺,也便于教師對資源進行更新和管理,教師可以利用知識點資源構(gòu)建課程。
教師在進行直播教學時,通過麥克風及攝像頭采集教師的音視頻信息,經(jīng)OBS軟件RTMP協(xié)議推流至騰訊云視頻直播服務,騰訊云會自動把視頻直播轉(zhuǎn)化為視頻點播。將騰訊云中教師視頻直播的播放器代碼或點播的播放器代碼復制粘貼到知識點資源的HTML編輯器中,即可在學習平臺中實現(xiàn)教學直播或點播功能。為了對學生進行監(jiān)督和及時了解學生的在線學習情況,便于對學生進行察言觀色,同樣采集學生在線學習該課程時的音視頻數(shù)據(jù),教師和學生的音視頻信息均存儲于騰訊云。教學直播內(nèi)容可以自動保存,變?yōu)榻虒W視頻點播。學生在課后觀看點播視頻進行復習,沒有參加直播課的學生課后利用點播視頻自學。視頻點播學習時同樣需要采集學生學習時的音視頻數(shù)據(jù),相比靜態(tài)表情圖片,視頻序列中蘊含更多的情感信息[3]。
5 利用數(shù)據(jù)挖掘?qū)崿F(xiàn)個性化教學
學生學習時的一舉一動,一笑一顰都反映學生不同的內(nèi)心活動。學生學習時的表情是傳遞其情感情緒等內(nèi)心活動最有效和直接的方式[4],情緒是影響學習效果的重要因素之一[5]。學生在線學習時的語言、表情等信息,可以幫助教師了解學生對所講內(nèi)容的領會情況,是否感興趣,是否已理解,有助于教師及時調(diào)整所講內(nèi)容,優(yōu)化教學過程,提高學生的學習效率。
深度學習中的卷積神經(jīng)網(wǎng)絡擅長處理圖像及聲音數(shù)據(jù),循環(huán)神經(jīng)網(wǎng)絡擅長處理時間等序列數(shù)據(jù)。深度學習不僅表現(xiàn)出更好的性能,而且將特征提取完全自動化,省去了傳統(tǒng)機器學習中人工提取特征的步驟。首先利用pydub和OpenCV分別對采集到的教師和學生的音頻和視頻數(shù)據(jù)進行預處理,然后利用深度學習庫Keras學習并分析教師和學生的音視頻數(shù)據(jù),分析音視頻中的語言和表情,幫助教師對眾多學習者進行察言觀色,讓教師可以把更多的精力應用于教學,幫助教師發(fā)現(xiàn)教學中存在的問題,將分析結(jié)果及時反饋給教師,以便教師根據(jù)挖掘分析結(jié)果,及時調(diào)整教學內(nèi)容和教學進度,有利于教學質(zhì)量的改進。
對結(jié)構(gòu)化數(shù)據(jù)進行分類、回歸等分析時,常采用機器學習中的XGBoost庫。利用機器學習技術對學生管理模塊中學生的一些基本信息,比如性別、年齡、受教育程度、所學專業(yè)、興趣愛好等進行學習和分析,可以在課程管理模塊中為學生推薦合適的課程進行學習;利用機器學習技術來學習和分析學生的學習日志,了解學生的學習習慣,從而為其推薦合適的直播課程;利用機器學習技術來學習和分析選課評教模塊中的課程評價數(shù)據(jù),可以幫助教師改進教學;利用機器學習技術來學習和分析練習考試模塊中學生的成績及錯題,為其推薦適合其自身特點的學習資源及相應的練習題,幫助學生鞏固薄弱的知識點。
將深度學習挖掘結(jié)果與機器學習挖掘結(jié)果相結(jié)合,為學生自動匹配與其自身特點相適應的個性化學習資源及練習,實現(xiàn)因材施教。學生進行網(wǎng)絡學習時的音視頻的采集,牽涉到個人隱私,數(shù)據(jù)在傳輸和存儲中需要進行數(shù)據(jù)加密,有利于隱私保護。
6 結(jié)束語
本文首先分析了網(wǎng)絡學習中目前存在的問題,設計了便于數(shù)據(jù)挖掘的網(wǎng)絡學習平臺,提出在網(wǎng)絡學習平臺中用深度學習技術來挖掘和分析在線學習時的音視頻數(shù)據(jù),分析音視頻中的語言和表情,幫助教師對眾多學習者進行察言觀色,讓教師可以把更多的精力應用于教學。用機器學習技術來挖掘和分析學生的基本信息、學習日志信息、課程評價信息及練習考試中的錯題及成績。這樣一方面可以起到監(jiān)督學生的效果,另一方面還能根據(jù)學生的特點為其提供個性化的學習服務,為其提供用數(shù)據(jù)挖掘技術構(gòu)建的個性化網(wǎng)絡學習平臺。數(shù)據(jù)挖掘使網(wǎng)絡學習中的個性化學習成為可能,教學內(nèi)容、教學方案和教學個體之間的精準匹配將極大地提高學習效率。
隨著5G腳步的臨近,可以將VR技術應用于網(wǎng)絡學習,讓學生在學習時感受到教師和同學仿佛就在身邊,身臨其境,營造濃厚的學習氛圍,也對學生的學習起到監(jiān)督作用。
參考文獻:
[1] 龔維印,王力.基于卷積神經(jīng)網(wǎng)絡和XGBoost的文本分類[J]. 通信技術,2018(10):2337-2342.
[2] Francois Chollet.Python深度學習[M].張亮,譯.北京:人民郵電出版社,2018.
[3] 胡敏,張柯柯,王曉華,等.結(jié)合滑動窗口動態(tài)時間規(guī)整和CNN的視頻人臉表情識別[J].中國圖象圖形學報,2018,23(8):1144-1153.
[4] 潘崢嶸,賀秀偉.人臉表情識別在智能機器人中的應用研究[J]. 計算機技術與發(fā)展,2018(02):173-177.
[5] 徐曉青,趙蔚,劉紅霞.混合式學習環(huán)境下情緒分析應用與模型研究——基于元分析的視角[J]. 電化教育研究,2018(8):70-77.
[通聯(lián)編輯:梁書]