陸霞 武善鋒
摘 要:隨著在線教學(xué)平臺(tái)的普及及推廣,師生在線的有效互動(dòng)和學(xué)習(xí)效果的評(píng)價(jià)成為研究的熱點(diǎn)。在線課堂教學(xué)實(shí)施過(guò)程中的彈幕評(píng)論是師生交互的主要方式之一,教師借助學(xué)生評(píng)論可以有效地了解學(xué)生的學(xué)習(xí)效果。文章研究利用神經(jīng)網(wǎng)絡(luò)算法及文本挖掘技術(shù)對(duì)彈幕文本中出現(xiàn)的基礎(chǔ)情感詞語(yǔ)、表情符號(hào)、網(wǎng)絡(luò)用戶進(jìn)行情感分析,能夠?yàn)榻虒W(xué)計(jì)劃的制定和修改提供有效的數(shù)據(jù)支撐。
關(guān)鍵詞:在線課堂;彈幕;神經(jīng)網(wǎng)絡(luò);情感分析
0 引言
近年來(lái),在線教學(xué)平臺(tái)成為互聯(lián)網(wǎng)文化產(chǎn)業(yè)中重要的一環(huán),也成為線下教學(xué)有效的補(bǔ)充。彈幕是一種在視頻界面以文字、符號(hào)等密集而快速顯示實(shí)時(shí)評(píng)論的形式,有別于普通的留言板[1]。彈幕評(píng)論可以直觀表現(xiàn)感受和情緒,通常用于在線課堂教學(xué)過(guò)程中學(xué)生發(fā)表個(gè)人觀點(diǎn),使用方便且傳播速度快,但是其中包含了大量碎片化的文本表達(dá),因此包含個(gè)人情感傾向的彈幕文本的分析對(duì)學(xué)生在線學(xué)習(xí)效果產(chǎn)生巨大的影響。
使用自然處理語(yǔ)言(Natural? Language Processing,NLP)和神經(jīng)網(wǎng)絡(luò)模型對(duì)彈幕評(píng)論進(jìn)行情感分析成為近年在線學(xué)習(xí)平臺(tái)研究的熱點(diǎn),借助于彈幕文本的長(zhǎng)度、發(fā)送頻率、文本特性等屬性分析用戶的交互型特點(diǎn)和活躍度特征,可以作為學(xué)生對(duì)于教學(xué)滿意度的評(píng)價(jià)因素之一。
1? ? 神經(jīng)網(wǎng)絡(luò)模型介紹
目前,神經(jīng)網(wǎng)絡(luò)在圖像分割、模式識(shí)別等領(lǐng)域有著廣泛的應(yīng)用。神經(jīng)網(wǎng)絡(luò)是一種仿生算法,具有信息傳輸和錯(cuò)誤反向傳播兩個(gè)主要特征。通過(guò)神經(jīng)網(wǎng)絡(luò)可以對(duì)文本中的頻譜和語(yǔ)義進(jìn)行建模[2]。神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
其中,X1,X2,…,Xn表示前向輸入數(shù)值;Y1,Y2,…,Ym表示反向傳播數(shù)值;ωij,ωik表示反向傳播參數(shù),ωij表示類(lèi)型層,ωik為打印層。從圖中可以看出,神經(jīng)網(wǎng)絡(luò)的構(gòu)造函數(shù)是一個(gè)非線性函數(shù),若以自變量作為網(wǎng)絡(luò)輸入值,因變量作為網(wǎng)絡(luò)輸出值,可以構(gòu)造一個(gè)從n到m維的函數(shù)[3]。
2? ? 基于神經(jīng)網(wǎng)絡(luò)的彈幕文本處理步驟
2.1? 數(shù)據(jù)采集
在線學(xué)習(xí)平臺(tái)中的彈幕文本規(guī)模龐大,且不斷變化,所以使用網(wǎng)絡(luò)爬蟲(chóng)程序和采樣策略對(duì)彈幕數(shù)據(jù)進(jìn)行抓取。數(shù)據(jù)采集過(guò)程經(jīng)過(guò)協(xié)議分析、設(shè)置采樣時(shí)間、編寫(xiě)抓包程序、自動(dòng)抓取數(shù)據(jù)和數(shù)據(jù)存儲(chǔ)幾個(gè)步驟,從而獲取課程信息、學(xué)習(xí)人數(shù)、學(xué)習(xí)時(shí)長(zhǎng)、用戶學(xué)習(xí)等級(jí)、彈幕信息等初始數(shù)據(jù)。數(shù)據(jù)采集流程如圖2所示。
2.2? 數(shù)據(jù)標(biāo)準(zhǔn)化
利用神經(jīng)網(wǎng)絡(luò)函數(shù)實(shí)現(xiàn)采集數(shù)據(jù)標(biāo)準(zhǔn)化,具體分為以下5個(gè)步驟。
步驟1:神經(jīng)網(wǎng)絡(luò)初始化。
根據(jù)神經(jīng)網(wǎng)絡(luò)類(lèi)型及打印矩陣算法確定節(jié)點(diǎn)數(shù)n,隱藏節(jié)點(diǎn)數(shù)1和打印層節(jié)點(diǎn)數(shù)m。確定打印范圍、訪問(wèn)率、ωij和ωik神經(jīng)元之間的連接及比例a、不可見(jiàn)層范圍b。
步驟2:隱藏層輸出及打印輸出。
2.3? 數(shù)據(jù)分析
利用已經(jīng)使用神經(jīng)網(wǎng)絡(luò)算法得到的標(biāo)準(zhǔn)化數(shù)據(jù)及研究得到的用戶相關(guān)行為數(shù)據(jù),建立用戶行為模型。深入了解學(xué)生在線學(xué)習(xí)效果,為教學(xué)策略的制定和調(diào)整提供參考依據(jù)。根據(jù)彈幕數(shù)據(jù)的特點(diǎn),結(jié)合采集并標(biāo)準(zhǔn)化的數(shù)據(jù)分為兩個(gè)部分。其一為用戶行為屬性數(shù)據(jù),包括在線學(xué)習(xí)時(shí)長(zhǎng)、賬號(hào)等級(jí)、發(fā)表彈幕的數(shù)量及發(fā)表彈幕的文本長(zhǎng)度;另一部分為用戶情感屬性數(shù)據(jù),目前大多數(shù)彈幕文本傾向于口語(yǔ)化表示,且?guī)в写罅勘砬榉?hào),從一些碎片化的詞語(yǔ)及表情符號(hào)可以體現(xiàn)出學(xué)生的情感。
(1)基礎(chǔ)情感詞語(yǔ)的提取。
BosonNLP屬于基礎(chǔ)情感詞典,其內(nèi)部的詞句是根據(jù)新聞、論壇、微博等數(shù)據(jù)來(lái)源的上百萬(wàn)篇情感標(biāo)注的數(shù)據(jù)而構(gòu)建的。囊括了很多正式的和非正式的文本表述,還收錄了很多褒義詞、中性詞和貶義詞,并按照情感傾向和情感強(qiáng)度對(duì)情感值進(jìn)行了賦權(quán)[4]。
(2)表情符號(hào)的提取。
彈幕中的表情符號(hào)往往與需要表達(dá)的情感是一致的。例如,“老師講的課真好”,其中“真好”與“”都表達(dá)了滿意的感情。因此,在彈幕分析過(guò)程中,可以使用表情符號(hào)判斷用戶情感??梢允褂谩肚楦斜倔w庫(kù)》七分類(lèi)標(biāo)準(zhǔn)(見(jiàn)表1),將表情符號(hào)從彈幕文本中剝離出來(lái),作為情感判斷的依據(jù)。
(3)網(wǎng)絡(luò)詞語(yǔ)的提取。
彈幕中經(jīng)常會(huì)出現(xiàn)一些網(wǎng)絡(luò)新詞,這些新詞不同于傳統(tǒng)的口語(yǔ)表達(dá)方式,現(xiàn)有的一些分詞法不適用于網(wǎng)絡(luò)詞語(yǔ)的分析,會(huì)影響網(wǎng)絡(luò)詞語(yǔ)提取及分析的準(zhǔn)確性。例如,“太難了,藍(lán)瘦香菇”。其中,“藍(lán)瘦香菇”并不是正常的文本詞語(yǔ),無(wú)法直接進(jìn)行分詞處理,“藍(lán)瘦”和“香菇”就屬于網(wǎng)絡(luò)詞語(yǔ)。這時(shí),就可以使用N-Gram+凝聚度+自由度的方法來(lái)提取及識(shí)別網(wǎng)絡(luò)詞語(yǔ)[5]。
3? ? 結(jié)語(yǔ)
本文從在線學(xué)習(xí)平臺(tái)學(xué)情分析的角度出發(fā),對(duì)彈幕中所表達(dá)的情感進(jìn)行研究,提出了基于神經(jīng)網(wǎng)絡(luò)的在線課堂彈幕評(píng)論的情感分析方法。將彈幕文本的處理過(guò)程分為數(shù)據(jù)采集、數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)分析3個(gè)步驟,使用神經(jīng)網(wǎng)絡(luò)算法完成采集數(shù)據(jù)的標(biāo)準(zhǔn)化工作。利用提出的模型探究在線課堂教學(xué)活動(dòng)中學(xué)生學(xué)習(xí)的學(xué)情和滿意度,為教學(xué)計(jì)劃的制定和修改提供有效的依據(jù)。
[參考文獻(xiàn)]
[1]段煉.面向彈幕文本的情感分析研究[D].重慶:重慶郵電大學(xué),2019.
[2]馬喆康.一種集成深度學(xué)習(xí)模型的旅游問(wèn)句文本分類(lèi)算法[J].計(jì)算機(jī)工程,2020(11):22-23.
[3]張咪樂(lè).基于概念神經(jīng)元網(wǎng)絡(luò)模型的高校政治教學(xué)系統(tǒng)構(gòu)建[J].自動(dòng)化技術(shù)及應(yīng)用,2020(39),58-60.
[4]邱全磊,崔宗敏,喻靜.基于表情和語(yǔ)氣的情感詞典用于彈幕情感分析[J].計(jì)算機(jī)技術(shù)與發(fā)展,2020(8):33-35.
[5]張咪樂(lè).面向視頻彈幕的文本情感分析與研究[D].蘭州:蘭州交通大學(xué),2020.
(編輯 傅金睿)