殷復(fù)蓮 張曉宇 馮晴 王思佳
摘要:針對(duì)互聯(lián)網(wǎng),尤其是微博平臺(tái)中大學(xué)生用戶的海量文本,應(yīng)用貝葉斯網(wǎng)絡(luò)分類器對(duì)微博評(píng)論進(jìn)行分類?;谪惾~斯,通過(guò)先驗(yàn)概率和似然度求出后驗(yàn)概率的原理,針對(duì)具體事件選擇不同的訓(xùn)練集和調(diào)整特征詞庫(kù),得到大學(xué)生對(duì)熱點(diǎn)事件關(guān)注相較于整體網(wǎng)民更加理性、冷靜的結(jié)論,可為研究大學(xué)生心理健康及大學(xué)生輿情提供參考。
關(guān)鍵詞:貝葉斯分類;文本分類;文本分詞;概率估測(cè);大學(xué)生;熱點(diǎn)事件
DOIDOI:10.11907/rjdk.161251
中圖分類號(hào):TP319文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1672-7800(2016)006-0112-03
參考文獻(xiàn):
[1]中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心.第36次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[R].北京:中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心.2015.
[2]吳保來(lái).基于互聯(lián)網(wǎng)的社交網(wǎng)絡(luò)研究[D].北京:中共中央黨校,2013.
[3]田野.基于微博平臺(tái)的事件趨勢(shì)分析及預(yù)測(cè)研究[D]武漢:武漢大學(xué),2012.
[4]李榮陸.文本分類及其相關(guān)技術(shù)研究[D]上海:復(fù)旦大學(xué),2005.
[5]許林杰.中文文本分詞研究[D]濟(jì)南:山東師范大學(xué),2003.
[6]李原.中文文本分類中分詞和特征選擇方法研究[D]長(zhǎng)春:吉林大學(xué),2011.
[7]蔣良孝.樸素貝葉斯分類器及其改進(jìn)算法研究[D]北京:中國(guó)地質(zhì)大學(xué),2009.
[8]馮永,李華,鐘將等.基于自適應(yīng)中文分詞和近似SVM的文本分類算法[J].計(jì)算機(jī)科學(xué),2010,37(1):251-252.