蘇瑩 張勇 胡珀 涂新輝
摘 要:針對情感分析需要大量人工標注語料的難點,提出了一種面向無指導情感分析的層次性生成模型。該模型將樸素貝葉斯(NB)模型和潛在狄利克雷分布(LDA)相結合,僅僅需要合適的情感詞典,不需要篇章級別和句子級別的標注信息即可同時對網(wǎng)絡評論的篇章級別和句子級別的情感傾向進行分析。該模型假設每個句子而不是每個單詞擁有一個潛在的情感變量;然后,該情感變量再以樸素貝葉斯的方式生成一系列獨立的特征。在該模型中,樸素貝葉斯假設的引入使得該模型可以結合自然語言處理(NLP)相關的技術,例如依存分析、句法分析等,用以提高無指導情感分析的性能。在兩個情感語料數(shù)據(jù)集上的實驗結果顯示,該模型能夠自動推導出篇章級別和句子級別的情感極性,該模型的正確率顯著優(yōu)于其他無指導的方法,甚至接近部分半指導或有指導的研究方法。
關鍵詞:情感分析;主題模型;潛在狄利克雷分布;樸素貝葉斯;意見挖掘
中圖分類號: TP391.1 文獻標志碼:A英文標題