• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      文本情感分析研究概述

      2014-04-29 23:58:31董秦濤蘇亞峰屈志毅董秦濤蘇亞峰屈志毅
      電腦迷 2014年13期
      關(guān)鍵詞:情感分析語料庫

      董秦濤 蘇亞峰 屈志毅董秦濤 蘇亞峰 屈志毅

      摘 要 對文本情感分析研究進(jìn)行總結(jié),從情感詞抽取、語料庫和情感詞典構(gòu)建、主觀分析三個方面對文本情感分析研究相關(guān)文獻(xiàn)進(jìn)行梳理、評述,最后介紹了實際應(yīng)用。

      關(guān)鍵詞 情感分析 情感詞抽取 語料庫 情感詞典

      中圖分類號:TP3 文獻(xiàn)標(biāo)識碼:A

      0引言

      網(wǎng)絡(luò)已經(jīng)進(jìn)入到了“交互式網(wǎng)絡(luò)”時代。人們從網(wǎng)絡(luò)獲取信息的同時,也直接在各種網(wǎng)絡(luò)平臺表達(dá)喜、怒、哀、樂等各種情感。這些主觀性文本每天以指數(shù)級的速度增長,僅靠人工進(jìn)行分析不僅需要消耗大量的人力和時間,還易造成信息遺漏。

      因此采用計算機快速地進(jìn)行文本信息分類和情感信息的抽取,通過挖掘和分析文本中的立場、觀點、情緒等主觀信息,對文本情感傾向做出判斷,成為目前學(xué)術(shù)界研究的一個熱點,即文本情感分析。

      1文本情感分析概述

      情感分析是指分析發(fā)表者在傳達(dá)信息時所隱含的情緒狀態(tài),對發(fā)表者的態(tài)度、意見進(jìn)行判斷或者評估。文本情感分析是自然語言理解領(lǐng)域的重要研究分支,涉及統(tǒng)計學(xué)、語言學(xué)、心理學(xué)、人工智能等領(lǐng)域的理論與方法。

      文本情感分析的主要任務(wù)就是根據(jù)文本信息來判斷發(fā)表者的情感傾向,主要利用底層情感信息抽取的結(jié)果將情感文本單元分為若干類別本文將分別從情感詞抽取、語料庫和情感詞典構(gòu)建、主觀分析三個方面對文本情感分析研究相關(guān)文獻(xiàn)進(jìn)行梳理,最后介紹了實際應(yīng)用。

      2情感詞抽取

      情感詞又稱極性詞、評價詞語,特指帶有情感傾向性的詞語。評價詞語的抽取和判別,主要方法可分為基于大規(guī)模語料庫的統(tǒng)計方法 (表情符號可以視為情感詞的一種)、利用詞典計算相似度方法。

      2.1基于語料庫的情感詞抽取和判別

      利用大語料庫的統(tǒng)計特性,其最大優(yōu)點在于簡單易行;缺點是可利用的語料庫有限,評價詞語在大語料庫中的分布等現(xiàn)象并不容易歸納。Wilson T等人對主觀性文本進(jìn)行系統(tǒng)的分析研究,挖掘大量的主觀性文本形成主觀表達(dá)式庫,并基于此完成文本的主客觀分類和褒貶分類。RILOFF E等人用手工方法制定模板并以此選取種子情感詞,通過使用迭代的方法可以獲取名詞詞性的情感詞。

      2.2基于詞典的情感詞抽取及判別方法

      使用詞典中的詞語之間的詞義聯(lián)系挖掘評價詞語,其最大優(yōu)點是獲取情感詞全面、準(zhǔn)確,缺點是存在一詞多義現(xiàn)象。朱嫣嵐等人提出基于HowNet詞的語義相似度和語義相關(guān)的情感詞極性計算方法。Yang C等人使用PMI(Point wise Mutual Information),通過計算一個詞和已知極性的種子詞(或表情符號)的點互信息量,推斷該詞是不是情感傾向詞。王昌厚等人基于模式的Bootstrapping方法,從微博語料中抽取情感評價詞,通過模式劃定新詞的邊界,跨過新詞識別的過程,直接進(jìn)行情感傾向詞的抽取。

      3語料庫、情感詞典構(gòu)建

      語料庫:WIEBE J等人建立多視角問答語料庫對535篇廣泛來源的新聞進(jìn)行了語句級人工標(biāo)注,而且對語句的低層進(jìn)行了標(biāo)注,標(biāo)出了情感文本的發(fā)表者、對象、極性、強度等要素。除了情感,還標(biāo)注了情緒、推斷、信念等。

      情感詞典:STONE P等人收集了1915個褒義詞和2 293個貶義詞,并按照極性、強度、詞性等打上不同的標(biāo)簽,對于詞匯還列出不同的義項,可以區(qū)別不同義項和詞性下的褒貶極性,也相當(dāng)于對每個單詞都構(gòu)建了一組語義消歧規(guī)則。HowNet評價詞詞典,包含9193個中文評價詞語,9142個英文評價詞語,并被分為褒貶兩類。

      4主觀分析

      在情感分析中,分析意見的屬性與語句上下文正確理解對判斷情感極性至關(guān)重要。屬性極性判定的步驟為:(1)對句子進(jìn)行詞性標(biāo)注;(2)提取句子中所有的名詞利用挖掘算法尋找頻繁項集;(3)對頻繁項集的項進(jìn)一步篩檢;(4)從文本中抽取出包含特征詞的句子(情感句);(5)通過對情感詞的極性定位結(jié)合句子中可能出現(xiàn)的程度副詞和否定詞做出抽取屬性的傾向性判定。

      5文本情感分析應(yīng)用

      (1)用戶評論分析與決策

      在購買產(chǎn)品或者服務(wù)前,消費者可以獲取相關(guān)的評論可以提供參考,提供者可以通過評論進(jìn)一步改進(jìn)產(chǎn)品或者服務(wù)質(zhì)量。LIU B等人研究并開發(fā)的產(chǎn)品信息反饋系統(tǒng),利用網(wǎng)絡(luò)上的顧客評論資源,提取并統(tǒng)計消費者對產(chǎn)品特征的評價,采用可視化方式顯示統(tǒng)計和比較結(jié)果。

      (2)輿情監(jiān)控

      政府機構(gòu)可以通過公眾對新聞事件或國家政策的看法來了解輿。朱元波在其碩士論文中設(shè)計了在線網(wǎng)絡(luò)挖掘系統(tǒng),對暴恐組織網(wǎng)上串聯(lián)進(jìn)行監(jiān)督。

      6結(jié)語

      本文就國內(nèi)外文本情感分析研究情況進(jìn)行了總結(jié)和梳理,重點介紹了文本情感分析研究中的幾個關(guān)鍵問題:情感詞抽取、語料庫和情感詞典構(gòu)建、主觀分析,最后文本情感分析實際應(yīng)用進(jìn)行了概括。文本情感分析,特別是中文文本情感分析是一個新興的研究方向,具有非常廣闊的應(yīng)用前景。

      參考文獻(xiàn)

      [1] 楊立公,朱儉,湯世平.文本情感分析綜述.計算機應(yīng)用,2013,33(6):1574-1578.

      [2] 朱嫣嵐,閔錦,周雅倩等.基于HowNet的詞匯語義傾向計算[J].中文信息學(xué)報,2006,20(1):14-20.

      [3] 王昌厚,王菲.使用基于模式的Bootstrapping方法抽取情感詞[J].計算機工程與應(yīng)用,2014,50(1):127-129.

      [4] 李思.基于合并模型的中文文本情感分析.第五屆全國信息檢索學(xué)術(shù)會議,2009,1( 1):322-328.

      猜你喜歡
      情感分析語料庫
      《語料庫翻譯文體學(xué)》評介
      基于語料庫“隱秘”的詞類標(biāo)注初步探究
      把課文的優(yōu)美表達(dá)存進(jìn)語料庫
      基于語義的互聯(lián)網(wǎng)醫(yī)院評論文本情感分析及應(yīng)用
      基于雙向循環(huán)神經(jīng)網(wǎng)絡(luò)的評價對象抽取研究
      基于SVM的產(chǎn)品評論情感分析系統(tǒng)的設(shè)計與實現(xiàn)
      基于詞典與機器學(xué)習(xí)的中文微博情感分析
      在線評論情感屬性的動態(tài)變化
      預(yù)測(2016年5期)2016-12-26 17:16:57
      文本觀點挖掘和情感分析的研究
      基于JAVAEE的維吾爾中介語語料庫開發(fā)與實現(xiàn)
      語言與翻譯(2015年4期)2015-07-18 11:07:45
      德阳市| 高雄市| 海门市| 永川市| 永胜县| 简阳市| 崇州市| 大安市| 于都县| 瓦房店市| 谢通门县| 太仆寺旗| 鄄城县| 大城县| 都兰县| 浦东新区| 梁河县| 宜丰县| 通州市| 桐柏县| 孟州市| 台南县| 苍南县| 南汇区| 乌鲁木齐市| 拉孜县| 博客| 济阳县| 紫金县| 左权县| 太湖县| 石首市| 北流市| 石林| 屏东市| 喜德县| 普格县| 洛宁县| 景东| 大新县| 阳泉市|