基于CRF的中文評論有效性挖掘產(chǎn)品特征*

2014-09-14 01:35:40蔡敦波吳云韜

計算機工程與科學(xué) 2014年2期

呂品，鐘珞，蔡敦波，吳云韜

(1.武漢理工大學(xué)計算機科學(xué)與技術(shù)學(xué)院,湖北武漢 430070；2.武漢工程大學(xué)計算機科學(xué)與工程學(xué)院,湖北武漢 430073；3.武漢工程大學(xué)智能機器人湖北省重點實驗室，湖北武漢 430073)

呂品1,2,3，鐘珞1，蔡敦波2,3，吳云韜2,3

方面級意見挖掘的任務(wù)通常包括從客戶評論中抽取產(chǎn)品的特征、與產(chǎn)品特征相關(guān)聯(lián)的觀點詞識別以及觀點的極性判斷三個方面。圍繞如何實現(xiàn)中文評論的方面級意見挖掘問題，提出了利用條件隨機場實現(xiàn)中文評論的方面級意見挖掘的四個主要步驟：數(shù)據(jù)預(yù)處理、訓(xùn)練集準(zhǔn)備、為條件隨機場模型定義學(xué)習(xí)函數(shù)、應(yīng)用模型標(biāo)注新的評論數(shù)據(jù)。在此基礎(chǔ)上，通過以五種實際產(chǎn)品的中文評論語料為數(shù)據(jù)集,對該方法進(jìn)行了數(shù)據(jù)實驗。實驗結(jié)果表明，該方法針對不同類型觀點元素的抽取在評估性能指標(biāo)上大部分達(dá)到或超過80%。為了進(jìn)一步驗證所提出方法的有效性,將研究結(jié)果進(jìn)行了差異顯著性檢驗。結(jié)果顯示，用CRF對中文評論進(jìn)行方面級意見挖掘和對英文評論的方面意見挖掘的性能差異不大。最后，比較了三種不同方法的方面抽取精度和情感分類精度，實驗結(jié)果表明，CRF方法優(yōu)于詞典化的隱馬爾可夫模型和關(guān)聯(lián)規(guī)則挖掘方法。

條件隨機場；方面級意見挖掘；觀點元素

1 引言

隨著Web上社會媒體(評論、論壇討論、博客和社會網(wǎng)絡(luò))爆炸性的增長，許多個人和組織都想利用這些媒體上的內(nèi)容為自己的決策作支持。然而，由于各種各樣的網(wǎng)站大量出現(xiàn)，尋找、監(jiān)測和抽取這些網(wǎng)站中的信息是一個艱巨的任務(wù)。為了解決這一問題，許多研究者提出了各種各樣的Web意見挖掘方法，旨在從這些媒體中發(fā)現(xiàn)必要的信息并把它們呈現(xiàn)給用戶。絕大多數(shù)意見挖掘方法可以歸為兩大類：篇章級意見挖掘和方面級意見挖掘。方面級意見挖掘中所指的方面可以是被評論產(chǎn)品的某個物理組成部分、功能或性質(zhì)，亦可以是被評論事件的某一個特征等。篇章級意見挖掘主要解決一篇文檔的總體觀點極性；方面級意見挖掘主要解決從句子中發(fā)現(xiàn)方面然后找出與該方面相聯(lián)系的觀點。顯然，篇章級意見挖掘不能向用戶提供觀點持有者對某一實體各方面的評價信息。為了獲得這樣的詳細(xì)信息，方面級意見挖掘日趨成為情感分析領(lǐng)域的一個研究熱點。

以英文語料為研究對象的方面級意見挖掘早在2004年就被提出,研究者已經(jīng)取得一些初步成果,而針對中文的研究還處于起步階段。不斷增長的中文評論已經(jīng)成為互聯(lián)網(wǎng)上一個重要的組成部分,為了給企業(yè)和個人提供更為方便的工具,自動化和智能化地挖掘中文評論中的有價值信息是非常必要的。但是，由于中英文語言存在著較大的差異,目前針對英文評論的研究成果很多無法直接應(yīng)用于中文評論。這些差異的主要根源在如下一些問題上:(1)文化差異導(dǎo)致語言表達(dá)方式不同；(2)語言結(jié)構(gòu)的差異；(3)中英文詞匯語法的差別。

本文正是在中英文語言存在差異的條件下,探索中文評論中意見挖掘中的信息提取技術(shù)。通過研究如何在方面級意見挖掘的三個任務(wù)中運用條件隨機場模型,把目前主要面向英文的評論挖掘方法拓展到中文,從而解決中文環(huán)境下,如何對客戶評論中所隱含的信息進(jìn)行自動挖掘的問題。

2 相關(guān)研究背景

2.1 基于頻率統(tǒng)計的挖掘方法

此方法是2004年Hu和Liu等人[1]首次提出的。它的基本原理是：(1) 使用關(guān)聯(lián)規(guī)則挖掘算法、壓縮修剪、冗余修剪等技術(shù)抽取頻繁名詞或名詞短語作為方面,如“價格”作為被評價實體的方面；(2)識別與這些頻繁方面最近的觀點詞，如價格的“高”或“低”；(3)形成一個基于被評價實體各方面的意見文摘系統(tǒng)。此方法最大的優(yōu)點是通常領(lǐng)域獨立或語言獨立，思想簡單，易實現(xiàn)，并且不需要訓(xùn)練數(shù)據(jù)集。但是，它也有一定的局限性，如：不能自動識別觀點的強度，不能很好處理隱含的方面表達(dá)。從2005年至今，許多研究者對該方法進(jìn)行了各種改進(jìn)，但這些改進(jìn)工作由于其針對的對象不同也各有其局限性。

2.2 基于監(jiān)督學(xué)習(xí)的挖掘方法

Li等人[2]提出了一種基于依存語法圖的監(jiān)督學(xué)習(xí)方法抽取(方面，觀點)信息對。他們在電影評論數(shù)據(jù)集上評估了該算法，并把得到的結(jié)果與Hu等人的方法進(jìn)行了比較。結(jié)果顯示他們所提方法的F-measure為52.9%，高于Hu等人方法的F-measure(48.8%)。CRF(Conditional Random Field)模型是另一種基于監(jiān)督的挖掘方法，在產(chǎn)品評論挖掘中有潛在的優(yōu)勢。因為它通過定義最大化條件概率p(Y|X)，選擇一個標(biāo)簽序列Y標(biāo)注一個觀察序列X。顯然，CRF能考慮被評價實體的任意方面，而且不需要條件獨立假設(shè)。該特性使得CRF廣泛使用于傳統(tǒng)的信息抽取任務(wù)，如詞性標(biāo)注和解析、命名實體的識別等。近來，有部分研究者利用CRF處理顧客評論。例如，Zhao等人[3]利用CRF執(zhí)行句子級和篇章級情感分類。Li等[4]研究者整合了兩個CRF變量：Skip-CRF和Tree-CRF同時抽取方面的觀點詞。與普通的CRF只能利用詞序列學(xué)習(xí)不同，Skip-CRF和Tree-CRF還可以利用CRF學(xué)習(xí)結(jié)構(gòu)特征。Choi等人[5]使用CRF從評論數(shù)據(jù)中識別觀點持有者。他們的錯誤分析報告報道了不精確的觀點識別對挖掘結(jié)果有很大程度的負(fù)面影響。Miao等人[6]使用CRF執(zhí)行方面抽取并獲得了合理的結(jié)果。他們在電影評論數(shù)據(jù)集中取得了86%的精度。Jakob等人[7]進(jìn)一步利用CRF解決跨領(lǐng)域應(yīng)用問題，例如，判斷在一個領(lǐng)域上訓(xùn)練的模型是否能在另一個領(lǐng)域上使用。他們還評估了在這種環(huán)境下方面抽取的精度。Chen等人[8]利用CRF實現(xiàn)了從評論中抽取多種類型的評論信息，如：實體的組成部分、實體的功能、實體的屬性、觀點和觀點的強度等。并將基于CRF的意見挖掘與基于頻率統(tǒng)計的方法及基于詞典化的HMM進(jìn)行了深入的比較。結(jié)果表明，該方法在同時抽取多種評論信息時的精度超過其它的所有方法。

目前國內(nèi)有關(guān)方面級意見挖掘的研究還處在起步階段。李實等人[9]提出了針對中文客戶評論中的產(chǎn)品特征的抽取方法，并證明了該方法的可行性和有效性，但該方法是基于頻率統(tǒng)計的一種改進(jìn)的關(guān)聯(lián)規(guī)則挖掘算法。據(jù)我們所了解，利用CRF研究中文評論中抽取不同類型的信息還很少有研究。本文針對中文評論的語言特點和風(fēng)格特征，嘗試?yán)肅RF實現(xiàn)方面級意見挖掘,探索中文客戶評論的意見挖掘方法和理論, 并且通過實驗表明了這一方法的有效性。

3 基于CRF的方面級意見挖掘方法

3.1 方法的基本思路

本文利用CRF在中文評論語料上實現(xiàn)方面級意見挖掘。CRF是一種圖模型[8]。圖中所有結(jié)點稱之為狀態(tài)。這些狀態(tài)包括可以觀察到的狀態(tài)集合W和隱藏的狀態(tài)集合T。W通常是評論文本，它的詞性標(biāo)注標(biāo)簽表示為集合S。T通常是預(yù)先定義好的類別集合。圖中的邊表示所有狀態(tài)之間的關(guān)系，這個關(guān)系通常由學(xué)習(xí)函數(shù)定義。利用CRF進(jìn)行挖掘的目標(biāo)就是從產(chǎn)品評論中抽取被評價實體的不同方面，識別與不同方面相關(guān)的觀點、觀點強度和觀點的極性等。通常把被評價實體的不同方面及與之相關(guān)聯(lián)的觀點、觀點強度和觀點的極性稱之為觀點元素。利用CRF進(jìn)行挖掘的方法就是給W中的每一個詞賦予一個T中的標(biāo)簽。由此可見，利用CRF實現(xiàn)意見挖掘就是一個自動標(biāo)注過程。此過程主要由四個步驟完成：(1)數(shù)據(jù)預(yù)處理；(2)準(zhǔn)備符號標(biāo)記與訓(xùn)練集；(3)為CRF定義學(xué)習(xí)函數(shù)，并訓(xùn)練CRF模型最大化條件概率；(4)應(yīng)用模型標(biāo)注新的評論數(shù)據(jù)中的觀點元素。為了突出預(yù)先定義符號標(biāo)記和訓(xùn)練集等步驟的準(zhǔn)備，將數(shù)據(jù)預(yù)處理置于實驗部分的5.3節(jié)。

3.2 準(zhǔn)備符號標(biāo)記與訓(xùn)練集

這一步驟的主要工作分兩個階段完成：首先為CRF準(zhǔn)備預(yù)先定義好的類別集合T；然后根據(jù)類別集合T準(zhǔn)備訓(xùn)練語料。表1明確給出了從評論中挖掘的具體信息屬于哪一類觀點元素，例如：觀點元素是被評價目標(biāo)的組成部分、功能、性質(zhì)或是與之相關(guān)的觀點等。觀點元素類別集合T的詳細(xì)類別符號標(biāo)記如表2所示。

Table 1 Class and description of opinion element表1 觀點元素的類別及描述

Table 2 Class and associated symbol tag of opinion element表2 觀點元素的類別與該類別對應(yīng)的符號標(biāo)記

符號標(biāo)記的準(zhǔn)備工作完成之后，本文采用中國科學(xué)院計算機所的中文分詞與詞性標(biāo)注工具ICTCLAS對評論語料進(jìn)行分詞與詞性標(biāo)注，為人工標(biāo)注訓(xùn)練語料中觀點元素的類別作準(zhǔn)備。由于二級詞性標(biāo)注可以標(biāo)注出更為具體的情況,包括具有名詞功能的形容詞或者動詞、專有名詞、詞素等等目標(biāo)，為了提高挖掘查準(zhǔn)率,采用二級標(biāo)注。同時，中文客戶評論中所討論的產(chǎn)品的組成部分、功能或?qū)傩缘瓤赡苡擅~短語構(gòu)成,但中文評論的詞性標(biāo)注過程中并不能直接標(biāo)注出名詞短語(除了專有名詞短語以外,例如，地名、單位名稱) ,再加上基本名詞的定義各不相同，本文采用的是周雅倩等人[10]提出的基本名詞短語定義。它規(guī)定基本名詞短語為非嵌套的名詞短語,包括單個名詞、沒有任何修飾成分的名詞短語、難以確定修飾關(guān)系的一串名詞、并列名詞性成分、專有名詞、時間、地點等,這種基本名詞短語占語料中所有基本短語的60.8%。根據(jù)這個定義,本文在實驗中根據(jù)以下兩種簡單情況界定名詞短語：(1)兩個相鄰的名詞連接構(gòu)成的短語(專有名詞和時間、地點名詞除外,但包含二級分詞標(biāo)注出來具有名詞功能的形容詞或者動詞，具有名詞功能的形容詞或者動詞)；(2)用結(jié)構(gòu)助詞“的”連接的兩個名詞構(gòu)成的短語。

3.3 定義學(xué)習(xí)函數(shù)

學(xué)習(xí)函數(shù)是觀察狀態(tài)詞序列W=w1w2w3…wN，W對應(yīng)的詞性標(biāo)注序列S=s1s2s3…sN以及隱藏狀態(tài)T=t1t2…ti-1ti+1…tN之間的關(guān)系。學(xué)習(xí)函數(shù)的一般形式是fi(tj-1,tj,w1:N,s1:N)，它表明了相鄰的狀態(tài)tj-1與tj、詞序列W=w1w2w3…wN以及它對應(yīng)的詞性標(biāo)注序列S=s1s2s3…sN之間的關(guān)系。那么，可以定義一個二值函數(shù)：如果當(dāng)前的詞wj是“照片”，它對應(yīng)的詞性標(biāo)注sj為名詞，前一個狀態(tài)tj-1是觀點，當(dāng)前的狀態(tài)tj是屬性，那么函數(shù)fi的值為1，否則為0。

fi(tj-1,tj,w1:N,s1:N)=

(1)

于是可得到以下條件概率：

(2)

(3)

3.4 訓(xùn)練CRF模型

(4)

其中，M是評論語料中句子的個數(shù)。為了避免模型過度擬合，可通過對參數(shù)的先驗分布加入懲罰因子。通常情況下采用均值為0的高斯分布，因而等式(4)變?yōu)椋?/p>

(5)

由于等式(5)是凹的，所以它有一個唯一的全局最優(yōu)解?？梢酝ㄟ^L-BFGS優(yōu)化算法求解目標(biāo)函數(shù)的梯度學(xué)習(xí)參數(shù)[11]。目標(biāo)函數(shù)的梯度計算如下：

(6)

在等式(6)中，第一項是函數(shù)fi在訓(xùn)練數(shù)據(jù)集中活動(fi=1)的次數(shù)。第二項是在當(dāng)前訓(xùn)練模型下對這個函數(shù)預(yù)測的活動次數(shù)。第三項由先驗分布產(chǎn)生。因此，這個派生項測量了精確的頻率與預(yù)測頻率的距離。假定在這個訓(xùn)練數(shù)據(jù)中，一個函數(shù)fk的活動次數(shù)是A，在當(dāng)前模型下，預(yù)測活動次數(shù)是B：當(dāng)|A|=|B|，派生項的值為0。因此，訓(xùn)練過程就是找到能最小化派生項的λk。

4 CRF模型的使用

獲取了使派生項最小化的參數(shù)λk后，使用模型的目標(biāo)就是應(yīng)用訓(xùn)練模型給句子中的詞自動標(biāo)注上最合適的觀點元素類型符號標(biāo)記。這必須要求每一步的條件概率都是最大的。假定當(dāng)前詞的位置是j,它有M個不同的候選標(biāo)記，于是有Viterbi變量αj(m)=p(W,S,tj=m)。Viterbi遞歸式如等式(7)所示：

(7)

其中，φj(W,S,m′,m)是觀察序列為W和S時狀態(tài)m′到狀態(tài)m的轉(zhuǎn)換函數(shù)。在本文中，轉(zhuǎn)換函數(shù)的定義如下：

(8)

遞歸求解Viterbi變量后，就能識別句子中合適的標(biāo)記分配。

5 實驗驗證

5.1 數(shù)據(jù)集

本文選取了五種商品的網(wǎng)絡(luò)評論作為實驗語料進(jìn)行數(shù)據(jù)實驗, 這五種商品分別是一款手機(蘋果 iPhone 4)、兩款數(shù)碼相機(Cannon PowerShot SX210 IS,Cannon PowerShot A3300 IS)、一款MP3播放器(臺電 c700sp)和一本圖書(《達(dá)芬奇的密碼》)。其中手機、數(shù)碼相機及MP3 播放器的評論從淘寶網(wǎng)下載, 圖書評論從卓越網(wǎng)下載?？偣策x取了821篇評論(1 775個句子)。然后去除這些評論中無意義的符號和標(biāo)記信息。為了檢驗CRF方法在中英文評論語料上進(jìn)行方面級挖掘的差異性，本文在實驗中還準(zhǔn)備了與中文評論語料中產(chǎn)品種類相似、評論篇數(shù)相同的英文語料數(shù)據(jù)集，該數(shù)據(jù)集來自文獻(xiàn)[1]。

5.2 性能評估方法

為了評估利用CRF實現(xiàn)挖掘的性能,本文采取了在文本處理問題研究中普遍使用的性能評估指標(biāo)：查準(zhǔn)率P(Precision)、查全率R(Recall)、F1-measure值F1(F1-measure)、精確度A(Accuracy)。本文中研究的問題主要是判斷利用CRF抽取的觀點元素是否為人工標(biāo)注的真實類別(如表2所示)。評估采用的混淆矩陣(Confusion Matrix)如表3所示。

Table 3 Confusion matrix of performance measure表3 性能評估混淆矩陣

根據(jù)表3有：P=a/(a+b)，R=a/(a+c)，F(xiàn)1=2PR/(P+R)，A=(a+b)/(a+b+c+d)。實驗中分別針對中文語料和英文語料把整個數(shù)據(jù)集平均分成10個子集，隨機選擇其中一個子集用作每一輪的測試驗證，其它九個子集用作訓(xùn)練集。這樣的交叉驗證過程執(zhí)行10次，查全率、查準(zhǔn)率、F值和精確度是10次交叉驗證的平均值。

5.3 用CRF挖掘中文評論的實驗結(jié)果

表4列出了10次交叉驗證后的比較結(jié)果，從中可以看出，用CRF對中文評論進(jìn)行方面級挖掘也取得了較好的性能指標(biāo)，大部分性能指標(biāo)值接近或超過80%。

Table 4 Comparison of performance extracted opinionelements:Component, Function, Feature表4 被抽取的觀點元素：組成部分、功能、屬性的性能比較

為了比較在中文語料中使用名詞短語界定的效果，我們利用CRF只針對中文語料中的功能這一觀點元素的抽取進(jìn)行了名詞短語的界定。從表4可以看出，該項在中文語料上獲得的三個性能指標(biāo)值要比針對英文語料的高。其中的主要原因有兩個方面：(1)在中文詞性標(biāo)注時采用了二級標(biāo)注。二級詞性標(biāo)注可以標(biāo)注出更為具體的情況，包括具有名詞功能的形容詞或者動詞、專有名詞、詞素等，那么在對訓(xùn)練集進(jìn)行人工標(biāo)注時，可以給一些不是名詞但卻具有名詞功能的詞標(biāo)注〈COMM_Func〉的符號標(biāo)記。(2)使用了3.2節(jié)的名詞短語界定方法，那么在對訓(xùn)練集進(jìn)行人工標(biāo)注時，可以給一些名詞短語標(biāo)注為〈COMM_Func〉的符號標(biāo)記。當(dāng)模型學(xué)習(xí)到具有這些特點的詞后，就可以對新數(shù)據(jù)中出現(xiàn)的類似詞進(jìn)行〈COMM_Func〉標(biāo)記。然而，其它兩項觀點元素由于沒有使用名詞短語的抽取，在三項性能指標(biāo)上均比英文語料低。其中的主要原因是利用CRF對英文語料數(shù)據(jù)集進(jìn)行挖掘時，考慮了具有名詞詞性的詞或短語表示功能這一觀點元素：組成部分和性質(zhì)。

對于觀點元素：觀點與觀點強度抽取性能比較，從表5可以看出，用CRF對中文評論進(jìn)行挖掘也取得了較好的性能指標(biāo)。每一項的性能指標(biāo)值都在80%以上，有些值還高出了利用CRF對英文語料的挖掘。例如，觀點的查全率是86.1%，這是因為除了形容詞或副詞明顯地表示觀點之外，一些表示資源的名詞也隱含有觀點，我們在人工標(biāo)注的過程中也給這樣的名詞賦予了觀點的符號標(biāo)記。而我們針對英文語料的處理使用的是文獻(xiàn)[8]中的方法，作者在利用CRF進(jìn)行觀點抽取時并沒有涉及如何從評論中推導(dǎo)出隱藏的觀點，因而我們在處理英文語料時也忽略了隱含觀點的推導(dǎo)。觀點強度的查準(zhǔn)率達(dá)到92.8%，這其中主要原因是當(dāng)中文評論中出現(xiàn)了感嘆詞時，在人工標(biāo)注訓(xùn)練集時，我們給這樣的感嘆詞一個觀點強度的標(biāo)注，由于中英文語料的風(fēng)格差異，英文語料中沒有這樣的處理過程。

Table 5 Comparison of performance extracted opinionelements:Opinion, Opinion Intensifier表5 被抽取的觀點元素：觀點、觀點強度的性能比較

表6給出了觀點句的判斷和句子極性的確定的比較結(jié)果。從表6可以看出，所有針對中文語料的性能評估值都在80%以上，這與表5中給出的針對中文語料的實驗結(jié)果相吻合。也即抽取的觀點與觀點強度越多越準(zhǔn)確，說明對語料中觀點句的判斷和對句子極性的確定就越具有多樣性。因而，針對中文語料句子極性的查全率高。

Table 6 Comparison of performance extractedopinion sentences and sentence polarity表6 觀點句、句子極性的識別性能比較

通過對相同類型產(chǎn)品的中英文語料的實驗研究表明，利用CRF針對中文評論進(jìn)行方面級挖掘具有一定有效性。為了深入驗證方法的實際性能,本文還進(jìn)一步針對中英文產(chǎn)品評論的挖掘結(jié)果進(jìn)行了差異顯著性檢驗。

5.4 差異顯著性檢驗

為了進(jìn)一步確認(rèn)用CRF方法對中文評論挖掘的有效性,將本文研究結(jié)果和文獻(xiàn)[8]的研究結(jié)果進(jìn)行比較,并對兩者差異做顯著性檢驗。如果兩個結(jié)果接近(即本文結(jié)果顯著好于或與文獻(xiàn)[8]的研究結(jié)果的差距不明顯) ,則可以進(jìn)一步驗證用CRF方法對中文評論挖掘的有效性。檢驗過程中所用實驗數(shù)據(jù)與文獻(xiàn)[8]中的數(shù)據(jù)種類相同，評論的篇數(shù)相同(注意：文獻(xiàn)[8]中的一個數(shù)據(jù)集是以文獻(xiàn)[1]中給出的產(chǎn)品種類與評論篇數(shù)為標(biāo)準(zhǔn)的),最后將實驗結(jié)果與文獻(xiàn)[8]的實驗結(jié)果即查準(zhǔn)率和查全率分別進(jìn)行差異T檢驗,同時考慮了與分類隨機比率50%的差異檢驗。

實驗中采用兩個比率之間顯著性差異的T檢驗，具體方法如下：設(shè)樣本集S中含量n個樣本，其中有nk個對象具有類別C，即類別C在樣本中出現(xiàn)的比率為p=nk/n。當(dāng)需要比較該比率與一個給定的比率π是否存在顯著差異時，可以用公式(9)計算T值。

(9)

在實驗中查準(zhǔn)率的n就是指利用CRF識別出的某一觀點元素的個數(shù)，查全率的n就是人工標(biāo)注的某一觀點元素的個數(shù)。自由度為n-2。隨機比率0.5的p值指的是分類隨機比率50%的差異顯著性檢驗。

最后總體差異顯著性檢驗實驗結(jié)果如表7所示。可以看到,本文與文獻(xiàn)[8]的平均實驗結(jié)果在觀點元素組成部分的查準(zhǔn)率差異在0.05水平上顯著, 查全率不顯著；觀點元素功能的查全率在0.05水平上顯著,查準(zhǔn)率不顯著。這說明本文使用CRF對中文評論挖掘和對英文評論挖掘的性能差異不大,進(jìn)一步驗證了CRF對中文語料挖掘的有效性。

5.5 CRF方法與其它方法挖掘中文評論的比較

根據(jù)相關(guān)研究工作可知，L-HMM方法[12]與ARM(關(guān)聯(lián)規(guī)則挖掘)方法[1]分別是基于監(jiān)督挖掘方法與基于頻率統(tǒng)計方法的代表，本節(jié)將CRF與這兩種方法進(jìn)行兩個方面的比較。一個是方面抽

Table 7 Result of difference verification表7 差異檢驗結(jié)果

注:上標(biāo)*，*分別表示結(jié)果在0. 01和0. 05水平上顯著,沒有*表示不顯著

取精度的比較，另一個是針對不同方面情感分類精度的比較。由于篇幅的原因，實驗只針對數(shù)碼相機(Cannon PowerShot SX210 IS)這一被評價實體。實驗有兩個目的，第一個目的是要觀察用戶給定被評價實體的方面?zhèn)€數(shù)，這三種方法的抽取精確度；第二個目的是要觀察針對用戶給定的被評價實體的方面，尋找與該方面相關(guān)聯(lián)的觀點并按極性(肯定的或否定的)進(jìn)行分類的情況。從圖1中可以看出CRF方法無論用戶給定被評價實體的方面是多或是少，該方法抽取方面的精度均值在80%以上，高于L-HMM方法且遠(yuǎn)遠(yuǎn)高于ARM方法。這主要是因為ARM方法只關(guān)心頻繁名詞所對應(yīng)的方面，而忽視了非頻繁出現(xiàn)的名詞以及一些抽象名詞也可能是被評論對象的某一個方面。

Figure 1 Comparison of aspect extraction accuracy圖1 方面抽取精度比較

對于不同抽取方法在情感分類精度上的比較結(jié)果如圖2所示。從圖2中可以看出，隨著用戶給定被評價實體的方面越來越多，CRF方法的方面級情感分類精度都遠(yuǎn)遠(yuǎn)高于ARM方法。這是因為本文在訓(xùn)練數(shù)據(jù)集的準(zhǔn)備時，對評論中某些暗含有觀點的名詞進(jìn)行了人工標(biāo)注，因而訓(xùn)練模型學(xué)習(xí)到了這方面的知識，從而使得模型在使用階段能夠發(fā)現(xiàn)新的評論中具有這樣特點的詞。然而，由于L-HMM方法與ARM方法都沒有涉及到隱式的觀點詞，所以其分類精度要比CRF低。L-HMM方法高于ARM方法的原因是因為L-HMM方法融合了多個重要的語言特性，如詞性標(biāo)注、詞的上下文環(huán)境暗示等。

Figure 2 Comparison of aspect sentiment classification accuracy圖2 方面情感分類精度比較

6 結(jié)束語

方面級意見挖掘的方法主要有兩大類：基于頻率統(tǒng)計的方法與基于監(jiān)督學(xué)習(xí)的方法。關(guān)聯(lián)挖掘算法是典型的基于頻率統(tǒng)計的方法，隱馬爾可夫模型和條件隨機場模型則是基于監(jiān)督學(xué)習(xí)的方法。目前這些方法主要針對的研究對象大部分是英文評論語料，并且條件隨機場模型是所有這些方法中精度最優(yōu)的模型。本文圍繞如何實現(xiàn)中文評論語料的方面級意見挖掘問題，提出了利用條件隨機場實現(xiàn)中文評論語料的方面級意見挖掘的方法與步驟。通過數(shù)據(jù)實驗分析與差異顯著性檢驗，表明了用條件隨機場實現(xiàn)中文評論的方面級意見挖掘是有效可行的。由于基于監(jiān)督學(xué)習(xí)的方法需要大量的人工標(biāo)注數(shù)據(jù)，因而如何減少人工標(biāo)注工作量，提高挖掘的效率是本工作下一步研究的主要目標(biāo)。

[1] Hu Min-qing, Liu Bing. Mining and summarizing customer reviews[C]∥Proc of ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2004:168-177.

[2] Li Zhuang, Feng Jing, Zhu Xiao-yan. Movie review mining and summarization[C]∥ Proc of the 15th ACM International Conference on Information and Knowledge Management, 2006:43-50.

[3] Zhao J,Liu K,Wang G.Adding redundant features for CRFs-based sentence sentiment classification[C]∥Proc of the Conference on Empirical Methods in Natural Language Processing,2008:117-126.

[4] Li Fang-tao, Han Chao, Huang Min-lie, et al. Structure-aware review mining and summarization[C]∥ Proc of the 23rd International Conference on Computational Linguistics (COLING-2010), 2010:653-661.

[5] Choi Y, Cardie C. Adapting a polarity lexicon using integer linear programming for domain-specific sentiment classification[C]∥Proc of the 2009 Conference on Empirical Methods in Natural Language Processing, 2009:590-598.

[6] Miao Q, Li Q, Zeng D. Mining fine grained opinions by using probabilistic models and domain knowledge[C]∥Proc of the 2010 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology-WI-IAT’10,2010:358-365.

[7] Jakob N, Gurevych I. Extracting opinion targets in a single and cross domain setting with conditional random fields[C]∥Proc of the 2010 Conference on Empirical Methods in Natural Language Processing, 2010:1035-1045.

[8] Chen Li, Qi Luo-le, Wang Feng. Comparison of feature-level learning methods for mining online consumer reviews[J]. Expert Systems with Applications, 2012, 39(10):9588-9601.

[9] Li Shi, Ye Qiang, Li Yi-jun, et al. Research on the approaches of mining product features from Chinese customer reviews on the internet[J]. Journal of Management Sciences in China, 2009,12(2):142-152.(in Chinese)

[10] Zhou Ya-qian, Guo Yi-kun, Huang Xuan-jing, et al. Chinese and English baseNP recognition based on a maximum entropy model[J]. Jouranl of Computer Research and Development, 2003, 40(3):440-446.(in Chinese)

[11] Liu D, Nocedal J. On the limited memory BFGS method for large scale optimization [J]. Mathematical Programming, 1989, 45(3):503-528.

[12] Jin W, Ho H, Srihari R. OpinionMiner:A novel machine learning system for web opinion mining and extraction[C]∥

Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2009:1195-1204.

附中文參考文獻(xiàn)：

[9] 李實,葉強, 李一軍, 等.中文網(wǎng)絡(luò)客戶評論的產(chǎn)品特征挖掘方法研究[J].管理科學(xué)學(xué)報,2009,12(2):142-152.

[10] 周雅倩, 郭以昆, 黃萱菁, 等. 基于最大熵方法的中英文基本名詞短語識別[ J ]. 計算機研究與發(fā)展, 2003, 40(3):440-446.

LüPin,born in 1973,PhD candidate,associate professor,her research interests include text mining, and sentiment analysis.

鐘珞(1957-),男,湖北武漢人，博士，教授，研究方向為智能技術(shù)與智能系統(tǒng)，軟件工程，知識發(fā)現(xiàn)與數(shù)據(jù)挖掘。E-mail:zhongluo@netease.com

ZHONGLuo,born in 1957,PhD,professor,his research interests include intelligent technology and system, software engineering, knowledge discover, and data mining.

蔡敦波(1981-),男,吉林長春人，博士，講師，研究方向為智能規(guī)劃、自動推理和約束可滿足。E-mail:dunbocai@gmail.com

CAIDun-bo,born in 1981,PhD,lecturer,his research interests include intelligent planning, automated reasoning, and constraint satisfaction.

吳云韜(1973-),男,湖北恩施人，博士，教授，研究方向為統(tǒng)計信號處理中的信號檢測和參數(shù)估計、智能信息處理。E-mail:ytwu@sina.com

WUYun-tao,born in 1973,PhD,professor,his research interests include signal detection and parameter estimator of statistical signal processing, and intelligent information processing.

EffectiveminingproductfeaturesfromChinesereviewbasedonCRF

Lü Pin1,2,3,ZHONG Luo1,CAI Dun-bo2,3,WU Yun-tao2,3

(1.College of Computer Science and Technology,Wuhan University of Technology,Wuhan 430070;2.School of Computer Science and Engineering,Wuhan Institute of Technology,Wuhan 430073;3.Hubei Province Key Laboratory of Intelligent Robot,Wuhan Institute of Technology,Wuhan 430073,China)

The task of aspect-level opinion mining usually include the extraction of product entities from consumer reviews, the identification of opinion words that are associated with the entities, and the determination of these opinion’s polarities. Aiming at realizing aspect-level opinion mining for Chinese reviews, the paper proposes the four major steps: pre-processing; preparing the training set to learn the model; defining learning functions for conditional random field model; and applying the model to label new review data. At the same time, our experiments on the real Chinese reviews of five types of products show that the conditional random field based method can achieve 80% in most of performance indicators of extracted different types of review opinion elements. In order to verify the effectiveness of the proposed method, a test of the significance of difference is involved. Experiments report that there is scarcely difference of performance on conditional random field based method for both Chinese reviews and English reviews. Finally, we compare the precision of aspect extraction and the accuracy of sentiment classification based on three different methods, and the result shows that CRF-based method outperforms the other two such as lexicalized hidden markov model and association rule mining.

conditional random field; aspect-level opinion mining; opinion elements

2012-09-28;

：2013-02-02

國家自然科學(xué)基金青年基金資助項目(61103136)；湖北省高等學(xué)校優(yōu)秀中青年科技創(chuàng)新團(tuán)隊計劃項目(T201206)；湖北省智能機器人重點實驗室開放基金資助項目(200906)

1007-130X(2014)02-0359-08

TP274

：A

10.3969/j.issn.1007-130X.2014.02.027

呂品(1973-),女,湖北鄂州人，博士生，副教授，研究方向為文本挖掘和情感分析。E-mail:lpwhict@163.com

通信地址：430073 湖北省武漢市武漢工程大學(xué)計算機科學(xué)與工程學(xué)院Address:School of Computer Science and Engineering,Wuhan Institute of Technology,Wuhan 430073,Hubei,P.R.China

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

基于CRF的中文評論有效性挖掘產(chǎn)品特征*

1 引言

2 相關(guān)研究背景

3 基于CRF的方面級意見挖掘方法

4 CRF模型的使用

5 實驗驗證

6 結(jié)束語