基于Markov邏輯網(wǎng)的虛假評(píng)論識(shí)別方法

2016-05-04 02:53:49行娟娟

中文信息學(xué)報(bào) 2016年5期

關(guān)鍵詞：評(píng)論者類別邏輯

行娟娟

(西安外事學(xué)院工學(xué)院，陜西西安 710077)

基于Markov邏輯網(wǎng)的虛假評(píng)論識(shí)別方法

行娟娟

(西安外事學(xué)院工學(xué)院，陜西西安 710077)

為解決虛假評(píng)論識(shí)別的問題，該文提出一種基于Markov邏輯網(wǎng)的虛假評(píng)論識(shí)別方法。首先，對(duì)虛假評(píng)論內(nèi)容和評(píng)論者行為的特點(diǎn)進(jìn)行分析，選取評(píng)論內(nèi)容特征和評(píng)論者行為特征；然后，根據(jù)特征定義一階邏輯謂詞和邏輯公式，并介紹了權(quán)重學(xué)習(xí)和推理的過程；最后，進(jìn)行了對(duì)比實(shí)驗(yàn)，結(jié)果表明該方法的虛假評(píng)論識(shí)別取得了較好的效果。

Markov邏輯網(wǎng)；虛假評(píng)論；權(quán)重學(xué)習(xí)；自適應(yīng)聚類

1 引言

虛假評(píng)價(jià)是指商家或者個(gè)人為了自身利益，對(duì)在線商品發(fā)表的推銷、詆毀的評(píng)論。一直以來，虛假評(píng)論的泛濫嚴(yán)重制約著我國電子商務(wù)的發(fā)展。這些虛假評(píng)論在一定程度上影響了評(píng)論信息的參考價(jià)值，從而誤導(dǎo)消費(fèi)者，識(shí)別出在線商品虛假評(píng)論有非常重要的現(xiàn)實(shí)意義。近幾年，隨著電子商務(wù)的快速發(fā)展，關(guān)于在線商品虛假評(píng)論識(shí)別研究已經(jīng)開展了很多工作，主要分為兩類：基于評(píng)論內(nèi)容和基于評(píng)論者行為的虛假評(píng)論識(shí)別方法。

基于評(píng)論內(nèi)容的虛假評(píng)論識(shí)別方法主要以評(píng)論內(nèi)容為中心，需要對(duì)評(píng)論內(nèi)容進(jìn)行語義分析和情感識(shí)別。Ren等人[1]提出一種創(chuàng)新的PU學(xué)習(xí)框架來識(shí)別虛假評(píng)論，對(duì)于未標(biāo)注評(píng)論集中的間諜樣例首先使用狄利克雷過程混合模型DPMM對(duì)其進(jìn)行聚類；然后混合種群性和個(gè)體性兩種策略確定間諜樣例的類別標(biāo)簽；最后使用兩種主流多核學(xué)習(xí)算法SILP和LPSOLVE來訓(xùn)練最終的分類器，實(shí)驗(yàn)證明所提方法可以有效用于虛假評(píng)論識(shí)別。Rupesh等人[2]提出結(jié)合詞匯特征和句法特征，利用有監(jiān)督學(xué)習(xí)算法進(jìn)行虛假評(píng)論識(shí)別，如SMO、決策樹、樸素貝葉斯等，取得了很好的識(shí)別效果。Wang等人[3]根據(jù)評(píng)論內(nèi)容的特性，提出了一種基于主題—對(duì)立情感依賴模型的虛假評(píng)論檢測方法，該方法采用有監(jiān)督學(xué)習(xí)分類器SVM對(duì)虛假評(píng)論進(jìn)行檢測。Banerjee等人[4]在分析真實(shí)評(píng)論和虛假評(píng)論語言特征的基礎(chǔ)上，采用多種機(jī)器學(xué)習(xí)算法進(jìn)行虛假評(píng)論的識(shí)別，提出語言特征和標(biāo)題可以提高虛假評(píng)論識(shí)別準(zhǔn)確率。Li等人[5]創(chuàng)建了一個(gè)多領(lǐng)域的黃金數(shù)據(jù)集，包括賓館、飯店和醫(yī)生三個(gè)領(lǐng)域的評(píng)論數(shù)據(jù)，并發(fā)現(xiàn)真實(shí)評(píng)論中包括更多的名詞、形容詞和介詞，而虛假評(píng)論中動(dòng)詞、副詞和人稱代詞較多。Li等人[6]提出一種分類算法MHCC，利用評(píng)論、用戶和IP地址等信息構(gòu)建異構(gòu)網(wǎng)絡(luò)進(jìn)行虛假評(píng)論識(shí)別，并在PU學(xué)習(xí)框架中對(duì)該算法進(jìn)行擴(kuò)展，取得了更高的識(shí)別準(zhǔn)確率。Li等人[7]針對(duì)虛假評(píng)論識(shí)別任務(wù)，提出一種基于流行排序算法的三層圖模型，把虛假評(píng)論識(shí)別轉(zhuǎn)換成了排序問題進(jìn)行求解。Li等人[8]通過定義虛假主題、真實(shí)主題、領(lǐng)域主題以及背景主題，利用概率主題模型獲取一條評(píng)論的主題分布，通過比較評(píng)論在虛假主題和真實(shí)主題上的概率大小來對(duì)虛假評(píng)論進(jìn)行識(shí)別。Feng等人[9]定義并提取評(píng)論的上下文無關(guān)文法規(guī)則特征，采用SVM分類器對(duì)虛假評(píng)論進(jìn)行檢測，并在標(biāo)準(zhǔn)數(shù)據(jù)集上獲得了一定分類率的驗(yàn)證。Diao[10]等人針對(duì)Blog本身的特點(diǎn)，使用規(guī)則初步過濾垃圾評(píng)論，對(duì)剩余評(píng)論，利用LDA對(duì)博客中的博文進(jìn)行主題提取，結(jié)合主題信息進(jìn)行判斷，識(shí)別Blog空間的垃圾評(píng)論。

基于評(píng)論者行為的識(shí)別方法主要是從用戶評(píng)分行為出發(fā)，根據(jù)用戶的行為特征建立分類器的一種虛假評(píng)論檢測方法。目前，在基于評(píng)論者行為的虛假評(píng)論檢測方面，有很多研究者開展了相關(guān)工作。Mukherjee等人[11]提出利用虛假評(píng)論者可疑度作為隱性變量構(gòu)建貝葉斯識(shí)別模型，通過分析虛假評(píng)論者的各種行為特點(diǎn)，如評(píng)論集中突發(fā)性、評(píng)論極端性等，認(rèn)為虛假評(píng)論者與正常用戶具有極為不同的行為分布。Lim等人[12]從用戶評(píng)分行為出發(fā)，根據(jù)經(jīng)驗(yàn)對(duì)虛假評(píng)論者行為進(jìn)行建模，設(shè)置各種行為特征的權(quán)重，通過找到虛假評(píng)論的制造者從而達(dá)到檢測虛假評(píng)論的目的。Qiu等人[13]從卓越亞馬遜網(wǎng)站獲取1 470個(gè)評(píng)論用戶，按單指標(biāo)選取、五個(gè)指標(biāo)集成選取的方法確定最可能和最不可能成為垃圾評(píng)論者的評(píng)論用戶各25個(gè)，并對(duì)這50個(gè)評(píng)論者進(jìn)行人工標(biāo)記，根據(jù)標(biāo)記結(jié)果設(shè)計(jì)有監(jiān)督的線性回歸模型。Song等人[14]從評(píng)論者行為出發(fā)，定義評(píng)論自身基本特征以及評(píng)論之間的關(guān)聯(lián)性特征，通過利用改進(jìn)的聚類算法對(duì)評(píng)論數(shù)據(jù)進(jìn)行聚類，然后計(jì)算每個(gè)聚類簇偏離整個(gè)評(píng)論數(shù)據(jù)集的程度，根據(jù)異常簇方法來識(shí)別虛假評(píng)論，提出一種基于自適應(yīng)聚類的虛假評(píng)論檢測方法，并且實(shí)驗(yàn)驗(yàn)證取得了較好的檢測效果。

上述的虛假評(píng)論識(shí)別方法主要是基于評(píng)論內(nèi)容或者評(píng)論者行為的檢測方法，它們對(duì)虛假評(píng)論識(shí)別取得了較好的效果。Markov 邏輯網(wǎng)利用強(qiáng)大的一階邏輯來表示知識(shí)，通過為每個(gè)一階邏輯公式附加權(quán)重的方式，將一階邏輯公式融合到概率圖模型中，可以更好地解決在線商品虛假評(píng)論的識(shí)別問題。因此，本文綜合考慮了評(píng)論內(nèi)容和評(píng)論者行為特征，根據(jù) Markov 邏輯網(wǎng)設(shè)計(jì)虛假評(píng)論識(shí)別規(guī)則，提出了一種基于Markov邏輯網(wǎng)的虛假評(píng)論識(shí)別方法。

2 基于Markov邏輯網(wǎng)的虛假評(píng)論識(shí)別

2.1 Markov邏輯網(wǎng)相關(guān)理論

Markov邏輯網(wǎng)是一種將一階邏輯與概率圖模型相結(jié)合的統(tǒng)計(jì)關(guān)系學(xué)習(xí)模型，能夠很好的處理復(fù)雜性和不確定性問題[15]?；舅枷胧菍?duì)一階邏輯約束的放松，當(dāng)一個(gè)世界違反了知識(shí)庫中的一個(gè)規(guī)則，該世界發(fā)生的概率降低但不是不可能；而違反的越少則發(fā)生的概率越大。Markov邏輯網(wǎng)通過對(duì)每個(gè)公式都附加一個(gè)權(quán)值來表示該公式限制強(qiáng)度的大小，權(quán)值越大，滿足該公式與不滿足該公式的可能世界發(fā)生概率之間的差越大。

*fi(x))

(1)

其中，Z是歸一化因子，i是第i條規(guī)則的權(quán)重，如果第i條規(guī)則為真，fi= 1，反之fi= 0。Markov邏輯網(wǎng)虛假評(píng)論識(shí)別方法的流程如圖1所示。

圖1 Markov邏輯網(wǎng)虛假評(píng)論識(shí)別方法流程圖

2.2 特征選取

評(píng)論內(nèi)容和評(píng)論者行為特征是反映評(píng)論是否為虛假評(píng)論的重要特征。結(jié)合以往相關(guān)學(xué)者針對(duì)虛假評(píng)論特征的研究工作[13-14]，本文選取相對(duì)更重要的六維特征，如表1所示。

表1 評(píng)論內(nèi)容特征

(1) 特征1，即“評(píng)論內(nèi)容包含對(duì)商品的體驗(yàn)感受詞”。體驗(yàn)感受詞往往在真實(shí)評(píng)論內(nèi)容中頻繁出現(xiàn)，而在虛假評(píng)論中出現(xiàn)的可能性較小，例如，實(shí)用、劃算、一如既往的好、外觀新穎、性能不錯(cuò)、正品、便宜、耐心、態(tài)度好等等。真實(shí)評(píng)論內(nèi)容與虛假評(píng)論內(nèi)容中的詞分布往往有很大的不同，選擇評(píng)論內(nèi)容中的體驗(yàn)感受詞作為一種評(píng)論內(nèi)容特征。

(2) 特征2，即“評(píng)論內(nèi)容包含大量字母、數(shù)字”。虛假評(píng)論者有隨意輸入一些字母或者數(shù)字來湊字?jǐn)?shù)的習(xí)慣，這樣做的目的是節(jié)省評(píng)論的時(shí)間，但是這些字母和數(shù)字沒有任何意義，在真實(shí)評(píng)論內(nèi)容中很少出現(xiàn)。因此，選擇評(píng)論內(nèi)容中的大量字母、數(shù)字作為一種評(píng)論內(nèi)容特征。

(3) 特征3，即“評(píng)論內(nèi)容中第一人稱和第二人稱的比例”。消費(fèi)者在電子商務(wù)網(wǎng)站上對(duì)所購商品做出的評(píng)論中，更多的是描述本人對(duì)商品的切身體會(huì)，往往表達(dá)的是我或者我們的體驗(yàn)，而不是你或者你們應(yīng)該做什么。然而，在虛假評(píng)論中，評(píng)論者所做的評(píng)論往往跟上述所描述的情況是相反的，即表達(dá)的是你或者你們應(yīng)該做什么。把第一人稱代詞我、我們與第二人稱代詞你、你們的比例作為一維特征，以此來反映評(píng)論的虛假程度。

(4) 特征4，即“評(píng)論者單位時(shí)間內(nèi)所發(fā)表評(píng)論數(shù)”。虛假評(píng)論者在單位時(shí)間內(nèi)所發(fā)表的評(píng)論數(shù)往往非常多，因此可以將評(píng)論者單位時(shí)間內(nèi)發(fā)表的評(píng)論數(shù)作為一維特征，如果評(píng)論者在單位時(shí)間內(nèi)發(fā)表的評(píng)論數(shù)過多的話，就表明該評(píng)論者是虛假評(píng)論者，其發(fā)表的評(píng)論也是虛假評(píng)論。

(5) 特征5，即“評(píng)論者發(fā)表評(píng)論次數(shù)和評(píng)論對(duì)象類別數(shù)量比例”。虛假評(píng)論者大多都是針對(duì)某一個(gè)產(chǎn)品或者某一類產(chǎn)品發(fā)表虛假評(píng)論，他們發(fā)表評(píng)論次數(shù)和評(píng)論對(duì)象類別數(shù)量相差非常大，而正常的真實(shí)評(píng)論者不會(huì)存在這種現(xiàn)象。因此可以將評(píng)論者發(fā)表評(píng)論次數(shù)和評(píng)論對(duì)象類別數(shù)量比例作為一維特征，如果評(píng)論者在評(píng)論者發(fā)表評(píng)論次數(shù)和評(píng)論對(duì)象類別數(shù)量比例相差很大，就表明該評(píng)論者是虛假評(píng)論者，其發(fā)表的評(píng)論也是虛假評(píng)論。

(6) 特征6，即“評(píng)論者評(píng)論該產(chǎn)品次數(shù)與購買該產(chǎn)品次數(shù)比例”。被雇傭的虛假評(píng)論者往往沒有體驗(yàn)過自己評(píng)論的產(chǎn)品，也即從沒購買過該產(chǎn)品，因此沒購買產(chǎn)品而發(fā)表評(píng)論的評(píng)論者很可能是虛假評(píng)論者，或者評(píng)論者購買過一次產(chǎn)品，而發(fā)表多條評(píng)論的話，這樣也可以認(rèn)為該評(píng)論者是虛假評(píng)論者，這條評(píng)論也很可能是虛假的。

2.3 謂詞定義

針對(duì)上一小節(jié)選取的特征，定義了下面七個(gè)一階邏輯謂詞。

(1) Topic (topic，review)：表示評(píng)論review屬于虛假評(píng)論或者真實(shí)評(píng)論。

(2) HasWord (word，review)：表示評(píng)論review中包含了體驗(yàn)感受詞word。

(3) HasManyLetterFigure (num，review)：表示評(píng)論review中包含num個(gè)字母或者數(shù)字。當(dāng)且僅當(dāng)評(píng)論review包含的字母或者數(shù)字?jǐn)?shù)量達(dá)到評(píng)論內(nèi)容字符數(shù)量一半時(shí)，為虛假評(píng)論。

(4) HasFirstAndSecond(flag，review)：表示評(píng)論review包含的第一人稱代詞和第二人稱代詞的比例。當(dāng)且僅當(dāng)?shù)诙朔Q代詞的比例不小于第一人稱代詞的比例時(shí)，為虛假評(píng)論。

(5) ReviewNumber(num，reviewer)：表示評(píng)論者reviewer單位時(shí)間內(nèi)所發(fā)表num個(gè)評(píng)論。當(dāng)且僅當(dāng)評(píng)論者每小時(shí)發(fā)表評(píng)論數(shù)大于10條時(shí)，為虛假評(píng)論。

(6) HasReviewAndCategory(flag，reviewer)：表示評(píng)論者reviewer發(fā)表評(píng)論次數(shù)和評(píng)論對(duì)象類別數(shù)量比例。當(dāng)且僅當(dāng)發(fā)表評(píng)論次數(shù)是評(píng)論對(duì)象類別數(shù)量的三倍及以上時(shí)，為虛假評(píng)論。

(7) HasReviewAndPurchase(flag，reviewer)：表示評(píng)論者reviewer評(píng)論產(chǎn)品次數(shù)與購買產(chǎn)品次數(shù)比例。當(dāng)且僅當(dāng)發(fā)表評(píng)論次數(shù)是購買該產(chǎn)品次數(shù)的兩倍及以上時(shí)，為虛假評(píng)論。

2.4 一階邏輯公式

根據(jù)虛假評(píng)論內(nèi)容和評(píng)論者行為特點(diǎn)，綜合考慮虛假評(píng)論內(nèi)容和評(píng)論者行為特征，定義了以下六個(gè)一階邏輯公式。

式(2)為：

HasWord(+word,review)?Topic(+topic,review)

(2)

該式表示的是體驗(yàn)感受詞特征，如果評(píng)論review包含了詞word，那么評(píng)論review就屬于類別topic，“+”符號(hào)表示針對(duì)不同的詞形成的閉謂詞學(xué)習(xí)不同的權(quán)重。

式(3)為：

HasManyLetterFigure(num,review)?
Topic(topic,review)

(3)

該式表示的是大量字母、數(shù)字特征，如果評(píng)論review中包含了num個(gè)字母或者數(shù)字，那么評(píng)論review就屬于類別topic，即虛假評(píng)論或者真實(shí)評(píng)論。

式(4)為：

HasFirstAndSecond(flag,review)?
Topic(topic,review)

(4)

該式表示的是第一人稱和第二人稱比例特征，是根據(jù)評(píng)論review中第一人稱和第二人稱比例情況，評(píng)論review屬于對(duì)應(yīng)的類別topic。

式(5)為：

ReviewNumber(num,reviewer)?
Topic(topic,review)

(5)

該式表示的是評(píng)論者單位時(shí)間內(nèi)發(fā)表評(píng)論數(shù)特征，如果評(píng)論者reviewer單位時(shí)間內(nèi)所發(fā)表num個(gè)評(píng)論，那么評(píng)論review屬于對(duì)應(yīng)的類別topic。

式(6)為：

HasReviewAndCategory(flag,reviewer)?
Topic(topic,review)

(6)

該式表示的是評(píng)論者發(fā)表評(píng)論次數(shù)和評(píng)論對(duì)象類別數(shù)量比例特征，是根據(jù)評(píng)論者reviewer發(fā)表評(píng)論次數(shù)和評(píng)論對(duì)象類別數(shù)量的比例情況，評(píng)論review屬于對(duì)應(yīng)的類別topic。

式(7)為：

HasReviewAndPurchase(flag,reviewer)?
Topic(topic,review)

(7)

該式表示的是評(píng)論者評(píng)論產(chǎn)品次數(shù)與購買產(chǎn)品次數(shù)比例特征，根據(jù)評(píng)論者reviewer評(píng)論產(chǎn)品次數(shù)與購買產(chǎn)品次數(shù)的比例情況，評(píng)論review屬于對(duì)應(yīng)的類別topic。

2.5 權(quán)重學(xué)習(xí)

Markov邏輯網(wǎng)的參數(shù)學(xué)習(xí)就是指在Markov邏輯網(wǎng)結(jié)構(gòu)確定的前提下，進(jìn)一步學(xué)習(xí)和優(yōu)化模型的參數(shù)。具體來說，就是對(duì)每個(gè)一階邏輯公式學(xué)習(xí)最優(yōu)的權(quán)重ωi。本文利用判別式權(quán)重學(xué)習(xí)算法[16]來得到權(quán)重。在已知哪些謂詞是查詢謂詞，哪些謂詞是證據(jù)謂詞的前提下，可以自然的將數(shù)據(jù)庫分為兩個(gè)集合：證據(jù)謂詞集合X和查詢謂詞集合Y，通過對(duì)條件概率式(8))，

(8)

求最大似然來學(xué)習(xí)權(quán)重ωi，其中，F(xiàn)Y是一個(gè)包含閉查詢謂詞的公式集合。fi(x,y)是數(shù)據(jù)庫中第i個(gè)公式的閉公式的真值個(gè)數(shù)，對(duì)式(8)的對(duì)數(shù)似然函數(shù)求偏導(dǎo)，可得式(9)。

(9)

式(9)中，精確的求Eω[fi(x,y)]的時(shí)間復(fù)雜度非常巨大，因此使用近似求解方法求解，使用馬爾科夫鏈蒙特卡洛方法進(jìn)行求解。

2.6 推理

Markov邏輯網(wǎng)推理的基本問題包括最大可能性推理，計(jì)算邊緣概率和條件概率。本文只需要計(jì)算最大可能解釋，因此只涉及最大可能性推理，下面簡要介紹Markov邏輯網(wǎng)中最大可能性推理的方法。最大可能性推理的基本過程可以表述為：給定證據(jù)變量集x，求變量集合y最可能處于的狀態(tài)，即求式(10)。

(10)

在Markov邏輯網(wǎng)中，根據(jù)Markov邏輯網(wǎng)的聯(lián)合概率公式，式(10)可以轉(zhuǎn)化為式(11)。

(11)

其中，wi表示從句i的權(quán)重，fi(x,y)表示從句i的閉從句的真值數(shù)量。

因此，推理問題就轉(zhuǎn)化為計(jì)算可滿足從句帶權(quán)重最大化的問題，即尋找一組變量的賦值使所有被滿足的公式的權(quán)重之和最大。通常，可采用任何帶權(quán)的可滿足性問題解決器來處理這類問題，其效率并不比任何類型的標(biāo)準(zhǔn)邏輯推理方法低。事實(shí)上，如果Markov邏輯網(wǎng)體系中某些硬性的規(guī)則能夠適當(dāng)放松，則推理效率可能會(huì)更快?？梢允褂肕axWalkSAT算法[15]進(jìn)行求解，測試結(jié)果表明，MaxWalkSAT算法可以在幾分鐘內(nèi)處理包含上千個(gè)變量的可滿足性問題。MaxWalkSAT算法的大致流程為：首先對(duì)所有變量隨機(jī)賦值，然后在所有未滿足的從句中隨機(jī)選取一個(gè)從句，改變從句中一個(gè)變量x的值。對(duì)于x的選取，有兩種情況：根據(jù)一定的概率隨機(jī)選取，或選取這樣一個(gè)變量，當(dāng)該變量的值改變時(shí)，所有已滿足的從句的權(quán)重之和將達(dá)到最大。變量x的選取體現(xiàn)了“隨機(jī)”與“貪心”相結(jié)合的思想，避免了在局部尋優(yōu)搜索中被卡住而導(dǎo)致算法不能正常收斂。

但是MaxWalkSAT需要將所有的公式和謂詞都轉(zhuǎn)化為閉公式和閉原子以后再進(jìn)行求解，內(nèi)存占用量過大，而在實(shí)際應(yīng)用中，從句的數(shù)量非常大。LazySAT算法[17]采用一種“需要時(shí)再激活”的“惰性”思想，從而很好地解決了該問題。LazySAT算法針對(duì)一階邏輯知識(shí)庫中稀疏性的特點(diǎn)，即大多數(shù)閉原子的取值都為假，從而隱性地決定了大多數(shù)閉從句的取值都為真。LazySAT只將需要的原子和公式轉(zhuǎn)化為閉原子和閉公式，可以很好的提高推理速度和節(jié)約內(nèi)存。LazySAT算法以加權(quán)的一階邏輯知識(shí)庫為輸入，使用兩個(gè)隊(duì)列active_atoms和active_clauses來分別保存激活的原子和從句。這兩個(gè)隊(duì)列使得LazySAT算法比MaxWalkSAT算法更有效地利用內(nèi)存，大大降低了算法的空間復(fù)雜度，同時(shí)也在一定程度上降低了算法的時(shí)間復(fù)雜度。

3 實(shí)驗(yàn)與分析

3.1 語料說明

中文領(lǐng)域沒有標(biāo)準(zhǔn)的虛假評(píng)論語料，本文抓取了2014年京東商城在服裝、手機(jī)數(shù)碼、食品、圖書和化妝品五類商品中的評(píng)論數(shù)據(jù)，這些評(píng)論數(shù)據(jù)具有普遍性和概括性，能夠使實(shí)驗(yàn)結(jié)果的準(zhǔn)確性更高。對(duì)獲取到的語料進(jìn)行了人工標(biāo)注，把評(píng)論數(shù)據(jù)標(biāo)記為虛假評(píng)論、真實(shí)評(píng)論以及不確定這三個(gè)類別。評(píng)論類別的標(biāo)注標(biāo)準(zhǔn)參照“30 Ways You Can Spot Fake Online Reviews”，該標(biāo)準(zhǔn)介紹了30種識(shí)別虛假評(píng)論的方式。每條評(píng)論數(shù)據(jù)由三個(gè)標(biāo)注者獨(dú)立進(jìn)行標(biāo)注，最終評(píng)論的類別依據(jù)多數(shù)原則來判斷，例如，某條評(píng)論至少兩個(gè)標(biāo)注者將其標(biāo)注為虛假評(píng)論，該條評(píng)論才是虛假評(píng)論。根據(jù)Kappa標(biāo)準(zhǔn)檢查標(biāo)注者的一致性，三個(gè)標(biāo)注者間的Kappa值均大于0.6，則認(rèn)為這三個(gè)標(biāo)注者得到的虛假評(píng)論結(jié)果一致性正常，標(biāo)注數(shù)據(jù)可用。最后把這些標(biāo)注語料數(shù)據(jù)集分成了兩類，一類作為訓(xùn)練集；另一部分作為測試集。本文使用判別式權(quán)重學(xué)習(xí)算法[15]在訓(xùn)練語料集上進(jìn)行權(quán)重學(xué)習(xí)和優(yōu)化，在測試語料集上進(jìn)行識(shí)別性能測試，實(shí)驗(yàn)數(shù)據(jù)集如表2所示。

表2 實(shí)驗(yàn)數(shù)據(jù)集信息

3.2 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析

為了能夠更好地驗(yàn)證所提方法的有效性，設(shè)計(jì)了三個(gè)對(duì)比試驗(yàn)： (1)不同特征下虛假評(píng)論識(shí)別效果； (2)不同分類模型的識(shí)別效果； (3)不同方法的識(shí)別效果。

實(shí)驗(yàn)一不同特征下虛假評(píng)論識(shí)別效果為驗(yàn)證融合評(píng)論內(nèi)容特征和評(píng)論者行為特征的虛假評(píng)論識(shí)別效果，在使用本文所提算法的基礎(chǔ)上，分別融合三類特征對(duì)虛假評(píng)論進(jìn)行識(shí)別： (1)融合評(píng)論內(nèi)容特征，即表1中的前三類特征，該方法記為M1； (2)融合評(píng)論者行為特征，即表1中的后三類特征，該方法記為M2； (3)融合評(píng)論內(nèi)容特征和評(píng)論者行為特征，即表1中的全部特征，該方法記為M3。實(shí)驗(yàn)中采用的評(píng)價(jià)指標(biāo)為準(zhǔn)確率P、召回率R和F值。在數(shù)據(jù)集相同的情況下，實(shí)驗(yàn)結(jié)果如表3所示。

表3 不同特征下虛假評(píng)論識(shí)別結(jié)果

續(xù)表

從表3可見，M1方法得到的平均準(zhǔn)確率、召回率和F值分別為65.40%、62.91%和64.11%；M2方法得到的平均準(zhǔn)確率、召回率和F值分別為63.16%、60.56%和74.60%；M3方法得到的平均準(zhǔn)確率、召回率和F值分別為74.60%、72.52%和73.54%。與M1、M2相比，M3方法對(duì)虛假評(píng)論識(shí)別的F值有了十個(gè)百分點(diǎn)左右的提高，證明了融合評(píng)論內(nèi)容特征和評(píng)論者行為特征提高了虛假評(píng)論的識(shí)別效果。

實(shí)驗(yàn)二不同分類模型的虛假評(píng)論識(shí)別效果為驗(yàn)證Markov邏輯網(wǎng)比其他有監(jiān)督分類模型在虛假評(píng)論識(shí)別上有更好的預(yù)測性能，在融合相同特征(表1)的條件下，本文與一些常見的監(jiān)督學(xué)習(xí)模型進(jìn)行了對(duì)比實(shí)驗(yàn)，如最大熵(ME)和支持向量機(jī)(SVM)。實(shí)驗(yàn)采用的評(píng)價(jià)指標(biāo)為準(zhǔn)確率P、召回率R和F值，在數(shù)據(jù)集大小相同的情況下，實(shí)驗(yàn)結(jié)果如圖2所示。

圖2 不同分類模型的虛假評(píng)論識(shí)別結(jié)果

圖2中在虛假評(píng)論識(shí)別上，在融合相同特征下，最大熵和支持向量機(jī)模型虛假評(píng)論識(shí)別的準(zhǔn)確率、召回率和F值分別是73.08%、71.99%、72.53%和73.28%、72.21%、72.74%，而Markov邏輯網(wǎng)的識(shí)別準(zhǔn)確率、召回率和F值達(dá)到了74.60%、72.52%、73.54%。與前面兩個(gè)有監(jiān)督分類模型相比，識(shí)別準(zhǔn)確率、召回率和F值都有一定的提高。因此，在虛假評(píng)論識(shí)別上，Markov邏輯網(wǎng)比其他有監(jiān)督分類模型具有更好的預(yù)測性能。

實(shí)驗(yàn)三不同方法的虛假評(píng)論識(shí)別效果為驗(yàn)證所提方法的有效性，本文與一些權(quán)威期刊和國際頂級(jí)會(huì)議論文提出的方法進(jìn)行了對(duì)比，把Ren等人[1]提出的基于PU學(xué)習(xí)框架的方法記為M1，把Li等人[8]提出的基于概率主題模型的方法[8]記為M2，把文獻(xiàn)[6]中提出的基于異構(gòu)網(wǎng)絡(luò)的方法[6]記為M3，把本文所提的基于Markov邏輯網(wǎng)的方法記為M4。實(shí)驗(yàn)采用的評(píng)價(jià)指標(biāo)為準(zhǔn)確率P、召回率R和F值，在相同數(shù)據(jù)集情況下，實(shí)驗(yàn)結(jié)果如圖3所示。

圖3 不同方法的虛假評(píng)論識(shí)別結(jié)果

圖3中與前三種方法相比，本文提出的基于Markov邏輯網(wǎng)的虛假評(píng)論識(shí)別方法各項(xiàng)指標(biāo)都有所提升，具有更好的虛假評(píng)論識(shí)別性能。主要原因包括兩個(gè)方面，第一本文使用了Markov 邏輯網(wǎng)，利用強(qiáng)大的一階邏輯更好地表示虛假評(píng)論的特征知識(shí)，通過為一階邏輯公式附加權(quán)重的方式，將公式融到概率圖模型中進(jìn)行虛假評(píng)論的識(shí)別推理，預(yù)測能力更強(qiáng)；第二在特征選擇上，本文綜合考慮了評(píng)論內(nèi)容和評(píng)論者行為特點(diǎn)進(jìn)行虛假評(píng)論識(shí)別，因此得到更好的識(shí)別效果。

4 結(jié)束語

針對(duì)虛假評(píng)論內(nèi)容和評(píng)論者行為特點(diǎn)以及Markov邏輯網(wǎng)絡(luò)對(duì)規(guī)則復(fù)雜性表達(dá)和不確定性推理的優(yōu)勢，本文提出一種基于Markov邏輯網(wǎng)的虛假評(píng)論識(shí)別方法，利用 Markov 邏輯網(wǎng)設(shè)計(jì)虛假評(píng)論識(shí)別規(guī)則，進(jìn)行虛假評(píng)論識(shí)別。使用京東商城的商品評(píng)論數(shù)據(jù)集進(jìn)行了對(duì)比實(shí)驗(yàn)，驗(yàn)證了提出方法的有效性。但是，隨著規(guī)則復(fù)雜度的提高，形成的 Markov網(wǎng)非常龐大，使得參數(shù)學(xué)習(xí)和推理過程需要巨大的時(shí)間和空間代價(jià)，識(shí)別算法的速度會(huì)明顯降低，目前只能進(jìn)行離線識(shí)別。下一步工作是將該算法進(jìn)行分布式架構(gòu)設(shè)計(jì)，減少虛假評(píng)論識(shí)別時(shí)間，滿足或者近似滿足在線工作的需求。

[1] 任亞峰, 姬東鴻, 張紅斌,等. 基于PU學(xué)習(xí)算法的虛假評(píng)論識(shí)別研究[J]. 計(jì)算機(jī)研究與發(fā)展,2015,52(3): 639-648.

[2] Rupesh K D, A K Singh. Identification of Fake Reviews Using New Set of Lexical and Syntactic Features[C]//Proceedings of the Sixth International Conference on Computer and Communication Technology 2015, 2015: 115-119.

[3] 汪建成, 嚴(yán)馨, 余正濤, 等. 基于主題-對(duì)立情感依賴模型的虛假評(píng)論檢測方法[J]. 山西大學(xué)學(xué)報(bào)(自然科學(xué)版), 2015, 38(1): 31-38.

[4] S Banerjee, A Y Chua, J J Kim. Using supervised learning to classify authentic and fake online reviews[C]//Proceedings of the 9th International Conference on Ubiquitous Information Management and Communication, ACM, 2015: 88-94.

[5] J Li, M Ott, C Cardie, et al. Towards a general rule for identifying deceptive opinion spam[C]//Proceedings of the 52th Annual Meeting of the Association for Computational Linguistics, ACL 2014, Baltimore, Maryland, USA, 2014: 1566-1576.

[6] H Li, Z Chen, B Liu, et.al. Spotting fake reviews via collective positive-unlabeled learning[C]//Proceedings of the 2014 IEEE International Conference on Data Mining, ICDM 2014, Shenzhen, China, 2014: 899-904.

[7] J Li, M Ott, C Cardie. Identifying manipulated offerings on review portals[C]//Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing, EMNLP 2013： 1933-1942.

[8] J Li, C Cardie, S Li. TopicSpam: a Topic-Model-Based Approach for Spam Detection[C]//Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics, ACL 2013： 217-221.

[9] S Feng, R Banerjee, Y Choi. Syntactic Stylometry for Deception Detection[C]//Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics, ACL 2012： 171-175.

[10] 刁宇峰, 楊亮, 林鴻飛. 基于LDA模型的博客垃圾評(píng)論發(fā)現(xiàn)[J]. 中文信息學(xué)報(bào), 2011, 25(1): 41-47.

[11] A Mukherjee, A Kumar, B Liu, et.al. Spotting opinion spammers using behavioral footprints[C]//Proceedings of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, KDD 2013: 632-640.

[12] Lim E P, Nguyen V A, Jindal N, et.al. Detecting Product Review Spammers Using Rating Behaviors[C]//Proceedings of the 19th ACM International Conference on Information and Knowledge Management, CIKM 2010: 939-948.

[13] 邱云飛, 王建坤, 邵良杉, 等.基于用戶行為的產(chǎn)品垃圾評(píng)論者檢測研究[J].計(jì)算機(jī)工程,2012,38(11): 254-257.

[14] 宋海霞, 嚴(yán)馨, 余正濤, 等. 基于自適應(yīng)聚類的虛假評(píng)論檢測[J]. 南京大學(xué)學(xué)報(bào)(自然科學(xué)), 2013, 49(4): 433-438.

[15] Richardson M, Domingos P. Markov logic networks[J]. Machine Learning, 2006, 62(1-2): 107-136.

[16] Parag Singla, Pedro Domingos. Discriminative training of markov logic networks[C]//Proceedings of the 20th National Conference on Articial Intelligence, Pittsburgh, Pennsylvania, 2005: 868-873.

[17] Singla P, Domingos P. Memory-Efficient inference in relational domains[C]//Proceedings of the 21st National Conference on Artificial Intelligence, Boston, Massachusetts, 2006: 488-493.

Fake Reviews Identification Based on Markov Logic Networks

XING Juanjuan

(Engineering College, Xi’an International University, Xi’an，Shanxi 710077, China)

In order to identify fake reviews, we propose a method of fake reviews identification based on Markov Logic Networks. Firstly, the characteristics of fake review content and reviewer behavior are analyzed,and the review content features and the reviewer behavior features are selected. Secondly, the predicates and the formulas are defined with the features,and the weight The experimental results and the inference are decriked. show that the proposed method has a good performance.

Markov logic networks; fake review; weight learning; adaptive clustering

行娟娟(1963—)，碩士研究生，高級(jí)工程師，主要研究領(lǐng)域?yàn)殡娏﹄娮蛹爸悄芸刂?。E?mail：xjj＿1963@sina．com

1003-0077(2016)05-094-07

2015-03-01 定稿日期： 2016-02-03

國家自然科學(xué)基金(61103242)

TP301