李耀鵬,徐德華
(同濟(jì)大學(xué) 經(jīng)濟(jì)與管理學(xué)院,上海 201804)
在Web2.0的時(shí)代,人們?cè)絹?lái)越多地使用電子商務(wù)和輿論共享網(wǎng)站,因此,產(chǎn)生了海量的商品在線評(píng)論。由于在線商品評(píng)論對(duì)于消費(fèi)者的購(gòu)買意愿有較為顯著的影響,部分不良商家采用垃圾評(píng)論攻擊行為,通過(guò)發(fā)表虛假評(píng)論和評(píng)分試圖誤導(dǎo)消費(fèi)者。垃圾評(píng)論的存在嚴(yán)重影響了在線評(píng)論應(yīng)有作用的發(fā)揮,所以識(shí)別垃圾評(píng)論是一個(gè)緊急且重要的問(wèn)題。目前,有許多關(guān)于垃圾評(píng)論識(shí)別的研究,按照識(shí)別對(duì)象,可分為識(shí)別垃圾評(píng)論發(fā)表者、識(shí)別垃圾評(píng)論發(fā)表者團(tuán)體和直接識(shí)別垃圾評(píng)論。本文從識(shí)別對(duì)象的角度對(duì)垃圾評(píng)論檢測(cè)的研究現(xiàn)狀進(jìn)行分析,以期能對(duì)相關(guān)工作的開(kāi)展提供借鑒。
一些研究人員通過(guò)關(guān)注垃圾評(píng)論發(fā)表者來(lái)研究如何識(shí)別垃圾評(píng)論,他們?cè)诶u(píng)論發(fā)表者方面進(jìn)行了許多研究。垃圾評(píng)論發(fā)表者的檢測(cè)是以評(píng)論者為中心的,相比于直接檢測(cè)垃圾評(píng)論,垃圾評(píng)論發(fā)表者的檢測(cè)更加簡(jiǎn)單、有效,因?yàn)橐粭l評(píng)論能獲取的信息有限,比如評(píng)論文本、評(píng)分、發(fā)表時(shí)間等,但是一個(gè)評(píng)論人則可能發(fā)表多條評(píng)論,涉及多個(gè)產(chǎn)品,除了評(píng)論本身之外,還可以對(duì)其行為模式進(jìn)行研究。
Lim等人[1]對(duì)垃圾評(píng)論發(fā)表者的行為特征進(jìn)行建模并用于檢測(cè)垃圾評(píng)論發(fā)表者。他們使用垃圾評(píng)論行為的線性加權(quán)因子組合來(lái)計(jì)算評(píng)論者的整體垃圾評(píng)論分?jǐn)?shù)。他們提出了基于打分行為的垃圾評(píng)論發(fā)表者的四種主要行為模式:針對(duì)某一個(gè)產(chǎn)品進(jìn)行評(píng)分;針對(duì)某一類產(chǎn)品進(jìn)行評(píng)分;總體偏差;早期偏差。
Jindal等人[2]發(fā)現(xiàn)了評(píng)論者的一些行為很可疑,比如一般正常的評(píng)論者所發(fā)表的評(píng)論往往包括積極的、中性的和消極的評(píng)論,但是有一部分評(píng)論者發(fā)表的評(píng)論全部是積極的或者全部是消極的。經(jīng)過(guò)試驗(yàn)發(fā)現(xiàn)這些行為特征與評(píng)論造假的關(guān)聯(lián)性很高。
Wang等人[3]提出了一種基于評(píng)論圖模型,利用評(píng)論者,評(píng)論和商鋪之間的影響來(lái)檢測(cè)垃圾評(píng)論發(fā)表者的迭代方法。該技術(shù)通過(guò)節(jié)點(diǎn)之間的相互關(guān)系計(jì)算評(píng)論者的可信度、評(píng)論的真實(shí)性以及商店的可靠性。
Fayazbakhsh等人[4]提出了一個(gè)類似的方法,也使用了一個(gè)評(píng)論圖模型。該方法再次對(duì)節(jié)點(diǎn)進(jìn)行評(píng)分,然后使用迭代算法更新分?jǐn)?shù)。這項(xiàng)研究所用的分?jǐn)?shù)構(gòu)成和初始化方法不同于Wang等人的研究。徐小婷等人[5]也采用了類似的方法,不同之處在于其采用了一種基于PageRank的評(píng)論者互評(píng)估可信度模型來(lái)檢測(cè)垃圾評(píng)論者。結(jié)果表明其模型在識(shí)別垃圾評(píng)論者方面是有效的,并且解決了僅有一條評(píng)論的評(píng)論者難以識(shí)別的問(wèn)題。
Fei等人[6]使用核密度估計(jì)技術(shù)來(lái)建立了一種檢測(cè)特定產(chǎn)品的評(píng)論中的突發(fā)模式的算法。他們使用垃圾評(píng)論發(fā)表者的五個(gè)行為特征作為垃圾評(píng)論發(fā)表者檢測(cè)的指標(biāo),然后作者使用馬爾可夫隨機(jī)場(chǎng)(MRFs)來(lái)對(duì)突發(fā)模式中的評(píng)論者進(jìn)行建模。他們的技術(shù)的精確度為83.7%,與以前的工作相比得出了更準(zhǔn)確的結(jié)果。然而,F(xiàn)ei等人使用的最有效的特征是“亞馬遜驗(yàn)證購(gòu)買比例”;在任何檢測(cè)技術(shù)中使用這個(gè)特征都會(huì)極大地優(yōu)化該方法的準(zhǔn)確性。它將用戶限制為真實(shí)的客戶,因?yàn)樗砹嗽u(píng)論者必須已經(jīng)購(gòu)買了產(chǎn)品。但這個(gè)特征不能應(yīng)用于其他數(shù)據(jù)集,不具備通用性。
某些情況下,垃圾評(píng)論活動(dòng)可被視為群體性事件,即可能存在多個(gè)垃圾評(píng)論發(fā)表者被雇傭來(lái)發(fā)表評(píng)論,以達(dá)到一定的目的的情況。手動(dòng)標(biāo)記訓(xùn)練數(shù)據(jù)以檢測(cè)垃圾評(píng)論發(fā)表者群體并不像垃圾評(píng)檢測(cè)中的其他任務(wù)那么困難,因?yàn)槌蓡T的垃圾評(píng)論行為是清晰的。來(lái)自垃圾評(píng)論發(fā)表者團(tuán)體的第一個(gè)標(biāo)記數(shù)據(jù)集是Mukherjee等人[7]創(chuàng)建的。
Mukherjee等人[8]使用頻繁模式挖掘技術(shù)來(lái)檢測(cè)垃圾評(píng)論發(fā)表者團(tuán)體,通過(guò)上述特征對(duì)每個(gè)團(tuán)體進(jìn)行“Spamicity”打分,然后提出了GRank關(guān)系模型對(duì)垃圾評(píng)論發(fā)表團(tuán)體進(jìn)行排序,將評(píng)論者團(tuán)體區(qū)分為垃圾評(píng)論或非垃圾評(píng)論團(tuán)體。
實(shí)際中,創(chuàng)建不同內(nèi)容的多個(gè)垃圾評(píng)論是很耗費(fèi)時(shí)間和精力的,垃圾評(píng)論發(fā)表者不會(huì)自己撰寫(xiě)大量?jī)?nèi)容獨(dú)特的垃圾評(píng)論,他們傾向于復(fù)制現(xiàn)有的垃圾評(píng)論的文本。因此,查找類似的評(píng)論是檢測(cè)垃圾評(píng)論的關(guān)鍵部分。Jindal等人[9]提出了第一種垃圾評(píng)論檢測(cè)技術(shù)。他們發(fā)現(xiàn),垃圾評(píng)論發(fā)表者通常會(huì)創(chuàng)建少量評(píng)論作為模板,并通過(guò)更改產(chǎn)品名稱將其復(fù)制到不同產(chǎn)品下面。因此,可以通過(guò)識(shí)別包含重復(fù)文本的評(píng)論來(lái)檢測(cè)垃圾評(píng)論。
Lai等人[10]提出了一個(gè)概率語(yǔ)言模型計(jì)算兩個(gè)評(píng)論之間的相似度分?jǐn)?shù)。該模型使用Kullback-Leibler散度比較一些評(píng)論以衡量其內(nèi)容相似度。
除了內(nèi)容重復(fù)之外,評(píng)論的概念可能會(huì)出現(xiàn)重復(fù)。Algur等人[11]提出了一種度量概念相似度的技術(shù),用于解決垃圾評(píng)論檢測(cè)問(wèn)題。該技術(shù)被用來(lái)衡量被評(píng)論的產(chǎn)品其特征的相似性。作者利用傳統(tǒng)的余弦函數(shù)來(lái)度量概念特征相似度以檢測(cè)垃圾評(píng)論,從評(píng)論中提取的產(chǎn)品特征被用來(lái)構(gòu)建評(píng)論矩陣。他們的方法的精確度是43.6%,效果不是很理想。
Ott等人[12]采用三種策略來(lái)處理垃圾評(píng)論檢測(cè)問(wèn)題:①類型識(shí)別。Rayson等人[13]在計(jì)算語(yǔ)言學(xué)中的研究表明,文本的類型影響文本中詞性(POS)的分布。②心理語(yǔ)言檢測(cè)。心理語(yǔ)言學(xué)檢測(cè)賦予文本中使用的關(guān)鍵詞以心理語(yǔ)言學(xué)意義。語(yǔ)言查詢和字?jǐn)?shù)統(tǒng)計(jì)(LIWC)軟件是著名的文本分析工具,它將80個(gè)心理語(yǔ)言學(xué)意義賦予給了4 500個(gè)關(guān)鍵詞。③文本分類。使用n-gram特征集,模擬評(píng)論的內(nèi)容和上下文。結(jié)果顯示,使用LIWC和BIGRAMS在區(qū)分虛假垃圾評(píng)論方面的準(zhǔn)確率達(dá)到了80%以上。該研究也被用來(lái)估計(jì)6個(gè)著名的在線評(píng)論社區(qū)的欺騙行為[14]。這兩項(xiàng)研究都使用從評(píng)論網(wǎng)站收集到的真實(shí)評(píng)論作為數(shù)據(jù)集。Banerjee等人[15]提出的另一種方法使用相同數(shù)據(jù)集,在文獻(xiàn)綜述的基礎(chǔ)上,作者假設(shè)欺騙性評(píng)論和真實(shí)性評(píng)論的可讀性(復(fù)雜性和閱讀難度),評(píng)論類型和評(píng)論寫(xiě)作風(fēng)格是不同的。
本文從識(shí)別垃圾評(píng)論發(fā)表者、識(shí)別垃圾評(píng)論發(fā)表者團(tuán)體和直接識(shí)別垃圾評(píng)論這三個(gè)角度對(duì)垃圾評(píng)論識(shí)別的研究進(jìn)行了綜述。該領(lǐng)域的研究已經(jīng)比較成熟,但是仍然存在識(shí)別效果難以評(píng)估的問(wèn)題,需要更多研究者投入精力。