楊曉暉 王衛(wèi)賓
摘 要:針對(duì)基于圖神經(jīng)網(wǎng)絡(luò)的謠言檢測(cè)方法在聚合鄰居節(jié)點(diǎn)信息生成謠言表示過(guò)程中存在的噪聲干擾問(wèn)題,充分利用社交媒體源帖包含的豐富語(yǔ)義和結(jié)構(gòu)信息對(duì)謠言檢測(cè)的重要影響,提出一種基于門控圖神經(jīng)網(wǎng)絡(luò)的謠言檢測(cè)模型,該模型根據(jù)信息傳播過(guò)程建模謠言的傳播圖和擴(kuò)散圖,基于門控圖神經(jīng)網(wǎng)絡(luò)聚合鄰居信息生成節(jié)點(diǎn)表示,利用門控機(jī)制去除鄰居節(jié)點(diǎn)噪聲,同時(shí)引入根節(jié)點(diǎn)語(yǔ)義增強(qiáng)方法提升表征節(jié)點(diǎn)的能力。此外,利用注意力機(jī)制融合局部結(jié)構(gòu)和全局結(jié)構(gòu)信息學(xué)習(xí)更加全面的謠言表示用于謠言檢測(cè)任務(wù)。在公開(kāi)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果證明,提出的模型在謠言檢測(cè)性能和早期檢測(cè)能力方面均優(yōu)于基線方法。
關(guān)鍵詞:社交媒體;謠言檢測(cè);圖神經(jīng)網(wǎng)絡(luò);注意力機(jī)制
中圖分類號(hào): TP391? 文獻(xiàn)標(biāo)識(shí)碼: A? DOI:10.3969/j.issn.1007-791X.2023.01.008
0 引言
隨著移動(dòng)互聯(lián)網(wǎng)的迅猛發(fā)展,社交媒體已成為人們獲取和傳播信息的主要途徑。然而,由于媒體缺乏對(duì)信息有效的監(jiān)控手段,謠言能夠迅速滋生并廣泛傳播,對(duì)網(wǎng)絡(luò)秩序和社會(huì)穩(wěn)定產(chǎn)生了不利影響[1]。例如,2022年俄羅斯與烏克蘭爆發(fā)沖突以來(lái),社交媒體上不斷出現(xiàn)未經(jīng)證實(shí)或故意偽造的消息,對(duì)人們準(zhǔn)確了解沖突局勢(shì)產(chǎn)生了嚴(yán)重干擾,甚至造成社會(huì)恐慌。由于社交媒體用戶數(shù)量極大,謠言在社交媒體上迅速傳播,已經(jīng)開(kāi)始從各個(gè)方面影響人們的日常生活。因此,開(kāi)展謠言檢測(cè)任務(wù)對(duì)維護(hù)網(wǎng)絡(luò)安全和保障社會(huì)穩(wěn)定發(fā)展具有重大的現(xiàn)實(shí)意義[2]。
早期謠言檢測(cè)方法主要采用人工提取特征,利用傳統(tǒng)的機(jī)器學(xué)習(xí)分類方法識(shí)別謠言信息。此類方法依賴繁重的特征工程工作,難以獲得復(fù)雜、抽象的特征表示,造成方法的魯棒性較差。由于社交媒體信息經(jīng)過(guò)評(píng)論或轉(zhuǎn)發(fā)過(guò)程形成具有豐富的傳播結(jié)構(gòu)信息,目前的方法通過(guò)構(gòu)建傳播序列或傳播樹(shù),利用深度學(xué)習(xí)獲得傳播結(jié)構(gòu)特征進(jìn)行
謠言檢測(cè),在一定程度上提高了表征謠言的能力。但這些方法仍只考慮了謠言信息傳播的序列特征,不能充分體現(xiàn)出其內(nèi)部結(jié)構(gòu)信息,因此存在一些限制。最近的一些研究使用圖神經(jīng)網(wǎng)絡(luò)來(lái)解決謠言檢測(cè)問(wèn)題,由于圖神經(jīng)網(wǎng)絡(luò)對(duì)圖結(jié)構(gòu)數(shù)據(jù)強(qiáng)大的表示能力,取得了良好的識(shí)別效果。盡管如此,現(xiàn)有的基于圖神經(jīng)網(wǎng)絡(luò)的謠言檢測(cè)方法在聚合鄰居信息學(xué)習(xí)節(jié)點(diǎn)表示時(shí)忽略了噪聲問(wèn)題的干擾,限制了謠言檢測(cè)的性能。此外,社交媒體中的源帖包含豐富的語(yǔ)義和結(jié)構(gòu)信息,在信息傳播過(guò)程中將會(huì)產(chǎn)生廣泛的影響力,對(duì)謠言檢測(cè)具有重要作用。
針對(duì)現(xiàn)有謠言檢測(cè)方法存在的不足,本文提出一種基于門控圖神經(jīng)網(wǎng)絡(luò)的謠言檢測(cè)模型。首先建模社交媒體中的帖子雙向傳播結(jié)構(gòu),利用門控機(jī)制去除鄰居節(jié)點(diǎn)噪聲并聚合得到目標(biāo)節(jié)點(diǎn)的表示;接著引入根節(jié)點(diǎn)語(yǔ)義增強(qiáng)方法獲得可靠的表征節(jié)點(diǎn)的能力。同時(shí),融合謠言的局部結(jié)構(gòu)和全局結(jié)構(gòu)信息以獲得全面的謠言表示,提升謠言檢測(cè)的性能。
1 相關(guān)工作
隨著謠言檢測(cè)研究的深入,目前提出的謠言檢測(cè)方法可概括為基于機(jī)器學(xué)習(xí)的謠言檢測(cè)方法與基于深度學(xué)習(xí)的謠言檢測(cè)方法。
1.1 基于機(jī)器學(xué)習(xí)的謠言檢測(cè)方法
基于機(jī)器學(xué)習(xí)的謠言檢測(cè)方法,利用人工構(gòu)造和提取顯著特征進(jìn)行謠言檢測(cè)。CASTILLO等人[3]通過(guò)對(duì)熱門話題相關(guān)的帖子進(jìn)行分析,人工提取用戶信息、文本內(nèi)容以及引用的外部源等特征對(duì)帖子進(jìn)行可信度評(píng)估,利用決策樹(shù)模型完成謠言的識(shí)別任務(wù)。YANG等人[4]通過(guò)提取微博內(nèi)容、用戶、主題、傳播統(tǒng)計(jì)、位置和客戶端等特征,采用支持向量機(jī)(Support Vector Machine, SVM)分類器對(duì)微博信息進(jìn)行謠言檢測(cè)。GUO等人[5]深入分析了基于謠言用戶賬戶的特征,提出用戶可信度,可靠性和名譽(yù)等隱含特征,通過(guò)實(shí)驗(yàn)證明了該特征的有效性。這些方法只是考慮單一信息的特征分析,忽略了信息傳播過(guò)程之間的差異,而基于事件級(jí)特征可以根據(jù)其傳播結(jié)構(gòu)反映出謠言信息的特點(diǎn)。GUPTA等人[6]提取用戶、消息、事件之間的層次關(guān)系特征,提出基于事件圖優(yōu)化的方法進(jìn)行可信度分析識(shí)別謠言事件。WU等人[7]基于隨機(jī)游走圖核和RBF核結(jié)合的方法,提出了一種基于混合核SVM模型進(jìn)行謠言檢測(cè)。MA等人[8]利用傳播結(jié)構(gòu)建立樹(shù)核模型,通過(guò)計(jì)算傳播樹(shù)子樹(shù)結(jié)構(gòu)相似度來(lái)識(shí)別謠言的傳播特性,以提升謠言的檢測(cè)性能。徐建民等人[9]提取微博用戶的影響力、情感信息特征嵌入到傳播樹(shù)的節(jié)點(diǎn)中,提升了基于傳播樹(shù)核的謠言檢測(cè)方法性能。然而,基于機(jī)器學(xué)習(xí)的謠言檢測(cè)方法需要一定的專家知識(shí),依靠人工選擇特征,缺乏高階的特征表示,造成檢測(cè)模型的魯棒性較差,無(wú)法應(yīng)對(duì)復(fù)雜多變的現(xiàn)實(shí)環(huán)境。
1.2 基于深度學(xué)習(xí)的謠言檢測(cè)方法
深度學(xué)習(xí)飛速發(fā)展,其強(qiáng)大的特征學(xué)習(xí)能力和對(duì)數(shù)據(jù)良好的代表性,在多個(gè)領(lǐng)域中都取得不錯(cuò)的效果。研究者開(kāi)始探索在謠言檢測(cè)問(wèn)題中使用深度學(xué)習(xí)的方法。MA等人[10]對(duì)謠言事件中的文本數(shù)據(jù)進(jìn)行時(shí)間序列排序,利用循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)學(xué)習(xí)謠言信息的序列特征。CHEN等人[11]利用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)來(lái)提取分散在輸入序列中的關(guān)鍵特征,有助于模型有效地識(shí)別謠言,尤其是在早期階段的謠言檢測(cè)中。MA等人[12]對(duì)謠言的消息傳播結(jié)構(gòu)建模為樹(shù)結(jié)構(gòu),利用遞歸神經(jīng)網(wǎng)絡(luò)捕獲節(jié)點(diǎn)的隱藏表示。然而,這些方法只考慮了謠言傳播過(guò)程中的序列特征,不能反應(yīng)出傳播的內(nèi)部結(jié)構(gòu)信息。圖神經(jīng)網(wǎng)絡(luò)(Graph Neural Network, GNN)由于其強(qiáng)大的表示能力[13-14],為謠言檢測(cè)任務(wù)提出了新的解決思路。BIAN等人[15]提出了一種用于謠言檢測(cè)的Bi-GCN模型,通過(guò)雙向圖卷積網(wǎng)絡(luò)學(xué)習(xí)消息轉(zhuǎn)發(fā)的結(jié)構(gòu)特征,取得了良好的效果。胡斗等人[16]建模社交媒體帖子之間多種交互關(guān)系,并提出一種多關(guān)系傳播結(jié)構(gòu)的檢測(cè)方法,捕捉更多傳播結(jié)構(gòu)特征以提升謠言檢測(cè)性能。盡管如此,圖神經(jīng)網(wǎng)絡(luò)在聚合鄰居節(jié)點(diǎn)信息時(shí)可能會(huì)產(chǎn)生噪聲,無(wú)法獲得充分的節(jié)點(diǎn)表示。
基于此,本文探究謠言自頂向下的信息傳播結(jié)構(gòu)和自底向上的信息擴(kuò)散結(jié)構(gòu),提出基于門控圖神經(jīng)網(wǎng)絡(luò)的謠言檢測(cè)方法,將節(jié)點(diǎn)特征表示和聚合后的鄰居特征表示利用門控機(jī)制進(jìn)行特征選擇,減少鄰居的噪聲影響。此外,考慮到社交媒體中的源帖包含最原始的語(yǔ)義信息,同時(shí)也包含著重要的局部結(jié)構(gòu)信息,提出根節(jié)點(diǎn)語(yǔ)義增強(qiáng)方法獲得可靠的節(jié)點(diǎn)表示,融合謠言的局部結(jié)構(gòu)和全局結(jié)構(gòu)信息實(shí)現(xiàn)謠言檢測(cè)任務(wù)。
2 問(wèn)題定義
形式化地,定義C={c1,c2,…,cm}表示謠言數(shù)據(jù)集,其中,ci是第i個(gè)事件,m表示數(shù)據(jù)集中事件對(duì)應(yīng)的總數(shù)量。對(duì)于每個(gè)社交媒體事件ci記為ci={ri,wi1,wi2,…,wini-1,Gi},其中ri表示事件ci的源帖,wij表示第j個(gè)轉(zhuǎn)發(fā)或評(píng)論關(guān)系的帖子,ni表示事件ci包含的帖子數(shù)量,Gi表示事件ci的傳播結(jié)構(gòu)。本文將Gi定義為傳播圖Gi=(Vi,Ei),其中,節(jié)點(diǎn)集合表示為Vi={ri,wi1,wi2,…,wini-1},ri表示圖Gi根節(jié)點(diǎn),Ei={eist|s,t=0,…,ni-1}表示轉(zhuǎn)發(fā)或評(píng)論的邊集合。如圖1(a)所示,如果wi1是ri的一個(gè)轉(zhuǎn)發(fā)帖子,那么存在一條有向邊e01。定義鄰接矩陣Ai∈{0,1}ni×ni表示圖中的傳播關(guān)系,其中元素表示為
aist=1? eist∈Ei0其他。(1)
對(duì)于事件ci,Xi=[xi0,xi1,…,xini-1]T為事件的特征矩陣,其中xi0表示源帖的特征向量,其他每個(gè)特征xij表示wij的特征向量。此外,對(duì)于社交媒體謠言檢測(cè)任務(wù),每個(gè)事件ci都包含著一個(gè)真實(shí)標(biāo)簽yi∈Y,其中Y表示事件的類別標(biāo)簽集合。謠言檢測(cè)問(wèn)題的分類器可以用由輸入空間C到輸出空間Y之間的映射f來(lái)表示,記作
f:C→Y。(2)
3 模型框架
本文提出一種基于門控圖神經(jīng)網(wǎng)絡(luò)的謠言檢測(cè)模型(Rumor detection model based on gated graph neural network, GGNN-RD),如圖2所示。模型主要包括構(gòu)建傳播和擴(kuò)散圖、節(jié)點(diǎn)表示、謠言表示、謠言分類器4部分內(nèi)容。
3.1 構(gòu)建傳播和擴(kuò)散圖
基于轉(zhuǎn)發(fā)和評(píng)論關(guān)系,為每個(gè)事件構(gòu)建傳播結(jié)構(gòu)G=(V,E)。定義A∈Rn×n和X分別為事件的鄰接矩陣和初始特征矩陣,A僅包含從上方節(jié)點(diǎn)到下方節(jié)點(diǎn)的邊。本文引入Dropedge方法[17]以減小模型的過(guò)擬合問(wèn)題,在訓(xùn)練的每個(gè)階段,通過(guò)式(3)隨機(jī)地從輸入圖中刪除邊生成變形數(shù)據(jù),這種方法增加了輸入數(shù)據(jù)的隨機(jī)性和多樣性。假設(shè)A中邊的數(shù)據(jù)量是Ne,丟棄比例為p,丟棄掉一定比例的邊后得到新的鄰接矩陣
A′=A-Adrop。(3)
基于A′和X,本文同時(shí)構(gòu)建自頂向下信息傳播方向上的傳播圖GTD和自底向上信息擴(kuò)散方向上的擴(kuò)散圖GBU,如圖1所示。將圖GTD的鄰接矩陣表示為ATD=A′,圖GBU的鄰接矩陣表示為ABU=A′T。另外,圖GTD和圖GBU采用相同的初始特征矩陣X。
其中,基于機(jī)器學(xué)習(xí)的謠言檢測(cè)方法使用scikit-learn庫(kù)實(shí)現(xiàn),BU-RvNN、TD-RvNN使用Theano框架實(shí)現(xiàn),GRU-RNN、Bi-GCN和本文提出的模型都采用PyTorch框架實(shí)現(xiàn)。為了進(jìn)行公平比較,數(shù)據(jù)集采用5折交叉驗(yàn)證的方法以獲得穩(wěn)健的實(shí)驗(yàn)結(jié)果。謠言檢測(cè)任務(wù)看作分類問(wèn)題,評(píng)估方法采用基于分類的評(píng)價(jià)指標(biāo)進(jìn)行評(píng)測(cè)。對(duì)于Twitter數(shù)據(jù)集,評(píng)估4個(gè)分類的整體準(zhǔn)確率(Accuracy,Acc)和各類別的F1值(F1)來(lái)驗(yàn)證本文模型的謠言檢測(cè)性能。對(duì)于Weibo數(shù)據(jù)集,通過(guò)實(shí)驗(yàn)得到分類的Acc和各類別的精確率(Precision,Pre),召回率(Recall,Rec),F(xiàn)1值來(lái)驗(yàn)證本文模型的謠言檢測(cè)性能。本文參考基線方法的相關(guān)參數(shù)設(shè)置[15],對(duì)本文所提模型的參數(shù)使用Adam[21]優(yōu)化算法進(jìn)行更新優(yōu)化,每個(gè)節(jié)點(diǎn)的隱藏特征向量的維度為64,DropEdge的丟棄率設(shè)為0.2,模型訓(xùn)練迭代次數(shù)設(shè)為200。
4.2 實(shí)驗(yàn)結(jié)果分析
首先,對(duì)本文提出的GGNN-RD模型與基線方法在謠言檢測(cè)任務(wù)中的性能進(jìn)行了一系列實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果顯示在表2~4中。
由表2~4的實(shí)驗(yàn)結(jié)果觀察可知,在Twitter15和Twitter16數(shù)據(jù)集,GGNN-RD相比最優(yōu)的基線方法在準(zhǔn)確率評(píng)估指標(biāo)上提升了至少1.1個(gè)百分點(diǎn),F(xiàn)1值提升了至少0.6個(gè)百分點(diǎn);在Weibo數(shù)據(jù)集,GGNN-RD相比于最優(yōu)的基線方法在準(zhǔn)確率評(píng)估指標(biāo)上提升了至少1.3個(gè)百分點(diǎn),F(xiàn)1值提升了至少1.2個(gè)百分點(diǎn)。因此,對(duì)比基線方法,本文提出的GGNN-RD在3個(gè)數(shù)據(jù)上均取得最優(yōu)的謠言檢測(cè)性能。
具體實(shí)驗(yàn)結(jié)果分析如下:
1) 由實(shí)驗(yàn)結(jié)果觀察得到,基于機(jī)器學(xué)習(xí)的謠言檢測(cè)方法(DTC、SVM-RBF)在所有評(píng)價(jià)指標(biāo)上都低于利用深度學(xué)習(xí)模型的謠言檢測(cè)方法。原因是機(jī)器學(xué)習(xí)通過(guò)人工提取特征,缺乏對(duì)謠言檢測(cè)的高階特征表示能力,模型的魯棒性較差。而深度學(xué)習(xí)方法具有較強(qiáng)的特征學(xué)習(xí)能力,可以捕捉到謠言信息重要的高階特征表示,對(duì)謠言信息的檢測(cè)性能更優(yōu)。這也說(shuō)明了開(kāi)展基于深度學(xué)習(xí)的謠言檢測(cè)技術(shù)研究具有一定的必要性和重要性。
2) 與GRU-RNN方法相比,基于傳播結(jié)構(gòu)的謠言檢測(cè)方法具有較好的性能。這是因?yàn)镚RU-RNN僅考慮了謠言傳播隨時(shí)間變化的序列特征,忽略了謠言信息的傳播結(jié)構(gòu)特征,從而導(dǎo)致謠言檢測(cè)性能的下降。實(shí)驗(yàn)證明,傳播過(guò)程含有大量重要的結(jié)構(gòu)信息,基于傳播結(jié)構(gòu)的檢測(cè)方法能夠挖掘豐富的傳播結(jié)構(gòu)特征,并對(duì)謠言進(jìn)行有效的識(shí)別。
3) 本文提出的GGNN-RD模型的實(shí)驗(yàn)結(jié)果要優(yōu)于BU-RvNN、TD-RvNN和Bi-GCN模型,BU-RvNN和TD-RvNN分別只考慮了單向信息傳播結(jié)構(gòu),無(wú)法獲得全面的結(jié)構(gòu)特征。Bi-GCN雖然使用了雙向的GCN對(duì)于傳播圖結(jié)構(gòu)進(jìn)行了建模,但是忽略了聚合鄰居節(jié)點(diǎn)信息時(shí)可能會(huì)產(chǎn)生噪聲,無(wú)法獲得較好的節(jié)點(diǎn)表示,針對(duì)這一點(diǎn)本文模型通過(guò)門控循環(huán)單元過(guò)濾聚合鄰居信息而產(chǎn)生的噪聲問(wèn)題。此外,本文模型利用了源貼豐富的語(yǔ)義和結(jié)構(gòu)信息,提出根節(jié)點(diǎn)增強(qiáng)方法,并融合了局部結(jié)構(gòu)和全局結(jié)構(gòu)信息特征從而學(xué)習(xí)更加全面的謠言特征表示。
4.3 消融實(shí)驗(yàn)
以往采用平均池化[22]的謠言表示方法無(wú)法取得突出的檢測(cè)性能,為了證明本文所提出的融合局部結(jié)構(gòu)和全局結(jié)構(gòu)信息的謠言表示方法有效性,通過(guò)設(shè)計(jì)消融實(shí)驗(yàn),對(duì)本文提出的謠言表示策略和下面3種方法相比較:
1) GGNN-RD-L指在謠言表示時(shí)僅考慮局部結(jié)構(gòu)信息的特征表示;
2) GGNN-RD-AVG指在謠言表示時(shí)考慮具有平均池化的全局結(jié)構(gòu)信息的特征表示;
3) GGNN-RD-ATT指在在謠言表示時(shí)只考慮具有注意力機(jī)制的全局結(jié)構(gòu)信息的特征表示。
通過(guò)在3個(gè)數(shù)據(jù)集采用4種不同謠言表示方法的消融實(shí)驗(yàn)獲得最終的實(shí)驗(yàn)結(jié)果,如圖3所示。
從圖3中可以看出,融合局部結(jié)構(gòu)和全局結(jié)構(gòu)信息的謠言表示方法GGNN-RD在所有數(shù)據(jù)集上都取得了最佳實(shí)驗(yàn)結(jié)果,它明確驗(yàn)證了將局部結(jié)構(gòu)信息與全局結(jié)構(gòu)信息結(jié)合起來(lái)的重要性。其中,GGNN-RD-L的性能最低,說(shuō)明僅包含源貼信息的局部結(jié)構(gòu)特征無(wú)法得到充分的謠言表示,隨著時(shí)間的不斷推移,社交媒體中的信息會(huì)形成豐富的傳播結(jié)構(gòu)。GGNN-RD-ATT在所有數(shù)據(jù)集上的結(jié)果都優(yōu)于采取平均池化的GGNN-RD-AVG方法,這說(shuō)明采用平均池化的謠言表示可能包含一些嘈雜的信息,而基于注意力機(jī)制能夠更好地捕獲重要信息,這再次說(shuō)明了融合局部結(jié)構(gòu)和全局結(jié)構(gòu)對(duì)于謠言檢測(cè)任務(wù)的必要性。
4.4 早期謠言檢測(cè)
早期謠言檢測(cè)是評(píng)估一個(gè)謠言檢測(cè)模型的重要指標(biāo),實(shí)現(xiàn)在社交媒體謠言傳播的早期發(fā)現(xiàn)謠言,及時(shí)對(duì)謠言信息進(jìn)行干預(yù),挽回一定損失[23]。本文設(shè)計(jì)了早期謠言檢測(cè)實(shí)驗(yàn),來(lái)評(píng)估各方法的早期謠言檢測(cè)效果。具體實(shí)現(xiàn),通過(guò)設(shè)置了一系列檢測(cè)截止期限來(lái)評(píng)估本文提出的模型和基線方法的準(zhǔn)確性,在每個(gè)截止時(shí)間點(diǎn)只選擇從源貼發(fā)布時(shí)間到檢測(cè)截止時(shí)間之間的帖子進(jìn)行實(shí)驗(yàn),對(duì)源帖發(fā)布后36 h內(nèi)多個(gè)檢測(cè)截止時(shí)間分別實(shí)驗(yàn)得出早期謠言檢測(cè)的實(shí)驗(yàn)結(jié)果,如圖4、圖5所示。
從實(shí)驗(yàn)結(jié)果中可以發(fā)現(xiàn),在圖4、圖5中源帖發(fā)布的最初期,本文所給出的模型在兩個(gè)不同的數(shù)據(jù)集上分別取得82.6%和81.3%的結(jié)果,與基線方法相比具有更優(yōu)的檢測(cè)性能,說(shuō)明本文的模型具有良好的早期謠言檢測(cè)水平。隨著時(shí)間不斷增長(zhǎng),不同謠言檢測(cè)方法的性能表現(xiàn)均有一定提升,說(shuō)明謠言檢測(cè)方法通過(guò)社交媒體中的信息傳播過(guò)程中學(xué)習(xí)得到的結(jié)構(gòu)特征越來(lái)越豐富。同時(shí),本文提出的模型在早期謠言檢測(cè)性能要明顯優(yōu)于基于傳播序列和傳播樹(shù)的檢測(cè)方法,表明其具有更好的捕獲真實(shí)環(huán)境中謠言的傳播模式的能力。在多個(gè)檢測(cè)截止時(shí)間節(jié)點(diǎn)的性能都優(yōu)于Bi-GCN模型,從而體現(xiàn)了模型具有良好的謠言表示能力,再次說(shuō)明了利用門控機(jī)制去除噪聲,融合局部結(jié)構(gòu)與全局結(jié)構(gòu)信息的謠言表示方法的有效性。
5 結(jié)論
本文對(duì)基于傳播結(jié)構(gòu)的謠言檢測(cè)問(wèn)題進(jìn)行了研究,并提出基于門控圖神經(jīng)網(wǎng)絡(luò)的謠言檢測(cè)模型GGNN-RD。通過(guò)建模社交媒體中信息的傳播過(guò)程為圖結(jié)構(gòu),利用門控圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)傳播結(jié)構(gòu)特征。此外,為了挖掘源帖豐富的語(yǔ)義和結(jié)構(gòu)信息,結(jié)合謠言的局部結(jié)構(gòu)和全局結(jié)構(gòu)信息以學(xué)習(xí)更全面的謠言表示。實(shí)驗(yàn)結(jié)果表明,本文模型較之前的基線方法有較大的性能提升,并且具有更好的早期檢測(cè)能力。由于社交媒體中包含豐富的對(duì)象及其社會(huì)交互關(guān)系,今后研究工作將考慮利用異質(zhì)信息網(wǎng)絡(luò)建模來(lái)解決謠言檢測(cè)問(wèn)題。
參考文獻(xiàn)
[1] 陳慧敏,金思辰.新冠疫情相關(guān)社交媒體謠言傳播量化分析[J].計(jì)算機(jī)研究與發(fā)展,2021,58(7):1366-1384.
CHEN H M, JIN S C. Quantitative analysis on the communication of COVID-19 related social media rumors[J]. Journal of Computer Research and Development, 2021, 58(7):1366-1384.
[2] 高玉君,梁剛, 蔣方婷,等. 社會(huì)網(wǎng)絡(luò)謠言檢測(cè)綜述[J]. 電子學(xué)報(bào), 2020,48(7):1421-1435.
GAO Y J, LIANG G, JIANG F T,et al. Social network rumor detection: a survey[J]. Acta Electronica Sinica, 2020,48(7):1421-1435.
[3] CASTILLO C, MENDOZA M, POBLETE B. Information credibility on twitter[C]//Proceedings of the 20th International Conference on World Wide Web,New York, USA,2011:675-684.
[4] YANG F, LIU Y, YU X H. Automatic detection of rumor on Sina Weibo[C]//Proceedings of the ACM SIGKDD Workshop on Mining Data Semantics,New York, USA,2012:1-7.
[5] GUO H, CAO J, ZHANG Y, et al. Rumor detection with hierarchical social attention network[C]//Proceedings of the 27th ACM International Conference on Information and Knowledge Management,Torino, Italy, 2018:943-951.
[6] GUPTA M,ZHAO P,HAN J. Evaluating event credibility on twitter[C]//Proceedings of the 2012 SIAM International Conference on Data Mining,San Francisco, USA, 2012:153-164.
[7] WU K, YANG S, ZHU K Q. False rumors detection on Sina Weibo by propagation structures[C]//Proceedings of the IEEE 31th International Conference on Data Engineering,Seoul, Korea, 2015:651-662.
[8] MA J, GAO W, WONG K F. Detect rumors in microblog posts using propagation structure via kernel learning[C]//Proceedings of the 55th Association for Computational Linguistics, Stroudsburg, USA,2017:708-717.
[9] 徐建民,孫朋,吳樹(shù)芳. 傳播路徑樹(shù)核學(xué)習(xí)的微博謠言檢測(cè)方法[J]. 計(jì)算機(jī)科學(xué),2022,49(6): 342-349.
XU J M, SUN P, WU S F. Microblog rumor detection method based on propagation path tree kernel learning[J]. Computer Science,2022,49(6): 342-349.
[10] MA J, GAO W, MITRA P, et al.Detecting rumors from microblogs with recurrent neural networks[C]//Proceedings of the 25th International Joint Conference on Artificial Intelligence,Palo Alto, USA, 2016:3818-3824.
[11] CHEN Y X, SUI J, HU L, et al. Attention-residual network with CNN for rumor detection[C]//Proceedings of the 28th ACM International Conference on Information and Knowledge Management, New York,USA,2019:1121-1130.
[12] MA J, GAO W, WONG K, et al. Rumor detection on twitter with tree-structured recursive neural networks[C]//Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics,Melbourne, Australia,2018:1980-1989.
[13] WU Z, PAN S, CHEN F, et al. A comprehensive survey on graph neural networks[J]. IEEE Transactions on Neural Networks and Learning Systems, 2021, 32(1):4-24.
[14] 石川,王睿嘉,王嘯.異質(zhì)信息網(wǎng)絡(luò)分析與應(yīng)用綜述[J].軟件學(xué)報(bào),2022,33(2):598-621.
SHI C, WANG R J, WANG X.Survey on heterogeneous information networks analysis and applications[J].Journal of Software,2022,33(2):598-621.
[15] BIAN T, XIAO X, XU T, et al. Rumor detection on social media with bi-directional graph convolutional networks[C]//Proceedings of the AAAI Conference on Artificial Intelligence, Palo Alto, USA, 2020:549-556.
[16] 胡斗, 衛(wèi)玲蔚,周薇.一種基于多關(guān)系傳播樹(shù)的謠言檢測(cè)方法[J].計(jì)算機(jī)研究與發(fā)展,2021,58(7):1395-1411.
HU D, WEI L W, ZHOU W, et al. A rumor detection approach based on muti-relational propagation tree[J].Journal of Computer Research and Development, 2021,58(7):1395-1411.
[17] RONG Y, HUANG W B, XU T Y. Dropedge:towards deep graph convolutional networks on node classification[C]//Proceedings of the AAAI Conference on Artificial Intelligence, New York, USA, 2020:1862.
[18] NIKOLENTZOS G, TIXIER A, VAZIRGIANNIS M. Message passing attention networks for document understanding[C]//Proceedings of the AAAI Conference on Artificial Intelligence, New York, USA,2020:8544-8551.
[19] HUANG Q, ZHOU C, WU J, et al. Deep spatial-temporal structure learning for rumor detection on twitter[J]. Neural Computing and Applications, 2020,41(3):219-230.
[20] LUONG M T, PHAM H, MANNING C D. Effective approaches to attention-based neural machine translation[C]//Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing, Lisbon, Portugal, 2015:1412-1423.
[21] KINGMA D, BA J. Adam: a method for stochastic optimization[C]//Proceedings of the 3rd International Conference on Learning Representations,San Diego, USA, 2015:1-13.
[22] RAO D N, MIAO X, JIANG Z H, et.al. STANKER: stacking network based on level-grained attention-masked BERT for rumor detection on social media[C]//Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, Punta Cana, Dominican,2021: 3347-3363.
[23] LU Y J, LI C T. GCAN:graph-aware co-attention networks for explainable fake news detection on social media[C]//Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics,2020:505-514.
Rumor detection model based on gated graph neural network
YANG Xiaohui, WANG Weibin
(School of Cyber Security and Computer, Hebei University, Baoding, Hebei 071003, China)
Abstract:Aiming at the noise interference problem of the rumor detection method based on graph neural network in the process of aggregating neighbor node information to generate rumor representation, a rumor detection model based on gated graph neural network is proposed. It also makes full use of the important impact of rich semantic and structural information contained in social media source posts on rumor detection. In the model, propagation graphs and diffusion graphs based on the propagation process of rumors is constructed, and a node representation is generated by aggregating neighbor information through a gated graph neural network.Gate mechanism is used to remove noise from neighbor nodes. At the same time, a root node semantic enhancement method is introduced to improve the ability to represent nodes. In addition, the attention mechanism is used to fuse local structure and global structure information to learn a more comprehensive rumor representation for the task of rumor detection. Experimental results on public datasets show that the proposed model has better rumor detection performance and early detection ability than baseline methods.
Keywords: social media; rumor detection; graph neural network; attention mechanism