• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      融合元路徑學(xué)習(xí)和膠囊網(wǎng)絡(luò)的社交媒體謠言檢測(cè)方法

      2022-07-15 08:10:30張鳳荔王瑞錦張志揚(yáng)賴金山
      關(guān)鍵詞:帖子謠言膠囊

      劉 楠,張鳳荔,王瑞錦,張志揚(yáng),賴金山

      (電子科技大學(xué)信息與軟件工程學(xué)院 成都 610054)

      社交媒體的快速發(fā)展為人們提供了獲取、處理和共享信息的便捷平臺(tái),促進(jìn)了海量信息的傳播和擴(kuò)散。其中,謠言的傳播會(huì)帶來(lái)不可逆、破壞性強(qiáng)、影響極廣的負(fù)面影響[1-2]。謠言的自動(dòng)識(shí)別有助于早期預(yù)防、減少損失,因此,謠言檢測(cè)技術(shù)[3]應(yīng)運(yùn)而生。

      早期的謠言檢測(cè)方法主要采用監(jiān)督學(xué)習(xí)[4-6],利用特征工程從文本內(nèi)容[7-9]、用戶信息[7]和傳播模式[10-13]中提取可區(qū)別的特征,如傳統(tǒng)機(jī)器學(xué)習(xí)模型[4]。隨著深度學(xué)習(xí)模型的出現(xiàn),基于RNN(recurrent neural network)、CNN(convolutional neural network)和AE(autoencoder)的方法在特征提取上有所改進(jìn),在情緒分析、機(jī)器翻譯、文本分類等方面均取得了顯著成果。文獻(xiàn)[10]利用遞歸神經(jīng)網(wǎng)絡(luò)捕捉微博中謠言源帖及其轉(zhuǎn)發(fā)帖的語(yǔ)義差異,從而根據(jù)語(yǔ)義的變化進(jìn)行下一個(gè)傳播點(diǎn)的預(yù)測(cè)。這是首個(gè)引入深度神經(jīng)網(wǎng)絡(luò)捕獲謠言在整個(gè)傳播過(guò)程的潛在時(shí)序變化的研究。文獻(xiàn)[14]基于樹的遞歸神經(jīng)網(wǎng)絡(luò)模型以捕獲謠言在傳播結(jié)構(gòu)中的潛在語(yǔ)義信息特征。文獻(xiàn)[15]使用一種變分自動(dòng)編碼器(variational autoencoder, VAE)獲取帖子涵蓋的文本特征和圖像特征,以確定該帖子是否為謠言。文獻(xiàn)[16]將源帖的傳播路徑建模為一個(gè)多元時(shí)間序列,利用RNN 和CNN 捕捉相關(guān)帖子參與者的用戶特征沿傳播路徑的變化。上述模型多采用單一的文本內(nèi)容檢測(cè)模型,忽略了社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)信息。此外,部分方法僅從信息個(gè)體角度進(jìn)行考慮,忽略了社交網(wǎng)絡(luò)信息之間所存在的結(jié)構(gòu)相關(guān)性。如果同一用戶發(fā)布或轉(zhuǎn)發(fā)了多個(gè)帖子,則可以連接這些帖子。這樣的關(guān)聯(lián)可在連接的實(shí)例之間共享知識(shí),幫助彼此檢測(cè)以提高性能。

      近年來(lái),GCN(graph convolutional networks)從信息結(jié)構(gòu)化的度檢測(cè)謠言和假新聞。如文獻(xiàn)[17]建立了一個(gè)深度擴(kuò)散網(wǎng)絡(luò)模型,學(xué)習(xí)新聞文章、創(chuàng)建者和主題的融合表示,挖掘社交網(wǎng)絡(luò)的結(jié)構(gòu)性特征。此外,信息在社交網(wǎng)絡(luò)上的傳播過(guò)程所構(gòu)成的圖網(wǎng)絡(luò)具有異質(zhì)性,從異構(gòu)圖的構(gòu)建與分析角度可有效提高虛假信息檢測(cè)模型的性能。如文獻(xiàn)[18]通過(guò)從社交網(wǎng)絡(luò)上的帖子、評(píng)論和相關(guān)用戶構(gòu)建的異構(gòu)圖中,捕獲圖結(jié)構(gòu)中的語(yǔ)義信息。雖然目前GCN 和異構(gòu)圖網(wǎng)絡(luò)在謠言檢測(cè)方面性能表現(xiàn)良好,但仍存在部分問(wèn)題。首先,GCN 針對(duì)圖中每個(gè)學(xué)習(xí)到的節(jié)點(diǎn)表示采用的是標(biāo)量式編碼,需要逐一編碼節(jié)點(diǎn)包含的所有屬性,當(dāng)數(shù)據(jù)量過(guò)大時(shí),效率會(huì)大大降低。其次,現(xiàn)有異構(gòu)圖網(wǎng)絡(luò)著重強(qiáng)調(diào)謠言傳播過(guò)程的文本內(nèi)容語(yǔ)義變化,忽略了用戶之間的社交關(guān)系,在一定程度上對(duì)檢測(cè)模型的性能進(jìn)行了限制。此外,目前已有的謠言檢測(cè)模型,對(duì)社交網(wǎng)絡(luò)的異構(gòu)性研究缺乏用戶之間社交關(guān)系的考慮,而在真實(shí)的社交網(wǎng)絡(luò)中,社交關(guān)系是一個(gè)較大的影響因素。

      針對(duì)上述問(wèn)題,本文提出了一種融合元路徑學(xué)習(xí)和膠囊網(wǎng)絡(luò)的社交媒體謠言檢測(cè)方法(rumor detection based on meta-path learning and capsule network, CNMLRD),聯(lián)合圖嵌入和文本內(nèi)容語(yǔ)義嵌入兩方面對(duì)謠言在社交網(wǎng)絡(luò)上的特征學(xué)習(xí)進(jìn)行表示,利用膠囊網(wǎng)絡(luò)以矢量編碼增強(qiáng)學(xué)習(xí)到的特征。該方法首次將膠囊網(wǎng)絡(luò)矢量編碼模型用于謠言早期檢測(cè)中,針對(duì)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)本身特性導(dǎo)致的檢測(cè)模型編碼效率低下的問(wèn)題提出了一種新的解決思路。此外,該方法涉及基于元路徑學(xué)習(xí)的異構(gòu)圖分解模型,實(shí)現(xiàn)了對(duì)用戶潛在社交關(guān)系及圖結(jié)構(gòu)的全局語(yǔ)義信息挖掘,不僅提高了謠言早期檢測(cè)模型的效率和精度,并在一定程度上增強(qiáng)了模型的可解釋性。

      1 問(wèn)題描述

      為了準(zhǔn)確描述面向社交網(wǎng)絡(luò)的謠言檢測(cè)問(wèn)題,對(duì)以下概念進(jìn)行定義。

      定義 1社交媒體關(guān)系:定義為社交傳播實(shí)體與其對(duì)應(yīng)的傳播內(nèi)容的集合S={e1,e2,···,es},其中es指 第s個(gè)社交傳播實(shí)體和其所傳播的內(nèi)容。

      定義 2社交傳播實(shí)體:在社交網(wǎng)絡(luò)中參與了發(fā)表、轉(zhuǎn)發(fā)和評(píng)論帖子等行為的用戶個(gè)體,用集合U={u1,u2···,un}表 示,其中un表 示第n個(gè)用戶實(shí)體。

      定義 3傳播內(nèi)容:用戶所發(fā)表的帖子,并且這些帖子至少會(huì)有不少于1 次的轉(zhuǎn)發(fā)和評(píng)論,用集合T={t1,t2,···,tm}表 示,其中tm表 示第m個(gè)帖子實(shí)體。

      定義 4異常傳播實(shí)體:以用戶是否發(fā)起或轉(zhuǎn)發(fā)過(guò)一條謠言帖子作為評(píng)判標(biāo)準(zhǔn),將用戶分為正常用戶和異常用戶。

      根據(jù)以上概念,可以構(gòu)建基礎(chǔ)社交信息傳播網(wǎng)絡(luò),并利用異常傳播實(shí)體的評(píng)判標(biāo)準(zhǔn)將基礎(chǔ)社交信息傳播網(wǎng)絡(luò)轉(zhuǎn)化為異構(gòu)圖網(wǎng)絡(luò),然后采用圖神經(jīng)網(wǎng)絡(luò)模型得到每一個(gè)傳播實(shí)體與傳播內(nèi)容的低維向量特征表示,謠言的潛在特征可以結(jié)合信息在社交媒體網(wǎng)絡(luò)上的結(jié)構(gòu)特征以及信息內(nèi)容的文本語(yǔ)義特征得到。

      綜上,本文將謠言檢測(cè)任務(wù)看作二分類問(wèn)題,目標(biāo)是訓(xùn)練一個(gè)模型f(·)以預(yù)測(cè)一個(gè)給定信息的標(biāo)簽f(ti), 若f(ti)=1, 則ti為 非謠言;f(ti)=0,則ti為謠言。

      2 方法介紹

      2.1 總體框架和流程

      整個(gè)模型框架如圖1 所示,主要包含4 個(gè)模塊:用戶?帖子異構(gòu)圖構(gòu)建模塊,圖節(jié)點(diǎn)結(jié)構(gòu)特征膠囊模塊、文本內(nèi)容特征膠囊模塊以及特征融合模塊。其中,用戶?帖子異構(gòu)圖構(gòu)建模塊主要是完成對(duì)原始數(shù)據(jù)集的清理及預(yù)處理,再依據(jù)應(yīng)用場(chǎng)景的需求構(gòu)建適當(dāng)?shù)漠悩?gòu)圖;圖節(jié)點(diǎn)結(jié)構(gòu)特征膠囊嵌入模塊主要是利用圖卷積膠囊網(wǎng)絡(luò)將異構(gòu)圖中節(jié)點(diǎn)的特征以膠囊形式嵌入得到圖節(jié)點(diǎn)膠囊的表示,充分保留節(jié)點(diǎn)的屬性;文本內(nèi)容特征膠囊嵌入模塊主要是利用內(nèi)容膠囊網(wǎng)絡(luò)將帖子文本內(nèi)容的語(yǔ)義特征以膠囊形式進(jìn)行嵌入得到帖子文本內(nèi)容膠囊的表示,充分挖掘文本的語(yǔ)義特征;特征融合模塊主要是將帖子在社交網(wǎng)絡(luò)中的圖節(jié)點(diǎn)膠囊表示與其文本內(nèi)容膠囊表示進(jìn)行融合,并在此基礎(chǔ)上實(shí)現(xiàn)對(duì)謠言的劃分。

      圖1 總體架構(gòu)和流程

      2.2 異構(gòu)圖構(gòu)建

      異構(gòu)圖構(gòu)建模塊的目的是對(duì)原始數(shù)據(jù)集進(jìn)行預(yù)處理,進(jìn)一步對(duì)給定的數(shù)據(jù)按照其在實(shí)際社交網(wǎng)絡(luò)中存在的點(diǎn)邊關(guān)系,提取對(duì)應(yīng)的點(diǎn)集、邊集。針對(duì)常見社交網(wǎng)絡(luò)構(gòu)建的用戶?帖子異構(gòu)圖G, 圖G=(V,E),V表示圖中節(jié)點(diǎn)的集合,包含所有的用戶節(jié)點(diǎn)和帖子節(jié)點(diǎn)。E表示圖中邊的集合,凡是用戶發(fā)起、轉(zhuǎn)發(fā)或者評(píng)論過(guò)的帖子,該用戶與帖子之間存在社交媒體關(guān)系,這兩者的節(jié)點(diǎn)之間存在一條邊。

      進(jìn)一步考慮用戶的異常狀態(tài),以用戶是否發(fā)起或轉(zhuǎn)發(fā)過(guò)一條謠言帖子作為評(píng)判標(biāo)準(zhǔn),將用戶分為正常用戶和潛在威脅用戶:

      式中,UB={ub1,ub2,···,ubn}表示社交網(wǎng)絡(luò)潛在威脅用戶的集合,ubi表示潛在威脅用戶;UY={uy1,uy2,···,uyn}表 示正常用戶的集合,uyi表示正常用戶;T={t1,t2,···,tm}表示一個(gè)話題下的所有帖子的集合,ti表 示帖子,t1表示源帖。節(jié)點(diǎn)之間的連接關(guān)系可以通過(guò)鄰接矩陣A={0,1}|V|×|V|表示獲得。

      2.3 圖節(jié)點(diǎn)結(jié)構(gòu)特征膠囊嵌入

      此模塊在CapsGNN 網(wǎng)絡(luò)[19]基礎(chǔ)上,根據(jù)本文的實(shí)際應(yīng)用場(chǎng)景做出相應(yīng)的調(diào)整,實(shí)現(xiàn)異構(gòu)圖節(jié)點(diǎn)的膠囊嵌入。在原有的CapsGNN 網(wǎng)絡(luò)中,只考慮了圖結(jié)構(gòu)信息,而在本文中需要將文本內(nèi)容信息進(jìn)行聯(lián)合,因此在本文的圖形嵌入部分的基礎(chǔ)上實(shí)現(xiàn)對(duì)圖節(jié)點(diǎn)膠囊的嵌入可以簡(jiǎn)化模型的復(fù)雜度。此模塊主要包括GCN 層、Capsule 層和圖節(jié)點(diǎn)膠囊構(gòu)建層3 部分,如圖2 所示。

      圖2 圖卷積膠囊(GCNCapsule)模塊圖

      其中,GCN 層的目的是從原始圖數(shù)據(jù)中提取圖結(jié)構(gòu)的低級(jí)特征,每一個(gè)Zi表示一個(gè)GCN 模塊,可進(jìn)行h次 圖卷積操作,h屬于超參可設(shè)置。GCN 的應(yīng)用對(duì)象是圖結(jié)構(gòu)數(shù)據(jù),利用圖結(jié)構(gòu)上節(jié)點(diǎn)的多階鄰域節(jié)點(diǎn)所包含的信息對(duì)該節(jié)點(diǎn)特征進(jìn)行學(xué)習(xí)。假設(shè)圖G=(V,E),V={v1,v2,···,vN}表示節(jié)點(diǎn)集合,E={e1,e2,···,em}表示邊集合,節(jié)點(diǎn)初始特征表示為X∈RN×d0, 其中d0示節(jié)點(diǎn)的特征維度。

      GCN 采用的是逐層疊加的學(xué)習(xí)方式,所有節(jié)點(diǎn)同步更新。因此在GCN 每層的學(xué)習(xí)過(guò)程中,卷積運(yùn)算應(yīng)用于每個(gè)節(jié)點(diǎn)及其鄰居,并通過(guò)激活函數(shù)計(jì)算每個(gè)節(jié)點(diǎn)的新表示。其過(guò)程可表示為:

      式中,Zl?1∈Rd×d′表示第l?1層提取到的節(jié)點(diǎn)特征,d表節(jié)點(diǎn)的維度;Z0=X為輸入的初始特征;A表示節(jié)點(diǎn)的鄰接矩陣;表示鄰接矩陣對(duì)應(yīng)的度矩陣,可由式(3)表示;Wl?1∈Rd×d′為 第l?1層的權(quán)重矩陣; σ是非線性激活函數(shù)。

      Capsule 層的主要目的是將圖中所包含的節(jié)點(diǎn)特征表示轉(zhuǎn)化為向量形式,有效保留圖節(jié)點(diǎn)的完整屬性。通過(guò)將每一個(gè)GCN 模塊提取的節(jié)點(diǎn)特征進(jìn)行封裝來(lái)實(shí)現(xiàn)。即原GCN 層的GCN 模塊之間不再是簡(jiǎn)單的直接卷積,而是在原有的卷積上進(jìn)一步捕獲GCN 模塊內(nèi)部特征通道之間存在的潛在關(guān)系,其過(guò)程可表示為:

      最后,在圖節(jié)點(diǎn)膠囊層,通過(guò)累加的方式將每一個(gè)GCN 模塊得到的capsule 疊加起來(lái)得到最后的圖節(jié)點(diǎn)膠囊,即完成了對(duì)圖節(jié)點(diǎn)膠囊的嵌入表示。

      2.4 文本內(nèi)容特征膠囊嵌入

      文本內(nèi)容特征膠囊嵌入的主要目的是為了將每個(gè)帖子的文本表示用膠囊的形式嵌入,本文采用多頭注意力機(jī)制和膠囊網(wǎng)絡(luò)來(lái)實(shí)現(xiàn),具體模型如圖1下半部分所示。

      為了對(duì)文本特征進(jìn)行有效嵌入,首先利用文本截?cái)嗟姆绞綄?duì)文本進(jìn)行預(yù)處理,設(shè)定處理后的文本為固定長(zhǎng)度L。若文本長(zhǎng)度大于L, 則以L長(zhǎng)度截?cái)辔谋?,若長(zhǎng)度小于L,則用0 填充,帖子ti的文本內(nèi)容表達(dá)式為:

      最后將計(jì)算得到的Z1,Z2,···,Zh進(jìn)行拼接,得到通過(guò)詞向量嵌入方式的文本初級(jí)嵌入Z∈RL×d。

      在文本初級(jí)嵌入的基礎(chǔ)上,利用一個(gè)內(nèi)容膠囊(ContentCapsule)模塊對(duì)文本的語(yǔ)義信息進(jìn)行嵌入,模塊的具體內(nèi)容如圖3 所示。

      圖3 內(nèi)容膠囊(ContentCapsule)

      在ContentCapsule 模塊的卷積層,將通過(guò)多頭注意力機(jī)制得到的詞向量嵌入作為輸入,通過(guò)卷積層對(duì)文本初級(jí)嵌入進(jìn)行一次局部特征檢測(cè),抽取低級(jí)特征,這樣網(wǎng)絡(luò)就可以在層次較少的情況下盡可能感受多的信息。隨后,將卷積層得到的結(jié)果作為主膠囊層的輸入構(gòu)建相應(yīng)的張量結(jié)構(gòu),在這一層,對(duì)上層輸出執(zhí)行n次不同權(quán)重的卷積操作,然后將這n個(gè)卷積結(jié)果單元封裝在一起組成Capsule 神經(jīng)元,這樣就得到文本內(nèi)容的低級(jí)別特征的向量。

      2.5 特征融合

      為了提高模型的檢測(cè)精確度,在分別得到帖子傳播圖結(jié)構(gòu)和帖子文本內(nèi)容的特征矢向量以后,本模塊將這兩個(gè)表征矢向量進(jìn)行融合,進(jìn)一步學(xué)習(xí)更深層次的特征表示,用于后續(xù)對(duì)謠言的分類及檢測(cè)。此模塊的結(jié)構(gòu)如圖4 所示。

      圖4 特征融合

      此模塊將帖子的圖節(jié)點(diǎn)膠囊與內(nèi)容膠囊進(jìn)行融合,再在此基礎(chǔ)上獲取高級(jí)別特征的向量,由于這不是傳統(tǒng)神經(jīng)網(wǎng)絡(luò)標(biāo)量到標(biāo)量,而是向量到向量,因此,需要用到一個(gè)動(dòng)態(tài)路由機(jī)制進(jìn)行傳播和更新,得到類膠囊(ClassCapsule),最終根據(jù)輸出向量模長(zhǎng)得出類別概率向量,路由機(jī)制實(shí)現(xiàn)偽碼如算法1 所示。

      算法 1 層級(jí)膠囊映射的路由選擇

      輸入:子級(jí)膠囊S,初始權(quán)重矩陣集W,可迭代次數(shù)t

      輸出:父級(jí)膠囊H

      路由選擇偽碼:

      1) 針對(duì)所有的l?1層 的膠囊i,計(jì)算其與對(duì)應(yīng)l層 的膠囊j之間的預(yù)測(cè)標(biāo)量積uj|i=

      2) 定義rij是l?1層 膠囊i連 接到l層 膠囊j的可能性,初始值為rij←0

      3) 執(zhí)行步驟4)~7)t次

      4) 針對(duì)l?1層 的膠囊i, 將rij轉(zhuǎn)化為概率←softmax(ri j)

      5)對(duì)l層 的 膠 囊j進(jìn) 行 加 權(quán) 求 和 得 到hj:hj←

      6)對(duì)hj進(jìn)行壓縮得到←squash(hj)

      7)更新rij,rij←rij+

      結(jié)束

      其中,squash 和softmax 函數(shù)的具體計(jì)算如式(8)~式(9)所示:

      3 實(shí)驗(yàn)分析

      3.1 數(shù)據(jù)集

      本文采用測(cè)評(píng)數(shù)據(jù)集Twitter15 和Twitter16[12]進(jìn)行實(shí)驗(yàn)驗(yàn)證,2 種數(shù)據(jù)集分別包含1 490 和818 條謠言源推文。數(shù)據(jù)集中的每一條源推特被標(biāo)記為真實(shí)謠言(true rumor, TR)、虛假謠言(false rumor, FR)、未 經(jīng) 證 實(shí) 的 謠 言(unverified rumor,UR)或非謠言(non-rumor, NR)。由于原始數(shù)據(jù)集不包括用戶配置文件信息,調(diào)用Twitter API3 抓取與源推文相關(guān)的所有用戶的配置文件。數(shù)據(jù)集的其他細(xì)節(jié)如表1 所示。

      表1 實(shí)驗(yàn)數(shù)據(jù)集統(tǒng)計(jì)詳情

      3.2 基線模型

      針對(duì)本文所選用的評(píng)測(cè)數(shù)據(jù)集,為驗(yàn)證本文所提出模型的有效性,與下列7 種謠言檢測(cè)模型進(jìn)行對(duì)比。

      1) DTR[20]:基于決策樹的模型,通過(guò)正則表達(dá)式對(duì)從Twitter 流中提取的集群進(jìn)行排序以識(shí)別謠言。

      2) DTC[1]:基于決策樹模型,利用特征工程提取的推文統(tǒng)計(jì)特征得到識(shí)別謠言的決策樹分類器[1]。

      3) BU-RvN[10]:基于從葉子到根節(jié)點(diǎn)的傳播樹遍歷方向的遞歸神經(jīng)網(wǎng)絡(luò),捕獲擴(kuò)散線索和內(nèi)容語(yǔ)義。

      4) TD-RvNN[10]:基于從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的傳播樹遍歷方向的遞歸神經(jīng)網(wǎng)絡(luò),捕獲傳播線索和內(nèi)容語(yǔ)義。

      5) PPC[15]:由遞歸和卷積網(wǎng)絡(luò)組成的傳播路徑分類器建模用戶特征序列。

      6) GLAN[9]:構(gòu)建整體?局部的注意力網(wǎng)絡(luò)捕獲源帖及相關(guān)帖子傳播結(jié)構(gòu)的局部語(yǔ)義關(guān)聯(lián)和全局結(jié)構(gòu)關(guān)聯(lián)。

      7) HGAN[17]:通過(guò)構(gòu)建異構(gòu)圖注意網(wǎng)絡(luò)框架,捕獲源帖及相關(guān)帖子在傳播結(jié)構(gòu)中的全局語(yǔ)義關(guān)聯(lián)和結(jié)構(gòu)關(guān)聯(lián)。

      3.3 評(píng)估指標(biāo)

      本文所研究的謠言檢測(cè)問(wèn)題本質(zhì)上是二分類問(wèn)題,本文選用基于分類的評(píng)價(jià)指標(biāo)進(jìn)行謠言檢測(cè)性能評(píng)測(cè)。針對(duì)本文選用的數(shù)據(jù)集,采用各類別判斷的準(zhǔn)確率(accuracy, Acc)和各類別的F1值來(lái)評(píng)估模型的性能,計(jì)算方式為:式中,TP(true positive)表示真實(shí)類別為正例,預(yù)測(cè)類別也為正例的數(shù)量;FP(false positive)表示真實(shí)類別為負(fù)例,預(yù)測(cè)類別為正例的數(shù)量;FN (false negative)表示真實(shí)類別為正例,預(yù)測(cè)類別為負(fù)例的數(shù)量;TN(true negative)表示真實(shí)類別為負(fù)例,預(yù)測(cè)類別為負(fù)例的數(shù)量。

      3.4 實(shí)驗(yàn)結(jié)果

      實(shí)驗(yàn)基于PyTorch 框架實(shí)現(xiàn),使用Adam 優(yōu)化器,初始學(xué)習(xí)率為0.005,在模型訓(xùn)練過(guò)程中逐漸降低。根據(jù)驗(yàn)證集上的性能選擇最佳參數(shù)設(shè)置,并在測(cè)試集中評(píng)估方法性能。初始化詞向量設(shè)置為300 維。模型訓(xùn)練的批量大小mini batch 設(shè)置為32。

      如表2 和表3 所示,本文方法在兩個(gè)數(shù)據(jù)集上的性能優(yōu)于其他所有基線。具體而言,本文方法在這兩個(gè)數(shù)據(jù)集上分別實(shí)現(xiàn)了92.5%和93.6%的分辨率,比最佳基線分別提高了1.4%和1.2%。雖然只有一個(gè)百分點(diǎn),但就數(shù)據(jù)呈指數(shù)級(jí)擴(kuò)增的規(guī)模而言,一個(gè)百分點(diǎn)帶來(lái)的效應(yīng)也是不可低估的,這表明本文方法能夠有效地捕獲謠言文本內(nèi)容的全局語(yǔ)義關(guān)系,有助于謠言檢測(cè)。

      表2 Twitter15 數(shù)據(jù)集實(shí)驗(yàn)結(jié)果

      表3 Twitter16 數(shù)據(jù)集實(shí)驗(yàn)結(jié)果

      此外,基于傳統(tǒng)機(jī)器學(xué)習(xí)方法(DTR 和DTC)的對(duì)比實(shí)驗(yàn)?zāi)P捅憩F(xiàn)不佳,深度學(xué)習(xí)方法(如BURvNN、TD-RvNN、PCC 和GLAN)比基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法有更好的性能,這表明深度學(xué)習(xí)方法更容易捕獲有效的特征用于謠言檢測(cè)。此外,GLAN 在所有對(duì)比模型中表現(xiàn)最好,因?yàn)樗蹲降街{言傳播源推文的局部語(yǔ)義和全局結(jié)構(gòu)信息,而其他基線未能捕捉到這部分信息。

      4 結(jié) 束 語(yǔ)

      本文提出了一種融合元路徑學(xué)習(xí)和膠囊網(wǎng)絡(luò)的社交媒體謠言檢測(cè)方法(CNMLRD),利用膠囊網(wǎng)絡(luò)矢量編碼的優(yōu)勢(shì)特性,彌補(bǔ)由傳統(tǒng)神經(jīng)網(wǎng)絡(luò)特性所導(dǎo)致的檢測(cè)模型編碼效率較低的缺陷;利用元路徑學(xué)習(xí)的異構(gòu)圖分解方法,實(shí)現(xiàn)了對(duì)用戶潛在社交關(guān)系以及圖結(jié)構(gòu)的全局語(yǔ)義信息挖掘,增強(qiáng)對(duì)檢測(cè)模型的可解釋性。實(shí)驗(yàn)表明,在同等數(shù)據(jù)集的情況下,該方法相比于其他方法,檢測(cè)結(jié)果的精確度有所提升,這樣的優(yōu)勢(shì)在數(shù)據(jù)集呈指數(shù)級(jí)增加的情況下更為凸顯。未來(lái)研究將考慮加入視頻、圖像、聲音等數(shù)據(jù),利用多模態(tài)解決社交媒體謠言檢測(cè)問(wèn)題,并進(jìn)一步提高方法的泛化性。

      猜你喜歡
      帖子謠言膠囊
      Shugan Jieyu capsule (舒肝解郁膠囊) improve sleep and emotional disorder in coronavirus disease 2019 convalescence patients: a randomized,double-blind,placebo-controlled trial
      中國(guó)使館駁斥荒謬謠言
      Shumian capsule(舒眠膠囊)improves symptoms of sleep mood disorder in convalescent patients of Corona Virus Disease 2019
      當(dāng)謠言不攻自破之時(shí)
      暴力老媽
      謠言
      謠言大揭秘
      情事圈點(diǎn)
      女性天地(2012年11期)2012-04-29 00:44:03
      聚焦“毒膠囊”
      高手是這樣拍馬屁的
      小品文選刊(2009年7期)2009-05-25 09:59:52
      射洪县| 马边| 婺源县| 旬邑县| 稷山县| 鲁山县| 津南区| 刚察县| 安阳县| 册亨县| 清丰县| 东光县| 商洛市| 长宁县| 卢龙县| 铁岭市| 越西县| 苏尼特左旗| 临武县| 新余市| 井研县| 铜山县| 墨脱县| 淮安市| 青龙| 高青县| 盐边县| 西和县| 长岛县| 隆安县| 华宁县| 泰来县| 特克斯县| 会昌县| 白水县| 衡东县| 延津县| 积石山| 德保县| 射阳县| 吉木萨尔县|