• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      社交網(wǎng)絡(luò)中流言的判別與溯源

      2019-05-24 14:11宋磊
      電腦知識(shí)與技術(shù) 2019年4期
      關(guān)鍵詞:傳播路徑社交網(wǎng)絡(luò)流言

      宋磊

      摘要:在互聯(lián)網(wǎng)飛速發(fā)展的今天,流言作為信息的一種,其危害在社交網(wǎng)絡(luò)的作用下不斷地被放大。隨著社交網(wǎng)絡(luò)的迅速發(fā)展,流言傳播無(wú)論從影響規(guī)模上和還是傳播速度上來(lái)說(shuō)都每日劇增,這使得人們對(duì)判別流言和抑制流言方法的需求也隨之增長(zhǎng)。為了對(duì)社交網(wǎng)絡(luò)中的流言進(jìn)行判別與溯源,從真實(shí)社交網(wǎng)絡(luò)數(shù)據(jù)爬取入手,基于數(shù)據(jù)的時(shí)間軌跡,挖掘出流言的傳播路徑,構(gòu)建信息傳播網(wǎng)絡(luò),并基于傳播網(wǎng)絡(luò)拓?fù)涮卣鞣治鰧?duì)流言進(jìn)行判別和溯源。并且基于傳播網(wǎng)絡(luò)以及相關(guān)拓?fù)涮卣餍畔?,提出了通過(guò)檢測(cè)其連通分支節(jié)點(diǎn)數(shù)目和直徑分布是否滿足冪律分布來(lái)判別該網(wǎng)絡(luò)中是否有流言存在,對(duì)不滿足冪律分布的,通過(guò)檢測(cè)“離群點(diǎn)”的方法來(lái)初步定位流言。

      關(guān)鍵詞:社交網(wǎng)絡(luò);流言;傳播路徑;判別與溯源

      中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2019)04-0006-03

      Abstract: Today, with the rapid development of the Internet, rumors as a kind of information, its harm is constantly amplified by the role of social networks. With the rapid development of social networks, rumors spread daily, both in terms of scale and speed of communication, which has led to an increase in the demand for discriminating rumors and suppressing rumors. In order to discriminate and trace the rumors in the social network, start from the real social network data crawling, based on the time trajectory of the data, mine the propagation path of the rumors, construct the information dissemination network, discriminate and trace the rumors based on the topological characteristics of the propagation network. Based on the propagation network and related topological feature information, it is proposed to determine whether there are rumors in the network by detecting whether the number of connected branch nodes and the diameter distribution satisfy the power law distribution. Then detecting the "outlier point" of the power law distribution to initially locate rumors.

      Key words: Social network; rumors; propagation path; discrimination and traceability

      1 研究背景

      社交網(wǎng)絡(luò)就是社交網(wǎng)絡(luò)服務(wù),它源自英文SNS(Social Network Service)的翻譯?;赪eb2.0的社交網(wǎng)絡(luò)已經(jīng)成為人們?nèi)粘I钪芯S系社會(huì)關(guān)系和信息傳播的重要方式,在社會(huì)的各個(gè)方面都產(chǎn)生了深遠(yuǎn)的影響:(1)社交網(wǎng)絡(luò)上的人們通過(guò)各種聯(lián)系形成了各種“關(guān)系結(jié)構(gòu)”,其中最顯著的便是形成了大量的虛擬社區(qū);(2)基于社交網(wǎng)絡(luò)的關(guān)系結(jié)構(gòu),社交網(wǎng)絡(luò)用戶圍繞著某個(gè)熱點(diǎn)事件或者話題聚集在一起,相互作用,影響,構(gòu)成了社交網(wǎng)絡(luò)上具有相似特征的“網(wǎng)絡(luò)群體”;(3)社交網(wǎng)絡(luò)推動(dòng)下,使得現(xiàn)實(shí)信息一旦變?yōu)椤熬W(wǎng)絡(luò)信息”,得益于社交網(wǎng)絡(luò)本身自帶的關(guān)系結(jié)構(gòu)以及各種網(wǎng)絡(luò)群體的出現(xiàn),將以往常難以想象的速度在網(wǎng)絡(luò)上擴(kuò)散,網(wǎng)絡(luò)世界與現(xiàn)實(shí)世界的信息互動(dòng)將不可避免地造成影響。

      流言與社交網(wǎng)絡(luò)的結(jié)合不僅改變了流言傳播的方式,同時(shí)也使得流言的傳播群體更容易被同化和產(chǎn)生從中心理。因此,對(duì)真實(shí)社交網(wǎng)絡(luò)中流言傳播模型以及其判別方法的研究具有非常重要的現(xiàn)實(shí)意義。近年來(lái),盡管社交網(wǎng)絡(luò)中的信息傳播已經(jīng)是當(dāng)前熱點(diǎn)之一,但是大多數(shù)研究只是提供了傳播理論以及傳播模型,卻沒(méi)有結(jié)合真實(shí)社交網(wǎng)絡(luò)的數(shù)據(jù)來(lái)分析;也有一些文章研究了傳播過(guò)程中每個(gè)節(jié)點(diǎn)的行為及其影響,但是沒(méi)有從整體上去分析和研究社交網(wǎng)絡(luò)中整個(gè)話題的信息傳播;同時(shí),當(dāng)前對(duì)于真實(shí)社交網(wǎng)絡(luò)上的流言并沒(méi)有一個(gè)有效判別和溯源流言的方法。本文正是基于這樣的狀況,提出了一種從公共信息中判別流言的方法,并做到簡(jiǎn)單的溯源,找到流言來(lái)源。

      2 實(shí)驗(yàn)分析

      本文樣本數(shù)據(jù)是通過(guò)選取不同時(shí)間twitter上的三個(gè)熱門(mén)話題來(lái)作為搜索關(guān)鍵字,獲取推文數(shù)據(jù)和相關(guān)用戶數(shù)據(jù),它們分別為BroadwayACeleb,F(xiàn)lyDubai,MakeTVShowsEvil。我們?yōu)槊恳活?lèi)關(guān)鍵字建立了對(duì)應(yīng)的信息數(shù)據(jù)庫(kù)。

      2.1 社交網(wǎng)絡(luò)信息傳播網(wǎng)絡(luò)構(gòu)建

      傳統(tǒng)社會(huì)網(wǎng)絡(luò)中,通常以信息內(nèi)容為主體,而在在線網(wǎng)絡(luò)中,信息依賴于人與人之間的好友關(guān)系進(jìn)行傳播,通過(guò)人與人之間的關(guān)系影響人與信息的關(guān)系。具體到本文中我們采用的Twitter,信息傳播往往依賴于Twitter用戶之間的關(guān)注與被關(guān)注的關(guān)系,因此我們?cè)跇?gòu)建信息傳播網(wǎng)絡(luò)中著重考慮了這一點(diǎn)。

      網(wǎng)絡(luò)由點(diǎn)與邊構(gòu)成,構(gòu)建信息傳播網(wǎng)絡(luò)首先就是定義網(wǎng)絡(luò)中點(diǎn)與邊代表的內(nèi)容。

      首先是信息傳播網(wǎng)絡(luò)中的點(diǎn),我們將話題下的每一條推文視為一個(gè)節(jié)點(diǎn),這個(gè)節(jié)點(diǎn)對(duì)應(yīng)我們數(shù)據(jù)庫(kù)中的一個(gè)文檔,因而每個(gè)節(jié)點(diǎn)都有一個(gè)用戶ID,一個(gè)對(duì)應(yīng)的推文發(fā)布時(shí)間,同時(shí)也帶有該用戶的粉絲列表。

      其次是邊的生成。由于我們所獲取的推文是在關(guān)鍵字搜索下得到的,因而傳統(tǒng)的轉(zhuǎn)發(fā)關(guān)系不能很好地描述我們?cè)掝}數(shù)據(jù)庫(kù)中的所有信息,因而在這個(gè)信息傳播網(wǎng)絡(luò)中,我們需要重新定義一種關(guān)系來(lái)描述信息的傳播,結(jié)合社交網(wǎng)絡(luò)的實(shí)際:Twitter用戶發(fā)推往往受其關(guān)注者發(fā)推影響,我們對(duì)于每一條用戶發(fā)的推文,都去查詢:是否這個(gè)用戶的關(guān)注者中在不久前發(fā)布了同樣話題的推文。具體來(lái)說(shuō),在信息傳播網(wǎng)絡(luò)中,對(duì)于一個(gè)節(jié)點(diǎn)A,我們進(jìn)行以下處理:

      初始化最相鄰時(shí)間tnearest,遍歷數(shù)據(jù)庫(kù),對(duì)于每一條推文B(對(duì)應(yīng)網(wǎng)絡(luò)的一個(gè)節(jié)點(diǎn)),

      (1)查詢A對(duì)應(yīng)的用戶ua是否在B對(duì)應(yīng)用戶ub的粉絲列表中,如果是,執(zhí)行(2);否則,跳過(guò)該節(jié)點(diǎn),繼續(xù)查詢下一條推文

      (2)比較B對(duì)應(yīng)的推文發(fā)布時(shí)間tb與最相鄰時(shí)間tnearest(初始值設(shè)定為早于ta的某個(gè)時(shí)間),若tnearest

      在遍歷完整個(gè)數(shù)據(jù)庫(kù)后,我們就找到了節(jié)點(diǎn)A對(duì)應(yīng)用戶關(guān)注者中最新發(fā)布相同話題的用戶IDidnearest_time,在節(jié)點(diǎn)A和idnearest_time對(duì)應(yīng)的節(jié)點(diǎn)之間我們生成一條邊。

      對(duì)每一個(gè)節(jié)點(diǎn)都進(jìn)行上述處理,我們信息傳播網(wǎng)絡(luò)中的邊就由此生成。

      2.2 拓?fù)渚W(wǎng)絡(luò)特性分析

      由于我們所獲取的推文來(lái)自同一個(gè)話題,推文用戶本身并沒(méi)有特殊的聯(lián)系,因而網(wǎng)絡(luò)應(yīng)該由各個(gè)不同的小網(wǎng)絡(luò)構(gòu)成,每個(gè)小網(wǎng)絡(luò)中的節(jié)點(diǎn)用戶都或多或少存在關(guān)注與被關(guān)注的關(guān)系,其中還存在很多單個(gè)節(jié)點(diǎn),這些節(jié)點(diǎn)在我們所得的數(shù)據(jù)庫(kù)信息中是單獨(dú)的,不存在互相關(guān)注的關(guān)系。我們根據(jù)話題數(shù)據(jù)庫(kù)構(gòu)建的話題傳播網(wǎng)絡(luò)也驗(yàn)證了這一點(diǎn),整個(gè)網(wǎng)絡(luò)由一個(gè)個(gè)連通分支構(gòu)成,從話題傳播網(wǎng)絡(luò)中可以直觀地發(fā)現(xiàn):網(wǎng)絡(luò)中最多的是直徑為1(兩個(gè)節(jié)點(diǎn)的連通分支)的連通分支,而直徑特別大的連通分支數(shù)很少,連通分支的數(shù)量隨著直徑(節(jié)點(diǎn)數(shù)目)的增長(zhǎng)而急劇減少。

      之后我們定量分析拓?fù)渚W(wǎng)絡(luò)特征,分別針對(duì)三個(gè)不同的話題網(wǎng)絡(luò)統(tǒng)計(jì)了其聯(lián)通分支的節(jié)點(diǎn)數(shù)目和直徑分布(圖1-圖3)。

      我們可以直觀地看出,直徑很大或者節(jié)點(diǎn)數(shù)目很多的連通分支數(shù)量很少,大多數(shù)都是直徑為1或者說(shuō)節(jié)點(diǎn)數(shù)目為2的連通分支,直徑分布和節(jié)點(diǎn)數(shù)目分布圖呈現(xiàn)冪律分布的特征。

      2.3 驗(yàn)證冪律分布

      如果樣本數(shù)據(jù)滿足冪律分布,那么對(duì)其橫縱坐標(biāo)都取對(duì)數(shù),即在雙對(duì)數(shù)坐標(biāo)下,冪律分布表現(xiàn)為一條斜率為冪指數(shù)的負(fù)數(shù)的直線,我們以直徑分布為例,將傳播路徑網(wǎng)絡(luò)的直徑分布圖轉(zhuǎn)換為雙對(duì)數(shù)坐標(biāo),之后對(duì)散點(diǎn)圖進(jìn)行線性擬合,得到每個(gè)話題傳播網(wǎng)絡(luò)連通分支直徑分布的雙對(duì)數(shù)曲線,分別如圖4到圖6所示。我們可以看到,在雙對(duì)數(shù)坐標(biāo)下,直徑分布幾乎可被完美擬合為一條負(fù)斜率直線,因而,我們可以得出結(jié)論,話題傳播路徑網(wǎng)絡(luò)的連通分支直徑分布滿足冪律分布。

      2.4 “離群點(diǎn)”與流言判別

      2.4.1 “離群點(diǎn)”檢測(cè)

      在樣本空間中,與其他的樣本點(diǎn)的一般行為或者特征不一致的點(diǎn),我們稱為離群點(diǎn)。在這里,我們把雙對(duì)數(shù)曲線中明顯偏離擬合直線的點(diǎn)稱之為“離群點(diǎn)”,例如圖6中的第四個(gè)點(diǎn),它明顯偏離擬合曲線,我們稱之為“離群點(diǎn)”。那么,如何確定這樣的“離群點(diǎn)”呢?

      在聚類(lèi)分析中,離群點(diǎn)檢測(cè)常用的方法包括基于統(tǒng)計(jì)分布的離群點(diǎn)檢測(cè)、基于距離的離群點(diǎn)檢測(cè)、基于密度的局部離群點(diǎn)檢測(cè)、基于偏差的離群點(diǎn)檢測(cè)等。

      基于統(tǒng)計(jì)分布的離群點(diǎn)檢測(cè):這一類(lèi)離群點(diǎn)檢測(cè)方法首先假設(shè)樣本空間中所有的數(shù)據(jù)符合某一個(gè)分布或者某一個(gè)數(shù)據(jù)模型,之后基于模型或者分布采用不和諧校驗(yàn)的方法來(lái)識(shí)別離群點(diǎn)。這種離群點(diǎn)檢測(cè)方法需要我們預(yù)先知道樣本空間中的數(shù)據(jù)結(jié)構(gòu)的分布特征,這在檢測(cè)之前我們往往無(wú)法獲知。

      基于距離的離群點(diǎn)檢測(cè):這種檢測(cè)方法定義如果在樣本空間S中與對(duì)象O的距離大于d的至少有N個(gè)樣本點(diǎn),那么我們稱這個(gè)對(duì)象O是以N(指至少N個(gè)樣本點(diǎn))和d為參數(shù)的基于距離的離群點(diǎn)。這種檢測(cè)方法需要數(shù)據(jù)均勻分布,如果數(shù)據(jù)分布不均勻,那么可能檢測(cè)就會(huì)遇到困難。

      基于密度的局部離群點(diǎn)檢測(cè):定義如果某個(gè)對(duì)象屬于局部離群點(diǎn),那么相對(duì)于它自己的局部領(lǐng)域,它是遠(yuǎn)離的。區(qū)別于前兩種方法,基于密度的局部離群點(diǎn)檢測(cè)不將離群點(diǎn)看成是二元性質(zhì)的點(diǎn),換句話說(shuō),不僅僅是判斷一個(gè)點(diǎn)是否離群點(diǎn),而是有一個(gè)權(quán)值來(lái)描述離群程度,它可以應(yīng)用到樣本分布不均勻的情況下。

      基于偏差的離群點(diǎn)檢測(cè):這種方法通過(guò)檢查對(duì)象的特征,查看其是否有“偏差”的特征,通過(guò)這種方法來(lái)判別是否為離群點(diǎn)。

      對(duì)圖3中的三個(gè)樣本分別進(jìn)行“離群點(diǎn)”檢測(cè),我們發(fā)現(xiàn)圖4和圖5不存在離群點(diǎn),而圖6的第四個(gè)點(diǎn)為離群點(diǎn),這與我們對(duì)圖像的直觀印象相符。

      2.4.2 流言判別與溯源

      研究表明,公共信息的相關(guān)分布符合冪律分布,不存在2.4.1中定義的“離群點(diǎn)”。上一步我們基于距離檢測(cè),對(duì)每一個(gè)話題的樣本空間進(jìn)行了檢測(cè),關(guān)鍵字話題FlyDubai、MakeTVShowsEvil的樣本空間中不存在“離群點(diǎn)”,那么我們認(rèn)為這兩個(gè)話題為公共信息,存在流言的可能性很低。而對(duì)于話題BroadwayACeleb,存在一個(gè)“離群點(diǎn)”,那么我們認(rèn)為該話題下存在流言,且流言極大可能性存在于“離群點(diǎn)”所在的連通分支中,我們以”離群點(diǎn)”到擬合直線的距離為衡量標(biāo)準(zhǔn),距離越大,那么”離群點(diǎn)”越偏離擬合曲線,流言的可能性也越大。這樣,我們就將可能流言從公共信息中判別出來(lái)了,并指出了流言的來(lái)源分支。

      3 總結(jié)

      本文主要針對(duì)當(dāng)前熱門(mén)社交網(wǎng)絡(luò)平臺(tái)Twitter,以三個(gè)樣本話題為例,獲取真實(shí)社交網(wǎng)絡(luò)數(shù)據(jù),再進(jìn)一步的將原始數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到信息傳播網(wǎng)絡(luò)構(gòu)建所需的用戶信息、用戶關(guān)系信息,建立相關(guān)的話題數(shù)據(jù)庫(kù)。之后,提出了一種新的信息傳播網(wǎng)絡(luò)的構(gòu)建方法,基于此方法構(gòu)建了網(wǎng)絡(luò)信息傳播網(wǎng)絡(luò)?;诰W(wǎng)絡(luò)信息傳播網(wǎng)絡(luò)的拓?fù)涮卣鞣治?,本文主要定量分析了話題信息傳播網(wǎng)絡(luò)連通分支的節(jié)點(diǎn)數(shù)目和直徑分布,提出了通過(guò)檢測(cè)其連通分支節(jié)點(diǎn)數(shù)目或直徑分布是否滿足冪律分布來(lái)判別流言的方法,對(duì)存在“離群點(diǎn)”的,通過(guò)檢測(cè)“離群點(diǎn)”的方法來(lái)溯源流言。經(jīng)實(shí)驗(yàn)研究,該方法與現(xiàn)實(shí)世界演化趨勢(shì)相一致,證明了其對(duì)流言判別方向的啟發(fā)性作用,有助于社交網(wǎng)絡(luò)流言的判別與溯源。

      參考文獻(xiàn):

      [1] Tong H, Papadimitriou S, Philip Y et al. Fast monitoring proximity and centrality on time-evolving bipartite graphs[J]. Statistic Analysis on Data Mining, 2008, 1: 142-156.

      [2] Ghoshal G, Zlatic V, Caldarelli G et al. Random hypergraphs and their applications. Phys Rev E, 2009, 79: 066118.

      [3] 張彥超,劉云,張海峰,等.基于在線社交網(wǎng)絡(luò)的信息傳播模型[J]. 物理學(xué)報(bào)2011,5:050501(1-8).

      [4] 趙遠(yuǎn)萍.即時(shí)通信系統(tǒng)拓?fù)浣<跋鞑ツP脱芯縖D].北京:北京郵電大學(xué),2010.

      [5] Sznajd W K,Sznajd .A simple model of price formation[J] .Int.J.Mod.Phys.C ,2000: 1157

      [6] 熊熙,胡勇,等. 基于社交網(wǎng)絡(luò)的觀點(diǎn)傳播動(dòng)力學(xué)研究 物理學(xué)報(bào)[J], 2012,15: 10-110.

      [7] Hethcote H. The mathematics of infectious diseases[J]. SI-AM Rev, 2000, 42: 599-653.

      【通聯(lián)編輯:梁書(shū)】

      猜你喜歡
      傳播路徑社交網(wǎng)絡(luò)流言
      在網(wǎng)絡(luò)流言的驚濤駭浪中,權(quán)威媒體如何做好“定海神針”
      真相在真相里活著
      高校思想政治教育“正能量”傳播的路徑研究
      都市報(bào)傳播城市文化的創(chuàng)新路徑
      新媒體時(shí)代科普類(lèi)微博的傳播路徑探析
      網(wǎng)民介入公共政策傳播的路徑及其風(fēng)險(xiǎn)規(guī)避
      流言分析:本性與控制
      罗源县| 江西省| 丽江市| 陆丰市| 东阿县| 抚州市| 张北县| 原阳县| 通许县| 大方县| 本溪市| 海林市| 武安市| 巩义市| 大港区| 紫金县| 长顺县| 明光市| 麟游县| 平谷区| 砀山县| 秦安县| 尚志市| 仙桃市| 历史| 康保县| 石阡县| 博爱县| 都江堰市| 徐闻县| 江口县| 张家口市| 凌云县| 布拖县| 望江县| 蓝田县| 托克逊县| 菏泽市| 金川县| 临安市| 拉萨市|