• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      利用社交網(wǎng)絡(luò)的影響力骨架探索信息傳播

      2016-05-04 03:11:26黃俊銘沈華偉程學(xué)旗
      中文信息學(xué)報(bào) 2016年2期
      關(guān)鍵詞:出度骨架影響力

      黃俊銘, 沈華偉, 程學(xué)旗

      (中國科學(xué)院 計(jì)算技術(shù)研究所,中國科學(xué)院網(wǎng)絡(luò)數(shù)據(jù)科學(xué)與技術(shù)重點(diǎn)實(shí)驗(yàn)室,北京 100190)

      利用社交網(wǎng)絡(luò)的影響力骨架探索信息傳播

      黃俊銘, 沈華偉, 程學(xué)旗

      (中國科學(xué)院 計(jì)算技術(shù)研究所,中國科學(xué)院網(wǎng)絡(luò)數(shù)據(jù)科學(xué)與技術(shù)重點(diǎn)實(shí)驗(yàn)室,北京 100190)

      理解社交網(wǎng)絡(luò)上的信息傳播機(jī)制,通常包括對拓?fù)浣Y(jié)構(gòu)的分析和對用戶行為的分析。由于社交網(wǎng)絡(luò)上連邊的強(qiáng)度具有異質(zhì)性,只有一部分連邊對于信息傳播有實(shí)質(zhì)作用,構(gòu)成隱藏在社交網(wǎng)絡(luò)中的影響力骨架。對影響力骨架的拓?fù)溲芯靠蓭椭覀儷@得比直接研究社交網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)更深入的認(rèn)識。我們從連邊正負(fù)性和個(gè)體節(jié)點(diǎn)角色分化入手,探討了微觀層面連邊和節(jié)點(diǎn)在信息傳播中的作用,進(jìn)而從宏觀層面分析信息傳播所依賴的影響力骨架的連通性和擴(kuò)散效率,發(fā)現(xiàn)信息傳播具有一定程度的脆弱性,且其傳播效率低于對社交網(wǎng)絡(luò)本身研究的預(yù)期。

      信息傳播;社交網(wǎng)絡(luò);影響力骨架

      1 引言

      近年來社交網(wǎng)絡(luò)的飛速發(fā)展,海量的信息通過社交網(wǎng)絡(luò)分發(fā)、共享和傳播,對大規(guī)模人群的線上和線下生活產(chǎn)生不可忽視的影響。例如,人們在Twitter和新浪微博上傳播身邊的新聞,或是在Facebook和豆瓣上交換對于音樂的看法。隨著社交網(wǎng)絡(luò)上的信息傳播逐漸衍生為蘊(yùn)含豐富價(jià)值的大數(shù)據(jù)來源,利用信息傳播數(shù)據(jù)預(yù)測政治[1]、分析金融[2]、指導(dǎo)市場營銷[3]、預(yù)警疾病傳播[4]等數(shù)據(jù)挖掘應(yīng)用逐漸興起,使得理解信息傳播的機(jī)制成為具有兼具研究價(jià)值和現(xiàn)實(shí)意義的重要問題[5]。

      對信息傳播的分析通常包括基于拓?fù)浣Y(jié)構(gòu)的分析和基于行為歷史的分析。一些研究者分析社交網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)對于信息傳播的速度、范圍、廣度等指標(biāo)的影響,希望尋找對信息傳播具有指導(dǎo)性意義的網(wǎng)絡(luò)拓?fù)錂C(jī)制,例如,探討復(fù)雜網(wǎng)絡(luò)的小世界性質(zhì)對信息傳播速度的影響[6],利用信息傳播隨機(jī)跳轉(zhuǎn)的平穩(wěn)分布尋找關(guān)鍵節(jié)點(diǎn)[7],討論結(jié)構(gòu)洞節(jié)點(diǎn)對于信息傳播的影響[8],揭示局部拓?fù)浣Y(jié)構(gòu)的多樣性對于個(gè)體信息傳播的決定性作用[9],分析信息傳播早期人群局部拓?fù)湫再|(zhì)[10]等。另一些研究者對社交網(wǎng)絡(luò)中信息傳播參與者的行為歷史進(jìn)行大規(guī)模分析以尋找信息傳播的統(tǒng)計(jì)規(guī)律,例如,通過信息傳播歷史估計(jì)信息傳播概率[11-14],討論用戶評價(jià)對于信息傳播的影響[15],分析不同性別、年齡等人口學(xué)因素對信息傳播的差異化作用[16],擬合新信息隨時(shí)間衰減的趨勢[17],評估信息傳播中蘊(yùn)含的信任程度[18]等。對拓?fù)浣Y(jié)構(gòu)和行為歷史的分析,從不同側(cè)面豐富了對信息傳播機(jī)制的定性認(rèn)識,能夠更準(zhǔn)確地指導(dǎo)針對信息傳播的定量應(yīng)用。

      然而,作為兩種主流分析方法之一的拓?fù)浣Y(jié)構(gòu)分析,目前幾乎所有的工作都集中于分析社交網(wǎng)絡(luò)本身的拓?fù)浣Y(jié)構(gòu)。事實(shí)上,社交網(wǎng)絡(luò)中連接人與人的連邊并不是全同的,而是具有非常顯著的異質(zhì)性,不同的連邊有不同程度的信任和影響力[19]。事實(shí)上,只有一小部分邊表達(dá)了顯著的信任和影響(稱為影響力邊),能夠在實(shí)質(zhì)上推動信息傳播。我們相信,由影響力邊所構(gòu)成的社交網(wǎng)絡(luò)的子圖(稱為影響力骨架)的拓?fù)浣Y(jié)構(gòu)提供了更精確了解信息傳播機(jī)制的拓?fù)渫緩?。相比于對社交網(wǎng)絡(luò)所有連邊不加區(qū)分地合并分析,集中討論影響力骨架或許能夠提供更深入的認(rèn)識。因此,本文我們試圖從真實(shí)的社交網(wǎng)絡(luò)中提取影響力骨架,以之作為實(shí)證分析信息傳播的拓?fù)浣Y(jié)構(gòu)的載體。

      我們首先從微觀角度入手,利用社會平衡理論與度分化現(xiàn)象分析連邊和節(jié)點(diǎn)在信息傳播中的角色,探討了影響力邊的正負(fù)性和個(gè)體節(jié)點(diǎn)的主導(dǎo)者/追隨者兩種角色的分化現(xiàn)象。在微觀討論的基礎(chǔ)上,我們從宏觀層面分析影響力骨架的連通能力與擴(kuò)散效率,發(fā)現(xiàn)信息傳播對于關(guān)鍵節(jié)點(diǎn)的依賴程度與信息傳播的擴(kuò)散效率都與此前對社交網(wǎng)絡(luò)研究的結(jié)果存在顯著差異,被低估的脆弱性和被高估的傳播效率使得我們意識到需要重新審視基于信息傳播的各種量化應(yīng)用。

      2 提取影響力骨架

      2.1 數(shù)據(jù)準(zhǔn)備

      我們采集了結(jié)合在線社交網(wǎng)絡(luò)和在線分享的網(wǎng)站豆瓣網(wǎng)(www.Douban.com) 和Goodreads(www.Goodreads.com)的數(shù)據(jù)作為觀測對象。在這兩個(gè)網(wǎng)站上,用戶可以對電影、音樂和書籍評分,并關(guān)注其他用戶的行為。用戶之間的關(guān)注關(guān)系構(gòu)成了社交網(wǎng)絡(luò),而對電影、音樂和書籍(統(tǒng)稱為對象)的評分意見作為信息在這一社交網(wǎng)絡(luò)上傳播(數(shù)據(jù)抓取于2010年8月)。我們從網(wǎng)站上若干個(gè)熱門討論組開始,抓取討論組成員的行為數(shù)據(jù),并擴(kuò)展到關(guān)注這些成員以及被他們關(guān)注的用戶,迭代直到不再能擴(kuò)展到新的未抓取用戶。我們一共抓取了1 014 890位豆瓣用戶和912 973位Goodreads用戶,并移除了關(guān)注者少于五個(gè)或評分少于五次的不活躍用戶,因?yàn)檫@些用戶的可用數(shù)據(jù)太少,無法提供穩(wěn)定的統(tǒng)計(jì)結(jié)果。清洗整理后的數(shù)據(jù)如表1所示。

      表1 采集數(shù)據(jù)說明

      2.2 影響力骨架提取算法

      (1)

      表2 影響力骨架的統(tǒng)計(jì)

      3 利用影響力骨架分析信息傳播

      3.1 影響力邊的正負(fù)性

      我們首先從符號網(wǎng)絡(luò)的角度分析影響力邊的正負(fù)性。符號網(wǎng)絡(luò)理論將網(wǎng)絡(luò)中的連邊分為表達(dá)積極關(guān)系的正邊和表達(dá)消極關(guān)系的負(fù)邊,許多復(fù)雜網(wǎng)絡(luò)中都存在正負(fù)邊對立的現(xiàn)象。理解影響力邊的正負(fù)性對于預(yù)測信息傳播有重要的理論意義。若影響力是正關(guān)系,則信息傳播的效果是讓群體意見趨向一致。若影響力是負(fù)關(guān)系,則信息傳播的效果是讓群體分裂成多個(gè)意見集團(tuán)。

      我們計(jì)算了影響力骨架的連邊互惠系數(shù),較高的互惠系數(shù)是正邊的標(biāo)識之一。雖然兩個(gè)數(shù)據(jù)集上的影響力骨架的互惠系數(shù)相比于原網(wǎng)絡(luò)有大幅度降低,但仍然高于隨機(jī)抽取相同大小的隨機(jī)子圖的互惠系數(shù),如表2所示。進(jìn)一步地,我們利用社會平衡理論[22]檢驗(yàn)影響力骨架中的三角形統(tǒng)計(jì)。社會平衡理論認(rèn)為,如果三個(gè)個(gè)體之間的三條連邊全為正關(guān)系,則這個(gè)三角形處于平衡態(tài),可以穩(wěn)定存在;反之若全為負(fù)關(guān)系則難以穩(wěn)定存在。在影響力骨架中,任意三個(gè)用戶之間的影響力若能構(gòu)成三角形,無外乎傳遞(a->b,b->c,a->c)和循環(huán)(a->b,b->c,c->a)兩種情況(若存在雙向邊,視為構(gòu)成兩個(gè)不同的三角形)。我們將影響力邊全部隨機(jī)重連,計(jì)算100次隨機(jī)實(shí)驗(yàn)中這兩種三角形在隨機(jī)狀態(tài)下的期望個(gè)數(shù),與實(shí)際影響力骨架中兩種三角形的個(gè)數(shù)相比。若一種三角形的實(shí)際個(gè)數(shù)遠(yuǎn)大于期望個(gè)數(shù),表明這種三角形能穩(wěn)定存在,反之則表明不能穩(wěn)定存在。

      如表3所示,兩種三角的實(shí)際個(gè)數(shù)都遠(yuǎn)遠(yuǎn)大于期望個(gè)數(shù)。以z-score度量的顯著水平表明這一現(xiàn)象并非由于隨機(jī)誤差導(dǎo)致,而是由于影響力骨架中的三角形處于平衡態(tài),從而能大量穩(wěn)定存在。這表明影響力邊表征了用戶之間的正關(guān)系,信息傳播的結(jié)果是使得相鄰個(gè)體的態(tài)度趨向一致。

      表3 社會平衡理論檢驗(yàn)影響力邊的正負(fù)性

      3.2 個(gè)體角色分化

      信息傳播中的個(gè)體作為社交網(wǎng)絡(luò)上的節(jié)點(diǎn),度中心度對于理解個(gè)體在信息傳播中的地位有較好的指示作用。在原社交網(wǎng)絡(luò)中,由于互惠系數(shù)較高,大部分節(jié)點(diǎn)的出度入度幾乎相等。而在互惠系數(shù)大幅降低的影響力骨架中,節(jié)點(diǎn)的出度和入度產(chǎn)生了明顯的分化,這種分化表明了個(gè)體在信息傳播中處于不同的地位。

      圖1為每個(gè)節(jié)點(diǎn)的出度-入度分布圖。在豆瓣和Goodreads兩個(gè)社交網(wǎng)絡(luò)中可以看到一個(gè)明顯的趨勢,大部分樣本點(diǎn)集中在y=x直線附近,其出度與入度表現(xiàn)出強(qiáng)烈的相關(guān)性,表明大部分節(jié)點(diǎn)傾向于保持相等的出度和入度。在影響力骨架中幾乎不存在這一趨勢,很多樣本點(diǎn)分布在遠(yuǎn)離y=x直線的位置,表明影響力骨架中相當(dāng)一部分節(jié)點(diǎn)的出度入度是嚴(yán)重不平衡的。為了更清晰地展示這一趨勢,我們對每個(gè)節(jié)點(diǎn)計(jì)算其出度入度之比的對數(shù)。如圖2所示,在兩個(gè)社交網(wǎng)絡(luò)中大部分節(jié)點(diǎn)集中在對數(shù)為0的位置,表明其出度入度基本一致。而在兩個(gè)影響力骨架中,雖然仍有不少節(jié)點(diǎn)集中在對數(shù)為0的位置,但兩側(cè)有明顯的多個(gè)分布峰,表明有相當(dāng)一部分節(jié)點(diǎn)的出度遠(yuǎn)大于入度,亦有相當(dāng)一部分節(jié)點(diǎn)的入度遠(yuǎn)大于出度。這一普遍的不平衡性現(xiàn)象背后是節(jié)點(diǎn)角色的分化。出度遠(yuǎn)大于入度的節(jié)點(diǎn),對應(yīng)的用戶能夠?qū)σ欢〝?shù)量的人群產(chǎn)生實(shí)質(zhì)影響,同時(shí)自己受到他人的影響較小,在社交網(wǎng)絡(luò)上的信息傳播中常常扮演主導(dǎo)者的角色。與之對稱的,入度遠(yuǎn)大于出度的節(jié)點(diǎn),對應(yīng)的用戶會受到較多人的影響,而自己影響他人的能力有限,在信息傳播中常常扮演追隨者的角色。這兩類人群的分化,使得信息能夠有效地從主導(dǎo)者傳播到追隨者,構(gòu)成了信息擴(kuò)散的微觀機(jī)制。

      圖1 原社交網(wǎng)絡(luò)和影響力骨架的出度-入度分布圖

      圖2 節(jié)點(diǎn)出度入度之比的對數(shù)分布

      圖 2(續(xù))

      為了進(jìn)一步分析這種不平衡性,我們選擇出度為某一特定值的節(jié)點(diǎn)計(jì)算其平均入度,畫出平均入度關(guān)于出度分布的散點(diǎn)圖,以分析給定影響力能力的人群受到影響的程度。毫無意外地,兩個(gè)社交網(wǎng)絡(luò)的分布圖集中在y=x一線,即平均入度嚴(yán)格隨出度遞增,不再贅述。圖3左側(cè)兩圖給出了兩個(gè)影響力骨架上的分布情況??梢钥吹剑S著出度的增加,平均入度并沒有表現(xiàn)出相應(yīng)地增加,而是始終穩(wěn)定在一定水平線以下。豆瓣數(shù)據(jù)中,任何出度的節(jié)點(diǎn)的平均入度都在10以下。Goodreads數(shù)據(jù)中,任何出度的節(jié)點(diǎn)的平均入度穩(wěn)定在10左右(雖然較大出度的節(jié)點(diǎn)由于樣本數(shù)量少產(chǎn)生波動)。這表明,對具有任何程度影響力的人來說,能影響他的人數(shù)始終是有限的。對于影響力較大的人,雖然其關(guān)注的人相應(yīng)地較多(原社交網(wǎng)絡(luò)中入度隨出度遞增),但是他所關(guān)注的人中能夠?qū)嵸|(zhì)影響他的人并不多。我們認(rèn)為這是因?yàn)閭€(gè)體的信息處理能力是有限的,從而只能維持一個(gè)較小規(guī)模的信任對象群體,而不可能呈現(xiàn)無上界的線性增長。

      相應(yīng)地,我們也選擇入度為某一特定值的節(jié)點(diǎn)計(jì)算其平均出度,畫出平均出度關(guān)于入度分布的散點(diǎn)圖,以分析給定受影響傾向的人群所具有的影響力。圖3右側(cè)兩圖給出了兩個(gè)影響力骨架上的分布情況。平均出度關(guān)于入度的分布在兩個(gè)數(shù)據(jù)集上表現(xiàn)出不同的趨勢。豆瓣表現(xiàn)出較弱的負(fù)相關(guān)性,入度越大的節(jié)點(diǎn)的平均出度越低, 表明容易受影響的用戶的影響力較弱。與之相反,Goodreads表現(xiàn)出一定程度的正相關(guān)性,入度越大的節(jié)點(diǎn)的平均出度越大,表明Goodreads社區(qū)中有較多的樞紐節(jié)點(diǎn)。這些樞紐節(jié)點(diǎn)具有較強(qiáng)的信息轉(zhuǎn)發(fā)能力,既能受到多個(gè)來源的影響,又能利用自己的高影響力將信息擴(kuò)散出去。

      3.3 傳播拓?fù)?/p>

      在個(gè)體角色的微觀分析基礎(chǔ)上,我們進(jìn)一步考察網(wǎng)絡(luò)的拓?fù)溥B通性,以便在宏觀層面討論信息傳播。我們在社交網(wǎng)絡(luò)和影響力骨架上分別隨機(jī)選擇一個(gè)節(jié)點(diǎn),將其五階以內(nèi)的鄰居節(jié)點(diǎn)構(gòu)成的子圖作為局部切片,在一定程度上提供對網(wǎng)絡(luò)連通性的直觀認(rèn)識。在豆瓣和Goodreads上重復(fù)多次實(shí)驗(yàn),所得切片結(jié)構(gòu)類似,篇幅所限僅在圖4中列出Good-reads的兩個(gè)切片。

      從圖4中可以看到,Goodreads社交網(wǎng)絡(luò)的局部切片呈現(xiàn)出明顯的復(fù)連通性質(zhì),任何兩個(gè)節(jié)點(diǎn)之間都有多條路徑可達(dá)。這是社交網(wǎng)絡(luò)作為復(fù)雜網(wǎng)絡(luò)的典型特征,路徑的冗余程度保證了連通能力的魯棒性,隨機(jī)移除少量節(jié)點(diǎn)并不會嚴(yán)重破壞網(wǎng)絡(luò)的連通性。同時(shí),節(jié)點(diǎn)之間的相對地位是模糊的,缺乏清晰的拓?fù)浣Y(jié)構(gòu)。與之形成鮮明對比的是,影響力骨架的局部切片表現(xiàn)出清晰的層級關(guān)系,接近于單連通的樹狀結(jié)構(gòu),絕大多數(shù)節(jié)點(diǎn)只有一個(gè)父節(jié)點(diǎn),任意兩個(gè)節(jié)點(diǎn)之間通常只有一條路徑。可以很容易把這一切片分成若干個(gè)小團(tuán)體, 每個(gè)小團(tuán)體是一個(gè)典型的星型結(jié)構(gòu),由一個(gè)中心節(jié)點(diǎn)和一組邊緣節(jié)點(diǎn)構(gòu)成。中心節(jié)點(diǎn)在小團(tuán)體中的重要地位遠(yuǎn)遠(yuǎn)超過邊緣節(jié)點(diǎn),一方面它是連接外部的主要(常常是唯一)通道,承擔(dān)整個(gè)小團(tuán)體的信息外源角色,另一方面它是連接內(nèi)部各個(gè)節(jié)點(diǎn)的橋節(jié)點(diǎn),承擔(dān)小團(tuán)體的內(nèi)部交互功能。

      圖3 影響力骨架中,固定出度/入度的節(jié)點(diǎn)的平均入度/出度值(a)和(b):豆瓣;(c)和(d):Goodreads

      圖4 Goodreads社交網(wǎng)絡(luò)(上圖)和影響力骨架(下圖)的局部切片

      這兩個(gè)切片的顯著對比引發(fā)了我們對社交網(wǎng)絡(luò)的信息傳播能力的思考。從表面上看,社交網(wǎng)絡(luò)上的信息傳播的途徑是冗余而多樣化的,具有很強(qiáng)的魯棒性。但由于很多連邊并不具有實(shí)質(zhì)影響的能力,真實(shí)的信息傳播是沿著樹狀結(jié)構(gòu)的層級進(jìn)行的。信息在一個(gè)個(gè)小團(tuán)體之間傳遞,很多情況下信息必須到達(dá)每個(gè)小團(tuán)體的中心節(jié)點(diǎn)才能接觸到圍繞在其周圍的邊緣節(jié)點(diǎn)。這些中心節(jié)點(diǎn)作為結(jié)構(gòu)洞大量存在,導(dǎo)致信息傳播嚴(yán)重依賴于這類節(jié)點(diǎn)。這提醒我們,真實(shí)信息傳播的抗干擾能力并不像直接分析社交網(wǎng)絡(luò)所表現(xiàn)出來的那么強(qiáng),事實(shí)上只需要識別出具有結(jié)構(gòu)洞地位的局部中心節(jié)點(diǎn)就能有針對性地對信息傳播發(fā)起有效攻擊、監(jiān)測和干預(yù)。

      3.4 傳播效率

      圖5 豆瓣(左)和Goodreads(右)的社交網(wǎng)絡(luò)(圓圈)和影響力骨架(十字)的節(jié)點(diǎn)出度分布

      圖6 豆瓣(左)和Goodreads(右)的社交網(wǎng)絡(luò)(實(shí)線)和影響力骨架(虛線)的節(jié)點(diǎn)覆蓋率,即出度排序靠前的一部分節(jié)點(diǎn)(橫軸)的出邊所能覆蓋的節(jié)點(diǎn)數(shù)(縱軸)

      信息傳播的效率是信息傳播分析的重要尺度。能否從少量節(jié)點(diǎn)出發(fā)讓信息覆蓋大部分節(jié)點(diǎn),體現(xiàn)了信息傳播的效率,構(gòu)成了病毒式營銷等各種應(yīng)用的基礎(chǔ)。在社交網(wǎng)絡(luò)中,節(jié)點(diǎn)的影響力通常被定義為節(jié)點(diǎn)作為信息源能夠把信息擴(kuò)散到的范圍大小。雖然社交網(wǎng)絡(luò)和影響力骨架都具有相同的度分布(如圖5所示,社交網(wǎng)絡(luò)和影響力骨架的節(jié)點(diǎn)出度分布都服從冪律分布且冪指數(shù)接近),但這并不保證它們具有相似的傳播效率。我們以大度節(jié)點(diǎn)的覆蓋能力作為網(wǎng)絡(luò)擴(kuò)散能力的度量。將社交網(wǎng)絡(luò)中的節(jié)點(diǎn)按出度排序,選擇出度最大的一部分節(jié)點(diǎn),觀察這些節(jié)點(diǎn)的出邊所能覆蓋的節(jié)點(diǎn)占全網(wǎng)的比例,類似于按出度選擇一組種子節(jié)點(diǎn)以激發(fā)病毒式營銷。我們看到,社交網(wǎng)絡(luò)上出度最大的20%的節(jié)點(diǎn)的出邊能夠覆蓋全網(wǎng)80%的節(jié)點(diǎn),表明社交網(wǎng)絡(luò)是一個(gè)直徑較小且大多數(shù)節(jié)點(diǎn)圍繞在大度節(jié)點(diǎn)周圍的網(wǎng)絡(luò)。這樣的網(wǎng)絡(luò)具有高效的傳播能力,符合20-80帕累托定律,只需借助20%的高影響力者就可以將信息擴(kuò)散到達(dá)80%的人群。然而,真實(shí)的信息傳播效率并沒有這么高。對影響力骨架進(jìn)行同樣的分析,我們發(fā)現(xiàn)影響力骨架中出度最大的20%的節(jié)點(diǎn)只能覆蓋到全網(wǎng)50%的節(jié)點(diǎn)。要覆蓋全網(wǎng)80%的節(jié)點(diǎn),我們需要動員出度排名靠前的60%的節(jié)點(diǎn)。影響力骨架較低的連邊密度和接近單連通的拓?fù)湫再|(zhì)是其主要因素。也就是說,要讓80%的人群“知道”某一觀點(diǎn),只需發(fā)動少量高影響力者即可,但要讓80%的人群“同意”某一觀點(diǎn),需要動員過半人群才能實(shí)現(xiàn)。這昂貴的動員成本表明,無論是病毒營銷還是輿論干預(yù),其真實(shí)難度都高于我們此前對社交網(wǎng)絡(luò)分析所得的認(rèn)識。

      5 小結(jié)

      社交網(wǎng)絡(luò)表征了信息傳播的基礎(chǔ)結(jié)構(gòu),而通過量化用戶之間影響力提取的影響力骨架則表征了信息傳播的功能。這兩個(gè)網(wǎng)絡(luò)在各方面存在一定的差異,表明了結(jié)構(gòu)與功能的不一致性。我們認(rèn)為影響力骨架體現(xiàn)了信息傳播的真實(shí)路徑和范圍,對其拓?fù)浣Y(jié)構(gòu)分析可以幫助我們更準(zhǔn)確地認(rèn)識社交網(wǎng)絡(luò)上的信息傳播的規(guī)律。我們首先從符號網(wǎng)絡(luò)的角度探討了信息借以傳播的影響力邊的正負(fù)性,利用社會平衡理論驗(yàn)證了影響力邊是正關(guān)系,指出信息傳播的結(jié)果是意見同步,即促使相鄰個(gè)體的態(tài)度趨向一致。在微觀層面,我們討論了個(gè)體在信息傳播中的角色分化,雖然社交網(wǎng)絡(luò)的高互惠系數(shù)導(dǎo)致絕大部分節(jié)點(diǎn)的出度入度平衡,難以劃分出清晰的角色。但在真實(shí)信息傳播中個(gè)體明顯分化為兩類不同的節(jié)點(diǎn),即出度遠(yuǎn)大于入度的主導(dǎo)者和入度遠(yuǎn)大于出度的追隨者,信息在這兩類個(gè)體之間的傳播構(gòu)成了信息的微觀傳播機(jī)制。同時(shí)我們發(fā)現(xiàn),對于任何個(gè)體,能真實(shí)影響到他的影響力來源總是有限的,這一現(xiàn)象可能歸因于個(gè)體接受信息的能力是有限的。在宏觀層面,我們討論了網(wǎng)絡(luò)的拓?fù)湫再|(zhì)對于信息傳播的影響。在冗余的復(fù)連通社交網(wǎng)絡(luò)上,真實(shí)信息傳播路徑更接近于單連通的樹狀結(jié)構(gòu),信息在大小不一的星型結(jié)構(gòu)小團(tuán)體之間跳轉(zhuǎn),存在相當(dāng)數(shù)量的結(jié)構(gòu)洞可以對信息傳播產(chǎn)生關(guān)鍵性影響。因此信息傳播的抗干擾能力是比較脆弱的,只需識別并控制結(jié)構(gòu)洞即可實(shí)現(xiàn)高效的攻擊和干預(yù)。最后我們討論了信息傳播效率。旨在“了解”的信息傳播符合傳統(tǒng)的20-80帕累托定律,只需動員20%的高影響力人群即可幫助信息到達(dá)80%的目標(biāo)人群,但旨在“說服”的信息傳播的效率較低,需要動員過半的高影響力人群才能讓80%的目標(biāo)人群接受一條信息,高昂的動員成本可能導(dǎo)致病毒營銷等信息傳播應(yīng)用的難度高于預(yù)期。

      [1] Robert M Bond,et al. A 61-million-person experiment in social influence and political mobilization [J]. Nature, 2012, 489(7415): 295-298.

      [2] Johan Bollen, Huina Mao. Twitter Mood as a Stock Market Predictor [J]. Computer, 2011, 44(10): 91-94.

      [3] David Kempe, Jon Kleinberg, Eva Tardos. Maximizing the spread of influence through a social network [C]//Proceedings of the 9th ACM SIGKDD international conference on knowledge discovery and data mining. Washington, D.C. 2003.

      [4] Jeremy Ginsberg,et al. Detecting influenza epidemics using search engine query data [J]. Nature, 2009. 457(7232): 1012-1014.

      [5] Jimeng Sun, Jie Tang. A Survey of Models and Algorithms for Social Influence Analysis [M]. Social Network Data Analytics. C. C. Aggarwal, Springer US, 2011: 177-214.

      [6] Lü Linyuan, Chen Duan-Bing, Zhou Tao. The small world yields the most effective information spreading [J]. New Journal of Physics, 2011, 13(12): 123005.

      [7] Lü Linyuan,et al. Leaders in Social Networks, the Delicious Case [J]. PLoS ONE, 2011, 6(6): e21202.

      [8] Jie Tang, Tiancheng Lou, Jon Kleinberg. Inferring social ties across heterogenous networks [C]//Proceedings of the 5th ACM international conference on Web search and data mining. Seattle, Washington, USA, ACM, 2012: 743-752.

      [9] Johan Ugander,et al. Structural diversity in social contagion [J]. Proceedings of the National Academy of Sciences, 2012, 109(16): 5962-5966.

      [10] Peng Bao,et al. Popularity prediction in microblogging network: a case study on sina weibo [C]//Proceedings of the 22nd international conference on World Wide Web companion, Rio de Janeiro, Brazil, 2013

      [11] Kazumi Saito,Ryohei Nakano, Masahiro Kimura. Prediction of Information Diffusion Probabilities for Independent Cascade Model [C]//Proceedings of the Knowledge-Based Intelligent Information and Engineering Systems. Springer Berlin Heidelberg. 2008: 67-75.

      [12] Amit Goyal, Francesco Bonchi, Laks V S Lakshmanan. Learning influence probabilities in social networks [C]//Proceedings of the 3rd ACM international conference on Web search and data mining, New York, USA, ACM, 2010.

      [13] Manuel Gomez-Rodriguez, Jure Leskovec, Andreas Krause. Inferring Networks of Diffusion and Influence [J]. ACM Trans. Knowl. Discov. Data, 2012, 5(4): 1-37.

      [14] Manuel Gomez-Rodriguez, et al. Structure and dynamics of information pathways in online media [C]//Proceedings of the 6th ACM international conference on Web search and data mining, Rome, Italy, ACM, 2013.

      [15] Paula Fitzgerald Bone. Word-of-mouth effects on short-term and long-term product judgments [J]. Journal of Business Research, 1995, 32(3): 213-223.

      [16] Sinan Aral, Dylan Walker. Identifying influential and susceptible members of social networks [J]. Science, 2012, 337(6092):337-341.

      [17] Fang Wu, Bernardo A. Huberman. Novelty and collective attention [J]. Proceedings of the National Academy of Sciences, 2007, 104(45): 17599-17601.

      [18] MeredithRingel Morris, et al. Tweeting is believing? understanding microblog credibility perceptions [C]//Proceedings of the ACM 2012 Conference on Computer Supported Cooperative Work. Seattle, Washington, USA, ACM, 2012.

      [19] Mark SGranovetter. The strength of weak ties [J]. American journal of sociology, 1973, 78(6): 1360-1380.

      [20] Junming Huang, et al. Exploring social influence via posterior effect of word-of-mouth recommendations [C]//Proceedings of the 5th ACM international conference on Web search and data mining. Seattle, Washington, USA, ACM, 2012.

      [21] Ruslan Salakhutdinov, Andriy Mnih. Probabilistic Matrix Factorization [J]. Advances in Neural Information Processing Systems 20. Cambridge, MA, MIT Press, 2008: 1257-1264.

      [22] Heider F. Attitudes and cognitive organization [J]. Journal of Psychology, 1946, 21(1):107-112.

      Understanding Information Propagations via Influence Backbone Analysis on Social Networks

      HUANG Junming, SHEN Huawei, CHENG Xueqi

      (CAS Key Lab of Network Data Science and Technology, Institute of Computing Technology, Chinese Academy Sciences, Beijing 100190, China)

      Understanding intrinsic mechanism of information propagations on social networks has attracted growing attention, including social network topology analysis and user behavior analysis. Due to the heterogeneity of links in social networks, only a portion of links significantly contribute to information propagations. The influence backbone of a social network, consisting of those links, might provide deeper insight to information propagations. Focused on the influence backbone, we analyzes the signs of links with social structural balance theory, and the roles of nodes with heterogeneous distributions of out-degrees, so as to find the roles played by links and nodes in information propagations in a microscopic. Furthermore, we investigate the network connectivity and information spread efficiency of the influence backbone, finding that information propagations are more fragile and less effective.

      information propagations; social networks; influence backbone

      黃俊銘(1984—),博士,主要研究領(lǐng)域?yàn)樾畔鞑?、社交網(wǎng)絡(luò)分析。E?mail:mail@junminghuang.com沈華偉(1982—),博士,副研究員、碩士生導(dǎo)師,主要研究領(lǐng)域?yàn)榫W(wǎng)絡(luò)科學(xué)、社會網(wǎng)絡(luò)分析、數(shù)據(jù)挖掘。E?mail:shenhuawei@ict.a(chǎn)c.cn程學(xué)旗(1971—),研究員、博士生導(dǎo)師,主要研究領(lǐng)域?yàn)榫W(wǎng)絡(luò)科學(xué)、網(wǎng)絡(luò)與信息安全、互聯(lián)網(wǎng)搜索與服務(wù)。E?mail:cxq@ict.a(chǎn)c.cn

      1003-0077(2016)02-0074-09

      2013-09-15 定稿日期: 2014-04-15

      國家基礎(chǔ)研究發(fā)展計(jì)劃(973)(2012CB316303,2013CB329602);國家自然科學(xué)基金(61232010,61202215);北京市自然科學(xué)基金(4122077)

      TP391

      A

      猜你喜歡
      出度骨架影響力
      淺談管狀骨架噴涂方法
      骨架密度對炭/炭多孔骨架壓力浸滲銅的影響
      天才影響力
      NBA特刊(2018年14期)2018-08-13 08:51:40
      黃艷:最深遠(yuǎn)的影響力
      3.15消協(xié)三十年十大影響力事件
      傳媒不可估量的影響力
      人間(2015年21期)2015-03-11 15:24:39
      羅通定口腔崩解片的溶出度研究
      內(nèi)支撐骨架封抽技術(shù)在突出煤層瓦斯抽采中的應(yīng)用
      中國煤層氣(2014年3期)2014-08-07 03:07:45
      阿莫西林克拉維酸鉀片溶出度對比研究
      鹽酸林可霉素片溶出度測定方法的研究
      凭祥市| 广州市| 阿尔山市| 崇阳县| 集安市| 乌苏市| 时尚| 遂宁市| 万安县| 五莲县| 石楼县| 黎平县| 南昌县| 玛沁县| 含山县| 中西区| 定陶县| 阿克陶县| 修水县| 榕江县| 阳江市| 枞阳县| 楚雄市| 曲沃县| 长兴县| 田林县| 三原县| 孙吴县| 东兰县| 富宁县| 墨玉县| 武乡县| 大名县| 将乐县| 黄梅县| 清远市| 南通市| 乐平市| 房产| 类乌齐县| 明星|