潛程浩,胡彥蓉,劉洪久,潘軍可
1.浙江農(nóng)林大學(xué) 信息工程學(xué)院,杭州 311300
2.浙江省林業(yè)智能監(jiān)測(cè)與信息技術(shù)研究重點(diǎn)實(shí)驗(yàn)室,杭州 311300
地方性網(wǎng)絡(luò)論壇作為一個(gè)重要的網(wǎng)絡(luò)輿情話題傳播平臺(tái),其主要目標(biāo)用戶擁有相同的地理位置和文化環(huán)境。這一特點(diǎn)使地方性論壇可以集中反映一地居民關(guān)注的熱點(diǎn)事件以及相關(guān)觀點(diǎn)態(tài)度。以杭州一地方性網(wǎng)絡(luò)論壇為例,諸如“杭州新的消費(fèi)券馬上就要來了”“鄰居遛狗給我?guī)淼臒馈边@樣的帖子遍布整個(gè)論壇。這些帖子無一不反映著普通民眾關(guān)注的熱點(diǎn)和相關(guān)態(tài)度。與此同時(shí),這類帖子在論壇中常年處于熱帖的狀態(tài)。這說明論壇中帶有地方性色彩的輿情話題在論壇用戶中具有很強(qiáng)影響力。鑒于互聯(lián)網(wǎng)的傳播速度與規(guī)模,再小的輿情話題,經(jīng)過發(fā)酵也有可能在網(wǎng)絡(luò)中造成巨大的社會(huì)影響。這就導(dǎo)致同樣帶有地方性色彩的不良信息(例如謠言)也能通過地方性網(wǎng)絡(luò)論壇給社會(huì)穩(wěn)定帶來危害。因此,為了對(duì)相關(guān)的輿情話題傳播進(jìn)行監(jiān)管,防止不良信息對(duì)當(dāng)?shù)厣鐣?huì)穩(wěn)定造成危害,對(duì)地方性網(wǎng)絡(luò)中熱點(diǎn)輿情話題的傳播機(jī)制和特點(diǎn)的研究便有了重要的實(shí)際意義。
當(dāng)前,國(guó)內(nèi)外對(duì)于輿情信息傳播機(jī)制的研究很多。主流的方法是通過改進(jìn)傳染病動(dòng)力學(xué)SIR模型建立新的輿情信息傳播模型來對(duì)其進(jìn)行研究。最早的傳染病SIR模型由Kermack和McKendrick提出[1],該模型將傳播節(jié)點(diǎn)分為易感者、傳播者和免疫者三類。后續(xù)的研究基本上都是以此為基礎(chǔ)進(jìn)行改進(jìn)進(jìn)行的。目前該領(lǐng)域的研究主要集中在以下三個(gè)方面:
(1)根據(jù)傳播的節(jié)點(diǎn)類型的不同,對(duì)模型的傳播節(jié)點(diǎn)的類型和數(shù)量進(jìn)行拓展。Zanette等人首先提出將復(fù)雜網(wǎng)絡(luò)中的節(jié)點(diǎn)分為了無知者、傳播者、移出者三種節(jié)點(diǎn)[2]。Xiong等人結(jié)合微博轉(zhuǎn)發(fā)行為的特點(diǎn),在傳播模型中加入了接觸者節(jié)點(diǎn),提出了SCIR信息傳播模型,并進(jìn)行了仿真實(shí)驗(yàn)[3]。張永等人在SIR模型的基礎(chǔ)上加入新的節(jié)點(diǎn),建立了基于轉(zhuǎn)發(fā)行為因素的SCIR模型[4]。張永等人考慮鄰居節(jié)點(diǎn)間的互相影響,加入了一個(gè)假免疫節(jié)點(diǎn),構(gòu)建了SDIR模型[5]。崔金棟等人綜合考慮了微博網(wǎng)絡(luò)中話題式信息的衍生特性,建立了H-SEIR模型[6]。
(2)根據(jù)實(shí)際情況中不同的信息傳播環(huán)境帶來的信息傳播的傳播機(jī)制的不同,對(duì)模型進(jìn)行改進(jìn)。方勁皓等人在SCIR模型中,引入了節(jié)點(diǎn)的在線和離線狀態(tài),增強(qiáng)了模型的時(shí)效性[7]。范海波等人根據(jù)發(fā)布信息的用戶的可信度差異對(duì)信息傳播的影響,針對(duì)真假信息傳播的不同效果,提出了新的IBU模型[8]。魏靜等人在SIR模型的基礎(chǔ)上,提出了部分無知者直接轉(zhuǎn)變?yōu)槊庖哒咭约熬哂醒苌?yīng)的SIR改進(jìn)模型[9]。包峻波等人考慮現(xiàn)實(shí)中信息真?zhèn)蔚牟淮_定性,在SIR模型中引入博弈論和社會(huì)加強(qiáng)效應(yīng),設(shè)計(jì)研究了基于非完全信息博弈的SIR模型[10]。Kawachi等人根據(jù)現(xiàn)實(shí)中謠言傳播的特點(diǎn),在謠言傳播模型中,新加入了傳播者轉(zhuǎn)變?yōu)槲粗?,抵制者轉(zhuǎn)變?yōu)閭鞑フ叩茸兓?guī)則,完善了相關(guān)的信息傳播模型[11]。劉小洋等人針對(duì)社交網(wǎng)絡(luò)中一種信息會(huì)抑制另一種信息傳播的機(jī)制,運(yùn)用馬爾科夫鏈理論分析網(wǎng)絡(luò)上不同信息之間的競(jìng)爭(zhēng)機(jī)制和節(jié)點(diǎn)狀態(tài)轉(zhuǎn)化、信息傳播演化之間的內(nèi)在聯(lián)系,建立了網(wǎng)絡(luò)系統(tǒng)信息擴(kuò)散的非線性動(dòng)力學(xué)傳播模型[12]。
(3)針對(duì)信息傳播模型中原本恒定的傳播系數(shù)進(jìn)行拓展。Barros等把模糊理論與SI傳染病模型相結(jié)合,將系數(shù)變?yōu)橐粋€(gè)模糊集[13]。Zanette在小世界網(wǎng)絡(luò)中對(duì)謠言傳播的閾值進(jìn)行了研究[14]。王飛雪等人在SIR模型的基礎(chǔ)上考慮了謠言在不同節(jié)點(diǎn)上的傳播概率,提出了社交網(wǎng)絡(luò)中考慮節(jié)點(diǎn)自身影響的謠言傳播模型[15]。陳紫揚(yáng)等人考慮到不同影響力的節(jié)點(diǎn)對(duì)信息傳播的影響,提出了NI-SIR模型[16]。對(duì)于網(wǎng)絡(luò)中的節(jié)點(diǎn)多次接觸到同一信息所造成的模型中系數(shù)的變化,也有學(xué)者對(duì)此作出了研究。Dodds等人提出多次接觸同一信息后,信息傳播的記憶效應(yīng)會(huì)對(duì)后續(xù)的信息傳播造成影響[17]。王曉萌等人通過引入信息曝光度曲線與社交網(wǎng)絡(luò)個(gè)體影響力,提出了一種基于信息轉(zhuǎn)發(fā)傳播過程中記憶效應(yīng)的信息傳播模型[18]。Lü等人提出在社交網(wǎng)絡(luò)中節(jié)點(diǎn)多次接觸同一信息時(shí),接受信息的概率不同于只接觸了一次該信息時(shí)的概率,并引入了一個(gè)指數(shù)函數(shù)來反映在多次接觸同一信息的過程中,概率變化的過程[19]。劉詠梅等人提出了考慮到興趣衰減系數(shù)的基于小世界網(wǎng)絡(luò)的微博謠言傳播模型[20]。
結(jié)合以上文獻(xiàn)可以看到,當(dāng)前國(guó)內(nèi)外研究的重點(diǎn)主要有三個(gè)方向,即模型節(jié)點(diǎn)的類型和數(shù)量的變化、傳播系數(shù)的拓展以及對(duì)信息傳播機(jī)制的改進(jìn)。但是,上述文獻(xiàn)仍具有較大的局限性:所有研究都是基于傳染病動(dòng)力學(xué)SIR模型進(jìn)行改進(jìn),針對(duì)微博等平臺(tái)的“轉(zhuǎn)發(fā)”傳播機(jī)制進(jìn)行的。這些研究無法應(yīng)用于地方性網(wǎng)絡(luò)論壇中的輿情信息傳播機(jī)制的研究。網(wǎng)絡(luò)論壇中的輿情話題傳播機(jī)制是基于對(duì)論壇帖子的“回復(fù)”行為構(gòu)建的:回復(fù)量越高,帖子在論壇中的實(shí)時(shí)位置越靠前,越容易被用戶看到,帖子內(nèi)的信息越容易被傳播。
因此,為了對(duì)地方性網(wǎng)絡(luò)論壇中的輿情話題信息傳播機(jī)制進(jìn)行研究,本文基于SIR模型,改進(jìn)提出了UBIR(Unknow-Browser-Infected-Removed)模型。該模型的主要特點(diǎn)是:第一,以用戶的“回復(fù)”行為作為信息傳播機(jī)制的基礎(chǔ)?,F(xiàn)有研究中的“轉(zhuǎn)發(fā)”行為,本質(zhì)上就是使某個(gè)傳播節(jié)點(diǎn)中的輿情信息接觸到更多未知節(jié)點(diǎn)的行為。網(wǎng)絡(luò)論壇中沒有“轉(zhuǎn)發(fā)”這一行為,起到相同作用的是“回復(fù)”行為。因此,該模型以“回復(fù)”為基礎(chǔ),構(gòu)建了新的地方性網(wǎng)絡(luò)論壇中輿情話題信息傳播機(jī)制。第二,在SIR模型基礎(chǔ)上加入了新的瀏覽者節(jié)點(diǎn)(Browser)。與常見的SCIR、SEIR模型[3-6]相比,UBIR模型增加了新的不同狀態(tài)節(jié)點(diǎn)之間相互轉(zhuǎn)化的機(jī)制,更加符合網(wǎng)絡(luò)論壇傳播機(jī)制的特點(diǎn)。第三,針對(duì)地方性論壇輿情話題傳播機(jī)制的特點(diǎn),對(duì)模型參數(shù)進(jìn)行了改進(jìn)。通過參數(shù)的變化,UBIR模型成功地還原出了地方性論壇輿情話題傳播機(jī)制的三個(gè)特點(diǎn)。第四,在模型中加入并改進(jìn)了興趣指數(shù)函數(shù)。劉詠梅等人[20]提出的興趣指數(shù)函數(shù)描述了同一節(jié)點(diǎn)多次接觸同一信息對(duì)該信息在節(jié)點(diǎn)中傳播概率的影響,UBIR模型在此基礎(chǔ)上進(jìn)行改進(jìn),將網(wǎng)絡(luò)論壇中節(jié)點(diǎn)的鄰居節(jié)點(diǎn)個(gè)數(shù)與信息接觸次數(shù)相結(jié)合,使該函數(shù)能夠適用于本次研究。
本文為了研究熱點(diǎn)輿情話題在地方性網(wǎng)絡(luò)論壇中傳播的機(jī)制和特點(diǎn),基于SIR模型構(gòu)建了UBIR模型。該模型引入了興趣指數(shù)函數(shù),加入了新的瀏覽者節(jié)點(diǎn),結(jié)合了網(wǎng)絡(luò)論壇中回復(fù)帖子增加信息傳播概率的特點(diǎn)。UBIR模型共有四種類型的節(jié)點(diǎn),即Unknow(未知者)、Browser(瀏覽者)、Infected(傳播者)、Removed(免疫者),其示意圖如圖1所示。
圖1 UBIR模型示意圖Fig.1 UBIR model diagram
在UBIR模型中,未知者節(jié)點(diǎn)在接觸到傳播者節(jié)點(diǎn)后以P(m)的概率轉(zhuǎn)變?yōu)闉g覽者節(jié)點(diǎn)。瀏覽者節(jié)點(diǎn)分別以α和β的概率轉(zhuǎn)變?yōu)閭鞑フ吖?jié)點(diǎn)和免疫者節(jié)點(diǎn)。
與傳統(tǒng)SIR模型不同的是,在UBIR模型中,傳播者節(jié)點(diǎn)和免疫者節(jié)點(diǎn)有一定的概率能夠轉(zhuǎn)變回瀏覽者節(jié)點(diǎn)。這一現(xiàn)象和論壇的特點(diǎn)有關(guān):
第一,傳播者節(jié)點(diǎn)的用戶在回復(fù)完帖子后有三種選擇,即離開帖子,繼續(xù)回復(fù)和繼續(xù)瀏覽帖子。這三種選擇分別代表了轉(zhuǎn)變?yōu)槊庖哒?、繼續(xù)作為傳播者和轉(zhuǎn)變回瀏覽者這三種情況。
第二,論壇普遍都有搜索和收藏功能。即使一篇帖子無人問津,完全“沉貼”,不再參與信息的傳播,用戶都可以通過搜索和收藏功能,再次接觸到這一帖子。網(wǎng)絡(luò)論壇中帖子的另一大功能便是“網(wǎng)絡(luò)聊天室”。免疫者用戶在失去對(duì)帖子的興趣后很有可能會(huì)收到后續(xù)用戶對(duì)其的回復(fù)。在這種情況下,免疫者用戶往往會(huì)通過搜索或收藏再次找到帖子,參與話題的討論。例如在百度貼吧中,就有很多用戶在離開帖子轉(zhuǎn)為免疫者的十幾個(gè)小時(shí)后,為了回復(fù)別人,再次進(jìn)入同一篇帖子轉(zhuǎn)變回瀏覽者。在論壇中,討論意味著傳播信息。這種情況在大型論壇中是比較常見的。
UBIR模型能夠適用于大多數(shù)大型的網(wǎng)絡(luò)論壇。但是地方性網(wǎng)絡(luò)論壇由于其主體用戶和規(guī)模的特殊性,無法直接應(yīng)用UBIR模型進(jìn)行研究。
為了對(duì)地方性論壇熱點(diǎn)輿情話題傳播機(jī)制進(jìn)行進(jìn)一步研究,本文選取了“天涯論壇”這一國(guó)內(nèi)主流的綜合性大型網(wǎng)絡(luò)論壇作為參照,爬取了一篇帶有地方性色彩的熱點(diǎn)輿情話題相關(guān)帖子。其數(shù)據(jù)如圖2、圖3所示。
圖2 大型論壇回復(fù)量變化圖Fig.2 Change chart of reply volume in large forums
圖3 大型論壇回復(fù)量變化速率圖Fig.3 Graph of rate of change of reply volume in large forums
從圖中明顯可得,大型論壇中回復(fù)量的增長(zhǎng)有多次明顯的長(zhǎng)達(dá)數(shù)個(gè)小時(shí)的停滯,其增長(zhǎng)速率在逐漸減少至歸零后再次大幅增加。大型論壇中地方性輿情話題信息傳播的周期較長(zhǎng)且速度較慢。從發(fā)帖開始,在50個(gè)小時(shí)后,回復(fù)量的增長(zhǎng)才最終歸零。論壇中對(duì)帖子的回復(fù)可以等同于對(duì)信息的傳播。大型論壇中回復(fù)量的增長(zhǎng)可以在數(shù)次歸零后重新再次開始增長(zhǎng)。這種現(xiàn)象的主要原因就是原本的免疫者用戶通過搜索和收藏功能,再次接觸到相關(guān)帖子,并進(jìn)行回復(fù)。
作為對(duì)比,本文在杭州19樓論壇對(duì)相同輿情話題的帖子進(jìn)行了爬蟲。之所以選擇該論壇,是因?yàn)樵撜搲?guī)模和用戶群體規(guī)模適中,具有較強(qiáng)的杭州地方性色彩,其數(shù)據(jù)具有較強(qiáng)的代表性,能夠有效地反映出該地民眾的輿情信息。在該論壇爬取的同一熱點(diǎn)輿情話題傳播的結(jié)果如圖4、圖5所示。
圖4 地方性論壇回復(fù)量變化圖Fig.4 Change chart of reply volume in local forum
圖5 地方性論壇回復(fù)量變化速率圖Fig.5 Graph of rate of change of reply volume in local forums
由于地方性論壇規(guī)模相對(duì)較小,同一熱點(diǎn)輿情話題相關(guān)的單篇帖子回復(fù)量較少。為了避免偶然性,本文選擇了同一話題的兩篇帖子同時(shí)進(jìn)行了爬蟲。從圖2到圖5四幅圖的對(duì)比,可以發(fā)現(xiàn)地方性論壇中熱點(diǎn)輿情話題的傳播具有三個(gè)特點(diǎn):
(1)地方性輿情傳播速度快。相比大型論壇,地方性輿情話題在地方性論壇發(fā)帖后的2到3個(gè)小時(shí)就會(huì)達(dá)到回復(fù)量增長(zhǎng)速度的巔峰。帖子回復(fù)量的快速增長(zhǎng),使帖子的輿情話題信息傳播在發(fā)帖后的3個(gè)小時(shí)內(nèi)達(dá)到巔峰。
(2)傳播周期短。在發(fā)帖的三個(gè)小時(shí)內(nèi)達(dá)到輿情話題信息傳播的高峰后,帖子的回復(fù)速度就會(huì)逐漸下降,直到12個(gè)小時(shí)左右,帖子的回復(fù)量歸零,話題信息停止傳播。
(3)停止信息傳播后不會(huì)“死灰復(fù)燃”。在帖子回復(fù)量增長(zhǎng)歸零,停止信息的傳播后,基本不會(huì)再重新開始大規(guī)模的信息傳播。
地方性論壇之所以與大型綜合性論壇會(huì)有這樣的區(qū)別,主要是其目標(biāo)用戶和論壇規(guī)模造成的。地方性論壇的用戶主要是當(dāng)?shù)鼐用?。與當(dāng)?shù)叵嚓P(guān)的輿情話題信息更容易被地方性論壇用戶接受。這造成了地方性論壇傳播地方性輿情話題速度快的特點(diǎn)。這反映到UBIR模型中的變化就是未知者節(jié)點(diǎn)在接觸到傳播節(jié)點(diǎn)后,轉(zhuǎn)變?yōu)闉g覽者節(jié)點(diǎn)的概率比普通論壇更高。地方性論壇較小的規(guī)模則決定了其信息傳播周期短,以及停止信息傳播后不會(huì)“死灰復(fù)燃”的特點(diǎn)。在經(jīng)歷發(fā)帖后的12個(gè)小時(shí)的傳播后,論壇中關(guān)心相關(guān)輿情的大多數(shù)用戶都已經(jīng)接觸輿情話題的相關(guān)信息。較少的用戶也使得帖子的“聊天室”功能受到了一定的限制。例如杭州19樓論壇總注冊(cè)人數(shù)在200萬左右,而論壇中一篇熱門帖子的閱讀量就達(dá)到了23萬,這說明論壇中的活躍用戶其實(shí)已經(jīng)基本上都接觸了該篇帖子的信息。后續(xù)已經(jīng)不會(huì)再有更多的用戶參與到該帖子的傳播中來了。這反映到UBIR模型中的變化就是,在地方性論壇的UBIR模型中,免疫者不會(huì)轉(zhuǎn)變?yōu)闉g覽者。
本文結(jié)合UBIR模型和地方性論壇的三個(gè)特點(diǎn),建立了針對(duì)地方性網(wǎng)絡(luò)論壇的UBIR模型,其示意圖如圖6所示。
圖6 地方性論壇的UBIR模型示意圖Fig.6 UBIR model diagram of local forum
地方性網(wǎng)絡(luò)論壇和普通論壇的信息傳播機(jī)制都是建立在回復(fù)行為上的。二者的傳播機(jī)制沒有本質(zhì)區(qū)別?,F(xiàn)有的差別主要是由地方性論壇的規(guī)模和主要目標(biāo)用戶造成的。因此,地方性網(wǎng)絡(luò)論壇的UBIR模型的主要變化有兩個(gè):第一,地方性網(wǎng)絡(luò)論壇UBIR模型的P(m)中的λ比普通的UBIR模型要高。第二,地方性網(wǎng)絡(luò)論壇UBIR模型中的免疫者節(jié)點(diǎn)不會(huì)轉(zhuǎn)變?yōu)闉g覽者節(jié)點(diǎn)。
本文所涉及模型,均選取地方性網(wǎng)絡(luò)論壇“杭州19樓論壇”作為數(shù)據(jù)來源,模型所涉及的相關(guān)假設(shè)規(guī)則如下:
(1)在網(wǎng)絡(luò)論壇所處的社交網(wǎng)絡(luò)中,回復(fù)即被視為傳播信息。與微博,推特等社交軟件不同,網(wǎng)絡(luò)論壇的信息傳播機(jī)制使模型無法利用消息的轉(zhuǎn)發(fā)行為來定義話題信息是否成功傳播。在網(wǎng)絡(luò)論壇中,存在“頂帖”現(xiàn)象,即用戶回復(fù)網(wǎng)絡(luò)論壇中的某一篇帖子,會(huì)提高該帖子在論壇版面中的位置。這會(huì)提高其他用戶接觸到這一帖子信息的概率。根據(jù)這一機(jī)制,本文將論壇用戶對(duì)某一篇帖子的回復(fù)行為視為對(duì)該帖子包含的輿情話題信息的傳播行為。
(2)假設(shè)在該論壇所處的社交網(wǎng)絡(luò)中包含的總節(jié)點(diǎn)數(shù)(用戶人數(shù))為N,該論壇用戶總共分為四類:未知者U(t)、瀏覽者B(t)、傳播者I(t)、免疫者R(t)。其中未知者為網(wǎng)絡(luò)論壇中在t時(shí)刻沒有點(diǎn)進(jìn)相關(guān)輿情話題消息的帖子中進(jìn)行瀏覽的用戶。瀏覽者為接觸到相關(guān)輿情話題消息后點(diǎn)進(jìn)相關(guān)帖子進(jìn)行瀏覽,但是既沒有關(guān)閉帖子離開,也沒有進(jìn)行回復(fù)頂帖的用戶。傳播者則是瀏覽者中接受了相關(guān)信息并進(jìn)行了回復(fù),增加了帖子的熱度,提高了帖子在論壇中的位置,進(jìn)一步傳播了相關(guān)信息的用戶。免疫者則是最終失去了對(duì)相關(guān)信息興趣,離開了相關(guān)帖子,從輿情話題信息的傳播行為中退出的用戶。
(3)假設(shè)19樓論壇所在的社交網(wǎng)絡(luò)為小世界網(wǎng)絡(luò),并假設(shè)其網(wǎng)絡(luò)的平均度為kˉ。
(4)在論壇中接觸到同一篇帖子或者說同一個(gè)熱點(diǎn)輿情話題的多個(gè)不同帖子的次數(shù)不止一次。不同的接觸次數(shù),以及帖子本身的話題的興趣指數(shù)(吸引人的程度)都會(huì)影響到用戶點(diǎn)進(jìn)該篇帖子成為瀏覽者的概率。由劉詠梅等人的相關(guān)研究[18]可知,用戶接受并傳播某條輿情信息的概率隨著該信息的出現(xiàn)次數(shù)的變化而變化。這種由于不同的接觸次數(shù)而帶來的對(duì)相關(guān)信息的興趣的變化或者說瀏覽信息內(nèi)容的概率的變化可以用指數(shù)函數(shù)來進(jìn)行表示。有公式如下:
其中,λ是未知者點(diǎn)第一次接觸到傳播輿情話題信息的相關(guān)帖子就點(diǎn)進(jìn)該帖子轉(zhuǎn)變?yōu)闉g覽者的概率。地方性網(wǎng)絡(luò)論壇中,該概率更高,λ比在普通論壇中更大。b是該輿情話題的興趣系數(shù),b越大,P(m)隨著接觸話題信息的次數(shù)的增加,減少的速度越來越快,瀏覽的概率越來越小。換言之,b越小,用戶對(duì)該輿情話題的興趣越高。m則是某節(jié)點(diǎn)用戶接觸到相關(guān)話題信息的次數(shù),在本文所涉及模型中具體體現(xiàn)為該節(jié)點(diǎn)在小世界網(wǎng)絡(luò)中鄰居節(jié)點(diǎn)中的傳播者節(jié)點(diǎn)數(shù)量。
(5)假設(shè)所有的未知者節(jié)點(diǎn),在第一次接受到輿情話題信息后,有λ的概率對(duì)話題信息產(chǎn)生興趣,進(jìn)入帖子轉(zhuǎn)變?yōu)闉g覽者節(jié)點(diǎn)。隨著傳播行為的進(jìn)行,該節(jié)點(diǎn)的鄰居節(jié)點(diǎn)中的傳播者節(jié)點(diǎn)越來越多(接觸到該話題信息的次數(shù)越來越多),P(m)最終趨向于0。即未知節(jié)點(diǎn)的用戶不再轉(zhuǎn)變?yōu)闉g覽者,一直保持為未知節(jié)點(diǎn)。
(6)瀏覽者在瀏覽完該帖子后,有δ的概率失去對(duì)這一話題信息的興趣,直接離開該帖子,不對(duì)這一話題信息的傳播產(chǎn)生作用。為了簡(jiǎn)化模型,假設(shè)離開帖子的瀏覽者不會(huì)再對(duì)該帖子產(chǎn)生興趣,重新進(jìn)入該篇帖子再次成為瀏覽者,轉(zhuǎn)變?yōu)槊庖哒?。地方性網(wǎng)絡(luò)論壇中的免疫者不會(huì)再轉(zhuǎn)變?yōu)闉g覽者和傳播者。同時(shí)瀏覽者有α的概率選擇回復(fù)帖子,對(duì)該帖子的輿情話題產(chǎn)生傳播作用。因此本文認(rèn)為回帖的用戶轉(zhuǎn)變?yōu)閭鞑フ?。由現(xiàn)實(shí)情況明顯可得:
(7)用戶的回帖行為并不限于一次。因此在用戶以概率β失去回帖的興趣,轉(zhuǎn)變?yōu)槊庖哒吖?jié)點(diǎn)退出話題信息的傳播過程前,都將被視為傳播者并進(jìn)行傳播行為。在實(shí)驗(yàn)中,為了簡(jiǎn)化模型,設(shè)β為固定值,每進(jìn)行一次傳播行為,就判斷一次是否退出傳播。
(8)傳播者節(jié)點(diǎn)進(jìn)行一次傳播行為后,有γ的概率轉(zhuǎn)變回瀏覽者。在轉(zhuǎn)變回瀏覽者的情況下,用戶繼續(xù)留在帖子中瀏覽輿情話題信息,直到再次回復(fù)轉(zhuǎn)變?yōu)閭鞑フ呋蛘唠x開帖子變?yōu)槊庖哒摺?/p>
由以上假設(shè)可得,在t時(shí)刻,未知者節(jié)點(diǎn)以概率P(m)被任意一個(gè)傳播節(jié)點(diǎn)傳播,接觸到信息后轉(zhuǎn)變?yōu)闉g覽節(jié)點(diǎn)。因此,未知者的演化方程為:
在t時(shí)刻,論壇中的瀏覽者節(jié)點(diǎn)(Browser)在由未知節(jié)點(diǎn)轉(zhuǎn)變過來的同時(shí),還分別以δ和α的平均概率轉(zhuǎn)變?yōu)閭鞑フ吖?jié)點(diǎn)(Infected)和免疫者節(jié)點(diǎn)(Removed)。同時(shí),還有一部分傳播節(jié)點(diǎn)以γ的概率轉(zhuǎn)變回瀏覽節(jié)點(diǎn),由此可得瀏覽者的演化方程為:
傳播者和免疫者節(jié)點(diǎn)在t時(shí)刻的演化方程如下:
由以上式(1)到式(6)綜合可得到UBIR模型的演化模型如下:
其中,U(t)+B(t)+I(t)+R(t)=N。假設(shè)在信息傳播初始情況下,有N0個(gè)瀏覽者,其余均為無知者節(jié)點(diǎn)。在實(shí)際情況中的意義即為,在一篇帖子剛發(fā)表的t0時(shí)刻,有N0個(gè)用戶進(jìn)入了帖子進(jìn)行瀏覽。
本文根據(jù)模型假設(shè)的輿情話題信息傳播機(jī)制,使用netlogo仿真軟件,進(jìn)行了仿真實(shí)驗(yàn)。實(shí)驗(yàn)以杭州19樓論壇中帶有地方性色彩的熱點(diǎn)輿情話題為數(shù)據(jù)來源。通過將仿真結(jié)果與實(shí)際數(shù)據(jù)進(jìn)行對(duì)比,本文研究了網(wǎng)絡(luò)論壇中輿情話題信息傳播的機(jī)制并驗(yàn)證UBIR模型的有效性。
首先,本文在杭州19樓論壇,選取“最美司機(jī)吳斌”這一具有很強(qiáng)杭州地方性色彩的熱點(diǎn)輿情話題作為主要的研究對(duì)象。為了減少單篇帖子回復(fù)量較少帶來的偶然性,本文一次性選取了該輿情話題相關(guān)的5篇帖子,總數(shù)據(jù)量達(dá)到10 611條回復(fù)。爬取數(shù)據(jù)如表1所示。
表1 爬取的19樓論壇部分?jǐn)?shù)據(jù)Table 1 Part of 19lou forum data
以第一層樓層的回復(fù)時(shí)間為原點(diǎn)t0,以回復(fù)時(shí)間的時(shí)間差為橫坐標(biāo),以用戶回復(fù)的樓層數(shù)和樓層數(shù)的增加速度為縱坐標(biāo)。選取目標(biāo)帖子發(fā)布后12個(gè)小時(shí)內(nèi)的數(shù)據(jù)變化,利用MATLAB軟件進(jìn)行作圖。結(jié)果如圖7、圖8所示。
圖7 熱點(diǎn)輿情話題帖子回復(fù)量隨時(shí)間變化圖Fig.7 Number of responses to hot public opinion topic posts changes over time
在圖7和圖8中,每一條曲線代表一篇有著相同話題信息的論壇帖子。圖7顯示的是在五篇熱點(diǎn)輿情話題相關(guān)帖子中,用戶回復(fù)量隨著時(shí)間推進(jìn)發(fā)生的變化。圖8顯示的是用戶回復(fù)量變化速率。從圖中可知,五篇帖子的信息傳播過程符合地方性論壇傳播機(jī)制的三個(gè)特點(diǎn)。其回復(fù)數(shù)的變化曲線都近似于對(duì)數(shù)曲線。在帖子發(fā)表后的兩個(gè)小時(shí)內(nèi),回復(fù)量發(fā)生了較快增長(zhǎng),并在2小時(shí)至3個(gè)小時(shí)的區(qū)間內(nèi)達(dá)到增速的最高峰。隨后增速開始大幅下降,帖子的“熱度”下降,回復(fù)量增速趨緩。最終在12個(gè)小時(shí)后,回復(fù)量增速漸漸歸零,帖子失去熱度,在論壇中“沉貼”了。
在上述兩幅圖中可以看到,第五篇帖子與其他帖子的曲線有較大差別。該帖子的回復(fù)量的變化趨勢(shì)雖然與其他曲線相近,但是整個(gè)變化過程比其他曲線推遲了3個(gè)小時(shí)。該現(xiàn)象的原因是該篇帖子的發(fā)布時(shí)間處于凌晨3點(diǎn)鐘。由于該時(shí)段的活躍用戶數(shù)量較小,導(dǎo)致在3個(gè)小時(shí)后,即現(xiàn)實(shí)時(shí)間6點(diǎn)鐘后,才有用戶對(duì)其進(jìn)行回復(fù)。這一現(xiàn)象說明,信息傳播的開始時(shí)間對(duì)整個(gè)信息傳播行為也會(huì)產(chǎn)生影響。本文暫不對(duì)這一影響因素進(jìn)行進(jìn)一步的研究。
對(duì)比圖4、圖5和圖7、圖8,兩次爬取的數(shù)據(jù)雖然輿情話題不同,但是兩次爬取的帖子的曲線變化趨勢(shì)相同,都符合地方性論壇熱點(diǎn)輿情話題傳播的特點(diǎn)。這說明熱點(diǎn)輿情話題本身的內(nèi)容不會(huì)對(duì)地方性論壇傳播機(jī)制的三個(gè)特點(diǎn)帶來影響。
圖8 熱點(diǎn)輿情話題帖子回復(fù)量變化速率圖Fig.8 Change rate chart of response number of hot public opinion topic posts
根據(jù)模型的基本假設(shè),本文采用Netlogo軟件進(jìn)行仿真實(shí)驗(yàn)。
本文將實(shí)驗(yàn)中代表社交網(wǎng)絡(luò)中各個(gè)節(jié)點(diǎn)的主體:turtles設(shè)為三個(gè)屬性,分別為Removed、Browser和Infected。屬性布爾值的true和false分別代表了該turtles所代表節(jié)點(diǎn)的屬性。當(dāng)三個(gè)屬性全部為false的時(shí)候,當(dāng)前節(jié)點(diǎn)是未知節(jié)點(diǎn)。Removed屬性為true,另外兩個(gè)屬性為false的時(shí)候則是免疫節(jié)點(diǎn)。以此類推,由此來表示節(jié)點(diǎn)的不同狀態(tài)。在netlogo中,為了方便區(qū)別節(jié)點(diǎn)的不同狀態(tài),賦予不同節(jié)點(diǎn)不同形狀加以區(qū)分。為了反映出地方性網(wǎng)絡(luò)論壇的特點(diǎn),本次實(shí)驗(yàn)網(wǎng)絡(luò)節(jié)點(diǎn)個(gè)數(shù)N為1 000,初始瀏覽者節(jié)點(diǎn)數(shù)B0為100,興趣指數(shù)b為0.2。
實(shí)驗(yàn)的具體過程如下:
(1)形成實(shí)驗(yàn)中的社交網(wǎng)絡(luò)。該步驟通過各個(gè)節(jié)點(diǎn)之間的鏈接,形成一個(gè)小世界網(wǎng)絡(luò)來完成。其節(jié)點(diǎn)數(shù)量變化如圖9所示。
圖9 建立總節(jié)點(diǎn)數(shù)N=1 000的社交網(wǎng)絡(luò)Fig.9 Establishing social network with total number of nodes N=1 000
(2)假設(shè)在一篇帖子發(fā)布后的t0時(shí)刻,有B0個(gè)用戶點(diǎn)擊進(jìn)入了帖子進(jìn)行瀏覽。本實(shí)驗(yàn)B0=100。在社交網(wǎng)絡(luò)中增加100個(gè)瀏覽節(jié)點(diǎn),其節(jié)點(diǎn)數(shù)量變化如圖10所示。
圖10 隨機(jī)選擇B0個(gè)節(jié)點(diǎn)轉(zhuǎn)變?yōu)闉g覽者Fig.10 Randomly selecting B0 nodes to convert to browsers
(3)開始模型的傳播過程仿真。各個(gè)節(jié)點(diǎn)數(shù)量變化如圖11所示。從傳播開始后,瀏覽者節(jié)點(diǎn)和傳播者節(jié)點(diǎn)呈波浪狀起伏變化,兩者交替增加減少。未知者節(jié)點(diǎn)不斷下降,轉(zhuǎn)變?yōu)樾碌臑g覽者節(jié)點(diǎn)。這說明,這一條輿情話題信息在網(wǎng)絡(luò)論壇中不斷傳播,沒有接觸過該信息的人不斷減少。同時(shí),免疫者節(jié)點(diǎn)不斷增加,并且隨著瀏覽者節(jié)點(diǎn)和傳播者節(jié)點(diǎn)的變化,增速在不斷增加。
圖11 信息傳播過程圖Fig.11 Information dissemination process diagram
(4)如圖12所示,論壇所處社交網(wǎng)絡(luò)只剩未知者節(jié)點(diǎn)和免疫者節(jié)點(diǎn),傳播者和瀏覽者全部歸零,話題信息的傳播過程結(jié)束。在這種情況下,不會(huì)再有新的傳播節(jié)點(diǎn)產(chǎn)生,話題信息的傳播行為完全停止。同時(shí),由于論壇規(guī)模較小,活躍用戶相對(duì)較少,不再有新的用戶通過收藏和搜索功能重新加入話題信息的傳播。對(duì)應(yīng)的現(xiàn)實(shí)情況就是,一篇帖子失去了熱度,瀏覽過和回復(fù)過該篇帖子的用戶全部離開。因此,帖子在論壇中的位置不會(huì)再被提高,并隨著新的帖子的出現(xiàn),慢慢地離開論壇的前排位置。新的未知節(jié)點(diǎn)不再有機(jī)會(huì)看到這篇帖子,接觸到相關(guān)話題信息,最終“沉貼”。從圖中還可以看到,在結(jié)束傳播后,社交網(wǎng)絡(luò)中的未知者節(jié)點(diǎn)數(shù)量仍然遠(yuǎn)遠(yuǎn)大于免疫者節(jié)點(diǎn)。這說明論壇中沒有接觸過該信息的用戶任然占大多數(shù)。這一現(xiàn)象也符合實(shí)際中論壇活躍用戶遠(yuǎn)少于總用戶的事實(shí)。
圖12 信息傳播完成圖Fig.12 Information dissemination completion diagram
(5)驗(yàn)證興趣指數(shù)對(duì)輿情話題信息傳播效果的影響。不同的話題帶來的興趣指數(shù)不同,由此會(huì)對(duì)信息的實(shí)際傳播帶來不同的影響。因此本文將初始節(jié)點(diǎn)數(shù)N0設(shè)為1 000,在初始時(shí)間t0,點(diǎn)進(jìn)帖子內(nèi)的瀏覽者節(jié)點(diǎn)B0為60。分別取興趣指數(shù)為0.2和2.0,以此來仿真不同話題帶來的不同的興趣指數(shù)的影響。通過不同節(jié)點(diǎn)隨時(shí)間的變化來驗(yàn)證實(shí)驗(yàn)結(jié)果。
(6)對(duì)比仿真結(jié)果和實(shí)際數(shù)據(jù),通過曲線的對(duì)比,證明UBIR模型的有效性。
3.3.1 模型仿真結(jié)果分析
用戶在論壇中進(jìn)行回復(fù),從瀏覽者轉(zhuǎn)變?yōu)閭鞑フ?。而傳播者在結(jié)束信息傳播行為后,最終都轉(zhuǎn)變?yōu)槊庖哒摺R虼?,在UBIR模型中,免疫者數(shù)量反映了現(xiàn)實(shí)中用戶的回復(fù)量,可以在一定程度上等同于回復(fù)量。免疫者的數(shù)量反映輿情話題信息傳播的效果。免疫者節(jié)點(diǎn)越多,回復(fù)量越高,傳播效果越好。仿真實(shí)驗(yàn)中免疫者節(jié)點(diǎn)變化如圖13所示。
圖13 仿真實(shí)驗(yàn)的免疫者節(jié)點(diǎn)變化曲線圖Fig.13 Graph of immunizer node change in simulation experiment
將圖13所代表的仿真結(jié)果和圖7所代表的實(shí)際數(shù)據(jù)進(jìn)行對(duì)比,明顯可得,仿真結(jié)果與實(shí)際數(shù)據(jù)發(fā)展趨勢(shì)基本吻合。二者的節(jié)點(diǎn)數(shù)和回復(fù)量,均在開始信息傳播行為后的前6個(gè)單位時(shí)間內(nèi)快速增加。在第6個(gè)單位時(shí)間后,二者的增長(zhǎng)曲線均趨于平緩,并在11至12個(gè)單位時(shí)間完全停止增長(zhǎng)。
圖14表示的是仿真實(shí)驗(yàn)中,免疫者節(jié)點(diǎn)的變化速率。從上文可知,免疫者節(jié)點(diǎn)的變化速率可以反映出回復(fù)量的變化速率。將圖14和圖8進(jìn)行對(duì)比,可以看出,雖然仿真結(jié)果存在速率的部分浮動(dòng),但在整體上,二者發(fā)展趨勢(shì)基本吻合。二者均在信息傳播行為開始后的2到3個(gè)單位時(shí)間內(nèi)達(dá)到了增速的巔峰。在之后的9個(gè)單位時(shí)間內(nèi),雖然偶有漲幅,但是增速總體是在逐漸下降的,直到最后第11至第12單位時(shí)間,增速歸零。
圖14 仿真實(shí)驗(yàn)的免疫者節(jié)點(diǎn)變化速率圖Fig.14 Graph of rate of change of immune nodes in simulation experiment
所以,整體來看,本文所涉及地方性論壇的UBIR仿真模型較為擬合實(shí)際情況。該模型可以較好地描述現(xiàn)實(shí)里地方性網(wǎng)絡(luò)論壇中熱點(diǎn)輿情話題信息的傳播過程,反映出話題信息在地方性論壇中傳播的三個(gè)特點(diǎn)。
3.3.2 興趣指數(shù)對(duì)輿情話題傳播效果的影響
興趣指數(shù)和輿情話題本身的內(nèi)容有關(guān),為了研究其對(duì)熱點(diǎn)輿情話題傳播的最終效果的影響,本文選取了兩個(gè)不同的興趣指數(shù)進(jìn)行了對(duì)比實(shí)驗(yàn)。
當(dāng)興趣指數(shù)為0.2時(shí)實(shí)驗(yàn)結(jié)果如圖15所示,當(dāng)興趣指數(shù)為2.0時(shí)實(shí)驗(yàn)結(jié)果如圖16所示。
圖15 b=0.2情況下各節(jié)點(diǎn)隨時(shí)間變化Fig.15 Each node changing with time in the case of b=0.2
圖16 b=2.0情況下各節(jié)點(diǎn)隨時(shí)間變化Fig.16 Each node changing with time in the case of b=2.0
不同的興趣指數(shù)代表了不同話題對(duì)于論壇用戶的吸引程度。該指數(shù)越小,話題越吸引人,論壇用戶回復(fù)的概率越大??梢钥吹剑琤=2.0時(shí),最終免疫者節(jié)點(diǎn)的數(shù)量遠(yuǎn)遠(yuǎn)高于b=2.0的情況,而未知者節(jié)點(diǎn)卻低于b=2.0的情況。這說明,興趣指數(shù)越小,整個(gè)網(wǎng)絡(luò)中參與到輿情話題信息傳播的節(jié)點(diǎn)越多,信息傳播的效果越好。通過同一論壇中不同輿情話題實(shí)際數(shù)據(jù)的對(duì)比,可以看到,19樓論壇中“最美司機(jī)”相關(guān)帖子的回復(fù)量要遠(yuǎn)高于另一個(gè)熱點(diǎn)話題。其帖子內(nèi)包含信息的傳播效果也比普通信息的傳播效果更加優(yōu)秀。為了排除偶然性,本文分別在興趣指數(shù)為0.2和2.0的情況下,重復(fù)進(jìn)行實(shí)驗(yàn),其結(jié)果如表2所示。
表2 兩種興趣指數(shù)下最終免疫者節(jié)點(diǎn)數(shù)Table 2 Number of final immune nodes under two interest indices
可以看到,在興趣指數(shù)為0.2的情況下,最終免疫者節(jié)點(diǎn)的數(shù)量的平均值要高于2.0的情況。因此興趣指數(shù)越小,話題越吸引人,信息傳播效果越好的結(jié)論成立。
通過建模與仿真實(shí)驗(yàn),可以得出結(jié)論,地方性網(wǎng)絡(luò)論壇中的熱點(diǎn)輿情話題的傳播機(jī)制是基于“回復(fù)”這一用戶行為的。因?yàn)榈胤叫哉搲趥鞑ポ浨樵掝}上的三個(gè)特點(diǎn),其傳播機(jī)制與普通論壇存在一定區(qū)別。地方性網(wǎng)絡(luò)論壇的傳播速度比普通論壇更快。在某個(gè)輿情話題的論壇帖子被發(fā)表后,論壇中部分用戶進(jìn)入帖子由未知者轉(zhuǎn)變?yōu)闉g覽者。隨后部分瀏覽者選擇回復(fù)帖子轉(zhuǎn)變?yōu)閭鞑フ?,同時(shí)還將帖子頂?shù)秸搲懈涌壳暗奈恢谩_@使更多未知者用戶接觸到了這一帖子包含的輿情話題信息,完成了一次話題信息的傳播。在失去興趣退出帖子轉(zhuǎn)變?yōu)槊庖哒咔?,傳播者保持著?duì)帖子的回復(fù),不斷“頂帖”傳播該帖子的輿情信息。另一部分瀏覽者,在接受完帖子的輿情話題信息后失去對(duì)該信息的興趣,直接退出了話題信息的傳播,轉(zhuǎn)變?yōu)槊庖哒?。同時(shí),傳播者也有可能轉(zhuǎn)變回瀏覽者,這對(duì)照了現(xiàn)實(shí)中用戶停止回復(fù)但是繼續(xù)瀏覽帖子的情況。
對(duì)比實(shí)際數(shù)據(jù)和仿真結(jié)果,明顯可得,以上行為發(fā)生的高峰期在帖子發(fā)布后的2個(gè)小時(shí)至3個(gè)小時(shí)之間。因此,若是要對(duì)相關(guān)輿情信息進(jìn)行管控,最佳的操作時(shí)間就在帖子發(fā)布的2個(gè)小時(shí)之內(nèi)。
為了研究地方性網(wǎng)絡(luò)論壇中熱點(diǎn)輿情話題傳播的機(jī)制和特點(diǎn),本文通過普通論壇和地方性論壇數(shù)據(jù)的對(duì)比,得出了地方性論壇輿情話題信息傳播機(jī)制的三個(gè)特點(diǎn)。本文基于SIR模型進(jìn)行改進(jìn),提出了針對(duì)地方性網(wǎng)絡(luò)論壇的UBIR模型。UBIR模型考慮并結(jié)合了現(xiàn)實(shí)的網(wǎng)絡(luò)論壇中信息傳播機(jī)制的特點(diǎn)。例如傳播節(jié)點(diǎn)有可能會(huì)重新轉(zhuǎn)變?yōu)闉g覽節(jié)點(diǎn),瀏覽節(jié)點(diǎn)也可能直接轉(zhuǎn)變?yōu)槊庖吖?jié)點(diǎn),多次接觸同一信息會(huì)對(duì)傳播造成影響等。通過仿真實(shí)驗(yàn),驗(yàn)證了UBIR模型可以較好地還原網(wǎng)絡(luò)論壇中輿情話題傳播的過程,能夠成功地還原出地方性網(wǎng)絡(luò)論壇中輿情話題信息傳播的機(jī)制,對(duì)解決現(xiàn)實(shí)中輿情話題傳播管理的問題具有參考意義。
本文也有一定的局限性。實(shí)際論壇中,雖然由于論壇本身規(guī)模較小,用戶相對(duì)較少,參與輿情話題傳播的用戶數(shù)量仍然是一個(gè)較大的數(shù)字。由于模型本身的局限性,UBIR模型對(duì)于論壇中瀏覽量的增加也能增加帖子的熱度,提高其在論壇中的順位,加快信息的傳播這一機(jī)制特點(diǎn)沒有能夠進(jìn)行還原。在處理實(shí)際數(shù)據(jù)時(shí)發(fā)現(xiàn)的發(fā)帖時(shí)間對(duì)于信息傳播的影響機(jī)制也沒有能夠通過該模型還原。因此,UBIR模型仍舊存在一定的偏差,地方性網(wǎng)絡(luò)論壇的信息傳播機(jī)制仍不完善。在未來的研究中,可以進(jìn)一步優(yōu)化模型,使其更加符合現(xiàn)實(shí)中網(wǎng)絡(luò)論壇輿情話題傳播機(jī)制的特點(diǎn),為網(wǎng)絡(luò)論壇的監(jiān)控和管理提供有效的參考。