涂貴宇 潘文林 張?zhí)燔?/p>
(1.云南民族大學(xué)數(shù)學(xué)與計算機(jī)科學(xué)學(xué)院 昆明 650504)(2.云南民族大學(xué)軟件工程研究所 昆明 650504)
隨著新浪微博網(wǎng)絡(luò)社交平臺的興起,許多網(wǎng)民、媒體等蜂擁而至的在網(wǎng)絡(luò)社交平臺上對某一輿論發(fā)表觀點、實時交流,無形之間加快了信息傳播的速度和廣度。任何一個網(wǎng)絡(luò)中,或多或少都存在著占有不可或缺地位的節(jié)點,這些節(jié)點一旦被移除或是攻擊,整個網(wǎng)絡(luò)很有可能會在連通性、穩(wěn)定性等方面受到一定程度的影響。例如在微博輿情傳播網(wǎng)絡(luò)中,通過控制關(guān)鍵人物就能把握輿情的走勢。因此,關(guān)鍵節(jié)點識別的理論研究意義和應(yīng)用價值不可估量。
針對輿情超網(wǎng)絡(luò)及關(guān)鍵節(jié)點的識別,國內(nèi)有不少研究。例如,趙劍華[1]等將SIR 傳播模型運用于社交網(wǎng)絡(luò)輿情傳播的分析中;王晰巍[2]等基于SNA闡述了移動環(huán)境下網(wǎng)絡(luò)輿情傳播;蔣侃[3]等分析了輿情關(guān)鍵節(jié)點識別及擴(kuò)散;楊伊帆[4]發(fā)現(xiàn)加快網(wǎng)絡(luò)輿情消退的關(guān)鍵在于對次意見領(lǐng)袖實施干預(yù);魏瑩[5]等闡述用主路徑分析法鑒別關(guān)鍵節(jié)點和控制輿情擴(kuò)散;周麗娜[6]等通過鄰接結(jié)構(gòu)熵確定了超網(wǎng)絡(luò)關(guān)鍵節(jié)點;王日芬[7]等研究了社會網(wǎng)絡(luò)關(guān)鍵節(jié)點的識別及應(yīng)用;張磊[8]等基于超網(wǎng)絡(luò)建立語義社會網(wǎng)絡(luò)并對其關(guān)鍵節(jié)點識別進(jìn)行了研究;馬寧[9]等利用超邊排序算法對網(wǎng)絡(luò)輿情領(lǐng)袖進(jìn)行識別;高俊峰[10]對輿情內(nèi)的輿論領(lǐng)袖所起到的號召能力進(jìn)行測度研究;詹天成[11]等將微博內(nèi)網(wǎng)絡(luò)領(lǐng)袖間的關(guān)聯(lián)用社會網(wǎng)絡(luò)分析法進(jìn)行分析;胡亞雪[12]對面向微博輿情用戶挖掘及消息傳播預(yù)測關(guān)鍵技術(shù)進(jìn)行研究;許鵬程[13]等對知識超網(wǎng)絡(luò)中的領(lǐng)域?qū)<疫M(jìn)行識別;Zlatic Vinko[14]等對超網(wǎng)絡(luò)中的超邊進(jìn)行排序提出輿情超網(wǎng)絡(luò)模型中的SuperEdgeRank算法等。
本文將在前人研究的基礎(chǔ)上,對新冠肺炎輿情超網(wǎng)絡(luò)中的重要節(jié)點加以識別,更好地為有關(guān)政府機(jī)構(gòu)在新冠肺炎輿情傳播中對關(guān)鍵用戶的干預(yù)提供依據(jù),以控制新冠肺炎的網(wǎng)絡(luò)輿情走勢。
超網(wǎng)絡(luò)“Supernetwork”方法是由Nagurney[15]最先明確的,將超越而又超出現(xiàn)有網(wǎng)絡(luò)的網(wǎng)絡(luò)定義為超網(wǎng)絡(luò)。根據(jù)模型構(gòu)建基礎(chǔ),超網(wǎng)絡(luò)模型可分為基于網(wǎng)絡(luò)的超網(wǎng)絡(luò)模型(Supernetwork)和基于超圖的超網(wǎng)絡(luò)模型(Hypernetwork)[16]?;诰W(wǎng)絡(luò)的超網(wǎng)絡(luò)更傾向于梳理網(wǎng)絡(luò)層次關(guān)系,基于超圖的超網(wǎng)絡(luò)更傾向于體現(xiàn)節(jié)點之間的復(fù)雜關(guān)系,當(dāng)因素、層級涉及的越多的時候,基于網(wǎng)絡(luò)的超網(wǎng)絡(luò)模型應(yīng)用優(yōu)勢越明顯。因此,本文將利用基于網(wǎng)絡(luò)的超網(wǎng)絡(luò)模型進(jìn)行后續(xù)的研究。
馬寧[17]等闡述微博輿情網(wǎng)絡(luò)由社交子網(wǎng)、環(huán)境子網(wǎng)、心理子網(wǎng)、觀點子網(wǎng)4 個子網(wǎng)構(gòu)成;梁曉賀[18]等將微博輿情網(wǎng)絡(luò)分為社交子網(wǎng)、觀點子網(wǎng)、時序子網(wǎng)和情感子網(wǎng);張連峰[19]等認(rèn)為微博輿情網(wǎng)絡(luò)由環(huán)境子網(wǎng)、社交子網(wǎng)、內(nèi)容子網(wǎng)、情感子網(wǎng)和時序子網(wǎng)5 個子網(wǎng)構(gòu)成等。結(jié)合前人的研究思想及超網(wǎng)絡(luò)理論基礎(chǔ),將輿情超網(wǎng)絡(luò)劃分為IP 屬地子網(wǎng)、主體子網(wǎng)、內(nèi)容子網(wǎng)、觀點子網(wǎng)和時序子網(wǎng),見圖1(a)。在輿情超網(wǎng)絡(luò)中,主體子網(wǎng)、內(nèi)容子網(wǎng)、觀點子網(wǎng)三個核心層子網(wǎng)是相互貫通的,是輿情生命周期存在的主要條件。為了更精準(zhǔn)地識別關(guān)鍵節(jié)點,將內(nèi)容子網(wǎng)拆分成信息子網(wǎng)和話題子網(wǎng)以及暫且隱去IP 屬地子網(wǎng)和時序子網(wǎng),剩下的主體子網(wǎng)、信息子網(wǎng)、話題子網(wǎng)、觀點子網(wǎng)間的關(guān)聯(lián),見圖1(b)。
圖1 輿情超網(wǎng)絡(luò)和輿情節(jié)點關(guān)聯(lián)
2.3.1 主體子網(wǎng)
以微博用戶為節(jié)點,用戶間的評論關(guān)系為邊連接節(jié)點,從而建立主體子網(wǎng)。
定義:節(jié)點為微博用戶,以用戶之間的評論關(guān)系構(gòu)造有向邊,由此構(gòu)造的用戶評論關(guān)系網(wǎng)絡(luò)見式(1)。
其中P={P1,P2,P3,…,Pn} 是微博用戶的有限集合,EP?P的計算方法見式(2)和式(3)。
其中,P1,P2,P3,…,Pn是微博用戶,是SP網(wǎng)絡(luò)中點的集合;(Pi,Pj)為SP網(wǎng)絡(luò)中邊的集合。
2.3.2 信息子網(wǎng)
以用戶發(fā)布的帖子內(nèi)容為節(jié)點,圍繞該帖子參與討論的話題為邊連接節(jié)點,從而建立信息子網(wǎng)。
定義:節(jié)點為用戶發(fā)布的帖子內(nèi)容,以用戶圍繞該帖子參與討論的話題為關(guān)系構(gòu)造無向邊,由此構(gòu)建的信息子網(wǎng)見式(4)。
其中C={C1,C2,C3,…,Cn} 是帖子內(nèi)容的有限集合,EC?C的計算方法見式(5)和式(6)。
其中,C1,C2,C3,…,Cn是帖子內(nèi)容,是SC網(wǎng)絡(luò)中點的集合;(Ci,Cj)為SC網(wǎng)絡(luò)中邊的集合。
2.3.3 話題子網(wǎng)
以用戶討論的話題為節(jié)點,話題包含著的關(guān)鍵詞相似度為關(guān)系連接節(jié)點,從而建立話題子網(wǎng)。
定義:節(jié)點為用戶討論的話題,以話題包含著的關(guān)鍵詞相似度為關(guān)系構(gòu)造無向邊,由此構(gòu)造的話題子網(wǎng)見式(7)。
其中T={T1,T2,T3,…,Tn} 是用戶討論的話題的有限集合,ET?T的計算方法見式(8)和式(9)。
其中,T1,T2,T3,…,Tn是用戶討論的話題,是ST網(wǎng)絡(luò)中點的集合;(Ti,Tj)為ST網(wǎng)絡(luò)中邊的集合。
2.3.4 觀點子網(wǎng)
觀點態(tài)度傾向可以分為三類:正面觀點、中立觀點和負(fù)面觀點。以用戶對某一話題發(fā)表的觀點中提取出的態(tài)度詞詞匯本體為節(jié)點,態(tài)度詞的傾向性為關(guān)系連接節(jié)點,從而構(gòu)建觀點子網(wǎng)。
定義:節(jié)點為用戶對某一話題發(fā)表的觀點中提取出的態(tài)度詞詞匯本體,以態(tài)度詞的傾向性為關(guān)系構(gòu)造無向邊,由此構(gòu)造的觀點子網(wǎng)見式(10)。
其中K={K1,K2,K3,…,Kn} 是態(tài)度詞詞匯本體的有限集合,EK?K的計算方法見式(11)和式(12)。
其中,K1,K2,K3,…,Kn是態(tài)度詞,是SK網(wǎng)絡(luò)中點的集合;(Ki,Kj)為SK網(wǎng)絡(luò)中邊的集合。
在多重因素共同作用下的輿情超網(wǎng)絡(luò)模型中,不同因素之間存在著不同類型的關(guān)系,其中包括同質(zhì)因素之間的關(guān)聯(lián)關(guān)系(即層內(nèi)關(guān)系)和異質(zhì)因素之間的映射關(guān)系(即層間映射關(guān)系)。主體子網(wǎng)到信息子網(wǎng)的映射表示某微博用戶發(fā)布了哪些帖子,可能同一個用戶發(fā)布多條帖子,也可能多個用戶發(fā)布了同一條帖子(即轉(zhuǎn)發(fā));信息子網(wǎng)到話題子網(wǎng)的映射表示用戶在某一條帖子中選擇自己感興趣的一個話題或是多個話題展開討論;話題子網(wǎng)到觀點子網(wǎng)的映射表示用戶對某一個話題發(fā)表了觀點。4層子網(wǎng)絡(luò)層內(nèi)和層間映射唇齒相依,由此構(gòu)建輿情超網(wǎng)絡(luò)模型。輿情超網(wǎng)絡(luò)模型超邊的定義見式(13)。
其中,超邊SEP?C?T?K表示用戶Pi發(fā)布了帖子Cj,參與討論話題Tm發(fā)表了包含態(tài)度詞Kn的觀點。
因此構(gòu)建的輿情超網(wǎng)絡(luò)模型(CPH)見式(14)。
模擬輿情超網(wǎng)絡(luò)模型使文中的研究思路和方法清晰易曉。主體子網(wǎng)P、信息子網(wǎng)C、話題子網(wǎng)T和觀點子網(wǎng)K中分別包含了6 個微博用戶、3 個信息節(jié)點、5 個話題及20 個態(tài)度詞。表1 展示了4層子網(wǎng)絡(luò)層間節(jié)點的映射關(guān)系。
表1 輿情具體超網(wǎng)絡(luò)模型示例
1)節(jié)點超度
超網(wǎng)絡(luò)中的節(jié)點超度是指包含這個節(jié)點的超邊數(shù)量。在輿情超網(wǎng)絡(luò)模型中節(jié)點超度值越大,其影響力就越大,該節(jié)點越可能成為活躍用戶。如在上述建立的輿情具體超網(wǎng)絡(luò)模型中,SDP1=2 ,SDP6=3 等。
2)超邊連接度
超網(wǎng)絡(luò)中的超邊連接度是指某條超邊所相鄰的其它超邊的數(shù)目。超邊連接度越大,該節(jié)點越可能成為核心人物。如在上述建立的輿情具體超網(wǎng)絡(luò)模型中,L(SE3)=5,L(SE7)=2 等。
3)平均最短距離
超網(wǎng)絡(luò)中平均最短距離是指某個節(jié)點到達(dá)其它所有節(jié)點的平均距離,平均最短距離越小的節(jié)點影響力越大,該節(jié)點越可能成為意見領(lǐng)袖。如在上述建立的輿情具體超網(wǎng)絡(luò)模型中,=0.25 ,=0.17 等。
首先基于python 爬取以#新冠肺炎#為主題的微博數(shù)據(jù),獲取用戶名稱、帖子及評論內(nèi)容;其次將jieba 分詞模塊運用于微博文檔以及評論的分詞處理,去除無關(guān)的內(nèi)容,例如標(biāo)點、“回復(fù):”、“@”等樣式的;最后用python進(jìn)行LDA[20]模型話題生成。
根據(jù)微博用戶之間的評論關(guān)系、對應(yīng)用戶發(fā)布的帖子、參與討論的話題以及發(fā)表的觀點為關(guān)系,建立主體子網(wǎng)、信息子網(wǎng)、話題子網(wǎng)和觀點子網(wǎng),然后根據(jù)各子層間的映射關(guān)系,最終建立新冠肺炎輿情超網(wǎng)絡(luò)。主體子網(wǎng)絡(luò)共有341 個用戶節(jié)點,信息子網(wǎng)包括258 條有效網(wǎng)民帖子及評論,話題子網(wǎng)包含47 個話題核心關(guān)鍵詞,觀點子網(wǎng)絡(luò)中共包含提取出的30個態(tài)度詞匯,見表2。
表2 新冠肺炎輿情超網(wǎng)絡(luò)各子層網(wǎng)絡(luò)
在構(gòu)建完成的新冠肺炎輿情超網(wǎng)絡(luò)中,以微博用戶為研究對象,計算微博用戶的節(jié)點超度值、超邊連接度、平均最短距離以及超邊排序值。
1)節(jié)點超度
在構(gòu)成該輿情主體子網(wǎng)的341 位用戶中,大多數(shù)用戶的節(jié)點超度值是1,表3 中列出了節(jié)點超度值排名前10 的微博用戶,這10 位用戶很有可能成為該新冠肺炎輿情超網(wǎng)絡(luò)中的活躍人物。
表3 超度值排名
2)超邊連接度
計算上述10 位預(yù)備活躍人物的超邊連接度,表4 中列出超邊連接度排名前7 的微博用戶,這7位微博用戶很有可能成為該新冠肺炎輿情超網(wǎng)絡(luò)中的核心人物。
表4 超邊連接度排名
3)平均最短距離
計算這7 位預(yù)備核心人物到達(dá)其他微博用戶的平均最短距離,識別出新冠肺炎輿情超網(wǎng)絡(luò)中的關(guān)鍵節(jié)點,即該新冠肺炎輿情超網(wǎng)絡(luò)中的輿情領(lǐng)袖,見表5。
表5 平均最短距離
從表5 中可知,平均最短距離最小的4 位分別是橋組、Real 厲害財經(jīng)、努力在搞機(jī)以及李青大夫。這四位關(guān)鍵節(jié)點用戶在新冠肺炎輿情超網(wǎng)絡(luò)中的部分超邊組成情況如表6所示。
表6 超邊組成情況
其中,在觀點態(tài)度詞列Ki中,0 表示用戶未發(fā)表觀點,1 表示用戶發(fā)表了觀點。C1表示內(nèi)容為“接種過疫苗,第三次甚至第四次感染…”的帖子,該帖子包含話題#新冠肺炎#;C2表示內(nèi)容為“r/co?vid19positive 版有13 萬人,每天有人發(fā)表自己得了新冠…”的帖子,該帖子包含話題#新冠肺炎#;C5表示內(nèi)容為“新冠、選舉、經(jīng)濟(jì),韓國正在進(jìn)行一場逆天的實驗,新冠疫情日增破40 萬,7 天均增世界第一…”的帖子,該帖子包含話題#韓國#、#新冠肺炎#和#尹錫悅當(dāng)選韓國總統(tǒng)#;C15表示內(nèi)容為“海外疫情不斷走高,全球經(jīng)濟(jì)…”的帖子,該帖子包含話題#新冠肺炎#;C31表示內(nèi)容為“十天前獲批首款國產(chǎn)新冠口服藥的河南真實生物科技有限公司…”的帖子,該帖子包含話題#科技#、#醫(yī)藥#、#新冠肺炎#和#首款國產(chǎn)新冠口服藥公司赴港上市#;C74表示內(nèi)容為“疫情大時代背景下,為了應(yīng)對潛在的經(jīng)濟(jì)下行壓力…”的帖子,該帖子包含話題#蘋果放緩部分招聘#;C17表示內(nèi)容為“主動感染新冠會怎么樣?34 人挑戰(zhàn)實驗結(jié)果發(fā)布…”的帖子,該帖子包含話題#新冠肺炎#;C14表示內(nèi)容為“韓國把新冠降級為乙類傳染病”的帖子,該帖子包含話題#視頻星計劃#、#疫情#和#韓國#。
本論文將超網(wǎng)絡(luò)理論運用于新冠肺炎輿情傳播中的各個子網(wǎng)建模,應(yīng)用Matlab、python 仿真分析方法識別新冠肺炎輿情中的關(guān)鍵節(jié)點。介紹了輿情超網(wǎng)絡(luò)模型子網(wǎng)絡(luò),主要包括主體子網(wǎng)、信息子網(wǎng)、話題子網(wǎng)以及觀點子網(wǎng)4 層子網(wǎng)絡(luò),并依據(jù)層間的映射關(guān)系構(gòu)建輿情超網(wǎng)絡(luò)模型;還介紹了用于識別關(guān)鍵節(jié)點的超網(wǎng)絡(luò)測度指標(biāo);最后通過仿真分析,證明了超網(wǎng)絡(luò)分析法在關(guān)鍵節(jié)點識別中的可靠性。
在新冠肺炎輿情超網(wǎng)絡(luò)中識別出關(guān)鍵節(jié)點,有助于相關(guān)部門實施相應(yīng)的引導(dǎo)和干預(yù)政策,避免因消息在傳播過程中出現(xiàn)“信息失真”現(xiàn)象而引起群眾恐慌,進(jìn)而妨礙疫情防控工作。在應(yīng)對突發(fā)的公共衛(wèi)生事件輿情傳播方面,要針對該類輿情事件對群眾進(jìn)行網(wǎng)民教育,切記不信謠不傳謠、有意識地培養(yǎng)正面意見領(lǐng)袖等,這需要在公共衛(wèi)生事件輿情超網(wǎng)絡(luò)中進(jìn)行更加深入的仿真分析。