楊?yuàn)?,王?,王傳彪,李昊展,劉銘
(1.中國傳媒大學(xué)數(shù)據(jù)科學(xué)與智能媒體學(xué)院,北京 100024;2.中國傳媒大學(xué)融合與傳播國家重點(diǎn)實(shí)驗(yàn)室,北京 100024)
突發(fā)公共事件[1]是指突然發(fā)生的,可能會(huì)造成社會(huì)危害的事件,其中往往存在復(fù)雜的、富有爭議的因素,容易引起網(wǎng)民的關(guān)注和討論。互聯(lián)網(wǎng)的實(shí)時(shí)性和去中心化提升了信息的擴(kuò)散速度和影響范圍,自媒體等意見領(lǐng)袖的加入使傳統(tǒng)的議程設(shè)置發(fā)生變化,傳播主體因其賬號影響力的高低不同,信息獲取的實(shí)效性不同,對輿情發(fā)展的推動(dòng)力也不盡相同。
當(dāng)輿情發(fā)生時(shí),網(wǎng)絡(luò)信息傳播的過程是官方媒體首先發(fā)布事件報(bào)道形成信息源,而后意見領(lǐng)袖介入,對信息進(jìn)行篩選、加工,并摻入自己的觀點(diǎn)[2]。網(wǎng)絡(luò)意見領(lǐng)袖不能直接控制網(wǎng)民“怎么想”,但他們可以利用信息權(quán)力,以迎合網(wǎng)民的方式解讀輿情,并將特定的價(jià)值理念編輯進(jìn)“意見”,潛移默化地引導(dǎo)網(wǎng)民“想什么”[3]。網(wǎng)民會(huì)同時(shí)接收信息源和再加工的信息,并選擇是否加入到信息傳播的過程中。
因此,在突發(fā)性公共輿情事件中,回答如下三方面問題對于厘清輿情傳播脈絡(luò),掌握輿情規(guī)律進(jìn)而正確引導(dǎo)和控制輿情具有重要作用。
(1)知網(wǎng)事件輿論走勢存在什么規(guī)律,有哪些特征?
(2)社交網(wǎng)絡(luò)信息傳播呈現(xiàn)網(wǎng)絡(luò)傳播特征,每個(gè)人即是信息接收者,也是傳播者,輿情事件意見領(lǐng)袖和把關(guān)人對信息傳播的走勢起重要的主導(dǎo)作用,在知網(wǎng)事件中信息傳播的網(wǎng)絡(luò)結(jié)構(gòu)特征和拓?fù)浣Y(jié)構(gòu)中的“意見領(lǐng)袖”等重要節(jié)點(diǎn)有哪些特征?
(3)關(guān)鍵節(jié)點(diǎn)(即意見領(lǐng)袖)起到什么作用,有怎樣的觀點(diǎn)輸出及情感傾向?
本文運(yùn)用社會(huì)網(wǎng)絡(luò)分析方法探究參與輿情傳播的各個(gè)節(jié)點(diǎn)之間的拓?fù)潢P(guān)系,以及重要節(jié)點(diǎn)的作用,分析“知網(wǎng)被市場監(jiān)管局立案調(diào)查”輿情事件,在此基礎(chǔ)上使用LDA主題提取和情感識別,探究重要節(jié)點(diǎn)的輿論引導(dǎo)傾向。
對于重大突發(fā)事件引發(fā)的網(wǎng)絡(luò)輿情,有多種研究角度。根據(jù)拉斯韋爾5W模式,傳播過程中存在五種基本要素:傳播者、信息內(nèi)容、媒介、接收者和傳播效果,每種要素均可作為研究的切入點(diǎn)。劉波維[4]等人對輿情研究的視角進(jìn)行分析,將不同視角的網(wǎng)絡(luò)輿情研究成果進(jìn)行編碼和分析,得出輿情研究的幾大范疇,包括主體、客體、引發(fā)者、輿情傳播理論、輿情功能、傳播內(nèi)容等。本文從中選取用戶互動(dòng)和信息內(nèi)容作為研究角度。
基于用戶互動(dòng)的角度,眾多用戶在社交網(wǎng)絡(luò)上的互動(dòng)行為構(gòu)成了巨大的復(fù)雜網(wǎng)絡(luò),此前有眾多研究人員利用社會(huì)網(wǎng)絡(luò)分析方法探究傳播結(jié)構(gòu)及重要節(jié)點(diǎn)的識別。基于信息內(nèi)容的角度,有研究者運(yùn)用話題識別和情感分析捕捉熱點(diǎn)話題,判斷輿論導(dǎo)向。
Huang[5]等認(rèn)為可以將復(fù)雜網(wǎng)絡(luò)中度最大的節(jié)點(diǎn)看作“意見領(lǐng)袖”,通過影響這些節(jié)點(diǎn)來控制信息在網(wǎng)絡(luò)中傳播,這一方法被應(yīng)用于多種復(fù)雜網(wǎng)絡(luò)的意見領(lǐng)袖挖掘。Kitsak[6]等人指出,網(wǎng)絡(luò)中節(jié)點(diǎn)的傳播能力與節(jié)點(diǎn)所處的位置有重要關(guān)系,處于網(wǎng)絡(luò)核心位置的節(jié)點(diǎn)有較高的影響力。趙蓉英[7]等采用社會(huì)網(wǎng)絡(luò)分析方法,進(jìn)行突發(fā)事件網(wǎng)絡(luò)輿情關(guān)鍵節(jié)點(diǎn)識別研究,通過網(wǎng)絡(luò)社群圖分析、接近中心性分析和K-叢分析等,挖掘出與情傳播的內(nèi)在結(jié)構(gòu)以及演化規(guī)律。劉小平[8]等通過測度部分媒體微博的網(wǎng)絡(luò)結(jié)構(gòu)特征,結(jié)合中心度與LeaderRank算法衡量微博節(jié)點(diǎn)的影響力。孫羽[9]等基于網(wǎng)絡(luò)分析和文本挖掘劃分意見領(lǐng)袖社團(tuán),分析“特朗普美國大選游行事件”中各類意見領(lǐng)袖的特點(diǎn)。安璐[10]等從意見領(lǐng)袖的評論內(nèi)容及用戶間的交互人入手識別網(wǎng)絡(luò)意見領(lǐng)袖。劉嘉琪[11]等基于社會(huì)網(wǎng)絡(luò)分析方法,分析意見領(lǐng)袖、普通節(jié)點(diǎn)與在線群體影響力間的關(guān)系。
吳曉娟[12]利用LDA模型分析“藍(lán)色錢江縱火案”在不同輿情時(shí)期的微博話題演化過程。Yuan[13]等利用LDA提取颶風(fēng)期間的Twitter數(shù)據(jù)中公眾關(guān)注的問題。Wang[14]等利用LDA模型識別新冠肺炎疫情期間用戶最常發(fā)布的主題,并結(jié)合點(diǎn)贊量、評論量和轉(zhuǎn)發(fā)量等數(shù)據(jù)對不同話題進(jìn)行了用戶行為分析,研究了用戶關(guān)注度的變化和話題參與度差異。黃仕靖[15]等對數(shù)據(jù)文本進(jìn)行情感分析及LDA主題模型建模,對不同階段及不同群體的輿情時(shí)空演化及差異進(jìn)行內(nèi)容分析。劉雅姝[16]等在突發(fā)事件網(wǎng)民評論的話題圖譜上,利用LDA模型提取了話題圖譜實(shí)體中的話題和時(shí)間屬性,從多維特征融合角度追蹤突發(fā)事件輿情的演化過程。肖倩[17]等將卷積神經(jīng)網(wǎng)絡(luò)與LDA模型相結(jié)合,利用了輿情熱度與其傳播過程間的潛在關(guān)聯(lián),設(shè)計(jì)了熱點(diǎn)輿情識別方法。鄧春林[18]對突發(fā)公共安全事件的微博評論進(jìn)行聚類,用LDA主題模型對評論文本進(jìn)行關(guān)鍵要素提取,得出歸因維度,進(jìn)而通過情感分析軟件對各維度進(jìn)行情感傾向度分析。
已有研究提出構(gòu)建社交網(wǎng)絡(luò),利用網(wǎng)絡(luò)結(jié)構(gòu)特征、節(jié)點(diǎn)位置、節(jié)點(diǎn)中心性特征、社群分析等多種方法研究意見領(lǐng)袖的識別,利用LDA主題提取模型研究輿情事件演化過程,對文本數(shù)據(jù)進(jìn)行情感傾向分析。上述成果對突發(fā)事件的輿情研究具有重要的借鑒意義。但已有研究僅聚焦用戶互動(dòng)或傳播內(nèi)容進(jìn)行單一角度的信息傳播特征研究,本文將以上研究綜合起來,以更全面、更完整、更系統(tǒng)的視角分析突發(fā)性輿情事件。
因此,在以上學(xué)者的研究基礎(chǔ)上,本文采用社會(huì)網(wǎng)絡(luò)分析方法以突發(fā)事件“知網(wǎng)被市場監(jiān)管局立案調(diào)查”為例,先探究轉(zhuǎn)發(fā)網(wǎng)絡(luò)特征,識別網(wǎng)絡(luò)中的意見領(lǐng)袖,再進(jìn)一步提取意見領(lǐng)袖的觀點(diǎn)輸出及情感傾向。
本文選取微博和百度作為主要研究平臺(tái)。研究對象是5月13日知網(wǎng)事件爆發(fā)期間參與信息傳播的博主,包括官媒用戶、自媒體用戶、普通用戶,共計(jì)37794名,以及部分博主發(fā)布的文章內(nèi)容。
本文使用Python語言爬蟲程序爬取微博數(shù)據(jù),獲得熱搜話題轉(zhuǎn)、贊、評情況。通過UID跟蹤微博主體轉(zhuǎn)發(fā)關(guān)系,經(jīng)過清洗后獲得知網(wǎng)報(bào)道轉(zhuǎn)發(fā)網(wǎng)絡(luò)。使用八爪魚采集器爬取百家號數(shù)據(jù),得到百度移動(dòng)端和PC端的用戶搜索指數(shù),以及媒體發(fā)布的文章內(nèi)容。
3.3.1 網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)特征分析
當(dāng)人們通過社會(huì)網(wǎng)絡(luò)交換信息的同時(shí),也建立起了一個(gè)龐大的傳播信息網(wǎng)絡(luò)。個(gè)體間的相互作用對信息傳播有著至關(guān)重要的影響。本文建構(gòu)了一個(gè)經(jīng)典的無權(quán)有向轉(zhuǎn)發(fā)網(wǎng)絡(luò),使用Python中的Networkx包,網(wǎng)絡(luò)分析工具Gephi和Pajek,對轉(zhuǎn)發(fā)網(wǎng)絡(luò)進(jìn)行定量的整體分析,對個(gè)體間關(guān)系和相互影響進(jìn)行精細(xì)測量。
研究流程如圖1所示。
圖1 轉(zhuǎn)發(fā)網(wǎng)絡(luò)研究指標(biāo)
各指標(biāo)對應(yīng)的表達(dá)式如表1所示。
表1 表達(dá)式
其中,ki表示與節(jié)點(diǎn)i直接相連的節(jié)點(diǎn)數(shù);N表示網(wǎng)絡(luò)中節(jié)點(diǎn)總數(shù);Ei表示節(jié)點(diǎn)i與相鄰點(diǎn)間直接連接的邊數(shù);dij表示目標(biāo)節(jié)點(diǎn)i到節(jié)點(diǎn)j的距離;Aij是鄰接矩陣中的元素;c表示矩陣A中特征值最大值的倒數(shù);pij代表行動(dòng)者i投入到相連點(diǎn)j的關(guān)系所占比例;q是除i或j之外的每個(gè)第三者,pqj代表第三者q投入到相連點(diǎn)j的關(guān)系所占比例。
3.3.2 意見領(lǐng)袖發(fā)表內(nèi)容分析
(1)LDA主題提取
LDA(隱含狄利克雷分布)[19]是一種文檔主題生成模型,也稱為一個(gè)三層貝葉斯概率模型,包含詞、主題和文檔三層結(jié)構(gòu)。一篇文章的每個(gè)詞都是通過“以一定概率選擇了某個(gè)主題,并從這個(gè)主題中以一定概率選擇某個(gè)詞語”這樣一個(gè)過程得到。文檔到主題服從多項(xiàng)式分布,主題到詞服從多項(xiàng)式分布,本文需要提取出意見領(lǐng)袖輸出的核心報(bào)道主題。先進(jìn)行分詞處理、分詞向量化,隨后使用Python中的庫pyLDAvis,指定單詞個(gè)數(shù)上限和主題個(gè)數(shù)等參數(shù),將數(shù)據(jù)填進(jìn)模型,抽取出主題,最后用pyLDAvis可視化。
(2)情感分析
情感分析是判定文本中對某一話題所表現(xiàn)出的態(tài)度或情緒傾向性的過程、技術(shù)和方法,本文需要判斷意見領(lǐng)袖輸出的觀點(diǎn)攜帶的情感傾向。采用Python中的庫SnowNLP和Pandas,直接對文件中的文本進(jìn)行情感值打分。SnowNLP[20]可以進(jìn)行文本預(yù)處理,例如分詞、詞性標(biāo)注提取關(guān)鍵詞等,同時(shí)該程序包也可以進(jìn)行情感分析,使用的基本模型是貝葉斯模型,即對于有兩個(gè)類別c1和c2的分類問題來說,其特征為w1,…,wn,特征之間是相互獨(dú)立的,屬于類別c1的貝葉斯模型的基本過程為:,其中P(w1,…,wn)=P(w1,…,wn|c1)?P(c1)+P。最終得到的取值為[0,1],0表示極端負(fù)面,1表示極端正面。
研究流程如圖2所示。
圖2 文章內(nèi)容研究指標(biāo)
知網(wǎng)在論文平臺(tái)中擁有極高的市場占有率,近年因連年漲價(jià)的高昂服務(wù)費(fèi)被多所高校抵制。如圖3所示,從去年趙德馨教授的論文被下架,國家市場監(jiān)管總局就表示將核實(shí)研究知網(wǎng)是否涉嫌壟斷;到今年中科院停用知網(wǎng),國家市場監(jiān)管總局在網(wǎng)上留言回應(yīng),表示正在依法開展相關(guān)工作。2022年5月13日,市場監(jiān)管總局對知網(wǎng)涉嫌壟斷行為立案調(diào)查。
圖3 知網(wǎng)事件時(shí)間軸
圖4搜索指數(shù)源于百度移動(dòng)端和PC端的用戶搜索情況。圖中標(biāo)出五個(gè)較高極值點(diǎn),對應(yīng)上圖時(shí)間軸中紅色的時(shí)間節(jié)點(diǎn)。
圖4 知網(wǎng)搜索指數(shù)
此次事件前期潛伏期長,從去年開始關(guān)于知網(wǎng)的議題就開始頻繁出現(xiàn)在大眾視野中,基本都是負(fù)面議題,議程設(shè)置的功能得到充分發(fā)揮。事件爆發(fā)之前,知網(wǎng)的負(fù)面形象已經(jīng)在人群中廣泛傳播。
2021年12月中旬,因趙教授系列事件,知網(wǎng)短暫維持在較高搜索熱度,之后熱度回落。從今年二月底開始,知網(wǎng)一直處于較高搜索熱度,與畢業(yè)生準(zhǔn)備畢業(yè)論文時(shí)間重合。4月18日知網(wǎng)搜索熱度飆升,當(dāng)天中科院宣布年內(nèi)與知網(wǎng)無合作計(jì)劃。4月26日,國家市場監(jiān)督管理總局在網(wǎng)上留言表示已關(guān)注到各方面反映的知網(wǎng)涉嫌壟斷問題,正在依法開展相關(guān)工作。此前趙教授的妻子周秀鸞也進(jìn)行維權(quán),5月9日,知網(wǎng)就賠償金額過高提出上訴,二審被駁回。5月13日搜索熱度再次飆升,當(dāng)天下午4點(diǎn),由中國之聲首發(fā)報(bào)道,市場監(jiān)管總局宣布對知網(wǎng)涉嫌壟斷行為立案調(diào)查,此次輿情爆發(fā)。
此次事件爆發(fā)期短,因?yàn)檫@是一個(gè)收尾事件,前期知網(wǎng)的所作所為現(xiàn)在國家已經(jīng)開始調(diào)查,大眾得到了想看到的結(jié)果。
圖5為話題#知網(wǎng)涉嫌壟斷被立案調(diào)查#詞條中參與討論用戶的轉(zhuǎn)、贊、評情況。篩選出點(diǎn)贊量大于90的博主列入下圖,按點(diǎn)贊數(shù)由大到小排序,其中媒體官號與自媒體號均為13個(gè),各占50%。發(fā)揮議程設(shè)置的功能,這些媒體和自媒體通過提供信息來吸引受眾關(guān)注到知網(wǎng)事件中。受眾不是被動(dòng)的信息接收者,而是積極的網(wǎng)絡(luò)傳播參與者,通過轉(zhuǎn)、評、贊的方式給媒體予以反饋。其它媒體的信息均從信息源“中國之聲”獲得,它們承擔(dān)了意見領(lǐng)袖的作用。而“中國之聲”既是信息源,又是意見領(lǐng)袖,它作為信息源起到傳遞信息的功能,作為意見領(lǐng)袖發(fā)揮的作用是在他的追隨者中構(gòu)成信息和影響的重要來源,并左右追隨者的態(tài)度。它的特殊地位給予它比其它媒體高出數(shù)十倍的數(shù)據(jù)量。
圖5 話題#知網(wǎng)涉嫌壟斷被立案調(diào)查#轉(zhuǎn)贊評情況
轉(zhuǎn)發(fā)是輿情信息擴(kuò)散的方法和主要途徑,而意見領(lǐng)袖在其中處于關(guān)鍵位置,對于信息擴(kuò)散起到主導(dǎo)作用,最大化地促進(jìn)信息傳播。故本節(jié)構(gòu)建轉(zhuǎn)發(fā)網(wǎng)絡(luò),先分析網(wǎng)絡(luò)全局特征,再綜合多種指標(biāo)識別網(wǎng)絡(luò)中的意見領(lǐng)袖節(jié)點(diǎn)。
將采集到的新浪微博轉(zhuǎn)發(fā)和被轉(zhuǎn)發(fā)用戶數(shù)據(jù)導(dǎo)入Gephi,繪制轉(zhuǎn)發(fā)網(wǎng)絡(luò)云圖,如圖6所示。運(yùn)用Py‐thon計(jì)算得到轉(zhuǎn)發(fā)網(wǎng)絡(luò)的基本指標(biāo),如表2所示。根據(jù)運(yùn)算結(jié)果可以看出,總計(jì)37794名用戶參與到知網(wǎng)話題的信息傳播,他們之間發(fā)生轉(zhuǎn)發(fā)的總次數(shù)為42482次,整體上節(jié)點(diǎn)用戶數(shù)量規(guī)模較大,相互之間傳播互動(dòng)數(shù)量較少。參與傳播的人數(shù)多、范圍廣,原因可能是潛伏期已經(jīng)歷幾次傳播,了解知網(wǎng)事件的受眾規(guī)模大。
圖6 轉(zhuǎn)發(fā)網(wǎng)絡(luò)可視化(右無中國之聲)
表2 轉(zhuǎn)發(fā)網(wǎng)絡(luò)基本指標(biāo)
知網(wǎng)信息轉(zhuǎn)發(fā)網(wǎng)絡(luò)的平均度值為2.248,表示每個(gè)節(jié)點(diǎn)用戶之間平均相互發(fā)生聯(lián)系的用戶數(shù)量為2.248。此轉(zhuǎn)發(fā)網(wǎng)絡(luò)的直徑僅為2,表示網(wǎng)絡(luò)中任意兩點(diǎn)之間的最長距離較小。普通用戶主要與傳播網(wǎng)絡(luò)中的意見領(lǐng)袖直接建立轉(zhuǎn)發(fā)聯(lián)系,中介節(jié)點(diǎn)非常少。網(wǎng)絡(luò)密度接近0,為稀疏網(wǎng)絡(luò)。
5.2.1 連接狀況嚴(yán)重不均的異質(zhì)網(wǎng)絡(luò)
運(yùn)用Gephi統(tǒng)計(jì)分析功能得出知網(wǎng)信息轉(zhuǎn)發(fā)網(wǎng)絡(luò)直徑為2,即網(wǎng)絡(luò)中任意兩點(diǎn)間距離的最大值僅為2。平均聚類系數(shù)為0.042,該值體現(xiàn)用戶之間的聚集程度,即網(wǎng)絡(luò)中兩個(gè)用戶之間存在聯(lián)系的概率為0.042,用戶之間聯(lián)系不緊密。平均路徑長度為1.002,即用戶平均通過1.002個(gè)節(jié)點(diǎn)用戶就可以與其他節(jié)點(diǎn)用戶接觸。該網(wǎng)絡(luò)聚類系數(shù)小,平均長度遠(yuǎn)小于6,不符合基于六度分隔理論的小世界網(wǎng)絡(luò)。
使用Gephi統(tǒng)計(jì)分析功能得出圖7度分布圖,為使圖中度分布顯著,則排除度最大節(jié)點(diǎn)中國之聲,得出知網(wǎng)事件轉(zhuǎn)發(fā)網(wǎng)絡(luò)中的結(jié)點(diǎn)的度符合冪律分布,故該網(wǎng)絡(luò)為節(jié)點(diǎn)度數(shù)嚴(yán)重不均勻的無標(biāo)度網(wǎng)絡(luò)。
圖7 網(wǎng)絡(luò)節(jié)點(diǎn)度分布(除中國之聲)情況
網(wǎng)絡(luò)中轉(zhuǎn)發(fā)鏈路的長度短、寬度窄,傳播速度快,傳播效率高。用戶之間的接觸和信息交流嚴(yán)重不均勻,大部分普通用戶為底層邊緣節(jié)點(diǎn),傳播路徑到他們即終止,只有少數(shù)關(guān)鍵節(jié)點(diǎn)在信息傳播中起主導(dǎo)作用。關(guān)鍵節(jié)點(diǎn)的識別將在下節(jié)詳細(xì)討論。
5.2.2 社群內(nèi)部層級擴(kuò)散
運(yùn)用Gephi的模塊化功能社區(qū)探測算法分解網(wǎng)絡(luò)。解析度越小,社區(qū)越多;解析度越大,社區(qū)越小。采用適中的解析度3,得出4個(gè)子網(wǎng)絡(luò),如圖8所示。采用Modularity Class進(jìn)行顏色渲染,直觀地得出四個(gè)凝聚子群,其規(guī)模差異大,集群現(xiàn)象明顯,如圖9所示。
圖8 模塊化社區(qū)探測結(jié)果
圖9 modularity class顏色渲染圖
規(guī)模最大的子網(wǎng)絡(luò)是由信息源“中國之聲”主導(dǎo)的,擁有整體網(wǎng)絡(luò)中92.42%的節(jié)點(diǎn),數(shù)量超過三萬。它與其他三個(gè)子網(wǎng)絡(luò)均有緊密聯(lián)系,三個(gè)子網(wǎng)絡(luò)各自無過多聯(lián)系。
排名第二的子網(wǎng)絡(luò)以官媒“央視新聞”主導(dǎo),另外四個(gè)大度節(jié)點(diǎn)“亭山樵者”、“五分之一刷”、“錦衣夜行焱十一”“蘿卜糖桃桃的抖森喵”均轉(zhuǎn)發(fā)了央視新聞的信息;排名第三的子網(wǎng)絡(luò)以自媒體博主“午后狂睡”主導(dǎo),另外兩個(gè)大度節(jié)點(diǎn)“禾幾Voix”、“JinnoNagi的男朋友雷歐”均轉(zhuǎn)發(fā)了“午后狂睡”的信息;排名第四的子網(wǎng)絡(luò)以自媒體博主“夢嘚啵嘚佳”主導(dǎo),大度節(jié)點(diǎn)“橄欖不菜”轉(zhuǎn)發(fā)了“夢嘚啵嘚加”的信息。而三個(gè)小規(guī)模子網(wǎng)絡(luò)的主導(dǎo)節(jié)點(diǎn)均轉(zhuǎn)發(fā)了信息源“中國之聲”的信息,傳播過程呈多階梯型擴(kuò)散體系,從信息源到受眾中間出現(xiàn)多個(gè)層次的意見領(lǐng)袖,形成多級傳播,如圖10所示。
圖10 多級傳播示意圖
雖然信息傳播的參與人數(shù)多,但是輿論主要由一方主導(dǎo),不存在輿論對立和輿論失焦的現(xiàn)象。在整個(gè)網(wǎng)絡(luò)傳播過程中,從一級傳播到多級傳播均有涉及。
5.3.1 節(jié)點(diǎn)指標(biāo)測度分析
(1)K-Shell分解
K殼分解可用于區(qū)分網(wǎng)絡(luò)中節(jié)點(diǎn)的重要程度,識別網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn),分解過程是逐漸剝除當(dāng)下度為1的節(jié)點(diǎn),也就是最不重要的節(jié)點(diǎn),重復(fù)循環(huán)該操作直至網(wǎng)絡(luò)中沒有度為1的節(jié)點(diǎn)。K值由小到大,重要程度遞增,4殼節(jié)點(diǎn)是網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn),中國之聲、央視新聞、午后狂睡等核心領(lǐng)導(dǎo)力節(jié)點(diǎn)均位于4‐shell中。各類節(jié)點(diǎn)數(shù)量如圖11所示。K核子圖如圖12所示,K值相同節(jié)點(diǎn)存在小范圍聚集情況,但各個(gè)子群聯(lián)系不緊密。
圖11 知網(wǎng)信息轉(zhuǎn)發(fā)網(wǎng)絡(luò)K?Shell數(shù)量
圖12 知網(wǎng)信息轉(zhuǎn)發(fā)網(wǎng)絡(luò)K?Shell子圖
(2)度中心性
該轉(zhuǎn)發(fā)網(wǎng)絡(luò)排名前10的節(jié)點(diǎn)用戶度中心性結(jié)果,如圖13所示。通過對節(jié)點(diǎn)用戶點(diǎn)度中心性分析可以看出,形成轉(zhuǎn)發(fā)網(wǎng)絡(luò)中心度排名前三的節(jié)點(diǎn)分別是初始源節(jié)點(diǎn)中國之聲、央視新聞、午后狂睡。前兩者是媒體官號,后者是影評博主,粉絲量都達(dá)到百萬千萬的級別,發(fā)揮著意見領(lǐng)袖的作用。節(jié)點(diǎn)用戶的度中心性越大,他們的節(jié)點(diǎn)圈越大,從圖6也可以看出這三個(gè)節(jié)點(diǎn)用戶的圈較大。
圖13 知網(wǎng)信息轉(zhuǎn)發(fā)網(wǎng)絡(luò)度中心性和出度情況
出度表示被轉(zhuǎn)發(fā)次數(shù),入度表示轉(zhuǎn)發(fā)次數(shù)。出度體量遠(yuǎn)大于入度,信息流動(dòng)呈單向化。用戶普遍僅轉(zhuǎn)發(fā)一次,最多轉(zhuǎn)發(fā)四次,如圖14所示。說明受眾對知網(wǎng)事件的參與度不深入,傾向于單一地轉(zhuǎn)發(fā)有影響力的信息源。
圖14 知網(wǎng)信息轉(zhuǎn)發(fā)網(wǎng)絡(luò)入度情況
其中中國之聲作為信息源頭,出度達(dá)到37729,相當(dāng)于被轉(zhuǎn)發(fā)37729次。作為央廣旗下的媒體,同時(shí)具備信息源和意見領(lǐng)袖的作用,其消息來源真實(shí)度高,獲取信息早,社會(huì)地位高,更容易受到受眾的追捧,故度中心性處于壟斷地位。
(3)接近中心性
圖15列出接近中心性0.5以上的用戶,這些用戶到其他用戶的最短距離很小,接近幾何上的中心位置,更容易參與到信息傳播過程中。相對地獨(dú)立性也較強(qiáng),不易受到其他節(jié)點(diǎn)的影響。有些節(jié)點(diǎn)同時(shí)擁有較大的度中心性和接近中心性,如中國之聲、央視新聞、午后狂睡、火法火法等。他們是知網(wǎng)信息傳播過程中的核心領(lǐng)導(dǎo)力,在形成的轉(zhuǎn)發(fā)網(wǎng)絡(luò)中發(fā)揮著重要的作用。
圖15 知網(wǎng)信息轉(zhuǎn)發(fā)網(wǎng)絡(luò)接近中心性
(4)結(jié)構(gòu)洞
結(jié)構(gòu)洞[21]是指兩個(gè)關(guān)系人之間的非重復(fù)關(guān)系。如果兩者之間缺少直接的聯(lián)系,而必須通過第三者才能形成聯(lián)系,那么行動(dòng)的第三者就在關(guān)系網(wǎng)絡(luò)中占據(jù)了一個(gè)結(jié)構(gòu)洞,結(jié)構(gòu)洞是針對于第三者而言的。節(jié)點(diǎn)占據(jù)的結(jié)構(gòu)洞越多,它的地位就越重要,通常用限制度來測量。
將數(shù)據(jù)導(dǎo)入Pajek中,算出限制度,如圖16,取數(shù)值小于0.24的節(jié)點(diǎn),與對應(yīng)節(jié)點(diǎn)的度中心性比對,基本走勢成反比。限制度指節(jié)點(diǎn)間存在阻礙的程度,值越小的節(jié)點(diǎn),越不易受到控制,擁有更多的資源,具有更多的結(jié)構(gòu)洞,他們是傳播網(wǎng)絡(luò)中的信息中樞,這些節(jié)點(diǎn)的度中心性也處于領(lǐng)先位置。
圖16 知網(wǎng)信息轉(zhuǎn)發(fā)網(wǎng)絡(luò)限制度
(5)特征向量中心性
特征向量中心性強(qiáng)調(diào)節(jié)點(diǎn)鄰居的數(shù)量和質(zhì)量,特征向量中心性高的節(jié)點(diǎn)連接了很多其他重要節(jié)點(diǎn)。圖17顯示的是用戶數(shù)量與特征向量中心性數(shù)值的關(guān)系。特征向量為1的節(jié)點(diǎn)均是通過和少量高分值節(jié)點(diǎn)相連來提高自身的重要性,他們是積極參與到傳播網(wǎng)絡(luò)中的普通用戶,多次轉(zhuǎn)發(fā)意見領(lǐng)袖的信息。但大部分普通用戶沒有深入?yún)⑴c到傳播過程中,對此事件的關(guān)注淺嘗輒止,值為0.0158的用戶高達(dá)91.42%。
圖17 知網(wǎng)信息轉(zhuǎn)發(fā)網(wǎng)絡(luò)特征向量中心性
5.3.3 意見領(lǐng)袖特征
意見領(lǐng)袖是關(guān)鍵節(jié)點(diǎn),是信息中樞,擔(dān)任傳播中的核心領(lǐng)導(dǎo)力,在其中起到信息傳遞和意見分發(fā)的關(guān)鍵作用。綜上可知,他們的特征即是擁有較大的出度、k值、度中心性和接近中心性,以及較小的限制度。
通過對擁有這些特征的節(jié)點(diǎn)取交集,我們可以識別出網(wǎng)絡(luò)中的意見領(lǐng)袖,包括官媒“中國之聲”和“央視新聞”,影評人“午后狂睡”,動(dòng)漫博主“火法火法”和“JinnoNagi的男朋友雷歐”,娛樂博主“夢嘚啵嘚佳”和“橄欖不菜”,軍事博主“禾幾Voix”,飯圈大粉“蘿卜糖桃桃的抖森喵”和“五分之一刷”,法律博主“普法達(dá)人張三”,科技博主“亭山樵者”。他們分屬不同領(lǐng)域,影響不同圈層,再次體現(xiàn)了此次事件的影響范圍之廣。其中信息源“中國之聲”處于轉(zhuǎn)發(fā)網(wǎng)絡(luò)中的壟斷地位,其出度值、度中心性和接近中心性以及首發(fā)微博的轉(zhuǎn)贊評都排在首位,并且數(shù)據(jù)量比其他意見領(lǐng)袖高數(shù)十倍。
上一節(jié)討論了意見領(lǐng)袖節(jié)點(diǎn)在轉(zhuǎn)發(fā)網(wǎng)絡(luò)中的特征和作用,即傳播主體之間的互動(dòng)。本節(jié)針對意見領(lǐng)袖發(fā)布的文章內(nèi)容進(jìn)行討論,也就是傳播內(nèi)容。
基于主流媒體及自媒體發(fā)聲,利用文本分析方法提取其語義信息,觀察意見領(lǐng)袖對輿情事件的加工解讀,繪制詞云如圖18所示?!爸袊薄ⅰ笆袌觥?、“壟斷”、“調(diào)查”、“學(xué)術(shù)”、“論文”等詞匯被提及頻率排行前列,媒體大多從客觀事實(shí)角度出發(fā)陳述事件,整體對該事件持中立態(tài)度。
圖18 媒體發(fā)文詞云圖
利用LDA主題提取方法得到主題數(shù)困惑度情況如圖19所示,選擇較低困惑度對應(yīng)的主題數(shù),得到“事件闡述”、“經(jīng)營狀況”兩個(gè)主題。
圖19 主題數(shù)困惑度情況
兩個(gè)主題各自包含的排名前二十的單詞詞頻排序分別如圖20、圖21所示?!笆录U述”主題中,“知網(wǎng)”、“中國”、“論文”三個(gè)單詞P值大于0.95,與主題相關(guān)程度最高,該主題與事件發(fā)展始末的敘述高度相關(guān)?!敖?jīng)營狀況”主題中,前20個(gè)單詞與主題相關(guān)程度差別不大,大多數(shù)單詞用來描述知網(wǎng)當(dāng)前經(jīng)營情況?!笆录U述”內(nèi)最低詞頻高于“經(jīng)營狀況”內(nèi)最高詞頻,說明媒體把主要關(guān)注點(diǎn)放在事件本身,衍生話題關(guān)注度較低。
圖20 “事件闡述”單詞詞頻排序
圖21 “經(jīng)營狀況”單詞詞頻排序
綜上,媒體報(bào)道主要從此次立案調(diào)查事件的發(fā)展始末闡述以及知網(wǎng)經(jīng)營狀況兩個(gè)角度展開。這兩個(gè)角度也是在解答受眾關(guān)心的問題,即知網(wǎng)為什么會(huì)被調(diào)查,以及知網(wǎng)在本行業(yè)的壟斷地位從何而來。
使用SnowNLP計(jì)算百家號正文情感得分,其分布情況如圖22所示。其中,得分大于0.55表示積極,0.45-0.55表示中立,小于0.45表示消極。
圖22 內(nèi)容情感態(tài)度
過半數(shù)文章對知網(wǎng)事件進(jìn)行積極闡述,即對知網(wǎng)被市場監(jiān)管局調(diào)查持支持態(tài)度。其他文章均采用中立情緒敘述,沒有消極情緒的文章出現(xiàn)。同時(shí),通過觀察原始得分?jǐn)?shù)據(jù),所有文章得分均在0.48-0.62之間,說明媒體大多持中立偏積極的態(tài)度對事件進(jìn)行報(bào)道。
之前對知網(wǎng)的報(bào)道大部分為負(fù)面報(bào)道,與其在業(yè)內(nèi)處于壟斷地位的經(jīng)營狀況和對學(xué)者的不公平待遇有關(guān),已形成“學(xué)界苦知網(wǎng)久矣”的輿論傾向。此次知網(wǎng)被調(diào)查,媒體持的態(tài)度符合先前的議程走向,與先前知網(wǎng)系列報(bào)道輿情導(dǎo)向一致。
本研究基于5月13日的知網(wǎng)事件從傳播網(wǎng)絡(luò)和發(fā)布內(nèi)容兩個(gè)層面分析傳播規(guī)律和輿論傾向。得出如下結(jié)論:
(1)此次事件前期潛伏期長,爆發(fā)期短,參與傳播的人數(shù)多、范圍廣,轉(zhuǎn)發(fā)網(wǎng)絡(luò)符合無標(biāo)度網(wǎng)絡(luò)特征。輿論主要由一方主導(dǎo),不存在輿論對立和輿論失焦的現(xiàn)象。傳播呈單向流動(dòng),過程呈多階梯型擴(kuò)散體系,從信息源到受眾中間出現(xiàn)多個(gè)層次的意見領(lǐng)袖,形成多級傳播。
(2)用戶個(gè)體化強(qiáng),互動(dòng)性低,互相聯(lián)系松散,普通用戶主要與傳播網(wǎng)絡(luò)中的意見領(lǐng)袖直接建立轉(zhuǎn)發(fā)關(guān)系,中介節(jié)點(diǎn)非常少。僅有少量普通用戶多次轉(zhuǎn)發(fā)關(guān)鍵節(jié)點(diǎn)的信息,大部分普通用戶沒有深入?yún)⑴c到傳播過程中。意見領(lǐng)袖擁有較大的出度、k值、度中心性和接近中心性,以及較小的限制度。識別出的意見領(lǐng)袖分屬不同領(lǐng)域,影響不同圈層。其中信息源“中國之聲”處于轉(zhuǎn)發(fā)網(wǎng)絡(luò)中的壟斷地位,其各個(gè)特征均排在首位。
(3)事件的議程設(shè)置與先前知網(wǎng)系列報(bào)道輿情導(dǎo)向一致。報(bào)道內(nèi)容均持中立偏積極的態(tài)度,無消極內(nèi)容,報(bào)道主題以事件闡述和經(jīng)營狀況為主。
本次突發(fā)性輿情事件的傳播特征分析可以為輿情預(yù)測和控制提供如下參考:(1)對于輿情預(yù)測,如果事件存在潛伏期,可以通過提取報(bào)道主題和情感傾向,觀察潛伏期的議程設(shè)置與此次事件是否一致,來預(yù)測用戶反應(yīng)和輿論走向。若一致,則輿論由一方主導(dǎo)的幾率較大;若不一致,則需要警惕次生輿情引起的討論。(2)對于信息控制,可以用以上指標(biāo)識別其中的關(guān)鍵節(jié)點(diǎn),有針對地持續(xù)監(jiān)測,以減少工作量。通過控制這些節(jié)點(diǎn),提取他們輸出信息內(nèi)容的主題,判斷與目標(biāo)輿情傾向是否相符,來決定擴(kuò)散還是抑制這些節(jié)點(diǎn)的傳播,讓他們充當(dāng)把關(guān)者。