劉姝 王思宇 王夢(mèng)可
摘 要:隨著食品安全事件在網(wǎng)絡(luò)上的不斷曝光,食品安全已是網(wǎng)絡(luò)媒體關(guān)注的熱點(diǎn)問題。為了彌補(bǔ)傳統(tǒng)網(wǎng)絡(luò)輿情分析的不足,本文基于微博對(duì)復(fù)雜網(wǎng)絡(luò)環(huán)境下的食品安全輿情進(jìn)行分析和研究,實(shí)現(xiàn)通過復(fù)雜網(wǎng)絡(luò)相關(guān)計(jì)算來識(shí)別微博上傳播食品安全相關(guān)輿情的意見領(lǐng)袖,并驗(yàn)證意見領(lǐng)袖是否是輿情傳播的關(guān)鍵節(jié)點(diǎn),實(shí)現(xiàn)對(duì)輿情傳播的跟蹤、管控。
關(guān)鍵詞:食品安全;復(fù)雜網(wǎng)絡(luò);意見領(lǐng)袖識(shí)別;輿情傳播管控
Abstract:With the continuous exposure of food safety incidents on the Internet, food safety has become a hot issue for online media. In order to make up for the shortcomings of traditional online public opinion analysis, this article analyzes and researches food safety public opinion in a complex network environment based on Weibo, and realizes complex network-related calculations to identify opinion leaders who spread food safety-related public opinion on Weibo. This paper also verifies that opinion leader is the key node of public opinion, and realizes the tracking and control of public opinion communication.
Key words:Food safety; Complex networks; Identification of opinion leaders; Control of public opinion dissemination
中圖分類號(hào):G206
1 有關(guān)食品安全復(fù)雜網(wǎng)絡(luò)輿情的概述
在信息和話語權(quán)充分開放的新媒體時(shí)代,食品安全網(wǎng)絡(luò)輿情應(yīng)運(yùn)而生,網(wǎng)絡(luò)已成為食品安全信息傳播的載體以及民眾對(duì)食品安全事件表達(dá)觀點(diǎn)和情感的主要平臺(tái)。由于食品安全網(wǎng)絡(luò)輿情的形成速度快、傳播迅速、影響范圍大,互聯(lián)網(wǎng)在為食品安全輿情提供平臺(tái)的同時(shí)也帶來了更多不可控的因素[1]。如果與食品安全相關(guān)的監(jiān)管和執(zhí)法部門不能及時(shí)發(fā)現(xiàn)當(dāng)前的熱點(diǎn)輿情,并進(jìn)行相應(yīng)的監(jiān)控和及時(shí)的引導(dǎo),當(dāng)前的食品產(chǎn)業(yè)鏈很容易受到不良影響,并可能會(huì)危害社會(huì)經(jīng)濟(jì)的穩(wěn)定及健康發(fā)展。雖然國內(nèi)外一些學(xué)者對(duì)食品藥品安全網(wǎng)絡(luò)輿情方面已做一些研究,但很大一部分研究只是停留在網(wǎng)絡(luò)輿情的效應(yīng)方面[2],對(duì)輿情傳播控制方面的研究相對(duì)較少[3]。
本文較以往研究,從網(wǎng)絡(luò)輿情的傳播控制入手,構(gòu)建合理的輿情傳播控制模型,以此來分析輿情的發(fā)展特點(diǎn)和傳播規(guī)律。通過“極少量意見領(lǐng)袖控制絕大部分重要傳播”的社交傳播規(guī)律特性,將輿情關(guān)注從傳統(tǒng)的監(jiān)管“事件”轉(zhuǎn)為監(jiān)管“人”,用復(fù)雜網(wǎng)絡(luò)分析技術(shù)來計(jì)算和評(píng)價(jià)社交傳播節(jié)點(diǎn)的重要程度,以實(shí)現(xiàn)輿情的有效監(jiān)管。
2 重大輿情的定義及原始數(shù)據(jù)的獲取
2.1 原始數(shù)據(jù)的獲取及信息統(tǒng)計(jì)
基于500個(gè)重要的食品安全相關(guān)字段,查找距離數(shù)據(jù)抽取時(shí)間最近的前69 691條微博,這69 691條微博出現(xiàn)的時(shí)間跨度為2014年1月1日 10:01:02到2017年4月27日 21:14:05。其中有78 456個(gè)用戶參與了這期間微博的發(fā)布和轉(zhuǎn)發(fā)。平均每個(gè)用戶發(fā)布或轉(zhuǎn)發(fā)了1.313條微博,每條微博被1.478個(gè)用戶發(fā)布或轉(zhuǎn)發(fā)過。
針對(duì)每條微博,構(gòu)建以用戶為節(jié)點(diǎn)的微博轉(zhuǎn)發(fā)樹。69 691條微博對(duì)應(yīng)于69 691棵微博轉(zhuǎn)發(fā)樹,其中節(jié)點(diǎn)為微博用戶,如果用戶a從用戶b處轉(zhuǎn)發(fā)了目標(biāo)微博,則兩者之間形成一條轉(zhuǎn)發(fā)連邊。圖1展示了用戶或微博的分布特性。圖1(a)為用戶的轉(zhuǎn)發(fā)量分布;圖(b)為每條微博被參與用戶的轉(zhuǎn)發(fā)次數(shù)分布;圖(c)為轉(zhuǎn)發(fā)樹中用戶節(jié)點(diǎn)的度分布;圖(d)為轉(zhuǎn)發(fā)數(shù)中的樹規(guī)模分布。圖(a)(b)與圖(c)(d)的區(qū)別在于,前者中每個(gè)用戶可能會(huì)多次轉(zhuǎn)發(fā)特定微博,因此用戶的轉(zhuǎn)發(fā)量,以及微博的被參與用戶數(shù)目會(huì)有重復(fù)計(jì)數(shù)。由圖1可知,這4種分布皆呈現(xiàn)常見的冪律分布形式,此處選擇具有Top-N轉(zhuǎn)發(fā)量的微博作為重大輿情。圖2展示特定微博轉(zhuǎn)發(fā)量的時(shí)間分布特性。從圖2來看各個(gè)微博在不同時(shí)間的轉(zhuǎn)發(fā)量分布比較均勻,且每個(gè)時(shí)期都有轉(zhuǎn)發(fā)量特別大的特定微博。
2.2 數(shù)據(jù)集劃分
為了預(yù)測在未來一段時(shí)間,哪些用戶會(huì)大概率轉(zhuǎn)發(fā)重大輿情,將69 691條微博根據(jù)時(shí)間信息劃分為訓(xùn)練集和測試集。以2016年12月31日 22:50:25為分界點(diǎn),在之前出現(xiàn)的微博及轉(zhuǎn)發(fā)行為作為訓(xùn)練集,在之后出現(xiàn)的微博及轉(zhuǎn)發(fā)行為即為測試集,注意,由于微博在任何時(shí)間段都會(huì)不斷發(fā)生轉(zhuǎn)發(fā)行為,訓(xùn)練集和測試集中的微博會(huì)出現(xiàn)重疊現(xiàn)象。本文的目標(biāo)是基于訓(xùn)練集識(shí)別重要的意見領(lǐng)袖,并利用這些意見領(lǐng)袖預(yù)測其在測試集時(shí)間區(qū)間內(nèi)參與的重大輿情的比例。
訓(xùn)練集數(shù)據(jù)覆蓋了33 638條微博,有37 472個(gè)用戶參與到這些微博的發(fā)布或轉(zhuǎn)發(fā)行為中。平均每個(gè)用戶參與1.418條微博,每條微博有1.581個(gè)用戶參與。測試集數(shù)據(jù)覆蓋了36 140個(gè)用戶,有43 065個(gè)用戶參與到這些微博的發(fā)布和轉(zhuǎn)發(fā)行為中。平均每個(gè)用戶參與了1.158條微博,每條微博有1.370個(gè)用戶參與。
2.3 模型構(gòu)建及驗(yàn)證
利用訓(xùn)練集數(shù)據(jù),通過不同的模型策略計(jì)算用戶的重要性值并對(duì)其進(jìn)行排序,獲取前Top-r的用戶作為意見領(lǐng)袖,計(jì)算這部分用戶能夠覆蓋測試集中重大輿情的比例s。本實(shí)驗(yàn)中選被轉(zhuǎn)發(fā)總量在前20%的微博為重大輿情。本文構(gòu)建以下3個(gè)模型。
(1)Model1。用戶在訓(xùn)練集中的粉絲量fa(選取訓(xùn)練集中用戶最新時(shí)刻i的粉絲狀態(tài))用戶I 的重要性可根據(jù)公式(1)計(jì)算。
(2)Model2。用戶參與的所有微博的被轉(zhuǎn)發(fā)量f,被評(píng)論量c,被點(diǎn)贊量的總和a,用戶參與程度為α,則用戶I的重要性可根據(jù)公式(2)計(jì)算。
(3)Model3。Model1和Model2的混合可得出(3)。
圖3給出了Model1和Model2的實(shí)驗(yàn)結(jié)果。隨著選取意見領(lǐng)袖比例r的變化,Model2明顯優(yōu)于Model1。作為對(duì)比,同時(shí)給出了一個(gè)基準(zhǔn)對(duì)比,即選取訓(xùn)練集中所有重大輿情的參與用戶(這些用戶占訓(xùn)練集用戶9.97%)在測試集時(shí)間中所能覆蓋的重大輿情的比例(baseline線圖)。而如果用訓(xùn)練集的所有用戶做預(yù)測,可以覆蓋測試集中重大輿情的72.3%。也就是說,在本數(shù)據(jù)集中,利用監(jiān)管用戶,監(jiān)測重大輿情的預(yù)測上限為72.3%??梢钥吹剑脷v史中參與重大輿情的所有用戶,預(yù)測的重大輿情的效果要低于Model1和Model2指標(biāo)。圖4進(jìn)一步給出了Model3的預(yù)測效果。預(yù)測最優(yōu)值略高于Model2。
的實(shí)驗(yàn)結(jié)果。由圖4可知,最好的模型可以用10%的意見領(lǐng)袖覆蓋到測試集中64.3%的重大輿情。同時(shí)可知利用Model1,也就是利用用戶粉絲數(shù)獲取意見領(lǐng)袖要弱于利用Model2,即用戶參與微博被轉(zhuǎn)發(fā)量、點(diǎn)贊量和評(píng)論量。而之前的思路,即從參與重大輿情的用戶中進(jìn)行細(xì)粒度篩選的策略失效,如圖3相關(guān)數(shù)據(jù)所示,利用所有參與重大輿情的用戶作為意見領(lǐng)袖來覆蓋重大輿情,覆蓋率要遠(yuǎn)遠(yuǎn)低于其他兩種模型,而這部分用戶占比為9.97%。根據(jù)對(duì)比分析,可以用10%的用戶(指參與的微博具有過被轉(zhuǎn)發(fā)行為的用戶總數(shù)的10%)覆蓋64.3%的重大輿情,即能力范圍之內(nèi)所能覆蓋到的重大輿情的88.9%(64.3%/72.3%)。
以上表明,可以通過意見領(lǐng)袖來實(shí)現(xiàn)對(duì)輿情傳播的跟蹤、監(jiān)控。意見領(lǐng)袖作為輿情傳播的關(guān)鍵節(jié)點(diǎn),往往是對(duì)某一事件發(fā)表態(tài)度的活躍者,其言論或信息是其他用戶評(píng)論和轉(zhuǎn)發(fā)的焦點(diǎn),具有重大影響力。
3 結(jié)語
本文通過對(duì)食品安全網(wǎng)絡(luò)輿情的形成、特點(diǎn)進(jìn)行研究,從中查找出了食品安全輿情的關(guān)鍵控制點(diǎn),分析了復(fù)雜網(wǎng)絡(luò)輿情的傳播路徑和方式,有助于實(shí)現(xiàn)對(duì)食品安全網(wǎng)絡(luò)輿情事件的實(shí)時(shí)監(jiān)測和實(shí)時(shí)分析,對(duì)改善食品安全監(jiān)督、彌補(bǔ)食品安全監(jiān)管具有推動(dòng)作用。
參考文獻(xiàn):
[1]董凱欣,傅熒,孫曉峰,等.基于社會(huì)網(wǎng)絡(luò)分析的企業(yè)網(wǎng)絡(luò)輿情預(yù)警機(jī)制研究——以食品安全網(wǎng)絡(luò)輿情為例[J].電子商務(wù),2015(8):54-55,57.
[2]吳林海,呂煜昕,吳治海.基于網(wǎng)絡(luò)輿情視角的我國轉(zhuǎn)基因食品安全問題分析[J].情報(bào)雜志,2015,34(4):85-90.
[3]陳靜靜,劉升.基于大數(shù)據(jù)挖掘的食品安全管理研究[J].中國物價(jià),2020(7):86-88.