• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于微博關(guān)注網(wǎng)絡(luò)的轉(zhuǎn)發(fā)預(yù)測算法研究

      2020-08-21 09:09:32劉超姚耿楊宏雨
      關(guān)鍵詞:信息傳播預(yù)測模型微博

      劉超 姚耿 楊宏雨

      摘要:針對目前研究轉(zhuǎn)發(fā)預(yù)測的方法忽視了微博傳播過程中用戶關(guān)注網(wǎng)絡(luò)的問題,基于微博信息的轉(zhuǎn)發(fā)機制,結(jié)合傳染病建模理論,提出一種基于微博關(guān)注網(wǎng)絡(luò)的轉(zhuǎn)發(fā)預(yù)測模型。首先建立微博轉(zhuǎn)發(fā)者與其被關(guān)注粉絲之間的數(shù)量關(guān)系,然后建立微博傳播者預(yù)測模型。微博數(shù)據(jù)集上的實驗結(jié)果表明,與基準(zhǔn)模型相比,該模型能夠取得更好的預(yù)測效果。

      關(guān)鍵詞:微博;預(yù)測模型;信息傳播

      中圖分類號:TP391.9 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2020)07-0121-04

      0 引言

      在線社交媒體和社交網(wǎng)絡(luò)已成為人類生活中不可替代的重要部分,例如新浪微博作為國內(nèi)最活躍的社交網(wǎng)絡(luò)之一,在2018年其月活躍用戶達(dá)4.62億,連續(xù)三年增長數(shù)量超過7000萬[1]。在線社交網(wǎng)絡(luò)已經(jīng)成為互聯(lián)網(wǎng)時代最重要的人際交互平臺,使得虛擬網(wǎng)絡(luò)成為當(dāng)今社會熱點話題和輿情傳播的主要渠道。在此背景下,預(yù)測用戶生成內(nèi)容的受歡迎程度,其在眾多應(yīng)用中的實用價值而引起了廣泛關(guān)注[2],因此預(yù)測信息傳播的流行程度已成為了在線社交網(wǎng)絡(luò)研究的重要內(nèi)容。

      微博作為中國最具影響力的社交媒體平臺之一,對微博流行度的預(yù)測已經(jīng)成為當(dāng)前的研究熱點。由于微博的轉(zhuǎn)發(fā)數(shù)據(jù)較為容易獲取,并且微博轉(zhuǎn)發(fā)量能夠反映微博在一段時間內(nèi)的熱度,因此一般采用微博的轉(zhuǎn)發(fā)量作為微博流行度的量化指標(biāo),從而將對微博的流行度預(yù)測轉(zhuǎn)化為對微博發(fā)布后對轉(zhuǎn)發(fā)數(shù)量的預(yù)測,根據(jù)其早期的轉(zhuǎn)發(fā)動態(tài)來預(yù)測其最終的轉(zhuǎn)發(fā)量[3]。

      目前對微博轉(zhuǎn)發(fā)量的預(yù)測有基于時間序列、基于回歸模型、基于傳染病模型等多種預(yù)測方法。基于時間序列的方法是對微博轉(zhuǎn)發(fā)量進(jìn)行時間序列建模,研究微博轉(zhuǎn)發(fā)量在一段時間內(nèi)的變化規(guī)律[4],這種方法不考慮微博傳播過程中的個體差異,通常只適用于研究微博傳播的一般情況[3]?;诨貧w的方法是通過挖掘影響微博傳播中的關(guān)鍵因素,一般包括發(fā)布時間、文本內(nèi)容、評論數(shù)量等,利用這些特征建立回歸模型,從而預(yù)測微博最終轉(zhuǎn)發(fā)量[5]。這種方法的困難在于不易選擇合適的特征,并且需要較多的歷史數(shù)據(jù)訓(xùn)練模型[3]。最后,基于流行病模型的預(yù)測方法是以傳染病學(xué)和傳播學(xué)的理論研究基礎(chǔ),構(gòu)建新的傳播規(guī)則和模型,建模思路清晰可靠,已成為微博轉(zhuǎn)發(fā)預(yù)測的一種重要方法。本文選擇基于傳染病模型,對微博轉(zhuǎn)發(fā)量進(jìn)行預(yù)測。

      傳染病建模的基本建模思路是把微博網(wǎng)絡(luò)中的用戶節(jié)點劃分為多個倉室,通常有未知者S、傳播者I和免疫者R。對于某條微博,未知者S表示沒有接觸過這條微博的用戶,傳播者I表示接觸過并且會以一定概率轉(zhuǎn)發(fā)該微博的用戶。免疫者R表示接觸過微博后不會進(jìn)行傳播的用戶。微博的轉(zhuǎn)發(fā)擴散就表示為用戶節(jié)點在不同倉室之間的轉(zhuǎn)移[6]。在經(jīng)典SIR模型的基礎(chǔ)上,Xiong等[7]增加了接觸信息者C,建立了基于轉(zhuǎn)發(fā)機制的信息傳播模型,接觸信息者C表示閱讀了這條微博,但還沒有決定是否要轉(zhuǎn)發(fā)。Zang等[8]在SI模型的基礎(chǔ)上提出了一種網(wǎng)絡(luò)增長模型,將信息在社交網(wǎng)絡(luò)上的傳播過程轉(zhuǎn)化為網(wǎng)絡(luò)的增長,實現(xiàn)了對社交網(wǎng)絡(luò)中用戶數(shù)量變化的預(yù)測。他們建立的這種模型將早期指數(shù)增長網(wǎng)絡(luò)放緩至中后期的冪律增長,更加精確地描述了網(wǎng)絡(luò)的變化過程。

      本文基于對微博傳播過程的分析,建立了一種基于關(guān)注網(wǎng)絡(luò)的微博轉(zhuǎn)發(fā)量預(yù)測模型,考慮了微博在傳播過程中潛在關(guān)注者數(shù)量的變化,并根據(jù)這一動態(tài)變化的指標(biāo)預(yù)測未來轉(zhuǎn)發(fā)量。在開源數(shù)據(jù)集上進(jìn)行的實驗結(jié)果表明,本文建立的模型相比基準(zhǔn)模型,能夠?qū)崿F(xiàn)更好的預(yù)測效果。

      1 模型建立

      在微博網(wǎng)站上,當(dāng)某個用戶發(fā)出一條微博時,只有這個用戶的粉絲可以收到這條信息,并考慮該信息是否值得轉(zhuǎn)發(fā)。如果一些用戶決定轉(zhuǎn)發(fā)它,那么這些用戶的粉絲就有機會閱讀和傳播這條微博。這些粉絲的轉(zhuǎn)發(fā)又會帶來新的用戶去閱讀和傳播。這樣這條微博信息的影響就超出了發(fā)布者的局部網(wǎng)絡(luò),并且有機會在微博網(wǎng)絡(luò)上擴散到更大范圍。

      基于上述的信息傳播機制,我們的模型以下列方式定義。在每個時間步里,轉(zhuǎn)發(fā)者和其他用戶之間的交互行為有以下規(guī)則:

      (1)定義轉(zhuǎn)發(fā)者為I,每個轉(zhuǎn)發(fā)者的粉絲會收到微博信息,因此,這個轉(zhuǎn)發(fā)者的粉絲會成為這條微博的潛在關(guān)注者。

      (2)全部的潛在關(guān)注者構(gòu)成一個倉室S,并且會有的概率轉(zhuǎn)發(fā)這條微博,即以的速度轉(zhuǎn)變?yōu)檗D(zhuǎn)發(fā)者。當(dāng)該S倉室內(nèi)的用戶轉(zhuǎn)變?yōu)檗D(zhuǎn)發(fā)者后,這個用戶的粉絲會在下一個時刻加入到倉室S中。

      可以看出,在該模型中,存在兩種狀態(tài),分別是轉(zhuǎn)發(fā)者I,以及潛在關(guān)注者S。這個模型的一個重要特征就是S并不是一個定值,而是根據(jù)初始微博傳播的數(shù)據(jù),建立S和I之間的數(shù)量關(guān)系:。我們將分別定義為在t時刻潛在關(guān)注者和轉(zhuǎn)發(fā)者的數(shù)量。因此在的時間段內(nèi),新增I的數(shù)量可計算為:

      通過對微博傳播數(shù)據(jù)的分析,發(fā)現(xiàn)潛在關(guān)注者數(shù)量S與微博傳播初期的轉(zhuǎn)發(fā)者數(shù)量I,以及初期轉(zhuǎn)發(fā)者的平均粉絲數(shù)相關(guān),其中S和I之間存在較為明顯的函數(shù)關(guān)系。當(dāng)轉(zhuǎn)發(fā)數(shù)量較小時,微博處在一個快速傳播的階段, 此階段轉(zhuǎn)發(fā)數(shù)會大幅增加,在這個階段,平均粉絲數(shù)較大,反映了在傳播初期,參與傳播的用戶多為活躍用戶,微博影響力較大。此時,每個參與轉(zhuǎn)發(fā)的用戶會帶來較多的潛在關(guān)注者,因此總的S數(shù)量相對I數(shù)量呈現(xiàn)出更加快速的增長。

      隨著時間的增加, 轉(zhuǎn)發(fā)快速增長階段結(jié)束后,總轉(zhuǎn)發(fā)次數(shù)在慢慢趨于平穩(wěn),這個階段轉(zhuǎn)發(fā)率下降到一個較低程度。此時,主要參與轉(zhuǎn)發(fā)的是數(shù)量相對較多的普通用戶,他們擁有較小的粉絲數(shù),但是由于整體的轉(zhuǎn)發(fā)數(shù)量較多,因此也會使?jié)撛陉P(guān)注者的數(shù)量在短時間內(nèi)有明顯的增長。之后隨著轉(zhuǎn)發(fā)率和單位時間內(nèi)轉(zhuǎn)發(fā)數(shù)的進(jìn)一步下降,新接受到信息的潛在關(guān)注者較少,因此信息較少發(fā)生傳播,總轉(zhuǎn)發(fā)量在較長時間上維持穩(wěn)定。

      由上述分析,可以根據(jù)某微博在t時刻的轉(zhuǎn)發(fā)數(shù)量I,計算得到對應(yīng)的未感染者數(shù)量,如公式(4):

      由上述公式,可以得到任意時刻I的數(shù)量。首先利用LM算法,在微博傳播的初始階段進(jìn)行擬合,最小化誤差和,得到參數(shù)。再將參數(shù)帶入到公式中,計算得到下一時間點的I的數(shù)量。為了使I的預(yù)測值更加準(zhǔn)確,也為了方便計算,需要讓計算時間間隔較小,保證條件成立。

      2 實驗分析

      2.1 數(shù)據(jù)預(yù)處理與評價指標(biāo)

      本文的實驗數(shù)據(jù)來自Jing Zhang等[9]采集的微博轉(zhuǎn)發(fā)數(shù)據(jù)集。該數(shù)據(jù)集采集了170萬用戶的微博數(shù)據(jù),并構(gòu)建了這170萬用戶之間的關(guān)注關(guān)系網(wǎng)絡(luò)。為了準(zhǔn)確評價實驗結(jié)果,使用絕對誤差MAPE,以及平均絕對誤差MAE,其計算公式為分別為公式(10)、公式(11)。

      2.2 實驗分析

      2.2.1 微博熱度對模型預(yù)測效果的影響

      首先,在實驗數(shù)據(jù)集上用本文提出的模型進(jìn)行實驗,以每條微博發(fā)布后4h的數(shù)據(jù)為訓(xùn)練集,對未來24h的微博轉(zhuǎn)發(fā)量進(jìn)行預(yù)測。模型對不同熱度的微博預(yù)測結(jié)果如圖1。根據(jù)實驗結(jié)果可以看出,本文提出的轉(zhuǎn)發(fā)量預(yù)測模型能夠較為準(zhǔn)確的對微博的未來轉(zhuǎn)發(fā)量進(jìn)行預(yù)測。特別是對于微博轉(zhuǎn)發(fā)量較大、熱度較高的微博,預(yù)測效果較好。

      2.2.2 預(yù)測時間對模型預(yù)測效果的影響

      選擇數(shù)據(jù)集中轉(zhuǎn)發(fā)量超過20000的微博數(shù)據(jù),用本文提出的模型以及對比的模型進(jìn)行測試,對比模型分別采用SH[10]、LL[11]、UAPA[12]。計算模型在微博發(fā)布后的各個時間節(jié)點上的預(yù)測誤差,結(jié)果如圖2所示。根據(jù)實驗結(jié)果可知,隨著預(yù)測時間的增大,模型的誤差也會增大。從總體上看,本文提出的模型(SIP)在各時間段內(nèi),均有較低的預(yù)測誤差,同時相比其他模型,準(zhǔn)確率也更高。

      3 結(jié)語

      本文基于微博轉(zhuǎn)發(fā)的實際規(guī)律,結(jié)合傳染病建模理論,建立了一個針對微博轉(zhuǎn)發(fā)量的預(yù)測模型。首先用參與傳播者的粉絲作為微博的關(guān)注者,代替?zhèn)魅静∧P凸潭〝?shù)量的初始未感染者,并建立了微博關(guān)注者與轉(zhuǎn)發(fā)者數(shù)量關(guān)系方程,利用已知數(shù)據(jù)擬合其中的參數(shù),然后又建立了轉(zhuǎn)發(fā)者數(shù)量的預(yù)測模型。將本文建立的模型在真實數(shù)據(jù)集上進(jìn)行實驗,證明該模型有較好的預(yù)測效果。

      參考文獻(xiàn)

      [1] 2018微博用戶發(fā)展報告[R].北京:新浪微博數(shù)據(jù)中心,2019.

      [2] 胡長軍,許文文,胡穎,等.在線社交網(wǎng)絡(luò)信息傳播研究綜述[J].電子與信息學(xué)報,2017,39(4):794-804.

      [3] 吳越,陳曉亮,蔣忠遠(yuǎn).微博信息流行度預(yù)測研究綜述[J].西華大學(xué)學(xué)報,2017,36(1):1-6.

      [4] Yang J,Leskovec J.Patterns of temporal variation in online media[C]//Proceedings of the fourth ACM international conference on Web search and data mining.ACM,2011:177-186.

      [5] Jamali S,Rangwala H.Digging digg:Comment mining, popularity prediction,and social network analysis[C]//2009 International Conference on Web Information Systems and Mining.IEEE,2009:32-38.

      [6] 李洋,陳毅恒,劉挺.微博信息傳播預(yù)測研究綜述[J].軟件學(xué)報,2016,27(2):247-263.

      [7] Xiong F,Liu Y,Zhang Z,et al.An information diffusion model based on retweeting mechanism for online social media[J]. Physics Letters A,2012,376(30-31):2103-2108.

      [8] Zang C,Cui P,F(xiàn)aloutsos C.Beyond sigmoids:The nettide model for social network growth,and its applications[C]//Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.ACM,2016:2015-2024.

      [9] Zhang J,Tang J,Li J,et al. Who influenced you? predicting retweet via social influence locality[J].ACM Transactions on Knowledge Discovery from Data (TKDD),2015,9(3):25.

      [10] Szabo G,Huberman B A.Predicting the Popularity of Online Content[J].Communications of the ACM,2010,53(8):80-88.

      [11] Shen H,Wang D,Song C,et al.Modeling and predicting popularity dynamics via reinforced poisson processes[C]//Twenty-eighth AAAI conference on artificial intelligence.2014.

      [12] 朱海龍,云曉春,韓志帥.基于傳播加速度的微博流行度預(yù)測方法[J].計算機研究與發(fā)展,2018,55(6):1282-1293.

      猜你喜歡
      信息傳播預(yù)測模型微博
      青少年數(shù)字素養(yǎng)的社會與文化內(nèi)涵及其教育啟示
      基于神經(jīng)網(wǎng)絡(luò)的北京市房價預(yù)測研究
      商情(2016年43期)2016-12-23 14:23:13
      中國石化J分公司油氣開發(fā)投資分析與預(yù)測模型研究
      事實與流言的博弈
      人間(2016年26期)2016-11-03 18:19:04
      全媒體語境下體育新聞教育建設(shè)的思索
      體育時空(2016年8期)2016-10-25 19:28:14
      網(wǎng)絡(luò)輿論對公共政策制定的影響
      中國市場(2016年36期)2016-10-19 05:18:35
      媒介融合背景下對新聞記者素質(zhì)的要求
      科技視界(2016年21期)2016-10-17 20:52:33
      如何進(jìn)行突發(fā)事件中的輿情引導(dǎo)
      人民論壇(2016年27期)2016-10-14 13:09:41
      基于IOWHA法的物流需求組合改善與預(yù)測模型構(gòu)建
      基于預(yù)測模型加擾動控制的最大功率點跟蹤研究
      科技視界(2016年1期)2016-03-30 13:37:45
      环江| 松原市| 南阳市| 门头沟区| 南城县| 霞浦县| 五台县| 嘉禾县| 阿瓦提县| 海门市| 文成县| 安新县| 绥中县| 土默特左旗| 阿勒泰市| 新郑市| 泰来县| 和林格尔县| 辽阳市| 洛浦县| 西华县| 江城| 嘉祥县| 洛宁县| 汝阳县| 佛学| 桑植县| 区。| 绥江县| 昭通市| 衡南县| 九龙城区| 虹口区| 伊通| 闽清县| 石景山区| 阳曲县| 焉耆| 鲁山县| 青冈县| 新建县|