劉榮叁+張宇+王星
摘 要: 隨著微博的高速發(fā)展,微博信息溯源成為信息內(nèi)容安全管理的重要研究內(nèi)容之一。此前的信息溯源研究中,事件數(shù)據(jù)純度不高,且用戶影響力涉及的因素考慮得不夠全面,本文即針對以上問題進(jìn)行研究。首先,由于微博信息采集過程中,得到的數(shù)據(jù)純度較低,對大量的新浪微博數(shù)據(jù)進(jìn)行事件聚類,得到某一具體事件的相關(guān)微博。接著,為了得到更合理的用戶影響力數(shù)值,針對具體事件涉及到的用戶,考慮多個因素,進(jìn)行用戶影響力分析,得到用戶的影響力數(shù)值。最后,綜合考慮微博的發(fā)布時間和用戶影響力數(shù)值,使用Hacker News排序算法,對具體事件進(jìn)行信息溯源。最終分析得出了事件傳播過程中,發(fā)布時間較早,且用戶影響力較大的一篇微博為事件源頭。
關(guān)鍵詞: 新浪微博;事件聚類;用戶影響力分析;信息溯源
中圖分類號:TP391.41
文獻(xiàn)標(biāo)志碼:A
文章編號:2095-2163(2017)02-0094-05