高淼
摘 要:隨著互聯網的普及,中國已成為世界第一大網民國家,網絡的重要性凸顯,而網絡輿論熱點也層出不窮,“毒跑道”事件、魏則西事件、大學生裸貸事件……都是通過網絡進行第一時間傳播,互聯網已經成為信息交流和知識共享的最好平臺,被公認為是繼報紙、廣播、電視之后的“第四媒體”,成為反映社會輿情的主要載體之一 。網絡輿論一旦被錯誤地控制和引導,將成為影響社會穩(wěn)定的重大隱患。因此,如何應對網絡輿情,目前正在考驗各級黨政機關及企事業(yè)單位。
關鍵詞:互聯網;網絡輿論;輿情
中圖分類號:G203 文獻標識碼:A 文章編號:1671-2064(2017)07-0195-01
1 引言
當前,互聯網已成為匯集輿情、暢通民意的重要平臺和渠道。政府可以通過對網絡輿情的搜集與分析來判定民眾的意愿,從而來幫助自己更好地決策,也可以更好地應對一些社會突發(fā)危機事件;企事業(yè)單位可以通過對網絡輿情的分析來有效保護和提升公司品牌形象,消減負面信息對公司的影響。
2 網絡輿情監(jiān)測技術重要性及必要性
網絡輿論的影響是巨大的,其中大部分是正面的影響,但是如果不對網絡輿情加以監(jiān)控與引導,一旦被錯誤利用,就可能產生嚴重的負面影響,以致危害個人安全,甚至是危害國家安全,如近年來娛樂圈頻發(fā)的抑郁癥自殺事件;互聯網是完全開放的虛擬的公共空間,每個網民都可以成為網絡信息的發(fā)布者,每個網民都有選擇網絡信息的自由,網絡輿情是網絡與一般社會輿情結合的產物,網絡輿情除具有社會輿情的一般特征外,還具有其它的特點:如網民在網上發(fā)布信息是匿名的,網民會直接表達自己的觀點,反映真實的情緒;網絡輿論的形成往往非常迅速;網絡輿情的主題是寬泛的、自發(fā)的、隨意的;網民普遍表現出強烈的參與意識,網絡輿情經常是互動的;網民由于各種因素影響,網絡輿論可能是感性的、情緒化的甚至是非理性的。[1]因此,如何因勢利導,及時掌握社會輿情動態(tài),積極引導社會輿論,是各級政府部門及企事業(yè)單位所面臨的嚴肅課題與嚴峻挑戰(zhàn)。
3 網絡輿情監(jiān)測技術應用研究
網絡輿情監(jiān)測的方式主要有人工方式和自動方式。人工方式主要是利用搜索引擎對網站進行人工監(jiān)測,有信息量大、搜索不全面、不能實時監(jiān)測的局限性,因此研究網絡輿情自動監(jiān)測是非常必要的。從技術角度來看,網絡輿情監(jiān)測系統(tǒng)是眾多技術結合的成果,基于內容挖掘的網絡輿情信息分析,涉及較多與自然語言處理相關的研究子領域。劉毅提出了內容分析法在網絡輿情分析中的應用,開拓了內容分析在網絡輿情監(jiān)測中的先河。[2]在網絡輿情監(jiān)測系統(tǒng)處理信息過程中,一般包含網絡輿情信息采集與提取、話題發(fā)現與追蹤、網絡輿情傾向性分析等步驟。
3.1 輿情信息采集與提取
網絡輿情主要通過新聞、論壇/BBS、博客等渠道形成和傳播,特別是近年的QQ群、微信以及Twitter等微博客,這些主要為動態(tài)網頁,以松散的非結構化信息為主體,實現準確的輿情采集和抽取存在難度。
在信息采集中,主要采用網絡爬蟲和網頁清洗等技術。網絡爬蟲是一個按照一定規(guī)則自動抓取網絡信息的程序,又稱網絡蜘蛛。網絡爬蟲分為三類:通用爬蟲、面向主題爬蟲和面向DeepWeb爬蟲??紤]到網絡輿情監(jiān)測一般是面向行業(yè)監(jiān)測,傾向于使用面向主題爬蟲。主題網絡爬蟲主要有兩種技術:基于Web鏈接分析的搜索、基于Web內容分析的搜索。網頁清洗就是從網頁中過濾掉“噪聲”數據,提取出網頁中有價值的信息內容。網頁清洗分析方法主要分為三類:基于樹結構分析方法,基于Web挖掘方法,基于正則表達式方法。
3.2 話題發(fā)現與追蹤
無論是熱點、敏感話題,還是需要重點關注的話題,如何從海量信息中找到這些話題?
話題發(fā)現與追蹤是對網絡輿情聚類分析后,利用關鍵詞過濾、語義分析、數值統(tǒng)計等方式識別被關注話題,以及熱點和敏感話題,并對其趨勢變化進行追蹤,是網絡輿情監(jiān)測中的核心技術。目前國內外的實現技術是基于文本聚類,即文本的關鍵詞作為文本的特征。話題發(fā)現與追蹤研究始于1996年美國DARPA提出一種能自動確定新聞信息流中話題結構的技術。目前,主題檢測與跟蹤研究集中于五個子任務展開,各個子任務的解決將有助于最終研究目標的實現。這五個子任務包括:對新聞報道的切分子任務、新事件的識別子任務、報道關系識別子任務、話題識別子任務、話題跟蹤子任務。[3]其中話題識別和話題追蹤是核心問題。
3.3 網絡輿情傾向性分析
輿情傾向性分析是對帶有感情色彩的主觀性文本進行分析、處理、歸納和推理的過程。傾向性分析是自然語言處理技術中新興的研究課題,具有很大的研究價值和應用價值,一般來說,它分為三個主要研究任務:情感信息抽取、情感信息分類、情感信息的檢索與歸納。[4]
通過傾向性分析可以明確網絡傳播者所蘊涵的感情、態(tài)度、觀點、立場、意圖等主觀反映。目前主要采用文本聚類和傾向性分析技術,對論壇帖子等網民評論聚類分析和傾向性分析,歸納網民觀點。一方面能夠主題趨勢跟蹤,分析新發(fā)表文章、貼子的話題是否與已有主題相同。另一方面對突發(fā)事件跨時間、跨空間綜合分析,獲知事件發(fā)生的全貌并預測發(fā)展趨勢。同時,通過傾向性分析預警功能,對突發(fā)事件、涉及內容安全的敏感話題及時發(fā)現并報警。
4 網絡輿情監(jiān)測技術問題與發(fā)展
通過網絡傳播的信息包含了網民對當前社會各種現象以及諸多熱點問題的立場和觀點,話題涉及與日常生活相關的各個領域。因此,網絡輿論能夠最直接、快速地反映各個層面的社會輿情狀況與發(fā)展態(tài)勢。把握好網絡輿情監(jiān)測技術,及時了解并正確引導輿情發(fā)展方向,對政府和企業(yè)發(fā)揮職能和生產經營至關重要。
然而,網絡輿情監(jiān)測技術還存在許多亟需完善的地方,如監(jiān)測源的獲取、復雜輿情傾向判斷、高質量輿情自動監(jiān)測、如何及時關注及應對由社會突發(fā)公共事件引起的網絡輿情問題、虛假信息和不良信息引發(fā)錯誤輿論導向問題等,這些關鍵問題的研究不僅需要我們充分利用已有的理論知識和先進的技術手段,還需要我們能夠創(chuàng)新性地提出更貼切網絡輿情實際的解決方案,來及時應對網絡輿情帶來的一系列影響。同時要繼續(xù)深化對網絡輿情的理論挖掘,加強數據挖掘技術的研究,在原有數據挖掘算法的基礎上改進或者提出新的算法,提高網絡輿情監(jiān)測技術水平,在此基礎上構建實時智能化的網絡輿情監(jiān)測以及應急處理機制。
參考文獻
[1]謝海光.互聯網內容及輿情深度分析模式.中國青年政治學院學報[J],2006,(3):95-100.
[2]劉毅.內容分析法在網絡輿情信息分析中的應用.天津大學學報(社會科學版)[J],2006(4):308-310.
[3]洪宇,張宇,劉挺,李生.話題檢測與跟蹤的評測及研究綜述.中文信息學報[J],2007.21(6):71-87.
[4]趙妍妍,秦兵,劉挺.文本情感分析.軟件學報[J],2010.10(8):1834-1848.