劉云花+黎泉
摘 要: 針對(duì)網(wǎng)絡(luò)輿情的隱蔽性與廣泛性對(duì)相關(guān)技術(shù)具有限制性的缺點(diǎn),提出了一種基于MVC模式的網(wǎng)絡(luò)輿情管理系統(tǒng)。該系統(tǒng)基于Windows平臺(tái),應(yīng)用Apache服務(wù)器,采用Java開(kāi)發(fā)語(yǔ)言,并結(jié)合AJAX技術(shù),以實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)輿情的高效采集、準(zhǔn)確監(jiān)控與預(yù)警。最后對(duì)該系統(tǒng)進(jìn)行驗(yàn)證,結(jié)果表明,該系統(tǒng)具有較強(qiáng)的實(shí)用性,滿足了用戶需求。
關(guān)鍵詞: 網(wǎng)絡(luò)輿情管理; MVC模式; 結(jié)構(gòu)設(shè)計(jì); 聚類; Java
中圖分類號(hào): TN711?34; TP393 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)24?0031?03
Abstract: In allusion to the covertness and extensiveness of network public opinions, and their constraints to the relevant technologies, a network public opinion management system based on MVC model is proposed. Apache server, Java development language and AJAX technology are used in the system based on the Windows platform to realize efficient collection, accurate monitoring and early warning of network public opinions. The system was verified. The results show that the system has strong practicality and can meet users′ needs.
Keywords: network public opinion management; MVC model; structure design; clustering; Java
0 引 言
互聯(lián)網(wǎng)隨著信息技術(shù)的發(fā)展已成為越來(lái)越重要的媒體,互聯(lián)網(wǎng)輿情監(jiān)測(cè)能力也已備受政府關(guān)注[1?3]。針對(duì)網(wǎng)絡(luò)輿情的隱蔽性與廣泛性對(duì)相關(guān)技術(shù)存在限制性的缺點(diǎn),本文提出一種基于MVC模式的網(wǎng)絡(luò)輿情管理系統(tǒng),旨在提高互聯(lián)網(wǎng)輿情檢測(cè)能力。該系統(tǒng)基于Windows平臺(tái),應(yīng)用Apache服務(wù)器,采用Java開(kāi)發(fā)語(yǔ)言,并結(jié)合AJAX技術(shù),且實(shí)現(xiàn)基于模型?試圖?控制(Model?View?Control,MVC)的系統(tǒng)技術(shù)架構(gòu)以解決系統(tǒng)結(jié)構(gòu)設(shè)計(jì)問(wèn)題。從而達(dá)到對(duì)網(wǎng)絡(luò)輿情的高效采集、準(zhǔn)確監(jiān)控與預(yù)警。
1 系統(tǒng)架構(gòu)技術(shù)
本文通過(guò)分析網(wǎng)絡(luò)輿情管理需求,采用MVC三層架構(gòu)設(shè)計(jì)該系統(tǒng),以有效解決系統(tǒng)結(jié)構(gòu)設(shè)計(jì)問(wèn)題。其中MVC是應(yīng)用于交互式的Web,尤其適用于存在大量客戶訪問(wèn)的情況[4?5]。該系統(tǒng)架構(gòu)所用技術(shù)包括網(wǎng)絡(luò)蜘蛛技術(shù)、垂直搜索采集、文本預(yù)處理與聚類和信息分析跟蹤技術(shù)。網(wǎng)絡(luò)蜘蛛技術(shù)輔助獲取輿情語(yǔ)料的核心是不斷通過(guò)網(wǎng)頁(yè)中的超鏈接獲取其他各個(gè)網(wǎng)頁(yè)內(nèi)容,其工作流程如圖1所示。
垂直搜索采集技術(shù)是搜索引擎的一個(gè)細(xì)分。相比于普通搜索引擎是抽取所有網(wǎng)頁(yè)內(nèi)容,垂直搜索引擎則僅是對(duì)相關(guān)行業(yè)信息進(jìn)行整合[6]。網(wǎng)頁(yè)文本預(yù)處理技術(shù)是對(duì)網(wǎng)頁(yè)進(jìn)行去重與特征提取,文本聚類則是為了方便人們?cè)诤A课墨I(xiàn)中定位有用文獻(xiàn)而對(duì)文獻(xiàn)進(jìn)行的有效分類方法,目前常用的有六類聚類方法:劃分、層次、密度分類、網(wǎng)絡(luò)分類和基于模型的方法。通過(guò)文本聚類得到關(guān)注的網(wǎng)站,對(duì)其進(jìn)行輿情分析與跟蹤,并分析文章語(yǔ)境進(jìn)行情感傾向性判斷。
2 網(wǎng)絡(luò)輿情管理系統(tǒng)需求分析
網(wǎng)絡(luò)輿情管理系統(tǒng)是實(shí)時(shí)分析管理與監(jiān)督網(wǎng)絡(luò)輿情信息,并將處理結(jié)果向用戶展示的系統(tǒng)。在設(shè)計(jì)系統(tǒng)時(shí),需考慮其功能可擴(kuò)展性與后期的可維護(hù)性。同時(shí),系統(tǒng)分析信息需全面廣泛覆蓋網(wǎng)絡(luò)媒介。網(wǎng)絡(luò)輿情監(jiān)督管理系統(tǒng)結(jié)構(gòu)圖如圖2所示。
網(wǎng)絡(luò)輿情監(jiān)管系統(tǒng)功能主要包括輿情規(guī)劃、檢索收集、統(tǒng)計(jì)分析、預(yù)警和分類評(píng)估功能。網(wǎng)絡(luò)輿情規(guī)劃是設(shè)定監(jiān)督主題,并確定搜索范圍;網(wǎng)絡(luò)輿情檢索由全文數(shù)據(jù)庫(kù)提供檢索功能;系統(tǒng)的關(guān)鍵是輿情分析,使用數(shù)據(jù)庫(kù)和數(shù)據(jù)挖掘等技術(shù)對(duì)海量數(shù)據(jù)進(jìn)行分析以實(shí)現(xiàn)輿情信息的精確管理;通過(guò)設(shè)置閾值系統(tǒng)實(shí)現(xiàn)自動(dòng)報(bào)警;輿情分類評(píng)估是分析總結(jié)與備案輿情事件,分析統(tǒng)計(jì)輿情熱點(diǎn),為優(yōu)化輿情監(jiān)督系統(tǒng)提供依據(jù)。除以上所述功能外,該系統(tǒng)還包括個(gè)性化、用戶權(quán)限管理與數(shù)據(jù)維護(hù)等功能。系統(tǒng)簡(jiǎn)要流程如圖3所示。系統(tǒng)功能結(jié)構(gòu)關(guān)系圖如圖4所示。
該系統(tǒng)的性能需求是滿足準(zhǔn)確數(shù)據(jù)輸入、輸出與遠(yuǎn)程傳輸。系統(tǒng)對(duì)本地局域網(wǎng)的響應(yīng)速度不超過(guò)5 s,遠(yuǎn)程用戶的響應(yīng)速度不超過(guò)10 s,且要保證數(shù)據(jù)訪問(wèn)與傳輸?shù)陌踩裕约皯?yīng)用級(jí)數(shù)據(jù)庫(kù)的安全。
3 系統(tǒng)設(shè)計(jì)
3.1 系統(tǒng)架構(gòu)
本文設(shè)計(jì)的系統(tǒng)采用MVC先進(jìn)架構(gòu)與B/S結(jié)構(gòu),根據(jù)監(jiān)督站點(diǎn)數(shù)量決定信息采集服務(wù)器個(gè)數(shù),服務(wù)器為主流服務(wù)器、Linux 操作系統(tǒng)??筛鶕?jù)實(shí)際情況調(diào)整其他應(yīng)用模塊服務(wù)器的數(shù)量,最終實(shí)現(xiàn)基于瀏覽器的瘦客戶端模式[7?8]。該系統(tǒng)網(wǎng)絡(luò)拓?fù)鋱D如圖5所示。系統(tǒng)開(kāi)發(fā)采用Java語(yǔ)言,使用標(biāo)準(zhǔn)通信協(xié)議,數(shù)據(jù)庫(kù)為SQL Server,以提高系統(tǒng)性能,網(wǎng)頁(yè)顯示界面采用HTML與AJAX集成技術(shù)。該系統(tǒng)技術(shù)架構(gòu)如圖6所示。
3.2 數(shù)據(jù)庫(kù)設(shè)計(jì)
數(shù)據(jù)庫(kù)設(shè)計(jì)需要按照數(shù)據(jù)規(guī)模進(jìn)行設(shè)計(jì),并充分考慮數(shù)據(jù)容量。該設(shè)計(jì)主要有逐步分解數(shù)據(jù)流對(duì)數(shù)據(jù)進(jìn)行分析與面向?qū)ο笠罁?jù)功能對(duì)數(shù)據(jù)分類這兩種策略[9?10]。數(shù)據(jù)庫(kù)根據(jù)系統(tǒng)功能而產(chǎn)生,一般設(shè)計(jì)過(guò)程包括目標(biāo)確定與數(shù)據(jù)收集、概念設(shè)計(jì)、數(shù)據(jù)模型建立、數(shù)據(jù)庫(kù)的維護(hù)。
3.3 系統(tǒng)功能與安全設(shè)計(jì)endprint
該系統(tǒng)主要由信息采集、信息檢索、信息分析與服務(wù)三個(gè)模塊構(gòu)成,如圖7所示。系統(tǒng)從大量Web頁(yè)面采集信息并進(jìn)行結(jié)構(gòu)化存儲(chǔ)供系統(tǒng)數(shù)據(jù)分析,系統(tǒng)中最為關(guān)鍵的處理模塊是輿情分析模塊,采用聚類方法分析挖掘預(yù)處理后的素材信息。
系統(tǒng)安全問(wèn)題始終是系統(tǒng)構(gòu)建者需要著重考慮的,本系統(tǒng)采用IP控制、驗(yàn)證碼、三方認(rèn)證和加密鎖等措施應(yīng)對(duì)惡意攻擊與入侵情況。
4 系統(tǒng)實(shí)現(xiàn)與驗(yàn)證
該系統(tǒng)基于Windows系統(tǒng)開(kāi)發(fā),運(yùn)行采集爬蟲(chóng)與并行搜索以提高效率。所實(shí)現(xiàn)系統(tǒng)的登錄界面如圖8所示。用戶管理界面如圖9所示。其包括用戶創(chuàng)建、刪改、訪問(wèn)權(quán)限的管理與用戶信息查詢、登錄記錄等功能。輿情采集事件管理實(shí)現(xiàn)界面如圖10所示。本文最后對(duì)系統(tǒng)進(jìn)行功能測(cè)試,并給出了測(cè)試報(bào)告。通過(guò)測(cè)試報(bào)告可看出,本文所設(shè)計(jì)的系統(tǒng)準(zhǔn)確性高,具有較強(qiáng)的實(shí)用性,能滿足用戶需求。
5 結(jié) 語(yǔ)
針對(duì)網(wǎng)絡(luò)輿情的隱蔽性與廣泛性對(duì)相關(guān)技術(shù)存在限制性的缺點(diǎn),本文提出一種基于MVC模式的網(wǎng)絡(luò)輿情管理系統(tǒng)。該系統(tǒng)基于Windows平臺(tái),應(yīng)用Apache服務(wù)器,采用Java開(kāi)發(fā)語(yǔ)言,并結(jié)合AJAX技術(shù),以實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)輿情的高效采集、準(zhǔn)確監(jiān)控與預(yù)警。本文最后對(duì)該系統(tǒng)進(jìn)行驗(yàn)證,結(jié)果表明該系統(tǒng)具有較強(qiáng)的實(shí)用性,滿足了用戶需求。
參考文獻(xiàn)
[1] 丁學(xué)君.基于SIR的SNS網(wǎng)絡(luò)輿情話題傳播模型研究[J].計(jì)算機(jī)仿真,2015,32(1):241?247.
[2] 史玉珍,單冬紅.基于Hadoop的網(wǎng)絡(luò)輿情監(jiān)控平臺(tái)的研究[J].電子測(cè)試,2015(9):71?73.
[3] 李宇博.基于文本聚類技術(shù)的網(wǎng)絡(luò)輿情分析系統(tǒng)的研究與應(yīng)用[D].天津:天津工業(yè)大學(xué),2016.
[4] 丁蒙蒙.突發(fā)事件網(wǎng)絡(luò)輿情監(jiān)測(cè)指標(biāo)體系構(gòu)建研究[D].成都:電子科技大學(xué),2015.
[5] EDWARDS J, MCCURLEY K, TOMLIN J. An adaptive model for optimizing performance of an incremental Web crawler [J]. Association for computing machinery, 2001: 106?113.
[6] 孟強(qiáng),李海晨.Web數(shù)據(jù)挖掘技術(shù)及應(yīng)用研究[J].電腦與信息技術(shù),2017,25(1):59?62.
[7] 肖紅,許少華.改進(jìn)的話題檢測(cè)和跟蹤算法研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2014(9):84?88.
[8] CHANG F, DEAN J, GHEMAWAT S, et al. A distributed storage system for structured data [C]// Proceedings of the 7th Symposium on Operating System Design and Implementation, 2006: 205?218.
[9] 房春波.“微時(shí)代”高校網(wǎng)絡(luò)輿情生成與干預(yù)機(jī)制研究[J].通訊世界,2016(5):252?253.
[10] MEHRA A. The development of social network analysis: a study in the sociology of science by Linton C. Freeman [J]. Empirical press, 2005, 50(1): 148?151.endprint