薛標
摘 要:資訊匯聚系統(tǒng)是針對新聞的時效性而開發(fā)的專門對網(wǎng)絡(luò)新聞、微博、微信、短信等新媒體上的信息進行銜接和管理,并能夠?qū)崿F(xiàn)信息的采集、搜索、審核、發(fā)布等需求的系統(tǒng)。本文從資訊匯聚的應(yīng)用背景、設(shè)計架構(gòu)、軟硬件功能幾個方面進行分析討論,以供同業(yè)者參考借鑒。
關(guān)鍵詞:資訊匯聚;信息采集審核;系統(tǒng)設(shè)計;軟硬件功能
1 資訊匯聚系統(tǒng)的應(yīng)用背景
在競爭如此激烈的今天,哪個媒體最先掌握了最新最熱門的資訊,哪個媒體就更容易獲得更多的觀眾與關(guān)注。在信息技術(shù)日新月異的今天,新媒體不斷的涌現(xiàn),如網(wǎng)絡(luò)、新聞、微博、微信、短信等,尤其是近幾年出現(xiàn)的微博,以其高度的時效性、易傳播性,成為媒體中的翹楚。但是這些新興媒體也有其自身的局限性,如單條的信息量較小、信息的深度與廣度還遠遠不夠等,還必須與傳統(tǒng)媒體如與電視、報紙、新媒體等相結(jié)合,才能產(chǎn)生既具有時效性又具有廣度與深度的新聞。在這種背景下,很多電視臺及新媒體運營開始關(guān)注并重視網(wǎng)絡(luò)、新聞、短信,特別是微博、微信等新興媒體的信息采集,充分利用互聯(lián)網(wǎng)傳播特點,第一時間從互聯(lián)網(wǎng)發(fā)現(xiàn)新聞線索以及獲得原始素材提供給記者進行深度調(diào)查和報道。因此,演播室部署專門的“資訊匯聚”系統(tǒng)成為必然。該系統(tǒng)是專門針對電視臺與新媒體運營對互聯(lián)網(wǎng)信息的采集、搜索、線索發(fā)現(xiàn)、信息發(fā)布等需求而開發(fā)的專業(yè)系統(tǒng)。
2 資訊匯聚系統(tǒng)設(shè)計架構(gòu)
1)業(yè)務(wù)模塊設(shè)計。
資訊匯聚系統(tǒng)結(jié)構(gòu)分為數(shù)據(jù)層和業(yè)務(wù)層兩個層次,化分為數(shù)據(jù)采集前端服務(wù)和篩選審查終端兩大模塊,兩個模塊間使用Socket進行通訊以便應(yīng)對不同的部署環(huán)境,另外還有一個下載服務(wù)模塊。數(shù)據(jù)采集前端服務(wù)主要負責數(shù)據(jù)采集,主要有:短信數(shù)據(jù)抓取、微博數(shù)據(jù)抓取、圖片視頻文件下載、前端服務(wù)管理等模塊。篩選審查終端將從服務(wù)器拿到的數(shù)據(jù)保存到數(shù)據(jù)庫,并提供篩選、編輯、審核、推送功能,主要分為:終端配置管理、短信篩選編輯、短信審核推送、微博篩選編輯、微博審核推送、短信投票抽獎、微博投票抽獎。整個系統(tǒng)的流程圖可以用下圖明確表示:
2)系統(tǒng)方案設(shè)計。
資訊匯聚系統(tǒng)的整個網(wǎng)絡(luò)結(jié)構(gòu)由資訊匯聚內(nèi)網(wǎng)服務(wù)器、外網(wǎng)服務(wù)器、審核工作站和以太網(wǎng)交換機組成。審核工作站、資訊匯聚內(nèi)網(wǎng)服務(wù)器通過網(wǎng)線連接到交換機,外網(wǎng)服務(wù)器直接連接外網(wǎng),數(shù)據(jù)信息通過外網(wǎng)服務(wù)器采集到數(shù)據(jù)庫,再由USB擺渡把信息傳到內(nèi)網(wǎng)服務(wù)器上,審核工作站直接讀取內(nèi)網(wǎng)服務(wù)器中的數(shù)據(jù)信息,并且將篩選后的數(shù)據(jù)存入資訊匯聚內(nèi)網(wǎng)服務(wù)器中,資訊匯聚內(nèi)網(wǎng)服務(wù)器可將數(shù)據(jù)推送給在線包裝點評系統(tǒng),在線包裝點評系統(tǒng)根據(jù)數(shù)據(jù)自動匹配模板,生成播出表單。資訊匯聚系統(tǒng)拓撲圖如下所示:
3 軟硬件功能
1)資訊匯聚審核客戶端。
安裝了采集審核軟件的審核工作站能夠接收資訊控制終端的控制命令,控制數(shù)據(jù)抓取模塊匯聚互聯(lián)網(wǎng)上的資訊內(nèi)容。審核客戶端把視頻、圖文、短信、微博、微信等信息源及時抓取并進行內(nèi)容管理,通過web服務(wù)進行雙向交互。可根據(jù)實際需求把資訊內(nèi)容主動推送給各個系統(tǒng)或由各個系統(tǒng)主動獲取資訊內(nèi)容信息實時播出,同時控制文件下載客戶端下載文件。作為一個獨立存在的應(yīng)用程序軟件,采集審核軟件通過Socket和資訊控制終端中進行通信,可以同時接受多個資訊控制終端的控制。
2)資訊匯聚服務(wù)器。
資訊匯聚服務(wù)器可實時采集互聯(lián)網(wǎng)上最新發(fā)布的微博、網(wǎng)站等信息進行篩選修改后推送到在線包裝系統(tǒng)進行展示。在系統(tǒng)設(shè)計架構(gòu)里,分為內(nèi)網(wǎng)服務(wù)器和外網(wǎng)服務(wù)器兩種。資訊匯聚外網(wǎng)服務(wù)器負責微信、微博等綜合信息的采集,采集的信息通過USB擺渡由內(nèi)網(wǎng)資訊匯聚服務(wù)器負責提供信息下載服務(wù)。
4 結(jié)語
資訊匯聚系統(tǒng)可實現(xiàn)如下功能:①能及時地從微博、論壇、新聞等互聯(lián)網(wǎng)新媒體抓取信息;②能實時抓取微信,包括圖片、文字、語音;③深度抓取微博粉絲、關(guān)注、回復(fù)、評論等;④支持智能搜索并配備強大的內(nèi)容審核功能;⑤根據(jù)時間段、關(guān)鍵詞等統(tǒng)計要素形成趨勢圖、各種分布統(tǒng)計圖功能;⑥獨特的采集監(jiān)測技術(shù),及時跟蹤采集源的變化并作出相應(yīng)的調(diào)整策略,保障數(shù)據(jù)的安全性與完整性;⑦支持多通道多任務(wù)的集群式采集;⑧支持一對多的應(yīng)用模式,一臺服務(wù)器可以鏈接多臺資訊匯聚篩選段;⑨支持遠程審核,用戶在任意網(wǎng)絡(luò)下都可以編輯審核條目;⑩微信微博條目支持簡單編輯圖片、視頻源;1111用戶可以在任何客戶端獲取服務(wù)器資源并進行編輯,同時支持多客戶端同時在線使用;1212支持用戶管理模塊,可以實現(xiàn)用戶分類、用戶授權(quán)以及管理;1313支持系統(tǒng)日志管理,方便追蹤用戶使用狀態(tài)等。其對電視臺等傳統(tǒng)媒體的應(yīng)用意義非凡,希望通過本文的闡述能夠為該系統(tǒng)的廣泛應(yīng)用做出貢獻。