摘要:為了深度挖掘直播衛(wèi)星多維關聯數據之間的隱藏關系,加強系統間數據交互的高效性、規(guī)范性、可擴展性,提出搭建直播衛(wèi)星用戶數據分析平臺。通過建設全生命周期數據管理系統、用戶數據分析系統、業(yè)務與服務統一門戶系統及業(yè)務與服務總線系統等四個子系統,建立海量異構數據同步共享機制,完善直播衛(wèi)星數據治理規(guī)范,實現中心全部業(yè)務系統及外部相關渠道的數據整合、內容整合和統一登錄,滿足不斷涌現的數據交互共享、綜合查詢、分析挖掘需求。
關鍵詞:數據共享;數據分析;廣播電視直播衛(wèi)星
一、引言
隨著“中星9號”及“中星9A”衛(wèi)星的成功發(fā)射,在黨中央的號召下國家廣電總局衛(wèi)星直播中心積極推行我國“戶戶通”工程,利用地球同步軌道衛(wèi)星將廣播、電視及其他數據業(yè)務直接發(fā)送至用戶接收設備,為近1.5億農村家庭提供豐富優(yōu)質的廣播電視節(jié)目。在此期間,為了對業(yè)務實施提供有效的保障和支持,中心陸續(xù)建設了一系列信息化系統,包括戶戶通用戶管理系統、村村通用戶管理系統、加密卡管理系統、專營點申報審核系統、服務區(qū)域管理系統等25個業(yè)務支撐系統。然而,由于各業(yè)務系統逐步開發(fā)、分散設計、獨立運行,直播衛(wèi)星平臺具有系統內數據維度多、系統間數據耦合度高、信息資源難以共享的問題。
綜上,有必要在對直播衛(wèi)星業(yè)務支撐系統做頂層梳理規(guī)劃的基礎上,建設直播衛(wèi)星用戶數據分析平臺,建立海量異構數據同步共享機制,完善直播衛(wèi)星數據治理規(guī)范,加強系統間數據交互的高效性、規(guī)范性、可擴展性,打破“信息孤島”的壁壘,深度挖掘直播衛(wèi)星多維關聯數據之間的隱藏關系,滿足不斷涌現的數據交互共享、綜合查詢、分析挖掘需求。
二、總體技術架構
直播衛(wèi)星用戶數據分析平臺主要由全生命周期數據管理系統、用戶數據分析系統、業(yè)務與服務統一門戶系統及業(yè)務與服務總線系統等四個子系統組成,實現中心全部業(yè)務系統及外部相關渠道的數據整合、內容整合、接口規(guī)范和統一登錄。直播衛(wèi)星公共服務平臺用戶數據分析系統的總體技術架構如圖1所示。
三、系統功能設計
(一)全生命周期數據管理系統
全生命周期數據管理系統,通過統一的數據接口規(guī)范,對中心所有業(yè)務系統的業(yè)務數據進行采集和匯聚,形成數據共享平臺,有效、靈活實現不同系統間的信息交換、數據共享與業(yè)務協同,進一步發(fā)揮信息資源和應用系統的效能。通過建立全局大集中數據庫,實時捕獲多系統、多數據庫的數據變化,采用數據泵壓縮數據日志文件并加密的方式將數據同步至目的數據庫,在不影響原業(yè)務系統業(yè)務的前提下,實現中心全部業(yè)務系統的數據同步[1-2]。此種同步方式不僅具有帶寬占用少、亞秒級同步延時、對源數據庫影響較小的優(yōu)點,同時支持對多種數據庫實現一對一、一對多、多對一、雙向復制等功能。其次,為了給后續(xù)數據統計、分析挖掘提供數據基礎,建設全生命周期實時數據倉庫,將數據從全局大集中數據庫的緩沖區(qū)經過清洗、轉換、映射等復雜的數據處理,進入到實時數據倉庫,實現數據的“一次采集、多系統共享”。此外,全生命周期數據管理系統具備靈活的可視化配置功能,能夠快速實現不同機構、不同應用系統、不同數據庫間基于不同傳輸協議的數據交換與信息共享,為各種應用和決策支持提供良好的數據環(huán)境。
(二)用戶數據分析系統
用戶數據分析系統,利用數據共享平臺采集的直播衛(wèi)星業(yè)務數據、從互聯網搜集的非結構化數據及用戶回傳的收視行為數據,通過數據預處理、數據倉庫、數據分析與數據挖掘四個步驟,建立各種業(yè)務模型和分析模型,深度挖掘數據背后蘊藏的價值,掌握直播衛(wèi)星用戶實際的收視習慣及內容需求,有力地支撐中心進一步精準化、科學化管理,形成快速感知用戶、社會對于直播衛(wèi)星業(yè)務輿情態(tài)勢的能力,探索分析評價直播衛(wèi)星業(yè)務對于收視地域在政治層面、經濟層面等公共服務視角下的影響力。用戶數據分析系統主要包括9大功能組件:
1.市場分析組件功能
主要面向衛(wèi)星直播業(yè)務的市場存量和發(fā)展空間進行量化分析,包括農戶市場總存量分析、當前用戶數分析、零售省份市場空間分析、整省推進省份市場空間分析等內容。
2.渠道分析組件功能
主要針對衛(wèi)星直播業(yè)務推廣的合作渠道進行量化分析,包括專營點數量分析、專營點發(fā)展規(guī)律分析、專營點業(yè)務推廣情況分析、工號數量分析、工號業(yè)務辦理情況分析、僵尸工號分析、僵尸專營點分析等內容。
3.運維分析組件功能
主要針對運維相關的數據進行量化分析,包括運維人員分析、資產分析、設備分析、信息系統分析、日常運維任務分析、運維作業(yè)計劃分析、運維故障分析等內容。此外,還提供了基于在線流模式的事件分析應用功能,包括疑似攻擊行為分析、異常事件識別與上報、事件管理中心等功能。
4.統計報表服務組件功能
主要從用戶發(fā)展、安全監(jiān)控、業(yè)務管理、客戶反饋等多角度進行用戶及業(yè)務數據的統計報表服務。
5.營銷分析組件功能
主要側重于分析業(yè)務發(fā)展規(guī)律和旺季規(guī)律,為專營點開展營銷活動提供科學指導,包括節(jié)假日用戶增長規(guī)律分析、淡旺季用戶增長規(guī)律分析等內容。
6.合作伙伴分析組件功能
主要針對衛(wèi)星直播中心的合作伙伴進行量化分析,包括合作伙伴類型與數量分析、方案商授權情況分析、機頂盒廠商生產/銷售情況分析、機頂盒廠商故障分析等內容。
7. 收視率分析組件功能
主要針對直播衛(wèi)星用戶的收視行為、興趣喜好等進行挖掘分析,包括收視率、收視行為、節(jié)目熱度、內容(節(jié)目/廣告)推薦等內容。對于具備雙向信息傳輸能力的試點,對收視情況進行詳細分析,準確了解不同時段下,各頻道、各節(jié)目的收視率情況。建立用戶收視行為模型,分析計算用戶的開機、換臺、點播、頻道類型、節(jié)目類型等行為[3]。建立用戶興趣模型,根據用戶的收視行為構建用戶畫像,并計算形成用戶聚類[4]。根據內容的特點,建立內容的標簽體系,構建用戶-內容的興趣矩陣。研究雙向精準匹配的協同過濾個性化推薦算法,面向用戶和用戶聚類,輸出內容的推薦結果,為未來增值業(yè)務運營推廣,提供科學的數據準備和決策支撐。
8.客戶分析組件功能
主要針對衛(wèi)星直播業(yè)務的收看用戶進行量化分析,包括當前用戶總量分析、用戶地域分析、用戶在網時間分析、用戶退網情況分析、用戶變更業(yè)務分析等內容。
9.管理分析組件功能
主要針對內部管理情況進行量化分析,包括人員數量分析、項目數量分析、人員承擔項目情況分析等內容。
(三)業(yè)務與服務統一門戶系統
業(yè)務與服務統一門戶系統,根據門戶用戶權限配置關系獲得相應授權的整合信息,為各類門戶角色人員提供定制化的門戶界面,實現中心業(yè)務支撐域各業(yè)務系統的統一接入訪問,用戶登錄一次,即可實現在所有授權業(yè)務系統之間“全網漫游”。同時,將內容管理、綜合業(yè)務辦理、綜合數據查詢等服務進行集成,靈活實現不同系統間的信息交換、共享與業(yè)務協同。此外,系統具備良好的擴展能力,可以靈活接入中心業(yè)務支撐域新增業(yè)務系統或其他安全域業(yè)務系統。業(yè)務與服務統一門戶系統主要功能主要包括4大方面:
1.統一用戶管理功能
主要包括組織機構、用戶管理、業(yè)務角色、權限管理、日志管理等五部分功能。
2.統一認證管理功能
主要包括系統登錄認證和單點登錄認證兩大功能。
3.統一內容管理功能
主要包括站點管理、欄目管理、內容管理、模板管理、流程審批、系統管理等六部分內容。
4.統一接口管理功能
主要包括界面信息同步、用戶信息同步、認證信息同步、業(yè)務資源信息同步、短信信息同步等五部分功能。
(四)業(yè)務與服務總線系統
作為中心業(yè)務系統的通信樞紐和信息交換平臺,高效、有序地實現各系統之間的互聯互通,為跨系統及數據庫間的同構及異構數據提供數據抽取、格式轉換、內容過濾、內容轉換、動態(tài)部署、可視化管理監(jiān)控等靈活的數據交換服務[5]。實現系統間數據共享和接口調用,降低系統間的耦合度,提高信息系統總體架構的靈活性,使中心獨立建設的多個信息系統平滑地向基于面向服務的應用架構(SOA)演進,逐步實現衛(wèi)星直播中心IT信息系統多層次、條線化、松耦合的整體應用架構目標。
四、結束語
通過建設直播衛(wèi)星用戶數據分析平臺,對中心現有全部業(yè)務系統的用戶數據、業(yè)務數據及外部互聯網輿情數據、用戶回傳收視行為數據等實現深度整合,突破“信息孤島”的壁壘,實現衛(wèi)星直播領域下全域、全集、全程數據高質量治理。同時,通過數理統計、聯機分析處理、語義分析等手段,對數據共享平臺整合的數據進行挖掘、分析,提供直觀的報表和可視化數據,為中心制度決策、科學管理、內容供給、業(yè)務發(fā)展等提供數據支撐。通過將直播衛(wèi)星用戶數據和收視行為數據的結合,有效掌握了我國農村地區(qū)直播衛(wèi)星節(jié)目覆蓋情況、用戶收視需求及效果反饋,為建立直播衛(wèi)星公共服務效果評估指標體系,有效評估改進直播衛(wèi)星公共服務效果和質量提供了技術支撐。
作者單位:萬敏? ? 國家廣播電視總局廣播電視衛(wèi)星直播管理中心
參? 考? 文? 獻
[1] 胡金龍. 異構數據庫同步復制技術研究與實現. 長江科學院院報[J]. 2011, 28(6):71-75.
[2] 董永峰. 分布式異構數據庫同步集成的研究與應用.計算機應用與軟件[J].2012,29(6):122-124.
[3] 萬敏. 數據挖掘算法在衛(wèi)星直播廣播電視用戶收視行為分析中的應用. 中國新聞技術工作者聯合會2016年學術年會論文集[C]. 2016,95-99.
[4] 苑喆. 大數據分析平臺及用戶收視行為分析的技術研究. 有線電視技術[J]. 2018, 1:33-35.
[5] 郭廣軍. 基于ESB的Web服務集成技術.計算機應用與軟件[J].2008,25(11):283-285.