余遠(yuǎn)潔
廣東省潮州市廣播電視臺(tái),廣東潮州 521000
摘 要 通過應(yīng)用大數(shù)據(jù)技術(shù)對(duì)廣電用戶進(jìn)行用戶畫像及收視行為建模,準(zhǔn)確刻畫用戶收視行為的特征和路徑,為企業(yè)的業(yè)務(wù)決策和運(yùn)營提供數(shù)據(jù)支撐,從根本上解決目前有線電視營銷中存在的產(chǎn)品設(shè)計(jì)落后、業(yè)務(wù)銷售與拓展受限、廣告經(jīng)營和主動(dòng)運(yùn)維不足等瓶頸問題。
關(guān)鍵詞 用戶畫像;數(shù)據(jù)建模;數(shù)據(jù)采集;精準(zhǔn)運(yùn)營;收視行為
中圖分類號(hào) G2 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 2096-0360(2017)11-0065-02
隨著互聯(lián)網(wǎng)發(fā)展,網(wǎng)絡(luò)電視臺(tái)大量興起,內(nèi)容碎片化,媒體分眾化趨勢日漸顯著,用戶可以根據(jù)自己喜好選擇觀看各類節(jié)目視頻,傳統(tǒng)廣電媒體的受眾、開機(jī)率、廣告份額出現(xiàn)快速下滑,廣電行業(yè)受到極大的沖擊,借用新技術(shù)進(jìn)行變革迫在眉睫。
以往傳統(tǒng)媒體播送時(shí)代,廣電媒體“不知道用戶在哪里,不知道用戶是誰,也不知道用戶想看什么”,因此,難以精準(zhǔn)把握用戶需求,而隨著數(shù)字機(jī)頂盒等技術(shù)的普及,廣電媒體具備了獲取用戶全樣本、實(shí)時(shí)收視數(shù)據(jù)的能力,通過海量數(shù)據(jù)對(duì)用戶的收視行為進(jìn)行建模,準(zhǔn)確刻畫用戶收視行為特征和路徑,有針對(duì)性地推送電視產(chǎn)品和服務(wù),這將全面提高用戶體驗(yàn),并為企業(yè)的業(yè)務(wù)的決策和運(yùn)營提供數(shù)據(jù)支撐,是當(dāng)前“數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)與運(yùn)營”的發(fā)展方向。
1 建立用戶畫像的四個(gè)階段
用戶畫像是指通過各個(gè)途徑收集到的與用戶特性和行為有關(guān)的屬性標(biāo)簽,包括個(gè)人基本信息、社會(huì)活動(dòng)信息、操作行為習(xí)慣等,通過對(duì)這些信息的綜合分析,勾勒出該用戶的特征與輪廓。為用戶畫像通常需要經(jīng)過數(shù)據(jù)采集、戰(zhàn)略定位、數(shù)據(jù)模型和業(yè)務(wù)應(yīng)用四個(gè)階段。
數(shù)據(jù)采集階段:通過各種途徑如廣電機(jī)頂盒、廣電運(yùn)營支撐系統(tǒng)及外部合作獲得的用戶的海量數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行清洗和入庫。
戰(zhàn)略定位階段:明確用戶畫像建模的戰(zhàn)略目標(biāo)和意義,如提升產(chǎn)品服務(wù)質(zhì)量、實(shí)現(xiàn)產(chǎn)品的精準(zhǔn)營銷等,根據(jù)戰(zhàn)略目標(biāo)確定用戶畫像的分析結(jié)論,開展有針對(duì)性的建設(shè)實(shí)施工作。
數(shù)據(jù)建模階段:根據(jù)實(shí)際需求建立用戶、產(chǎn)品、渠道、服務(wù)等數(shù)據(jù)實(shí)體,再以數(shù)據(jù)實(shí)體為中心,對(duì)分析對(duì)象和維度進(jìn)行規(guī)約,選取和戰(zhàn)略目的相關(guān)的數(shù)據(jù)維度,對(duì)次要的數(shù)據(jù)維度進(jìn)行分解,在此基礎(chǔ)上對(duì)數(shù)據(jù)進(jìn)行分析和挖掘。
業(yè)務(wù)應(yīng)用階段:針對(duì)不同業(yè)務(wù)場景開發(fā)應(yīng)用,基于用戶家庭特征、消費(fèi)數(shù)據(jù)和收看特征數(shù)據(jù)了解用戶特征和潛在需求挖掘,開展基于用戶中心的產(chǎn)品設(shè)計(jì)優(yōu)化,提升產(chǎn)品設(shè)計(jì)管理的數(shù)據(jù)決策力,并利用用戶畫像和協(xié)同過濾等算法進(jìn)行主動(dòng)營銷。
2 數(shù)據(jù)分類及收視行為建模
2.1 用戶數(shù)據(jù)分類收集
構(gòu)建用戶畫像的關(guān)鍵就是準(zhǔn)確獲取用戶信息,根據(jù)用戶數(shù)據(jù)的變化特征和頻率,我們將用戶數(shù)據(jù)劃分為靜態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù)兩大類。靜態(tài)數(shù)據(jù)就是用戶信息中相對(duì)穩(wěn)定、不容易發(fā)生變化的信息,如廣電用戶的姓名、性別、年齡、身份證號(hào)碼、家庭地址、電話號(hào)碼、機(jī)頂盒標(biāo)識(shí)碼、訂購套餐類型等人口屬性和商業(yè)屬性,此類數(shù)據(jù)最重要的工作是通過數(shù)據(jù)清洗,提高數(shù)據(jù)質(zhì)量。而動(dòng)態(tài)數(shù)據(jù)則是跟用戶行為相關(guān)的不斷變化的行為信息,包括收視信息、社交信息和節(jié)目信息。針對(duì)廣電用戶特點(diǎn),我們從人群、時(shí)間、地點(diǎn)、產(chǎn)品和付費(fèi)方式五個(gè)維度進(jìn)行用戶數(shù)據(jù)的收集,具體可詳細(xì)描述為:什么用戶,在什么時(shí)間什么地點(diǎn)觀看了什么電視頻道的什么節(jié)目并是否付費(fèi)。其中:
(1)人群維度,目的是為了區(qū)分用戶和進(jìn)行單點(diǎn)定位,通過機(jī)頂盒進(jìn)行用戶信息綁定及用戶收看節(jié)目的偏好來獲得,從而明確用戶年齡特征如少兒、青少年、中年或老年及性別特征等,以及習(xí)慣的收視語言是外語、國語、粵語等。
(2)時(shí)間維度:時(shí)間包括兩個(gè)重要信息,時(shí)間點(diǎn)+時(shí)間長度。時(shí)間點(diǎn)是用戶發(fā)生行為的時(shí)間點(diǎn),時(shí)間長度則是用戶觀看某一電視節(jié)目的停留時(shí)間。
(3)地點(diǎn)維度:指用戶的收視常在地。
(4)產(chǎn)品維度,產(chǎn)品包含兩層信息:電視頻道+節(jié)目分類,其中,頻道標(biāo)明收視的來源渠道,節(jié)目分類則包括體育、綜合、電視劇、時(shí)事、汽車、旅游、時(shí)裝、購物、少兒等內(nèi)容。
(5)付費(fèi)方式維度則標(biāo)明用戶是收費(fèi)用戶還是免費(fèi)用戶。
2.2 收視行為建模
根據(jù)電視業(yè)務(wù)開展需求,從人群、時(shí)間、地點(diǎn)、產(chǎn)品和付費(fèi)方式這五個(gè)維度對(duì)用戶的收視行為進(jìn)行建模,并通過模型分析獲知家庭成員構(gòu)成、產(chǎn)品相關(guān)度、客戶細(xì)化、客戶忠誠度、客戶價(jià)值等知識(shí)。
(1)根據(jù)收視行為,推測分析用戶的家庭情況,構(gòu)建完整用戶畫像,包括家庭人數(shù)、年齡、職業(yè)、收視忠誠度及用戶收視興趣等。
(2)根據(jù)用戶使用產(chǎn)品的情況,找出產(chǎn)品間潛在的關(guān)聯(lián)關(guān)系,發(fā)現(xiàn)隱藏規(guī)則或知識(shí),如通過數(shù)據(jù)挖掘發(fā)現(xiàn):“增值產(chǎn)品中關(guān)聯(lián)最強(qiáng)的四大業(yè)務(wù)為體育、音樂、氣象和動(dòng)漫”“看紀(jì)實(shí)節(jié)目的人??捶ㄖ祁惡托侣?lì)惞?jié)目”“喜好看動(dòng)作劇場的人很少看歡笑和娛樂類節(jié)目”等知識(shí)。
(3)通過建立客戶和產(chǎn)品需求矩陣計(jì)算實(shí)現(xiàn)產(chǎn)品精準(zhǔn)營銷。例如,通過矩陣運(yùn)算發(fā)現(xiàn)具有下列標(biāo)簽“老人、小孩、運(yùn)動(dòng)節(jié)目、寬帶速率、月均消費(fèi)額”的用戶與具有標(biāo)簽的A產(chǎn)品具有高關(guān)聯(lián)性,從而有針對(duì)性地進(jìn)行產(chǎn)品營銷推送。
(4)根據(jù)用戶使用時(shí)段上的分布情況,包括收視總時(shí)間段及分布、工作日與周末的收視差異、地區(qū)和套餐上的時(shí)段分布差異,收視偏好、業(yè)務(wù)占比及增長情況等,對(duì)用戶類型和特征進(jìn)行細(xì)化。
(5)計(jì)算用戶的價(jià)值。通過定義客戶價(jià)值中影響變量如“日均點(diǎn)播時(shí)長、回看使用天數(shù)及次數(shù)、收視中直播業(yè)務(wù)占比”,判斷準(zhǔn)則如“使用時(shí)間長的用戶比使用時(shí)間短的用戶更有價(jià)值”,和價(jià)值計(jì)算公式如“某類用戶總價(jià)值=直播業(yè)務(wù)價(jià)值+點(diǎn)播業(yè)務(wù)價(jià)值+回看業(yè)務(wù)價(jià)值”,進(jìn)行用戶價(jià)值的綜合計(jì)算,獲得用戶的重要權(quán)值。
2.3 技術(shù)實(shí)現(xiàn)
基于大數(shù)據(jù)的廣電用戶收視行為分析建模及實(shí)現(xiàn)項(xiàng)目包括大數(shù)據(jù)收集加工平臺(tái)和大數(shù)據(jù)存儲(chǔ)分析平臺(tái)兩部分內(nèi)容。
首先,搭建大數(shù)據(jù)收集加工平臺(tái),通過ETL等工具對(duì)數(shù)字電視機(jī)頂盒及廣電業(yè)務(wù)系統(tǒng)產(chǎn)生的數(shù)據(jù)進(jìn)行加載管理、服務(wù)總線、接口管理、模板編輯、模板下發(fā)和采集歸檔,再對(duì)采集到的操作型數(shù)據(jù)、歷史數(shù)據(jù)進(jìn)行質(zhì)量檢測、數(shù)據(jù)脫敏、數(shù)據(jù)清洗和數(shù)據(jù)轉(zhuǎn)換等清洗處理后,加載至帶有事實(shí)表和維度表的數(shù)據(jù)平臺(tái)。
其次,基于HADOOP建立海量存儲(chǔ)、高效計(jì)算的廣電大數(shù)據(jù)存儲(chǔ)分析平臺(tái),利用Spark等在線高速計(jì)算分析算法,通過各種數(shù)據(jù)分析工具,對(duì)收集到的各種非結(jié)構(gòu)化文檔數(shù)據(jù)和結(jié)構(gòu)化業(yè)務(wù)數(shù)據(jù)進(jìn)行深度融合分析,從數(shù)據(jù)中獲取更準(zhǔn)確、更深層次的知識(shí),準(zhǔn)確刻畫用戶行為畫像,提升對(duì)數(shù)據(jù)的理解、推理、發(fā)現(xiàn)和決策能力,更好地應(yīng)用到業(yè)務(wù)營銷及各種管理,全面提升廣電系統(tǒng)的服務(wù)能力和效益。
2.4 效果分析
通過對(duì)用戶收視行為進(jìn)行建模,運(yùn)營商可精確把握對(duì)當(dāng)?shù)貜V電用戶群體的特征和收視行為習(xí)慣模式,并基于上述分析結(jié)果提供個(gè)性化、精準(zhǔn)化和智能化的服務(wù)推廣,從根本上解決目前有線電視營銷中存在產(chǎn)品設(shè)計(jì)、銷售與業(yè)務(wù)拓展、廣告經(jīng)營和主動(dòng)運(yùn)維等瓶頸問題?;诖髷?shù)據(jù)技術(shù)的用戶收視行為分析將成為各大廣電運(yùn)營商優(yōu)化現(xiàn)有商業(yè)模式、創(chuàng)造新型商業(yè)模式、提高運(yùn)營效率和服務(wù)質(zhì)量的重要戰(zhàn)略舉措。
參考文獻(xiàn)
[1]李冰,王悅,劉永祥.大數(shù)據(jù)環(huán)境下基于K-means的用戶畫像與智能推薦的應(yīng)用[J].現(xiàn)代計(jì)算機(jī)版,2016(24):11-15.
[2]丁偉.基于大數(shù)據(jù)技術(shù)的手機(jī)用戶畫像與征信研究[J].郵電設(shè)計(jì)技術(shù),2016(3):64-69.