施曉光
【摘? 要】針對互聯(lián)網(wǎng)業(yè)務(wù)數(shù)據(jù)量大、用戶畫像在用戶消費行為模型構(gòu)建中使用較少的問題,利用用戶畫像技術(shù),通過用戶的自然屬性、使用屬性、消費行為屬性、充值行為屬性建立用戶畫像模型。通過跟蹤單個用戶ARPU值的變化軌跡,用戶畫像報告生成,用戶ARPU的宏觀關(guān)聯(lián)性分析介紹了用戶畫像模型的使用。通過高危用戶的挽留實驗,從實踐的角度證實了模型的用途。此模型的使用有效地反應(yīng)了業(yè)務(wù)的經(jīng)營狀況,可以全景展示業(yè)務(wù)視圖,為提升用戶ARPU值提供了策略制定依據(jù)。
【關(guān)鍵詞】用戶畫像;模型構(gòu)建;關(guān)聯(lián)分析
中圖分類號:TN929.5
文獻標(biāo)志碼:A? ? ? 文章編號:1006-1010(2019)04-0070-05
[Abstract]?In view of large amounts of Internet data and few uses of user portrait in user consumption behavior model, the user portrait technology is used to build user portrait model based on natural property, usage attribute, consumption behavior attribute and charge behavior attribute. By tracking the changing trajectory of ARPU value for a single user, the user portrait report is generated. The macro correlation analysis of users ARPU introduces the use of user portrait model. Through the retention experiment of high-risk users, the use of the model is validated from the aspect of practice. The use of the model effectively reflects the operation state of business, comprehensively displays the business view and provides a strategic basis to enhance users ARUPU value.
[Key words]user portrait; modeling; association analysis
1? ?引言
移動通信技術(shù)的快速發(fā)展和應(yīng)用不僅提升了用戶使用通信媒體的便利性,也產(chǎn)生了大量的用戶信息,而如何完善這些用戶信息,進而根據(jù)用戶的使用規(guī)律有效地配置資源,做到效益最大化是一項迫在眉睫的事情。用戶畫像作為真實用戶的虛擬代表,是建立在一系列真實數(shù)據(jù)之上的用戶模型。關(guān)于用戶畫像的使用遍布各個行業(yè)[1],為了對“知乎”網(wǎng)站PM2.5話題下1 303位用戶進行實證分析,構(gòu)建了基于用戶基本屬性、社交屬性、興趣屬性和能力屬性四個維度的動態(tài)用戶畫像模型[2]。趙剛等人在入侵檢測技術(shù)中引入了用戶畫像技術(shù),提出基于用戶畫像的入侵檢測模型,實現(xiàn)入侵檢測粒度的細(xì)化,將大數(shù)據(jù)技術(shù)引入網(wǎng)絡(luò)安全領(lǐng)域,發(fā)掘其潛在研究及使用價值,使入侵檢測技術(shù)具有大數(shù)據(jù)特性。用戶畫像在通信領(lǐng)域的應(yīng)用也非常的普遍,尤其是在分析用戶的運動軌跡方面[3],有顯示移動用戶的頻繁活動規(guī)律、周期性行為及出行方式的移動用戶行為畫像模型,可用來分析移動用戶群體行為及用戶間交互行為[4]。通過時空關(guān)聯(lián)分析的方法提出了一套通信用戶停留分析的方法,分析用戶的軌跡行為。通過用戶畫像技術(shù)分析用戶的消費行為的模型不是很多。
本文利用用戶畫像技術(shù),通過用戶的自然屬性、使用行為屬性消費行為屬性、充值行為屬性建立用戶畫像模型。在跟蹤單個用戶的ARPU值的變化軌跡,生成用戶畫像報告,在用戶ARPU的宏觀性關(guān)聯(lián)性分析方面闡述了此畫像模型的應(yīng)用,為提升用戶ARPU值提供策略制定依據(jù)。
2? ?用戶畫像模型構(gòu)建
在本文中,一切研究目的都是圍繞著提升用戶ARPU值,所以建模的目的就是為了發(fā)現(xiàn)各個屬性對ARPU值的影響。圖1為本文的建模思路:
整個用戶畫像建模思路為:首先整理數(shù)據(jù),并拆分為自然屬性、使用行為屬性、消費行為屬性、充值行為屬性四個數(shù)據(jù)集;然后分別對每個數(shù)據(jù)集進行定義,構(gòu)建用戶畫像模型;最后則是介紹此用戶畫像模型的應(yīng)用。
2.1? 數(shù)據(jù)收集與處理
本文選擇的數(shù)據(jù)集為某電信運營商近半年線上用戶的消費行為數(shù)據(jù)和繳費數(shù)據(jù)。此數(shù)據(jù)包含60萬用戶5個月的屬性行為、消費行為、繳費行為數(shù)據(jù),在數(shù)據(jù)收集的過程中,根據(jù)數(shù)據(jù)的類別進行了拆分處理,整理后的數(shù)據(jù)集如圖2所示。
2.2? 用戶畫像模型構(gòu)建
(1)用戶自然屬性
在本文中,基于用戶數(shù)據(jù)收集成本與隱私的保護,主要考慮了用戶的年齡、性別、所屬區(qū)縣、星級、受教育程度對用戶ARPU的影響力,通常受教育程度越高的用戶產(chǎn)生的ARPU會偏高一些。定義函數(shù)Natu(i)表示用戶i的自然屬性對用戶ARPU的影響力:
(2)用戶使用行為屬性
本文探討的使用行為屬性包含套餐、時長、合約與否。在本文的數(shù)據(jù)集中,用戶的套餐會有基本的月租費,用戶ARPU由基本的月租費和套餐外收入組成,月租費越高,對應(yīng)的用戶ARPU相應(yīng)也會增加。在網(wǎng)時間越長,用戶的使用習(xí)慣會逐漸形成,用戶的ARPU值便會趨于一個穩(wěn)定值。定義函數(shù)App(i)表示用戶i的使用行為屬性對用戶ARPU的影響力:
其中,Pro(i)表示用戶使用的套餐對用戶ARPU的影響力;Star(i)表示目前用戶的所屬星級對用戶ARPU的影響力;Long(i)表示用戶在網(wǎng)時長對用戶ARPU的影響力;Nat(i)表示用戶目前合約與否對用戶ARPU的影響力。
(3)用戶消費行為屬性
目前用戶使用通信服務(wù),通常體現(xiàn)在用戶撥打電話、發(fā)送短信、使用流量三個方面。相應(yīng)地,反映出來的數(shù)據(jù)為語音通話時長、短信條數(shù)、流量值。其中語音通話時長又分為市話和長途、來話與去話;短信分為發(fā)送短信和接收短信;流量的區(qū)分按網(wǎng)絡(luò)制式可分為2G、3G、4G流量,按使用范圍又可分為本地流量和長途流量等。針對不同的產(chǎn)品、不同的人群,用戶消費行為的側(cè)重點也不一樣,年輕人通常使用流量比較多,老年人則較習(xí)慣撥打電話。在不同時期,用戶消費行為的三個方面對用戶ARPU值的影響比重又有變化。前幾年用戶移動端上網(wǎng)沒有完全普及的時候,用戶使用短信和通話對用戶ARPU的影響比較大,現(xiàn)在則是流量對用戶ARPU的影響比較大。本文定義了函數(shù)Con(i)表示用戶i的消費行為屬性對用戶ARPU的影響力:
(4)用戶充值行為屬性
用戶的充值行為與用戶的ARPU是相輔相成的,用戶ARPU值越大,用戶的充值行為則越頻繁,充值金額則越大;用戶的充值屬性越明顯,用戶則越穩(wěn)定,則越容易成為穩(wěn)定客戶。在本文中,我們著重考慮用戶的充值行為對用戶ARPU的影響。定義了函數(shù)Pay(i)表示用戶i的充值行為屬性對用戶ARPU的影響力:
3? ?用戶畫像模型應(yīng)用
本文構(gòu)建的用戶畫像模型包含了與用戶ARPU值直接關(guān)聯(lián)的各種屬性,同時數(shù)據(jù)集的體量也是非常大的,包含了60萬線上用戶的屬性信息。這對于充分發(fā)掘此畫像模型的應(yīng)用提供了強有力的基礎(chǔ)。在本文中,從單個用戶ARPU的變化規(guī)律、用戶畫像報告和用戶ARPU的宏觀性關(guān)聯(lián)分析方面介紹此用戶畫像模型的應(yīng)用。
3.1? 單個用戶的ARPU變化規(guī)律
企業(yè)整體的收入是由單個用戶產(chǎn)生的收入累加起來的,所以分析好每一個用戶的ARPU值變化則顯得尤為重要。本文選擇了某一個用戶近五個月的ARPU值與消費行為數(shù)據(jù)進行舉例闡述,如表1所示:
從表1、圖3、圖4可以看出,用戶的套餐月租費遠(yuǎn)小于用戶的ARPU,這表明用戶目前的套餐不適于用戶的使用方式;ARPU值和流量的下降,則表明用戶有離網(wǎng)的傾向。綜上,需要協(xié)助用戶選擇合適的套餐,做好用戶的挽留工作。
3.2? 用戶畫像報告
用戶畫像報告對用戶進行全景視圖展示,本文可以從各個視角進行用戶畫像報告,比如年齡、性別、區(qū)局、套餐等?,F(xiàn)在從用戶ARPU值高于平均ARPU和低于平均ARPU的角度來介紹用戶畫像模型的使用。圖5和圖6展示了高于平均ARPU和低于ARPU的組成情況。
3.3? 用戶ARPU的宏觀性關(guān)聯(lián)分析
從圖7至圖9可以看出,用戶近5個月的收入呈現(xiàn)上升的變化趨勢,用戶的收入增加由新增用戶的收入和存量用戶的收入組成。新增收入在201804賬期呈現(xiàn)了下降趨勢,而存量收入在201804賬期上升明顯。由此可見,用戶收入的上升是由存量用戶的收入增加引起的,這表明存量用戶的維系工作做的比較到位,而新增用戶的發(fā)展則需要加強。
4? ?實驗結(jié)果
利用本文構(gòu)建的用戶畫像模型,提取了1 025條高危用戶,本文定義的高危用戶指的是連續(xù)三個月用戶ARPU值都持續(xù)下降,并且流量、語音、短信使用很少的用戶。圖10為本批用戶的年齡分布:
不同年齡段的用戶有不同的使用習(xí)慣與需求,通過圖10可以看出,用戶著重分布在30歲以下,這也說明30歲以下的年輕人更容易流失。所以本文制定策略時著重考慮年輕人,依據(jù)目前年輕人都比較喜歡玩網(wǎng)游的特點,采用微信推廣與短信通知的方式推薦用戶參加公司的“充值送流量”活動。策略實施后的平均ARPU變化如圖12所示:
5? ?結(jié)束語
移動通信技術(shù)的迅猛發(fā)展產(chǎn)生了大量的用戶數(shù)據(jù),如何從大量的數(shù)據(jù)中提取有益于提高效益的信息是非常重要的。本文利用用戶畫像技術(shù),從用戶自然屬性、使用行為屬性、消費行為屬性和充值行為屬性方面構(gòu)建了用戶畫像模型,并從單個用戶的ARPU變化規(guī)律、用戶畫像報告和用戶ARPU的宏觀性關(guān)聯(lián)分析方面探討了用戶畫像模型的使用。通過高危用戶的挽留實驗,從實踐的角度證實了模型的用途。此模型的使用直觀明了地反映了用戶的全景視圖及收入變化的原因,為企業(yè)制定決策提供了依據(jù)。
參考文獻:
[1] 陳志明,胡震云. UGC網(wǎng)站用戶畫像研究[J]. 計算機系統(tǒng)應(yīng)用, 2017(26): 24-25.
[2] 趙剛,姚興仁. 基于用戶畫像的異常行為檢測模型[J]. 技術(shù)研究, 2017(7): 18-24.
[3] 黃文彬,徐山川,吳家輝,等. 移動用戶畫像構(gòu)建研究[J]. 現(xiàn)代情報, 2016(10): 54-61.
[4] 席巖,張乃亮,王磊,等. 基于大數(shù)據(jù)的用戶畫像方法研究[J]. ICTC, 2017(10): 37-41.
[5] 馬亮,陶利濤,謝駿凱. 基于客戶畫像的客戶訴求管理[J]. 電力需求側(cè)管理, 2016(10): 98-100.
[6] 王憲朋. 基于視頻大數(shù)據(jù)的用戶畫像構(gòu)建[J]. 網(wǎng)絡(luò)與融合, 2017(4): 20-21.
[7] 裴國才. 基于用戶畫像的電信精準(zhǔn)營銷模型研究[J]. 信息通信, 2017(12): 240-243.
[8] 何雪海,黃明浩,宋飛. 網(wǎng)絡(luò)安全用戶行為畫像方案設(shè)計[J]. 通信技術(shù), 2017(4): 789-794.
[9] 陳秀敏,許向東,黃毅華,等. 基于數(shù)據(jù)挖掘的4G用戶投訴預(yù)測[J]. 移動通信, 2017(12): 32-34.
[10] 齊帥,單桂華,田東,等. 基于基站數(shù)據(jù)挖掘個人駐留規(guī)律[J]. 計算機系統(tǒng)應(yīng)用, 2017(6): 176-180.