趙宏田
互聯(lián)網(wǎng)步入大數(shù)據(jù)時(shí)代后,用戶行為給企業(yè)的產(chǎn)品和服務(wù)帶來了一系列的改變和重塑,其中最大的變化在于,用戶的一切行為在企業(yè)面前是可“追溯”“分析”的。企業(yè)內(nèi)保存了大量的原始數(shù)據(jù)和各種業(yè)務(wù)數(shù)據(jù),這是企業(yè)經(jīng)營(yíng)活動(dòng)的真實(shí)記錄。如何更加有效地利用這些數(shù)據(jù)進(jìn)行分析和評(píng)估,成為企業(yè)基于更大數(shù)據(jù)量背景的問題所在。
隨著大數(shù)據(jù)技術(shù)的深入研究與應(yīng)用,企業(yè)的關(guān)注點(diǎn)日益聚焦在如何利用大數(shù)據(jù)來為精細(xì)化運(yùn)營(yíng)和精準(zhǔn)營(yíng)銷服務(wù)上,但要做精細(xì)化運(yùn)營(yíng),首先要建立本企業(yè)的用戶畫像。
大數(shù)據(jù)如何給用戶畫像?
要實(shí)現(xiàn)給用戶畫像,首先得知道用戶畫像是什么?
用戶畫像實(shí)際上就是把用戶信息標(biāo)簽化,通過收集用戶的社會(huì)屬性、消費(fèi)習(xí)慣、偏好特征等各個(gè)維度的數(shù)據(jù),進(jìn)而對(duì)用戶或者產(chǎn)品特征屬性進(jìn)行刻畫,并對(duì)這些特征進(jìn)行分析、統(tǒng)計(jì),挖掘潛在價(jià)值信息,從而抽象出用戶的信息全貌。
大數(shù)據(jù)已經(jīng)興起多年,其對(duì)于互聯(lián)網(wǎng)公司的應(yīng)用來說已經(jīng)如水、電、空氣;對(duì)于人們的生活來說,也成為不可或缺的重要組成部分。從基礎(chǔ)設(shè)施建設(shè)到應(yīng)用層面,主要有數(shù)據(jù)平臺(tái)搭建及運(yùn)維管理、數(shù)據(jù)倉(cāng)庫(kù)開發(fā)、上層應(yīng)用的統(tǒng)計(jì)分析、報(bào)表生成及可視化、用戶畫像建模、個(gè)性化推薦與精準(zhǔn)營(yíng)銷等應(yīng)用方向。
很多公司在大數(shù)據(jù)基礎(chǔ)建設(shè)上投入很多,也做了不少報(bào)表,但業(yè)務(wù)部門覺得大數(shù)據(jù)和傳統(tǒng)報(bào)表沒什么區(qū)別,也沒能體會(huì)到大數(shù)據(jù)對(duì)業(yè)務(wù)有什么幫助和價(jià)值。究其原因,其實(shí)是“數(shù)據(jù)靜止在數(shù)據(jù)倉(cāng)庫(kù),是死的”。
而用戶畫像正好可以幫助大數(shù)據(jù)“走出”數(shù)據(jù)倉(cāng)庫(kù),針對(duì)用戶進(jìn)行個(gè)性化推薦、精準(zhǔn)營(yíng)銷、個(gè)性化服務(wù)等多樣化服務(wù),為數(shù)據(jù)驅(qū)動(dòng)運(yùn)營(yíng)奠定了基礎(chǔ)。
其次我們需要給用戶畫像建模,其實(shí)就是給用戶“打標(biāo)簽”。結(jié)合數(shù)據(jù)應(yīng)用體系的層級(jí)劃分(如圖1),以及給用戶打標(biāo)簽的方式來看,用戶畫像一般有3種標(biāo)簽類型:統(tǒng)計(jì)類標(biāo)簽、規(guī)則類標(biāo)簽、機(jī)器學(xué)習(xí)挖掘類標(biāo)簽。
1.統(tǒng)計(jì)類標(biāo)簽
這類標(biāo)簽是最基礎(chǔ)、常見的標(biāo)簽類型。例如,對(duì)于某個(gè)用戶來說,其性別、年齡、城市、星座、近7日活躍時(shí)長(zhǎng)、近7日活躍天數(shù)、近7日活躍次數(shù)等字段,可以從用戶注冊(cè)數(shù)據(jù)、用戶訪問、消費(fèi)數(shù)據(jù)中統(tǒng)計(jì)得出。
2.規(guī)則類標(biāo)簽
這類標(biāo)簽基于用戶行為及確定的規(guī)則產(chǎn)生。例如,對(duì)平臺(tái)上“消費(fèi)活躍”用戶可以定義為“近30天交易次數(shù)≥2”。在實(shí)際開發(fā)畫像的過程中,由于運(yùn)營(yíng)人員對(duì)業(yè)務(wù)更為熟悉,而數(shù)據(jù)人員對(duì)數(shù)據(jù)的結(jié)構(gòu)、分布、特征更為熟悉,因此規(guī)則類標(biāo)簽的規(guī)則一般由運(yùn)營(yíng)人員和數(shù)據(jù)人員共同協(xié)商確定。
3.機(jī)器學(xué)習(xí)挖掘類標(biāo)簽
這類標(biāo)簽是通過機(jī)器學(xué)習(xí)挖掘產(chǎn)生,用于對(duì)用戶的某些屬性或某些行為進(jìn)行預(yù)測(cè)判斷。例如,根據(jù)一個(gè)用戶的行為習(xí)慣,判斷該用戶是男性還是女性;根據(jù)一個(gè)用戶的消費(fèi)習(xí)慣,判斷其對(duì)某商品的偏好程度。該類標(biāo)簽需要通過算法挖掘產(chǎn)生。
在項(xiàng)目工程實(shí)踐中,一般統(tǒng)計(jì)類和規(guī)則類的標(biāo)簽就可以滿足應(yīng)用需求,在開發(fā)中占有較大比例。機(jī)器學(xué)習(xí)挖掘類標(biāo)簽多用于預(yù)測(cè)場(chǎng)景,如判斷用戶性別、用戶購(gòu)買商品偏好、用戶流失意向等。一般情況下,機(jī)器學(xué)習(xí)標(biāo)簽開發(fā)周期較長(zhǎng),開發(fā)成本較高,因此其開發(fā)所占比例也比較小。
用戶畫像有哪些模塊?
借助用戶畫像,我們可以對(duì)商品的銷量進(jìn)行分析。比如說可以快速定位到爆款品類,進(jìn)一步分析購(gòu)買爆款品類的用戶在各個(gè)維度上的特征。
比如,運(yùn)營(yíng)人員在分析用戶購(gòu)買記錄時(shí),可以直觀地看出產(chǎn)品品類的銷量情況。如果運(yùn)營(yíng)人員想進(jìn)一步了解用戶的其他特征,我們可以搭建一套完整的用戶畫像系統(tǒng),以便進(jìn)行精準(zhǔn)營(yíng)銷。
一般來說,一套用戶畫像方案需要考慮8個(gè)模塊的建設(shè)(如圖2)。
用戶畫像基礎(chǔ):需要了解、明確用戶畫像是什么,包含哪些模塊,數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)是什么樣子,開發(fā)流程,表結(jié)構(gòu)設(shè)計(jì),ETL設(shè)計(jì)等。這些都是框架,大方向的規(guī)劃,只有明確了方向,后續(xù)才能做好項(xiàng)目的排期和人員投入預(yù)算。這對(duì)于評(píng)估每個(gè)開發(fā)階段重要指標(biāo)和關(guān)鍵產(chǎn)出都非常重要。
數(shù)據(jù)指標(biāo)體系:根據(jù)業(yè)務(wù)線梳理,包括用戶屬性、用戶行為、用戶消費(fèi)、風(fēng)險(xiǎn)控制等維度的指標(biāo)體系。
標(biāo)簽數(shù)據(jù)存儲(chǔ):標(biāo)簽相關(guān)數(shù)據(jù)可存儲(chǔ)在Hive、MySQL、HBase、Elasticsearch等數(shù)據(jù)庫(kù)中,不同存儲(chǔ)方式適用于不同的應(yīng)用場(chǎng)景。
標(biāo)簽數(shù)據(jù)開發(fā):這是用戶畫像工程化的重點(diǎn)模塊,包含統(tǒng)計(jì)類、規(guī)則類、挖掘類、流式計(jì)算類標(biāo)簽的開發(fā),以及人群計(jì)算功能的開發(fā),可有效打通畫像數(shù)據(jù)和各業(yè)務(wù)系統(tǒng)之間的通路,提供接口服務(wù)等開發(fā)內(nèi)容。
開發(fā)性能調(diào)優(yōu):標(biāo)簽加工、人群計(jì)算等腳本上線調(diào)度后,為了縮短調(diào)度時(shí)間、保障數(shù)據(jù)的穩(wěn)定性等,需要對(duì)開發(fā)的腳本進(jìn)行迭代重構(gòu)、調(diào)優(yōu)。
作業(yè)流程調(diào)度:標(biāo)簽加工、人群計(jì)算、同步數(shù)據(jù)到業(yè)務(wù)系統(tǒng)、數(shù)據(jù)監(jiān)控預(yù)警等腳本開發(fā)完成后,需要調(diào)度工具把整套流程調(diào)度起來。
用戶面像產(chǎn)品化:為了能讓用戶數(shù)據(jù)更好地服務(wù)于業(yè)務(wù)方,需要以產(chǎn)品化的形態(tài)應(yīng)用在業(yè)務(wù)上。產(chǎn)品化的模塊主要包括標(biāo)簽視圖、用戶標(biāo)簽查詢、用戶分群、透視分析等。
用戶畫像應(yīng)用:畫像的應(yīng)用場(chǎng)景包括用戶特征分析、短信、郵件、站內(nèi)信、Push消息的精準(zhǔn)推送、客服針對(duì)用戶的不同話術(shù)、針對(duì)高價(jià)值用戶的極速退貨退款等VIP服務(wù)應(yīng)用。
這些模塊可以有利于幫助我們更清楚地了解用戶畫像是如何從0到l搭建起來的,并以此作為提供服務(wù)、驅(qū)動(dòng)用戶、將用戶畫像產(chǎn)品化的基礎(chǔ)。
怎樣做一款用戶畫像產(chǎn)品?
我們開發(fā)出畫像的標(biāo)簽數(shù)據(jù)、搭建起畫像的整體模塊之后,如果只是“躺在”數(shù)據(jù)倉(cāng)庫(kù)中,并不能發(fā)揮更大的業(yè)務(wù)價(jià)值。只有將畫像數(shù)據(jù)產(chǎn)品化才能更方便業(yè)務(wù)方使用,比如用戶畫像產(chǎn)品主要可能涵蓋到的功能模塊,以及這些功能模塊的應(yīng)用場(chǎng)景。
畫像產(chǎn)品按常見的功能來看,主要包括標(biāo)簽視圖與即時(shí)查詢,用戶分群,用戶人群透視分析,對(duì)用戶從事件、留存、漏斗、分布等多維度展開的深入交瓦式分析等模塊。下面我們?cè)敿?xì)介紹—下畫像的產(chǎn)品形態(tài)。
1.標(biāo)簽視圖與查詢
標(biāo)簽視圖與查詢功能主要面向業(yè)務(wù)人員使用,如圖3所示。
在平臺(tái)標(biāo)簽視圖板塊中,層級(jí)化地展示了目前已經(jīng)上線使用的全部用戶標(biāo)簽。用戶可以層級(jí)化地通過點(diǎn)擊標(biāo)簽,查看每個(gè)標(biāo)簽的詳細(xì)介紹。
當(dāng)點(diǎn)擊圖中“用戶屬性”這個(gè)一級(jí)類目,可進(jìn)入到“自然性別”“購(gòu)物性別”“用戶價(jià)值”等二級(jí)類目;點(diǎn)擊“自然性別”二級(jí)類目,可看到展開的“男性”“女性”三級(jí)標(biāo)簽;進(jìn)一步點(diǎn)擊三級(jí)標(biāo)簽“男性”或是“女性”,可以進(jìn)入查看該標(biāo)簽的詳細(xì)介紹,如圖4所示。
在該標(biāo)簽詳情頁(yè)中,可以查看人口屬性這一個(gè)類目下面的各個(gè)標(biāo)簽覆蓋用戶量情況。
每天通過對(duì)標(biāo)簽的覆蓋用戶量進(jìn)行監(jiān)控,可以作為預(yù)警使用。例如:某天某個(gè)標(biāo)簽的覆蓋用戶量與前一天相比出現(xiàn)了很大比例的波動(dòng),這時(shí)就需要排查該標(biāo)簽當(dāng)日ETL作業(yè)是否出現(xiàn)異常,或是否因業(yè)務(wù)上的操作導(dǎo)致標(biāo)簽量級(jí)的波動(dòng)。
在標(biāo)簽查詢模塊中,通過輸入用戶對(duì)應(yīng)的usend或CookieID,可以查看該用戶的屬性信息、行為信息、風(fēng)控屬性等多維度的信息,從多方位了解一個(gè)用戶的特征。
2.用戶分群功能
用戶分群功能主要面向業(yè)務(wù)人員使用。產(chǎn)品經(jīng)理、運(yùn)營(yíng)、客服等業(yè)務(wù)人員在應(yīng)用標(biāo)簽時(shí),可能不僅僅只查看某一個(gè)標(biāo)簽對(duì)應(yīng)的人群情況,更多地需要組合多個(gè)標(biāo)簽來滿足其在業(yè)務(wù)上對(duì)人群的定義。
例如,組合“近30日購(gòu)買次數(shù)”大于3次和“高活躍”“女性”用戶這3個(gè)標(biāo)簽進(jìn)行定義目標(biāo)人群,查看該類人群覆蓋的用戶量,以及該部分人群的各維度特征。在“用戶分群”板塊下,點(diǎn)擊“新建人群”或編輯之前已添加的分組(如圖5),進(jìn)入詳情頁(yè)可自定義涵蓋某些標(biāo)簽的人群。
在自定義編輯用戶分群時(shí),對(duì)于有統(tǒng)計(jì)值類型的標(biāo)簽,可以自定義篩選該標(biāo)簽的取值范圍,如“近30日購(gòu)買次數(shù)”的標(biāo)簽,業(yè)務(wù)人員可篩選該標(biāo)簽的數(shù)值。對(duì)于分類型標(biāo)簽,(如圖4)中“活躍度”標(biāo)簽,業(yè)務(wù)人員選中該標(biāo)簽即可圈出包含該標(biāo)簽的用戶。“人群名稱”和“人群描述”表單用于業(yè)務(wù)人員描述該人群在業(yè)務(wù)上的定義,方便后續(xù)繼續(xù)查看、應(yīng)用該人群。
3.人群分析功能
人群分析功能主要是面向業(yè)務(wù)人員、數(shù)據(jù)分析師、產(chǎn)品經(jīng)理等人群使用。
人群分析是一個(gè)根據(jù)現(xiàn)有用戶標(biāo)簽圈定用戶群的功能,方便業(yè)務(wù)方從多個(gè)維度(如地域、性別、年齡、消費(fèi)水平等)進(jìn)一步分析該批用戶群的特征,從而為精細(xì)化運(yùn)營(yíng)提供支持。和用戶人群功能相似,人群分析功能首先也需要組合標(biāo)簽圈定用戶群體。不同之處在于多維透視分析功能支持從多個(gè)維度去分析圈定用戶群體的特征,而用戶分群功能側(cè)重的是將篩選出來的用戶群推送到各業(yè)務(wù)系統(tǒng)中,提供服務(wù)支持。
和用戶分群功能一樣,人群分析功能也需要組合標(biāo)簽篩選出目標(biāo)用戶群體,創(chuàng)建起需要分析的人群。然后,在“對(duì)比維度”選擇菜單中選擇需要分析該批用戶的維度,如下單次數(shù)、活躍度?!皩?duì)比維度”列表中的可選標(biāo)簽也是用戶屬性、用戶行為欄目中已經(jīng)構(gòu)建的標(biāo)簽。這樣我們就可以看到剛才篩選出來的用戶群在活躍度和下單次數(shù)上的表現(xiàn)了。
除了能透視分析單個(gè)人群在多個(gè)維度上的特征,還可以支持同時(shí)分析多個(gè)人群在不同維度上的表現(xiàn)。業(yè)務(wù)人員可以根據(jù)不同業(yè)務(wù)規(guī)則同時(shí)創(chuàng)建兩個(gè)人群,然后篩選對(duì)比維度,從多個(gè)維度上對(duì)比分析這兩個(gè)人群的特征。
用戶畫像產(chǎn)品化只是把數(shù)據(jù)應(yīng)用到業(yè)務(wù)服務(wù)中的一個(gè)重要出口,方便業(yè)務(wù)人員分析用戶群特征,將分析后的用戶群推送到對(duì)應(yīng)業(yè)務(wù)系統(tǒng)中,更方便、快捷地將數(shù)據(jù)賦能到業(yè)務(wù)場(chǎng)景中去。企業(yè)想要在營(yíng)銷和業(yè)務(wù)增量上有更大的突破,還需要在用戶畫像的基礎(chǔ)上,做更多產(chǎn)品策略性的思考。
【編輯 陳俊伶】