王子君 梁峰
摘 要:客戶未來活躍度和購買頻次信息對客戶關(guān)系管理具有重要決策參考價值。文章基于國內(nèi)某大型石化企業(yè)成品油客戶購油數(shù)據(jù),采用MBG/CNBD-k模型對客戶未來活躍度及購買頻次進(jìn)行建模,研究結(jié)果表明,該模型對客戶流失率預(yù)測具有較高的準(zhǔn)確率,有助于石化企業(yè)及時發(fā)現(xiàn)可能流失的客戶,針對性地開展客戶維系與挽留措施,減少客戶流失。
關(guān)鍵詞:MBG/CNBD-k模型;客戶活躍度;客戶購買行為預(yù)測
中圖分類號:F274 文獻(xiàn)標(biāo)識碼:A 文章編號:1005-6432(2022)13-0137-04
DOI:10.13939/j.cnki.zgsc.2022.13.137
1 引言
在客戶關(guān)系管理中,非契約客戶與企業(yè)關(guān)系不受合同影響,客戶轉(zhuǎn)移成本較低,客戶未來活躍度信息對于營銷決策具有重要價值。管理者可以依據(jù)客戶活躍度預(yù)測,提升營銷政策的精準(zhǔn)性,通過對客戶活躍度細(xì)分,及時采取措施降低客戶流失率。目前,預(yù)測客戶購買活躍度主要有兩大類方法:一類是機(jī)器學(xué)習(xí)模型,例如邏輯回歸模型[1]、決策樹模型[2]、支持向量機(jī)[3]等;另一類是概率模型,例如Pareto/NBD模型[4-5]、BG/NBD模型[6-7]、MBG/NBD模型[8]、MBG/CNBD-k模型[9]等,這兩條技術(shù)路線均有各自的追隨者。MBG/CNBD-k模型是新提出的針對客戶購買行為的概率建模方法[9],其對經(jīng)典Pareto/NBD概率模型進(jìn)行了改進(jìn),由于提出時間較短,其預(yù)測效果尚未得到廣泛驗證。文章基于國內(nèi)某大型石化企業(yè)成品油客戶購油數(shù)據(jù),使用MBG/CNBD-k模型對客戶活躍度及購買頻次構(gòu)建模型,增進(jìn)客戶管理相關(guān)領(lǐng)域?qū)BG/CNBD-k模型的認(rèn)識及推廣應(yīng)用。
2 MBG/CNBD-k模型簡介
2.1 模型設(shè)定
MBG/CNBD-k模型建立在MBG/NBD模型的基礎(chǔ)之上,模型有六個基本假設(shè)。
(1)在客戶活躍時,客戶與企業(yè)交易的動機(jī)和行為是隨機(jī)的,并且客戶交易次數(shù)服從交易率為λ的泊松分布,客戶交易時間間隔服從k階愛爾朗分布,其概率密度為:
當(dāng)k等于1時,MBG/CNBD-k模型退化為MBG/NBD模型,k值越大意味購買時間間隔的規(guī)律性越強(qiáng)。
(2)不同客戶之間的交易率存在異質(zhì)性,既有頻繁購買客戶,也有購買一次之后流失的客戶。假定交易率λ在不同客戶間的異質(zhì)性服從形狀參數(shù)為r和尺度參數(shù)為α的伽瑪分布,其概率密度為:
不同客戶交易率的平均值為E[λ|r, α]=r/α,方差為D[λ|r, α]=r/α2??蛻舻慕灰茁适艿絽?shù)r和α的共同影響。
(3)每個客戶存在一個不可觀測的生命周期,假定客戶每次交易后變得不活躍的概率為p,允許客戶在首次交易便以概率p退出,客戶退出時間點(diǎn)服從幾何分布。
(4)假定客戶流失概率p的異質(zhì)性服從形狀參數(shù)為a和尺度參數(shù)為b的貝塔分布。與伽瑪分布相比,貝塔分布其變量取值范圍介于0到1之間,適合用于描述未知概率值的變化。
其中B(a, b)為貝塔函數(shù), 可以用伽瑪函數(shù)表示為:
不同客戶流失概率的均值為E[p|a, b]=a/(a+b),故客戶的流失概率受到參數(shù)a和b的共同影響。
(5)交易率λ和流失概率p相互獨(dú)立。
(6)觀測期從客戶第一次購買開始。
2.2 參數(shù)估計
MBG/CNBD-k模型除了需要客戶在觀測期內(nèi)的重復(fù)購買次數(shù)x、交易關(guān)系時間長度tx 以及觀測截止時間T三個方面信息之外,還加入一個反映客戶購買時間間隔規(guī)律性的變量,記為litt,這是MBG/CNBD-k模型與之前提出的概率模型一個重要不同之處??蛻艚灰讜r間間隔是否具有規(guī)律性,對于預(yù)測客戶活躍度具有重要影響,litt近似為客戶交易時間間隔的對數(shù)和,表達(dá)式如下:
其中ti表示第i次交易時間,ti+1-ti為交易時間間隔。litt值越大,客戶購買時間間隔規(guī)律性越強(qiáng)。
MBG/CNBD-k模型中,隨機(jī)選擇的客戶在時間T活躍的條件概率為:
客戶在未來一段時間內(nèi)條件期望交易次數(shù)為:
模型中的五個參數(shù)k, r, α, a, b可以通過式(9)的最大似然法估計得到,樣本的似然函數(shù)如下。估計程序使用R語言BTYDplus程序包。
根據(jù)式(7)和式(8),代入客戶歷史購買信息(x, tx, T, litt),可以計算客戶在觀測期結(jié)束時客戶活躍度及在未來指定時段的期望購買頻次。
3 實證分析
3.1 數(shù)據(jù)處理及描述統(tǒng)計
本研究選取國內(nèi)某大型石化企業(yè)成品油客戶交易數(shù)據(jù),數(shù)據(jù)包含約5萬客戶的80余萬條購油交易記錄,交易時間為2017年1月到2019年10月。對數(shù)據(jù)的轉(zhuǎn)換主要包括以下幾個方面。
(1)剔除數(shù)據(jù)中企業(yè)內(nèi)部交易記錄,該類交易屬于非市場化的交易行為。
(2)構(gòu)建客戶交易特征變量。將原始數(shù)據(jù)中同一客戶分布在多行的交易信息進(jìn)行匯總,測算每一客戶在觀測期內(nèi)除首次購買之外的重復(fù)購買頻次x;觀測期內(nèi)第一次交易與最后一次交易的時間間隔tx;客戶在觀測期內(nèi)第一次交易到觀測期截止的時間間隔T,計算客戶時間規(guī)律性變量litt。四個預(yù)測變量的描述性統(tǒng)計如表1所示。
3.2 實驗設(shè)計
為防止模型出現(xiàn)過擬合,客觀評價模型的預(yù)測效果,本研究將數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集,訓(xùn)練集為從全部樣本客戶中隨機(jī)抽取80%樣本客戶,測試集為剩下20%的樣本客戶。并將訓(xùn)練集和測試集劃分為觀測期和驗證期,觀測期為2017年1月到2019年6月客戶交易數(shù)據(jù),驗證期為2019年7月到2019年10月數(shù)據(jù)。使用訓(xùn)練集觀測期數(shù)據(jù)估計模型參數(shù)。452F8187-7752-45FF-A17F-EB9E6F421547
MBG/CNBD-k模型對客戶流失率的預(yù)測效果使用預(yù)測準(zhǔn)確率、精確率、召回率、特異度、F1值五個指標(biāo)綜合評價。將預(yù)測的活躍度與客戶后期實際購買情況對比,使用KS曲線選擇活躍度閾值,作為流失預(yù)測臨界點(diǎn)??蛻艋钴S度大于或等于該閾值為未流失客戶,小于該閾值為流失客戶。
3.3 參數(shù)估計結(jié)果及預(yù)測效果
代入樣本客戶信息(X=(x, tx, T, litt)),式(9)最大似然法得到估計參數(shù)結(jié)果為:k=2, r=0.87, α=15.09, a=0.37, b=3.53,代入式(7)得到客戶2019年6月30日的活躍度。根據(jù)KS曲線選擇MBG/CNBD-k模型活躍度閾值為0.8。MBG/CNBD-k模型準(zhǔn)確率為81.55%,指在模型預(yù)測結(jié)果中預(yù)測正確的樣本占總樣本數(shù)的81.55%;精確率為88.47%,指在模型預(yù)測為流失的客戶中預(yù)測正確的樣本所占比例,模型精確度越高,第一類錯誤越低;召回率為80.22%,指在真正流失的客戶中模型預(yù)測為流失的客戶占真正流失客戶的比重,召回率越高,第二類錯誤越低。這三個指標(biāo)互相補(bǔ)充,綜合反映模型的估計結(jié)果,遠(yuǎn)高于隨機(jī)判斷。
4 MBG/CNBD-k模型發(fā)現(xiàn)的客戶購買行為規(guī)律
通過對比模型測算的客戶活躍度及其購買特征,發(fā)現(xiàn)客戶在觀測截止時間點(diǎn)的活躍度與其購買特征存在以下規(guī)律。
4.1 最近購買時間距離當(dāng)前越近,活躍度及未來復(fù)購頻次越高
具有相同復(fù)購次數(shù)客戶,客戶最后一次購買時間距離觀測截止點(diǎn)的時間越近,即tx與T差值越小,其計算得到的活躍度概率及未來交易次數(shù)越高。這表明與客戶之間沒有交易的時間越長,客戶流失的可能性越大。表2列出若干個隨機(jī)抽取的客戶,客戶6和客戶2重復(fù)購買頻次x及客戶時間規(guī)律litt相同,客戶6距離當(dāng)前時間更短,其活躍度及未來復(fù)購頻次高于客戶2。
4.2 復(fù)購頻次越高,活躍度及未來復(fù)購頻次越高
客戶最后一次購買時間距離觀測截止點(diǎn)的時間相差不大,客戶重復(fù)購買頻次越高,客戶活躍度及未來交易頻次越高,如表2中,客戶7和客戶5時間規(guī)律litt及客戶最后一次購買時間距離觀測截止點(diǎn)的時間相差不大,客戶7復(fù)購頻次更高,其活躍度及未來復(fù)購頻次高于客戶5。
4.3 規(guī)律購買客戶具有更高的活躍度及復(fù)購頻次
客戶實際復(fù)購頻次及最后一次購買時間距離觀測截止點(diǎn)的時間間隔相差不大,客戶購買時間規(guī)律性litt越大,客戶活躍度及未來交易頻次越高,如客戶3和客戶4復(fù)購頻次及最近度相近,客戶4時間規(guī)律性越大,其活躍度及未來復(fù)購頻次高于客戶4。
4.4 最近購買時間對活躍度及未來復(fù)購頻次的影響高于復(fù)購次數(shù)及購買規(guī)律性
客戶最后一次購買時間距離觀測截止點(diǎn)時間間隔比復(fù)購頻次對活躍度及未來交易頻次的影響更大,如客戶2和客戶6活躍度及未來復(fù)購頻次變化幅度,遠(yuǎn)大于客戶5和客戶7的變化幅度;客戶最近度影響比時間規(guī)律性對活躍度及未來復(fù)購頻次的影響更大,如客戶2和客戶6活躍度及未來交易頻次變化幅度大于客戶3和客戶4。
4.5 客戶活躍度與購買頻次正向相關(guān)
隨著客戶活躍度增大,客戶購買可能性和客戶未來復(fù)購次數(shù)也隨之增加,詳見表3。客戶活躍度小于0.8,發(fā)生0次購買的客戶占比較大,表明購買概率較低,可認(rèn)為該客戶已流失;客戶活躍度大于或等于0.8,發(fā)生0次購買的客戶比例明顯下降,發(fā)生多次購買的客戶比例顯著增加。
從以上分析可知,采用KS曲線確定流失臨界值的效果較好。客戶活躍度臨界值對預(yù)測客戶購買行為具有重要作用,客戶活躍度大于或等于該臨界值,客戶與企業(yè)發(fā)生交易的概率顯著提升。
5 小結(jié)與應(yīng)用建議
MBG/CNBD-k模型在預(yù)測客戶活躍度和重復(fù)購買頻次有較好的準(zhǔn)確度,企業(yè)可將其用于客戶關(guān)系管理,作為石化企業(yè)預(yù)測客戶行為的決策依據(jù),有助于石化企業(yè)維持客戶。企業(yè)根據(jù)客戶活躍度和未來重復(fù)購買頻次對客戶進(jìn)行細(xì)分,實行不同類型的客戶差異化管理。針對MBG/CNBD-k模型的應(yīng)用,文章提出以下建議。
5.1 根據(jù)客戶活躍度進(jìn)行客戶分類管理,提升營銷的精準(zhǔn)性
根據(jù)客戶預(yù)測活躍度可將客戶分為兩大類客戶:活躍客戶和不活躍客戶。在活躍客戶中進(jìn)一步識別出零星活躍客戶,零星活躍客戶是指模型預(yù)測為活躍,但是兩次購買時間間隔較長的客戶。針對不同類型客戶采取個性化管理措施。零星活躍客戶在活躍與流失之間搖擺,挽留這類客戶是企業(yè)營銷工作的重點(diǎn),可以給企業(yè)帶來較大價值。針對活躍客戶應(yīng)采取定期回訪措施,保持客戶的活躍度。不活躍客戶是已經(jīng)流失的客戶,應(yīng)該分析其流失原因,屬于近期流失還是早已流失,針對近期流失的采取必要的挽留營銷措施。
5.2 定期根據(jù)客戶交易特征數(shù)據(jù)開展客戶活躍度預(yù)測,了解客戶活躍總規(guī)模
活躍度除了設(shè)置閾值判斷客戶活躍程度,反映具體客戶的流失情況,還可以運(yùn)用MBG/CNBD-k模型計算客戶活躍度,然后將所有客戶的活躍度進(jìn)行加總,以此估算企業(yè)客戶總規(guī)模??蛻艋钴S度總和反映企業(yè)有購買需求的累計客戶數(shù)量,該統(tǒng)計指標(biāo)是對以客戶人數(shù)記錄測度客戶規(guī)模指標(biāo)的一個補(bǔ)充,幫助企業(yè)了解客戶總體滿意度的變動。
參考文獻(xiàn):
[1]周靜,周小宇,王漢生.自我網(wǎng)絡(luò)特征對電信客戶流失的影響[J].管理科學(xué),2017(5):28-37
[2]張宇,張之明.一種基于C5.0決策樹的客戶流失預(yù)測模型研究[J].統(tǒng)計與信息論壇,2015(1):89-94.
[3]夏國恩,馬文斌,唐嬋娟,等.融入客戶價值特征和情感特征的網(wǎng)絡(luò)客戶流失預(yù)測研究[J].管理學(xué)報,2018,15(3):442-449.
[4]齊佳音,李懷祖,舒華英,等.SMC模型在IT分銷業(yè)的實證研究[J].中國管理科學(xué),2003,11(6):71-76.
[5] SCHMITTLEIN D C,MORRISON D G,COLMBO R.Counting your customers: who-are they and what will they do next?[J].Management Science,1987,33(1):1-24.
[6]吳昊,王純,周立娟.BG/NBD模型的手機(jī)閱讀業(yè)務(wù)客戶價值預(yù)測實證研究[J].計算機(jī)系統(tǒng)應(yīng)用,2013(3):166-169.
[7] OEST R V,KNOX G.Extending the BG/NBD: a simple model of purchases and complaints[J].International Journal of Research in Marketing,2011,28(1):30-37.
[8] BATISLAM E P,DENIZEL M,F(xiàn)ILIZTEKIN A.Formal response to “Erratum on the MBG/NBD Model”[J].International Journal of Research in Marketing,2008,25(3):227-227.
[9] PLATZER M,REUTTERER NADINE S.Leveraging purchase regularity for predicting customer behavior the easy way[J].International Journal of Research in Marketing,2020(12): 194-215.
[基金項目]文章得到教育部人文社科基金(項目編號:19YJA790052)資助。
[作者簡介]王子君(1998—),女,漢族,湖北人,碩士,研究方向:客戶關(guān)系管理;通訊作者:梁峰(1977—),男,漢族,廣東人,副教授,博士,研究方向:經(jīng)濟(jì)統(tǒng)計、數(shù)據(jù)挖掘。452F8187-7752-45FF-A17F-EB9E6F421547