俞 倩 雯
(國網(wǎng)上海市電力公司, 上海 200235)
近年來,新能源汽車產(chǎn)業(yè)發(fā)展迅猛,為踐行“雙碳”目標,各地新能源汽車推廣量大幅增加,新能源汽車用戶數(shù)量隨之增加,各類企業(yè)入場新能源汽車充電服務市場,充電運營服務行業(yè)發(fā)展迅速,傳統(tǒng)充電運營企業(yè)在充電設施建設、充電網(wǎng)絡規(guī)劃、充電設備運維等方面都有豐富的經(jīng)驗,但在充電服務經(jīng)營,尤其是個人充電用戶運營、精準營銷等方面缺乏經(jīng)驗。在大客戶營銷服務方面,充電運營企業(yè)可以采用配置客戶經(jīng)理等一對一營銷策略,但在量大面廣的個人充電用戶端,由于信息不對稱,往往很難開展精準營銷服務。用戶運營和精準營銷是互聯(lián)網(wǎng)行業(yè)優(yōu)勢領域,如何借鑒互聯(lián)網(wǎng)行業(yè)大數(shù)據(jù)分析技術(shù),對個人充電用戶進行用戶畫像,從而實現(xiàn)差異化服務和精準用戶營銷,具有重要意義。
用戶價值評價是用戶畫像技術(shù)中最基礎的環(huán)節(jié),RFM模型是評價用戶價值最常用的工具,該模型最早由Arthur Hughes提出[1],RFM模型中,R(Recency)代表近度,即最近一次消費距今的時間,F(Frequency)代表頻度,即觀測期內(nèi)消費的次數(shù),M(Monetary)代表額度,即觀測期內(nèi)消費的總金額,這三個指標可以有效反映用戶的忠誠度和貢獻度。近年來,有諸多使用RFM模型對用戶進行價值評價的研究,如陳倩舒等采用RFM模型對物流客戶價值進行研究[2]。RFM模型在消費用戶評價方面有很大的普適性,但在特定領域客戶價值評價方面,往往會采用改進的RFM模型來優(yōu)化評價結(jié)果,如包志強等在RFM模型的基礎上,引入平均交易間隔和貢獻時間,對百度外賣客戶進行價值分析[3],楊琳等則在RFM模型的基礎上,增加會員入會時長和會員機票平均折扣率對民航客戶開展細分研究[4]。
以某充電運營企業(yè)的充電交易記錄為例,分析充電用戶消費特性,建立改進的、適合充電用戶的RFM模型,通過數(shù)據(jù)挖掘與訓練,對個人充電用戶進行細分價值研究。
以某充電運營企業(yè)2022年2月充電交易數(shù)據(jù)進行數(shù)據(jù)分析,2022年2月共產(chǎn)生交易數(shù)據(jù)281 136條,每條數(shù)據(jù)包括“用戶id”、“充電樁編碼”、“充電站”、“交易流水號”、“訂單創(chuàng)建時間”、“交易電量”、“交易金額”等56個字段,為確定充電用戶、用戶充電時間、用戶充電電量和充電站點,提取其中“用戶id”,“訂單創(chuàng)建時間”,“交易電量”和“充電站”等4個字段為研究字段。原始數(shù)據(jù)字段名及格式如表1所示。
表1 原始數(shù)據(jù)字段名及格式
由于充電樁故障或通信故障會造成無效訂單,需要對原始數(shù)據(jù)進行數(shù)據(jù)清洗,定義交易電量為0或大于500 kWh的訂單為無效訂單,共計37 888條。剔除無效訂單后,有效訂單共計243 248條。
研究的對象為個人充電用戶,故對公交充電用戶及有合作關系的大客戶等多人共用賬號訂單做篩除,篩除相關訂單后,剩余有效訂單145 820條。后續(xù)所有數(shù)據(jù)分析和建模基于此數(shù)據(jù)樣本。
研究對象為新能源汽車的個人充電用戶,這些充電用戶具有一般消費者的共性,RFM模型的三個基礎參數(shù)可以有效反映充電用戶的忠誠度和貢獻度,但另一方面,由于充電行為是有別于一般互聯(lián)網(wǎng)消費的線下行為,充電場所可以反映用戶的充電習慣,因此,在RFM模型基礎上,增加充電用戶充過電的充電站數(shù)量S,對用戶進行建模,以R、F、M、S作為評價用戶價值的特征量,具體定義如下:
R:用戶最近一次充電距離當前日期(2022年3月1日)的天數(shù);
F:用戶在觀測期(2022年2月1日—2022年2月28日)內(nèi)的充電次數(shù);
M:用戶在觀測期內(nèi)的充電電量;
S:用戶在觀測期內(nèi)充過電的充電站數(shù)量。
對數(shù)據(jù)樣本做數(shù)據(jù)透視,145 820條充電訂單共用戶48 521個,計算每個用戶的R、F、M、S值,所有用戶的R、F、M、S統(tǒng)計特性如表2所示。
表2 所有用戶的R、F、M、S統(tǒng)計特性
由于R、F、M、S量綱不同,對后續(xù)模型訓練可能造成影響,采用Z-Score方式對R、F、M、S進行標準化處理:
(1)
(2)
(3)
(4)
Ri、Fi、Mi、Si——第i個用戶的R、F、M、S值;
σR、σF、σM、σS——所有用戶R、F、M、S的標準差。
定義用戶i標準化后的用戶評價指標向量為:
(5)
1.3.1 K-means聚類算法[5]
在改進的RFM模型的基礎上,定義用戶評價指標向量Wi后,采用K-means的聚類算法對充電用戶進行聚類分析,K-means 的算法步驟為:
(1) 選擇初始化的k個用戶評價指標向量作為初始聚類中心,為減少計算步驟,加快收斂速度,采用K-means的方式確定初始聚類中心。
(2) 對樣本中每個用戶的評價指標向量,計算它到k個聚類中心的距離并將其分到距離最小的聚類中心所對應的類中,此處距離計算采用歐幾里得距離,Dij代表用戶i與用戶j之間的距離,即兩用戶評價指標間的差距,由以下公式計算:
(6)
兩個用戶間評價指標向量間的距離Dij越小,代表這兩個用戶在評價上越接近。
(3) 針對每個類別,重新計算它的聚類中心,即屬于該類的所有用戶的評價指標向量的質(zhì)心。
(4) 重復上面 2、3兩步操作,直到聚類中心不再變化,即得到最終的分類。
1.3.2 簇數(shù)k的確定
為判斷K-means聚類算法的好壞,定義聚類后的標準誤差和SSE,SSE越小代表聚類后同簇中用戶評價指標向量間距離和越小,則聚類越精細。
(7)
式中:SSEk——簇數(shù)為k時的標準誤差和;
Ci——第i個簇;
mi——Ci的聚類中心;
w——Ci中的用戶的評價指標向量。
計算k為2到7時的標準誤差和,并繪制標準誤差和圖。
標準誤差和圖如圖1所示,由標準誤差和圖可以發(fā)現(xiàn),k越大,SSE越小,聚類越精細,但當k超過4時,SSE的變化趨于平穩(wěn),因此選取k=4,即將充電用戶分為4類。
圖1 標準誤差和圖
基于改進的RFM模型,通過K-means聚類,可以獲得四類充電用戶群,每類用戶群的數(shù)量及聚類中心的R*、F*、M*、S*、R、F、M、S值聚類結(jié)果如表3所示。
表3 聚類結(jié)果
為直觀顯示各類用戶R、F、M、S分布,繪制各簇用戶R、F、M、S的核密度曲線圖(Kernel Density Estimation,KDE)。用戶群0的R、F、M、S的核密度曲線圖如圖2所示。用戶群1的R、F、M、S的核密度曲線圖如圖3所示。用戶群2的R、F、M、S的核密度曲線圖如圖4所示。用戶群3的R、F、M、S的核密度曲線圖如圖5所示。
圖2 用戶群0的R、F、M、S的核密度曲線圖
圖3 用戶群1的R、F、M、S的核密度曲線圖
圖4 用戶群2的R、F、M、S的核密度曲線圖
圖5 用戶群3的R、F、M、S的核密度曲線圖
通過基于大數(shù)據(jù)分析的充電用戶價值評價方法,將目標樣本充電用戶分為四類,通過分析四類用戶的R、F、M、S分布,可以對四類用戶做出評價,用戶評價如表4所示。
表4 用戶評價
用戶群3:最高價值用戶,共有598個用戶,此類用戶距最近一次充電時間最短,平均在1.46天前進行最近一次充電,觀測期內(nèi)充電頻率最高,平均為29.65次,平均每天超過一次,觀測期內(nèi)充電量最高,平均充電666.86 kWh,是企業(yè)具有最高價值的用戶,且可以發(fā)現(xiàn)這類用戶觀測期內(nèi)平均在6.07個充電站充過電,基本可以確定大部分不是兩點一線的上班族,而是網(wǎng)約車或出租車等運營車輛(企業(yè)應對此類用戶精準營銷,保持其活躍度和貢獻度)。
用戶群2:重要價值用戶,共有5 080個用戶,此類用戶距最近一次充電時間較短,平均在3.49天前進行最近一次充電,觀測期內(nèi)充電頻率較高,平均為9.59次,觀測期內(nèi)充電量較高,平均充電186.95 kWh,活躍度較高,貢獻度較高,忠誠度較高,這類用戶觀測期內(nèi)平均在2.84個充電站充過電,多數(shù)可能為兩點一線的上班族,部分為運營車輛(應重點發(fā)展此類用戶,進一步將其發(fā)展為最高價值用戶)。
用戶群1:一般發(fā)展用戶,共有25 181個用戶,是所有類型中數(shù)量最多的用戶群,此類用戶距最近一次充電時間低于平均值,平均在5.82天進行最近一次充電,觀測期內(nèi)充電頻率較低,平均為2.13次,觀測期內(nèi)充電量較低,平均充電41.72 kWh,此類用戶貢獻度一般,忠誠度一般,這類用戶觀測期內(nèi)平均在1.28個充電站充過電,基本確定為非運營車輛的私家車(可制定專屬營銷策略,保持或挽留此類用戶)。
用戶群0:低價值用戶,共有17 658個用戶,此類用戶距最近一次充電時間最長,平均在20.39天前進行最近一次充電,觀測期內(nèi)充電頻率最低,平均為1.46次,觀測期內(nèi)充電量最低,平均充電28.33 kWh,貢獻度和忠誠度最低,這類用戶觀測期內(nèi)平均在1.13個充電站充過電,同樣基本確定為非運營車輛的私家車(是企業(yè)低價值用戶群)。
本文針對傳統(tǒng)充電運營企業(yè)在充電用戶運營、精準營銷等方面缺乏經(jīng)驗的現(xiàn)狀,借鑒互聯(lián)網(wǎng)行業(yè)大數(shù)據(jù)分析技術(shù),提出一種基于大數(shù)據(jù)分析的充電用戶價值評價方法。
應用大數(shù)據(jù)分析的基本思路,選取充電交易數(shù)據(jù),首先進行數(shù)據(jù)清洗,確認分析樣本,在RFM模型的基礎上,引入充電站數(shù)量S,形成評判用戶價值的四維評價指標向量W,再通過K-means聚類方法訓練模型,最終獲得四類用戶群。
根據(jù)四類用戶的R、F、M、S分布,逐一分析特點,最終對四類用戶做出價值評價,分為最高價值用戶、重要價值用戶、一般價值用戶和低價值用戶,為后續(xù)精準化營銷策略的制定提供參考依據(jù)。
本文在數(shù)據(jù)選取時,僅選取了用戶id、訂單創(chuàng)建時間、交易電量、充電站4個字段,事實上,另有52個其他字段描述交易詳情。未來,可以考慮將用戶習慣充電時間(工作日或周末)、充電時段(早、中、晚或凌晨)、充電支付方式、賬戶余額等變量引入模型,創(chuàng)建更多維度的用戶評價指標向量,實現(xiàn)更深層次和更細致的用戶畫像。