關(guān)鍵詞:信用卡;中老年信用卡客戶;隨機(jī)森林算法;K-means算法
一、導(dǎo)論及研究現(xiàn)狀
隨著金融科技領(lǐng)域的迅猛發(fā)展和消費(fèi)者支付偏好的轉(zhuǎn)變,信用卡市場(chǎng)正經(jīng)歷著由高速增長(zhǎng)向深度重構(gòu)的轉(zhuǎn)型。近年來,信用卡發(fā)卡量的增長(zhǎng)速度逐漸放緩,交易量也呈現(xiàn)出一定的波動(dòng)性,多家大中型銀行在信用卡業(yè)務(wù)領(lǐng)域正面臨客戶流失的嚴(yán)峻考驗(yàn)。這種客戶流失不僅直接沖擊著銀行的業(yè)務(wù)收入和市場(chǎng)份額,還可能對(duì)銀行的品牌聲譽(yù)及長(zhǎng)期發(fā)展造成不利影響。因此,深入剖析信用卡客戶流失的風(fēng)險(xiǎn)因素,并提出有效的應(yīng)對(duì)策略以降低流失率,對(duì)于提升客戶滿意度與忠誠(chéng)度,推動(dòng)銀行業(yè)務(wù)的可持續(xù)發(fā)展具有舉足輕重的意義[1]。
在以往針對(duì)客戶流失預(yù)測(cè)的研究中,早期的研究大多采用定性分析方法,通過構(gòu)建基于RFM模型和人口統(tǒng)計(jì)變量的多維度指標(biāo)體系,并借助神經(jīng)網(wǎng)絡(luò)模型來預(yù)測(cè)商業(yè)銀行的客戶流失情況。然而,隨著數(shù)據(jù)挖掘技術(shù)的興起,許多學(xué)者開始利用聚類集成算法,如K-means算法,對(duì)客戶特征進(jìn)行高效分類,以識(shí)別出具有顯著特征的客戶群體,或者采用決策樹法來構(gòu)建客戶流失的預(yù)警模型[2]。
在隨機(jī)森林(RF)、決策樹(DT)、支持向量機(jī)(SVM)和邏輯回歸(LR)這四種常用的分類器算法中,隨機(jī)森林算法以其卓越的精準(zhǔn)度和良好的召回率及其他性能指標(biāo)脫穎而出[3]。鑒于此,本文決定采用隨機(jī)森林算法來識(shí)別影響中老年信用卡客戶流失的關(guān)鍵因素,并隨后運(yùn)用K-means算法以這些關(guān)鍵因素為特征進(jìn)行客戶畫像的繪制。此舉旨在為銀行提供科學(xué)的客戶挽留與召回策略建議,從而有效提升客戶的生命周期價(jià)值[4]。
二、數(shù)據(jù)描述
為強(qiáng)化研究的針對(duì)性和數(shù)據(jù)的時(shí)效性,本文聚焦于Z銀行某特定網(wǎng)點(diǎn)中老年信用卡客戶(年齡界定在45歲及以上)的交易數(shù)據(jù)。研究周期設(shè)定為2023年12月至2024年5月,共計(jì)六個(gè)月。在此期間,依據(jù)客戶近六個(gè)月內(nèi)無(wú)信用卡交易的行為,界定為客戶流失,并據(jù)此篩選出了5953條有效數(shù)據(jù)記錄。
(一)人口統(tǒng)計(jì)描述
如圖1和圖2所示,從性別和年齡來看,中老年女性客戶信用卡流失率高于中老年男性客戶,從婚姻狀態(tài)來看,婚姻存續(xù)的中老年客戶流失率最低,單身的中老年客戶流失率最高[5]。
(二)金融財(cái)務(wù)狀況描述
如圖3、4、5所示,信用卡的使用余額是衡量客戶信用卡消費(fèi)情況的重要指標(biāo),余額較低則表明卡內(nèi)額度被更充分地使用。在深入剖析中老年客戶的金融財(cái)務(wù)狀況后,發(fā)現(xiàn)中老年流失客戶的信用卡余額顯著高于中老年非流失客戶。進(jìn)一步從信用卡持卡類別分析,持有白金卡的中老年客戶流失率最為突出,達(dá)到了28.6%。此外,在信用額度方面,中老年流失客戶的平均信用額度相較于中老年非流失客戶更低。
三、客戶流失預(yù)測(cè)
(一)變量檢驗(yàn)和選取
1.皮爾遜相關(guān)系數(shù)檢驗(yàn)。為構(gòu)建高效的中老年客戶流失率預(yù)測(cè)模型,利用皮爾遜相關(guān)系數(shù)對(duì)關(guān)鍵變量進(jìn)行了詳盡檢驗(yàn),旨在深入剖析各變量在預(yù)測(cè)中老年客戶流失率方面的重要性。如表1檢驗(yàn)結(jié)果顯示,總交易金額與信用卡平均利用率分別與中老年客戶流失率展現(xiàn)出18.82%和19.18%的顯著負(fù)相關(guān)性。而信用卡余額的負(fù)相關(guān)性更為強(qiáng)烈,達(dá)到了27.26%;尤為值得注意的是,總成交筆數(shù)與中老年客戶流失率之間的負(fù)相關(guān)性最為顯著,高達(dá)38.17%。這些發(fā)現(xiàn)為后續(xù)構(gòu)建和優(yōu)化預(yù)測(cè)模型提供了寶貴的參考依據(jù)。
2.T檢驗(yàn)和U檢驗(yàn)。為了更精確地評(píng)估上述變量是否對(duì)中老年客戶流失產(chǎn)生顯著影響,本研究運(yùn)用了T檢驗(yàn)與U檢驗(yàn),對(duì)比分析中老年流失客戶群與未流失客戶群之間的差異。如表2所示,通過仔細(xì)觀察這些變量在兩類客戶群體中的P值,發(fā)現(xiàn)所有變量均不符合正態(tài)分布的假設(shè)。尤其在U檢驗(yàn)的結(jié)果中,關(guān)鍵指標(biāo)如信用卡余額、用戶活躍度、總交易金額、總交易次數(shù)、平均用卡頻率及購(gòu)買產(chǎn)品數(shù)量,在中老年流失客戶與未流失客戶間顯示出顯著的差異。
(二)構(gòu)建預(yù)測(cè)模型
如圖6所示,本研究采用隨機(jī)森林算法構(gòu)建了預(yù)測(cè)模型,輸入了上述變量進(jìn)行預(yù)測(cè)分析。模型運(yùn)行結(jié)果顯示,準(zhǔn)確率為0.930,精確率為0.868,而召回率為0.676,相對(duì)較低,這表明模型在識(shí)別所有實(shí)際流失客戶方面還有提升空間。此外,模型的ROC曲線_AUC值為0.970,表明模型在區(qū)分正負(fù)樣本方面表現(xiàn)良好,具有優(yōu)秀的分類性能。綜上所述,所選變量與中老年信用卡客戶的流失行為緊密相關(guān),且模型構(gòu)建有效。
(三)流失客戶分類
為精準(zhǔn)制定營(yíng)銷策略以應(yīng)對(duì)不同流失客戶特征群體,本文采用機(jī)器學(xué)習(xí)中的無(wú)監(jiān)督學(xué)習(xí)聚類算法,專門對(duì)中老年客戶群體進(jìn)行分類。通過實(shí)施K-means聚類分析于樣本數(shù)據(jù)之上,我們成功劃分出四類具有鮮明特征的客戶群體。進(jìn)一步驗(yàn)證顯示,該模型的準(zhǔn)確率高達(dá)93.8%(具體數(shù)據(jù)參見表3)。
在四類中老年客戶特征分析中,第一類客戶以最高平均年齡著稱,其平均流失率達(dá)到了15%。由于此類客戶的信用卡額度相對(duì)較低,且對(duì)信用卡產(chǎn)品服務(wù)的使用頻率不高,導(dǎo)致客戶黏性較低,因此較易流失。第二類中老年客戶的平均流失率則顯著較低,僅為3%。他們的信用卡額度明顯高于其他類別客戶,顯示出高價(jià)值客戶的特征。同時(shí),他們的交易金額和交易筆數(shù)均較高,但信用卡的平均利用率卻相對(duì)較低。盡管目前流失率很低,但仍需保持高度關(guān)注,以防潛在流失風(fēng)險(xiǎn)。第三類中老年客戶的平均流失率為9%。他們的信用卡額度低于其消費(fèi)能力,存在透支行為,且持有的消費(fèi)金融產(chǎn)品最多。這使得他們的流失行為可能性仍需進(jìn)一步觀察。最后,第四類中老年客戶的平均流失率高達(dá)27%,為四類客戶中最高。盡管他們的信用情況良好,但信用卡的使用率卻很低,且卡額度的使用不充分。因此,這類客戶的挽留潛力相對(duì)較大,值得重點(diǎn)關(guān)注。
四、建議
一是優(yōu)化中老年客戶信用等級(jí)評(píng)級(jí)標(biāo)準(zhǔn),設(shè)計(jì)更為科學(xué)合理的評(píng)估指標(biāo)體系。通過構(gòu)建專門的數(shù)據(jù)收集與分析系統(tǒng),全面收集中老年客戶的各類信息,包括但不限于銀行流水、社保繳納記錄、房產(chǎn)證明等,以實(shí)現(xiàn)對(duì)客戶信用狀況的精準(zhǔn)評(píng)估。二是推出多元化的消費(fèi)金融產(chǎn)品和服務(wù),涵蓋旅游分期、購(gòu)物分期等多種消費(fèi)金融產(chǎn)品,以滿足中老年客戶多樣化的消費(fèi)需求。同時(shí),提供線上線下相結(jié)合的便捷服務(wù)渠道,提升客戶體驗(yàn)。三是深入挖掘中老年信用卡消費(fèi)場(chǎng)景,基于對(duì)中老年人消費(fèi)習(xí)慣與需求的深刻洞察,開發(fā)出更符合其實(shí)際使用場(chǎng)景的信用卡產(chǎn)品。并圍繞信用卡產(chǎn)品,為中老年客戶提供一系列增值服務(wù),以進(jìn)一步提升客戶滿意度與忠誠(chéng)度。
(作者簡(jiǎn)介:何井丹、夏廣偉,長(zhǎng)沙民政職業(yè)技術(shù)學(xué)院講師。)