【摘要】本文對(duì)數(shù)據(jù)挖掘的基本原理進(jìn)行簡述,運(yùn)用數(shù)據(jù)挖掘工具及算法并結(jié)合實(shí)際說明了數(shù)據(jù)挖掘技術(shù)在銀行理財(cái)客戶的應(yīng)用。通過建立模型實(shí)證分析理財(cái)客戶線上遷移的有效性,并對(duì)銀行理財(cái)客戶進(jìn)行聚類,實(shí)證分析銀行理財(cái)客戶分群的必要性。
【關(guān)鍵詞】數(shù)據(jù)挖掘 理財(cái)客戶 線上遷移 聚類
數(shù)據(jù)挖掘技術(shù)是指從大量的、隨機(jī)的、有噪聲的實(shí)績運(yùn)用數(shù)據(jù)中掘取事先不知道的但又可能有用的信息和知識(shí)的過程。[1]本文通過銀行數(shù)據(jù)實(shí)證數(shù)據(jù)挖掘技術(shù)在銀行中的具體應(yīng)用與效果評(píng)估。
一、數(shù)據(jù)選取及預(yù)處理
本文選取某農(nóng)商銀行2015年3月20日(第一筆理財(cái)產(chǎn)品認(rèn)購時(shí)間)-2017年9月17日共17023筆個(gè)人理財(cái)客戶交易記錄。通過數(shù)據(jù)清理后得到人口統(tǒng)計(jì)信息字段:戶名、身份證號(hào)、性別、年齡;產(chǎn)品交易信息字段:產(chǎn)品代碼、理財(cái)賬戶、購買金額、產(chǎn)品認(rèn)購日期、產(chǎn)品成立日期、產(chǎn)品到期日期、封閉期時(shí)長、交易渠道(柜面、手機(jī)銀行)等。
二、描述性統(tǒng)計(jì)
第一,根據(jù)銀行理財(cái)客戶基本信息及交易信息截止2017年9月17日共有7617戶理財(cái)客戶其中男性3979戶,占比52.24%;女性3638戶占比47.76%。
第二,銀行理財(cái)客戶的年齡結(jié)構(gòu)符合正太分布,主要集中在40-60歲。
■
第三,農(nóng)商銀行客戶群理財(cái)資金量相對(duì)國有大型銀行來說較少,主要集中在100萬元以下。
三、客戶理財(cái)手機(jī)銀行渠道有效模型
為說明購買銀行理財(cái)由柜面向線上遷移的有效性,本文建立了手機(jī)銀行渠道有效模型:
假定M時(shí)點(diǎn)某客戶第一次通過手機(jī)銀行渠道購買理財(cái);
M-N時(shí)期客戶在柜面渠道購買理財(cái)次數(shù)接近于0
通過modeler構(gòu)建模型,重點(diǎn)節(jié)點(diǎn)解釋如下:
匯總1:以身份證號(hào)為關(guān)鍵字,匯總字段為認(rèn)購日期最小值;合并是以身份證號(hào)為關(guān)鍵字的內(nèi)部鏈接。
匯總2:以身份證號(hào)、交易渠道為關(guān)鍵字,總數(shù)做為默認(rèn)模式;選擇:丟棄交易渠道=“手機(jī)銀行”and Record_Count=1的記錄。
匯總3:以交易渠道作為關(guān)鍵字。
效果評(píng)估:通過手機(jī)銀行渠道購買過理財(cái)產(chǎn)品的3213戶理財(cái)客戶,后續(xù)有103戶返回到柜面渠道購買過理財(cái),1302戶在手機(jī)銀行渠道購買過理財(cái),有效率達(dá)92.7%。
四、理財(cái)客戶分群及行為預(yù)測
第一,RFM模型是客戶關(guān)系管理領(lǐng)域廣泛應(yīng)用的一種評(píng)價(jià)客戶忠誠度、流失傾向的一種算法。RFM分析的三類重要指標(biāo):一是距上次交易的時(shí)間R(Recency),二是最近統(tǒng)計(jì)期內(nèi)交易次數(shù)F(Frequency),三是最近統(tǒng)計(jì)期內(nèi)交易金額M(Monetary Value)。[3]
建立良好的客戶關(guān)系,通過無指導(dǎo)性的聚類分析,按類相似性最大化,類間相似性最小化的原則進(jìn)行客戶分群。[2]通過客戶的共性,發(fā)現(xiàn)他們的交易習(xí)慣。這樣既可以提高客戶滿意度又可以降低銀行的營銷成本。
第二,模型解釋。
選擇1(實(shí)驗(yàn)組):結(jié)束時(shí)間 >= "2017/09/18";
選擇2(測試組):結(jié)束時(shí)間 < "2017/09/18";
填充:將購買金額轉(zhuǎn)化為年日均金額;
通過K-Means聚類后分成四類,根據(jù)近因、頻數(shù)、貨幣三個(gè)指標(biāo)值區(qū)分出:聚類1(非活躍客戶)、聚類2(活躍大客戶)、聚類3(一般客戶)、聚類4(流失客戶),為提高營銷精準(zhǔn)性,選擇出聚類2(活躍大客戶)作為精準(zhǔn)營銷目標(biāo)客戶,展示如下圖。
第三,結(jié)果預(yù)測。聚類2(活躍大客戶)共有280戶,在選擇2(測試組)又有236戶有交易記錄,預(yù)測再次購買的準(zhǔn)確率為84.28%,符合預(yù)測結(jié)果,證實(shí)能通過客戶分層提升銀行理財(cái)客戶的精準(zhǔn)營銷要求。
五、結(jié)語
數(shù)據(jù)挖掘技術(shù)是一種先進(jìn)的數(shù)據(jù)處理技術(shù),對(duì)于數(shù)據(jù)挖掘技術(shù)的研究有利于提升銀行的競爭力。[4]本文詳細(xì)闡述了技術(shù)挖掘的概念,以客戶理財(cái)手機(jī)銀行渠道有效模型、RFM模型、K-Means聚類模型有針對(duì)性的分析了數(shù)據(jù)挖掘技術(shù)在銀行理財(cái)客戶線上遷移的應(yīng)用,銀行通過數(shù)據(jù)挖掘技術(shù)的應(yīng)用能有效提高客戶運(yùn)營效率,增強(qiáng)核心競爭力。
參考文獻(xiàn)
[1]傅國錦.數(shù)據(jù)挖掘技術(shù)在商業(yè)銀行客戶細(xì)分中的應(yīng)用.金華職業(yè)技術(shù)學(xué)院學(xué)報(bào)[J].2007(8).
[2]Jiawei Han,Micheline Kamber著.范明,孟小峰等譯.數(shù)據(jù)挖掘:概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社.2001.
[3]王文賢,金陽,陳道斌.基于RFM模型個(gè)人客戶忠誠度研究.金融論壇[J].2012(3).
[4]傅俊.數(shù)據(jù)挖掘技術(shù)及其在商業(yè)銀行中的應(yīng)用.軟件導(dǎo)刊[J].2014(2).
作者簡介:封錄(1987-),男,漢族,江蘇鹽城人,江蘇大學(xué)碩士,中級(jí)經(jīng)濟(jì)師,AFP持證人,CDA持證人,主要研究成果:cssci一篇、國內(nèi)核心一篇。