許荻迪
[摘 要] 交叉營銷是商業(yè)銀行開展營銷活動、進行客戶關系管理,降低成本、增加利潤的關鍵。關聯(lián)規(guī)則挖掘能夠分析銀行海量交易數(shù)據(jù)獲得潛在規(guī)則,為商業(yè)銀行交叉營銷提供強有力的支持。采用關聯(lián)規(guī)則分析中的Apriori和Carma算法,從信貸產(chǎn)品類別和具體產(chǎn)品兩個層面,對商業(yè)銀行信貸產(chǎn)品的年度交易記錄進行數(shù)據(jù)挖掘。研究結(jié)果顯示,關聯(lián)規(guī)則挖掘應用于商業(yè)銀行信貸產(chǎn)品交叉營銷研究是可行的和有效的,對于已購買不同種類、不同具體產(chǎn)品的客戶,需要綜合考慮關聯(lián)規(guī)則的具體形式、支持度、置信度等各方面,制定批量營銷、精準營銷、套餐營銷等不同的交叉營銷策略。
[關鍵詞] 關聯(lián)規(guī)則挖掘;商業(yè)銀行;信貸產(chǎn)品;交叉營銷
[中圖分類號] F830.33 [文獻標識碼] A
[文章編號] 1009-6043(2017)03-0103-04
Abstract: Cross marketing is the key to holding marketing activities, customer relationship management, decrease of cost and increase of revenue for commercial banks. Association rule mining could help analyze the large amount of transaction data on banks for obtaining potential rules and offering strong support to the cross marketing of commercial banks. With Apriori and Carma, two analysis algorithms of association rules, the annual transaction record of the credit products of commercial banks are analyzed from the perspectives of credit product category and specific product. The result shows that it is feasible and effective to apply association rules mining into the study of cross marketing of credit products of commercial banks. As to customers who buy specific products of different category, the specific form, support degree, and degree of confidence should be considered comprehensively for creating different cross marketing such as bulk marketing, precision marketing and package marketing.
Key words: association rule mining, commercial banks, credit product, cross marketing
一、引言
交叉營銷(Cross Selling)是一種發(fā)現(xiàn)顧客的多種需求,并通過滿足其需求而銷售多種相關服務或產(chǎn)品的一種新興營銷方式。由于銀行業(yè)市場競爭的日益激烈,銀行想要依靠獲得新客戶的方式來開展經(jīng)營活動越來越困難。交叉銷售作為一種向現(xiàn)有客戶銷售更多產(chǎn)品的一種營銷方式,正好適應了市場競爭環(huán)境的變化。有關研究表明[1],開發(fā)一個新客戶的費用是保留一個老客戶費用的5倍,成功保留老客戶可大幅節(jié)約企業(yè)成本、增加企業(yè)利潤,交叉銷售正是銀行保留老客戶的一種非常重要的方法。同時,交叉營銷還有助于商業(yè)銀行更有針對性地開展營銷活動,擴大銷售量,提高客戶滿意度。
作為數(shù)據(jù)挖掘(Data Mining)中最活躍的研究方法之一,關聯(lián)規(guī)則挖掘(Association rule mining)能夠“在大量的數(shù)據(jù)中挖掘知識”[2],從龐大的企業(yè)歷史資料中,找出隱藏的規(guī)律并建立模型預測未來[3]。關聯(lián)規(guī)則分析在個性化推薦、醫(yī)療數(shù)據(jù)分析、語義分析等領域都有廣泛的作用[4]-[6],同時也適用于銀行業(yè)研究:通過挖掘銀行海量的交易數(shù)據(jù),獲得信貸產(chǎn)品被同一客戶購買的潛在規(guī)則,為商業(yè)銀行交叉營銷提供強有力的支持。
為了充分發(fā)揮關聯(lián)規(guī)則挖掘?qū)ι虡I(yè)銀行信貸產(chǎn)品交叉營銷的決策支持作用,本文針對商業(yè)銀行的實際情況和交叉營銷需求,采用Apriori和Carma算法,以某銀行的實際業(yè)務數(shù)據(jù)為例,對其信貸產(chǎn)品的中小企業(yè)年度購買記錄進行數(shù)據(jù)挖掘。經(jīng)過對信貸產(chǎn)品分類和具體產(chǎn)品兩個層面的挖掘分析,改善了商業(yè)銀行進行信貸產(chǎn)品交叉營銷過程中針對性不足的問題,給出了交叉營銷思路和相關建議。
二、關聯(lián)規(guī)則挖掘的適用性分析
關聯(lián)規(guī)則分析的目的是找出數(shù)據(jù)庫中隱藏的關系網(wǎng),挖掘出隱藏在數(shù)據(jù)庫中的關聯(lián)規(guī)則,利用這些關聯(lián)規(guī)則可以根據(jù)已知情況對未知問題進行推測判斷[7]。關聯(lián)規(guī)則分析的基本思想是,若數(shù)據(jù)集中兩個或多個數(shù)據(jù)項同時出現(xiàn)在同一筆或同一個客戶交易中的概率很高,則認為這些數(shù)據(jù)項之間存在某種關聯(lián),從而可建立起關聯(lián)規(guī)則。[1]
商業(yè)銀行常規(guī)的產(chǎn)品設計和營銷,尤其是交叉營銷,采取的是自上而下的思路。首先,商業(yè)銀行錨定一組設想的需求設計產(chǎn)品;其次,在要通過交叉營銷推廣該產(chǎn)品時,根據(jù)之前確定的需求設想一組規(guī)則,在已有客戶庫中篩選出可能具有這些需求的客戶;最后,試圖用該產(chǎn)品的特點匹配篩選出的客戶的需求進行營銷。然而,在這個過程中,產(chǎn)品所針對的需求、客戶的篩選規(guī)則、篩選出的客戶所具有的需求特征都是商業(yè)銀行根據(jù)經(jīng)驗、觀察和調(diào)研設計的,并沒有通過實際數(shù)據(jù)的驗證,其中可能存在或大或小的偏差,產(chǎn)品的特點也許并不能滿足原先設想的客戶群體的實際需求,或者沒有推銷到真正需要的客戶群體中。
關聯(lián)規(guī)則挖掘?qū)τ谏虡I(yè)銀行信貸產(chǎn)品的交叉營銷十分適用,能夠通過現(xiàn)有所有客戶的所有信息,找出這些客戶的實際行為規(guī)律,因此是基于實際客戶、實際信息和實際行為而設計頂層規(guī)則的自下而上的做法。關聯(lián)規(guī)則挖掘能夠充分利用商業(yè)銀行長期以來積累的所有數(shù)據(jù),為其制定符合實際的策略提供支持,與上述傳統(tǒng)方式互相補充、互相提升。
三、模型和數(shù)據(jù)處理
(一)關聯(lián)規(guī)則挖掘模型
在關聯(lián)規(guī)則挖掘中,若分析得出30%的客戶購買了A產(chǎn)品,這些客戶中的80%還購買了B,該規(guī)則可表示為形如“A→B”的蘊含式,其中A通常被稱為前項(antecedent或left-hand-side,LHS),B為后項(consequent或right-hand-side,RHS)。在考察關聯(lián)規(guī)則的代表性和有效性時,需要同時考慮兩條獨立的標準,即支持度(support)、置信度(confidence)。支持度表示關聯(lián)規(guī)則的前項在所有交易中出現(xiàn)的百分比,用來衡量關聯(lián)規(guī)則的重要性;置信度表示在前項出現(xiàn)的情況下,后項也出現(xiàn)的百分比,表示這條規(guī)則成立的概率。在上例中,“A→B”的規(guī)則支持度為30%,置信度為80%。
最常見的關聯(lián)規(guī)則挖掘算法是Apriori算法和Carma算法。Apriori算法把挖掘關聯(lián)規(guī)則的過程分為兩個階段:一是獲取頻繁集。這些項集出現(xiàn)的頻繁度至少和預定義的最小支持度一樣。二是由頻繁集產(chǎn)生關聯(lián)規(guī)則。這些規(guī)則必須滿足最小可信度。[8]CARMA是Berkeley大學的Christian Hidber教授1999年提出來的,該算法改進了傳統(tǒng)關聯(lián)規(guī)則挖掘算法,占用內(nèi)存較少,能夠處理在線連續(xù)交易流數(shù)據(jù),并且能夠在掃描交易流的過程中不斷改變支持度,以控制輸出的規(guī)則的大小和數(shù)目。[9]
(二)數(shù)據(jù)處理
本研究采用某商業(yè)銀行的2014年基數(shù)數(shù)據(jù)。采用Access數(shù)據(jù)庫管理系統(tǒng),將時間窗口內(nèi)的中小企業(yè)貸款業(yè)務月度報表合并在一個數(shù)據(jù)庫里,并采用SQL語言對數(shù)據(jù)進行查詢、計算和整理,得到13098條業(yè)務數(shù)據(jù)和9566條客戶數(shù)據(jù)。根據(jù)客戶購買記錄將其分為僅購買1次信貸產(chǎn)品、購買同一種信貸產(chǎn)品多次、購買多種信貸產(chǎn)品三類,篩選出購買多種信貸產(chǎn)品的客戶,對其購買情況進行關聯(lián)規(guī)則挖掘。
該數(shù)據(jù)集中共有36種信貸產(chǎn)品,根據(jù)其特征和性質(zhì)分為4類:信用產(chǎn)品,即不需要抵押和擔保的信用類貸款;特色產(chǎn)品,即專門針對三農(nóng)、文化、綠色、科技、惠民等特色金融領域開發(fā)的符合行業(yè)特征的信貸產(chǎn)品;專項產(chǎn)品,即對企業(yè)資質(zhì)、擔保等有專門要求的產(chǎn)品;基礎產(chǎn)品即沒有特殊命名的普通貸款,在該數(shù)據(jù)集中被標識為“其他貸款”。
四、關聯(lián)規(guī)則挖掘
同一客戶對同一個信貸產(chǎn)品,甚至同一類別的信貸產(chǎn)品需求總是有限的。例如,短期內(nèi)一個企業(yè)的抵押物是有限的,因此不可能無限制地購買抵押貸款產(chǎn)品。購買多個產(chǎn)品,甚至是多種類的產(chǎn)品,能夠在金額、期限、利率、放款節(jié)奏等各方面互補地為企業(yè)提供資金支持。如果能夠恰當?shù)貫槠髽I(yè)推薦多個、多種類的信貸產(chǎn)品,就能在更好滿足客戶需求的情況下,增加商業(yè)銀行的業(yè)務量和利潤,這也是交叉營銷的意義所在。
為了挖掘出哪些信貸產(chǎn)品傾向于被同一客戶購買,首先對該銀行客戶購買的不同信貸產(chǎn)品類別進行挖掘,然后挖掘客戶同時購買的具體產(chǎn)品,從而為交叉營銷提供兩個層面的依據(jù)。在這兩個層面的關聯(lián)規(guī)則挖掘中,都同時使用Apriori和Carma兩種算法,并對兩種算法的結(jié)果進行比較和分析。
(一)按信貸產(chǎn)品分類進行關聯(lián)規(guī)則挖掘
采用Apriori算法對不同類別信貸產(chǎn)品被同時購買的情況進行關聯(lián)規(guī)則挖掘,設定置信度在25%以上。支持度較高的挖掘結(jié)果如下表所示。以挖掘出的第一條關聯(lián)規(guī)則為例,在所分析的客戶群體中,18.67%的客戶購買了特色產(chǎn)品,其中85.71%同時還購買了基礎產(chǎn)品,這說明對已購買特色產(chǎn)品的客戶交叉營銷基礎產(chǎn)品成功率較高。
除了“A→B”的形式,挖掘結(jié)果中還有“(AandB)→C”的形式。該形式體現(xiàn)在本數(shù)據(jù)集的挖掘結(jié)果中,如下表所示。下列關聯(lián)規(guī)則的支持度都不高,在實際操作中,適用范圍較小。
采用Carma算法的挖掘結(jié)果與Apriori算法基本一樣,置信度不低于25%,支持度較高的關聯(lián)規(guī)則同表1,但是Carma算法沒有挖掘出表2的關聯(lián)規(guī)則。
(二)按具體產(chǎn)品進行關聯(lián)規(guī)則挖掘
1.采用Apriori算法進行挖掘
采用Apriori算法對具體產(chǎn)品進行關聯(lián)規(guī)則挖掘。支持度在25%以上的產(chǎn)品共有4個,例如,購買了其他貸款的客戶為80%,這些客戶同時還購買信托貸款買斷的概率為23.33%。所有支持度在25%以上,置信度在20%以上的關聯(lián)規(guī)則,如下表所示。
以上關聯(lián)規(guī)則的置信度都不高于70%,該算法還挖掘出一些置信度為100%的關聯(lián)規(guī)則。購買了創(chuàng)意貸(廣告和會展;文化體育休閑;出版發(fā)行和版權(quán)交易;廣告影視節(jié)目制作)、節(jié)能貸(EMCo貸款)、法人設備按揭、就業(yè)貸、薦信貸、軟件貸、智權(quán)貸、訂單貸等11種信貸產(chǎn)品的客戶,100%也購買了其他貸款。類似的,購買了創(chuàng)意貸(軟件、網(wǎng)絡、計算機)和留學人員創(chuàng)業(yè)貸款的客戶,100%也購買了信用貸;購買了集成電路設計貸款的客戶100%購買了信托貸款買斷,同時也100%購買了瞪羚計劃貸款。但是這些產(chǎn)品的支持度都比較低,在0.67%-3.33%之間。另外,還有4條形如“(AandB)→C”、置信度為100%的關聯(lián)規(guī)則,它們同樣支持度很小(0.67%)。如下表所示:
2.采用Carma算法進行挖掘
采用Carma算法對具體產(chǎn)品的購買情況進行關聯(lián)規(guī)則挖掘,支持度不低于25%、置信度不低于20%的關聯(lián)規(guī)則挖掘結(jié)果與表3一致。
Carma算法與Apriori算法的一個顯著的區(qū)別是,Carma算法能夠挖掘出形如“A→(BandC)”的規(guī)則,即Carma算法的結(jié)論可以包含兩項產(chǎn)品。例如,購買了瞪羚計劃貸款,同時有8.7%的可能性會購買信用貸(“融信寶”中小企業(yè)信用貸款)和其他貸款2個產(chǎn)品。這樣的關聯(lián)規(guī)則沒有在Apriori算法的結(jié)果中出現(xiàn),如下表所示。這些關聯(lián)規(guī)則的支持度比較小,在6.52%到9.52%之間。對于已購買這些前項產(chǎn)品的客戶,可以考慮直接推銷后項中所顯示的產(chǎn)品組合。
Carma算法所挖掘的置信度100%的規(guī)則少于Apriori算法,僅有7條。兩種算法的結(jié)果的不同,正顯示了同時使用兩種算法的必要性,即有助于做出更全面的分析。
五、結(jié)果分析和交叉營銷建議
采用Apriori和Carma算法對商業(yè)銀行信貸產(chǎn)品購買情況進行關聯(lián)規(guī)則挖掘,兩種算法的結(jié)果基本吻合,也比較符合現(xiàn)實情況,證明采用關聯(lián)規(guī)則對商業(yè)銀行信貸產(chǎn)品交叉營銷進行決策支持是可行的和有效的。不論是針對產(chǎn)品類別還是具體產(chǎn)品層面的關聯(lián)規(guī)則挖掘,都給商業(yè)銀行信貸產(chǎn)品的交叉營銷提出了一些參考思路。
(一)基于產(chǎn)品類別的交叉營銷建議
基于產(chǎn)品分類而不是單個產(chǎn)品的關聯(lián)規(guī)則分析,有利于對商業(yè)銀行客戶的購買行為有整體的了解,由于產(chǎn)品分類比較簡單明了,相應的關聯(lián)規(guī)則也比較簡單清晰,據(jù)此進行交叉營銷容易操作。
根據(jù)關聯(lián)規(guī)則挖掘的結(jié)果——4種產(chǎn)品類別相互之間被同一顧客購買的關系顯示,對已購買不同種類的信貸產(chǎn)品的客戶,其交叉營銷策略應有所區(qū)別:
1.對于所有基礎產(chǎn)品以外的產(chǎn)品,都可對已購買該產(chǎn)品的客戶營銷基礎產(chǎn)品。
2.對于已購買基礎產(chǎn)品的客戶,可向其營銷專項產(chǎn)品。
3.對于已購買專項產(chǎn)品和信用產(chǎn)品其中任意一種的客戶,除了基礎產(chǎn)品之外,還可向其推薦前兩種信貸產(chǎn)品中未購買的另一種。
4.關聯(lián)規(guī)則挖掘結(jié)果顯示,特色產(chǎn)品很少和專項產(chǎn)品、信用產(chǎn)品一起被同一客戶購買。同時,也沒有任何一種產(chǎn)品被購買之后,能向該客戶推薦特色產(chǎn)品。這是由于特色產(chǎn)品對企業(yè)所處領域、所從事業(yè)務范圍的針對性較強,特色產(chǎn)品適合根據(jù)企業(yè)特征直接營銷,而非根據(jù)企業(yè)購買的其他產(chǎn)品來交叉營銷。
上述四類關系及其支持度、置信度如下圖所示。其中,每類產(chǎn)品下方標識的比率為支持度,表示該產(chǎn)品在所有共同購買關系中出現(xiàn)的幾率;每個箭頭上標識的比率為置信度,表示依據(jù)該規(guī)則進行交叉營銷成功的幾率。
(二)基于具體產(chǎn)品的交叉營銷建議
在對產(chǎn)品分類挖掘的基礎上,再對具體產(chǎn)品數(shù)據(jù)進行挖掘,有助于找出覆蓋面較大、或者營銷成功率較高的具體產(chǎn)品,為交叉營銷提出更有針對性的建議。挖掘結(jié)果顯示,根據(jù)不同類型的關聯(lián)規(guī)則可制定不同的交叉營銷策略。
1.批量營銷。支持度比較高的規(guī)則的前項產(chǎn)品由于本身被購買較多,依據(jù)這些關聯(lián)規(guī)則進行交叉營銷,覆蓋面較大。根據(jù)挖掘結(jié)果,應采取短信、微信、郵件等成本較低的廣撒網(wǎng)的批量方式進行營銷,向相關客戶優(yōu)先營銷關聯(lián)規(guī)則中置信度排在前列的后項產(chǎn)品,對于重點客戶可單獨采取重點營銷。例如,根據(jù)表1,對于購買了其他貸款的客戶,優(yōu)先營銷信托貸款買斷和瞪羚計劃貸款,這兩類信貸產(chǎn)品都屬于專項產(chǎn)品,這也與關于產(chǎn)品分類的結(jié)論一致。
2.精準營銷。支持度比較低的關聯(lián)規(guī)則的前項產(chǎn)品被購買的幾率較小,因此已購買這些產(chǎn)品的客戶群體較小。盡管如此,關聯(lián)規(guī)則顯示,某些產(chǎn)品與這些產(chǎn)品被共同購買的置信度為100%,這意味著依照這些關聯(lián)規(guī)則進行交叉營銷成功率較高,也就是將交叉營銷的對象和產(chǎn)品的范圍縮小到了較為精準的程度。對于這些客戶建議采取精準營銷,采用電話、面談等點對點的方式進行。例如,前面提到的15組置信度為100%的產(chǎn)品購買關系。
3.套餐營銷。Carma算法能夠挖掘出對客戶營銷一個產(chǎn)品組合(即多于1個產(chǎn)品)的關聯(lián)規(guī)則,如表5。本研究得出的這類關聯(lián)規(guī)則雖然支持度低,但是對于購買了這些產(chǎn)品的客戶,營銷規(guī)則中的后項產(chǎn)品組合營銷成功率高(置信度高),并且由于客戶可能一并購買兩種之前沒購買過的信貸產(chǎn)品,這對于提高業(yè)務量、利潤和客戶忠誠度的作用都優(yōu)于僅再購買一種產(chǎn)品。對于這些客戶建議在不投入太大額外營銷成本的基礎上,設計套餐進行營銷。
六、結(jié)論
交叉營銷是商業(yè)銀行開展營銷活動、進行客戶關系管理,降低成本、增加利潤的關鍵。關聯(lián)規(guī)則挖掘能夠分析銀行海量交易數(shù)據(jù)獲得潛在規(guī)則,為商業(yè)銀行交叉營銷提供強有力的支持。
為了充分發(fā)揮關聯(lián)規(guī)則挖掘?qū)ι虡I(yè)銀行信貸產(chǎn)品交叉營銷的決策支持作用,本文針對商業(yè)銀行的實際情況和交叉營銷需求,采用Apriori和Carma算法,以某銀行的實際業(yè)務數(shù)據(jù)為例,對其信貸產(chǎn)品的中小企業(yè)年度購買記錄進行數(shù)據(jù)挖掘。經(jīng)過對信貸產(chǎn)品分類和具體產(chǎn)品兩個層面的挖掘分析,改善了商業(yè)銀行進行信貸產(chǎn)品交叉營銷過程中針對性不足的問題,給出了交叉營銷思路和相關建議。
從關聯(lián)規(guī)則挖掘的結(jié)果來看,兩種算法的結(jié)果基本吻合,也比較符合現(xiàn)實情況,從而證明了采用關聯(lián)規(guī)則對商業(yè)銀行信貸產(chǎn)品交叉營銷進行決策支持的可行性和有效性。產(chǎn)品類別和具體產(chǎn)品層面的關聯(lián)規(guī)則挖掘結(jié)果都顯示,對于已購買不同種類、不同具體產(chǎn)品的客戶,需要綜合考慮支持度、置信度和規(guī)則形式等各方面,制定批量營銷、精準營銷、套餐營銷等不同的交叉營銷策略。
[參 考 文 獻]
[1]孫景,田甜.基于多層關聯(lián)規(guī)則的銀行產(chǎn)品交叉銷售策略[J].中國金融電腦,2008(10):76-79
[2]Jiawei Han, Micheline Kanber. Data Mining: Concepts and Techniques [M]. San Francisco: Morgan Kaufmann, 2000
[3]戴穩(wěn)勝,匡宏波,謝邦昌.數(shù)據(jù)挖掘中的關聯(lián)規(guī)則[J].統(tǒng)計研究,2002(8):40-42
[4]丁振國,陳靜.基于關聯(lián)規(guī)則的個性化推薦系統(tǒng)[J].計算機集成制造系統(tǒng),2003(10):891-893
[5]李虹,蔡之華.關聯(lián)規(guī)則在醫(yī)療數(shù)據(jù)分析中的應用[J].微機發(fā)展,2003(6):94-97
[6]李德毅,邸凱昌,李德仁,史雪梅.用語言云模型發(fā)掘關聯(lián)規(guī)則[J].軟件學報,2000(2):143-158
[7]王明哲,基于數(shù)據(jù)挖掘技術(shù)的信用卡客戶的信用評價[J].商場現(xiàn)代化,2007(8):77-78
[8]于海波,姜鍇.數(shù)據(jù)挖掘在銀行交叉銷售中的應用研究[J].計算機技術(shù)與應用進展,210:423-426
[9]左映華,高居泰,李晉宏.Carma關聯(lián)規(guī)則算法的一種改進[J].韶關學院學報(自然科學版),2004(3)
[責任編輯:王鳳娟]