霍魁
摘要:伴隨著信息技術的飛速發(fā)展,各行各業(yè)各個領域都在積極引進信息技術,銀行工作也是如此。當今時代已經(jīng)成為了富含海量數(shù)據(jù)信息的大數(shù)據(jù)時代,想要在此背景下從眾多信息中迅速挖掘出想要的信息,比以往要困難很多。對于銀行工作來說,數(shù)據(jù)基本決定了其發(fā)展,但是有些銀行目前卻還沒有發(fā)現(xiàn)海量爆炸性數(shù)據(jù)所造成的威脅,對此,相關工作人員必須加以重視,引進數(shù)據(jù)挖掘技術,實現(xiàn)銀行業(yè)的可持續(xù)發(fā)展。
關鍵詞:大數(shù)據(jù)時代;銀行;數(shù)據(jù)挖掘
隨著時代的發(fā)展和進步,對于銀行來說,需要不斷完善計算機系統(tǒng)中的操作數(shù)據(jù)存儲。數(shù)據(jù)庫群、企業(yè)數(shù)據(jù)倉庫、主數(shù)據(jù)存儲等建設相應的基礎網(wǎng)絡。NoSQL、Lucene、Hadoop、MapReduce等技術的發(fā)展適當?shù)脑黾恿算y行掌握數(shù)據(jù)的能力?,F(xiàn)階段,無論銀行面對的是外部數(shù)據(jù)和是內(nèi)部數(shù)據(jù)、非結構數(shù)據(jù)或者結構數(shù)據(jù),已經(jīng)具有比較成熟的產(chǎn)生、整合、存儲以及訪問數(shù)據(jù)的技術,此外,要想最大限度實現(xiàn)數(shù)據(jù)的價值,需要銀行全面分析挖掘數(shù)據(jù)的發(fā)展趨勢和規(guī)律,并運用到銀行運行中。
一、大數(shù)據(jù)時代銀行面臨的挑戰(zhàn)
(一)銀行中傳統(tǒng)方式對銀行企業(yè)文化的沖擊
隨著大數(shù)據(jù)的發(fā)展,對銀行產(chǎn)生很多影響和沖擊,對于銀行企業(yè)文化發(fā)展的影響主要包括以下幾方面:第一,摒棄偏愛純凈數(shù)據(jù)和有條理數(shù)據(jù),轉(zhuǎn)向接受非結構數(shù)據(jù),允許少量不精確數(shù)據(jù)。第二,逐漸從局部沖擊變?yōu)槿繘_擊,因為大數(shù)據(jù)時代不同于以往的情況,需要大量數(shù)據(jù),因此全面沖擊企業(yè)文化。第三,企業(yè)文化與數(shù)據(jù)逐漸沖因果關系變?yōu)橄嚓P關系[1]。
(二)銀行面臨的數(shù)字化挑戰(zhàn)
大數(shù)據(jù)分析對于銀行決策來說就是一定的擴展數(shù)據(jù)、快速分析數(shù)據(jù)的作用,支持銀行發(fā)展目標。隨著大數(shù)據(jù)時代的發(fā)展和進步,銀行面臨著一些挑戰(zhàn),一方面要使銀行內(nèi)部不斷開發(fā)新業(yè)務和新產(chǎn)品,另外一方面就是傳統(tǒng)數(shù)據(jù)結構性能問題。數(shù)字化的發(fā)展使得銀行需要面對大量的數(shù)據(jù),數(shù)據(jù)增長速度快、規(guī)模龐大;類型多,數(shù)據(jù)類型除了傳統(tǒng)的結構以外,還具有語音、視頻、文字、圖片等形式,結構復雜,內(nèi)容繁多;分析規(guī)則復雜,一般有價值的數(shù)據(jù)藏的都比較深,需要利用多種算法進行分析;具有很高的實時性,隨著數(shù)字化發(fā)展,數(shù)據(jù)處理的速度更快,實時性更強,需要及時準確地進行處理[2]。
二、數(shù)據(jù)挖掘技術
(一)數(shù)據(jù)挖掘概述
1.數(shù)據(jù)挖掘技術應用步驟
數(shù)據(jù)挖掘?qū)嶋H上就是在海量數(shù)據(jù)中利用各種分析工具來發(fā)現(xiàn)數(shù)據(jù)之間的關系和模型的過程,預測數(shù)據(jù)關系和模型,以便于可以很好的找到潛在的數(shù)據(jù)關系,發(fā)現(xiàn)被忽視的原因,因此,是目前解決數(shù)據(jù)爆炸的有效方式,被稱作KDD。數(shù)據(jù)挖掘?qū)儆诜磸偷倪^程,主要包括以下步驟:
第一,定義問題和分析主題。在挖掘數(shù)據(jù)的時候,需要分析應用領域,主要包括應用目標和知識[3]。定義問題可以適當?shù)某浞至私鈱嶋H情況,熟悉背景以及用戶需求,不能定義缺少背景的知識。在確定用戶實際需求以后,需要評估歷史數(shù)據(jù),利用數(shù)據(jù)挖掘來不斷滿足用戶需求,然后制定合理的數(shù)據(jù)挖掘計劃。
第二,準備數(shù)據(jù)。數(shù)據(jù)挖掘需要處理的數(shù)據(jù)不但具有大量數(shù)據(jù),還會存在一些冗余數(shù)據(jù)和噪音數(shù)據(jù)以及不完整數(shù)據(jù)。準備數(shù)據(jù)主要包括數(shù)據(jù)清理、集成數(shù)據(jù)、選擇數(shù)據(jù)、變換數(shù)據(jù)、歸約數(shù)據(jù)以及數(shù)據(jù)質(zhì)量分析。
第三,建立模型。主要就是通過已知知識和數(shù)據(jù)建立模型,能夠有效的分析和描述知識和數(shù)據(jù),可以在未知數(shù)據(jù)中進行應用。建模實際上就是把一般規(guī)律、相關經(jīng)驗形成抽象的分析模型,挖掘數(shù)據(jù)就是依據(jù)模型分析、處理、預測數(shù)據(jù)的過程。
第四,評估模式。評估模式主要就是通過知識來體現(xiàn)用戶需求,然后優(yōu)化挖掘數(shù)據(jù)過程中的數(shù)據(jù),直到符合規(guī)范。
2.數(shù)據(jù)挖掘技術算法
數(shù)據(jù)挖掘技術算法實際上具體實現(xiàn)數(shù)據(jù)挖掘方法,主要包括模型表示、模型評價標準以及發(fā)現(xiàn)方法三部分。數(shù)據(jù)挖掘技術算法主要包括決策樹、遺傳算法、K—近鄰算法、神經(jīng)網(wǎng)絡等。具有最佳搜索空間的方式就是遺傳算法,利用應用遺傳算法的適應函數(shù)來合理的搜索方向,然后通過人工算法來模擬一些生物種群的優(yōu)勝劣汰和多樣性,從而進行周而復始的一代代演化。決策樹是利用樹狀結構來體現(xiàn)影響數(shù)據(jù)變量的分析預測模型,屬性就是決策集合或者分類集合,通過自上到下的回歸方式,樹的葉結點代表不同種類、非終端結點代表屬性。合理計算每個樹期望值,得到最優(yōu)解。K—鄰近算法是在距離度量分類的基礎上進行的,假設所有集合不包括數(shù)據(jù)集,并且包括很多類別的期望值。神經(jīng)網(wǎng)絡是能夠模仿人類大腦思考結構的分析方式,利用非線性預測,來進行識別,從而得到各網(wǎng)絡單元的數(shù)據(jù)。數(shù)據(jù)挖掘工具核心內(nèi)容就是算法,主要包括分類分析、聚類分析、關聯(lián)分析、統(tǒng)計分析、時間序列、相關分析以及值預測。一般比較常用的就是分類算法、值預測和聚類分析[4]。
表一數(shù)據(jù)挖掘工具比較分析
三、數(shù)據(jù)挖掘技術在銀行中的應用
(一)貸款方進行信用風險評估應用
貸款方進行的信用風險評估是銀行應用數(shù)據(jù)挖掘技術的主要方式之一,可以建立一定的評級模型,例如,神經(jīng)網(wǎng)絡模型、FICO評估模型以及貝葉斯分析模型等來進行貸款方風險評估。在評估銀行賬戶信譽的時候,可以適當?shù)氖褂弥庇^量化的方式。依據(jù)信用評分為基本例子,在確定權重的時候,按照數(shù)據(jù)挖掘模型,對于申請過程中的每一項進行打分,累加起來就是申請人的實際信用情況。然后銀行依據(jù)信用評分來確定是否接受申請人的申請以及信用額度[5]。
(二)客戶關系管理中應用
客戶關系管理也是銀行數(shù)據(jù)挖掘技術應用的重要方式之一。發(fā)現(xiàn)以及開拓新客戶是銀行發(fā)展過程中比較重要的部分,利用探索性挖掘數(shù)據(jù)的方式,可以適當?shù)陌l(fā)現(xiàn)數(shù)據(jù)中心的特征以及預測營銷活動的實際響應率,例如,自動探測聚類。利用聚類分析的方式把客戶進行分類,然后依據(jù)客戶風險、服務收入成本等來分析、預測以及優(yōu)化相關因素,以便于能夠發(fā)現(xiàn)并達到盈利的目標。利用決策樹的方式來合理計算客戶貢獻期望值,以此來分類客戶,然后依據(jù)不同期望值進行分組,可以分為三種類別 ,包括黃金客戶、頂級客戶以及一般客戶。然后依據(jù)不同種類客戶的實際特點來提供一些特色服務,從而可以有效提高忠誠度。數(shù)據(jù)挖掘技術運用到銀行中,可以適當?shù)念A防流失客戶,在風險出現(xiàn)流失客戶的時候,需要通過特殊待遇、額外增值以及激勵忠誠度來對客戶進行保留。例如,在預測客戶停止在此銀行放貸,變?yōu)槿e的銀行,可以利用適當降低利率以及增加額度來保留客戶。數(shù)據(jù)挖掘可以在一定程度上及時轉(zhuǎn)移關聯(lián)因子,找到客戶中比較類似的轉(zhuǎn)移者,然后利用分析孤立點的方式來體現(xiàn)異??蛻粜袨?,以便于銀行能夠最大限度降低客戶流失[6]。
(三) 關聯(lián)規(guī)則挖掘在電子銀行產(chǎn)品推薦中的應用
隨著信息化技術的發(fā)展,電子技術也在不斷進步,傳統(tǒng)的銀行柜面服務模式已經(jīng)逐漸不能符合社會發(fā)展需求,電子銀行應運而生。在推薦電子銀行產(chǎn)品的時候運用關聯(lián)規(guī)則,從大量銀行數(shù)據(jù)中可以適當抽取一些有價值、有效的數(shù)據(jù)信息來推薦電子銀行產(chǎn)品,也是關聯(lián)技術的具體實踐,可以在一定程度上帶動銷售、挖掘客戶以及開發(fā)客戶等的發(fā)展。電子銀行發(fā)展,在一定程度上改變傳統(tǒng)的銀行模式,不斷提高銀行處理系統(tǒng)的智能化水平,讓客戶充分了解電子產(chǎn)品的優(yōu)勢,滿足客戶實際需求,建立相應的可以存儲大量數(shù)據(jù)的數(shù)據(jù)庫,利用簡單的方式進行操作就可以得到數(shù)據(jù)信息,需要從多角度、多層次進行關聯(lián)。關聯(lián)規(guī)則運用到推薦電子產(chǎn)品中,可以在一定程度上調(diào)節(jié)資源配置,解決人力和資金,提高銷售率,科學的進行市場預測,吸引客戶,以便于可以獲得更多利益[7]。
(四) 金融監(jiān)管應用
第一,隨著金融市場的不斷發(fā)展和進步,保證金融市場正常運行的就是金融監(jiān)管,同時也是預防市場風險的主要方式?,F(xiàn)階段,金融監(jiān)管方式應用數(shù)據(jù)挖掘及時最主要的就是集中在反洗錢方面。在反洗錢中應用數(shù)據(jù)挖掘中的分類研究、孤立點分析、聚類等方式具有很大優(yōu)勢,利用上述挖掘數(shù)據(jù)技術可以保證金融機構可以有效的監(jiān)測洗錢行為。
第二,監(jiān)管非現(xiàn)場。在監(jiān)管非現(xiàn)場的時候,進行數(shù)據(jù)挖掘,依據(jù)實際風險情況、資源情況、流動性情況、應力情況等,利用定量分析以及模型技術來逐漸累積監(jiān)管模型庫,以便于能夠及時的計量銀行經(jīng)營情況??蛻羟闆r以及風險情況,進行縱向和橫向比較,可以從根本上了解現(xiàn)場監(jiān)督以及警示非現(xiàn)場監(jiān)督。
第三,數(shù)據(jù)可視化。數(shù)據(jù)挖掘最重要的就是大量數(shù)據(jù),對數(shù)據(jù)進行可視化處理可以為分析數(shù)據(jù)提供可靠圖形,為金融監(jiān)管人員提供保障和基礎[8]。
結語
總而言之,隨著大數(shù)據(jù)時代的發(fā)展,銀行以往通過利息差來當作主要收入的形式已經(jīng)成為過去,銀行不僅面臨大數(shù)據(jù)時代臨挑戰(zhàn)和沖擊,還需要面對越來越激烈的行業(yè)競爭,因此,需要從以往的產(chǎn)品為中心的模式變?yōu)榭蛻魹橹行牡哪J剑浞职l(fā)揮數(shù)據(jù)挖掘技術的作用,掌握好客戶實際需求,并且開展一些具有一定針對性的營銷活動,為客戶服務,提高客戶價值,從而打造出具有競爭力的銀行。(作者單位:中國人民大學)
參考文獻:
[1]王日宏,王曉龍.大數(shù)據(jù)時代下數(shù)據(jù)挖掘在銀行中的應用[J].電腦知識與技術,2014(7):1369-1370,1374.
[2]于上上,陳璐,孫璐等.銀行數(shù)據(jù)挖掘的運用及效用研究[J].計算機光盤軟件與應用,2014(6):25-26.
[3]戴玉勤,景廣軍,謝俊元等.基于數(shù)據(jù)倉庫技術的銀行決策支持系統(tǒng)設計和實現(xiàn)[J].計算機工程與應用,2012,38(5):224-227.
[4]賀本嵐.大數(shù)據(jù)時代數(shù)據(jù)挖掘在銀行客戶關系管理中的應用研究[C].//第八屆中國管理學年會——中國管理的國際化與本土化論文集.2013:1-6.
[5]彭敢.Apriori算法在銀行系統(tǒng)數(shù)據(jù)挖掘中的應用[J].電腦編程技巧與維護,2012(24):62-63.
[6]郭瑩,張曉燕.數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術在銀行客戶關系管理中的應用[J].科技管理研究,2013,23(2):75-78.
[7]周晶平.數(shù)據(jù)挖掘在銀行分析型CRM系統(tǒng)應用中存在的問題與對策[J].湖北大學學報(自然科學版),2010,32(1):46-49.
[8]黃昶君,王林.大數(shù)據(jù)助推銀行零售業(yè)務量化經(jīng)營——大數(shù)據(jù)時代的零售數(shù)據(jù)挖掘和利用探索[J].海南金融,2014(1):66-69.