河北金融學院 郭佳
隨著Internet的飛速發(fā)展,網(wǎng)絡已經(jīng)成了一個全球性的巨大的信息服務中心,大量信息在給人們帶來方便的同時,也帶來很多問題:一是信息量過大,二是信息難辨真假,三是信息安全難以保證,四是信息形式不統(tǒng)一。所以人們開始考慮怎樣才能從海量信息中發(fā)現(xiàn)有用的知識,充分提高信息的利用率,于是數(shù)據(jù)挖掘技術(shù)便應運而生。
數(shù)據(jù)挖掘技術(shù)是從大量數(shù)據(jù)中提取或挖掘知識的過程,又稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn),是指從大型數(shù)據(jù)庫或數(shù)據(jù)倉庫中提取隱含的、未知的,但又是潛在有價值的信息和知識的過程。數(shù)據(jù)挖掘可以從數(shù)據(jù)中提取人們感興趣的可用信息和知識,并將它們表示成概念、規(guī)則、模式等形式,以便人們理解與利用。數(shù)據(jù)挖掘涉及多學科和技術(shù),例如數(shù)據(jù)庫技術(shù)、統(tǒng)計學、信息提取、高性能計算、機器學習、神經(jīng)網(wǎng)絡和數(shù)據(jù)可視化等學科。并應用于包括商業(yè)、保險業(yè)、電信業(yè)、教育、科學研究等多個領域。
如果從企業(yè)角度分析,數(shù)據(jù)挖掘是一種新的客戶信息處理技術(shù),通過對企業(yè)數(shù)據(jù)庫中的海量業(yè)務數(shù)據(jù)進行抽取、轉(zhuǎn)換、分析,從中提取對企業(yè)決策起到關鍵性作用的數(shù)據(jù),并進一步將其轉(zhuǎn)化為企業(yè)先進有效的管理方法。
綜上所述,我們可以把數(shù)據(jù)挖掘的概念總結(jié)以下幾個特點。
(1)數(shù)據(jù)挖掘是通過采用自動或半自動的手段,在海量數(shù)據(jù)中發(fā)現(xiàn)有意義的行為和規(guī)則的分析活動。(2)數(shù)據(jù)挖掘是以科學的方法和模型的建立作為挖掘基礎。(3)數(shù)據(jù)挖掘的使用者需要對決策問題深入理解,對模型深刻認識,從而作出科學的決策。
目前越來越多的企業(yè)使用數(shù)據(jù)挖掘技術(shù)來加強CRM的應用水平,衡量一個企業(yè)是否有競爭力也從先前看重它的產(chǎn)品和生產(chǎn)效率逐漸轉(zhuǎn)化為看重它是否具有良好的客戶關系。早期由于技術(shù)的限制,使得企業(yè)很難做到全方位了解客戶的特征和需求,而在現(xiàn)在這個網(wǎng)絡科技時代,成熟的數(shù)據(jù)庫和數(shù)據(jù)倉庫挖掘技術(shù),使企業(yè)能更便捷的掌握客戶的需求和行為??蛻絷P系管理是企業(yè)達到預期利潤目標的最有利工具,而數(shù)據(jù)挖掘就是這個工具的最佳引擎。數(shù)據(jù)挖掘在CRM中的應用模型如下圖所示。
具體來說,企業(yè)CRM應用數(shù)據(jù)挖掘的必要性體現(xiàn)在以下幾個方面。
圖1 數(shù)據(jù)挖掘在CRM中的應用模型
所謂把握客戶動態(tài)即快速了解客戶行動的改變、偏好的改變,快速做出相應的對策,從而贏得客戶。我們可以將客戶的生命周期分為:獲得新客戶、提高客戶價值、保持客戶三個階段。在生命周期的不同階段,數(shù)據(jù)挖掘也有其不同的應用價值。
首先,獲得新用戶是企業(yè)發(fā)展壯大所必須的,數(shù)據(jù)挖掘能夠從現(xiàn)有的客戶資料中總結(jié)出共同的特點,通過分類或聚類對客戶進行分類,再通過模式分析預測潛在客戶群,從而提高市場活動的響應率。
其次,由于現(xiàn)代企業(yè)和客戶之間的關系是經(jīng)常變化的,一旦公司之間建立了合作關系,企業(yè)就要盡力保持好這種關系,并不斷提高客戶價值,使其向著最長時間、最多交易次數(shù)、最大交易利潤的方向發(fā)展。而交叉銷售可以幫助企業(yè)實現(xiàn)以上目標。所謂交叉銷售及企業(yè)通過與客戶的交流,向現(xiàn)有客戶銷售新的產(chǎn)品或提供新的服務的過程。
再次,由于行業(yè)競爭的不斷加劇,企業(yè)獲得新客戶的成本也在不斷的上升,往往失去的客戶比新挖掘的客戶貢獻的利潤更多,因此對原有客戶的保持顯得尤為重要。據(jù)權(quán)威機構(gòu)統(tǒng)計數(shù)據(jù)說明,在全球500強中,5年內(nèi)流失客戶約50%,而企業(yè)獲取一個新客戶所消耗的成本是保留一個老客戶的近10倍,所以對企業(yè)而言,留住老客戶,提高客戶的忠誠度是非常重要的。利用數(shù)據(jù)挖掘的孤立點分析法,可以發(fā)現(xiàn)客戶異常行為,建立預測模型,找出易流失的客戶群體,制定相應的對策方案,避免客戶流失帶給企業(yè)的諸多不利影響。
數(shù)據(jù)挖掘技術(shù)可以對客戶的行為模式進行分析和追
蹤,發(fā)現(xiàn)客戶的行為方式和喜好,從而為客戶量身定做產(chǎn)品、定價及服務,實施個性化的營銷理念,這也是企業(yè)通過高質(zhì)量的產(chǎn)品和服務爭取新客戶、保持老客戶、提高客戶忠誠度和滿意度的重要途徑。
數(shù)據(jù)挖掘技術(shù)在企業(yè)的CRM中挖掘客戶歷史信息,通過得到的有價值的信息,預測潛在客戶信息,及時調(diào)整產(chǎn)品和服務方向,制定有針對性的決策方案,把握市場發(fā)展動態(tài)。
綜上所述,我們得出CRM是一種管理技術(shù),數(shù)據(jù)挖掘是一種數(shù)據(jù)處理和分析技術(shù)。后者是前者的運用工具,為其提供數(shù)據(jù)基礎平臺和技術(shù)支持。數(shù)據(jù)挖掘技術(shù)可以幫助CRM挖掘出企業(yè)隱含的、未知的,但又是潛在有用的信息和知識,包括客戶的特征、“黃金客戶”、客戶關注點以及客戶忠誠度等等,并能夠根據(jù)已有的信息對未來發(fā)生行為做出結(jié)果預測,科學確定各種業(yè)務的實施方案。數(shù)據(jù)挖掘在企業(yè)CRM中的應用,能夠?qū)⑷娴墓芾硪暯恰姶蟮慕涣髂芰妥畲蟮睦麧櫴找嫣峁┙o企業(yè)。
隨著我國企業(yè)對CRM應用水平的不斷提高,企業(yè)對CRM中數(shù)據(jù)挖掘部分的要求也會越來越高,數(shù)據(jù)挖掘在企業(yè)CRM中的作用也越來越顯著,具體表現(xiàn)如下所示。
數(shù)據(jù)挖掘在企業(yè)客戶關系管理中的應用范圍很廣泛,比如客戶盈利能力、客戶保留、客戶細分、客戶傾向、渠道優(yōu)化、風險管理、欺詐監(jiān)測、需求預測等等。在不同的應用領域體現(xiàn)著不同的應用價值。
(1)客戶價值的分析。通過數(shù)據(jù)挖掘技術(shù),可以分析客戶盈利能力及預測客戶盈利能力的變化,計算客戶對企業(yè)的價值度,根據(jù)價值度大小,劃分客戶群體,實施有針對性的服務,制定適合的市場策略。
(2)客戶滿意度分析。數(shù)據(jù)挖掘可以分析客戶對企業(yè)產(chǎn)品和服務的滿意度,把信息系統(tǒng)中的大量客戶分成不同的類,針對不同的類提供不同的個性化服務,幫助企業(yè)完善營銷策略,提高客戶的忠誠度,從而留住客戶。
(3)客戶的保持。數(shù)據(jù)挖掘中的聚類和關聯(lián)分析可以將企業(yè)客戶分為不同類型的群體,例如穩(wěn)定型價值高客戶群、易流失型價值高客戶群、穩(wěn)定型價值低客戶群、易流失型價值低客戶群和沒有價值的客戶群。從而輔助企業(yè)管理者針對不同客戶群體做出相應對策,避免客戶流失帶給企業(yè)不必要的損失。
(4)潛在客戶分析。一個企業(yè)若要獲取一個新客戶,就要從潛在客戶信息開始挖掘,發(fā)現(xiàn)客戶的行為習慣,發(fā)現(xiàn)行為相似的潛在客戶群,不斷挖掘新客戶,提高市場占有率。
(5)客戶的信用風險分析。采用數(shù)據(jù)挖掘中的神經(jīng)網(wǎng)絡算法對企業(yè)的海量數(shù)據(jù)進行分析和處理,并建立模型,對現(xiàn)有客戶群體進行測試,測探出具有欺詐傾向的客戶。同時可以采用孤立點分析法,找出行為異常的客戶進行防范。對客戶的信用風險進行分析預測,有利于企業(yè)在風險發(fā)生前進行預警,進而采取有效的措施進行控制。
總之,數(shù)據(jù)挖掘技術(shù)在中小企業(yè)CRM中的廣泛應用,為企業(yè)挖掘出有價值的潛在客戶的同時,使企業(yè)能夠按照不同客戶群體提供有針對性的個性服務,提高客戶的滿意度和忠誠度,提高客戶信用風險的預測和控制能力,從而提高企業(yè)CRM的應用水平和市場響應能力。
一個完整的數(shù)據(jù)挖掘過程主要由數(shù)據(jù)準備、數(shù)據(jù)挖掘和結(jié)果表達解釋三個階段構(gòu)成。如下圖所示。
圖2 數(shù)據(jù)挖掘的一般過程
在企業(yè)CRM中實施數(shù)據(jù)挖掘技術(shù)一般采用以下步驟:
(1)挖掘任務的確定。首先建立數(shù)據(jù)倉庫,明確需要解決的問題和預計達到的目標。決策者在制定任務目標時,要考慮企業(yè)的現(xiàn)狀和技術(shù)水平,也要考慮市場對企業(yè)的要求和挑戰(zhàn),這樣才能保證數(shù)據(jù)挖掘工作有效的開展和進行。
(2)應用用戶的確定。企業(yè)CRM系統(tǒng)的應用群體比較復雜,包括普通工作人員、部門管理者、高層決策者等,所以數(shù)據(jù)挖掘應用的用戶群體也比較復雜,因此細致的用戶需求分析是非常必要的。
(3)訓練數(shù)據(jù)源組的確定。數(shù)據(jù)挖掘的成功在很大程度上取決于數(shù)據(jù)的數(shù)量和質(zhì)量。我們應從大量的企業(yè)客戶數(shù)據(jù)中找到與分析問題有關的,具有代表性的樣本數(shù)據(jù)子集,并確保數(shù)據(jù)的適用性和質(zhì)量。然后,進行數(shù)據(jù)預處理、分析,按問題要求對數(shù)據(jù)進行組合或增刪,從而對問題狀態(tài)進行有效描述。
(4)數(shù)據(jù)挖掘技術(shù)的選擇。針對所要解決的問題,選擇適當?shù)耐诰蚣夹g(shù),可以在很大程度上提高系統(tǒng)的可靠性。例如若明確主要任務是客戶分類,我們可以采用貝葉斯分類算法、決策樹算法、遺傳算法等等,經(jīng)多方面的認真分析和權(quán)衡后,最終采用決策樹中ID3算法進行分類和預測,這個過程就是挖掘工具的選擇過程。
(5)模型的建立。模型的建立是數(shù)據(jù)挖掘的核心步驟,不同的挖掘技術(shù)產(chǎn)生的結(jié)果模型有很大區(qū)別,而且對模型的理解也存在著一定的差異,另外,對結(jié)果的表達和描述也非常重要,不恰當?shù)拿枋鰰o企業(yè)決策造成很大的誤導。
(6)結(jié)果的驗證。通過上述步驟,得到一組挖掘結(jié)果,使用建立模型的原始數(shù)據(jù)或新數(shù)據(jù)對其進行反復驗證,糾正其中的錯誤,提高挖掘結(jié)果的可靠性。
(7)用戶的理解與支持。用戶對客戶關系管理中數(shù)據(jù)挖掘的支持、理解和承諾,是數(shù)據(jù)挖掘成功的關鍵因素之一。所以要對用戶進行培訓,使他們熟悉使用CRM系統(tǒng)挖掘的整體流程、功能和作用,進而對挖掘結(jié)果深入理解和有效的可視化。
針對企業(yè)CRM系統(tǒng)不同的分析功能,分析結(jié)果可以選擇以報表形式或者以圖表形式進行顯示。
報表顯示主要是將從數(shù)據(jù)庫中讀取的數(shù)據(jù)按照一定的格式顯示出來,可以通過vbscript函數(shù)實現(xiàn)。圖表顯示主要是利用VML(Vector Markup Language,矢量標記語言)來實現(xiàn)。
在VML中單個元素被定義為形狀(shape),大多數(shù)形狀是由矢量路徑描述的。形狀有很多屬性,例如:名稱(title)、樣式(style)、填充(fi ll)、填充顏色(fi llcolor)等。本文中分析模塊利用的就是VML的基本元素,通過畫線、填充和樣式的控制來實現(xiàn)柱狀圖的顯示。
[1]趙華.基于數(shù)據(jù)挖掘的分析型CRM的應用研究[D].江蘇大學,2005.
[2]張云濤,龔玲.數(shù)據(jù)挖掘原理與技術(shù)[M].電子工業(yè)出版社,2004.
[3]陳京民.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘[M].電子工業(yè)出版社,2002.
[4]武森,高學東,(德)M.巴斯蒂安.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘[M].冶金工業(yè)出版社,2003.