肖艷群
摘要:數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)是存儲、分析和提取海量數(shù)據(jù)的重要工具。針對企業(yè)客戶關(guān)系的特點,將數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)運用到企業(yè)客戶關(guān)系管理中,具體介紹了在預(yù)防和減少客戶流失中的應(yīng)用。
關(guān)鍵詞:數(shù)據(jù)倉庫;數(shù)據(jù)挖掘;客戶關(guān)系管理;客戶流失
中圖分類號:TP311文獻標識碼:A文章編號:1009-3044(2012)26-6200-03
Application of Customer Relationship Management Based on Data Warehouse and Data Mining
XIAO Yan-qun
(Yangzhou polytechnic college,Yangzhou 225009,China)
Abstract: Data Warehouse and Data Mining are important tools in storage, analysis and extracting data. According to Customer Relationships characteristics, Data Warehouse and Data Mining are added to its management,which mainly focuses on introduc? ing the application in the prevention and reduction of customer loss.
Key words: data warehouse; data mining; customer relationship management; customer loss
隨著市場經(jīng)濟的發(fā)展,產(chǎn)品種類日益豐富,企業(yè)之間的競爭越來越激烈,賣方市場已過渡到了買方市場,對現(xiàn)代企業(yè)而言,當下最主要提升的不僅僅是產(chǎn)品本身,更為重要的是客戶的爭奪。因此,企業(yè)要想立于不敗之地,必須能夠?qū)κ袌錾习l(fā)生的變化做出迅速的反應(yīng),而導致市場變化的根源就是客戶行為的變化。企業(yè)已經(jīng)逐漸認識到保有客戶的重要性,只有不斷提升服務(wù)意識,有針對性地滿足客戶的需求,企業(yè)才能長期發(fā)展。因此,企業(yè)當下的重要課題就是要加強客戶關(guān)系管理,提高核心競爭能力。
客戶數(shù)據(jù)的收集與存儲是實施客戶關(guān)系管理的根基。隨著辦公自動化的推廣,數(shù)據(jù)庫和網(wǎng)絡(luò)技術(shù)的應(yīng)用,各企業(yè)擁有的客戶信息越來越多,增長迅速。在這海量的、異構(gòu)的信息資源中,蘊含著具有巨大潛在價值的信息資源,比如客戶的基本資料、產(chǎn)品交易信息及客戶反饋信息等[1]。企業(yè)要想不陷入信息的沼澤中,必須擁有強有力的數(shù)據(jù)分析工具,用以實現(xiàn)客戶關(guān)系管理的目標。而數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)的發(fā)展可以很好地解決這個問題。
1數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)
1.1數(shù)據(jù)倉庫
數(shù)據(jù)倉庫是一個在企業(yè)管理和決策中面向主題的(Subject- Oriented)、集成的(Integrated)、反映歷史變化的(TimeVariant)、相對穩(wěn)定(Non-Volatile)的數(shù)據(jù)集合[2]。
數(shù)據(jù)倉庫要求數(shù)據(jù)量大,數(shù)據(jù)正確全面,所以數(shù)據(jù)在進入數(shù)據(jù)倉庫前必須經(jīng)過提取、轉(zhuǎn)換與集成,把數(shù)據(jù)按主題分類,形成多維數(shù)據(jù)模型。它以多維數(shù)據(jù)模型為基礎(chǔ),實現(xiàn)數(shù)據(jù)的分析處理,主要用于支持管理決策。數(shù)據(jù)進入數(shù)據(jù)倉庫后,一般會被長期保存,基本不會進行修改和刪除操作,主要實現(xiàn)數(shù)據(jù)的查詢。
數(shù)據(jù)倉庫與傳統(tǒng)關(guān)系型數(shù)據(jù)庫不同,主要區(qū)別在于數(shù)據(jù)倉庫打破了關(guān)系數(shù)據(jù)庫中數(shù)據(jù)的規(guī)范性,實現(xiàn)了數(shù)據(jù)的重組,增加了數(shù)據(jù)冗余度;其次傳統(tǒng)關(guān)系型數(shù)據(jù)庫為了實現(xiàn)數(shù)據(jù)處理的及時性,要求數(shù)據(jù)盡量少,而數(shù)據(jù)倉庫為了更有效的實現(xiàn)數(shù)據(jù)查詢,要求存儲的數(shù)據(jù)盡量多,實現(xiàn)海量存儲。
1.2數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘技術(shù),是近幾年國內(nèi)外迅速發(fā)展起來的一門交叉學科,涉及到數(shù)據(jù)庫、統(tǒng)計學、人工智能與機器學習等多個領(lǐng)域,并在金融、商業(yè)零售、電信以及生物醫(yī)學和基因分析等領(lǐng)域得到廣泛應(yīng)用。
1.2.1數(shù)據(jù)挖掘的概念
數(shù)據(jù)挖掘(Data Ming),是指從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程,提取的知識一般可表示為概念(ConcePts)、規(guī)則(Rules)、規(guī)律(Regularities)、模式(Patterns)等形式[3]。
數(shù)據(jù)挖掘是知識發(fā)現(xiàn)的過程,是將未加工的數(shù)據(jù)轉(zhuǎn)換為有用信息的整個過程。該過程包含一系列的步驟:確定業(yè)務(wù)對象、數(shù)據(jù)準備、數(shù)據(jù)挖掘、模式評估和知識表示[4]。
1.2.2數(shù)據(jù)挖掘的技術(shù)與方法
數(shù)據(jù)挖掘方法是以數(shù)據(jù)庫為對象,基于機器學習、科學計算、統(tǒng)計分析等技術(shù),形成了數(shù)據(jù)挖掘方法和技術(shù)。一般,數(shù)據(jù)挖掘常用的技術(shù)與方法可以分為以下幾個方面:
1)決策樹方法
決策樹方法是利用信息論的原理建立決策樹,主要用于分類和預(yù)測。決策樹是一種簡單的知識表示方法,它將事例逐步分類成代表不同的類別。由于分類規(guī)則比較直觀,易于理解,實用效果好,影響較大,因而得到廣泛應(yīng)用。決策樹最早的算法是Quinlan提出的ID3算法,最流行的是其改進版的C4.5算法。
2)聚類方法
聚類分析是直接分析樣本,按照各樣本數(shù)據(jù)間的距離遠近將樣本數(shù)據(jù)分成若干個不同的類。一般,同一類中的對象相似度很高,不同類中的對象相似度很差。聚類分析屬于無監(jiān)督的分類方法。
3)統(tǒng)計分析方法
統(tǒng)計分析方法是通過統(tǒng)計學中的技術(shù)方法實現(xiàn)數(shù)據(jù)庫的數(shù)據(jù)分析,發(fā)現(xiàn)數(shù)據(jù)間的關(guān)系和規(guī)律。常用的方法有:回歸分析、相關(guān)分析、主成分分析等。
4)關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則通過對給定數(shù)據(jù)集中的數(shù)據(jù)進行關(guān)聯(lián)分析,描述一個事物中某些屬性頻繁同時出現(xiàn)的條件,發(fā)現(xiàn)隱藏在其中的有趣的聯(lián)系或規(guī)律。一旦建立起數(shù)據(jù)項間的關(guān)聯(lián)規(guī)則,則其中某一項的屬性值就可以依據(jù)其他屬性值進行預(yù)測。
5)可視化技術(shù)
可視化數(shù)據(jù)分析技術(shù)在傳統(tǒng)圖表功能基礎(chǔ)上進行了拓展,為用戶提供交互式的數(shù)據(jù)瀏覽,幫助用戶更清楚地剖析數(shù)據(jù)。當所要識別的不規(guī)則事物是一系列圖形而不是數(shù)字表格時,人的識別速度是最快的。
2數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用
2.1客戶關(guān)系管理
客戶關(guān)系管理(CRM)關(guān)注的是企業(yè)與客戶之間實時、方便的信息交互,通過與客戶多渠道的接觸、交流和溝通,實現(xiàn)從“接觸管理”到“客戶關(guān)懷”的角色轉(zhuǎn)變,企業(yè)的經(jīng)營中心也從產(chǎn)品或市場轉(zhuǎn)變?yōu)榭蛻?。客戶關(guān)系管理最核心的任務(wù)是對企業(yè)運營過程中所得到的各種數(shù)據(jù)進行分析,進而為企業(yè)經(jīng)營決策提供支持和依據(jù)。
從功能上來看,CRM系統(tǒng)可分為三種類型[5]:
1)操作型CRM
操作型CRM也稱為流程型CRM,主要用于客戶信息的自動集成過程,實現(xiàn)企業(yè)各部門對客戶信息的協(xié)同合作。
2)分析型CRM
分析型CRM用于分析操作型CRM中產(chǎn)生的各種數(shù)據(jù),使用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)產(chǎn)生商務(wù)智能,為企業(yè)決策提供支持。3)合作型CRM
合作型CRM用于企業(yè)與客戶的合作服務(wù)系統(tǒng),包括電話、呼叫系統(tǒng)、電子郵件等,它能實現(xiàn)客戶信息的全面收集。
2.2數(shù)據(jù)倉庫的形成
數(shù)據(jù)倉庫是CRM的中央存儲系統(tǒng)。在這個信息爆炸的時代,各個企業(yè)經(jīng)過長期經(jīng)營,收集了大量的客戶數(shù)據(jù)。而這些海量、異構(gòu)的數(shù)據(jù)被分散在不同部門,沒有得到充分合理的利用。因此,首先要做的是對這些海量分散的數(shù)據(jù)進行清洗、集成和轉(zhuǎn)換,建立一個整合的、標準化、結(jié)構(gòu)化的數(shù)據(jù)模型,形成全面、一致和面向決策的數(shù)據(jù),即數(shù)據(jù)倉庫。對已形成的數(shù)據(jù)倉庫,按照不同的主題,產(chǎn)生多個對應(yīng)的數(shù)據(jù)處理模塊,如普通客戶數(shù)據(jù)模塊,Vip客戶數(shù)據(jù)模塊,團體客戶數(shù)據(jù)模塊等,這種多數(shù)據(jù)模塊的建設(shè)有利于分析不同客戶的行為特點。
2.3數(shù)據(jù)挖掘技術(shù)的應(yīng)用
使用數(shù)據(jù)挖掘技術(shù)對企業(yè)客戶信息進行分析,從而挖掘出對企業(yè)發(fā)展有價值的信息,如:新客戶開發(fā)、交叉銷售及預(yù)測、客戶信用分析、客戶細分、客戶類別分析等客戶關(guān)系管理功能,為企業(yè)決策者提供更有效的的決策支持,最大程度地發(fā)揮企業(yè)CRM的作用。
近年來,隨著市場競爭的加劇,企業(yè)要想獲得一個新客戶,所花費的開銷往往是爭取留住老客戶的幾倍。有統(tǒng)計數(shù)據(jù)表明:1)公司一般每年平均流失10%的老客戶;
2)企業(yè)留住5%的老客戶,利潤提升100%;
3)開發(fā)新客戶的成本是留住老客戶成本的5-8倍;
4)一個公司如果將其客戶流失率降低5%,其利潤就可能增加25-85%。
因此保持老客戶就顯得更有價值。那么,如何才能預(yù)防、減少客戶的流失呢?一個非常重要的工作就是要找出顧客流失的原因。我們可以通過數(shù)據(jù)挖掘技術(shù)實現(xiàn)這一目標。
現(xiàn)以電信公司判斷用戶離網(wǎng)的可能性來做分析,首先進行數(shù)據(jù)準備,抽取一定量的用戶信息,提取的信息主要包括:用戶號碼、用戶類型、用戶狀態(tài)、話費性質(zhì)(長話/市話)、欠費情況、投訴次數(shù)等,利用這些數(shù)據(jù),我們來建立判斷用戶離網(wǎng)可能性的模型。
在數(shù)據(jù)準備和適當?shù)念A(yù)處理之后,我們采用決策樹中的C4.5算法建立決策樹模型。這里,我們引入了信息論中的信息增益率的概念并以此作為屬性選擇的標準,其核心是在決策樹的各級節(jié)點上選擇屬性時用信息增益率作為屬性選擇標準。通過計算這些屬性的信息增益率,找出“投訴次數(shù)”屬性作為決策樹的根節(jié)點。擴展決策樹節(jié)點,進行分枝,其他中間節(jié)點也是選擇各節(jié)點檢測屬性增益最大的屬性,同級的預(yù)選屬性的增益相同時,規(guī)定選擇屬性值個數(shù)較少的屬性作為當前節(jié)點的分枝,最后,我們可以生成一棵決策樹。
生成的決策樹還需要進行進一步驗證,才能最終得到可用的分類模型。選擇一些具有共同特征的已離網(wǎng)用戶作為測試數(shù)據(jù),輸入屬性值進行離網(wǎng)判斷,檢驗?zāi)P偷恼_性,生成最終的決策樹模型。
使用生成的決策樹模型,對比用戶的信息是否貼近離網(wǎng)用戶的特征屬性值,能大致預(yù)測出該用戶的離網(wǎng)可能性,對離網(wǎng)可能性高的用戶,根據(jù)其特征屬性進行挽留工作,從而預(yù)防、減少客戶的流失。
3結(jié)束語
在當前的技術(shù)形式下,將數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)有效運用在CRM中,對企業(yè)收集的大量客戶數(shù)據(jù)信息進行分析,挖掘出對企業(yè)發(fā)展有價值的客戶信息,從而更有效地提升企業(yè)的競爭能力,樹立企業(yè)的品牌形象,幫助企業(yè)實現(xiàn)有效的市場營銷和客戶服務(wù),達到成功挽留客戶的目的。相信未來會有更多的行業(yè)加入使用客戶關(guān)系管理的行列中,通過數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)挖掘出對自身發(fā)展有用的信息,也必使CRM的目標得到更好的實現(xiàn)。
參考文獻:
[1]白雪.數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用研究[J] .大眾科技,2012 (2).
[2] Han Jianwei,Micheline Kamber.Data Mining Concepts and Techniques[M].Morgan Kanfmann Publishing,2000.
[3]陳安.數(shù)據(jù)挖掘技術(shù)及應(yīng)用[M].北京:科學出版社,2006.
[4]董寧.數(shù)據(jù)挖掘技術(shù)在CRM中的應(yīng)用[J].計算機工程與設(shè)計,2007(6).
[5] Alex Berson,Stephen Smith,Kurt Thearling.Building DataMining Applications for CRM [M].北京:人民郵電出版社,2001.