鄶淑娥
(東北財(cái)經(jīng)大學(xué)職業(yè)技術(shù)學(xué)院,遼寧大連 116023)
基于數(shù)據(jù)挖掘技術(shù)的超市顧客忠誠(chéng)度評(píng)價(jià)模型的構(gòu)建
鄶淑娥
(東北財(cái)經(jīng)大學(xué)職業(yè)技術(shù)學(xué)院,遼寧大連 116023)
隨著計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)等的迅速發(fā)展,顧客忠誠(chéng)度系統(tǒng)對(duì)數(shù)據(jù)存儲(chǔ)、查找、統(tǒng)計(jì)、報(bào)表等能力有了很大的提高,隨著數(shù)據(jù)不斷累積,這些數(shù)據(jù)背后隱藏著怎樣的信息鑰能否通過(guò)對(duì)數(shù)據(jù)的多角度分析為企業(yè)提供更加豐富和有利的決策支持呢鑰文章通過(guò)數(shù)據(jù)挖掘技術(shù),構(gòu)建了超市顧客忠誠(chéng)度評(píng)價(jià)模型,以期對(duì)企業(yè)的管理者提供借鑒。
數(shù)據(jù)挖掘;顧客忠誠(chéng)度;評(píng)價(jià)模型;構(gòu)建
顧客忠誠(chéng)度是指顧客忠誠(chéng)的程度,是一個(gè)量化概念。它是指由于質(zhì)量、價(jià)格、服務(wù)等諸多因素的影響,使顧客對(duì)某一企業(yè)的產(chǎn)品或服務(wù)產(chǎn)生感情,形成偏愛(ài)并長(zhǎng)期重復(fù)購(gòu)買(mǎi)該企業(yè)產(chǎn)品或服務(wù)的程度。
顧客忠誠(chéng)度的數(shù)據(jù)系統(tǒng)中蘊(yùn)藏著大量的信息資源,企業(yè)雖然可以針對(duì)明確的信息,利用查詢等工具直接獲取,但隱藏在大量數(shù)據(jù)中的關(guān)系、趨勢(shì)等信息卻無(wú)法從數(shù)據(jù)表層獲得。需要有新的、更有效的技術(shù)對(duì)大量的數(shù)據(jù)進(jìn)行挖掘以發(fā)揮其潛能,從中迅速萃取有用的信息以幫助企業(yè)提高顧客忠誠(chéng)度。因此,有必要在研究顧客忠誠(chéng)度的評(píng)價(jià)體系中引入數(shù)據(jù)挖掘技術(shù),以提高企業(yè)的顧客忠誠(chéng)度和競(jìng)爭(zhēng)能力。數(shù)據(jù)挖掘是解決數(shù)據(jù)豐富而知識(shí)貧乏的有效途徑,其實(shí)質(zhì)是從數(shù)據(jù)庫(kù)中提取隱含的、未知的和潛在有用信息的過(guò)程,被公認(rèn)為是數(shù)據(jù)庫(kù)研究中的一個(gè)極具應(yīng)用前景的新領(lǐng)域。數(shù)據(jù)挖掘技術(shù)包括聚類(lèi)分析、分類(lèi)與預(yù)測(cè)以及關(guān)聯(lián)分析等功能,它們可以從評(píng)價(jià)數(shù)據(jù)中找出大量真正有價(jià)值的信息和知識(shí),能夠更好地對(duì)顧客忠誠(chéng)做出定量的分析和預(yù)測(cè),進(jìn)而有效的提高顧客忠誠(chéng)度,更好的為企業(yè)和社會(huì)服務(wù)。
數(shù)據(jù)挖掘涉及的學(xué)科領(lǐng)域和方法很多,有人工智能、數(shù)據(jù)統(tǒng)計(jì)、可視化、并行計(jì)算等。根據(jù)挖掘任務(wù)可將數(shù)據(jù)挖掘分為分類(lèi)模型發(fā)現(xiàn)、聚類(lèi)、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、序列分析、偏差分析、數(shù)據(jù)可視化等類(lèi)型。
(1)分類(lèi):其旨在生成一個(gè)分類(lèi)函數(shù)或分類(lèi)模型,該模型能把數(shù)據(jù)庫(kù)中的數(shù)據(jù)項(xiàng)映射到給定類(lèi)別中的某一個(gè)。既可以用此模型分析已有的數(shù)據(jù),也可以用它來(lái)預(yù)測(cè)未來(lái)的數(shù)據(jù)。
(2)聚集:聚集是對(duì)記錄分組,把相似的記錄在一個(gè)聚集里。聚集和分類(lèi)的區(qū)別是聚集不依賴于預(yù)先定義好的類(lèi),不需要訓(xùn)練集。
(3)數(shù)據(jù)可視化:數(shù)據(jù)可視化嚴(yán)格地講不是一個(gè)單獨(dú)的數(shù)據(jù)挖掘任務(wù),它被用來(lái)支持其他挖掘任務(wù)。可視化是采用圖形、圖表等易于理解的方式表達(dá)數(shù)據(jù)挖掘結(jié)果。
(4)關(guān)聯(lián)規(guī)則:關(guān)聯(lián)規(guī)則是尋找數(shù)據(jù)庫(kù)中值得相關(guān)性,主要是尋找在同一個(gè)事件中出現(xiàn)的不同項(xiàng)的相關(guān)性,比如在一次購(gòu)買(mǎi)活動(dòng)中所買(mǎi)不同商品的相關(guān)性。
(5)序列分析:序列模式分析同樣也是試圖找出數(shù)據(jù)之間的聯(lián)系。但它的側(cè)重點(diǎn)在于分析數(shù)據(jù)之間前后關(guān)系,因此對(duì)數(shù)據(jù)往往要求引入時(shí)間屬性。序列模式分析非常適于尋找事物的發(fā)生趨勢(shì)或重復(fù)性模式。
(6)偏差分析:偏差分析是用來(lái)發(fā)現(xiàn)與正常情況不同的異常和變化,并進(jìn)一步分析這種變化是否有意的詐騙行為,還是正常的變化。如果是異常行為,則提示預(yù)防措施:如果是正常的變化,那么就需要更新數(shù)據(jù)庫(kù)記錄。
2.1 超市顧客數(shù)據(jù)準(zhǔn)備和數(shù)據(jù)選擇處理
2.1.1 數(shù)據(jù)準(zhǔn)備
數(shù)據(jù)挖掘的對(duì)象是數(shù)據(jù),只有對(duì)數(shù)據(jù)充分了解之后才能進(jìn)行數(shù)據(jù)挖掘工作。結(jié)合超市企業(yè)的商業(yè)目標(biāo),理解、熟悉顧客信息,能將商業(yè)目標(biāo)轉(zhuǎn)化為對(duì)數(shù)據(jù)的理解,從而準(zhǔn)確地進(jìn)行數(shù)據(jù)挖掘。在超市數(shù)據(jù)庫(kù)中可獲得如下數(shù)據(jù):持會(huì)員卡的會(huì)員此次消費(fèi)商品的品牌、型號(hào)、價(jià)格、數(shù)量、消費(fèi)時(shí)間等。建立的度量指標(biāo)為:
(1)超市顧客忠誠(chéng)度的衡量。超市銷(xiāo)售的商品大部分為生活日用品。會(huì)員卡購(gòu)物多以家庭為單位,家庭購(gòu)物存儲(chǔ)期一般不超過(guò)6周,故以周為平均計(jì)算單位。建立超市顧客忠誠(chéng)度系數(shù)的衡量指標(biāo)計(jì)算方式為:每周購(gòu)物次數(shù)標(biāo)準(zhǔn)差比上平均每周購(gòu)物次數(shù)再加上每周購(gòu)物金額標(biāo)準(zhǔn)差比上平均每周購(gòu)物金額,式中,兩項(xiàng)之比都表示重要性權(quán)重,用層次分析法確定。認(rèn)為在超市購(gòu)物中,忠誠(chéng)顧客是那些在一段時(shí)間內(nèi)購(gòu)物次數(shù)和購(gòu)物金額相對(duì)穩(wěn)定的顧客,即具備較穩(wěn)定的購(gòu)物習(xí)慣的顧客。結(jié)果的數(shù)值越大,表明該顧客購(gòu)物行為波動(dòng)越大,越不忠誠(chéng);結(jié)果的數(shù)值越小,則相反。
(2)超市客戶盈利性的衡量。基于數(shù)據(jù)的可獲得性和可實(shí)現(xiàn)性的考慮,認(rèn)為購(gòu)物金額高的客戶為企業(yè)帶來(lái)的利潤(rùn)也高,即近似用購(gòu)物金額的高低來(lái)衡量客戶盈利性的高低。
2.1.2 數(shù)據(jù)選擇處理
數(shù)據(jù)選擇:通過(guò)確定數(shù)據(jù)挖掘目標(biāo)和進(jìn)行數(shù)據(jù)理解,從XXX市某超市數(shù)據(jù)庫(kù)中抽取顧客數(shù)據(jù),其中一部分?jǐn)?shù)據(jù)用于建立模型、獲取規(guī)律,最后剩余數(shù)據(jù)用于模型檢驗(yàn)。
數(shù)據(jù)預(yù)處理:數(shù)據(jù)預(yù)處理技術(shù)可改進(jìn)數(shù)據(jù)的質(zhì)量,從而有助于提高其挖掘過(guò)程的精度和性能。主要為:
(1)缺失的值處理。本研究存在兩種類(lèi)型的缺失的值:一是正常缺失,表現(xiàn)為當(dāng)周的購(gòu)物次數(shù)和購(gòu)物金額同時(shí)表現(xiàn)為缺失。這種缺失是由于顧客在當(dāng)周并沒(méi)有發(fā)生購(gòu)買(mǎi)引起的,缺失用數(shù)字“0”填充。二是非正常缺失,表現(xiàn)為當(dāng)周購(gòu)物次數(shù)和購(gòu)物金額任意一者缺失。這種缺失是由于人為的疏忽和錯(cuò)誤引起的,可采用各屬性均值填充。SPSS能很方便地對(duì)缺失的值進(jìn)行處理,可替換滿足特定條件的屬性值,也可用這個(gè)節(jié)點(diǎn)來(lái)替換、填補(bǔ)空缺值。
(2)極值處理。少數(shù)顧客的個(gè)別行為可能引起聚類(lèi)中心的偏移,從而影響聚類(lèi)分群的準(zhǔn)確性。在研究各屬性值的圖形分布后,去掉部分極值。利用SPSS可產(chǎn)生各屬性值的分布圖,能直觀地看出少數(shù)極值分布的區(qū)域。
(3)數(shù)據(jù)規(guī)范化。對(duì)基于距離的聚類(lèi)算法,規(guī)范化可幫助防止具有較大或較小初始值域的屬性權(quán)重過(guò)大引起聚類(lèi)中心偏移而影響聚類(lèi)的準(zhǔn)確度。由于顧客的月消費(fèi)額對(duì)顧客價(jià)值存在正相關(guān)影響,即M值越大,顧客價(jià)值越大。
2.2 超市顧客群模型的建立和評(píng)估
2.2.1 聚類(lèi)分析模型
根據(jù)商業(yè)目標(biāo),建立盈利性、忠誠(chéng)度系數(shù)模型,運(yùn)用聚類(lèi)算法對(duì)超市顧客進(jìn)行聚類(lèi)分析。本模型中的顧客分類(lèi)是將每個(gè)顧客的類(lèi)別聚類(lèi)中心盈利值和忠誠(chéng)度值分別與當(dāng)月的總盈利值和總忠誠(chéng)度的平均值進(jìn)行比較來(lái)決定的。而單個(gè)指標(biāo)的比較只能有兩種情況,即大于、等于或小于平均值,因此可能有4種類(lèi)別。選定顧客細(xì)分?jǐn)?shù)目的值為4,將SPSS中聚類(lèi)節(jié)點(diǎn)中的值設(shè)為4。在SPSS中建立聚類(lèi)模型的流程,分別對(duì)數(shù)據(jù)庫(kù)中的客戶數(shù)據(jù)進(jìn)行聚類(lèi)分析。在聚類(lèi)過(guò)程中,聚類(lèi)算法結(jié)束后自動(dòng)產(chǎn)生類(lèi)別標(biāo)號(hào)如“cluster-n”,其中n代表第n類(lèi),且類(lèi)別標(biāo)號(hào)是按照各類(lèi)數(shù)據(jù)出現(xiàn)的先后順序依次標(biāo)記的。因此,為了方便分析比較各個(gè)月的顧客細(xì)分群的變化,在聚類(lèi)前將類(lèi)別標(biāo)號(hào)進(jìn)行統(tǒng)一:A表示盈利值的簇均值小于當(dāng)月盈利值的總均值,忠誠(chéng)度的簇均值大于總均值的簇;B表示盈利值和忠誠(chéng)度的簇均值大于當(dāng)月的總均值的簇;C表示盈利值的簇均值大于當(dāng)月盈利值的總均值,忠誠(chéng)度的簇均值小于總均值的簇;D表示盈利值和忠誠(chéng)度的簇均值小于當(dāng)月的總均值的簇。結(jié)果分析:根據(jù)以上聚類(lèi)模型,可得到A,B,C,D四類(lèi)顧客:
(1)A類(lèi)顧客具有很高的消費(fèi)能力,但是忠誠(chéng)度很低,這類(lèi)顧客是企業(yè)應(yīng)該著重爭(zhēng)取的顧客,是推銷(xiāo)的重點(diǎn)顧客。對(duì)這類(lèi)顧客進(jìn)行詳細(xì)分析,并針對(duì)這類(lèi)顧客的特點(diǎn)和需求制定有針對(duì)性的服務(wù)和推銷(xiāo)策略,將他們從競(jìng)爭(zhēng)對(duì)手中爭(zhēng)取過(guò)來(lái)變?yōu)樽约旱闹艺\(chéng)顧客。
(2)B類(lèi)顧客是產(chǎn)生利潤(rùn)最高和忠誠(chéng)度最高的顧客。這部分顧客是企業(yè)的“黃金顧客”,是企業(yè)最有價(jià)值的顧客,也是企業(yè)應(yīng)重點(diǎn)保持的顧客。
(3)C類(lèi)顧客的忠誠(chéng)度很高,但購(gòu)物水平相對(duì)較低。這樣的顧客可能更傾向于物美價(jià)廉的產(chǎn)品,他們可能更注重性價(jià)比而不是品牌。對(duì)于這類(lèi)顧客應(yīng)向其推銷(xiāo)一些價(jià)格較低、性價(jià)比適中的產(chǎn)品。
(4)D類(lèi)顧客的忠誠(chéng)度較低,消費(fèi)額也相對(duì)較低,他們是競(jìng)爭(zhēng)對(duì)手的忠誠(chéng)客戶,對(duì)他們推銷(xiāo)存在很大的風(fēng)險(xiǎn),應(yīng)適當(dāng)放棄。2.2.2序列分析模型
SPSS中的序列節(jié)點(diǎn)用來(lái)建立序列分析模型,序列節(jié)點(diǎn)是基于CARMA關(guān)聯(lián)的規(guī)則演算法,此外由序列節(jié)點(diǎn)創(chuàng)建生成的模型節(jié)點(diǎn)可插入到流程中生成預(yù)測(cè)。從數(shù)據(jù)庫(kù)中抽取數(shù)據(jù),在SPSS中建立序列模型的流程。其中,序列節(jié)點(diǎn)參數(shù)過(guò)大或者過(guò)小,都會(huì)導(dǎo)致信息的丟失或產(chǎn)生無(wú)用信息,從而影響模型的準(zhǔn)確性。因此,參數(shù)的設(shè)定應(yīng)該反復(fù)調(diào)試、謹(jǐn)慎進(jìn)行。最小規(guī)則支持度可設(shè)定限定標(biāo)準(zhǔn),規(guī)則支持度是指數(shù)據(jù)的集中包括完整序列的ID比例,規(guī)則支持度數(shù)值越大,序列越普遍。本研究中的序列分析對(duì)象是超市顧客群的忠誠(chéng)度。通過(guò)統(tǒng)計(jì)客戶聚類(lèi)數(shù)據(jù)發(fā)現(xiàn),數(shù)據(jù)中A、B、C和D平均每個(gè)月的顧客人數(shù)占總的顧客人數(shù)的百分比分別為17%、24%、20%和39%。為了不丟失有用的信息,將設(shè)為最小規(guī)則支持度6.0,最小置信度是指在所有做預(yù)測(cè)的ID中預(yù)測(cè)正確的ID百分?jǐn)?shù)。置信度的計(jì)算方法是用序列中包含完整序列的ID數(shù)目除以僅含有前提條件的ID數(shù)目。由于此參數(shù)表示預(yù)測(cè)的準(zhǔn)確率,故本研究將其設(shè)為50.0。最大序列規(guī)??芍付ㄐ蛄兄许?xiàng)的最大個(gè)數(shù)。如果有用序列相對(duì)較短,可降低該項(xiàng)值。本研究的最大序列為4,因此將次參數(shù)設(shè)為4。加入流程的預(yù)測(cè)數(shù)指定添加到最終生成模型節(jié)點(diǎn)流中的預(yù)測(cè)數(shù)。由于最終生成的預(yù)測(cè)結(jié)果是按照置信度由高到低排列的,即第一個(gè)預(yù)測(cè)的置信度是最高的,對(duì)研究也是最有意義的,因此本研究將此參數(shù)設(shè)為1。
運(yùn)行序列分析流程,生成的序列模型結(jié)果的每一行都代表一個(gè)滿足模型參數(shù)的規(guī)律,該規(guī)律是按照置信度的降序排列的。前項(xiàng)規(guī)律的“if”部分,結(jié)果規(guī)律的“then”部分,例子包含整個(gè)序列的ID數(shù),支持度的記錄只包含前項(xiàng)ID的百分比,置信度的顯示所有作為預(yù)測(cè)的ID中正確預(yù)測(cè)的ID百分?jǐn)?shù);規(guī)則支持度與支持度不同,規(guī)則支持記錄包含整個(gè)序列的ID百分?jǐn)?shù),即同時(shí)包含前項(xiàng)和結(jié)果的ID百分?jǐn)?shù)。如果顧客有2個(gè)月屬于B,接下來(lái)有89.7%的可能性仍然屬于B。這說(shuō)明忠誠(chéng)的高價(jià)值顧客保持兩個(gè)階段將很可能成為企業(yè)的長(zhǎng)期忠誠(chéng)高價(jià)值客戶,這種客戶的流失率較小,是企業(yè)的重要利潤(rùn)源。C是相對(duì)較穩(wěn)定的顧客群。C類(lèi)顧客忠誠(chéng)程度高,但是消費(fèi)水平較低,如果超市考慮為這類(lèi)顧客提供價(jià)格較低、性價(jià)比較好的商品,這類(lèi)顧客是很容易保持的。在兩個(gè)階段都屬于D的顧客,有82.2%的可能仍屬于D。顧客在某一階段表現(xiàn)為D類(lèi)顧客,接下來(lái)的階段有53.5%的可能仍然表現(xiàn)為D。這就說(shuō)明,當(dāng)顧客表現(xiàn)出低忠誠(chéng)低消費(fèi)的特征之后將很難被挽回。A類(lèi)顧客如果在2個(gè)階段內(nèi),超市對(duì)其提供的顧客挽留策略沒(méi)有使其成為忠誠(chéng)顧客,則這類(lèi)顧客在以后階段將很難再挽回,可能出現(xiàn)永久性流失。C類(lèi)顧客通過(guò)實(shí)施相應(yīng)的策略,如為他們提供符合其消費(fèi)特點(diǎn)的商品,使其成為超市企業(yè)的高忠誠(chéng)、高價(jià)值顧客后,很可能在下階段成為企業(yè)永久性的高忠誠(chéng)、高價(jià)值顧客。仔細(xì)分析A類(lèi)顧客的消費(fèi)傾向,將其轉(zhuǎn)變?yōu)锽類(lèi)顧客,很可能成為企業(yè)永久性的高忠誠(chéng)、高盈利顧客。
數(shù)據(jù)挖掘能幫助公司管理者從海量數(shù)據(jù)中識(shí)別顧客的購(gòu)買(mǎi)行為特征,發(fā)現(xiàn)顧客購(gòu)買(mǎi)模式和趨勢(shì),提高顧客的購(gòu)買(mǎi)效率和服務(wù)質(zhì)量,提升顧客的忠誠(chéng)度,從而達(dá)到提升顧客層次、保持有價(jià)值顧客的目的。
[1]張永賓.基于數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘的客戶忠誠(chéng)度的分析[J].商場(chǎng)現(xiàn)代化,2011(21).
[2]錢(qián)鋒,徐麟文.基于數(shù)據(jù)挖掘的客戶忠誠(chéng)度提升[J].經(jīng)濟(jì)論壇,2006(21).
10.3969/j.issn.1673-0194.2015.19.036
F274
A
1673-0194(2015)19-0063-03
2015-08-03