• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      改進的k—means聚類算法在客戶細分中的應(yīng)用研究

      2014-02-17 17:49:10杜巍趙春榮等
      關(guān)鍵詞:means算法客戶群聚類分析

      杜巍 趙春榮等

      摘要:聚類分析是數(shù)據(jù)挖掘的一種重要方法,將它應(yīng)用在客戶細分中,可以識別出不同的客戶群,從而針對不同的客戶群制定相應(yīng)的營銷政策,使企業(yè)效益最大化。針對聚類分析中k-means算法的不足,運用改進的聚類算法對旅游業(yè)客戶進行細分,從而使企業(yè)能夠更合理地細分、規(guī)劃客戶群組,針對不同需求的客戶群體進行區(qū)別對待,得到了較好的效果,驗證了改進算法的可行性和高效性。

      關(guān)鍵詞:聚類分析;客戶細分;數(shù)據(jù)挖掘;改進的k-means算法;客戶群

      中圖分類號:F713.50 文獻標識碼:A 文章編號:1007-2101(2014)01-0118-04

      客戶關(guān)系管理中的一個重要環(huán)節(jié)就是客戶細分,它也是客戶關(guān)系管理中的核心概念之一??蛻艏毞质菍⒁粋€大的客戶群或者消費者群體劃分成多個細分群體,這些群體中同屬于一個細分群體的客戶或者消費者的彼此特性相似,而隸屬于不同細分群體的客戶或者消費者之間是不同的。簡而言之,客戶細分是根據(jù)客戶的屬性、行為、需求、偏好以及價值等因素劃分的客戶集合。

      在激烈的市場競爭中,客戶細分是眾多企業(yè)識別客戶類別、把握客戶特征的重要方法。通過客戶細分,企業(yè)可以更好地識別客戶群體,從而達到區(qū)別對待有不同需求的客戶,采取差異化的營銷策略,達到最優(yōu)化配置客戶資源的目的。因此,當今企業(yè)如果想在激烈的市場競爭中脫穎而出就應(yīng)該了解如何對客戶群體進行客戶細分,從而挖掘出具有消費潛力的客戶,并針對這些客戶進行合理的資源分配,對不同價值的客戶制定出不同的營銷策略。

      一、聚類分析算法

      目前,有很多種聚類算法可以選擇,而究竟選擇哪種算法主要取決于數(shù)據(jù)的類型、聚類的目的及其應(yīng)用?,F(xiàn)今,主要的聚類算法可以劃分為以下幾類:基于劃分的方法、基于網(wǎng)格的方法、基于層次的方法和基于密度的方法等?;趧澐值木垲惙椒榻o定數(shù)據(jù)集合指定合理的劃分,每個對象被指定給唯一的簇。簇的個數(shù)k是需要用戶指定的輸入?yún)?shù)。一個好的聚類算法的劃分準則是:不同類中的對象之間盡可能的遠離或者不同,而同一類中的對象之間盡可能的相近或者相關(guān)。

      k-means算法是其中最常用的劃分方法,它以k為參數(shù),再把n個對象分解成為k個簇,以使簇內(nèi)具有較高的相似度,簇間具有較低的相似度。而相似度的計算是根據(jù)一個簇中對象的平均值來進行的。它的算法步驟為:首先在所有的對象中隨機的選取k個對象用作初始的聚類中心;然后根據(jù)剩余對象與各個中心點之間的距離,將它們分配到距離最近的簇中;再重新計算一遍新得到的每個簇的均值并將它作為新的聚類中心。重復(fù)上述步驟直到準則函數(shù)收斂為止。

      k-means算法的主要優(yōu)點是算法簡潔、快速。它是解決聚類問題的經(jīng)典算法之一。它在結(jié)果簇是密集的,且簇與簇之間區(qū)別明顯時效果最好。同時對處理較大的數(shù)據(jù)集時,該算法也是相對高效和可伸縮的。它的時間復(fù)雜度是O(nkt),其中n是所有對象的數(shù)目,k是簇的數(shù)目,t是迭代的次數(shù)。但k-means算法同時也具有一定的局限性,主要體現(xiàn)在以下幾個方面:

      1. 從樣本點的集合中隨機選取k個中心,這種選擇具有盲目性和隨意性,它在很大程度上決定了算法的有效性。這個算法的聚類結(jié)果對初值的依賴性很強,初始值一旦選擇的不好,可能無法得到有效的聚類結(jié)果。所以,這也成為k-means算法的一個核心問題,因此對初始中心的選擇進行改進既有意義也有必要。

      2. 聚類中心的調(diào)整,這是涉及聚類準確性的關(guān)鍵問題。k-means算法的處理方法是對每一個已有的分類,聚類中心為該類中所含數(shù)據(jù)點的幾何平均值。而平方誤差準則函數(shù)在各個簇之間區(qū)別明顯且數(shù)據(jù)分布稠密時運用起來比較有效;但是如果各簇的形狀和大小差別很大,為使函數(shù)收斂則可能會將大的聚類簇分割,從而導(dǎo)致聚類結(jié)果的不準確。

      二、改進的k-means算法

      三、實例分析

      本次試驗是針對旅游業(yè)客戶對服務(wù)重要性的評價打分進行客戶細分,從而將客戶細分成幾類,針對不同類客戶采取不同的決策,最終使企業(yè)的效益最大化。

      1. 確定數(shù)據(jù)挖掘的目標。數(shù)據(jù)挖掘不能盲目地進行,必須非常明確的定義出業(yè)務(wù)的問題。因此認清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘很重要的一步。本次試驗是對旅游業(yè)的客戶進行分類。

      2. 收集和預(yù)處理數(shù)據(jù)。在數(shù)據(jù)挖掘中首要步驟就是收集數(shù)據(jù)。數(shù)據(jù)可以從多種渠道中獲得,可以從數(shù)據(jù)倉庫中,也可以從現(xiàn)有事務(wù)處理系統(tǒng)中得到。獲得數(shù)據(jù)后,從中選擇出與業(yè)務(wù)對象相關(guān)的,并且適用于數(shù)據(jù)挖掘應(yīng)用的數(shù)據(jù)。而在收集階段得到的數(shù)據(jù)可能存在一系列的問題,表現(xiàn)在數(shù)據(jù)有缺失或存在自身的不一致性等。因此我們要先做數(shù)據(jù)的預(yù)處理,一般包括消除重復(fù)記錄、推導(dǎo)計算缺值數(shù)據(jù)、完成數(shù)據(jù)類型的轉(zhuǎn)換、消除噪聲等。

      本次試驗的數(shù)據(jù)來源于數(shù)據(jù)倉庫中抽取的旅游業(yè)的客戶服務(wù)數(shù)據(jù),既有客戶旅行完的問卷調(diào)查,也有網(wǎng)上評分。同時表明了客戶對于服務(wù)重要性的打分。表1中的數(shù)據(jù)是客戶認為服務(wù)重要性的5個打分,分別為1~5從不重要到重要。

      3. 數(shù)據(jù)分析。數(shù)據(jù)分析的主要目的是:“消減數(shù)據(jù)維數(shù)或降維,即從初始特征中找出真正有用的特征,以減少數(shù)據(jù)挖掘時要考慮的特征或變量個數(shù)?!贬槍β糜螛I(yè)客戶的評價,對于性別等不起決定作用的屬性予以刪除,主要考慮客戶對于時間安排、交通安排、食宿安排、瀏覽地點及導(dǎo)游服務(wù)的評價。

      6. 分析模型結(jié)果。客戶ID為1、2、7和客戶ID為3、4的客戶都有相類似的服務(wù)要求,而客戶ID為5、6的客戶我們把他歸類為第三類客戶。其中,當客戶的數(shù)量達到一定程度時,我們可以根據(jù)服務(wù)細分原則,把要求類似的客戶聚類分組,這樣就可以做到針對不同需求的客戶做到不同的服務(wù),這樣既有利于節(jié)約成本,又能給客戶提供最為適合的服務(wù)。并能使該公司做到自己的服務(wù)內(nèi)容與眾不同,從而逐步實現(xiàn)“一對一營銷”,提高客戶的滿意度,也在一定程度上保證了客戶的忠誠度,最終使公司效益和利益最大化。

      與k-means算法得到的結(jié)果比較:如圖2所示,k-means算法需要迭代四次后算法收斂,生成最終聚類;改進后的k-means算法只需迭代2次即可得到結(jié)果,從而在效率上大大提高,簡化了復(fù)雜度。

      由此得出改進的k-means算法具有可行性和高效性,能夠?qū)⒖蛻艏毞郑瑸槠髽I(yè)做出正確決策提供依據(jù)。

      四、總結(jié)

      聚類分析在數(shù)據(jù)挖掘中的有著較為廣泛的實際應(yīng)用,本文研究和實現(xiàn)了用改進的k-means算法對旅游行業(yè)的客戶進行細分建模,并把具有相似特征的客戶歸為一類,不同特征的客戶分為不同的類。并根據(jù)建立的模型,可以使企業(yè)能夠更合理地細分、規(guī)劃客戶群組,針對不同需求的客戶群體進行區(qū)別對待,從而提供有針對性的服務(wù)。最終幫助企業(yè)把有效的精力、資源和時間安排在最有價值和潛力的客戶身上,以使企業(yè)能在日益激烈的市場競爭中立于不敗之地,從而提高公司的效益和競爭力。同時本模型在支持企業(yè)領(lǐng)導(dǎo)的決策等方面有著極為重要的理論參考價值和實際應(yīng)用價值。

      參考文獻:

      [1]紀希禹.數(shù)據(jù)挖掘技術(shù)應(yīng)用實例[M].北京:機械工業(yè)出版社,2009.

      [2]Jiawei Han,Micheline Kamber.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機械工業(yè)出版社,2006.

      [3]梁小強.數(shù)據(jù)挖掘聚類算法在CRM中的研究與應(yīng)用[D].烏魯木齊:新疆農(nóng)業(yè)大學(xué),2009.

      [4]朱銀歡.數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用[D].西安電子科技大學(xué),2006.

      [5]張效娟.k-means算法的改進和在保險業(yè)CRM中的應(yīng)用[J].大連交通大學(xué)學(xué)報,2008,(1):76-79.

      [6]李志剛.客戶關(guān)系管理理論與應(yīng)用[M].北京:機械工業(yè)出版社,2007.

      [7] Anonymous.Both sides of the CRM divide[J]. Marketing. Toronto:Apr18,2005.Vol.110,Lss.14;p.S14(1 page).

      [8]Netter.Database firm unveils Web CRM service[J].Marketing Week.London:Apr 14,2005.p.17.

      責任編輯、校對:秦學(xué)詩

      與k-means算法得到的結(jié)果比較:如圖2所示,k-means算法需要迭代四次后算法收斂,生成最終聚類;改進后的k-means算法只需迭代2次即可得到結(jié)果,從而在效率上大大提高,簡化了復(fù)雜度。

      由此得出改進的k-means算法具有可行性和高效性,能夠?qū)⒖蛻艏毞?,為企業(yè)做出正確決策提供依據(jù)。

      四、總結(jié)

      聚類分析在數(shù)據(jù)挖掘中的有著較為廣泛的實際應(yīng)用,本文研究和實現(xiàn)了用改進的k-means算法對旅游行業(yè)的客戶進行細分建模,并把具有相似特征的客戶歸為一類,不同特征的客戶分為不同的類。并根據(jù)建立的模型,可以使企業(yè)能夠更合理地細分、規(guī)劃客戶群組,針對不同需求的客戶群體進行區(qū)別對待,從而提供有針對性的服務(wù)。最終幫助企業(yè)把有效的精力、資源和時間安排在最有價值和潛力的客戶身上,以使企業(yè)能在日益激烈的市場競爭中立于不敗之地,從而提高公司的效益和競爭力。同時本模型在支持企業(yè)領(lǐng)導(dǎo)的決策等方面有著極為重要的理論參考價值和實際應(yīng)用價值。

      參考文獻:

      [1]紀希禹.數(shù)據(jù)挖掘技術(shù)應(yīng)用實例[M].北京:機械工業(yè)出版社,2009.

      [2]Jiawei Han,Micheline Kamber.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機械工業(yè)出版社,2006.

      [3]梁小強.數(shù)據(jù)挖掘聚類算法在CRM中的研究與應(yīng)用[D].烏魯木齊:新疆農(nóng)業(yè)大學(xué),2009.

      [4]朱銀歡.數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用[D].西安電子科技大學(xué),2006.

      [5]張效娟.k-means算法的改進和在保險業(yè)CRM中的應(yīng)用[J].大連交通大學(xué)學(xué)報,2008,(1):76-79.

      [6]李志剛.客戶關(guān)系管理理論與應(yīng)用[M].北京:機械工業(yè)出版社,2007.

      [7] Anonymous.Both sides of the CRM divide[J]. Marketing. Toronto:Apr18,2005.Vol.110,Lss.14;p.S14(1 page).

      [8]Netter.Database firm unveils Web CRM service[J].Marketing Week.London:Apr 14,2005.p.17.

      責任編輯、校對:秦學(xué)詩

      與k-means算法得到的結(jié)果比較:如圖2所示,k-means算法需要迭代四次后算法收斂,生成最終聚類;改進后的k-means算法只需迭代2次即可得到結(jié)果,從而在效率上大大提高,簡化了復(fù)雜度。

      由此得出改進的k-means算法具有可行性和高效性,能夠?qū)⒖蛻艏毞?,為企業(yè)做出正確決策提供依據(jù)。

      四、總結(jié)

      聚類分析在數(shù)據(jù)挖掘中的有著較為廣泛的實際應(yīng)用,本文研究和實現(xiàn)了用改進的k-means算法對旅游行業(yè)的客戶進行細分建模,并把具有相似特征的客戶歸為一類,不同特征的客戶分為不同的類。并根據(jù)建立的模型,可以使企業(yè)能夠更合理地細分、規(guī)劃客戶群組,針對不同需求的客戶群體進行區(qū)別對待,從而提供有針對性的服務(wù)。最終幫助企業(yè)把有效的精力、資源和時間安排在最有價值和潛力的客戶身上,以使企業(yè)能在日益激烈的市場競爭中立于不敗之地,從而提高公司的效益和競爭力。同時本模型在支持企業(yè)領(lǐng)導(dǎo)的決策等方面有著極為重要的理論參考價值和實際應(yīng)用價值。

      參考文獻:

      [1]紀希禹.數(shù)據(jù)挖掘技術(shù)應(yīng)用實例[M].北京:機械工業(yè)出版社,2009.

      [2]Jiawei Han,Micheline Kamber.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機械工業(yè)出版社,2006.

      [3]梁小強.數(shù)據(jù)挖掘聚類算法在CRM中的研究與應(yīng)用[D].烏魯木齊:新疆農(nóng)業(yè)大學(xué),2009.

      [4]朱銀歡.數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用[D].西安電子科技大學(xué),2006.

      [5]張效娟.k-means算法的改進和在保險業(yè)CRM中的應(yīng)用[J].大連交通大學(xué)學(xué)報,2008,(1):76-79.

      [6]李志剛.客戶關(guān)系管理理論與應(yīng)用[M].北京:機械工業(yè)出版社,2007.

      [7] Anonymous.Both sides of the CRM divide[J]. Marketing. Toronto:Apr18,2005.Vol.110,Lss.14;p.S14(1 page).

      [8]Netter.Database firm unveils Web CRM service[J].Marketing Week.London:Apr 14,2005.p.17.

      責任編輯、校對:秦學(xué)詩

      猜你喜歡
      means算法客戶群聚類分析
      農(nóng)村居民家庭人均生活消費支出分析
      基于省會城市經(jīng)濟發(fā)展程度的實證分析
      中國市場(2016年33期)2016-10-18 12:16:58
      基于聚類分析的互聯(lián)網(wǎng)廣告投放研究
      科技視界(2016年20期)2016-09-29 12:32:48
      基于K—Means聚類算法入侵檢測系統(tǒng)研究
      基于Weka的Apriori算法在原油產(chǎn)量預(yù)測中的應(yīng)用
      “縣級供電企業(yè)生產(chǎn)經(jīng)營統(tǒng)計一套”表輔助決策模式研究
      基于HSI顏色空間的小麥粉精度自動識別研究
      基于聚類的Web日志挖掘
      淺析微電影
      專注于特殊客戶群社交網(wǎng)廣告
      漠河县| 平谷区| 循化| 吉首市| 贵南县| 平江县| 喀喇沁旗| 广宗县| 景泰县| 长岛县| 响水县| 昌图县| 林甸县| 翁牛特旗| 秦皇岛市| 鲁甸县| 黔江区| 德昌县| 名山县| 荆门市| 四会市| 麻栗坡县| 祁门县| 手游| 宝兴县| 北碚区| 微山县| 中山市| 信宜市| 雅安市| 华容县| 安义县| 八宿县| 固安县| 武城县| 信阳市| 上栗县| 无极县| 扎赉特旗| 安溪县| 安阳市|