• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于RFM購買樹的客戶分群

      2017-06-15 18:52:33張文斌黃哲學(xué)陳小軍
      關(guān)鍵詞:復(fù)雜度聚類對象

      明 勇,張文斌,黃哲學(xué),陳小軍

      深圳大學(xué)計(jì)算機(jī)與軟件學(xué)院,廣東深圳518060

      【電子與信息科學(xué) / Electronic and Information Science】

      基于RFM購買樹的客戶分群

      明 勇,張文斌,黃哲學(xué),陳小軍

      深圳大學(xué)計(jì)算機(jī)與軟件學(xué)院,廣東深圳518060

      針對通過零售交易數(shù)據(jù)進(jìn)行客戶分群時(shí)傳統(tǒng)方法未考慮商品的價(jià)值問題,提出用RFM(recency frequency monetary)表達(dá)交易數(shù)據(jù)的方法,該方法將客戶購買的商品和商品類別組成一棵RFM購買樹(recency frequency monetary purchase tree,RFMPT).提出基于RFM購買樹的快速聚類算法(based recency frequency monetary purchase tree clustering,BRFMPTC),把購買樹構(gòu)建為CoverTree(CT)索引結(jié)構(gòu),利用CT結(jié)構(gòu)快速選擇k個(gè)密度最大的購買樹作為中心,將其他對象劃分到距它最近的類中心. 實(shí)驗(yàn)結(jié)果表明,在距離加權(quán)下,BRFMPTC算法較傳統(tǒng)算法在整體上能產(chǎn)生質(zhì)量更高的聚類結(jié)果,性能得到較大提升.

      計(jì)算機(jī)感知;零售數(shù)據(jù);客戶分群;RFM購買樹;聚類;覆蓋樹;Dunn指數(shù)

      客戶分群在客戶關(guān)系管理中起著關(guān)鍵性的作用[1],它將客戶劃分成許多組,同組客戶有相似的喜好和購買行為.企業(yè)可根據(jù)不同客戶群的購買行為,采取針對性的營銷策略.聚類是客戶分群常采用的技術(shù),其目的是根據(jù)客戶的屬性將客戶分組.常用的屬性包括性別、年齡、職業(yè)、愛好和收入等客戶基本信息[2-3].但是,這些屬性數(shù)據(jù)存在不準(zhǔn)確和不完整等問題[4],且這些靜態(tài)數(shù)據(jù)不能反映客戶購買行為[5],無法按客戶的購買喜好進(jìn)行分群,不滿足營銷應(yīng)用需求.

      基于零售交易數(shù)據(jù)的客戶分群是當(dāng)前研究的熱點(diǎn)[6].Zalaghi等[7-8]將客戶購買的商品表示成矩陣,并用k-means方法進(jìn)行客戶分群.Hsu等[9]提出通過層次聚類法對客戶進(jìn)行分群,但該方法計(jì)算復(fù)雜度高.蔡玖琳等[10]提出基于聚類的多指標(biāo)客戶細(xì)分方法.陳小軍等[11]提出用購買樹表示零售數(shù)據(jù)并用于客戶分群.以上方法僅考慮客戶購買的商品,并未考慮商品的價(jià)值.

      在客戶關(guān)系管理模式中,基于RFM(recency frequency monetary)客戶細(xì)分是一種統(tǒng)計(jì)劃分的方法,該方法用R表示每個(gè)客戶在一定時(shí)期內(nèi)最近一次購買的時(shí)間,用F表示購買商品的次數(shù),用M表示購買商品的總金額,然后加權(quán)計(jì)算得到RFM得分,進(jìn)而對客戶按得分進(jìn)行分組.但這樣的劃分并未考慮同組客戶購買商品的差異性,在大量客戶的情況下,分組非常粗糙.為此,本研究提出一種基于RFM購買樹的表達(dá)方法來表達(dá)交易數(shù)據(jù)的客戶分群方法.在該方法中,統(tǒng)計(jì)每個(gè)客戶購買每種商品的RFM值,根據(jù)客戶購買的商品和商品類別建成一棵RFM購買樹,樹的葉子節(jié)點(diǎn)表示商品,內(nèi)部節(jié)點(diǎn)表示商品類別,商品節(jié)點(diǎn)和商品類別節(jié)點(diǎn)都帶有RFM值,通過定義RFM購買樹之間的相似度計(jì)算方法,提出基于RFM購買樹的快速聚類算法(basedRFMpurchasetreeclustering,BRFMPTC).結(jié)果表明,在距離加權(quán)下,采用BRFMPTC算法比傳統(tǒng)算法能獲得更好的聚類效果,效率有大幅提升.

      1 RFM購買樹表達(dá)及相似度計(jì)算

      1.1 交易數(shù)據(jù)

      設(shè)D={R1,R2, …,Rm}是所有交易記錄的集合,Ri為數(shù)據(jù)庫中一條交易記錄,其中1≤i≤m.R={TID,timestamp,vipID,item},這里,TID為交易記錄在D中唯一標(biāo)識;timestamp為購買商品的時(shí)間;vipID為客戶唯一標(biāo)識;item為商品項(xiàng).在超市或商場內(nèi),商品項(xiàng)都超過十萬種,若采用傳統(tǒng)矩陣方法表示數(shù)據(jù),列表示商品項(xiàng),顯然不可取,因?yàn)檫@樣表示的矩陣維度超過十萬維,且矩陣非常稀疏,浪費(fèi)存儲空間.

      本研究擬用RFM購買樹表達(dá)客戶交易數(shù)據(jù),設(shè)T={t1,t2, …,tn}是從D中抽取出某客戶的一組交易記錄,對應(yīng)商品項(xiàng)是i1,i2, …,in, 表示成樹狀結(jié)構(gòu)PT={vipID, }, 這樣以前綴樹形式共享父級層次信息,對原始數(shù)據(jù)進(jìn)行壓縮,減小了存儲空間,實(shí)現(xiàn)高效處理大量數(shù)據(jù).

      1.2 RFM購買樹表達(dá)方法

      統(tǒng)計(jì)每個(gè)客戶購買每種商品中的R、F和M值后構(gòu)建RFM購買樹.RFM購買樹是某個(gè)客戶購買商品和RFM值集合的樹狀表達(dá),所有客戶購買商品和購買頻率的集合表達(dá)稱為商品樹.設(shè)φ為購買樹,Ψ為商品樹,F(xiàn)v(φ)為φ中節(jié)點(diǎn)v的RFM值,則φ是Ψ的子集,即節(jié)點(diǎn)N(φ)?N(Ψ), 邊E(φ)?E(Ψ), 節(jié)點(diǎn)是一個(gè)商品名稱和RFM值的結(jié)構(gòu)體.從RFM購買樹根節(jié)點(diǎn)Root(φ)到任意一個(gè)葉節(jié)點(diǎn)v?N(φ)的路徑,可在商品樹Ψ中找到同樣一條路徑.購買樹由客戶交易數(shù)據(jù)產(chǎn)生,通過遍歷購買樹可查找客戶具體購買的商品.圖1為某客戶的RFM購買樹,該購買樹有5層,葉子層為客戶具體購買的商品,內(nèi)部節(jié)點(diǎn)表示層次類別信息,如手機(jī)屬于個(gè)人數(shù)碼類別,其父節(jié)點(diǎn)即為個(gè)人數(shù)碼.每個(gè)節(jié)點(diǎn)中的三元組表示RFM值,如個(gè)人數(shù)碼節(jié)點(diǎn)中(50,2,5998.00)的50為最近一次購買距離分析點(diǎn)的時(shí)間(單位:d),2為購買商品次數(shù),5998.00為購買商品的總金額(單位:元).

      圖1 RFM購買樹示意圖Fig.1 A sample of RFM purchase tree

      1.3 RFM購買樹生成算法

      給定某客戶的m條交易記錄R={r1,r2, …,rm}, 掃描R中每條交易記錄,提取每條記錄中的經(jīng)營小類、商品種類、商品小類和商品品牌等信息,依次插入RFM購買樹φ中.各節(jié)點(diǎn)的RFM值計(jì)算方法為:以季度為滑動(dòng)窗口統(tǒng)計(jì)出該商品的購買次數(shù)、金額和最后一次購買距分析點(diǎn)的時(shí)間,并統(tǒng)計(jì)出φ中各葉節(jié)點(diǎn)的RFM值.內(nèi)部節(jié)點(diǎn)的RFM值是其子節(jié)點(diǎn)RFM值的累加和,再根據(jù)商品樹中記錄的各節(jié)點(diǎn)的最大RFM值對購買樹節(jié)點(diǎn)RFM值進(jìn)行歸一化處理.φ的第1層為根節(jié)點(diǎn),第2層到倒數(shù)第2層分別表示商品大類、中類、小類和品牌等層次信息,葉子層表示具體的商品.從交易記錄中生成購買樹的算法CreateRFMPurTree()代碼如圖2.

      圖2 CreateRFMPurTree算法

      Fig.2 CreateRFMPurTree algorithm

      1.4 RFM購買樹相似度計(jì)算

      對規(guī)模為n的購買樹集合Ф={φ1,φ2,…,φn}, 設(shè)H(Φ)為購買樹的高度, Root(φ)為購買樹的根節(jié)點(diǎn),F(xiàn)v(φi)為RFM購買樹φi中節(jié)點(diǎn)v的RFM值,Nl(φi)為購買樹φi中第l層的所有節(jié)點(diǎn).交易數(shù)據(jù)一般維度很高,采用歐式距離計(jì)算復(fù)雜度較高,且歐式距離更多體現(xiàn)的是數(shù)值的絕對差異.因此,本研究采用余弦距離,則φi與φj在節(jié)點(diǎn)v的余弦距離為

      (1)

      層次間的距離指兩顆購買樹在相同層的距離,由該層所有節(jié)點(diǎn)間的余弦距離加權(quán)求和,即

      (2)

      其中,l為購買樹的層次, 1≤l≤H(φ);βv是節(jié)點(diǎn)v的權(quán)重,對于根節(jié)點(diǎn),βv=1, 對于其他節(jié)點(diǎn),βv的值是其父節(jié)點(diǎn)的值除以該父節(jié)點(diǎn)擁有的子節(jié)點(diǎn)數(shù)目δv(φi,φj).

      RFM購買樹之間的距離對應(yīng)購買樹層次距離的累積和,為調(diào)節(jié)某層距離在購買樹距離中的比例,引入權(quán)重系數(shù)ωl, 則購買樹φi和φj的距離為

      (3)

      表示從購買樹第1層到第H(Ф)層的各層距離加權(quán).其中,ωl表示第l層的權(quán)值,權(quán)值越大的層在購買樹中占的比例越大,所有層的權(quán)值之和為1.

      設(shè)r為相鄰層之間系數(shù)的倍數(shù),則ωl的值可通過r來控制,即ωl=rωl-1.

      根據(jù)RFM購買樹的距離定義,客戶i和客戶j購買樹的相似度為

      (4)

      2 基于RFM購買樹表達(dá)的聚類算法

      客戶分群需先用層次索引樹(CoverTree,CT)將所有RFM購買樹構(gòu)建為CT結(jié)構(gòu),用于快速近鄰查找,然后在CT中找到類初始中心所在的層,計(jì)算位于該層的RFM購買樹對象的密度,作為類初始化中心,最后,將其他RFM購買樹劃分到距離最近的中心.

      2.1 CT結(jié)構(gòu)

      CT是由Beygelzimer提出[12]的分層次的索引樹,結(jié)構(gòu)如圖3.

      圖3 CoverTree示意圖[12]Fig.3 A sample of CoverTree[12]

      由圖3可見,CT的每層有個(gè)索引,且隨著樹的生長而減小,用Ci表示集合S中與CT第i層相關(guān)聯(lián)的對象集合,CT的每個(gè)節(jié)點(diǎn)和集合S的一個(gè)對象關(guān)聯(lián),S中的每個(gè)對象可能和CT多個(gè)節(jié)點(diǎn)關(guān)聯(lián),但每層只出現(xiàn)1次.CT具有以下特性:

      1)嵌套性.Ci∈Ci-1, 表示若一個(gè)對象P∈S出現(xiàn)在第i層,則第i層以下每層都有一個(gè)節(jié)點(diǎn)與P關(guān)聯(lián).

      2)覆蓋性.對于第i-1層中的每個(gè)對象p∈Ci-1, 在第i層都存在一個(gè)對象q∈Ci, 使d(p,q)<2i. 同時(shí),與q關(guān)聯(lián)的節(jié)點(diǎn)為i-1層與p關(guān)聯(lián)的節(jié)點(diǎn)的父節(jié)點(diǎn).

      3)分離性.對于每層中任何兩個(gè)相異節(jié)點(diǎn)所關(guān)聯(lián)的對象p,q∈Ci, 且p≠q,d(p,q)<2i.

      把購買樹集合構(gòu)建為一棵CT索引結(jié)構(gòu)樹,用于快速近鄰查找.設(shè)購買樹集合為Ф={φ1,φ2, …,φn}, 根據(jù)CT的性質(zhì),依次將φi(1≤i≤n)插入CT,任意兩棵購買樹之間的距離d(φp,φq)∈[0,1]. 根據(jù)CT分離性易知最頂層僅1個(gè)購買樹Ct, 其余都是Ct的后代,對于n個(gè)購買樹對象,創(chuàng)建CT的時(shí)間復(fù)雜度為O(nlg(n)).

      2.2 密度估計(jì)

      在進(jìn)行聚類時(shí),需計(jì)算CT結(jié)構(gòu)中某一層節(jié)點(diǎn)所關(guān)聯(lián)的購買樹的密度,并根據(jù)計(jì)算結(jié)果找出聚類的初始中心,再將其他購買樹依次分配到相應(yīng)的聚類中心.設(shè)p為任意購買樹,其密度為

      (5)

      其中,q為除p外的其他購買樹.購買樹p的密度就是第l層中與p的距離小于等于2l的購買樹個(gè)數(shù).計(jì)算p的密度算法EstimateDensity()如圖4.

      圖4 EstimateDensity算法

      Fig.4 EstimateDensity algorithm

      2.3 聚 類

      對給定的n棵RFM購買樹Ф={φ1,φ2, …,φn}, 先構(gòu)建CT結(jié)構(gòu).將n棵RFM購買樹分成k類,從CT中找到某層對象個(gè)數(shù)大于k的層數(shù)i, 根據(jù)CT的分離性,第i層任意兩個(gè)不同的RFM購買樹p和q的距離d(p,q)>2i, 以2來衡量這k個(gè)初始中心的相互距離,用EstimateDensity()計(jì)算該層所有RFM購買樹的密度,選擇密度最大的k個(gè)RFM購買樹作為初始中心,再將剩余的每個(gè)客戶劃分到距它最近的類初始中心,整個(gè)過程的時(shí)間復(fù)雜度為O(nlg(n)), 聚類算法BRFMPTC()如圖5.

      圖5 BRFMPTC算法

      Fig.5 BRFMPTC algorithm

      3 結(jié)果與分析

      為檢驗(yàn)基于RFM購買樹表達(dá)交易數(shù)據(jù)的聚類算法的有效性,采用真實(shí)數(shù)據(jù)對效果和性能進(jìn)行驗(yàn)證.?dāng)?shù)據(jù)源自國內(nèi)某大型連鎖超市的實(shí)際交易記錄數(shù)據(jù),共3 073 886條交易記錄,76 419個(gè)vip號(vipID數(shù)目).該超市的商品結(jié)構(gòu)分為4層,從高到低依次是經(jīng)營小類、商品中類、商品小類和商品.為便于分析,將數(shù)據(jù)分成10個(gè)數(shù)據(jù)集,用平均稀疏度描述購買樹不同層中節(jié)點(diǎn)分布情況,則第l層平均稀疏度定義為

      (6)

      其中,φi為第i棵RFM購買樹; Ф為n棵購買樹的集合;Nl(φi)為RFM購買樹φi第l層的節(jié)點(diǎn).由CreateRFMPurTree()生成的10個(gè)數(shù)據(jù)集D1,D2, …,D10的大小和平均稀疏度如表1.

      表1 各數(shù)據(jù)集大小和平均稀疏度

      實(shí)驗(yàn)所用計(jì)算機(jī)配置為Inter(R) Core(TM)i5-4590CPU@3.30Hz,12 G內(nèi)存,Win10操作系統(tǒng).為評估BRFMPTC算法效果,選擇層次聚類算法(hierarchical clustering algorithm, HAC)[13]、基于密度的聚類算法(density-based spatial clustering of application with noise, DBSCAN)[14]和模型聚類算法譜聚類(spectral clustering)[15]做為比較算法(k-means算法因不能處理樹形結(jié)構(gòu)數(shù)據(jù),不參與比較),選擇聚類的緊湊度評價(jià)指標(biāo)和Dunn指數(shù)(Dunnindex,DI)進(jìn)行對比參數(shù).

      本實(shí)驗(yàn)要進(jìn)行不同參數(shù)的多組計(jì)算,指標(biāo)評價(jià)在大小適度的數(shù)據(jù)集D5中進(jìn)行,該數(shù)據(jù)集含有3 198 個(gè)vipID.緊湊度評價(jià)標(biāo)準(zhǔn)定義為

      (7)

      其中,P1,P2,…,Pk表示聚成的k個(gè)簇結(jié)果.

      圖6展示了r取1、500和1 000時(shí),BRFMPTC算法、單連接層次聚類算法(HAC-single)、全連接層次聚類算法(HAC-complete)、DBSCAN算法和Spectral算法在不同聚類簇?cái)?shù)下的lg(W(k))值.從每幅圖內(nèi)部來看,隨著聚類簇?cái)?shù)的增加,各算法計(jì)算得到的lg(W(k))不斷減小, lg(W(k))值越小表示緊湊度越高,聚類效果好,因?yàn)殡S著劃分簇?cái)?shù)的增多,原來緊湊度不高的一個(gè)大簇會被劃分幾個(gè)較小的簇,而這些小簇緊湊度較高.可見,無論r取1和500還是1 000,BRFMPTC算法的lg(W(k))值普遍比其他算法低,緊湊度更高,說明BRFMPTC算法聚類效果更好.

      圖6 不同k下各算法lg(W(k))值Fig.6 (Color online) lg(W(k)) of each algorithm under different k

      DI指用任意簇間最小距離除以任意簇內(nèi)最大距離來評價(jià)聚類效果,如式(8),其中Ci(1≤i≤k)為聚成的第i個(gè)簇.在聚類中,任意簇間最小距離越大,說明各簇有越好的分離性,任意簇內(nèi)距離的最大距離越小,說明簇內(nèi)越緊密,因此DI值越大越好.

      (8)

      圖7 各算法在不同r和k下的DI值Fig.7 (Color online) The DI value of each algorithm in different r and k

      圖7為r分別取1、500和1 000時(shí),各算法在不同聚類簇?cái)?shù)k下的DI值.從圖7可見,r=1 000時(shí),DI值比較大,在各算法對比中,BRFMPTC算法得到的DI值普遍高于其他算法.

      對于n個(gè)RFM購買樹對象,本研究提出的BRFMPTC算法構(gòu)建CoverTree結(jié)構(gòu)和聚類過程,時(shí)間復(fù)雜度都是O(nlg(n)), 所以BRFMPTC算法時(shí)間為O(nlg(n)).HAC算法在進(jìn)行每次迭代的時(shí)候要計(jì)算與其他所有對象的距離,時(shí)間復(fù)雜度為O(n2).DBSCAN算法需要將若干個(gè)核心點(diǎn)相關(guān)聯(lián)的邊界點(diǎn)分派到最近的核心點(diǎn),時(shí)間復(fù)雜度也為O(n2).Spectral算法需要構(gòu)造數(shù)據(jù)對象的相似矩陣和對應(yīng)的Laplacian矩陣,Laplacian矩陣分解是立方級的復(fù)雜度.在表1的10個(gè)不同大小的數(shù)據(jù)集上運(yùn)行各算法,得到各算法總運(yùn)行時(shí)間如圖8.從中可見,BRFMPTC算法運(yùn)行時(shí)間比其他算法更短,僅用BRFMPTC算法測出了所有數(shù)據(jù)集的運(yùn)行時(shí)間,spectralclustering算法在D7數(shù)據(jù)集上的運(yùn)行時(shí)間已經(jīng)非常大了.

      圖8 各算法在數(shù)據(jù)集D1到D10上的運(yùn)行時(shí)間Fig.8 (Color online) The execution time of each algorithm

      結(jié) 語

      針對基于零售交易數(shù)據(jù)進(jìn)行客戶分群的傳統(tǒng)方法存在的問題,提出將客戶交易數(shù)據(jù)用RFM購買樹表達(dá),并基于該表達(dá)方法和相似度計(jì)算提出快速聚類算法BRFMPTC.實(shí)驗(yàn)結(jié)果表明,在距離加權(quán)下,BRFMPTC算法比傳統(tǒng)算法聚類的效果更好.下一步,將基于該聚類方法開發(fā)一個(gè)客戶分群系統(tǒng),以期提高客戶零售數(shù)據(jù)分析挖掘的效率,降低數(shù)據(jù)處理分析的成本.

      / References:

      [1] Natchiar S U, Baulkani S. Customer relationship management classification using data mining techniques[C]// International Conference on Science Engineering and Management Research. Dubai: IEEE, 2014:e18.

      [2] Chattopadhyay M, Dan P K, Mazumdar S, et al. Application of neural network in market segmentation: areview on recent trends[J]. Management Science Letters, 2012, 2(2):425-438.

      [3] Chen Muchen, Chao Chuangmin, Wu Kuanting. Pattern filtering and classification for market basket analysis with profit-based measures[J]. Expert Systems, 2012, 29(2):170-182.

      [4] B?ttcher M,Spott M,Nauck D, et al. Mining changing customer segments in dynamic markets[J]. Expert Systems with Applications: An International Journal, 2009,36(1):155-164.

      [5] Müller H, Hamm U. Stability of market segmentation with cluster analysis:a methodological approach[J]. Food Quality and Preference, 2014, 34(2):70-78.

      [6] Singh A, Rumantir G, South A, et al. Clustering experiments on big transaction data for market segmentation[C]// Proceedings of the 2014 International Conference on Big Data Science and Computing. New York, USA: ACM, 2014:1-7.

      [7] Zalaghi Z, Varzi Y A. Measuring customer loyalty using an extended RFM and clustering technique[J]. Management Science Letters, 2014, 4(5): 905-912.

      [8] 李 剛,張 莉,李純青.交易數(shù)據(jù)的百貨商場客戶細(xì)分研究[J].西安工業(yè)大學(xué)學(xué)報(bào), 2014(3):216-220. Li Gang, Zhang Li, Li Chunqing. Research on customer segmentation with transaction data of a department store[J]. Journal of Xi’an Technological University,2014(3):216-220.(in Chinese)

      [9] Hsu F M,Lu Lipang,Lin Chunmin. Segmenting customers by transaction data with concept hierarchy[J]. Expert Systems with Applications: an International Journal,2012,39(6):6221-6228.

      [10] 蔡玖琳,張 磊,張秋三.一種基于數(shù)據(jù)挖掘的零售業(yè)客戶細(xì)分方法研究[J].重慶工商大學(xué)學(xué)報(bào)自然科學(xué)版, 2015,32(2):43-48. Cai Jiulin, Zhang Lei, Zhang Qiusan. Research on customer segmentation method in retail industry based on data mining[J]. Journal of Chongqing Technology and Business University Natural Sciences Edition, 2015, 32(2):43-48.(in Chinese)

      [11] Chen Xiaojun,Huang Joshua,Luo Jun.PurTreeClust: a purchase tree clustering algorithm for large-scale customer transaction data[C]// IEEE 32nd International Conference on Data Engineering. Helsinki: IEEE, 2016:661-672.

      [12] Beygelzimer A, Kakade S, Langford J. Cover trees for nearest neighbor[C]// Proceedings of the 23rd Inter-national Conference on Machine Learning.Pittsburgh, USA: ACM, 2010:97-104.

      [13] Hall M, Frank E, Holmes G, et al. The WEKA data mining software: an update[J]. ACMSIGKDD Explorations Newsletter, 2009, 11(1):10-18.

      [14] Sander J, Ester M, Kriegel H P, et al. Density-based clustering in spatial databases: the algorithm GDBSCAN and its applications[J]. Data Mining and Knowledge Discovery, 1998, 2(2):169-194.

      [15] Ng A Y, Jordan M I, Weiss Y. On spectral clustering: analysis and an algorithm[J]. Proceedings of Advances in Neural Information Processing Systems, 2002, 14:849-856.

      【中文責(zé)編:英 子;英文責(zé)編:子 蘭】

      2016-11-07;Accepted:2017-02-27

      Professor Huang Zhexue.E-mail:zx.huang@szu.edu.cn

      Customer segmentation based on RFM purchase tree

      Ming Yong, Zhang Wenbin, Huang Zhexue, and Chen Xiaojun

      College of Computer Science and Software Engineering, Shenzhen University, Shenzhen 518060, Guangdong Province, P.R.China

      In order to solve the problem that the value of goods has not been considered in traditional methods of customer segmentation, we propose a method of using the recency frequency monetary purchase tree (RFMPT) to represent transaction data, in which a RFM purchase tree is built based on the category of the goods.Based on the RFM purchase tree,we propose a fast clustering algorithm named based recency frequency monetary purchase tree clustering (BRFMPTC). This algorithm constructs the purchase tree as a CoverTree(CT) index structure. With this structure, we can quickly select thekdensestpurchasetreesasclustercenters,thendividetheotherobjectsintothenearestclasscenter.Theexperimentalresultsshowthattheperformanceoftheproposedmethodwithdistanceweightingisbetterthanthatofthetraditionalclusteringalgorithms.

      computer perception; transaction data; customer segmentation; recency frequency monetary purchase tree; cluster; CoverTree; Dunn index

      :Ming Yong, Zhang Wenbin, Huang Zhexue, et al. Customer segmentation based on RFM purchase tree[J]. Journal of Shenzhen University Science and Engineering, 2017, 34(3): 306-312.(in Chinese)

      國家自然科學(xué)基金資助項(xiàng)目(61305059);深圳大學(xué)青年教師科研啟動(dòng)資助項(xiàng)目(201432)

      明 勇(1989—),男,深圳大學(xué)碩士研究生.研究方向:數(shù)據(jù)挖掘.E-mail:13760182207@163.com

      K921/927;TP

      A

      10.3724/SP.J.1249.2017.03306

      Foundation:National Natural Science Foundation of China (61305059); Natural Science Foundation of Shenzhen University (201432)

      引 文:明 勇,張文斌,黃哲學(xué),等.基于RFM購買樹的客戶分群[J]. 深圳大學(xué)學(xué)報(bào)理工版,2017,34(3):306-312.

      猜你喜歡
      復(fù)雜度聚類對象
      神秘來電
      睿士(2023年2期)2023-03-02 02:01:09
      一種低復(fù)雜度的慣性/GNSS矢量深組合方法
      攻略對象的心思好難猜
      意林(2018年3期)2018-03-02 15:17:24
      基于DBSACN聚類算法的XML文檔聚類
      電子測試(2017年15期)2017-12-18 07:19:27
      求圖上廣探樹的時(shí)間復(fù)雜度
      基于熵的快速掃描法的FNEA初始對象的生成方法
      區(qū)間對象族的可鎮(zhèn)定性分析
      某雷達(dá)導(dǎo)51 頭中心控制軟件圈復(fù)雜度分析與改進(jìn)
      基于改進(jìn)的遺傳算法的模糊聚類算法
      出口技術(shù)復(fù)雜度研究回顧與評述
      乳山市| 光山县| 西城区| 凤山县| 始兴县| 桃江县| 安义县| 简阳市| 吴川市| 新蔡县| 甘南县| 台中县| 马公市| 湘潭市| 阿拉善左旗| 车险| 监利县| 赞皇县| 东台市| 洛南县| 教育| 新建县| 苏尼特右旗| 崇文区| 华坪县| 禄丰县| 尖扎县| 阿瓦提县| 铜梁县| 璧山县| 清原| 思茅市| 玉田县| 洛宁县| 自贡市| 潢川县| 长沙县| 巩义市| 德兴市| 德化县| 无棣县|