宋濤 王星
摘要:銀行卡支付在社會(huì)消費(fèi)行為中占很大比例,在促進(jìn)經(jīng)濟(jì)增長(zhǎng)中發(fā)揮重大作用,因此,預(yù)測(cè)持卡消費(fèi)行為具有重要意義。然而,傳統(tǒng)方法難以有效應(yīng)對(duì)復(fù)雜數(shù)據(jù)和動(dòng)態(tài)變化。為此,提出基于二次聚類和隱馬爾可夫鏈(HMC)理論的個(gè)體消費(fèi)行為預(yù)測(cè)方法。首先,對(duì)消費(fèi)行為按照序列進(jìn)行模式聚類,并引入懲罰聚類進(jìn)行二次聚類,對(duì)序列模式中的層次狀態(tài)進(jìn)行平衡劃分;其次,利用HMC來(lái)估計(jì)序列中消費(fèi)層次的狀態(tài)轉(zhuǎn)移,對(duì)用戶的未來(lái)消費(fèi)行為進(jìn)行預(yù)測(cè)。最后,通過(guò)實(shí)驗(yàn)比較分析傳統(tǒng)聚類、無(wú)懲罰序列聚類和帶懲罰項(xiàng)的聚類結(jié)果表明,提出的基于二次聚類和隱馬氏鏈的方法更適用于消費(fèi)者行為預(yù)測(cè)。
關(guān)鍵詞:
二次聚類;懲罰聚類;隱馬爾可夫鏈;持卡消費(fèi);行為預(yù)測(cè)
中圖分類號(hào): TP18 文獻(xiàn)標(biāo)志碼:A
0引言
當(dāng)今,社會(huì)消費(fèi)品零售總額中約有四分之一是用銀行卡支付的。截止2014年底,我國(guó)銀行卡發(fā)行量已經(jīng)接近50億張,各季度的非現(xiàn)金支付額度也已突破數(shù)百萬(wàn)億,比上年度都有較大的增長(zhǎng)。據(jù)中國(guó)銀聯(lián)測(cè)算,銀行卡的使用能拉動(dòng)全國(guó)居民消費(fèi)的增加,帶動(dòng)國(guó)內(nèi)生產(chǎn)總值(Gross Domestic Product, GDP)的提升。這些數(shù)據(jù)表明,銀行卡在刺激消費(fèi)、拉動(dòng)內(nèi)需和促進(jìn)經(jīng)濟(jì)增長(zhǎng)方面發(fā)揮著巨大的作用。與此同時(shí),很多卡不明原因減用或停用也促使銀行經(jīng)營(yíng)者意識(shí)到需要精耕細(xì)作、深入考察持卡消費(fèi)者的消費(fèi)情況,準(zhǔn)確把握消費(fèi)結(jié)構(gòu)和變化規(guī)律,生成有見(jiàn)地的知識(shí)決策,因此,建立基于持卡用戶真實(shí)消費(fèi)特征的預(yù)測(cè)模型是銀行業(yè)了解用戶消費(fèi)行為特征和理解消費(fèi)特點(diǎn)的基本途徑,也是逐步實(shí)現(xiàn)由需求拉動(dòng)客戶滿意與客戶忠誠(chéng)的長(zhǎng)遠(yuǎn)管理規(guī)劃。
持卡消費(fèi)者行為價(jià)值是客戶關(guān)系管理中的核心概念。目前有不少消費(fèi)模型,如譚濤等[1]提出的兩階段模型,郭愛(ài)君等[2]提出的
近似理想的消費(fèi)系統(tǒng)(Almost Ideal Demand System, AIDS)模型。這兩種模型均對(duì)農(nóng)村居民消費(fèi)行為進(jìn)行了模擬和分析,但其分析的數(shù)據(jù)是已經(jīng)發(fā)生的消費(fèi)行為,并不對(duì)未來(lái)行為進(jìn)行預(yù)測(cè)。比較典型的消費(fèi)者價(jià)值模型是RFM(RecencyFrequencyMonetary)行為度量模型[3-4],該模型采用銀行業(yè)務(wù)系統(tǒng)中消費(fèi)者最近消費(fèi)時(shí)間(Recency, R請(qǐng)補(bǔ)充R、F、M所代表的完整英文單詞。RFM是此3個(gè)英文單詞的縮寫吧,請(qǐng)明確。)、消費(fèi)頻數(shù)(Frequency, F)和消費(fèi)金額(Monetary, M)三個(gè)變量定義客戶的消費(fèi)價(jià)值。該方法首先將連續(xù)的RFM數(shù)據(jù)離散化為幾種狀態(tài)級(jí)別類型,計(jì)算相應(yīng)類型的概率分布及其時(shí)間變化,并根據(jù)RFM級(jí)別對(duì)消費(fèi)者行為特征進(jìn)行價(jià)值聚類,從而把握用戶的分群消費(fèi)價(jià)值結(jié)構(gòu)。
馬爾可夫鏈(即馬氏鏈)由俄國(guó)科學(xué)家最早提出,在實(shí)際中有廣泛的應(yīng)用[5-6]。在眾多消費(fèi)預(yù)測(cè)模型中,其中比較典型的一種方法即是基于馬爾可夫鏈的方法,即基于RFM狀態(tài)的馬氏鏈轉(zhuǎn)移參數(shù)預(yù)測(cè)模型[7]。該模型考慮了多時(shí)期RFM消費(fèi)價(jià)值結(jié)構(gòu)的變化,給出了用戶價(jià)值的兩階段參數(shù)預(yù)測(cè)方法,但該方法主要存在如下三方面的缺陷:
1)模型僅適用于具有簡(jiǎn)單結(jié)構(gòu)的數(shù)據(jù),不適用于復(fù)雜結(jié)構(gòu)的數(shù)據(jù)。傳統(tǒng)消費(fèi)層次聚類假設(shè)個(gè)體消費(fèi)者行為獨(dú)立,難以捕捉到個(gè)人消費(fèi)習(xí)慣對(duì)于消費(fèi)行為的影響,沒(méi)有將變化和走向相似的序列共同考慮,結(jié)果很難產(chǎn)生精準(zhǔn)預(yù)測(cè)。
2)消費(fèi)行為如購(gòu)買金額和消費(fèi)頻率常常呈現(xiàn)嚴(yán)重的右偏分布,即一些數(shù)據(jù)的偏度很大,模型參數(shù)估計(jì)不穩(wěn)定。
3)傳統(tǒng)的馬爾可夫鏈方法假設(shè)消費(fèi)狀態(tài)與消費(fèi)行為相同,忽略了不同的消費(fèi)狀態(tài)在動(dòng)態(tài)演變中對(duì)消費(fèi)行為產(chǎn)生的影響。
隱馬爾可夫鏈(即隱馬氏鏈)[8](Hidden Markov Model, HMM)是一種典型的統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法,它是觀測(cè)馬氏鏈模型的延伸。傳統(tǒng)觀測(cè)馬氏鏈認(rèn)為觀測(cè)和狀態(tài)是統(tǒng)一的;而隱馬氏鏈則認(rèn)為觀測(cè)和狀態(tài)是分離的,每個(gè)觀測(cè)部分由狀態(tài)決定。隱馬氏鏈在多個(gè)領(lǐng)域得到成功應(yīng)用:蔡文學(xué)等[9]將其應(yīng)用于軌跡定位,朱旭東等[10]應(yīng)用隱馬爾可夫鏈進(jìn)行異常檢測(cè),Choo等[11]則在基因檢測(cè)中引入HMC。
為了得到更為客觀的、更有預(yù)測(cè)性的消費(fèi)結(jié)構(gòu),本文提出基于二次聚類和HMC理論的個(gè)體消費(fèi)者結(jié)構(gòu)預(yù)測(cè)方法。該方法以消費(fèi)者多期消費(fèi)行為觀測(cè)數(shù)據(jù)為起點(diǎn),首先,對(duì)消費(fèi)行為按照序列進(jìn)行模式聚類,并引入懲罰聚類進(jìn)行二次聚類,對(duì)序列模式中的層次狀態(tài)進(jìn)行平衡劃分;其次,基于HMC估計(jì)序列中消費(fèi)層次的狀態(tài)轉(zhuǎn)移,對(duì)用戶的未來(lái)消費(fèi)行為進(jìn)行預(yù)測(cè);最后,通過(guò)實(shí)驗(yàn)比較分析表明,與傳統(tǒng)聚類、無(wú)懲罰序列聚類相比,本文提出的基于二次聚類和隱馬氏鏈的方法更適用于消費(fèi)者行為預(yù)測(cè)模型。
1本文方法
本章將建立消費(fèi)者價(jià)值行為預(yù)測(cè)模型,即采用HMC模型,并對(duì)模型中的參數(shù)進(jìn)行訓(xùn)練計(jì)算。在此之前,首先對(duì)數(shù)據(jù)采用序列聚類和懲罰聚類方法對(duì)序列模式中的層次狀態(tài)進(jìn)行平衡劃分。模型建立框架如圖1所示。
1.1用于持卡消費(fèi)行為的二次聚類
為了更準(zhǔn)確地預(yù)測(cè)消費(fèi)行為,即對(duì)數(shù)據(jù)進(jìn)行聚類的組合分析,在對(duì)數(shù)據(jù)進(jìn)行序列模式分解的基礎(chǔ)上,引入懲罰聚類對(duì)數(shù)據(jù)消費(fèi)層次劃分。
1.1.1序列聚類
問(wèn)題的基本概率框架是有限混合分布:
其中:S表示一個(gè)序列;wj表示第j個(gè)模式的權(quán)重;pj(S|θj)表示在第j種序列模式下S序列的分布密度,θj代表了第j種模式,每一種模式都代表了一種消費(fèi)者類型,每一種消費(fèi)者類型都由一個(gè)隱馬氏鏈定義了消費(fèi)層次的轉(zhuǎn)移,以及每個(gè)消費(fèi)層次的特征。
為了能對(duì)持卡消費(fèi)行為進(jìn)行序列模型分解,在此參照美國(guó)、日本業(yè)界領(lǐng)先的消費(fèi)者生活形態(tài)的分類研究模型,定義在消費(fèi)研究中比較受關(guān)注的六類序列,即k=6:成長(zhǎng)型消費(fèi)者(S1)、衰減型消費(fèi)者(S2)、起伏倒U型(S3)、跳躍型消費(fèi)者(S4)、記憶型消費(fèi)者(S5)和起伏型U型(S6),典型實(shí)例如圖2所示。
S1的特點(diǎn)是刷卡次數(shù)隨時(shí)間呈現(xiàn)增長(zhǎng)態(tài)勢(shì);S2的特點(diǎn)是刷卡次數(shù)隨時(shí)間呈現(xiàn)減少態(tài)勢(shì);S3的特點(diǎn)是前半程上升、后半程下降;S4主要表現(xiàn)出層次易變的特點(diǎn);S5的特點(diǎn)是消費(fèi)層次傾向于保持不變;S6的特點(diǎn)是前半程下降、后半程上升。假設(shè)六個(gè)序狀態(tài)之間沒(méi)有交互作用,可以定義矩陣A表示θj的核心信息:
1.1.2懲罰聚類
我國(guó)的消費(fèi)特點(diǎn)是以儲(chǔ)蓄型為主,即小額消費(fèi)的密度遠(yuǎn)高于大額或超大額消費(fèi)的密度;另外還有一些大尺度數(shù)據(jù)的存在,這些異常都會(huì)導(dǎo)致數(shù)據(jù)的直接聚類不能產(chǎn)生很好的平衡效果。為了消除或減弱這些影響,在此引入懲罰聚類進(jìn)行二次聚類,對(duì)數(shù)據(jù)進(jìn)行層次劃分。
消費(fèi)層次劃分是研究消費(fèi)行為變化的起點(diǎn)。傳統(tǒng)的聚類分析如k均值法[12]或期望最大(Expectation Maximization, EM)算法 [13]是無(wú)監(jiān)督數(shù)據(jù)挖掘工具中的代表,它可以在不借助響應(yīng)變量幫助的情況下探索數(shù)據(jù)的群組結(jié)構(gòu)。在聚類分析中比較困難的問(wèn)題是聚類類別數(shù)的確定。目前大部分方法是以類內(nèi)距離的最優(yōu)化作為選擇標(biāo)準(zhǔn)。
1.2基于隱馬氏鏈的消費(fèi)者行為預(yù)測(cè)
1.2.1隱馬氏鏈及消費(fèi)狀態(tài)定義
隱馬氏鏈由于不對(duì)數(shù)據(jù)的分布類型作出過(guò)多的理論限制,從而具有廣泛的適用性。隱馬氏鏈分離狀態(tài)和觀測(cè)的做法本質(zhì)上擴(kuò)展了序列數(shù)據(jù)的研究視角,提高了序列信息的利用率。構(gòu)建合理的隱馬氏鏈可促使?fàn)顟B(tài)內(nèi)數(shù)據(jù)變動(dòng)具有較強(qiáng)的穩(wěn)健性;同時(shí)對(duì)類間模式的區(qū)別有較強(qiáng)的敏感性。按照觀測(cè)值概率取值與狀態(tài)轉(zhuǎn)移描述方式的不同,隱馬氏鏈可以分為離散型HMM(Discrete Hidden Markov Model, DHMM)、半連續(xù)型HMM(SemiContinuous Hidden Markov Model, SCHMM)與連續(xù)型HMM(Continuous Hidden Markov Model, CHMM)。
本文研究使用DHMM,記為λ=(S,XV,π,A,B此處的B是矢量、向量或矩陣嗎?請(qǐng)明確。)。
其中:狀態(tài)集S=(s1,s2,…,si,…,sN)是不同的狀態(tài)模組,N為狀態(tài)數(shù)。
X是序列模式集S上的離散隨機(jī)變量,稱為狀態(tài)序列,其中si對(duì)應(yīng)狀態(tài)模組中的一個(gè)模式。
狀態(tài)轉(zhuǎn)移矩陣A=(aij)N×N是狀態(tài)概率轉(zhuǎn)移矩陣,表示狀態(tài)從si變動(dòng)到sj的概率,即aij=P(Xt+1=sj|Xt=si),其中:1≤i, j≤N,∑Nj=1aij=1。
π=(π1,π2,…,πN)是初始狀態(tài)概率矢量。
V=(v1,v2,…,vM)為不同的觀測(cè),M為觀測(cè)數(shù)。
B=(bj(vk))N×M表示狀態(tài)為j時(shí)觀測(cè)值的觀測(cè)分布條件概率矩陣,其中:1≤j≤N, 1≤k≤M,bj(vk)≥0,∑Mk=1bj(vk)=1。
考慮到分類結(jié)果各部分比例的均衡性,本文將持卡消費(fèi)者按人均消費(fèi)頻次劃分為以下四種類型:1)低水平,指人均消費(fèi)頻次低于全體平均的25%;2)中低水平,指人均消費(fèi)頻次位于全體平均的25%~40%;3)中高水平,指人均消費(fèi)頻次位于全體平均的40%~85%;4)高水平,指人均消費(fèi)頻次高于全體平均的85%。四種狀態(tài)分別由四個(gè)層次分布構(gòu)成:
狀態(tài)a: Normal(μ1,σ21), μ1>0;
狀態(tài)b: Normal(μ2,σ22), μ2>μ1;
狀態(tài)c: Lognormal(μ3,σ23)], μ3>μ2;
狀態(tài)d: Lognormal(μ4,σ24)], μ3>μ4μ4>μ3。
狀態(tài)a至狀態(tài)d分別表示低消費(fèi)層、中消費(fèi)層、中高消費(fèi)層和高消費(fèi)層。根據(jù)中高消費(fèi)層的數(shù)據(jù)分布特點(diǎn),分別采用了對(duì)數(shù)正態(tài)分布進(jìn)行結(jié)構(gòu)描述。四個(gè)狀態(tài)之間可以相互轉(zhuǎn)移,如圖3所示。
1.2.2基于隱馬氏鏈的預(yù)測(cè)及參數(shù)估計(jì)
其中:γ1(i)是初始t=1處狀態(tài)的期望頻率;ij的分子指狀態(tài)i轉(zhuǎn)移到狀態(tài)j的期望步數(shù),ij的分母指狀態(tài)i出發(fā)的期望轉(zhuǎn)移數(shù);b^j(k)的分子指在狀態(tài)j觀察到vk的期望時(shí)間,b^j(k)的分母指狀態(tài)i出發(fā)的期望行程。
2實(shí)驗(yàn)結(jié)果與分析
2.1實(shí)驗(yàn)數(shù)據(jù)
實(shí)驗(yàn)分析所用數(shù)據(jù)取自國(guó)內(nèi)某大型銀行13821名持卡用戶自2012年6月到2015年6月連續(xù)36個(gè)月月消費(fèi)行為數(shù)據(jù)。在此需要關(guān)注每個(gè)用戶消費(fèi)價(jià)值的序列變化。將數(shù)據(jù)按照序列比例拆分成兩部分,其中:9417筆作為訓(xùn)練數(shù)據(jù),4404筆作為測(cè)試數(shù)據(jù)。
2.2實(shí)驗(yàn)分析
首先,在同一筆消費(fèi)數(shù)據(jù)上,對(duì)三種不同的狀態(tài)聚類方式和三種序列聚類的方式進(jìn)行組合實(shí)驗(yàn),即分別測(cè)試RFM層次聚類、k均值聚類(k=6)和懲罰項(xiàng)的狀態(tài)聚類各自與無(wú)序列聚類、有序列聚類傳統(tǒng)馬爾可夫鏈[17]和隱馬爾可夫鏈(采用KL距離定義類間距離)進(jìn)行組合的效果,以預(yù)測(cè)精度為評(píng)價(jià)標(biāo)準(zhǔn),得到表31。
從表31可以看出,RFM層次聚類和k均值聚類的結(jié)果沒(méi)有明顯的差異;而帶懲罰項(xiàng)的聚類能很好地改善預(yù)測(cè)精度,這說(shuō)明對(duì)于個(gè)體消費(fèi)行為數(shù)據(jù),弱化異常數(shù)據(jù)得到平衡聚類對(duì)把握消費(fèi)者主體特征有顯著影響。有序列聚類的隱馬爾可夫鏈相對(duì)于無(wú)序列聚類預(yù)測(cè)精度提高了20%,相對(duì)于有序列聚類傳統(tǒng)馬爾可夫鏈預(yù)測(cè)精度提高了13%,充分說(shuō)明把握用戶的消費(fèi)習(xí)慣對(duì)于決定消費(fèi)者未來(lái)的消費(fèi)狀態(tài)的重要性,隱馬爾可夫鏈不直接對(duì)連續(xù)數(shù)據(jù)狀態(tài)化,而是通過(guò)時(shí)間序列擬合對(duì)狀態(tài)進(jìn)行劃分,對(duì)傳統(tǒng)馬爾可夫的結(jié)果起到平滑作用。
另外,在訓(xùn)練數(shù)據(jù)分析中產(chǎn)生了狀態(tài)數(shù)為4的合理聚類,即每個(gè)序列組由4狀態(tài)隱馬爾可夫鏈構(gòu)成,因此,時(shí)間跨度中雖然
居民消費(fèi)價(jià)格指數(shù)(Consumer Price Index, CPI)有先增后降的特點(diǎn);但該數(shù)據(jù)中消費(fèi)頻數(shù)的總體結(jié)構(gòu)沒(méi)有受到階段性影響,所以直接對(duì)36個(gè)月數(shù)據(jù)建立模型,得到轉(zhuǎn)移矩陣如表42所示。
表42的數(shù)據(jù)表明了以下幾個(gè)消費(fèi)特點(diǎn):
1)持卡消費(fèi)者刷卡行為受到序列模式的影響,不同的消費(fèi)習(xí)慣即不同的消費(fèi)序列模式下,消費(fèi)行為的轉(zhuǎn)移矩陣大不相同。不同的序列模式下,隱馬爾可夫鏈的狀態(tài)轉(zhuǎn)移存在很大差異。
2)不同序列模式對(duì)于消費(fèi)行為狀態(tài)轉(zhuǎn)移所起的作用各不相同。由序列比例構(gòu)成來(lái)看,數(shù)據(jù)中以記憶型消費(fèi)者(A5)和增長(zhǎng)成長(zhǎng)型消費(fèi)者(A1)為主,二者占數(shù)據(jù)比例約為71.8%,其中記憶型占47.8%,增長(zhǎng)成長(zhǎng)型消費(fèi)者占24%,記憶型中高層占訓(xùn)練比23%,這充分說(shuō)明分析人群的主流特點(diǎn)是行為保持型和消費(fèi)增長(zhǎng)成長(zhǎng)型用戶,該銀行的整體服務(wù)得到了大部分持卡用戶的認(rèn)同,高端消費(fèi)者呈增長(zhǎng)態(tài)勢(shì)。增長(zhǎng)成長(zhǎng)型用戶中出現(xiàn)了一個(gè)中高層吸收態(tài),占訓(xùn)練數(shù)據(jù)的20%,這些人群直接從低層直接轉(zhuǎn)變?yōu)橹懈邔酉M(fèi)者,充分反映了該銀行對(duì)消費(fèi)者的強(qiáng)大吸引作用。
3)跳躍型消費(fèi)者(A4)占數(shù)據(jù)比為15%左右,觀察發(fā)現(xiàn)消費(fèi)行為向上或向下轉(zhuǎn)移的概率主要在低層、中高層和高層之間,轉(zhuǎn)移的可能性存在差異。對(duì)于一個(gè)低層次消費(fèi)者,他轉(zhuǎn)向中高層次的可能性為35%,而對(duì)于高層次的消費(fèi)者,直接轉(zhuǎn)向低層次的可能性只有12%,但更傾向于轉(zhuǎn)向中高層次。這說(shuō)明對(duì)活躍用戶而言,存在向下轉(zhuǎn)移緩慢現(xiàn)象,這說(shuō)明多次呈現(xiàn)高層次消費(fèi)用戶更傾向于保持高端水平。
4)U型用戶(A6)占1.0%,中高層消費(fèi)者在中高和高層之間有23%可能性得到保持(19%保持中高消費(fèi),4%轉(zhuǎn)向高消費(fèi)),顯示出這部分消費(fèi)者理性選擇高端消費(fèi)的潛力。
5)8.7%消費(fèi)者呈現(xiàn)消費(fèi)持續(xù)下降(A2)和3.5%消費(fèi)者呈現(xiàn)消費(fèi)階段性下降態(tài)勢(shì)(A3),從高層下降到中高水平有35%的保持;但從中高水平向下轉(zhuǎn)移的可能性都超過(guò)60%,這體現(xiàn)了消費(fèi)者在猶豫中作出隱退的選擇。
注意:當(dāng)進(jìn)行懲罰聚類時(shí),分散點(diǎn)的個(gè)數(shù)會(huì)影響到最優(yōu)聚類數(shù),一般來(lái)說(shuō),分散點(diǎn)越多,最優(yōu)聚類數(shù)相對(duì)減少,但過(guò)少的聚類會(huì)對(duì)大樣本數(shù)據(jù)有一定程度的影響,因此,在懲罰聚類時(shí),不宜采用過(guò)高的懲罰數(shù)值,將區(qū)域類型劃分為四類比較合適。當(dāng)研究范圍擴(kuò)大或空間尺度變小時(shí),可以考慮劃分更多的區(qū)域類型。
3結(jié)語(yǔ)
本文主要探討了持卡消費(fèi)行為預(yù)測(cè)模型的建立與應(yīng)用,提出基于二次聚類和隱馬爾可夫鏈理論的個(gè)體消費(fèi)行為預(yù)測(cè)方法,該方法將個(gè)體消費(fèi)行為進(jìn)行序列模式聚類;接著,引入懲罰聚類弱化異常值對(duì)各序列模式中的層次狀態(tài)進(jìn)行平衡劃分;最后,基于隱馬爾可夫鏈估計(jì)序列中消費(fèi)層次的狀態(tài)轉(zhuǎn)移。對(duì)國(guó)內(nèi)某大型銀行36個(gè)月的消費(fèi)數(shù)據(jù)分別采用傳統(tǒng)聚類、無(wú)懲罰序列聚類和帶懲罰項(xiàng)的聚類進(jìn)行了分析比較,結(jié)果表明提出的基于二次聚類和隱馬氏鏈的方法更適用于消費(fèi)者行為預(yù)測(cè)模型。
參考文獻(xiàn):
[1]
譚濤, 張燕媛, 唐若迪, 等. 中國(guó)農(nóng)村居民家庭消費(fèi)架構(gòu)分析:基于QUAIDS模型的兩階段一致估計(jì)[J]. 中國(guó)農(nóng)村經(jīng)濟(jì), 2014(9): 17-30.(TAN T, ZHANG Y Y, TANG R D, et al. The analysis of consume of Chinese rural family: the twostep consistency estimation based on QUAIDS model[J]. Chinese Rural Economy, 2014(9): 17-30.)
[2]
郭愛(ài)君, 武國(guó)榮. 基于AIDS模型的我國(guó)農(nóng)村居民消費(fèi)結(jié)構(gòu)的動(dòng)態(tài)分析[J]. 人口與經(jīng)濟(jì), 2008(2): 34-38.(GUO A J, WU G R. A adynamic analysis of Chinas rural residents consumption structure based on AIDS model[J]. Population & Economics, 2008(2): 34-38.)
[3]
HUGHES A M. Strategic Database Marketing[M]. Chicago, IL: Probus Publishing Company, 1994: 75-80.
Publisher: McGraw-Hill; 2 edition (May 16, 2000)
[4]
HUGHES A M. Boosting response with RFM[J]. American Demographics, 1996, 3(3): 4-9.
[5]
鄧鑫洋, 鄧勇, 章雅娟, 等. 一種信度馬爾科夫鏈模型及應(yīng)用[J]. 自動(dòng)化學(xué)報(bào), 2012, 38(4): 666-672.(DENG X Y, DENG Y, ZHANG Y J, et al. A belief Markov model and its application[J]. Acta Automatica Sinica, 2012, 38(4): 666-672.).
[6]
易錦, 羅峋, 凹建勛, 等. 基于馬爾科夫鏈的軟件故障分類預(yù)測(cè)模型[J]. 中國(guó)科學(xué)院大學(xué)學(xué)報(bào), 2013, 30(4): 562-567.(YI J, LUO X, AO J X, et al. Software fault classification prediction model based on Markov chain[J]. Journal of University of Chinese Academy of Sciences, 2013, 30(4): 562-567.)
[7]
PFEIFER P E, CARRAWAY R L. Modeling customer relationships as Markov chains[J]. Journal of Interactive Marketing, 2000, 14(2): 43-55.
[8]
BAUM L E, PETRIE T. Statistical inference for probabilistic function of finite state Markov chains[J]. Annals of Mathematical Statistics, 1966, 37(6): 1554-1563.
[9]
蔡文學(xué), 邱珠成, 黃曉宇, 等. 基于WiFi指紋的室內(nèi)軌跡定位模型[J]. 計(jì)算機(jī)工程, 2015, 41(6): 76-82.(CAI W X, QIU Z C, HUANG X Y, et al. Indoor track positioning model based on WiFi fingerprint[J]. Computer Engineering, 2015, 41(6): 76-82.)
[10]
朱旭東, 劉志鏡. 基于主題隱馬爾科夫模型的人體異常行為識(shí)別[J]. 計(jì)算機(jī)科學(xué), 2012, 39(3): 251-259.(ZHU X D, LIU Z J. Human abnormal behavior recognition based on topic hidden Markov model[J]. Computer Science, 2012, 39(3): 251-259.)
[11]
CHOO K H, TONG J C, ZHANG L. Recent applications of hidden Markov models in computational biology[J]. Genomics, Proteomics and Bioinformatics, 2004, 2(2): 84-96.
[12]
HARTIGAN J A, WONG M A. Kmeans clustering algorithm [J]. Applied Statistics, 2013, 28(1): 100-108.
[13]
DEMPSTER A P, LAIRD N M, RUBIN D B. Maximum likelihood from incomplete data via the EM algorithm[J]. Journal of the Royal Statistical Society, Series B (Methodological), 1977, 39(1): 1-38.
[14]
TSENG G C. Penalized and weighted kmeans for clustering with scattered objects and prior information in highthroughput biological data [J]. Bioinformatics, 2007, 23(17): 2247-2255.
[15]
劉建偉, 崔立鵬, 劉澤宇, 等. 正則化稀疏模型[J]. 計(jì)算機(jī)學(xué)報(bào), 2015, 38(7): 1307-1322.(LIU J W, CUI L P, LIU Z Y, et al. Survey on the regularized sparse models[J]. Chinese Journal of Computers, 2015, 38(7): 1307-1322.)
[16]
ROBERTSON A W, KIRSHNER S, SMYTH P. Hidden Markov models for modeling daily rainfall occurrence over Brazil, Technical Report UCIICS 0327[R]. Irvine, CA: University of California, Department of Information and Computer Science, 2003: 29-56.
http://www.datalab.uci.edu/papers/tr0327_color.pdf
[17]
PORIKLI F. Clustering variable length sequences by eigenvector decomposition using HMM[C]// SSPR 2004 and SPR 2004: Proceedings of the 2004 Joint IAPR International Workshops on Structural, Syntactic, and Statistical Pattern Recognition, LNCS 3138. Berlin: Springer, 2004: 352-360.
[18]
劉健, 吳翊, 譚璐. 對(duì)bootstrap方法的自助抽樣的改進(jìn)[J]. 數(shù)學(xué)理論與應(yīng)用, 2006, 26(1): 69-72.(LIU J, WU Y, TAN L. An improvement to the resampling procedure of Bootstrap method[J]. Mathematical Theory and Applications, 2006, 26(1): 69-72.)