• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于聚類算法的購(gòu)物籃壓縮研究

      2018-01-23 07:14:16張文斌褚維偉黃哲學(xué)
      關(guān)鍵詞:聚類算法分析

      張文斌,明 勇,褚維偉,黃哲學(xué)

      (深圳大學(xué),廣東 深圳 518000)

      0 引 言

      購(gòu)物籃分析對(duì)零售業(yè)是非常重要的技術(shù)分析,尤其近年來(lái)網(wǎng)絡(luò)零售的突飛猛進(jìn),產(chǎn)生了海量的交易數(shù)據(jù),從而對(duì)購(gòu)物籃分析提出了更高的要求。購(gòu)物籃分析可以為超市和網(wǎng)絡(luò)商城中的各種促銷提供參考,去庫(kù)存,商品布局優(yōu)化。購(gòu)物籃分析能為決策者提供快速、準(zhǔn)確、節(jié)約、多元的信息參考。提高零售產(chǎn)業(yè)綜合效益、提高國(guó)際競(jìng)爭(zhēng)力、建設(shè)節(jié)約型社會(huì)購(gòu)物籃分析都有重要的宏觀意義[1]。

      但是在傳統(tǒng)的購(gòu)物籃分析中,得出的結(jié)果通常是一些常規(guī)商品的組合。這些組合的購(gòu)物籃支持度很高,但是它們已經(jīng)被大家所認(rèn)知,對(duì)企業(yè)的價(jià)值和意義不大。此外,傳統(tǒng)購(gòu)物籃分析一個(gè)很大的局限性在于它并不能預(yù)測(cè),通常只對(duì)歷史數(shù)據(jù)進(jìn)行分析,而不是對(duì)購(gòu)物籃按時(shí)間的序列做出演化和預(yù)測(cè)。往往精準(zhǔn)的預(yù)測(cè)能給企業(yè)帶來(lái)很大的利益,也能提高對(duì)風(fēng)險(xiǎn)的控制。還有,傳統(tǒng)的購(gòu)物籃分析只給出比較簡(jiǎn)單的結(jié)果,沒(méi)有實(shí)現(xiàn)數(shù)據(jù)可視化。一幅圖勝過(guò)千言萬(wàn)語(yǔ),人類對(duì)外界過(guò)多的信息約有80%以上來(lái)自于視覺(jué)系統(tǒng),當(dāng)大數(shù)據(jù)以直觀可視化的圖形形式展示在分析者面前時(shí),分析者往往能夠一眼洞悉數(shù)據(jù)背后隱藏的信息并轉(zhuǎn)化為知識(shí)以及智慧。購(gòu)物籃可視化結(jié)果實(shí)現(xiàn)友好人機(jī)交互界面就需要研究數(shù)據(jù)可視化,同時(shí),大數(shù)據(jù)本身的新特點(diǎn)也對(duì)可視化提出了更為迫切的需求。

      針對(duì)購(gòu)物籃分析的現(xiàn)狀,結(jié)合企業(yè)實(shí)際應(yīng)用中的需求,在購(gòu)物籃壓縮研究分析的基礎(chǔ)上,設(shè)計(jì)并建立了購(gòu)物籃可視化系統(tǒng)。其中,通過(guò)購(gòu)物籃壓縮來(lái)壓縮并篩選更有價(jià)值的購(gòu)物籃,購(gòu)物籃可視化讓購(gòu)物籃分析結(jié)果實(shí)現(xiàn)友好的人機(jī)交互界面及可視化[2]。

      1 購(gòu)物籃重組分析

      通常說(shuō)的購(gòu)物籃分析指的是通過(guò)購(gòu)物籃中顯示出來(lái)的交易信息來(lái)分析顧客的購(gòu)買行為,顧客在購(gòu)買商品的過(guò)程中通常會(huì)一次購(gòu)買多個(gè)商品,從而使得這些商品之間具有很強(qiáng)的關(guān)聯(lián)性。因此,可以認(rèn)為顧客的購(gòu)買行為是一種整體的行為,是否購(gòu)買一件商品會(huì)影響到其他商品的購(gòu)買,從而影響到每個(gè)購(gòu)物籃的利潤(rùn)。所以,購(gòu)物籃分析的目標(biāo)就是找出重要且有價(jià)值的購(gòu)物籃[3]。

      關(guān)聯(lián)規(guī)則挖掘是購(gòu)物籃數(shù)據(jù)挖掘最經(jīng)典的應(yīng)用之一,用來(lái)從大量的數(shù)據(jù)中挖掘出一些令人感興趣的規(guī)則,分析產(chǎn)品之間的關(guān)聯(lián)性,從而指導(dǎo)人們做出一些有利的決策和安排。例如在超市中將啤酒和尿布放在一起會(huì)增加啤酒的銷量等。

      關(guān)聯(lián)規(guī)則挖掘問(wèn)題最早是在1993年由AGRAWAL等提出的,主要是為了幫助零售企業(yè)分析交易數(shù)據(jù),對(duì)一些商業(yè)決策提供支持,如怎樣制定促銷方案,怎樣擺放商品來(lái)提升銷售業(yè)績(jī),怎樣決定供貨數(shù)量來(lái)減少庫(kù)存,等等。他們認(rèn)為,關(guān)聯(lián)規(guī)則挖掘問(wèn)題主要通過(guò)兩部分來(lái)解決,即先挖掘出大項(xiàng)集集合,再?gòu)拇箜?xiàng)集集合中挖掘出關(guān)聯(lián)規(guī)則。同時(shí)提出了語(yǔ)法約束和支持度約束的概念,并且提出了AIS算法來(lái)生成大項(xiàng)集集合[4]。

      關(guān)聯(lián)規(guī)則挖掘問(wèn)題可以表述為:設(shè)I=[i1,i2,…,in]是所有項(xiàng)目的集合,即所有商品類別的集合;D=[T1,T2,…,Tn]是所有事務(wù)的集合,即所有交易記錄的集合。事務(wù)T可以表示為:T=[TID,],其中TID是事務(wù)T在D中的唯一標(biāo)識(shí),i1,i2,…,in?I(1≤n≤m)是事務(wù)T的項(xiàng)目集合。一個(gè)關(guān)聯(lián)規(guī)則表示為:X→Y,其中X?I,Y?I且X∩Y=?。X和Y都是項(xiàng)目的集合,稱之為項(xiàng)集。設(shè)X是一個(gè)項(xiàng)集,那么當(dāng)且僅當(dāng)X?T時(shí),事務(wù)T包含項(xiàng)目集X。支持度和置信度都是表示關(guān)聯(lián)規(guī)則強(qiáng)度的最常用的指標(biāo)[5]。

      2 購(gòu)物籃聚類分析

      2.1 購(gòu)物籃聚類的意義

      購(gòu)物籃分析在實(shí)際場(chǎng)景中應(yīng)用時(shí)往往得出的是數(shù)以千計(jì)的購(gòu)物籃,企業(yè)很難從這數(shù)量繁多的購(gòu)物籃中找出真正感興趣的、對(duì)自己有價(jià)值的部分。購(gòu)物籃分析中最經(jīng)典的案例莫過(guò)于“啤酒和尿布”了,可是這之后就很少有類似的購(gòu)物籃分析結(jié)果了。購(gòu)物籃數(shù)量的問(wèn)題給購(gòu)物籃分析的應(yīng)用造成了很大的阻礙。為了解決這個(gè)問(wèn)題,自然而然就會(huì)想到去壓縮這些數(shù)量龐大的購(gòu)物籃,例如,用一種簡(jiǎn)潔的表達(dá)來(lái)描述一類購(gòu)物籃。對(duì)購(gòu)物籃通過(guò)聚類進(jìn)行壓縮,再?gòu)木垲惤Y(jié)果中找出代表性的購(gòu)物籃,從而大大減少購(gòu)物籃數(shù)量[5]。

      2.2 購(gòu)物籃聚類算法

      K-Means算法是基于劃分的聚類算法,簡(jiǎn)潔易懂且有較高的效率,因此應(yīng)用十分廣泛。用戶給定一個(gè)期望得到的聚類數(shù)k,K-Means算法就可以通過(guò)某種距離函數(shù)反復(fù)地把數(shù)據(jù)集中的點(diǎn)分到這k個(gè)類中,直到滿足某個(gè)終止條件。

      設(shè)數(shù)據(jù)點(diǎn)的集合為X=[x1,x2,…,xn],其中xi=[xi1,xi2,…,xir]為r維向量,K-Means算法將把給定的數(shù)據(jù)集劃分成r類,每個(gè)類有一個(gè)聚類中心。聚類中心為這個(gè)類中所有點(diǎn)的均值,通常用聚類中心來(lái)表示這個(gè)類。K-Means聚類算法描述如下:

      輸入:數(shù)據(jù)集D,聚類個(gè)數(shù)k

      輸出:k個(gè)類

      步驟:

      選擇k個(gè)數(shù)據(jù)點(diǎn)作為原始聚類中心

      repeat

      for each data pointx?Ddo

      compute the distance fromxto each centroid

      計(jì)算x到每個(gè)聚類中心點(diǎn)的距離

      assignxto the closest centroid //將x分配到距離最近的類中

      endfor

      re-compute the centroid //重新計(jì)算每個(gè)類中的聚類中心點(diǎn)

      until the stopping criterion is met

      首先從數(shù)據(jù)集中隨機(jī)抽取k個(gè)點(diǎn)作為原始聚類中心,然后計(jì)算每個(gè)數(shù)據(jù)點(diǎn)到這k個(gè)聚類中心的距離,并根據(jù)這個(gè)距離值將每個(gè)數(shù)據(jù)點(diǎn)分到最近的聚類中心,當(dāng)分配完所有的數(shù)據(jù)點(diǎn)之后,重新計(jì)算每個(gè)類中的聚類中心。不斷重復(fù)這一過(guò)程直到滿足某個(gè)終止條件。終止條件為以下三個(gè)中的任何一個(gè):

      (1)沒(méi)有(或最小數(shù)目)數(shù)據(jù)點(diǎn)被重新分配給不同的類;

      (2)沒(méi)有(或最小數(shù)目)聚類中心發(fā)生變化;

      (3)誤差平方和局部最小。

      (1)

      均值為使得簇的誤差平方和最小的質(zhì)心,即:

      (2)

      其中,k為用戶設(shè)定的聚類簇個(gè)數(shù);x為對(duì)象;Ci為第i個(gè)簇;ci為第i個(gè)簇的質(zhì)心;dist(x,ci)為數(shù)據(jù)點(diǎn)x到簇中心ci的距離;mi為第i個(gè)簇中包含的數(shù)據(jù)點(diǎn)個(gè)數(shù)。

      證明過(guò)程如下:

      對(duì)于一維數(shù)據(jù),式(1)可以寫成:

      (3)

      其中,Ci表示第i個(gè)簇;x表示Ci中的點(diǎn);ci表示簇Ci的均值。

      然后求解第k個(gè)質(zhì)心ck,最小化式(3),也就是對(duì)SSE求偏導(dǎo)數(shù),令偏導(dǎo)數(shù)為0,再求解ck。

      (4)

      (5)

      因此,簇中各點(diǎn)的均值是簇的最小化誤差平方和的最優(yōu)質(zhì)心。

      K-Means算法雖然簡(jiǎn)潔易懂、效率較高,但是實(shí)際應(yīng)用中也有很多不足之處。這里運(yùn)用K-Means算法進(jìn)行購(gòu)物籃聚類存在的問(wèn)題主要為用戶需要指定聚類數(shù)目k,這個(gè)k值的選定是非常難以估計(jì)的。很多時(shí)候,事先并不知道給定的數(shù)據(jù)集應(yīng)該分成多少個(gè)類別才最合適。若k值設(shè)置過(guò)大,會(huì)導(dǎo)致聚類數(shù)目過(guò)多,達(dá)不到壓縮購(gòu)物籃集合的目的;若k值設(shè)置過(guò)小,會(huì)導(dǎo)致聚類結(jié)果過(guò)于粗糙,不夠準(zhǔn)確[6-7]。

      3 購(gòu)物籃壓縮方法

      購(gòu)物籃集合壓縮方法與代表模式方法類似,也是通過(guò)聚類實(shí)現(xiàn)的。不同的是,聚類的對(duì)象不再是購(gòu)物籃表達(dá)式本身,而是由一系列特征屬性表示的購(gòu)物籃[8]。

      3.1 數(shù)據(jù)預(yù)處理及屬性構(gòu)造

      在數(shù)據(jù)挖掘的整體過(guò)程中,海量的原始數(shù)據(jù)中存在著大量雜亂的、重復(fù)的、不完整的數(shù)據(jù),嚴(yán)重影響了數(shù)據(jù)挖掘算法的執(zhí)行效率,甚至可能導(dǎo)致挖掘結(jié)果的偏差[9]。為此,在數(shù)據(jù)挖掘算法執(zhí)行之前,必須對(duì)收集的原始數(shù)據(jù)進(jìn)行預(yù)處理,以改進(jìn)數(shù)據(jù)的質(zhì)量,提高數(shù)據(jù)挖掘過(guò)程的效率、精度和性能。數(shù)據(jù)預(yù)處理主要包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)交換與數(shù)據(jù)歸約等[10]。

      數(shù)據(jù)預(yù)處理可以補(bǔ)全殘缺的數(shù)據(jù),糾正錯(cuò)誤的數(shù)據(jù),刪除多余的數(shù)據(jù),篩選出所需的數(shù)據(jù)并進(jìn)行數(shù)據(jù)的集成操作,轉(zhuǎn)化數(shù)據(jù)為需要的格式,從而實(shí)現(xiàn)數(shù)據(jù)類型的相同化、數(shù)據(jù)格式的一致化、數(shù)據(jù)信息的精練化以及數(shù)據(jù)存儲(chǔ)的集中化[11]。通過(guò)數(shù)據(jù)預(yù)處理后,可以得到數(shù)據(jù)挖掘所需要的數(shù)據(jù)集,從而使數(shù)據(jù)挖掘具有可行性;同時(shí)也可以在一定程度上減少進(jìn)行挖掘所需付出的代價(jià),提高挖掘結(jié)果的可理解性與有效性[12]。

      為了對(duì)上面得出的購(gòu)物籃進(jìn)行聚類以達(dá)到壓縮購(gòu)物籃集合的目的,首先對(duì)購(gòu)物籃進(jìn)行屬性構(gòu)造。通過(guò)對(duì)交易數(shù)據(jù)的仔細(xì)分析與深入理解,首先對(duì)每個(gè)購(gòu)物籃構(gòu)造了13個(gè)屬性。

      另一方面,有的購(gòu)物籃具有較強(qiáng)的時(shí)間特征,會(huì)受到季節(jié)、節(jié)假日等時(shí)間因素的影響?;诖?,將用于產(chǎn)生購(gòu)物籃的原始交易數(shù)據(jù)按月分割,計(jì)算每個(gè)購(gòu)物籃在每個(gè)月中這13個(gè)屬性的值。這樣得到的購(gòu)物籃屬性就形成了一個(gè)12個(gè)月的時(shí)間序列,其中每個(gè)月都有13個(gè)屬性,最后每個(gè)購(gòu)物籃共有156個(gè)屬性。在構(gòu)造完這些屬性之后,發(fā)現(xiàn)像支持度和銷售額占比這些屬性值都非常小。而在聚類的過(guò)程中,如果屬性值太小,在計(jì)算距離時(shí)權(quán)重就很小,近似為0,對(duì)聚類結(jié)果影響較大。因此,在聚類之前還要進(jìn)行屬性值的正規(guī)化操作,將所有屬性值都映射到[0,1]區(qū)間[13]。

      3.2 購(gòu)物籃壓縮算法

      針對(duì)K-Means算法應(yīng)用在購(gòu)物籃集合壓縮中的不足之處,結(jié)合基于劃分和基于層次的聚類方法,提出一種基于K-Means的層次聚類算法。算法詳細(xì)描述如下:

      (1)將原始數(shù)據(jù)集D用K-Means()算法分裂成k個(gè)子聚類;

      (2)分別對(duì)上一次聚類產(chǎn)生的所有子聚類運(yùn)行K-Means()算法;

      (3)重復(fù)第2步,直到滿足終止條件。

      算法的主要思想是自上而下的分裂聚類。聚類過(guò)程從整個(gè)數(shù)據(jù)集的聚類(根)開(kāi)始,根據(jù)用戶指定的k值,運(yùn)用K-Means算法將根節(jié)點(diǎn)聚類分裂成k個(gè)子聚類。每個(gè)子聚類再遞歸地繼續(xù)往下分裂直到滿足某個(gè)終止條件。終止條件為以下任何一個(gè):

      (1)所有的葉節(jié)點(diǎn)中數(shù)據(jù)點(diǎn)的個(gè)數(shù)都小于k;

      (2)沒(méi)有葉子節(jié)點(diǎn)再分裂成子聚類。

      圖1為聚類結(jié)果示例,聚類結(jié)果為一棵聚類樹(shù)。樹(shù)的葉子節(jié)點(diǎn)有5個(gè)聚類(5個(gè)數(shù)據(jù)點(diǎn)),在上一層中,聚類4包含葉子節(jié)點(diǎn)5和6,聚類3包含葉子節(jié)點(diǎn)8和9。用到的結(jié)果只需要最底層的葉子節(jié)點(diǎn)的聚類信息,即5和6為一個(gè)聚類,7為一個(gè)聚類,8和9為一個(gè)聚類[14]。

      圖1 聚類結(jié)果示例

      通過(guò)上文所述的聚類方法,將購(gòu)物籃集合劃分成n個(gè)聚類。接下來(lái)從每個(gè)聚類中找出一個(gè)購(gòu)物籃來(lái)表示這個(gè)聚類中的所有購(gòu)物籃,這樣就將原始的購(gòu)物籃集合壓縮成n個(gè)購(gòu)物籃。在每個(gè)聚類中,根據(jù)購(gòu)物籃中商品出現(xiàn)的頻次來(lái)構(gòu)造代表購(gòu)物籃。

      4 實(shí)驗(yàn)結(jié)果分析

      為了檢驗(yàn)購(gòu)物籃聚類方法在實(shí)際應(yīng)用中的效果,采用購(gòu)物籃集合作為輸入數(shù)據(jù)對(duì)效果和性能進(jìn)行驗(yàn)證。輸入數(shù)據(jù)為500個(gè)購(gòu)物籃,并按3.1的方法進(jìn)行了數(shù)據(jù)預(yù)處理和屬性構(gòu)造,這樣每個(gè)購(gòu)物籃為一個(gè)聚類對(duì)象,有156個(gè)特征屬性。通過(guò)文中提出的購(gòu)物籃聚類方法,將500個(gè)購(gòu)物籃劃分成了50個(gè)類,在每個(gè)類中找出一個(gè)代表購(gòu)物籃,從而實(shí)現(xiàn)了購(gòu)物籃壓縮。下面首先對(duì)聚類效果進(jìn)行評(píng)估與分析。

      圖2為聚類結(jié)果中每個(gè)聚類中的點(diǎn)到聚類中心的距離分布圖,用來(lái)評(píng)估聚類結(jié)果中的類內(nèi)是否緊密。

      從圖中可以看出,聚類中點(diǎn)到聚類中心的距離主要集中分布在0.05到0.2之間,其中距離在0.1至0.15之間點(diǎn)的占比達(dá)到50%以上。圖1表明聚類結(jié)果中每個(gè)聚類比較緊湊,聚類效果較好,達(dá)到了使相同類中樣本盡可能相似的目的。

      采用雷達(dá)圖的形式來(lái)對(duì)比購(gòu)物籃聚類前后的差別。圖3為購(gòu)物籃聚類之前的購(gòu)物籃數(shù)據(jù)雷達(dá)圖,這里考慮到購(gòu)物籃在不同月份的表現(xiàn)具有較大差異,將購(gòu)物籃屬性按月劃分,由每個(gè)月的購(gòu)物籃數(shù)據(jù)得到一張雷達(dá)圖。其中每個(gè)月份的雷達(dá)圖有13個(gè)頂點(diǎn),代表3.1中構(gòu)造的13個(gè)基本屬性,通過(guò)觀察每個(gè)雷達(dá)圖的形狀就可以判斷購(gòu)物籃的分布情況。如果雷達(dá)圖中購(gòu)物籃的軌跡比較雜亂、分散,則說(shuō)明購(gòu)物籃集合差異性較大。反之,如果雷達(dá)圖中購(gòu)物籃形成的軌跡具有明顯的相似性,則說(shuō)明這些購(gòu)物籃具有很強(qiáng)的共性。由圖3可以看出,購(gòu)物籃聚類前較為分散,沒(méi)有什么規(guī)律性。

      圖4為聚類結(jié)果中聚類中心點(diǎn)間距離分布直方圖,用來(lái)評(píng)估聚類結(jié)果中類間是否遠(yuǎn)離。由圖中可以看出,聚類中心點(diǎn)間的距離主要分布在0.2至0.4之間,占比達(dá)到60%以上。而由圖2可知,每個(gè)聚類中點(diǎn)到聚類中心的距離主要分布在0.05到0.2之間,對(duì)比實(shí)驗(yàn)結(jié)果可表明聚類結(jié)果中不同類間較為分散。

      圖4 聚類中心點(diǎn)間距離分布直方圖

      由以上兩個(gè)實(shí)驗(yàn),可以得出所提出的購(gòu)物籃聚類算法滿足類內(nèi)緊密、類間遠(yuǎn)離的聚類有效性評(píng)估標(biāo)準(zhǔn),有較好的聚類效果。

      (a)聚類1的購(gòu)物籃數(shù)據(jù)雷達(dá)圖

      (b)聚類2的購(gòu)物籃數(shù)據(jù)雷達(dá)圖

      在實(shí)驗(yàn)得到的50個(gè)聚類中,選擇兩個(gè)作為購(gòu)物籃聚類結(jié)果示例。由圖5可以看出,每個(gè)聚類中的12張雷達(dá)圖形狀非常相似,每張雷達(dá)圖中的購(gòu)物籃軌跡也基本重疊,有明顯的相似性。通過(guò)對(duì)比可以看出,聚類后同一個(gè)類中的購(gòu)物籃具有較高的相似度,說(shuō)明提出的購(gòu)物籃聚類方法具有較好的聚類效果。

      下面對(duì)從聚類結(jié)果中選擇代表購(gòu)物籃進(jìn)行評(píng)估與分析,以代表購(gòu)物籃中的商品在類中出現(xiàn)的頻次占比作為評(píng)估代表購(gòu)物籃的標(biāo)準(zhǔn),顯然占比越高則說(shuō)明選擇的購(gòu)物籃越有代表性。圖6為代表購(gòu)物籃中商品在類中出現(xiàn)的頻次占比分布直方圖。

      圖6 代表購(gòu)物籃中商品在類中出現(xiàn)的頻次占比

      由圖6可以看出,這一占比值普遍較高,都在50%以上,主要分布在60%至80%之間,表明所采用方法具有較高的有效性與實(shí)用價(jià)值。

      根據(jù)算法描述以及實(shí)驗(yàn)結(jié)果,可以總結(jié)出文中提出的購(gòu)物籃壓縮方法具有以下優(yōu)點(diǎn):

      (1)結(jié)合基于劃分和基于層次的聚類方法,提出基于K-Means的層次聚類算法。算法簡(jiǎn)單高效,不用人工輸入k值,避免了因k值設(shè)置不當(dāng)導(dǎo)致的聚類效果不理想。

      (2)根據(jù)聚類中商品出現(xiàn)的頻次來(lái)構(gòu)造代表購(gòu)物籃,保留了聚類中影響最大的商品,具有較高的代表性與有效性。

      5 結(jié)束語(yǔ)

      購(gòu)物籃數(shù)量過(guò)多是購(gòu)物籃分析在實(shí)際應(yīng)用中不可避免的問(wèn)題,而傳統(tǒng)的壓縮方法中關(guān)注的對(duì)象都是購(gòu)物籃表達(dá)式本身,效果并不是很理想。文中提出的購(gòu)物籃壓縮方法為每個(gè)購(gòu)物籃構(gòu)造了具有時(shí)間序列特征的屬性,然后根據(jù)這些屬性值對(duì)購(gòu)物籃進(jìn)行聚類,再?gòu)木垲惤Y(jié)果中挑選出代表購(gòu)物籃,從而達(dá)到了壓縮購(gòu)物籃集合的效果。

      [1] 余 穎.購(gòu)物籃分析在網(wǎng)絡(luò)零售業(yè)中的應(yīng)用研究[D].天津:天津大學(xué),2007.

      [2] 褚維偉,張文斌,陳小軍,等.一種帶約束條件的購(gòu)物籃分析方法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2016,26(8):69-74.

      [3] DIPPOLD K,HRUSCHKA H.Variable selection for market basket analysis[J].Computational Statistics,2013,28(2):519-539.

      [4] 黃 鶴.關(guān)聯(lián)規(guī)則算法綜述[J].軟件導(dǎo)刊,2009,8(3):56-57.

      [5] 羅 芳.基于聚類和壓縮矩陣的加權(quán)關(guān)聯(lián)規(guī)則算法的研究與應(yīng)用[D].上海:華東師范大學(xué),2010.

      [6] 高 瀅,劉大有,齊 紅,等.一種半監(jiān)督K均值多關(guān)系數(shù)據(jù)聚類算法[J].軟件學(xué)報(bào),2008,19(11):2814-2821.

      [7] RUPALI S,SHAH T,CHAVAN T,et al.Survey on implementation of market basket analysis using Hadoop framework[J].International Journal of Computer Applications,2016,134(10):6-9.

      [8] SOLNET D,BOZTUG Y, DOLNICAR S. An untapped gold mine? Exploring the potential of market basket analysis to grow hotel revenue[J].International Journal of Hospitality Management,2016,56:119-125.

      [9] 張平庸,歐陽(yáng)為民,萬(wàn)志華.基于密度的購(gòu)物籃數(shù)據(jù)聚類方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2005,26(1):180-181.

      [10] CHEN Y L,TANG K,SHEN R J,et al.Market basket analysis in a multiple store environment[J].Decision Support Systems,2005,40(2):339-354.

      [12] KOCSOR A,KERTéSZ-FARKAS A,KAJN L,et al.Application of compression-based distance measures to protein sequence classification:a methodological study[J].Bioinformatics,2006,22(4):407-412.

      [13] 李雷定,馬鐵華,尤文斌.常用數(shù)據(jù)無(wú)損壓縮算法分析[J].電子設(shè)計(jì)工程,2009,17(1):49-50.

      [14] 彭喜元,俞 洋.基于變游程編碼的測(cè)試數(shù)據(jù)壓縮算法[J].電子學(xué)報(bào),2007,35(2):197-201.

      猜你喜歡
      聚類算法分析
      隱蔽失效適航要求符合性驗(yàn)證分析
      基于MapReduce的改進(jìn)Eclat算法
      Travellng thg World Full—time for Rree
      進(jìn)位加法的兩種算法
      電力系統(tǒng)不平衡分析
      電子制作(2018年18期)2018-11-14 01:48:24
      基于DBSACN聚類算法的XML文檔聚類
      電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
      一種改進(jìn)的整周模糊度去相關(guān)算法
      基于改進(jìn)的遺傳算法的模糊聚類算法
      一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
      威信县| 虹口区| 惠来县| 响水县| 蓬莱市| 桓台县| 浙江省| 屏东市| 射阳县| 通辽市| 石嘴山市| 平山县| 上栗县| 阿勒泰市| 新蔡县| 昆山市| 萍乡市| 波密县| 西城区| 建湖县| 凤冈县| 中西区| 黑河市| 高州市| 德令哈市| 郧西县| 镇坪县| 江安县| 永仁县| 普兰县| 海原县| 枣强县| 平泉县| 阿拉善右旗| 祁门县| 漠河县| 利津县| 囊谦县| 新巴尔虎左旗| 双辽市| 夹江县|