張 玨,陳 莉,田建學(xué)
(1.榆林學(xué)院 信息工程學(xué)院,陜西 榆林 719000;2.西北大學(xué) 信息科學(xué)與技術(shù)學(xué)院,陜西 西安 710000)
面向零售業(yè)的關(guān)聯(lián)規(guī)則挖掘的研究與實(shí)現(xiàn)
張 玨1,2,陳 莉2,田建學(xué)1
(1.榆林學(xué)院 信息工程學(xué)院,陜西 榆林 719000;2.西北大學(xué) 信息科學(xué)與技術(shù)學(xué)院,陜西 西安 710000)
隨著零售業(yè)在城市的快速發(fā)展,智能系統(tǒng)積累了大量的零售業(yè)原始數(shù)據(jù),急需一種技術(shù)來發(fā)現(xiàn)數(shù)據(jù)中蘊(yùn)含的內(nèi)在規(guī)則,為企業(yè)管理者提供決策支持。數(shù)據(jù)挖掘是目前一個(gè)重要的研究方向,可以把日常業(yè)務(wù)數(shù)據(jù)知識化。介紹了零售業(yè)商務(wù)智能系統(tǒng)的發(fā)展現(xiàn)狀,并通過分析零售業(yè)數(shù)據(jù)來掌握顧客的購買偏好,并同時(shí)對挖掘結(jié)果進(jìn)行說明,在一定程度上利用關(guān)聯(lián)規(guī)則技術(shù)解決現(xiàn)實(shí)中的商業(yè)問題。針對數(shù)量和利潤的因素,提出利用頻繁項(xiàng)目集尋找商品利潤最大化的銷售組合模型,零售商可以根據(jù)該模型輸出的銷售組合模型對商品進(jìn)行捆綁銷售,以獲得最大利潤。提出來競爭商品的概念,即找出隱含在數(shù)據(jù)庫中相互競爭商品的模型,這樣就得到了零售業(yè)商品推薦模型。實(shí)驗(yàn)結(jié)果表明,提出的模型能找出高交叉銷售利潤的商品,在零售業(yè)中有很好的實(shí)用性。
數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;零售業(yè)商務(wù)智能系統(tǒng);Apriori算法
隨著零售行業(yè)競爭的日益激烈,傳統(tǒng)的銷售模式已經(jīng)不能適應(yīng)當(dāng)前的形勢。超市作為日常生活中一種非常頻繁重要的零售購物方式,是目前商家爭奪的焦點(diǎn)。超市的經(jīng)營特征決定了超市的特點(diǎn):雇傭人員少、商品流量大、資金周轉(zhuǎn)快等?,F(xiàn)代社會市場變化快,顧客需求也漸漸趨向于個(gè)性化,零售業(yè)的競爭日趨激烈,超市要獲得更多的利潤、取得更好的銷售業(yè)績就需要最大限度地利用數(shù)據(jù)庫中的大量業(yè)務(wù)數(shù)據(jù)。這些數(shù)據(jù)對企業(yè)管理者來說意義重大、價(jià)值非凡,通過數(shù)理模式分析營銷過程中產(chǎn)生的大量數(shù)據(jù),劃分出不同類型的客戶或市場,并分析消費(fèi)者的偏好和行為,幫助商家保留老客戶,發(fā)展新客戶,提升客戶的滿意度。比如市場部需要實(shí)時(shí)獲得近兩年的銷售記錄,來向有潛在購買能力、購買意向的客戶宣傳自己的產(chǎn)品。傳統(tǒng)的信息管理系統(tǒng)一直停留在事物處理層面上,只能用于綜合統(tǒng)計(jì)等一些簡單功能,不能獲得其他一些較為高級的統(tǒng)計(jì)信息,而企業(yè)高層決策者則希望通過數(shù)據(jù)挖掘技術(shù)從海量數(shù)據(jù)中找出更多有用的信息以幫助決策,及時(shí)應(yīng)對市場變化[1-2]。
許多大的零售商由于依據(jù)“最佳猜測”來定價(jià)而失去了利潤,如果他們等待很久才對產(chǎn)品進(jìn)行打折,或者一些產(chǎn)品本不需要打折,卻因?yàn)槟承┎徽_的決策對產(chǎn)品進(jìn)行了打折,則會影響企業(yè)的利潤。商場的目的是為了追求利潤最大化,比如:銷售什么樣的商品,促銷策略如何制定,貨架上的商品如何擺放才能吸引顧客眼球,這些都是零售商需要考慮的問題。只有準(zhǔn)確掌握顧客的購買偏好才可以幫助商場對類似問題制定準(zhǔn)確合理的決策[3-4]。關(guān)聯(lián)規(guī)則挖掘就是對商場銷售數(shù)據(jù)進(jìn)行分析,得到顧客的購買偏好,然后做出合理的決策。在客戶消費(fèi)偏好關(guān)聯(lián)規(guī)則分析中,使用數(shù)據(jù)挖掘中的經(jīng)典Apriori算法對客戶消費(fèi)的商品進(jìn)行了挖掘,建立合理的客戶消費(fèi)方式模型,根據(jù)客戶購買偏好進(jìn)行促銷分析,為零售商提供貨架擺放和促銷方案推薦,更好地把關(guān)聯(lián)規(guī)則挖掘用到零售業(yè)中,從大量業(yè)務(wù)數(shù)據(jù)中找出有用的模式和規(guī)律,為客戶分析決策服務(wù)。
關(guān)聯(lián)規(guī)則挖掘由R.Agrawal,T.Imielinski和A.Swami提出,應(yīng)用在數(shù)據(jù)庫上,用來發(fā)現(xiàn)零售業(yè)中用戶購買商品之間的內(nèi)在的隱含關(guān)系及關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則挖掘,就是對業(yè)務(wù)數(shù)據(jù)里不同類型的信息進(jìn)行處理,得到不同類型信息之間的關(guān)系,并進(jìn)一步分析信息之間內(nèi)在的邏輯規(guī)律,為業(yè)務(wù)運(yùn)作提供決策支持。決策者還可以利用關(guān)聯(lián)規(guī)則提供的信息來合理地設(shè)計(jì)和安排貨架等,從而優(yōu)化商場布置。
在對商品做促銷時(shí),也可以利用關(guān)聯(lián)規(guī)則對用戶進(jìn)行分類。例如,英國的某大型超市利用數(shù)據(jù)挖掘方法對商場上架商品進(jìn)行關(guān)聯(lián)分析時(shí),發(fā)現(xiàn)有一部分滯銷商品居然是總計(jì)消費(fèi)額最高的前25%顧客的購買對象,于是該商場決定繼續(xù)銷售這批滯銷產(chǎn)品,而不是簡單地撤下這些滯銷產(chǎn)品[5-7]。
基于關(guān)聯(lián)規(guī)則的Apriori算法有助于挖掘出有用規(guī)則,關(guān)聯(lián)規(guī)則挖據(jù)是在給定的事物數(shù)據(jù)中找到所有滿足最小支持度和最小置信度的形如X→Y的規(guī)則。其中,X和Y分別表示屬性集合(稱為項(xiàng)集),并且滿足X∩Y=?。蘊(yùn)含式XY稱為關(guān)聯(lián)規(guī)則,X、Y分別稱為關(guān)聯(lián)規(guī)則的前提和結(jié)論。假設(shè)T為要進(jìn)行處理的所有事務(wù)記錄的集合,X為T中包含X的事務(wù)記錄的個(gè)數(shù),X∩Y為T中同時(shí)包含X和Y的有共同屬性的事務(wù)記錄個(gè)數(shù),X∪Y為T中所有事物記錄的個(gè)數(shù)[8-9]。支持度和置信度為:
support(XY)=support(X∪Y)
confidence(X
支持度衡量整體數(shù)據(jù)集合的重要性;置信度是描述規(guī)則成立的可信度。一般情況下,決策者和用戶感興趣的、有用的關(guān)聯(lián)規(guī)則是支持度和置信度都高的關(guān)聯(lián)規(guī)則。在統(tǒng)計(jì)意義上最小支持度表示項(xiàng)目集合最低重要度,最小置信度則表示規(guī)則最低的可靠度。關(guān)聯(lián)規(guī)則挖掘問題就是找到支持度和置信度都大于指定閾值的關(guān)聯(lián)規(guī)則。如果規(guī)則的置信度和支持度都大于最小支持度、最小置信度時(shí),規(guī)則是有效的,也稱為強(qiáng)關(guān)聯(lián)規(guī)則。當(dāng)數(shù)據(jù)項(xiàng)集合X的支持度大于最小支持度時(shí),就把X稱為頻繁項(xiàng)目集合。
關(guān)聯(lián)規(guī)則挖掘算法中涉及的問題主要有兩個(gè):如何減少I/O操作,因?yàn)轭l繁的I/O操作會影響挖掘效率;如何降低需要計(jì)算支持率的項(xiàng)目集數(shù)量,盡量與頻繁項(xiàng)目集的數(shù)量接近。
Apriori算法非常經(jīng)典,主要分為兩大步驟:
第一步驟:找出高頻項(xiàng)目集合。
(1)找出高頻項(xiàng)目集k-1,若為空,則停止執(zhí)行。
(2)由(1)中找出任意兩個(gè)有(k-2)項(xiàng)目相同的項(xiàng)目集k-1,組合成項(xiàng)目集k。
(3)判斷由(2)找出的項(xiàng)目集,其所有包括的項(xiàng)目集k-1是否都出現(xiàn)在(1)中,假如成立就保留此項(xiàng)目集k;否則就刪除。
(4)檢查由(3)所獲得的項(xiàng)目集k是否滿足最小支持度,如果符合就加入高頻項(xiàng)目集k;否則就刪除。
(5)轉(zhuǎn)到(1)繼續(xù)查找高頻項(xiàng)目集k1,循環(huán)結(jié)束,直到無法產(chǎn)生高頻項(xiàng)目集。
第二步驟:產(chǎn)生關(guān)聯(lián)規(guī)則。
(1)將所有高頻k項(xiàng)目集(k1)拆解成XY,X,YXY。
(2)判斷所有的規(guī)則是否符合最小信任度,若符合則稱為關(guān)聯(lián)規(guī)則。
因?yàn)榈诙降拈_銷遠(yuǎn)低于第一步,因此關(guān)聯(lián)規(guī)則挖掘的性能主要取決于第一步。
關(guān)聯(lián)規(guī)則主要分為以下幾類:
(1)根據(jù)變量類別的不同,關(guān)聯(lián)規(guī)則可分為布爾型和數(shù)值型。布爾型處理的值是離散的、種類化的,顯示了變量之間的關(guān)系。數(shù)值型處理的是連續(xù)的變量,把多維、多層關(guān)聯(lián)規(guī)則結(jié)合起來對數(shù)據(jù)進(jìn)行動態(tài)分割或者直接處理。
(2)根據(jù)數(shù)據(jù)的抽象層次,關(guān)聯(lián)規(guī)則分為單層關(guān)聯(lián)和多層關(guān)聯(lián)。在單層的關(guān)聯(lián)規(guī)則中,不考慮變量的現(xiàn)實(shí)數(shù)據(jù)是否屬于同一層次;但在多層的關(guān)聯(lián)規(guī)則中,就需要考慮數(shù)據(jù)是否屬于同一層次、考慮變量的多層性。
(3)根據(jù)規(guī)則中數(shù)據(jù)的維數(shù),關(guān)聯(lián)規(guī)則可以分為單維和多維。單維的規(guī)則考慮數(shù)據(jù)的一個(gè)維度和單個(gè)屬性的關(guān)系,多維的關(guān)聯(lián)規(guī)則考慮處理數(shù)據(jù)的多個(gè)維度和多個(gè)屬性之間的關(guān)系。
假定事務(wù)數(shù)據(jù)庫如表1所示。該數(shù)據(jù)庫中有4個(gè)事務(wù),設(shè)定支持度為2,置信度為0.5。
表1 事物表(1)
頻繁項(xiàng)集發(fā)現(xiàn)過程:
(1)掃描數(shù)據(jù)集中的所有事務(wù),對每個(gè)項(xiàng)的出現(xiàn)次數(shù)計(jì)數(shù)。
(2)最小事務(wù)支持度為2,確定項(xiàng)目集合為L1。
(3)為發(fā)現(xiàn)頻繁項(xiàng)集L2,算法連接L1產(chǎn)生候選2項(xiàng)集的集合C2={{蘋果,橘子},{蘋果,火腿},{蘋果,葡萄},{橘子,火腿},{橘子,葡萄},{火腿,尿布}}。
(4)掃描D中所有事務(wù),計(jì)算C2中每個(gè)候選項(xiàng)集的支持?jǐn)?shù)目,如果某個(gè)事務(wù)包含該候選項(xiàng)集,那么候選項(xiàng)集的支持計(jì)數(shù)加1。
(5)確定頻繁2項(xiàng)集的集合L2,它是由C2中大于并等于支持度計(jì)數(shù)的2項(xiàng)集組成,L2={{蘋果,橘子},{蘋果,火腿},{蘋果,葡萄},{橘子,火腿}}。
(6)候選3-項(xiàng)集的集合C3由頻繁2-項(xiàng)集產(chǎn)生,C3={蘋果,橘子,火腿}。
(7)掃描D中事務(wù),計(jì)算C3中候選集的支持計(jì)數(shù),所以{蘋果,橘子,火腿}為頻繁3-項(xiàng)集L3。
由于頻繁項(xiàng)集已經(jīng)滿足最小支持度的要求,所以這時(shí)只考慮置信度。設(shè)最小置信度為80%,由頻繁項(xiàng)集{蘋果,橘子,火腿}可生成強(qiáng)關(guān)聯(lián)規(guī)則{蘋果,橘子}→{火腿}和{蘋果,火腿}→{橘子}。置信度規(guī)則如表2所示[10-11]。
置信度為100%說明,購買前一物品的同時(shí),也會購買后一物品。也就是說購買蘋果、橘子的用戶同時(shí)會購買火腿。購買蘋果、火腿的用戶同時(shí)也會購買橘子。
已知另一數(shù)據(jù)庫數(shù)據(jù)如表3所示。
表2 置信規(guī)則表
表3 事物表(2)
數(shù)據(jù)挖掘過程如下:
第一步:根據(jù)定義,計(jì)算每種商品的關(guān)聯(lián)規(guī)則的支持度。
Support(帽子)=3/9=33%
Support(圍巾)=3/9=33%
Support(手套)=3/9=33%
Support(棉衣)=2/9=22%
Support(毛巾)=1/9=11%
Support(電熱毯)=1/9=11%
Support(鞋刷)=2/9=22%
Support(香皂)=3/9=33%
Support(浴衣)=3/9=33%
Support(剃須泡沫)=3/9=33%
Support(空氣清新劑)=1/9=11%
第二步:設(shè)定最小的支持度閾值為20%,將大于或等于最小支持度閾值的商品挑選出來,那么帽子、圍巾、手套、棉衣、鞋刷、香皂、浴衣、剃須泡沫可以被挑選出來。
第三步:計(jì)算商品關(guān)聯(lián)規(guī)則的置信度。
帽子、圍巾、手套、棉衣、鞋刷、香皂、浴衣和剃須泡沫的置信度為:
Confidence(棉衣帽子)=Support(棉衣帽子)/Support(棉衣)=11%/22%=0.5
Confidence(棉衣圍巾)=Support(棉衣圍巾)/Support(棉衣)=11%/22%=0.5
Confidence(棉衣手套)=Support(棉衣手套)/Support(棉衣)=22%/22%=1
Confidence(毛巾毛毯)=Support(毛巾毛毯)/Support(毛巾)=11%/11%=1
Confidence(香皂浴衣)=Support(香皂浴衣)/Support(香皂)=22%/33%=0.67
Confidence(香皂剃須泡沫)=Support(香皂剃須泡沫)/Support(香皂)=22%/33%=0.67
Confidence(浴衣剃須泡沫)=Support(浴衣剃須泡沫)/Support(浴衣)=33%/33%=1
Confidence(鞋刷剃須泡沫)=Support(鞋刷剃須泡沫)/Support(鞋刷)=11%/22%=0.5
其余數(shù)據(jù)通過XY的信任度表示如表4、5所示。
表4 置信度(1)
表5 置信度(2)
第四步:設(shè)定最小信任度閾值為0.6,得到的規(guī)則如表6所示。
根據(jù)上述生成的關(guān)聯(lián)規(guī)則,可以發(fā)現(xiàn)顧客潛在的購買習(xí)慣和偏好,將帽子、圍巾放置在一起,以方便顧客選購,甚至可以把帽子、圍巾和手套,棉衣和手套放在一起捆綁銷售。浴衣和剃須泡沫可以捆綁在一起銷售,香皂、鞋刷和剃須泡沫也可以在一起捆綁銷售。在進(jìn)貨的時(shí)候,可以考慮將上述商品統(tǒng)一采購,也可以放在一起統(tǒng)一印發(fā)促銷廣告,來提高商品的支持度和信任度。上述關(guān)聯(lián)規(guī)則生成中,任務(wù)度和支持度都高的就可以考慮在一起捆綁銷售,讓消費(fèi)者交叉購買以提高消費(fèi)力[12-13]。
大型零售業(yè)的利潤主要來自于以下三個(gè)方面:商品差價(jià)、供應(yīng)鏈成本和管理成本。但在目前激烈競爭的客觀環(huán)境下,大型零售業(yè)在以上三方面利潤上升空間很小。想要在市場中擁有競爭力關(guān)鍵在于提高銷售額,即吸引更多的顧客,并要提高顧客的購買金額,這樣零售業(yè)才能獲得更多更高的利潤、在市場中擁有更
表6 規(guī)則表
多的競爭力。超市促銷就是為了提高營業(yè)額,利用各種方法和手段,讓消費(fèi)者能夠了解并且注意到超市的產(chǎn)品從而刺激消費(fèi)者的購買欲望,最終促使消費(fèi)者實(shí)現(xiàn)購買行為,因此促銷是零售業(yè)日常非常重要的一項(xiàng)工作。以往零售商考慮的角度就是單個(gè)商品的利潤,但在實(shí)際經(jīng)營中,很多時(shí)候最大利潤來源于商品組合銷售。消費(fèi)者心理學(xué)指出,消費(fèi)者的購買決策帶有很強(qiáng)的情景性,顧客是否購買商品會隨著情景的變化而變化,所以零售業(yè)貨架的安排和設(shè)計(jì)變得尤其重要,目標(biāo)就是讓顧客發(fā)現(xiàn)更多的商品,進(jìn)而產(chǎn)生購買沖動,那么可以建議在擺放商品時(shí),盡量將置信度較高的商品擺放在和人視線平行的貨柜以方便用戶購買,同時(shí)也能促進(jìn)相鄰商品的銷售量上漲。通過統(tǒng)計(jì)數(shù)據(jù)還發(fā)現(xiàn),最大置信度和最小支持度相差越小,生成的競爭商品組數(shù)越多。如果兩種物品的置信度都較低,說明這兩種物品之間在購買時(shí)沒有關(guān)聯(lián)關(guān)系,那么就可以分開擺放。對于這些支持度、置信度較小的商品可以采取一些措施來提高銷售業(yè)務(wù)和顧客滿意度,進(jìn)而提升企業(yè)競爭力。一般來說采取以下策略來激發(fā)顧客購買的欲望:
(1)制定促銷活動,利用關(guān)聯(lián)規(guī)則確定不同商品銷售的關(guān)聯(lián)關(guān)系,來精確確定促銷對象。
(2)對銷售、顧客、產(chǎn)品、時(shí)間和地區(qū)進(jìn)行分類分析,考慮到不同顧客的需求、不同產(chǎn)品的銷售和不同品牌日用品的質(zhì)量、價(jià)格、利潤等,對不同維度進(jìn)行分類,這樣就可以更準(zhǔn)確地掌握顧客類型、產(chǎn)品暢銷程度,以及在不同時(shí)間、不同地域的銷售區(qū)別。
(3)分析顧客購買趨勢,對顧客在不同時(shí)期購買的商品進(jìn)行分析,分析顧客消費(fèi)變化的原因,然后及時(shí)調(diào)整商品的價(jià)格和種類,挽留老顧客,吸引新顧客。
(4)如果某種產(chǎn)品存在它的競爭商品,那么企業(yè)可以把購買競爭商品的顧客列為重點(diǎn)顧客,并且商品缺貨時(shí),競爭商品就可以作為臨時(shí)替代品進(jìn)行銷售。
(5)高推薦度的商品個(gè)體利潤都比較低,超市可以把推薦度高的商品陳列在顯眼的地方,這樣在節(jié)省顧客購買時(shí)間的同時(shí)也可以增加相關(guān)聯(lián)商品的銷售額[14-15]。
(6)進(jìn)行捆綁銷售,比如優(yōu)惠購買,消費(fèi)者購買A產(chǎn)品時(shí)可以用低于正常價(jià)格的形式購買到B。比如統(tǒng)一出售,多種產(chǎn)品按照捆綁后低于單獨(dú)標(biāo)價(jià)的價(jià)格出售,這樣在降低了銷售成本的同時(shí),也增加了銷售額和顧客滿意度,起到“1+1>2”的效果,讓產(chǎn)品相互協(xié)調(diào)和促進(jìn)。
(7)交叉銷售,在貨架擺放時(shí)把關(guān)聯(lián)程度高的商品由過去的就近擺放調(diào)整為遠(yuǎn)離擺放,比如可以交換個(gè)人衛(wèi)浴和廚具餐具的位置,使洗衣用品和衛(wèi)生清潔品相對遠(yuǎn)離,這樣購買這兩類產(chǎn)品的顧客就需要穿過廚具和家居日用品區(qū),這樣就可能引起消費(fèi)者的購物沖動。經(jīng)常性有意識地改變超市貨架布局,來打破消費(fèi)者的購買習(xí)慣,使消費(fèi)者發(fā)現(xiàn)沒有注意到的商品,吸引消費(fèi)者購買,以提高營業(yè)額,而同時(shí)超市應(yīng)該將日銷售量高的物品擺放在兩端,銷售量低的產(chǎn)品擺放在容易引人注意的地方,這樣消費(fèi)者在購買的時(shí)候可以快速定位,也可以引起顧客對各個(gè)貨架的關(guān)注,從而瀏覽整個(gè)貨架,帶動更多的銷售量。
關(guān)聯(lián)規(guī)則技術(shù)是一項(xiàng)重要的數(shù)據(jù)挖掘技術(shù),該技術(shù)可以從海量的業(yè)務(wù)數(shù)據(jù)中挖掘消費(fèi)者的購買行為的關(guān)聯(lián)性。關(guān)聯(lián)規(guī)則能挖掘不同種類項(xiàng)目之間的相關(guān)性,因此,可以找出潛在的商品銷售的關(guān)聯(lián)性和客戶消費(fèi)傾向等信息。當(dāng)然如果考慮序數(shù)資料間存在相似度,可以找出更多有意義的規(guī)則。然而,在產(chǎn)生更多有意義的高頻項(xiàng)目集的同時(shí)也會產(chǎn)生相似度太低的項(xiàng)目集。為了解決上述問題,文中以Apriori算法為基礎(chǔ),挖掘出具有高度關(guān)聯(lián)性的關(guān)聯(lián)規(guī)則,針對挖掘結(jié)果提出了包括捆綁銷售、競爭分析、交叉營銷、商品推薦等不同的解決方案,利用挖掘出的有意義信息,企業(yè)可進(jìn)行決策參考,實(shí)現(xiàn)了關(guān)聯(lián)規(guī)則挖掘在零售業(yè)實(shí)體中的應(yīng)用研究,對零售業(yè)的發(fā)展有著較為重要的現(xiàn)實(shí)意義。
[1]HanJW,KamberM.數(shù)據(jù)挖掘概念與技術(shù)[M].范 明,孟小峰,譯.北京:機(jī)械工業(yè)出版社,2006.
[2] 亓文娟,晏 杰.關(guān)聯(lián)規(guī)則挖掘在超市中的應(yīng)用研究[J].吉林師范大學(xué)學(xué)報(bào):自然科學(xué)版,2013,34(2):138-141.
[3] 陳 莉,焦李成.文檔挖掘與降維技術(shù)[J].西北大學(xué)學(xué)報(bào):自然科學(xué)版,2003,33(3):267-271.
[4] 李穎基,彭 宏,鄭啟倫,等.Web日志中有趣關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)[J].計(jì)算機(jī)研究與發(fā)展,2003,40(3):435-439.
[5] 卜耀華.關(guān)聯(lián)規(guī)則挖掘技術(shù)在零售業(yè)中的應(yīng)用[J].商場現(xiàn)代化,2009(10):97-98.
[6] 張小利,陳 莉.數(shù)據(jù)挖掘在智能交通系統(tǒng)中的應(yīng)用[J].西北大學(xué)學(xué)報(bào):自然科學(xué)版,2005,35(6):687-690.
[7]HeraviMJ,ZaianeOR.Astudyoninterestingmeasuresforassociativeclassifiers[C]//Proceedingsofthe2010ACMsymposiumonappliedcomputing.Sierre:ACM,2010:1039-1046.
[8]TingSL,TseYK,HoGTS,etal.Mininglogisticsdatatoassurethequalityinasustainablefoodsupplychain:acaseintheredwineindustry[J].InternationalJournalofProductionEconomics,2013,152:200-209.
[9]LiaoShu-Hsien,ChuPeihui,HsiaoPei-Yuan.Dataminingtechniquesandapplications-adecadereviewfrom2000to2011[J].ExpertSystemswithApplications,2012,39:11303-11311.
[10]RongJia,VuHQ,LawR,etal.AbehavioralanalysisofwebsharersandbrowsersinHongKongusingtargetedassociationrulemining[J].TourismManagement,2011,33(4):731-740.
[11]LiouJJH,TzengGH.Adominance-basedroughsetapproachtocustomerbehaviorintheairlinemarket[J].InformationSciences,2010,180(11):2230-2238.
[12] 王偉輝,耿國華,陳 莉.數(shù)據(jù)挖掘技術(shù)在保險(xiǎn)業(yè)務(wù)中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用與軟件,2008,25(3):123-125.
[13] 閆 珍.面向零售業(yè)的關(guān)聯(lián)規(guī)則動態(tài)挖掘算法研究[D].南京:南京航空航天大學(xué),2010.
[14] 黃嘉滿.面向零售業(yè)的關(guān)聯(lián)規(guī)則挖掘的研究與實(shí)現(xiàn)[D].上海:上海交通大學(xué),2007.
[15]HanJiawei,KamberM.Datamining:conceptsandtechniques[M].2nded.Beijing:ChinaMachinePress,2011:146-155.
Research and Realization of Association Rules Mining in Supermarket
ZHANG Jue1,2,CHEN Li2,TIAN Jian-xue1
(1.Department of Information Engineering,Yulin College,Yulin 719000,China; 2.School of Information Science and Technology,Northwest University,Xi’an 710000,China)
With the rapid development of supermarket,a lot of business data are accumulated by intelligent system.It’s imperative and necessary to find an effective technique to explore and discover the potential knowledge from the enormous amount of data,which is helpful for business decision making.Data mining has an important research role in the world.It can be used to acquire the knowledge.The current situation of supermarket development is analyzed,and the customer’s buying behavior is understood through the analysis of the retail sales data,making the explanation to the mining result,application of association rules to solve real business problems.According to the factors of the quantity and profit,the frequent item sets are adopted to find the sales combination model of profit maximization of commodity,and retailers can use it to bundling and gain the biggest profit.Based on the concept of competitive products,a model is proposed that can be used to find out the hidden in the retail database by the frequent and non-frequent items,getting the model of retail commodity recommendation.The experiment shows that the model can find out the high cross selling goods with good practicality in supermarkets.
data mining;association rules;retail business intelligence system;Apriori algorithm
2015-08-12
2015-12-24
時(shí)間:2016-09-18
陜西省自然基金資助項(xiàng)目(2003JM8005);榆林市科技局資助項(xiàng)目(NY13-15);榆林學(xué)院青年科技基本資助項(xiàng)目(14YK37)
張 玨(1984-),女,講師,博士研究生,研究方向?yàn)榇髷?shù)據(jù)、智能信息處理、數(shù)據(jù)挖掘。
http://www.cnki.net/kcms/detail/61.1450.TP.20160918.1707.012.html
TP311
A
1673-629X(2016)10-0146-05
10.3969/j.issn.1673-629X.2016.10.032