• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于RFM模型的商場會員畫像的建模與驗證

      2019-09-26 06:59:46李海燕王松響
      關(guān)鍵詞:明細(xì)表畫像附件

      李海燕,王松響

      (鄭州鐵路職業(yè)技術(shù)學(xué)院,河南 鄭州 451460)

      會員畫像研究是當(dāng)前的一個熱門話題,最早是由交互設(shè)計之父Alan Cooper提出的,他認(rèn)為會員畫像是根據(jù)一系列用戶的真實數(shù)據(jù)而挖掘出的目標(biāo)用戶模型。用戶畫像的本質(zhì)是消費者特征“可視化”,通過收集與分析用戶的基本屬性、購買特征、行為特征等多個維度的主要信息,將會員標(biāo)簽綜合起來,即可勾勒出會員的整體特征與輪廓。在商業(yè)領(lǐng)域,會員畫像所能實現(xiàn)的會員識別、精準(zhǔn)營銷、改善經(jīng)營、拓展市場等功能,是企業(yè)應(yīng)用會員畫像的主要驅(qū)動力。

      本研究的目的是針對會員的消費情況數(shù)據(jù),建立一個RFM數(shù)學(xué)模型,利用python軟件實現(xiàn)刻畫每一位會員購買力,以便能夠?qū)γ總€會員的價值進(jìn)行識別,為商場對會員進(jìn)行精準(zhǔn)促銷提供數(shù)據(jù)支撐。

      數(shù)據(jù)來源于2018年全國大學(xué)生數(shù)學(xué)建模競賽的C題《大型百貨商場會員畫像描繪》(簡稱《競賽題》)。題目數(shù)據(jù)中給出了某大型百貨商場會員的相關(guān)信息,附件1是會員信息數(shù)據(jù)表,附件2是近幾年的銷售流水表,附件3是會員消費明細(xì)表,附件4是商品信息表,附件5是數(shù)據(jù)字典表。

      1 RFM模型

      RFM模型是衡量客戶價值和購買力的重要工具和手段。該模型通過一個客戶的近期購買行為、購買的總體頻率以及消費金額來描述該客戶的會員價值畫像。三個指標(biāo)分別是最近一次消費時間(Recency)、消費頻率(Frequency)和消費總金額(Monetary)[1]。

      最近一次消費時間指會員最近一次的購買時間。理論上,最近一次的消費時間越近的會員價值越高。消費頻率是指在一定時間內(nèi)會員的消費次數(shù),一定時間內(nèi)的消費次數(shù)越多,越說明會員喜歡在該商場購物,會員的忠誠度越高。消費總金額指在一定時間內(nèi)的消費總金額,金額越高說明該會員的消費能力越強。

      運用軟件,采用K-means聚類分析的方法,將會員劃分為8類。

      2 數(shù)據(jù)預(yù)處理

      對于《競賽題》附件1會員信息數(shù)據(jù)表、附件3會員消費明細(xì)表數(shù)據(jù)預(yù)處理如下:

      將“登記時間”一列中的空白數(shù)據(jù)刪除。

      選取2017年10月1日—2017年12月31日的消費記錄。

      對第一步處理完畢會員消費明細(xì)表中的異常數(shù)據(jù)進(jìn)行清洗,即篩選出能反映會員消費特征的有效數(shù)據(jù)。異常數(shù)據(jù)有兩種情況:一種是商品售價與消費金額差距較大的數(shù)據(jù)。這種情況可能是由于產(chǎn)品打折或商場促銷造成的,由于優(yōu)惠活動的實施背景無法確定,所以以打折為唯一因素,并以一折為最低優(yōu)惠限度。用Excel對數(shù)據(jù)進(jìn)行篩選,將消費金額小于售價一折的產(chǎn)品數(shù)據(jù)和負(fù)數(shù)據(jù)刪除。另一種是銷售量、消費金額、積分都為負(fù)數(shù)的數(shù)據(jù)。

      數(shù)據(jù)字典表中與相同會員消費明細(xì)表中的單據(jù)號可能不是同一筆消費,在提取數(shù)據(jù)時,將同一卡號下相同的單據(jù)號當(dāng)作一次消費。

      在會員消費明細(xì)表中用vlookup函數(shù)匹配會員信息數(shù)據(jù)表中的數(shù)據(jù),將未匹配到的數(shù)據(jù)刪除,以此篩選出該商場會員的所有消費數(shù)據(jù)。

      3 Python軟件

      Python軟件是一種解釋性的、高級的、通用的計算機編程語言,由荷蘭計算機工程師吉多·范羅蘇姆(Guido van Rossum)創(chuàng)建,并于1991年首次發(fā)布,它的設(shè)計理念強調(diào)代碼可讀性,特別是使用強制縮進(jìn)格式。Python語言具有簡潔性、易讀性以及可擴展性,完全開源,非常多的科學(xué)計算庫都提供了Python的調(diào)用接口。它具有豐富和強大的庫,常被昵稱為“膠水語言”,能夠把用其他語言制作的各種模塊很輕松地聯(lián)結(jié)在一起。

      本研究的聚類算法K-means算法,來自Python的Sklearn庫。Sklearn是機器學(xué)習(xí)中常用的第三方庫,對常用的機器學(xué)習(xí)中的回歸、分類、聚類等方法進(jìn)行了封裝。Sklearn庫要建立在NumPy、Scipy、MatPlotLib等庫之上[2]。

      4 K-means算法

      K-means是一個聚類分析算法, 在數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)對象之間的關(guān)系,將數(shù)據(jù)進(jìn)行分組,組內(nèi)的相似性越大,組間的差別越大,則聚類效果越好。算法的主要目的是找到數(shù)據(jù)中自然聚類的中心,使得各個類內(nèi)部點的誤差平方和最小。假設(shè)有n個對象,k個類,m個樣本[3]。

      算法步驟如下:第一步,確定有k類;第二步,在m個樣本中隨機選取k個樣本作為類中心;第三步,計算各樣本與各類中心的距離,將各樣本歸于最近的類中心點;第四步,求各類樣本的均值,作為新的類中心;第五步,如果類中心不再發(fā)生變動或者達(dá)到迭代次數(shù)上限,算法結(jié)束,否則回到第三步,反復(fù)執(zhí)行三、四、五步,直到結(jié)束[4]。

      常見的距離函數(shù)有歐式距離、曼哈頓距離、余弦距離等,這里我們選取歐式距離

      用誤差平方和作為聚類的目標(biāo)函數(shù)

      式中,k表示k個聚類中心,Ci表示第i個中心,d表示歐式距離。

      5 基于RFM模型的K-means 聚類算法建模

      5.1 數(shù)據(jù)標(biāo)準(zhǔn)化

      根據(jù)對會員數(shù)據(jù)的分析,各指標(biāo)數(shù)據(jù)度量單位各不相同,且不在同一個區(qū)間,為避免直接進(jìn)行數(shù)據(jù)建模對結(jié)果造成干擾,需要將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。由于F、R、M指標(biāo)對顧客價值存在正相關(guān)影響,因此針對這三項指標(biāo)運用正向指標(biāo)的標(biāo)準(zhǔn)化方法,標(biāo)準(zhǔn)化公式為

      式中,xnorm表示標(biāo)準(zhǔn)化后的數(shù)值,x表示原始值,xmin表示該指標(biāo)的極小值,xmax表示該指標(biāo)的極大值。

      5.2 K-means 算法

      利用 R(最近購買日期)、F(購買頻次數(shù))、 M(購買總金額三個指標(biāo)),完成RFM模型的建設(shè)。聚類K-means 算法使用Python軟件實現(xiàn),實驗過程分兩個階段。

      第一個階段,選取2017年12月共31天的數(shù)據(jù),對算法程序進(jìn)行訓(xùn)練,按k=8,聚類分為8簇。

      第二個階段,選取2017年10—12月的數(shù)據(jù),運用程序運算,按k=8,聚類分為8簇。

      程序分兩個部分:第一部分是聚類,調(diào)用K-means 算法;第二部分是利用第一部分的數(shù)據(jù)結(jié)果,運用Matplotlib庫畫三維散點圖。

      5.3 實驗結(jié)果及分析

      5.3.1 第一階段實驗結(jié)果

      第一階段實驗結(jié)果見表1和圖1。

      表1 第一階段各類會員卡數(shù)量

      續(xù)表

      圖1 第一階段三維分類散點圖

      5.3.2 第二階段實驗結(jié)果

      第二階段實驗結(jié)果見表2和圖2。

      表2 第二階段各類會員卡數(shù)量

      圖2 第二階段三維分類散點圖

      6 結(jié)果分析

      將該商場會員劃分為8類,其分類特征和營銷策略見表3。

      表3 會員特征及營銷策略

      其中,消費非常高的會員(一段時間內(nèi)的消費總金額超過該段時間內(nèi)平均消費金額900%的會員)劃分在高級會員中。

      7 結(jié)語

      近年來,隨著大數(shù)據(jù)分析技術(shù)的發(fā)展,對客戶進(jìn)行會員畫像,利用會員標(biāo)簽細(xì)分客戶類型,成為認(rèn)識和了解商場會員的重要工具,也為商場制定精細(xì)化的、有針對性的營銷手段提供了數(shù)據(jù)支持。

      本研究根據(jù)某商場2017年10月到12月的會員銷售記錄,通過K-means 算法聚類分析,將該商場3個月消費的會員劃分為8類。通過會員的類別標(biāo)簽,可以對不同類的會員使用不同的營銷手段,分類進(jìn)行商品的宣傳、推送等,挖掘顧客的后續(xù)消費力、消費價值,將客戶的價值最大化。

      猜你喜歡
      明細(xì)表畫像附件
      威猛的畫像
      附件三:擬制定的標(biāo)準(zhǔn)匯總表
      “00后”畫像
      2019年中國出口石材明細(xì)表(三)
      石材(2020年8期)2020-10-28 07:53:18
      畫像
      2019年中國出口石材明細(xì)表(二)
      石材(2020年7期)2020-08-24 08:28:08
      2019年中國出口量值石材明細(xì)表(一)
      石材(2020年6期)2020-08-24 08:27:08
      關(guān)于TSG 07——2019附件M與TSG Z0004——2007內(nèi)容的對照
      新型武器及附件展呈
      輕兵器(2017年3期)2017-03-13 19:15:42
      附件 注釋體例
      新绛县| 洛隆县| 靖宇县| 壶关县| 云和县| 弥勒县| 尖扎县| 兴宁市| 额尔古纳市| 类乌齐县| 德清县| 额尔古纳市| 铅山县| 垣曲县| 商丘市| 克山县| 米脂县| 弥勒县| 壶关县| 北票市| 神农架林区| 越西县| 赞皇县| 达日县| 昭通市| 丽水市| 景洪市| 漠河县| 肥西县| 绥德县| 封开县| 综艺| 长子县| 长宁区| 邢台县| 景东| 蒙山县| 海盐县| 雅江县| 天等县| 汾阳市|