• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)據(jù)挖掘在物流客戶細(xì)分中的應(yīng)用

      2015-05-11 15:34:05李煜陳相汝
      現(xiàn)代商貿(mào)工業(yè) 2015年7期
      關(guān)鍵詞:數(shù)據(jù)挖掘

      李煜 陳相汝

      摘要:針對物流客戶細(xì)分的目標(biāo),對客戶信息挖掘的需求,從數(shù)據(jù)挖掘的定義出發(fā),介紹了物流客戶細(xì)分中數(shù)據(jù)挖掘的目標(biāo)以及相應(yīng)的挖掘流程。為了進(jìn)一步說明,以某批發(fā)商客戶數(shù)據(jù)作為挖掘?qū)ο螅脭?shù)據(jù)挖掘軟件SPSS Clementine,建立K-means模型進(jìn)行了聚類分析,得到挖掘結(jié)果。最后對挖掘結(jié)果進(jìn)行分析,完成了該批發(fā)商的客戶細(xì)分。

      關(guān)鍵詞:數(shù)據(jù)挖掘;SPSS Clementine;客戶細(xì)分

      中圖分類號:F25

      文獻(xiàn)標(biāo)識碼:A

      文章編號:16723198(2015)07004404

      1引言

      隨著計算機(jī)網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)庫技術(shù)的迅速發(fā)展,信息化時代的來臨,物流企業(yè)不能只依靠誰的倉庫面積大,誰擁有的車輛船舶多來吸引客戶,而必須清楚知道客戶的需求,針對客戶的需求提供讓客戶滿意的客戶才能在留住老客戶的同時,吸引并發(fā)展更多的新用戶。面對大量繁雜冗余的客戶數(shù)據(jù)和信息,怎么才能找出真正有用的信息,挖掘出客戶的需求。這是依靠傳統(tǒng)方法所不能解決的問題。

      近年來,數(shù)據(jù)挖掘作為一種有效的工具,在信息處理方面有著巨大的發(fā)展,本文將介紹數(shù)據(jù)挖掘在物流客戶細(xì)分中的應(yīng)用。

      2客戶細(xì)分?jǐn)?shù)據(jù)挖掘簡述

      2.1數(shù)據(jù)挖掘

      數(shù)據(jù)挖掘是從大量的、有噪聲的、不完全的、模糊的、隨機(jī)的實際應(yīng)用數(shù)據(jù)中提取有效的、新穎的、潛在有用的知識的非平凡過程。數(shù)據(jù)挖掘又稱作知識發(fā)現(xiàn),由此可見,它并不是創(chuàng)造信息,而是在已有的數(shù)據(jù)和信息的基礎(chǔ)上發(fā)現(xiàn)對決策分析有用的信息。由于數(shù)據(jù)挖掘處理海量數(shù)據(jù)發(fā)現(xiàn)有用信息方面有著得天獨厚的優(yōu)勢,無疑數(shù)據(jù)挖掘能對物流中的客戶管理提供強(qiáng)有力的支持和幫助。在本篇文章中,主要應(yīng)用數(shù)據(jù)挖掘高度自動化地分析客戶數(shù)據(jù),對客戶進(jìn)行細(xì)分,從中挖掘出不同地區(qū)不同客戶的需求特點,以便物流企業(yè)關(guān)注相關(guān)客戶和貨源的同時,對改進(jìn)營銷策略和客戶管理策略提供幫助。

      2.2客戶細(xì)分

      客戶細(xì)分就是根據(jù)客戶的屬性、行為、需求、偏好以及價值等因素進(jìn)行分類,把一個整體的客戶群以相應(yīng)的變量劃分為不同的等級或子群體,以便從中尋找共同的要素,分門別類地研究客戶行為與需求,并進(jìn)行有效的客戶管理,從而為企業(yè)充分獲取客戶價值提供理論和方法指導(dǎo)。數(shù)據(jù)挖掘可以把企業(yè)大量的客戶以各自屬性為基礎(chǔ)分成不同的類。此外,數(shù)據(jù)挖掘還可以對新客戶的各項屬性進(jìn)行類比和評分,以確定新客戶是屬于一般、目標(biāo)、還是重點客戶。

      2.3物流客戶細(xì)分中數(shù)據(jù)挖掘的任務(wù)

      數(shù)據(jù)挖掘的主要任務(wù)主要有分類分析、聚類分析、關(guān)聯(lián)分析、預(yù)測、時序模式、偏差分析等。而在物流客戶細(xì)分中的任務(wù)主要有以下幾個。

      (1)分類分析。

      物流客戶數(shù)據(jù)存在不同的類型,如企業(yè)的性質(zhì)、地域、服務(wù)需求種類、服務(wù)方式、服務(wù)頻率等不同的屬性。分類分析將對這些數(shù)據(jù)進(jìn)行內(nèi)在聯(lián)系的分析,找出一個類別的概念描述,來代表這類數(shù)據(jù)的整體信息。如表1所示。分類分析的結(jié)果可進(jìn)一步被用于規(guī)則的描述和相關(guān)的預(yù)測。

      (2)聚類分析。

      由于后文的案例與聚類分析相關(guān),此部分內(nèi)容將在后文詳細(xì)介紹。

      (3)關(guān)聯(lián)分析。

      關(guān)聯(lián)就是兩個或兩個以上變量的取值之間存在某種規(guī)律性。關(guān)聯(lián)分析即是通過一定的方法,發(fā)現(xiàn)數(shù)據(jù)項與屬性之間的關(guān)聯(lián)。比如在大量的物流客戶數(shù)據(jù)中可能存在著某種規(guī)律與聯(lián)系,我們可以將客戶的地區(qū)與服務(wù)種類、貨源等屬性進(jìn)行關(guān)聯(lián)分析,得到某地的貨源與某地區(qū)的客戶有著特殊的關(guān)聯(lián)?;蛘邔⒖蛻襞c服務(wù)種類、服務(wù)頻率等屬性進(jìn)行關(guān)聯(lián)分析,得到客戶需求服務(wù)的趨勢走向,以便制定更適宜的客戶策略。

      (4)預(yù)測。

      預(yù)測是利用歷史數(shù)據(jù)找出變化規(guī)律,建立模型,并由此模型對未來數(shù)據(jù)的種類及特征進(jìn)行預(yù)測。預(yù)測關(guān)心的是精度和不確定性,通常用預(yù)測方差來度量。歷史的數(shù)據(jù)用于構(gòu)造模型,來解釋當(dāng)前觀察到的行為。當(dāng)這個模型應(yīng)用到當(dāng)前的輸入,給出的結(jié)果就是對未來的行為的預(yù)測。比如說通過對新客戶和老客戶的各種數(shù)據(jù)的對比和分析,我們可以預(yù)測該新客戶對物流企業(yè)的重要程度,是一般客戶、目標(biāo)客戶還是重點客戶。

      3物流客戶細(xì)分?jǐn)?shù)據(jù)挖掘流程

      因為不同領(lǐng)域不同行業(yè)具體情況的不同,數(shù)據(jù)挖掘的任務(wù)、需要解決的問題以及對象的不同,數(shù)據(jù)挖掘的具體實施步驟也會有所不同。由于物流客戶的數(shù)據(jù)作為一種普遍的客戶數(shù)據(jù)調(diào)查樣本,本文將介紹跨行業(yè)數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程(Cross-Industry Standard Process for Data Mining,CRISP-DM)。它提綱挈領(lǐng)地描述了數(shù)據(jù)挖掘的完整過程,提供了物流客戶數(shù)據(jù)挖掘的方法和步驟。其主要過程為:商業(yè)理解、數(shù)據(jù)理解、數(shù)據(jù)準(zhǔn)備、模型建立、模型評估、模型部署。

      (1)行業(yè)理解(Business Understanding)。

      在數(shù)據(jù)挖掘的最開始階段,我們必須明確挖掘的需求和最終的目標(biāo)。從數(shù)據(jù)的收集、統(tǒng)計、整理和挖掘都有統(tǒng)一明確的目標(biāo)。在物流客戶細(xì)分的數(shù)據(jù)挖掘中,我們應(yīng)該針對我們最后索要達(dá)到的目標(biāo),選擇相應(yīng)的數(shù)據(jù),建立各種模型,最后得到相應(yīng)的結(jié)果。于是,行業(yè)理解應(yīng)該包括明確對象:各種客戶;評估環(huán)境:挖掘的需求性,約束,風(fēng)險,現(xiàn)有的資源以及將要付出的成本;明確挖掘目標(biāo):進(jìn)行客戶細(xì)分,更好地進(jìn)行客戶管理;最后是制定項目計劃。

      (2)數(shù)據(jù)理解(Data Understanding)。

      從數(shù)據(jù)收集開始我們就在進(jìn)行數(shù)據(jù)理解,收集后熟悉數(shù)據(jù),描述數(shù)據(jù),進(jìn)而對數(shù)據(jù)的可用性進(jìn)行評估,根據(jù)挖掘目標(biāo)過濾出所有可能有用的數(shù)據(jù),以及數(shù)據(jù)的潛在假設(shè),檢驗數(shù)據(jù)的質(zhì)量,最后建立相關(guān)數(shù)據(jù)庫。

      (3)數(shù)據(jù)準(zhǔn)備(Data Preparation)。

      數(shù)據(jù)準(zhǔn)備這一階段,是將我們所收集的原始數(shù)據(jù)處理成最終建模所需要的數(shù)據(jù)。它主要包括數(shù)據(jù)集的描述;以一定的包含或者排除的準(zhǔn)則進(jìn)行數(shù)據(jù)選擇;清洗數(shù)據(jù);以派生屬性或者數(shù)據(jù)轉(zhuǎn)化、離散等方式構(gòu)造數(shù)據(jù);整合數(shù)據(jù);最后是格式化數(shù)據(jù)。數(shù)據(jù)準(zhǔn)備的過程可能會多次執(zhí)行,且執(zhí)行順序不限,直到得到所需數(shù)據(jù)為止。

      (4)模型建立(Modeling)。

      模型建立這一階段,我們需要針對物流行業(yè)的特點,根據(jù)所選擇的數(shù)據(jù)挖掘模型技術(shù)方法進(jìn)行建模。它主要包括選擇建模技術(shù)、生成測試設(shè)計以及構(gòu)建模型。需要注意的是,在建模過程中需要對參數(shù)進(jìn)行調(diào)優(yōu),也可能會需要多次執(zhí)行數(shù)據(jù)準(zhǔn)備階段的工作。

      (5)模型評估(Evaluation)。

      在進(jìn)行模型部署之前,需要先進(jìn)行全面的模型評估。模型評估主要包括模型的測試,算法的完善等,并判斷模型是否達(dá)到了既定的商業(yè)目標(biāo),是否有改進(jìn)空間等。

      (6)模型部署(Deployment)。

      在模型部署這一階段中,挖掘的發(fā)現(xiàn)的結(jié)果以及過程將得到解釋。模型部署生成直觀的報告,或者是將結(jié)果嵌入到客戶管理系統(tǒng)等,實現(xiàn)最初的行業(yè)理解中的目標(biāo)。

      4聚類分析與K-means算法

      所謂“物以類聚”,聚類分析是把屬性按照屬性的相似程度分為若干類別。同一組中數(shù)據(jù)相似度盡可能大,而不同組之間的差距盡可能大。與分類分析不同的是并沒有事先規(guī)定數(shù)據(jù)的類別,這樣一來,便可以得到代表性大的客戶,進(jìn)行重點分析和培養(yǎng),改進(jìn)客戶管理方案。

      K-means算法是J.MacQuene于1967年提出的一種著名的劃分算法,至今仍然是最為常用的聚類算法之一。它是一種基于劃分的聚類方法,以K為參數(shù),把n個對象分為K個簇,以使類內(nèi)具有較高的相似度,而類間的相似度最低。相似度的計算根據(jù)一個簇中對象的平均值來進(jìn)行。

      K-means算法的處理流程如下:首先,隨機(jī)地選擇K個對象,每個對象初始地代表了一個簇中心。對于剩余的每個對象,根據(jù)其與各個簇中心的距離,將它賦給最近的簇。然后重新計算每個簇的平均值。這個過程不斷重復(fù),直到準(zhǔn)則函數(shù)收斂。平方誤差準(zhǔn)則是經(jīng)常被采用的準(zhǔn)則函數(shù),其定義如下。

      E=Ki=1

      P∈Ci

      |p-m i|2

      其中,E是數(shù)據(jù)庫中所有對象的平方誤差的總和;p是空間中的點,表示給定的數(shù)據(jù)對象;Mi是簇Ci的平均值(P和mi都是多維的)。

      5客戶細(xì)分案例

      根據(jù)物流客戶細(xì)分?jǐn)?shù)據(jù)挖掘流程,本文以某批發(fā)商的客戶數(shù)據(jù)(該數(shù)據(jù)集來自UCI數(shù)據(jù)庫)為例,進(jìn)行客戶細(xì)分的數(shù)據(jù)挖掘。在行業(yè)理解和數(shù)據(jù)理解之后,進(jìn)行數(shù)據(jù)準(zhǔn)備。例如除去對數(shù)據(jù)分析過程和結(jié)果無用的字段,除去信息不全的記錄以及將文字類的記錄轉(zhuǎn)化成可量化的數(shù)據(jù)(例如將銷售途徑中的團(tuán)購大客戶(horeca)轉(zhuǎn)化為1,零售(retail)轉(zhuǎn)化成2;客戶所在區(qū)域Lisbon轉(zhuǎn)化成1,Oporto轉(zhuǎn)化成2,其他地區(qū)轉(zhuǎn)化成3),將發(fā)貨種類歸為鮮貨類(fresh)、奶制品類(milk)、雜貨類(grocery)、冷凍品類(frozen)、清潔劑和紙類(detergents_paper)熟食類(delicassen)等。

      接下來在數(shù)據(jù)挖掘軟件SPSS Clementine中導(dǎo)入客戶數(shù)據(jù)表,通過導(dǎo)出表格結(jié)點查看該表中的數(shù)據(jù)信息,如圖2所示。

      在數(shù)據(jù)流中利用“type”結(jié)點來讀取字段,雙擊該結(jié)點對其進(jìn)行屬性設(shè)置,在聚類方法中所有參與聚類的字段在設(shè)置字段格式時其方向(Direction)都將被設(shè)置為輸入(In)。如圖3所示,以便進(jìn)行后續(xù)的K-means分析。

      生成聚類分析數(shù)據(jù)流設(shè)置好以后,我們將K-means結(jié)點加入到數(shù)據(jù)流,并在聚類數(shù)中設(shè)定聚類的類別數(shù),這里我們設(shè)置為5。設(shè)置好后,執(zhí)行該數(shù)據(jù)流。瀏覽執(zhí)行結(jié)果我們能夠得到相關(guān)聚類的信息,如圖4所示。

      從結(jié)果中我們可以看到,客戶一共被分為5類,第一到五類分別包含117、35、86、105、37條記錄。顯然第一類中客戶最多,相似度顯示第二類和第三類接近,且銷售渠道信息對聚類結(jié)果影響不大。

      最后我們接入“table”結(jié)點輸出個記錄的分類信息。如圖6所示。

      至此,客戶細(xì)分?jǐn)?shù)據(jù)挖掘完成。現(xiàn)就K-means模型結(jié)果做出如下分析。

      對于第一類客戶數(shù)量多屬于其他區(qū)域的團(tuán)購大客戶,對除了清潔劑以外的其他類型產(chǎn)品需求量大,是與

      批發(fā)商頻繁交易且每次交易量很大的客戶,應(yīng)重點管理。對于分類四和分類五的銷售方式都是零售,他們對產(chǎn)品的需求也相似對清潔劑、雜貨和奶制品需求較大,只不過四的顧客屬于其他區(qū)域,五的區(qū)域?qū)儆趨^(qū)域2,他們每次交易量不大,卻交易頻繁,屬于批發(fā)商的目標(biāo)客戶。對于第二類和第三類客戶來說,他們都屬于團(tuán)購大客戶,對各種類型的產(chǎn)品需求量一般,多是一次性交易或少次交易,每次交易量較大的客戶。這類的客戶需求不定,屬于一般客戶,但不排除在今后,其中有潛力客戶以后會發(fā)展成重點客戶。

      該案例按照數(shù)據(jù)挖掘的跨行業(yè)標(biāo)準(zhǔn)過程,應(yīng)用SPSS Clementine挖掘軟件,以K-means模型對某批發(fā)商客戶數(shù)據(jù)進(jìn)行聚類分析,最后在得到的結(jié)果上進(jìn)一步分析,完成了整個客戶細(xì)分。

      6總結(jié)

      在今天的大數(shù)據(jù)時代,數(shù)據(jù)挖掘作為知識發(fā)現(xiàn)的科學(xué)方法被人們所重視著。然而在物流領(lǐng)域,數(shù)據(jù)挖掘的應(yīng)用仍處于起步階段。本文從數(shù)據(jù)挖掘的定義出發(fā),介紹了數(shù)據(jù)挖掘的流程以及在物流客戶細(xì)分中的應(yīng)用,用SPSS Clementine數(shù)據(jù)挖掘工具對某批發(fā)商客戶數(shù)據(jù)進(jìn)行了簡單的挖掘,并得到了相應(yīng)的結(jié)果,說明了數(shù)據(jù)挖掘在物流客戶細(xì)分中的應(yīng)用。相信在未來,數(shù)據(jù)挖掘在物流行業(yè)中會有著更深入的研究以及更廣泛更實際的應(yīng)用。

      參考文獻(xiàn)

      [1]蒙肖蓮,蔡淑琴.商業(yè)銀行客戶流失預(yù)測模型研究[J].系統(tǒng)工程,2004,22(12):6771.

      [2]高聯(lián)雄.智能公交系統(tǒng)數(shù)據(jù)挖掘與應(yīng)用[D].北京:北京郵電大學(xué),2011.

      [3]黃雄偉.基于Web數(shù)據(jù)挖掘的客戶行為分析研究及應(yīng)用[D].武漢:武漢理工大學(xué),2011.

      [4]朱子昊.基于數(shù)據(jù)挖掘技術(shù)的物流信息系統(tǒng)研究[D].上海:上海交通大學(xué),2007.

      [5]劉昱崗,安冬冬.數(shù)據(jù)挖掘在公交調(diào)查數(shù)據(jù)分析中的應(yīng)用研究[J].公路工程,2014,(02).

      [6]楊竟洵.關(guān)聯(lián)規(guī)則挖掘技術(shù)在3PL企業(yè)信息系統(tǒng)中的應(yīng)用研究[D].成都:西南交通大學(xué),2009.

      [7]曹潔,徐強(qiáng).利用數(shù)據(jù)挖掘技術(shù)對公交乘客特征狀況的分析[J].計算機(jī)工程與設(shè)計,2007,28(17):42604262.

      [8]戴穩(wěn)勝,張阿蘭,謝邦昌.數(shù)據(jù)挖掘的方法、流程及應(yīng)用[J].中國統(tǒng)計,2004,(10):535.

      猜你喜歡
      數(shù)據(jù)挖掘
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      數(shù)據(jù)挖掘的分析與探索
      河南科技(2014年23期)2014-02-27 14:18:43
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      库伦旗| 望江县| 平舆县| 鄂伦春自治旗| 菏泽市| 保山市| 四川省| 高安市| 新巴尔虎右旗| 鹤山市| 敖汉旗| 乌兰察布市| 岐山县| 井冈山市| 伊通| 新平| 上思县| 苗栗县| 平阳县| 山阳县| 溆浦县| 米脂县| 民丰县| 井研县| 崇信县| 铁力市| 杨浦区| 万盛区| 康乐县| 陆川县| 志丹县| 丽水市| 且末县| 施秉县| 永康市| 紫阳县| 苗栗县| 吴旗县| 南丹县| 深泽县| 岳池县|