朱金峰 陳曦
【摘 要】現(xiàn)行煙草專(zhuān)賣(mài)管理對(duì)違規(guī)行為主要采取普查方式,帶有很大的盲目性,浪費(fèi)大量人力資源,同時(shí)也給零售戶帶來(lái)許多不便,影響客戶的滿意度,而現(xiàn)有的違規(guī)預(yù)警系統(tǒng)指標(biāo)單一,預(yù)警準(zhǔn)確率較低。如何利用相關(guān)數(shù)據(jù)挖掘理論研究以及對(duì)現(xiàn)狀的分析,從大量的歷史銷(xiāo)售記錄和與之相關(guān)的各種數(shù)據(jù)中提取信息,建立卷煙違規(guī)銷(xiāo)售預(yù)測(cè)模型,對(duì)零售戶進(jìn)行違規(guī)預(yù)測(cè)為煙草專(zhuān)賣(mài)的檢查工作提供科學(xué)依據(jù),提高檢查的準(zhǔn)確性和及時(shí)性,從而提高專(zhuān)賣(mài)打假的效率,節(jié)約大量人力、物力。本文進(jìn)行了簡(jiǎn)單的探討。
【關(guān)鍵詞】數(shù)據(jù)挖掘;卷煙零售戶;違規(guī);預(yù)測(cè)
煙草銷(xiāo)售由于實(shí)行專(zhuān)賣(mài),銷(xiāo)售規(guī)律有一定的特殊性。煙草專(zhuān)賣(mài)局的一個(gè)重要的任務(wù)是對(duì)卷煙的銷(xiāo)售進(jìn)行市場(chǎng)監(jiān)督管理,對(duì)違規(guī)銷(xiāo)售的行為及時(shí)進(jìn)行查處,以保證煙草市場(chǎng)秩序的穩(wěn)定,然而專(zhuān)賣(mài)管理部門(mén)在確定檢查對(duì)象時(shí),基本上都是采取普查的方式,帶有很大的盲目性,浪費(fèi)大量人力、物力資源,同時(shí)也給零售戶帶來(lái)不必要的麻煩,影響客戶的滿意度,并且查處的準(zhǔn)確率也較低,很多違規(guī)是從事后檢查賬目得到的,從而導(dǎo)致了工作的滯后性,降低了工作的及時(shí)性和有效性。
目前卷煙營(yíng)銷(xiāo)提出“精準(zhǔn)營(yíng)銷(xiāo)”理念,然而如何對(duì)零售戶違規(guī)行為進(jìn)行預(yù)測(cè),實(shí)現(xiàn)專(zhuān)賣(mài)打假工作的精準(zhǔn)化是目前我們需要仔細(xì)研究的一個(gè)問(wèn)題,正是我們所要研究的課題。
一、現(xiàn)狀分析
目前專(zhuān)賣(mài)內(nèi)管信息系統(tǒng)在這方面已經(jīng)進(jìn)行了有益的嘗試,但是其采取的是當(dāng)期銷(xiāo)量與前三周期平均銷(xiāo)量比值這一簡(jiǎn)單的計(jì)算手段,產(chǎn)生大量的預(yù)警信息,其產(chǎn)生的預(yù)警往往都被證實(shí)屬于無(wú)效預(yù)警。
如何利用數(shù)據(jù)挖掘技術(shù),參考多種影響因素,從而獲取一個(gè)比較接近實(shí)際的模型,并將模型與現(xiàn)行的信息系統(tǒng)結(jié)合起來(lái)。通過(guò)對(duì)大量的歷史銷(xiāo)售記錄和與之相關(guān)的各種數(shù)據(jù)的分析,找出各種相關(guān)因素對(duì)違規(guī)行為的影響規(guī)律,使用成熟的算法建立卷煙銷(xiāo)售違規(guī)預(yù)測(cè)模型,對(duì)各個(gè)零售戶的銷(xiāo)售情況進(jìn)行違規(guī)預(yù)測(cè),為煙草專(zhuān)賣(mài)的檢查工作提供重要的科學(xué)依據(jù),提高檢查的準(zhǔn)確性和及時(shí)性,從而提高專(zhuān)賣(mài)打假的效率,節(jié)約大量人力、物力。
二、數(shù)據(jù)挖掘的意義
數(shù)據(jù)挖掘,又稱數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn),是指從大量的、不完全的,有噪聲的、模糊的實(shí)際數(shù)據(jù)中提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息的過(guò)程。
數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又潛在于有用的信息和知識(shí)的獲取過(guò)程。隨著信息技術(shù)的高速發(fā)展,積累的數(shù)據(jù)量急劇增長(zhǎng),動(dòng)輒以TB計(jì),如何從海量的數(shù)據(jù)中提取有用的知識(shí)成為時(shí)代當(dāng)務(wù)之急問(wèn)題。數(shù)據(jù)挖掘就是順應(yīng)這種需要去應(yīng)運(yùn)而生發(fā)展起來(lái)的數(shù)據(jù)處理技術(shù)是知識(shí)發(fā)現(xiàn)的關(guān)鍵步驟。
1.數(shù)據(jù)的處理功能
通過(guò)從現(xiàn)行信息系統(tǒng)中獲取的大量的歷史數(shù)據(jù),建立卷煙銷(xiāo)售違規(guī)的預(yù)測(cè)模型,確立相對(duì)較優(yōu)的參數(shù)。利用大數(shù)據(jù)能夠挖掘客戶的行為習(xí)慣和偏好,在紛繁復(fù)雜的數(shù)據(jù)背后找到更加契合用戶消費(fèi)心理的產(chǎn)品和服務(wù),并有針對(duì)性地調(diào)整和優(yōu)化,使看似枯燥的數(shù)據(jù)產(chǎn)生價(jià)值。目前大部分煙草企業(yè)對(duì)數(shù)據(jù)信息不敏感,只是開(kāi)展基本的采集和統(tǒng)計(jì),沒(méi)有將其轉(zhuǎn)化為戰(zhàn)略資源的意識(shí)和工具,“數(shù)據(jù)豐富,信息匱乏”的現(xiàn)象比較普遍,制約了市場(chǎng)分析和經(jīng)營(yíng)決策能力的深化和提高。
因此,煙草行業(yè)亟需建立基于大數(shù)據(jù)分析與應(yīng)用的信息支撐網(wǎng)絡(luò),通過(guò)對(duì)多維數(shù)據(jù)的整合、運(yùn)算、分析、利用等信息化操作,從海量數(shù)據(jù)中挖掘出隱含的、常規(guī)手段難以察覺(jué)的、對(duì)決策能提供直觀幫助的規(guī)律性認(rèn)識(shí),從而為市場(chǎng)定位、品牌培育、營(yíng)銷(xiāo)策劃、案例分析等實(shí)踐行為提供參考依據(jù)。
2.模型的預(yù)測(cè)功能
在預(yù)測(cè)模型的基礎(chǔ)上,利用客戶當(dāng)前已有的銷(xiāo)售信息,找到可能會(huì)違規(guī)的用戶,并用標(biāo)注預(yù)警等級(jí)。
通過(guò)對(duì)大量的歷史銷(xiāo)售記錄和與之相關(guān)的各種數(shù)據(jù)的分析,找出各種相關(guān)因素對(duì)違規(guī)行為的影響規(guī)律,建立卷煙銷(xiāo)售違規(guī)預(yù)測(cè)模型,對(duì)各零售戶的銷(xiāo)售情況進(jìn)行違規(guī)預(yù)測(cè),為煙草專(zhuān)賣(mài)的檢查工作提供重要的科學(xué)依據(jù),提高檢查的準(zhǔn)確性和及時(shí)性,從而提高專(zhuān)賣(mài)打假的效率,節(jié)約大量人力、物力。
3.數(shù)據(jù)挖掘在專(zhuān)賣(mài)領(lǐng)域的應(yīng)用
真煙非法流動(dòng)是商業(yè)企業(yè)面臨的難題。通過(guò)孤立點(diǎn)分析法可用于確定極低或極高以及品牌高集中的客戶進(jìn)貨行為。孤立點(diǎn)是數(shù)據(jù)集中與其它數(shù)據(jù)對(duì)象顯著不同的數(shù)據(jù),它可能是度量或執(zhí)行錯(cuò)誤所導(dǎo)致的,也可能是固有數(shù)據(jù)變異性的結(jié)果。孤立點(diǎn)分析法就是找出數(shù)據(jù)中的這些孤立點(diǎn),這些客戶的實(shí)際經(jīng)營(yíng)能力值得警惕,我們要采取相應(yīng)對(duì)策做提前預(yù)防。采用孤立點(diǎn)分析技術(shù)對(duì)客戶群進(jìn)行分析,找出與其他客戶明顯不同的客戶進(jìn)行重點(diǎn)關(guān)注和防范。例如某卷煙零售客戶在當(dāng)?shù)責(zé)煵輰?zhuān)賣(mài)批發(fā)企業(yè)進(jìn)貨量比較少,但是經(jīng)營(yíng)規(guī)模比較大,則有可能從其它渠道購(gòu)進(jìn)卷煙或銷(xiāo)售假煙。
三、構(gòu)建模型
1.零售戶的自身特征
(1)經(jīng)營(yíng)規(guī)模。卷煙零售戶的經(jīng)營(yíng)規(guī)模有“大”、“中”、“小”三類(lèi),在模型構(gòu)建過(guò)程中將規(guī)?!按蟆钡臉?biāo)記為“1”,“中”標(biāo)記為“2”,“小”標(biāo)記為“3”。
(2)市場(chǎng)細(xì)分類(lèi)型。由于卷煙零售戶的市場(chǎng)細(xì)分類(lèi)型有五種:“城鄉(xiāng)結(jié)合部”、“農(nóng)村”、“市區(qū)”、“縣城城區(qū)”、“鄉(xiāng)鎮(zhèn)”。
(3)經(jīng)營(yíng)業(yè)態(tài)。分為有11種:百貨店、餐飲(賓館)、大型超市(大型商場(chǎng))、流動(dòng)攤點(diǎn)(小推車(chē))、批零兼營(yíng)雜貨店、小賣(mài)部、一般雜貨店、雜貨店、中小超市(中小超市、百貨店)、專(zhuān)營(yíng)店、娛樂(lè)場(chǎng)所(酒店娛樂(lè)類(lèi))。
(4)商圈類(lèi)型。商圈類(lèi)型有8種,工業(yè)區(qū)、居民區(qū)(村)、旅客中轉(zhuǎn)區(qū)、商業(yè)(集貿(mào))區(qū)、學(xué)區(qū)、娛樂(lè)(旅游)區(qū)、政務(wù)(商務(wù))區(qū)、其他。
2.零售戶的銷(xiāo)售行為
(1)月銷(xiāo)售量差異:即用戶每月銷(xiāo)售數(shù)量與上個(gè)月銷(xiāo)售量差異。
(2)旬銷(xiāo)售量差異:零售戶每旬銷(xiāo)售總量與前三周期平均數(shù)的差異。
3.數(shù)據(jù)預(yù)處理
數(shù)據(jù)質(zhì)量的好壞直接影響數(shù)據(jù)挖掘的質(zhì)量,數(shù)據(jù)的預(yù)處理是數(shù)據(jù)挖掘過(guò)程中至關(guān)重要的一個(gè)步驟,也是耗費(fèi)時(shí)間最多的一個(gè)步驟。數(shù)據(jù)預(yù)處理、尤其是在對(duì)包含有噪聲、不完整,甚至是不一致數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘時(shí),更需要進(jìn)行數(shù)據(jù)的預(yù)處理,以提高數(shù)據(jù)挖掘?qū)ο蟮馁|(zhì)量,并最終達(dá)到提高數(shù)據(jù)挖掘所獲模式知識(shí)質(zhì)量的目的。數(shù)據(jù)預(yù)處理過(guò)程包含數(shù)據(jù)清理、數(shù)據(jù)選擇、數(shù)據(jù)集成、數(shù)據(jù)變換四個(gè)部分。
(1)數(shù)據(jù)清理。清除與建模主題無(wú)關(guān)的數(shù)據(jù),即清除所采集樣本中與銷(xiāo)售數(shù)據(jù)沒(méi)有關(guān)系或者很明顯會(huì)影響建模效果的數(shù)據(jù),本文對(duì)缺失值較多的屬性如性別,學(xué)歷也予以刪除。特別說(shuō)明的是對(duì)噪聲數(shù)據(jù)即異常值的處理:噪聲是指標(biāo)錄入或測(cè)量時(shí)所引入的隨機(jī)誤差或偏差。異常值的存在會(huì)對(duì)分析結(jié)果(平均值與標(biāo)準(zhǔn)差)產(chǎn)生重要影響,對(duì)于出現(xiàn)異常值的記錄,不能簡(jiǎn)單的予以刪除,應(yīng)根據(jù)挖掘主體進(jìn)行具體分析,對(duì)于卷煙違規(guī)銷(xiāo)售預(yù)測(cè),異常記錄正是所要研究的對(duì)象,因此予以保留。
(2)數(shù)據(jù)選擇。刪除建模無(wú)關(guān)指標(biāo),在源數(shù)據(jù)庫(kù)包含的很多客戶信息,某些指標(biāo)沒(méi)有被選取納入初始指標(biāo),需要清除。預(yù)測(cè)模型是建立在屬性相互獨(dú)立的基礎(chǔ)上的,如果不予清除將造成冗余,冗余屬性會(huì)影響預(yù)測(cè)準(zhǔn)確度。對(duì)定量指標(biāo)而言,如果兩個(gè)指標(biāo)之間的相關(guān)性比較大,則會(huì)產(chǎn)生共線性,對(duì)建模結(jié)果會(huì)產(chǎn)生影響,各定量指標(biāo)之間的相關(guān)系數(shù)較小,不存在較嚴(yán)重的共線性。
參考文獻(xiàn):
[1]趙衛(wèi)東.商務(wù)智能, 20011年清華大學(xué)出版社27頁(yè)、82頁(yè)、145頁(yè)、165頁(yè).
[2]張為民.云計(jì)算深刻改變未來(lái), 2009年科學(xué)出版社46頁(yè)、65頁(yè)、192頁(yè).
[3]趙曉秋.現(xiàn)代企業(yè)統(tǒng)計(jì)理論體系創(chuàng)新研究, 2010年經(jīng)濟(jì)科學(xué)出版社12頁(yè)、216頁(yè).
[4]朱明.數(shù)據(jù)挖掘?qū)д揫M].合肥:2012年中國(guó)科學(xué)技術(shù)大學(xué)出版社.