袁奭暉++汪思敏++丁雄++盧嫣??
摘 要:數(shù)據(jù)挖掘技術(shù)是電子商務(wù)領(lǐng)域未來(lái)應(yīng)用空間最大的一種新技術(shù)。橙光扶農(nóng)平臺(tái)為了以最快的速度和效率推廣滯銷(xiāo)農(nóng)產(chǎn)品,需要迅速找出潛藏于大量客戶群體中可以發(fā)展為愛(ài)心公益推廣使者的志愿者。因此,平臺(tái)利用數(shù)據(jù)挖掘技術(shù),針對(duì)客戶歷史信息中的多個(gè)維度,設(shè)計(jì)了能迅速分析潛在志愿者的客戶細(xì)分模塊,取得了良好的效果。
關(guān)鍵詞:數(shù)據(jù)挖掘;愛(ài)心志愿者;客戶細(xì)分;維度分析;聚類(lèi)分析
中圖分類(lèi)號(hào):F49 文獻(xiàn)標(biāo)識(shí)碼:A doi:10.19311/j.cnki.16723198.2018.05.037
1 引言
扶農(nóng)電子商務(wù)平臺(tái)是一種新興商業(yè)模式,可以有效的幫助農(nóng)民朋友解決滯銷(xiāo)、掉價(jià)等傷農(nóng)問(wèn)題。但在我國(guó)現(xiàn)階段從事扶農(nóng)電子商務(wù)的公司中,業(yè)務(wù)模式缺乏創(chuàng)新、效果不理想、經(jīng)營(yíng)目的缺乏社會(huì)公益性、技術(shù)相對(duì)落后等問(wèn)題比較突出。橙光扶農(nóng)平臺(tái)的基于志愿者公益性推廣模式,無(wú)疑是這一領(lǐng)域的一次新的嘗試。平臺(tái)把一些諸如數(shù)據(jù)挖掘和云計(jì)算等最新先進(jìn)技術(shù)植入到電子商務(wù)平臺(tái)中來(lái)。雖然這些技術(shù)還在不斷的研究改進(jìn),但對(duì)于電商龍頭阿里巴巴等大公司,這些技術(shù)已經(jīng)應(yīng)用于公司的數(shù)據(jù)分析與商業(yè)模式研究,但沒(méi)有全面的為個(gè)人用戶服務(wù)。中國(guó)電子商務(wù)目前依托集約化平臺(tái)的現(xiàn)象十分普遍,比如淘寶、京東等,基本沒(méi)有自己獨(dú)立的客戶分析系統(tǒng),這對(duì)于企業(yè)長(zhǎng)遠(yuǎn)的發(fā)展是不利的,電商市場(chǎng)急需有數(shù)據(jù)挖掘和云計(jì)算功能植入的獨(dú)立系統(tǒng)平臺(tái)。
2 國(guó)外發(fā)展研究現(xiàn)狀
由于國(guó)外許多電子商務(wù)平臺(tái)發(fā)展比較早,也成為我國(guó)電子商務(wù)行業(yè)發(fā)展早期的主要參照。他們的數(shù)據(jù)挖掘、云計(jì)算等技術(shù)也比我國(guó)研究應(yīng)用的早,也已經(jīng)有了相對(duì)成熟的研究模式和成果,并且早已經(jīng)將這些成熟的技術(shù)應(yīng)用到了電子商務(wù)領(lǐng)域。其中Amazon就是其中的佼佼者,其在電子商務(wù)領(lǐng)域不但成了一方霸主,同時(shí)也是云計(jì)算的最早引領(lǐng)者,數(shù)據(jù)挖掘與云計(jì)算已經(jīng)成了其主要業(yè)務(wù)之一??茖W(xué)技術(shù)正在領(lǐng)導(dǎo)世界社會(huì)的進(jìn)步,例如谷歌的無(wú)人駕駛汽車(chē)、三星視網(wǎng)膜識(shí)別技術(shù)都在改變著整個(gè)世界格局。數(shù)據(jù)挖掘技術(shù)在企業(yè)信息系統(tǒng)中的廣泛應(yīng)用已經(jīng)是整個(gè)行業(yè)發(fā)展的必然,技術(shù)不但能提升了自身產(chǎn)品的含金量和競(jìng)爭(zhēng)力,同時(shí)還可以擴(kuò)展公司的業(yè)務(wù)范圍,幫助企業(yè)獲取更多的利潤(rùn)源。
3 橙光扶農(nóng)平臺(tái)客戶細(xì)分系統(tǒng)的需求分析
3.1 橙光扶農(nóng)平臺(tái)建設(shè)背景
近年來(lái),我國(guó)農(nóng)產(chǎn)品滯銷(xiāo)現(xiàn)象層出不窮,傷農(nóng)損農(nóng)顯現(xiàn)不斷出現(xiàn)。一邊是市民抱怨農(nóng)副產(chǎn)品價(jià)格大漲,一邊是農(nóng)民種植的產(chǎn)品低價(jià)賤賣(mài)、血本無(wú)歸。分析這一怪相的原因有很多,比如:中間商壟斷收購(gòu)、壓倉(cāng)抬價(jià);物流不暢、物流成本高;農(nóng)民無(wú)規(guī)劃盲目種植、造成市場(chǎng)供過(guò)于求;一家一戶的分散種植經(jīng)營(yíng)模式,造成農(nóng)產(chǎn)品滯銷(xiāo)、難賣(mài)等等。原因很復(fù)雜,但總歸有一點(diǎn)基本的問(wèn)題就是市場(chǎng)供求信息流通不暢,解決的方法之一就是建設(shè)高效的信息平臺(tái),幫助農(nóng)民和消費(fèi)者之間搭建無(wú)障礙的信息溝通的橋梁。橙光計(jì)劃的主要業(yè)務(wù)目標(biāo)就是通過(guò)建設(shè)的電子商務(wù)系統(tǒng)平臺(tái)幫助農(nóng)戶宣傳、銷(xiāo)售農(nóng)產(chǎn)品,解決農(nóng)戶農(nóng)產(chǎn)品滯銷(xiāo)這一最大的困難。扶農(nóng)平臺(tái)通過(guò)搭建供銷(xiāo)信息平臺(tái)“基地+平臺(tái)+消費(fèi)者”的現(xiàn)代產(chǎn)銷(xiāo)體系,減少中間環(huán)節(jié),減少時(shí)間地理帶來(lái)的經(jīng)濟(jì)損失,引導(dǎo)農(nóng)戶直接和市場(chǎng)對(duì)接。通過(guò)自建的電子商務(wù)交易平臺(tái)加強(qiáng)農(nóng)產(chǎn)品市場(chǎng)信息的發(fā)布,拓寬農(nóng)產(chǎn)品銷(xiāo)售渠道,建設(shè)農(nóng)戶直通消費(fèi)者的網(wǎng)絡(luò)直銷(xiāo)平臺(tái),幫助滯銷(xiāo)的農(nóng)戶銷(xiāo)售出農(nóng)產(chǎn)品。
3.2 客戶細(xì)分的目的與需求
橙光平臺(tái)是以公益志愿者為主參與滯銷(xiāo)農(nóng)產(chǎn)品公益推廣的運(yùn)作模式。通過(guò)了解,我們發(fā)現(xiàn)大部分地區(qū)的農(nóng)戶想要嘗試新的辦法銷(xiāo)售出農(nóng)產(chǎn)品,但是又怕費(fèi)力不討好,讓辛苦培育出的農(nóng)產(chǎn)品銷(xiāo)售不出或者自己虧本。平臺(tái)從全國(guó)各地招募志愿者,家在滯銷(xiāo)地區(qū)的在校大學(xué)生、非滯銷(xiāo)地區(qū)的大學(xué)生、社會(huì)愛(ài)心人士等,家在滯銷(xiāo)地區(qū)的在校大學(xué)生更能清楚的了解滯銷(xiāo)地區(qū)的農(nóng)產(chǎn)品情況,組織志愿者走進(jìn)農(nóng)戶,了解農(nóng)戶農(nóng)產(chǎn)品的銷(xiāo)售情況,向農(nóng)戶推廣電子商務(wù)平臺(tái),普及扶農(nóng)平臺(tái)相關(guān)信息知識(shí),了解市場(chǎng)情況,獲得信任,從而幫助他們銷(xiāo)售農(nóng)產(chǎn)品。讓農(nóng)戶愿意相信我們并愿意嘗試通過(guò)我們的扶農(nóng)平臺(tái)銷(xiāo)售他們的農(nóng)產(chǎn)品。
對(duì)于橙光平臺(tái),基于公益的推廣模式的重要環(huán)節(jié)是從全國(guó)大量的客戶資源中,細(xì)分出能夠成為我們公益推廣使者的客戶群,發(fā)展他們成為我們團(tuán)隊(duì)的成員,從而能最大限度的推廣滯銷(xiāo)農(nóng)產(chǎn)品,更好的幫助農(nóng)民朋友。但在海量的客戶數(shù)據(jù)中,迅速有效的找到適合的群體,一般是十分困難的。不過(guò)目前的數(shù)據(jù)挖掘技術(shù)、云數(shù)據(jù)技術(shù)可以幫我們實(shí)現(xiàn)這個(gè)需求。我們基于客戶的購(gòu)買(mǎi)頻次、金額、數(shù)量、價(jià)格敏感系數(shù)等多個(gè)系數(shù)指標(biāo),設(shè)計(jì)了一套可以進(jìn)行目標(biāo)客戶聚合的客戶細(xì)分系統(tǒng)。
4 用戶細(xì)分系統(tǒng)設(shè)計(jì)
4.1 用戶數(shù)據(jù)的整理
在數(shù)據(jù)挖掘的應(yīng)用過(guò)程中,為了便于進(jìn)一步的深度挖掘,首先要對(duì)數(shù)據(jù)進(jìn)行整理。在我們?cè)O(shè)計(jì)系統(tǒng)的多個(gè)數(shù)據(jù)表中,各表多個(gè)元素之間有很多關(guān)聯(lián),數(shù)據(jù)冗余較多,所以,我們需要進(jìn)行優(yōu)化整理。橙光平臺(tái)的數(shù)據(jù)庫(kù)設(shè)計(jì)共有三個(gè)數(shù)據(jù)庫(kù),并作為數(shù)據(jù)挖掘的三層基本結(jié)構(gòu)。例如:對(duì)于客戶訂單信息數(shù)據(jù),包括有農(nóng)產(chǎn)品信息數(shù)據(jù)、愛(ài)心公益型用戶的信息、訂單物流信息數(shù)據(jù)以及農(nóng)產(chǎn)品訂單數(shù)據(jù)等。首先進(jìn)行第一層面的處理,就是把庫(kù)中多個(gè)表格的數(shù)據(jù)進(jìn)行整合,然后把上層的數(shù)據(jù)進(jìn)行整合,并集成到一個(gè)表中作為第二層,且每一個(gè)表都需要將重點(diǎn)數(shù)據(jù)信息突顯。在第三層中是用于數(shù)據(jù)的展示,方便數(shù)據(jù)的整合。針對(duì)各個(gè)維度,每一個(gè)都需要進(jìn)行數(shù)據(jù)挖掘,以客戶記錄中訂單數(shù)量(order_num)為例,通過(guò)以訂單數(shù)作為主要的對(duì)象進(jìn)行挖掘,可以把所有的客戶數(shù)據(jù)通過(guò)訂單數(shù)這個(gè)字段進(jìn)行聚類(lèi),然后還可以分析其它維度信息,例如農(nóng)產(chǎn)品大類(lèi)的購(gòu)買(mǎi)量和金額,從而去分析挖掘此客戶作為公益發(fā)展代表的可能性。
4.2 數(shù)據(jù)聚類(lèi)的數(shù)學(xué)模型
系統(tǒng)應(yīng)該給所有需要的聚類(lèi)都設(shè)計(jì)一個(gè)數(shù)學(xué)模型,然后再以模型為基礎(chǔ),求出相對(duì)應(yīng)的數(shù)據(jù)集合。我們需要做的假定就是目標(biāo)數(shù)據(jù)集由一系列概率分布的數(shù)據(jù)組成。我們通過(guò)設(shè)計(jì)一個(gè)數(shù)據(jù)分布模型來(lái)對(duì)分布情況進(jìn)行描述,根據(jù)數(shù)學(xué)模型來(lái)尋找一個(gè)區(qū)域,以驗(yàn)證維度分析的可能性。對(duì)于數(shù)據(jù)分布比較分散且不利于數(shù)據(jù)的分析這種情況,可以判斷維度的選擇是不恰當(dāng)?shù)模催^(guò)來(lái)如果數(shù)據(jù)相對(duì)比較集中,則可以判斷區(qū)域聚類(lèi)是有效的。數(shù)學(xué)模型設(shè)定 X={X1,X2,…,Xn}是 n 維的一個(gè)立體模型,當(dāng)中的 X1,X2,…,Xn 分別代表 n 維空間中單獨(dú)的一個(gè)維度。數(shù)學(xué)模型設(shè)計(jì)的算法輸入?yún)?shù)是 n 維空間中的點(diǎn)集合,其中 A={a1,a2,…,an}代表點(diǎn)集中。然后我們確定一個(gè)區(qū)域集,再確定好參數(shù)半徑δ,如果點(diǎn)中心與點(diǎn)的距離在δ以內(nèi),就算作集合的組成項(xiàng)。設(shè)計(jì)的二維空間的距離計(jì)算公式如式1所示:endprint
判斷點(diǎn) A={a1,a2,…,an}是否位于指定區(qū)間{b1,b2,…,bn}內(nèi),只要比較a的每個(gè)分量是否都滿足距離中心距離小于參數(shù)δ。
4.3 客戶細(xì)分的聚類(lèi)
在客戶進(jìn)行細(xì)分時(shí),所有類(lèi)型客戶的參數(shù)都可以進(jìn)行自主調(diào)整,我們首先通過(guò)消費(fèi)者的消費(fèi)總額進(jìn)行第一層面的聚類(lèi),可以得到一個(gè)核心的點(diǎn)為¥450的范圍,然后設(shè)定范圍半徑為¥60,則可以得出此聚類(lèi)范圍的客戶數(shù)量。在進(jìn)行客戶細(xì)分時(shí),不只是通過(guò)購(gòu)買(mǎi)的總額度作為唯一單獨(dú)的維度,還將購(gòu)買(mǎi)農(nóng)產(chǎn)品總次數(shù)、價(jià)格敏感度、下單次數(shù)、區(qū)段時(shí)間內(nèi)購(gòu)買(mǎi)的頻次等信息要素按系數(shù)比例整合,組成一個(gè)特有的愛(ài)心公益客戶數(shù)據(jù)模型,再根據(jù)得出的數(shù)據(jù)結(jié)果進(jìn)行客戶的類(lèi)型級(jí)別的劃分。在我們目標(biāo)客戶群體中,以分析富有愛(ài)心的公益客戶為主,可以發(fā)現(xiàn)多個(gè)不同情況的聚類(lèi)。比如,按照交易的金額進(jìn)行客戶公益熱衷度分類(lèi)的聚類(lèi)結(jié)果,如圖1(a)所示。同時(shí)我們還設(shè)計(jì)了以交易頻次作為分析對(duì)象,設(shè)置1-3次、4-6次、7-10次、10次以上作為維度分析的半徑,分析結(jié)果如圖1(b)所示。
通過(guò)對(duì)各個(gè)維度的因素設(shè)置合理的系數(shù)指標(biāo),我們將客戶的聚類(lèi)分析結(jié)果進(jìn)行匯總,按既定范圍將目標(biāo)的客戶分為三大類(lèi),結(jié)果如圖2所示。從圖中我們發(fā)現(xiàn),公益性強(qiáng)的客戶已基本從大量客戶信息資源中脫穎而出,我們將進(jìn)行下一步吸收擴(kuò)展,從最后的效果上來(lái)看,成功的幾率已比原來(lái)有大幅提高,證明了我們?cè)O(shè)計(jì)的客戶細(xì)分系統(tǒng)在這一應(yīng)用領(lǐng)域的有效性。
5 結(jié)語(yǔ)
橙光平臺(tái)客戶細(xì)分模塊的設(shè)計(jì)實(shí)現(xiàn),能有效的幫助我們?cè)谄脚_(tái)客戶群體中快速找到并發(fā)展富有愛(ài)心的公益群里,能使我們的扶農(nóng)項(xiàng)目在短期內(nèi)達(dá)到理想的營(yíng)銷(xiāo)推廣效果,對(duì)平臺(tái)而言是一個(gè)十分重要的功能。但是,由于開(kāi)發(fā)設(shè)計(jì)的時(shí)間比較短,設(shè)計(jì)者的技術(shù)經(jīng)驗(yàn)不足,此模塊還有許多有待改進(jìn)的地方。后期我們將不斷完善這一模塊的功能,并且將分析的維度進(jìn)一步擴(kuò)大,爭(zhēng)取提高分析結(jié)果的準(zhǔn)確性和合理性。而且,在此基礎(chǔ)之上,未來(lái)我們還要將此技術(shù)應(yīng)用的范圍擴(kuò)大至我們的客戶服務(wù)這一領(lǐng)域,希望建設(shè)一個(gè)更好的平臺(tái)為廣大需要幫助的農(nóng)民朋友和愛(ài)心客戶服務(wù)。
參考文獻(xiàn)
[1]張吉善,胡曉棠,尤惠.數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用[J].科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì), 2007,(6Z):268268.
[2]逄琳,劉方愛(ài).基于層次劃分的密度優(yōu)化聚類(lèi)算法[J].計(jì)算機(jī)應(yīng)用,2016, 36(6).
[3]王碩.數(shù)據(jù)挖掘技術(shù)與電子商務(wù)關(guān)系分析[Z].大學(xué)生論文聯(lián)合比對(duì)庫(kù),2015.
[4]侯俐至.SLA 驅(qū)動(dòng)的 Paa S 平臺(tái)資源管理的設(shè)計(jì)與實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2014.endprint