董敏 王琨
摘 要:隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,大數(shù)據(jù)、云計算和數(shù)據(jù)的深度挖掘等技術(shù)的出現(xiàn),給電子商務(wù)發(fā)展提供了更多的技術(shù)支撐。電子商務(wù)發(fā)展至今,從傳統(tǒng)PC電子商務(wù)平臺發(fā)展到今天的移動電子商務(wù),讓電子商務(wù)這個領(lǐng)域開枝散葉,不斷擴(kuò)展。本文主要是通過對電子商務(wù)平臺中各類型數(shù)據(jù)的采集,對用戶的購物行為和對商品的喜愛特點(diǎn)進(jìn)行各種行為分析,已達(dá)到對用戶購物行為數(shù)據(jù)的深度挖掘。以此可以理性地開展各種形式的電子商務(wù)行為,減少電子商務(wù)活動的成本,實現(xiàn)利益的最大化。
關(guān)鍵詞:電子商務(wù),評價數(shù)據(jù),數(shù)據(jù)挖掘,行為分析
伴隨電子商務(wù)在我國的飛速發(fā)展,各類型的數(shù)據(jù)也呈現(xiàn)快速膨脹階段,已經(jīng)達(dá)到海量級別。在電子商務(wù)平臺中,用戶在購買商品后,大部分會留下購物體驗和對商品使用的感受和心得,這種數(shù)據(jù)稱作為了用戶評價數(shù)據(jù)。用戶評價數(shù)據(jù)很大程度上會影響用戶對該商品的購買的因素。因此,可以通過研究用戶評價數(shù)據(jù),分析數(shù)據(jù)之間的特點(diǎn),挖掘數(shù)據(jù)的價值,就可以優(yōu)化商品的不足之處,提高銷售份額。
一、數(shù)據(jù)挖掘在電子商務(wù)中的作用
數(shù)據(jù)挖掘:英文名稱為Data Mining,是從海量數(shù)據(jù)中分析出有價值、有意義、潛在的信息。并根據(jù)分析結(jié)果對各種決策提供數(shù)據(jù)依據(jù)和技術(shù)上的支撐。如何對海量數(shù)據(jù)進(jìn)行有效利用,使得用戶能夠從海量數(shù)據(jù)中獲得自己所需要的知識和信息,提高其各種活動的效率和價值。
在電子商務(wù)領(lǐng)域中,數(shù)據(jù)挖掘其主要的目的就是從互聯(lián)網(wǎng)中獲取大量有關(guān)于電子商務(wù)相關(guān)的數(shù)據(jù),通過數(shù)據(jù)挖掘手段挖掘出電子商務(wù)活動過程中的潛在價值的信息,以此來指導(dǎo)電子商務(wù)營銷活動,其具體的作用如下幾點(diǎn):
1.根據(jù)用戶的瀏覽商品和購買商品的記錄,挖掘出用戶線上的活動規(guī)律,針對用戶電子商務(wù)活動特點(diǎn),指導(dǎo)電子商務(wù)平臺用戶提供線上的“個性化”服務(wù)。
2.通過對電子商務(wù)網(wǎng)站用戶瀏覽商品頁面數(shù)據(jù)的分析,可以幫助電子商務(wù)平臺挖掘出該商品的潛在用戶。
3.目前對于線上網(wǎng)站來說,主要用戶都來自于搜索引擎和網(wǎng)站自身導(dǎo)航的引導(dǎo),因此如何優(yōu)化網(wǎng)站內(nèi)部關(guān)鍵字和電子商務(wù)平臺內(nèi)部導(dǎo)航,以提高網(wǎng)站訪問流量和方位商品的精準(zhǔn)度。
4.通過對電子商務(wù)平臺中用戶對商品評價數(shù)據(jù)的挖掘,分析用戶購買商品后的情感分析,可以更深層次的挖掘用戶的具體需求。
5.通過平臺Web數(shù)據(jù)的挖掘,可以分析出一定的網(wǎng)站威脅、欺詐、入侵和很多異常訪問行為等。因此通過大數(shù)據(jù)挖掘分析,可以有效預(yù)防網(wǎng)絡(luò)危機(jī),構(gòu)建出一個安全、和諧的網(wǎng)絡(luò)環(huán)境。
隨著大數(shù)據(jù)的廣泛應(yīng)用,數(shù)據(jù)挖掘?qū)τ陔娮由虅?wù)的發(fā)展也起著很大影響,利用數(shù)據(jù)挖掘技術(shù),可以有效的提高用戶訪問數(shù)量,優(yōu)化網(wǎng)站訪問效率,挖掘潛在用戶、優(yōu)化出售商品性能和提高網(wǎng)站安全環(huán)境等級等作用。
二、電子商務(wù)用戶評價數(shù)據(jù)挖掘技術(shù)研究
1.電子商務(wù)數(shù)據(jù)挖掘的過程
數(shù)據(jù)挖掘作為大數(shù)據(jù)的重要發(fā)展方向之一,其主要的目的是挖掘潛在用戶,服務(wù)于用戶,為用戶提供定制化的個性服務(wù)。在電子商務(wù)活動中,數(shù)據(jù)挖掘的服務(wù)對象是在線上的所有用戶,本文主要是研究用戶在電子商務(wù)平臺中各種對評價數(shù)據(jù),包括了對商品評價,物流評價和售后評價等各個方面。
在電子商務(wù)活動中,數(shù)據(jù)挖掘的一般過程分為三個方面:
(1)數(shù)據(jù)準(zhǔn)備階段,在該階段主要是對數(shù)據(jù)進(jìn)行采集、數(shù)據(jù)的預(yù)處理。數(shù)據(jù)采集,采用主題性爬蟲進(jìn)行,通過對電子商務(wù)平臺的結(jié)果進(jìn)行分析,采用面向電子商務(wù)網(wǎng)站的主題網(wǎng)站爬蟲。同時利用云計算平臺的高計算能力、高寬帶量、大吞吐能力等有點(diǎn),將網(wǎng)站爬蟲部署到云計算平臺中,采取并行技術(shù),可以大大提高數(shù)據(jù)采集的效率,同時也可以提高數(shù)據(jù)采集的主題性。
將原始數(shù)據(jù)采集存放到數(shù)據(jù)庫后,接下來就是進(jìn)行數(shù)據(jù)的預(yù)處理階段。數(shù)據(jù)的預(yù)處理就是通過消除噪聲、計算缺值數(shù)據(jù)、數(shù)據(jù)去重,最終將數(shù)據(jù)轉(zhuǎn)換成離散型數(shù)據(jù)的過程。
(2)數(shù)據(jù)挖掘階段,對于采集和預(yù)處理后的數(shù)據(jù),首先要確定是數(shù)據(jù)挖掘目標(biāo)和類型。在確定挖掘具體的任務(wù)后,可以采用相應(yīng)的數(shù)據(jù)挖掘算法進(jìn)行數(shù)據(jù)的挖掘,具體的算法接下來會詳細(xì)介紹數(shù)據(jù)挖掘的主要算法。經(jīng)過數(shù)據(jù)挖掘過程后,會對挖掘的結(jié)果保存到數(shù)據(jù)庫后,以便于接下來的處理。
(3)第三個階段是對挖掘的數(shù)據(jù)結(jié)果進(jìn)行評價,在該階段主要是對發(fā)現(xiàn)的知識,經(jīng)過量化評估后,對存在冗余的知識點(diǎn)和與挖掘目標(biāo)任務(wù)無關(guān)的知識點(diǎn)進(jìn)行清洗。其次就是對挖掘結(jié)果不完全滿足的數(shù)據(jù)進(jìn)行重新挖掘,可以選擇其他數(shù)據(jù)挖掘算法進(jìn)行。對于滿足用戶需求的挖掘結(jié)果數(shù)據(jù),經(jīng)過可視化處理后,提供個用戶進(jìn)行使用。
以上即是數(shù)據(jù)挖掘的三個主要階段,可以看出,數(shù)據(jù)在挖掘過程中,會出現(xiàn)挖掘不理想的情況,因此就需要調(diào)整挖掘算法進(jìn)行反復(fù)挖掘,直到對挖掘目標(biāo)任務(wù)滿足為止,同時保存挖掘不完整的過程,逐步的完善挖掘算法的自我學(xué)習(xí)和深度挖掘的能力,最終完成用戶所提出的挖掘需求。
2.電子商務(wù)數(shù)據(jù)挖掘算法介紹
數(shù)據(jù)挖掘算法是實現(xiàn)數(shù)據(jù)挖掘的關(guān)鍵性技術(shù),采取哪種數(shù)據(jù)挖掘算法會直接影響到數(shù)據(jù)挖掘的效果,以下即是介紹幾種常見的數(shù)據(jù)挖掘算法:
(1)聚類挖掘算法,聚類分析是一種典型的統(tǒng)計學(xué)方法,是一種同數(shù)據(jù)庫技術(shù)相結(jié)合形成的現(xiàn)代化數(shù)據(jù)挖掘最為常用的技術(shù)之一。其主要的思想是在給定的是一個初始化數(shù)據(jù)集中,搜索數(shù)據(jù)對象之間是否存在有價值聯(lián)系。在電子商務(wù)活動中,可以利用聚類分析算法來發(fā)現(xiàn)客戶群中不同特點(diǎn)的群組,從而針對不同的特征群組來優(yōu)化商品上下架、推廣的時間和位置,已提高商品銷售量。
(2)關(guān)聯(lián)規(guī)則分析法,該算法是比較基本的數(shù)據(jù)挖掘算法,其主要的思想是通過大量的數(shù)據(jù)來提取有用的數(shù)據(jù),通過提出對提取數(shù)據(jù)和過去數(shù)據(jù)進(jìn)行比較,找出數(shù)據(jù)與數(shù)據(jù)之間的關(guān)聯(lián)性,從而發(fā)現(xiàn)其潛在的關(guān)系。該算法可以幫助許多商務(wù)決策的制定,為商務(wù)活動的決策提供可靠的數(shù)據(jù)依據(jù)。
(3)時間序列模式,該數(shù)據(jù)挖掘的主要思想是,通過發(fā)現(xiàn)按時間順序查看時間事件數(shù)據(jù)庫,從數(shù)據(jù)中找出一個或多個相似的時序事件,通過時間序列搜索出重復(fù)發(fā)生概率較高的一種挖掘模式。發(fā)現(xiàn)序列模式便于進(jìn)行電子商務(wù)組織預(yù)測客戶的查找模式,從而對客戶進(jìn)行針對性的服務(wù)。在時序模式中,一個重要影響的方法是相似時序。
(4)預(yù)測與評價,該方法與關(guān)聯(lián)規(guī)則分析法有一定的相似性,都是對歷史數(shù)據(jù)進(jìn)行綜合分析和歸納,從而推理出數(shù)據(jù)分布的時效性和規(guī)律性。從而對未來事件發(fā)展的趨勢和結(jié)果進(jìn)行預(yù)測和評估。
3.數(shù)據(jù)挖掘在電子商務(wù)中的具體應(yīng)用
(1)建立電子商務(wù)推薦系統(tǒng),數(shù)據(jù)挖掘應(yīng)用于電子商務(wù)其最大的一個特點(diǎn)就是可以圍繞客戶為中心,為客戶提供個性化服務(wù)。因此可以根據(jù)客戶的喜好和不同的特征,可以建立其一個基于數(shù)據(jù)挖掘的電子商務(wù)推薦系統(tǒng)??梢酝ㄟ^該系統(tǒng)為客戶提供與其感興趣的商品,幫助客戶快速找到所需要的商品,把電子商務(wù)由被動變?yōu)橹鲃印?/p>
(2)優(yōu)化商品的營銷策略,通過對用戶對電子商務(wù)平臺Web頁面的訪問,采集用戶各類評價數(shù)據(jù),進(jìn)行挖掘分析??梢猿浞至私庥脩粼谑褂蒙唐泛蟮恼媲懈惺埽瑥亩鴥?yōu)化商品營銷的策略。針對不同的產(chǎn)品進(jìn)行制定不同的營銷策略,利用數(shù)據(jù)挖掘技術(shù)實現(xiàn)不同的產(chǎn)品優(yōu)惠、各類型促銷活動的策略方針,實現(xiàn)商品銷售利潤的最大化。
(3)優(yōu)化平臺網(wǎng)站結(jié)構(gòu),增強(qiáng)平臺的安全性,對于電子商務(wù)平臺來說,其方位的數(shù)據(jù)量和網(wǎng)站本身的安全性,是有個至關(guān)重要的運(yùn)營因素。有很多方法可以很好的實現(xiàn),但是數(shù)據(jù)挖掘可以通過客戶本身的擁塞和訪問平臺的性能,來提示平臺管理者加以改進(jìn)平臺的各項訪問策略。比如網(wǎng)站的緩存策略、網(wǎng)絡(luò)傳輸策略、流量負(fù)載平衡機(jī)制和數(shù)據(jù)的分布策略等。同時還可以有效防止非法人員惡意訪問平臺,消除平臺的弱點(diǎn),提高站點(diǎn)可靠性,保證平臺的正常運(yùn)行。
4.客戶滿意度分析機(jī)制,對于客戶滿意度的調(diào)查,可以通過各類型調(diào)查問卷來進(jìn)行,但是這種方法最大的缺點(diǎn)就是被動,其效果與客戶填寫資料的主觀性有著很大的影響。因此可以采取數(shù)據(jù)挖掘的方式來進(jìn)行,通過采集和挖掘用戶對商品、物流和客服的評價信息,進(jìn)行情感分析實現(xiàn)主動式的客戶滿意度分析機(jī)制。這種分析機(jī)制可以主動、準(zhǔn)確且客觀的分析出客戶對商品、物流公司和銷售服務(wù)的各項調(diào)查數(shù)據(jù),為改進(jìn)平臺的營銷策略提供可靠的決策依據(jù)。
三、總結(jié)
通過數(shù)據(jù)挖掘技術(shù),對目前電子商務(wù)提出一個更為深刻的課題,打破了傳統(tǒng)的電子商務(wù)線上操作模式。對客戶的行為進(jìn)行深度的分析,為其提供更為有效、更為精準(zhǔn)的商品服務(wù),提供技術(shù)和數(shù)據(jù)上支撐,這也是今后一段時間內(nèi)電子商務(wù)發(fā)展的一個重要方向。
參考文獻(xiàn):
[1]蔣良孝,蔡之華.電子商務(wù)中的數(shù)據(jù)挖掘及其應(yīng)用[J].計算機(jī)工程與設(shè)計,2003,6(24),74-75.
[2]李濤,曾春秋,周武柏,等.大數(shù)據(jù)時代的數(shù)據(jù)挖掘--從應(yīng)用的角度看大數(shù)據(jù)挖掘[J].大數(shù)據(jù),2015,04:1-24.
[3]李雪菁.基于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)客戶關(guān)系管理[J].計算機(jī)與數(shù)字工程,2018.
[4]易新忠.數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用探析[J].現(xiàn)代經(jīng)濟(jì)信息,2018,13.
[5]劉芬.計算機(jī)數(shù)據(jù)挖掘技術(shù)的開發(fā)及其應(yīng)用探究[J].現(xiàn)代工業(yè)經(jīng)濟(jì)和信息化,2018,06.
[6]史紅霞.淺談數(shù)據(jù)挖掘在電子商務(wù)中的具體應(yīng)用期[J].計算機(jī)產(chǎn)品與流通,2018,04.