許霞++唐浩++汪永超
摘要:互聯(lián)網(wǎng)使用與發(fā)展使得電子商務(wù)在現(xiàn)代企業(yè)的地位日益加重,因此如何充分利用網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)庫技術(shù)的業(yè)務(wù)優(yōu)勢,是目前所企業(yè)關(guān)注的一個重要問題。本文介紹了常用的數(shù)據(jù)挖掘和利用數(shù)據(jù)挖掘技術(shù)在電子商務(wù)分析領(lǐng)域的技術(shù)應(yīng)用和建立動態(tài),高效的電子商務(wù)的可行性,并做出更具針對性的電子商務(wù)網(wǎng)站,使得用戶體驗更加人性化,并為企業(yè)提供數(shù)據(jù)以支持業(yè)務(wù)決策。
關(guān)鍵詞:數(shù)據(jù)挖掘;數(shù)據(jù)倉庫;電子商務(wù);信息處理
中圖分類號:TP274 文獻識別碼:A 文章編號:1001-828X(2016)007-000-01
電子商務(wù)使得公司在發(fā)展商務(wù)活動的過程中得到大量的復(fù)雜的數(shù)據(jù),這些數(shù)據(jù)需要通過一種方法將它轉(zhuǎn)變成有用的信息和知識,從而為公司創(chuàng)造出應(yīng)有價值。因此,通過在互聯(lián)網(wǎng)對大量數(shù)據(jù)進行挖掘分析,從而對公司企業(yè)帶來無比巨大的效益。通過數(shù)據(jù)挖掘技術(shù),找出其中有效信息,進來調(diào)整企業(yè)營銷策略,改善客戶服務(wù),使得企業(yè)的服務(wù)更加便捷更加人性化。
一、如何進行數(shù)據(jù)挖掘
挖掘數(shù)據(jù)過程可以分為3個步驟:
1.數(shù)據(jù)預(yù)處理。將數(shù)據(jù)文件或數(shù)據(jù)庫合并;很多來自有效的數(shù)據(jù)分析得出的無用數(shù)據(jù),除去無用的數(shù)據(jù),并將其轉(zhuǎn)換成以促進數(shù)據(jù)挖掘的格式等。
2.模式發(fā)現(xiàn)。通過模式發(fā)現(xiàn)來搜尋其中的能夠用到的新的有效信息。web挖掘技術(shù)可以用于路徑選擇,相關(guān)分析,分類規(guī)則,聚類分析,序列分析等。
3.模式分析。從相位檢測模式得到的模式的分析模型,通過技術(shù)手段,從中過濾掉不感興趣的信息,得出有意義的結(jié)論。常用的技術(shù)有:關(guān)聯(lián)規(guī)則,分類,聚類,序列模式等。
二、在電子商務(wù)活動中數(shù)據(jù)挖掘的作用
數(shù)字挖掘技術(shù)通過挖掘潛在信息來指導(dǎo)電子商務(wù)活動,通過這種方式來達到服務(wù)電子商務(wù)的目的。在電子商務(wù)中的作用有7個方面:
1.通過在客戶瀏覽網(wǎng)站時反饋的信息來改善網(wǎng)絡(luò)服務(wù),提升客戶的服務(wù)質(zhì)量。
2.在對電子商務(wù)網(wǎng)站的瀏覽信息中挖掘潛在的客戶。
3.通過挖掘商務(wù)網(wǎng)站的訪問者的各類信息需求來優(yōu)化服務(wù),更加深入了解客戶所需。
4.挖掘客戶的購買需求與習(xí)慣來幫助開發(fā)產(chǎn)品和定制合理的促銷策略。
5.通過對商品的訪問狀況和銷售狀況來優(yōu)化營銷活動。
6.針對不同客戶提供不同的信息導(dǎo)航,方便客戶的瀏覽。
7.通過收集客戶在瀏覽時出現(xiàn)的各類錯誤,來發(fā)現(xiàn)該網(wǎng)站的漏洞以及不合理的部分,并改善問題,從而提高網(wǎng)站的穩(wěn)定和解決客戶的問題,以確保購物的效率。
三、常用在電子商務(wù)活動的數(shù)據(jù)挖掘方式
1.分類
數(shù)據(jù)挖掘分類啟動一批已經(jīng)分類數(shù)據(jù)集(訓(xùn)練集)來獲取數(shù)據(jù)集中的知識。從而應(yīng)用此模型(知識)的未分類的新數(shù)據(jù)進行分類。它的目標(biāo)是分類或分類功能,數(shù)據(jù)項數(shù)據(jù)庫用于特定類別的模型。分類的主要方法是基于數(shù)據(jù)分類樹模型,貝葉斯分類算法,ID3算法和基于算法的神經(jīng)網(wǎng)絡(luò)等。例如,在醫(yī)療應(yīng)用中,對象可以被劃分成兩種類型患病和未患?。辉谒械呢攧?wù)中,該對象可以分為低風(fēng)險和高風(fēng)險類別。
2.聚類分析
聚類分析是一組相似的數(shù)據(jù)因之間的差異而被分成幾類,其目的是使該各種類別之間的數(shù)據(jù)相似性屬于同一個類別。聚類分析是數(shù)據(jù)挖掘的最常用的技術(shù)。聚類分析常用的方法有:聚類分割方法,層次聚類方法,基于密度聚類方法和罕見的高維聚類算法。從聚類分析的不同和分級的方法聚類分發(fā)數(shù)據(jù)之前,它們沒有任何意義。在通過多次的刪除或添加變量影響的分類方式,可以從中得到我們想要的最佳結(jié)果。使用電子商務(wù)的聚類分析的方法也非常廣闊。一個典型的應(yīng)用就是幫助企業(yè)通過數(shù)據(jù)分析來發(fā)現(xiàn)不同客戶的不同需求,以及不同的方式來分享獲取,對客戶提供更細致的服務(wù)。
3.關(guān)聯(lián)規(guī)則挖掘
關(guān)聯(lián)規(guī)則是描述一個事物某些項目可以導(dǎo)出到其他項目的數(shù)據(jù)點數(shù)據(jù)庫之間的關(guān)系出現(xiàn),這是隱藏在之間的相關(guān)性或關(guān)系規(guī)則數(shù)據(jù),例如,在相關(guān)的采集的事件購買各種產(chǎn)品。在電子商務(wù),有一個由交易數(shù)據(jù)大量且有趣的業(yè)務(wù)關(guān)系,它可以幫助使許多商業(yè)決策。在典型的購物籃分析中,通過客人對購物籃中商品的分類,來得到不同產(chǎn)品之間的聯(lián)系并得到?jīng)Q策制定。典型的應(yīng)用是超市的客戶,以確定哪些產(chǎn)品將被放置在一個購物車或購物籃,他們就會購買這些商品。這些信息可以幫助零售商選擇調(diào)節(jié)分配和貨架,行李箱出售。例如,將牛奶和面包放在一起刺激客人去同時購買這些商品。在電子商務(wù),Web服務(wù)器因為日志文件記錄訪問用戶數(shù)據(jù),這些數(shù)據(jù)通過使用客戶挖掘關(guān)聯(lián)規(guī)則來購買產(chǎn)品的網(wǎng)上某些偏好和品牌忠誠的相關(guān)性,價格可以接受的范圍內(nèi)和包裝要求的結(jié)果可以用來挖掘,以幫助管理人員計劃,確定投資品,價格和新產(chǎn)品的類型。
4.序列模式分析
關(guān)聯(lián)規(guī)則挖掘模型和類似的序列分析,而是側(cè)重于之前和序列分析后的數(shù)據(jù)之間的關(guān)系。他發(fā)現(xiàn),在一定的時間期限內(nèi)形式的數(shù)據(jù)庫,顧客購買商品1,然后購買商品2,然后購買商品3,會出現(xiàn)1-2-3這樣的多次出現(xiàn)的數(shù)據(jù)。描述序列分析模型的問題是,每個序列是按照調(diào)節(jié)與交易的時間進行,在一個特定的數(shù)據(jù)庫事務(wù)的序列,如果序列功能的事務(wù)處理流程數(shù)據(jù)庫代理定義了一組,高頻序列數(shù)據(jù)庫會出現(xiàn)。當(dāng)連續(xù)模型的分析,還要求用戶輸入至少最低的最低支持C和信任S。序列模式促進電子商務(wù)組織預(yù)測的方法給客戶端,從而進行有針對性的廣告服務(wù)或建議,盡力滿足客人的各式各樣要求。
四、結(jié)語
電子商務(wù)是現(xiàn)代信息技術(shù)的發(fā)展與應(yīng)用,它給人們帶來便捷的同時也給企業(yè)與公司帶來了新的商業(yè)模式,并為未來的商務(wù)網(wǎng)站的運營提供了有力保障。而電子商務(wù)網(wǎng)站離不開數(shù)據(jù)挖掘技術(shù),利用數(shù)據(jù)挖掘技術(shù)來分析大量數(shù)據(jù),可以挖掘客戶購買習(xí)慣以及瀏覽習(xí)慣來分析策略,并幫助企業(yè)制定有效的營銷策略,充分發(fā)揮優(yōu)勢獨特的企業(yè),推進技術(shù)創(chuàng)新和管理創(chuàng)新,增強企業(yè)的競爭力。
參考文獻:
[1]吳春瓊.淺析數(shù)據(jù)挖掘技術(shù)及其在電子商務(wù)中的應(yīng)用[J].黑龍江科技信息,2009,(30):90.
[2]葉俊,胡同森.數(shù)據(jù)挖掘技術(shù)及其在電子商務(wù)中的應(yīng)用[J].麗水學(xué)院學(xué)報,2010,32(2):42-47.
[3]孫學(xué)軍.Web文本數(shù)據(jù)挖掘技術(shù)及其在電子商務(wù)中的應(yīng)用[J].菏澤學(xué)院學(xué)報,2011,33(2):35-39.