傅柯萌
摘要:如何利用客戶數(shù)據(jù)已經(jīng)成為了電子商務(wù)目前最關(guān)注的問題。Web挖掘的出現(xiàn),給電子商務(wù)所面臨的問題提供了有效的解決途徑。就這一問題,系統(tǒng)分析了客戶在電子商務(wù)中的重要性以及對(duì)客戶行為的Web挖掘。
關(guān)鍵詞:電子商務(wù);Web挖掘;客戶行為
中圖分類號(hào):F224-39
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):167Z-3198(2009)08-0237-02
1電子商務(wù)中客戶的重要性
營(yíng)銷學(xué)上有個(gè)著名的公式;100-1=0,即一個(gè)企業(yè)即使有100個(gè)客戶對(duì)其感到很滿意,但是只要有一個(gè)客戶對(duì)持否定態(tài)度,企業(yè)的盛名就可能立即化為0,盡管這個(gè)觀點(diǎn)有點(diǎn)夸大其實(shí),但是至少它說明了一個(gè)問題,即:客戶滿意的重要性。
市場(chǎng)經(jīng)濟(jì)體制下,公司的目標(biāo)就是為企業(yè)持股者爭(zhēng)取利潤(rùn)的最大化,而公司的利潤(rùn)從何而來——客戶。換句話說,為客戶服務(wù)能創(chuàng)造長(zhǎng)期的利益,而長(zhǎng)期的利益又能夠滿足持股者的目的需求。雖然,使客戶滿意需要花更多的錢,同時(shí)也需要更長(zhǎng)的周期,但是長(zhǎng)周期加上大量的資金意味著企業(yè)更多的利益。所以,客戶對(duì)企業(yè)的重要性是越來越突出。即使在電子商務(wù)領(lǐng)域這個(gè)遵循市場(chǎng)經(jīng)濟(jì)體制的網(wǎng)上交易體系。這一重要性也是同樣符合的。
如今Google、Amazon、Yahoo、MSN等一些Web公司都要求員工運(yùn)用Web挖掘技術(shù)來了解客戶行為,并根據(jù)挖掘出的信息數(shù)據(jù)及模式設(shè)計(jì)更加符合客戶需求的服務(wù)和產(chǎn)品。也就是說利用Web挖掘可以了解客戶行為,其分析的數(shù)據(jù)結(jié)果可提供給企業(yè)參考,做出合適的調(diào)整策略。
2客戶行為的Web挖掘
2.1挖掘數(shù)據(jù)來源
在挖掘過程中,關(guān)鍵性步驟是提供合適的挖掘?qū)ο?。在電子商?wù)中,客戶行為挖掘的數(shù)據(jù)源,主要有以下幾種:
(1)服務(wù)器日志文件。
Web服務(wù)器日志文件記錄了客戶每次登錄瀏覽網(wǎng)站的行為信息,包括了IP地址、時(shí)間、頁面等,是Web挖掘的主要數(shù)據(jù)源。
(2)Cookies日志文件。
Cookies是服務(wù)器為自動(dòng)跟蹤網(wǎng)站瀏覽者而在客戶端生成的標(biāo)志,用于存儲(chǔ)類似于購物手推車狀態(tài)信息或者瀏覽者所訪問的電子商務(wù)網(wǎng)站的頁面信息或交易信息等。
(3)客戶信息。
客戶信息指客戶通過Web頁在屏幕上輸入的、要提交給服務(wù)器的相關(guān)信息。在電子商業(yè)網(wǎng)站須進(jìn)行信用授權(quán)才能進(jìn)行交易,因此客戶大量的個(gè)人資料會(huì)傳到網(wǎng)站上。對(duì)這些信息組織序化后,存儲(chǔ)到數(shù)據(jù)倉庫中可作為長(zhǎng)期分析客戶消費(fèi)趨勢(shì)的來源。
2.2挖掘過程
對(duì)客戶行為的Web挖掘并不是雜亂無序的,一般其過程可分為三個(gè)階段:
(1)數(shù)據(jù)的預(yù)處理;
預(yù)處理主要對(duì)用戶訪問日志(包含用戶的訪問日志、引用日志和代理日志)進(jìn)行過濾、反蜘蛛化、客戶驗(yàn)證、會(huì)話和路徑補(bǔ)全等處理,形成用戶會(huì)話文件。
①過濾:收集完數(shù)據(jù)后,首要的步驟便是過濾出不想要的記錄,為分析做準(zhǔn)備。
②反蜘蛛化:所謂蜘蛛,就是搜索引擎對(duì)萬維網(wǎng)的掃描建立索引的半自動(dòng)化程序。蜘蛛的行為與人的行為不同(要比客戶的全面),在數(shù)據(jù)處理中要把蜘蛛的行為和客戶的行為區(qū)分開來,并過濾掉蜘蛛行為在服務(wù)器上的記錄。
③客戶驗(yàn)證:在會(huì)話之前必須識(shí)別客戶,一是識(shí)別出同一客戶在一次瀏覽中為建立會(huì)話而發(fā)出的頁面請(qǐng)求,另一目的是識(shí)別在多次站點(diǎn)瀏覽的同一客戶,使我們能夠分析客戶在數(shù)天,數(shù)月或是數(shù)年中的行為。
④會(huì)話;會(huì)話指客戶在一次訪問中訪問的所有Web頁面,通過這些可以反映出訪問者對(duì)網(wǎng)站什么地方有興趣或關(guān)心。
⑤路徑補(bǔ)全;客戶在瀏覽網(wǎng)時(shí)可能出現(xiàn)頁面后退現(xiàn)象,導(dǎo)致路徑損失,所以需要根據(jù)客戶訪問前后頁面進(jìn)行推理,補(bǔ)全訪問路徑。
(2)模式發(fā)現(xiàn):
模式發(fā)現(xiàn)是對(duì)數(shù)據(jù)預(yù)處理所形成的用戶會(huì)話文件,利用數(shù)據(jù)挖掘的一些有效算法,例如統(tǒng)計(jì)分析、關(guān)聯(lián)規(guī)則、聚類、分類等。來發(fā)現(xiàn)隱藏的模式、規(guī)則。
①統(tǒng)計(jì)分析:統(tǒng)計(jì)方法是從電子商務(wù)網(wǎng)站中抽取知識(shí)的最常用的方法??梢愿鶕?jù)選擇的特征來分析網(wǎng)頁此特征的點(diǎn)擊次數(shù),根據(jù)獲得的數(shù)據(jù)結(jié)果來調(diào)整網(wǎng)站。
②關(guān)聯(lián)規(guī)則:根據(jù)關(guān)聯(lián)規(guī)則,可以從客戶訪問網(wǎng)站的行為中找出相關(guān)性。利用這些相關(guān)性,可以改進(jìn)電子商務(wù)網(wǎng)站的結(jié)構(gòu),例如哪些產(chǎn)品可以擺在一起或捆綁銷售。
③聚類和分類:聚類規(guī)則是從一組數(shù)據(jù)項(xiàng)中聚集出相似特征的一個(gè)聚類,可分為用戶聚類和網(wǎng)頁聚類。而分類規(guī)則是找出描述并區(qū)分?jǐn)?shù)據(jù)類或概念的模型,并使用模型預(yù)測(cè)類標(biāo)記未知的對(duì)象類。
(3)模式分析:
在這個(gè)階段,主要是對(duì)挖掘出來的模式、規(guī)則進(jìn)行分析,找出用戶感興趣的模式,并輔助理解。最常見的模式分析方法是采用sQL查詢語句進(jìn)行分析。另一種分析方法是先將數(shù)據(jù)導(dǎo)入并提供可視化的結(jié)果輸出。
3Web挖掘的應(yīng)用
網(wǎng)絡(luò)個(gè)性化服務(wù)是目前電子商務(wù)商業(yè)運(yùn)作和發(fā)展的新方向,它根據(jù)用戶興趣、愛好、習(xí)慣,以及各個(gè)用戶之間的相關(guān)性等向用戶在線推薦商品,提供瀏覽建議,通過不定期調(diào)整網(wǎng)站的結(jié)構(gòu)方便用戶訪問。動(dòng)態(tài)地為用戶定制個(gè)性化的網(wǎng)站等。
如今,許多商家一直在尋求識(shí)別有利可圖的市場(chǎng)分割和追蹤網(wǎng)絡(luò)使用者的行為習(xí)慣,其目的是提醒用戶他們可能感興趣的產(chǎn)品的實(shí)用性。這就出現(xiàn)了像亞馬遜網(wǎng)站那樣的一種新模式,根據(jù)某一特殊用戶可能感興趣的問題提出所需信息。對(duì)于被特征化的用戶,運(yùn)用一些客戶分類、挖掘技術(shù),讓他們了解所感興趣產(chǎn)品的預(yù)報(bào)。
網(wǎng)絡(luò)個(gè)性化服務(wù)的本質(zhì)就是以客戶為中心提供Web服務(wù)。首先,客戶瀏覽訪問電子商務(wù)網(wǎng)站的資源;其次,系統(tǒng)分析客戶行為特性,創(chuàng)建訪問模型;最后,根據(jù)所獲取的信息知識(shí)調(diào)整服務(wù),系統(tǒng)進(jìn)行推薦來滿足不同用戶的個(gè)性化需求。通過客戶與系統(tǒng)不斷的交互,最終為客戶提供個(gè)性化服務(wù)。
4Web挖掘面臨的問題
Web挖掘給電子商務(wù)帶來新機(jī)遇的同時(shí),也帶來潛在的問題——隱私安全問題。網(wǎng)絡(luò)的特點(diǎn)使得我們?cè)诰W(wǎng)站上留下的信息幾乎都可以被全世界獲得。事實(shí)上,對(duì)用戶數(shù)據(jù)的采集和挖掘,有些時(shí)候利用了用戶的注冊(cè)信息和登記信息,這包括客戶姓名、性別、地址、出生年月、電話號(hào)碼、購物習(xí)慣、收入、信用卡號(hào)碼、電子郵件及經(jīng)常訪問的Web站點(diǎn)地址等私人信息。如果這些信息的利用未得到客戶的允許,則會(huì)涉及到隱私權(quán)問題并產(chǎn)生糾紛。
如何對(duì)客戶隱私進(jìn)行保護(hù),我們可以從三個(gè)方面著手:第一,立法進(jìn)行強(qiáng)制性規(guī)范;第二,對(duì)涉及隱私的網(wǎng)上數(shù)據(jù)采取技術(shù)防范;第三,行業(yè)自律,不隨意泄露客戶信息,禁止買賣數(shù)據(jù)等。
5結(jié)語
電子商務(wù)是現(xiàn)代信息技術(shù)發(fā)展的必然結(jié)果,也是未來商業(yè)運(yùn)作模式的必然選擇。運(yùn)用Web挖掘技術(shù)對(duì)電子商務(wù)網(wǎng)站上的客戶行為進(jìn)行分析,挖掘出客戶行為的知識(shí)模式,有助于企業(yè)更好的理解客戶改善客戶關(guān)系,減少費(fèi)用支出并且增加網(wǎng)站靈活性,從而為企業(yè)帶來更高的利益,也加快了電子商務(wù)的發(fā)展。