王 虎,喻 立
(武漢理工大學(xué)管理學(xué)院,湖北武漢 430070)
主動服務(wù)就是通過客戶行為差異分析預(yù)測出企業(yè)應(yīng)向客戶提供服務(wù)的內(nèi)容和時機,構(gòu)建基于客戶實時需求的統(tǒng)一信息平臺,有針對性地進行服務(wù)資源的動態(tài)匹配,提升企業(yè)服務(wù)響應(yīng)水平,使企業(yè)將服務(wù)提前,變被動服務(wù)為主動服務(wù),提高客戶對產(chǎn)品的使用滿意度,同時避免企業(yè)因無效服務(wù)導(dǎo)致的資源浪費。服務(wù)挖掘是企業(yè)開展主動服務(wù)的基礎(chǔ),它是以客戶行為特征[1-2]為主要分析對象,將專家知識庫與客戶行為特征分析相結(jié)合,綜合運用數(shù)據(jù)挖掘、知識管理和數(shù)理統(tǒng)計等技術(shù)方法和理論,對客戶所需的服務(wù)進行準確的預(yù)測,從而獲得最佳主動服務(wù)方案的一種科學(xué)方法。
服務(wù)挖掘的基本思路是基于客戶行為數(shù)據(jù)庫,利用各種分析與統(tǒng)計工具,獲取每個客戶對某一特定產(chǎn)品的消費或使用偏好特征,結(jié)合給定的專家知識以及生產(chǎn)商所提供的服務(wù)指南,挖掘出客戶行為特征對每項服務(wù)所產(chǎn)生的影響因子,并結(jié)合預(yù)測模型、標準服務(wù)指南和知識庫,預(yù)測出每個客戶下一次最有可能接受服務(wù)的項目及時間。
對大多數(shù)產(chǎn)品而言,客戶在產(chǎn)品使用時所表現(xiàn)出的行為差異對產(chǎn)品的性能狀況有著直接的影響,這種影響對于缺乏專家知識的一般客戶來說是很難意識到的,當客戶真正意識到需要服務(wù)時,產(chǎn)品往往已經(jīng)出現(xiàn)了明顯的問題,即已經(jīng)對客戶造成了損失。以汽車維修服務(wù)為例,一般情況下都是因為車輛出現(xiàn)了比較明顯的問題,客戶主動前來維修站保養(yǎng)維修車輛,這些問題實際上已經(jīng)對客戶造成了損失,如果能夠掌握客戶車輛的行駛變化規(guī)律,通過客戶使用行為特征分析,了解車輛的性能變化情況,再結(jié)合規(guī)則庫和專家知識庫的推理,預(yù)測出車輛即將發(fā)生的問題,使客戶在問題發(fā)生之前獲得主動服務(wù),從而避免遭受損失[3-4];另以切削加工機床為例,經(jīng)過一段時間的使用后,機床的組件會發(fā)生磨損、偏移和間隙等故障,繼續(xù)使用會導(dǎo)致大量廢品產(chǎn)生甚至造成重大的安全事故。服務(wù)挖掘通過對歷史數(shù)據(jù)進行挖掘,結(jié)合操作者行為分析,可以預(yù)測出將要發(fā)生的故障,及時地解決問題,避免更大的損失。由此可以推斷:客戶行為差異對產(chǎn)品性能狀況的變化有著不同程度的影響,從而導(dǎo)致不同的服務(wù)內(nèi)容和時機,這是服務(wù)挖掘的機理所在?;谶@一點,服務(wù)挖掘試圖對這種影響程度進行衡量,并進一步探究其對標準服務(wù)方案庫的影響,從而獲得更精確的服務(wù)方案。而如何從客戶行為差異信息中提取對服務(wù)產(chǎn)生影響的重要因子,建立起反映客戶主要行為特征的行為指標體系是進行服務(wù)挖掘的基礎(chǔ)。
圖1 服務(wù)挖掘系統(tǒng)框架
基于以上分析,可以獲得服務(wù)挖掘系統(tǒng)的結(jié)構(gòu)框架如圖1所示,該構(gòu)架是對服務(wù)挖掘系統(tǒng)中的構(gòu)成要件以及要件間的相互關(guān)系的進一步描述。根據(jù)服務(wù)挖掘的機理分析,可以將服務(wù)挖掘系統(tǒng)的構(gòu)架分為4個層次,從下層基礎(chǔ)到上層應(yīng)用,分別為數(shù)據(jù)采集層、數(shù)據(jù)處理層、客戶行為分析層和服務(wù)應(yīng)用發(fā)布層。
服務(wù)數(shù)據(jù)采集層采集各類數(shù)據(jù)。采集的數(shù)據(jù)包括國家宏觀數(shù)據(jù)、行業(yè)和企業(yè)微觀數(shù)據(jù)、客戶動態(tài)數(shù)據(jù)和靜態(tài)數(shù)據(jù)4個部分。
數(shù)據(jù)處理層對底層采集的各類數(shù)據(jù)進行整理形成產(chǎn)品和服務(wù)規(guī)則庫、客戶本體數(shù)據(jù)庫和客戶行為特征信息庫。服務(wù)數(shù)據(jù)處理層對客戶靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù)進行處理形成客戶行為特征信息庫和客戶本體數(shù)據(jù)庫,再通過對產(chǎn)品和服務(wù)規(guī)則庫、客戶服務(wù)信息庫和客戶本體數(shù)據(jù)庫的數(shù)據(jù)選擇、預(yù)處理和轉(zhuǎn)換,最終形成主題數(shù)據(jù)倉庫,該庫主要存儲所有與客戶相關(guān)的個體信息。產(chǎn)品和服務(wù)規(guī)則庫主要存儲行業(yè)的現(xiàn)行標準,以及對現(xiàn)行標準的調(diào)整規(guī)則。在服務(wù)數(shù)據(jù)處理層中,數(shù)據(jù)挖掘引擎將抽取算法提供給由數(shù)據(jù)倉庫中提取的數(shù)據(jù),結(jié)合規(guī)則庫以及上一層的專家知識庫,抽取數(shù)據(jù)元素間的模式和關(guān)系,再經(jīng)過濾得到關(guān)注性的知識和信息,即知識發(fā)現(xiàn)。
客戶行為分析層是基于服務(wù)數(shù)據(jù)處理層之上的,這一層的目的主要是通過分析掌握客戶行為特征以及這些特征對服務(wù)的影響因子??蛻粜袨榉治鰧拥闹饕獢?shù)據(jù)來源于數(shù)據(jù)處理層輸出的規(guī)則庫、客戶行為特征信息庫和客戶本體數(shù)據(jù)庫,在分析時需要運用特定的算法對客戶行為進行定量和定性描述,專家知識庫中存儲關(guān)于服務(wù)在特定的行為和環(huán)境下受影響程度的相關(guān)知識,通過分析判斷客戶行為對服務(wù)所產(chǎn)生的影響因子。影響因子進入到服務(wù)規(guī)則匹配系統(tǒng)中,對從服務(wù)數(shù)據(jù)處理層進行分析獲得的預(yù)測及相關(guān)知識給予修正,并進一步推斷出具體的服務(wù)內(nèi)容和服務(wù)時機。
在整個服務(wù)挖掘構(gòu)架中,客戶行為分析是服務(wù)挖掘的核心。在客戶行為分析中,包括客戶行為指標體系構(gòu)建、客戶行為分析和算法實現(xiàn)、客戶行為對服務(wù)內(nèi)容與服務(wù)時機的影響分析等主要內(nèi)容。通過對客戶行為特征數(shù)據(jù)的選取形成初步的客戶行為指標體系,采用數(shù)理統(tǒng)計方法和人工神經(jīng)網(wǎng)絡(luò)、粗糙集等算法對指標進行篩選,進而獲得降維后的精煉指標體系。在此基礎(chǔ)上對主題數(shù)據(jù)倉庫進行挖掘分析,得到客戶個性服務(wù)信息提取,運用云模型、定性推理和本體論的方法進行客戶信息轉(zhuǎn)換,使客戶特征化,從而獲得標準化的客戶行為數(shù)據(jù),最后綜合客戶群共性特征庫構(gòu)建影響模型,通過關(guān)聯(lián)規(guī)則和神經(jīng)網(wǎng)絡(luò)等算法找出個體影響因子,個體影響因子可通過自適應(yīng)學(xué)習(xí)系統(tǒng)的自學(xué)習(xí)方式實現(xiàn)個體影響因子的修正。客戶行為分析流程如圖2所示。
圖2 客戶行為分析流程
在服務(wù)應(yīng)用發(fā)布層,企業(yè)需要對整個服務(wù)供應(yīng)鏈系統(tǒng)進行重構(gòu),即有針對性地整合資源,調(diào)整能力,進行計劃的協(xié)調(diào),最大限度地發(fā)揮現(xiàn)有資源的作用,滿足重點客戶或絕大部分客戶的服務(wù)需求。服務(wù)質(zhì)量取決于客戶期望的服務(wù)與客戶感知到的實際服務(wù)之間的差異,由于服務(wù)挖掘是對最佳服務(wù)的一種事先預(yù)測,通過服務(wù)挖掘提供給客戶的服務(wù)與客戶獲得服務(wù)后的滿意度感知會存在差異,這種差異將及時反饋到服務(wù)挖掘反饋系統(tǒng)感知器中進行自適應(yīng)學(xué)習(xí),隨后的服務(wù)方案輸出將使客戶的感知差異變小。服務(wù)挖掘反饋系統(tǒng)中將涉及到感知器的設(shè)計、自適應(yīng)學(xué)習(xí)的算法實現(xiàn)。
在服務(wù)挖掘中,從數(shù)據(jù)的采集、處理、分析到最后的實施,需要運用各種手段和工具,尤其是各種算法分析工具和數(shù)據(jù)處理工具的合理運作是服務(wù)挖掘效率高低的重要決定因素,在服務(wù)挖掘分析中運用的主要工具涉及到數(shù)據(jù)采集、客戶行為描述、數(shù)據(jù)預(yù)處理和數(shù)據(jù)分析等方面。
在服務(wù)挖掘中,數(shù)據(jù)的采集是基礎(chǔ),與其他數(shù)據(jù)挖掘和分析方式不同,服務(wù)挖掘更多地涉及到客戶的私有數(shù)據(jù)的分析和管理,對數(shù)據(jù)的完備性和及時性有較高的要求。對此,企業(yè)應(yīng)建立多元的客戶數(shù)據(jù)采集系統(tǒng),通過電子商務(wù)平臺收集的數(shù)據(jù)是一種比較高效的方式,采用這種方式收集的數(shù)據(jù)具有較高的時效性,并且是比較清潔的數(shù)據(jù),可以直接用于客戶行為分析。另外通過企業(yè)的客戶關(guān)系管理聯(lián)絡(luò)中心和客戶服務(wù)支持中心也可以獲得客戶的有關(guān)信息,但信息收集的效率取決于客戶的配合程度,其時效性和完備性都難以得到保障,獲得的數(shù)據(jù)需要進行清洗、集成、歸約等技術(shù)處理,這種數(shù)據(jù)采集方式是企業(yè)獲取客戶數(shù)據(jù)的主要渠道。
通過各種渠道采集的原始數(shù)據(jù)是不完整、不一致或含有噪聲的,因此在數(shù)據(jù)挖掘和分析之前,需要對原始數(shù)據(jù)進行清理、集成、變換和歸約處理,只有高質(zhì)量的數(shù)據(jù)才能保證高質(zhì)量的服務(wù)挖掘效果。在對數(shù)據(jù)空缺值進行填充處理時可采用多種方式,如平均值填充、人工填寫,或用最可能的值填充,這時可用Bayesian公式、判定樹等方法通過對現(xiàn)有的數(shù)據(jù)進行歸納判斷出最可能的值進行填充[5-6];數(shù)據(jù)噪聲是指變量中的隨機錯誤和偏差,在坐標上表現(xiàn)為個別點的尖銳凸起,需要用到分箱法、聚類法和回歸法進行處理;數(shù)據(jù)集成是把多個數(shù)據(jù)源中的數(shù)據(jù)整合到一個存儲單元中,在集成中會產(chǎn)生大量的數(shù)據(jù)冗余,往往會用到相關(guān)性分析,如果兩集合中的數(shù)據(jù)具有較大的相關(guān)性,直接集成會產(chǎn)生大量數(shù)據(jù)冗余;在數(shù)據(jù)的變換中,常用到分類、概化和規(guī)范化等方法,數(shù)據(jù)歸約是為了提高服務(wù)挖掘的效率,通過對部分少量數(shù)據(jù)的挖掘和分析可以達到對整體數(shù)據(jù)庫處理的效果,數(shù)據(jù)歸約方式主要有數(shù)據(jù)立方體聚集、維歸約、數(shù)值歸約和壓縮等方式,常用的工具有線性回歸、多元回歸、直方圖和聚類等;數(shù)據(jù)的離散化主要用到分箱、直方圖和基于熵的離散化等方法。
在數(shù)據(jù)采集和數(shù)據(jù)挖掘分析過程中,不可避免地要建立定性描述的語言值和定量表示數(shù)值間的互換模型,實現(xiàn)數(shù)值與符號值之間的隨時轉(zhuǎn)換,連續(xù)量與離散量之間的隨時轉(zhuǎn)換,建立定性與定量彼此間的相互聯(lián)系、相互依存、性中有量和量中有性的映射關(guān)系。云模型和粗糙集是在客戶行為描述中常用到的方法和工具。
在統(tǒng)計數(shù)學(xué)和模糊數(shù)學(xué)的基礎(chǔ)上,可以用云模型來統(tǒng)一刻畫語言值與數(shù)值間的隨機性和模糊性。它是用語言值描述的某個定性概念與其定量表示之間的不確定性轉(zhuǎn)換模型。云的數(shù)字特征反映了定性概念的定量特征,分別用期望值Ex(Expected value)、熵 En(Entropy)和超熵 He(Hyper entropy)3個數(shù)值表示[7]。云的數(shù)字特征是描述云模型、產(chǎn)生虛擬云、實現(xiàn)云計算和完成云變換的數(shù)值基礎(chǔ),也是從含有不確定性的空間數(shù)據(jù)庫或空間數(shù)據(jù)倉庫中發(fā)現(xiàn)空間知識的基礎(chǔ)[8]。云模型使得定性概念與定量數(shù)據(jù)之間的轉(zhuǎn)換變得清晰、具體和可操作,同時又較真實地反映了轉(zhuǎn)換過程的不確定性[9]。
粗糙集理論是一種刻畫不完整性和不確定性信息的數(shù)學(xué)工具,能有效地分析不精確、不一致、不完整等各種不完備的信息,還可以對數(shù)據(jù)進行分析和推理,從中發(fā)現(xiàn)隱含的知識,揭示潛在的規(guī)律[10]。粗糙集的主要優(yōu)勢之一是它不需要任何預(yù)備的或額外的有關(guān)數(shù)據(jù)信息,如統(tǒng)計學(xué)中的數(shù)據(jù)的概率分布或者模糊集理論中的隸屬度等,因此對問題的不確定性的描述或處理是比較客觀的[11]。粗糙集理論是利用數(shù)據(jù)本身提供的信息,在保留關(guān)鍵信息的前提下對數(shù)據(jù)進行約簡并求得知識的最小表達,運用粗糙集方法能識別并評估數(shù)據(jù)之間的依賴關(guān)系[12]。
在服務(wù)挖掘中,要運用概率統(tǒng)計工具和多種算法,各種算法有其各自的特點,適合于不同場合。人工神經(jīng)網(wǎng)絡(luò)、粗糙集、遺傳算法、決策樹和關(guān)聯(lián)規(guī)則是在分析中常用到的算法,在不同的服務(wù)挖掘中運用最合適的算法,即算法匹配是服務(wù)挖掘能否有效的關(guān)鍵。如人工神經(jīng)網(wǎng)絡(luò)就適合于對數(shù)值型數(shù)據(jù)的處理,主要用于分類和預(yù)測,具有較強的魯棒性和容錯性,運算速度較快;而決策樹方法則適合于對非數(shù)值型數(shù)據(jù)的分析和處理,主要用于預(yù)測分析,粗糙集用于對不精確、不完整數(shù)據(jù)的處理,發(fā)現(xiàn)隱含知識、揭示內(nèi)在規(guī)律,關(guān)聯(lián)規(guī)則適合于對離散變量的處理,用于發(fā)現(xiàn)變量之間的內(nèi)在聯(lián)系和規(guī)律[13]。
服務(wù)挖掘模型是建立在客戶行為差異對產(chǎn)品性能變化的影響規(guī)律和影響程度這一機理分析基礎(chǔ)之上的。
客戶行為差異是衡量客戶個體行為與群用戶行為之間關(guān)系的標尺,是實現(xiàn)服務(wù)挖掘的關(guān)鍵。通過比較和度量個體行為特征與客戶群共性特征的偏差,將偏差與歷史服務(wù)數(shù)據(jù)進行比對,可以找出客戶行為偏差對服務(wù)的影響規(guī)律,從而挖掘出所需的服務(wù)。行為差異是客戶行為與服務(wù)之間的聯(lián)系紐帶,將個性和共性特征歸納入庫進行關(guān)聯(lián)規(guī)則運算,可以找到其間的聯(lián)系,進而與客戶服務(wù)數(shù)據(jù)庫對應(yīng),形成服務(wù)方案,從而有針對性地為客戶提供其所需的服務(wù)。根據(jù)客戶行為數(shù)據(jù),對客戶的使用行為習(xí)慣進行統(tǒng)計分析,獲得客戶使用行為的規(guī)律以及客戶對某一特定產(chǎn)品的使用偏好特征,通過聚類分析來劃分不同的客戶群,建立客戶行為指標體系,對客戶的行為特征進行定量化描述,通過關(guān)聯(lián)分析等方法挖掘出客戶行為特征對每項服務(wù)所產(chǎn)生的行為差異影響因子,并結(jié)合標準服務(wù)指南和專家知識庫,預(yù)測出每個客戶下一次最有可能接受服務(wù)的內(nèi)容和時間,經(jīng)客戶認可后的服務(wù)方案將保存于知識庫中或?qū)υ械闹R庫給予更新和完善,產(chǎn)生偏差的服務(wù)方案將反饋到自適應(yīng)學(xué)習(xí)系統(tǒng)中進行自學(xué)習(xí)后的偏差識別,并對原有的服務(wù)方案重新調(diào)整。服務(wù)挖掘模型如圖3 所示[14]。
圖3 服務(wù)挖掘模型
在服務(wù)挖掘模型中,客戶的個性服務(wù)規(guī)則匹配是難點,其中涉及到數(shù)據(jù)和算法的匹配。不同客戶的消費習(xí)慣是不同的,如某些汽車用戶對汽車的使用很有規(guī)律,用途也比較單一,維修部門里有經(jīng)驗的專業(yè)人員通過用戶使用的時間就可以判斷出車輛狀況的變化規(guī)律,而另外的用戶在使用上可能沒有規(guī)律,其消費行為受到很多主客觀因素影響,對不同類型的客戶采取統(tǒng)一的算法是不科學(xué)的。目前服務(wù)挖掘所提供的常用算法有決策樹、人工神經(jīng)網(wǎng)絡(luò)、遺傳算法、粗糙集和關(guān)聯(lián)原則等,這些算法在不同場合中各有優(yōu)缺點。另外一個難點就是客戶數(shù)據(jù)的收集,服務(wù)挖掘中所涉及的客戶數(shù)據(jù)一般是客戶的私有數(shù)據(jù),目前服務(wù)挖掘的應(yīng)用領(lǐng)域還主要集中在通信、保險、汽車修理服務(wù)和銀行等服務(wù)領(lǐng)域,這是因為在這些服務(wù)領(lǐng)域中關(guān)于客戶的信息比較豐富,客戶私有數(shù)據(jù)相對容易獲得,因此如何有效地獲得客戶的私有數(shù)據(jù)是服務(wù)挖掘在應(yīng)用領(lǐng)域得以推廣的關(guān)鍵。
以主動服務(wù)為導(dǎo)向的服務(wù)挖掘是基于客戶行為、知識、服務(wù)規(guī)范和客戶數(shù)據(jù)的綜合應(yīng)用,也是企業(yè)為客戶提供最佳服務(wù)管理的思想方法。在服務(wù)領(lǐng)域,根據(jù)整理的客戶數(shù)據(jù)和選擇的算法,在服務(wù)挖掘的推理層進行數(shù)據(jù)和算法的匹配,結(jié)合客戶行為分析,挖掘出客戶所需要的服務(wù),從而得到最佳服務(wù)解決方案。
[1]馬剛,李洪心,楊興凱.客戶關(guān)系管理[M].大連:東北財經(jīng)大學(xué)出版社,2008:12-65.
[2]曲昭偉,鄭巖,李廷杰.基于聚類實現(xiàn)客戶行為分析[J].東北師大學(xué)報:自然科學(xué)版,2006(6):19-21.
[3]WANG H,GONG C Q,LI Y.Service-mining based on the knowledge and customer databases[C]//Proceedings of 6thIEEE/ACIS ICIS 2007.[S.l.]:[s.n.],2007:561-568.
[4]龔春強.服務(wù)挖掘模型與算法研究[D].武漢:武漢理工大學(xué)圖書館,2007.
[5]陳京民.數(shù)據(jù)倉庫原理、設(shè)計與應(yīng)用[M].北京:中國水利水電出版社,2004:153-175.
[6]王實,高文,李錦濤.Web數(shù)據(jù)挖掘[J].計算機科學(xué)方法,2004(4):58-60.
[7]李德毅.知識表示中的不確定性[J].中國工程科學(xué),2000,2(10):73-79.
[8]范定國,賀碩,段副,等.一個基于云模型的綜合評判模型[J].科學(xué)技術(shù)發(fā)展與經(jīng)濟,2003(9):157-159.
[9]周林.基于云理論和粗糙集的電信家庭客戶聚類分析預(yù)處理研究[D].上海:同濟大學(xué)圖書館,2008.
[10]PAWLAK Z.Rough sets[J].International Journal of Computer and Information Sciences,1982,11(5):341-356.
[11]趙炎,周文.基于粗糙集理論的知識密集型服務(wù)業(yè)集群創(chuàng)新能力評價研究[J].軟科學(xué),2009(4):46-55.
[12]RYBINSKIO M.Reducing information systems with uncertain attributes[C]//9thInternational Symposium on Foundations of Intelligent Systems.[S.l.]:[s.n.],1996:366-375.
[13]陳榮秋,馬士華.生產(chǎn)與運作管理[M].北京:高等教育出版社,2005:288-290.
[14]王虎,毛文婷.基于云模型的電信客戶行為關(guān)聯(lián)規(guī)則研究[J].武漢理工大學(xué)學(xué)報:信息與管理工程版,2009,31(5):769-772.