趙家胤
(南京信息職業(yè)技術(shù)學院數(shù)字商務(wù)學院,江蘇 南京 210013)
近些年來,電子商務(wù)市場發(fā)展迅速,消費者選擇網(wǎng)絡(luò)購物的比例也日趨增長。隨之而來的是消費者對網(wǎng)絡(luò)購物體驗的要求日益提高。因此,傳統(tǒng)的較為模糊的指標體系己經(jīng)不能很好地評價現(xiàn)今互聯(lián)網(wǎng)電子商務(wù)顧客滿意度[1]。最近幾年,國內(nèi)外學者專家在電子商務(wù)滿意度方面的研究逐漸變多,但仍未形成統(tǒng)一完善的標準,很多評價方式依舊存在弊端與局限性。
顧客滿意度一般包括商品滿意、服務(wù)滿意、理念滿意等方面。倉星星[2]歸納了五種因素來研究電商品牌形象對顧客滿意度的影響。陳振華[3]基于ACSI 模型來研究商品、平臺、配送質(zhì)量對顧客消費感知的影響,以此來評價生鮮電商顧客滿意度。劉瀟等[4]提出了結(jié)構(gòu)方程模型,研究了在B2C 中與配送相關(guān)的指標對電子商務(wù)滿意度的影響。本文在己有研究成果的基礎(chǔ)上,結(jié)合B2C 電子商務(wù)運營模式特點及顧客滿意度的影響因素,并對己有指標體系的指標進行優(yōu)化,運用模糊綜合評價法構(gòu)造一套電子商務(wù)顧客滿意度測度指標體系[5],對顧客滿意度做出科學定量的綜合評價,并對所選擇的電商平臺和物流公司的業(yè)績情況分別進行動態(tài)綜合評價[6]。
近年來,隨著機器學習理論以及深度學習成為學術(shù)界的研究熱點,其應(yīng)用場景也日益廣泛,其中便包含了電子商務(wù)滿意度評價[7]。Lakkaraju 等[8]提出了一系列概率模型,這些模型基于有關(guān)情感表達的內(nèi)容,以監(jiān)督的方式建模,在多點尺度上對情感主題進行排序。Turdja 等[9]利用機器學習方法通過分析客戶情緒來判斷客戶滿意度。Mikolov 等[10]將Word2Vec 應(yīng)用于滿意度評價模型,該方法表示能夠有效學習語義信息。在分布式表示基礎(chǔ)上,Socher 等[11]提出了采用遞歸神經(jīng)網(wǎng)絡(luò)捕獲文本信息,從而識別文本中所隱含的意見傾向。本文基于機器學習方法,從商品評論信息的角度,展開對電子商務(wù)滿意度的評價研究。
顧客滿意度用來衡量顧客實際接受服務(wù)與期望服務(wù)的相關(guān)關(guān)系。SCSB 模型(Sweden Customer Satisfaction Barometer)是最早建立的全國性顧客滿意指數(shù)模式,其中包含了5 種變量,分別是:客戶感知、客戶滿意、客戶忠誠、客戶期望以及客戶投訴[12]。而在1999 年,依照中國國情,清華大學建立了中國國情的滿意度評價模型CCSI。
目前電子商務(wù)顧客滿意度的研究方式主要采用問卷調(diào)查的方式。但這些方式不僅會花費大量的時間,而且樣本的覆蓋面有一定局限性,效果往往也一般。
對于顧客滿意度評價指標體系,以讓消費者滿意為核心,確定一級指標為消費者對電商平臺(或者電商)、商品、物流公司的滿意度,根據(jù)電商平臺、商品、物流公司的類型特點,分別給出對其進行評價的二級指標。
建立模型進行篩選,排除不具有代表性的數(shù)據(jù),對各項二級指標進行平均求值,計算得出一級指標的值,進而確定評價體系及其指標,如圖1 所示。
圖1 模糊綜合評價流程
這里選取的電商為華為,物流公司為申通。在評價華為時,從銷售量、營業(yè)額、市場占有率三個層面來分析,在評價申通時,從貨運量、營業(yè)額、市場占有率三個層面來分析。從數(shù)據(jù)統(tǒng)計來看,兩者有其相似性,在對它們進行評價時,要充分考慮不同時期它們各項指標的“質(zhì)差”與“量差”。
考慮到評價指標的“質(zhì)差”與“量差”的關(guān)系,在確定綜合評價指標時,既要能體現(xiàn)不同類型指標之間的差異,也要能體現(xiàn)同類型指標的數(shù)量差異。從實際問題出發(fā)分析確定不同的權(quán)函數(shù)。對于不同的指標可以取相同的權(quán)函數(shù),也可以取不同的權(quán)函數(shù)。
自1965 年模糊理論被Zadeh L A[13]提出以來,其中的模糊綜合評價問題至今已經(jīng)形成了一套相對完整的體系。模糊綜合評價方法的基本思想是,以模糊數(shù)學、模糊線性變換原理和最大隸屬度原則為基礎(chǔ),考慮所需評價事物的各個評價指標因素,對其做出合理的優(yōu)劣、等級評價。它利用隸屬函數(shù)作為橋梁,將不確定性非量化因素在形式上轉(zhuǎn)化為確定性量化結(jié)果,即將模糊性加以量化,從而可以利用傳統(tǒng)的數(shù)學方法對其進行分析及處理,本質(zhì)上是應(yīng)用模糊關(guān)系合成,從多個因素對評價對象隸屬等級狀況進行綜合評價的一種方法。
(1)缺失數(shù)據(jù)的處理。對于數(shù)據(jù)中存在的缺失現(xiàn)象,本文采用均值替換法(Mean Imputation)對缺失數(shù)據(jù)進行替換。均值替換法就是將該項目剔除異常數(shù)據(jù)后,取剩余數(shù)據(jù)的平均值來替換異?;蛉笔?shù)據(jù)的方法,如下式所示:
(2)相關(guān)數(shù)據(jù)的篩選。根據(jù)利益相關(guān)性模型篩選指標,篩選剔除與滿意度無關(guān)的指標,如被調(diào)查者的性別、華為公司的成立時間等。
在篩選過后,我們對問卷上的問題進行概括,總結(jié)得出10 個二級指標。其中售后服務(wù)、知名度、客服態(tài)度為華為官網(wǎng)旗艦店滿意度評價指標體系中的二級指標,手機外觀、手機性能、手機價格為華為手機滿意度評價指標體系中的二級指標,物流速度、安全性、服務(wù)態(tài)度、物流價格為申通物流滿意度評價指標體系中的二級指標。具體分類如表1~表3 所示。
表1 對華為商城滿意度評價指標體系的建立
表2 對華為手機滿意度評價指標體系的建立
表3 對申通物流滿意度評價指標體系的建立
由收集數(shù)據(jù)可分別得出顧客對華為的售后服務(wù)、知名度、客服態(tài)度,手機外觀、手機性能、手機價格,申通的物流速度、安全性、服務(wù)態(tài)度、物流價格的滿意度評價。非常滿意為5 分,滿意為4 分,基本滿意為3 分,不滿意為2 分,很不滿意為1 分,各項指標5 年總評價采用年平均滿意度(u)計算。
可知顧客對華為官網(wǎng)旗艦店滿意度為3.664分,對華為手機滿意度為3.582 分,顧客對申通物流滿意度為3.600 分??梢钥吹剑櫩蛯θA為官網(wǎng)旗艦店、華為手機、申通物流滿意度均為滿意。
對5 年來3 個環(huán)節(jié)總體進行評價,采用模糊綜合評價模型,具體步驟如下:
(1)選取因素集U={ 顧客對華為官網(wǎng)旗艦店年平均滿意度u1,顧客對手機年平均滿意度u2,顧客對申通物流年平均滿意度u3}
(2)選取評語集V={ 非常滿意v1=5,滿意v2=4,基本滿意v3=3,不太滿意v4=2,很不滿意v5=1}
(3)確定各因素權(quán)重:A(0.3,0.4,0.3)
(4)確定綜合判斷量:加權(quán)平均滿意度R=A·U=3.61
(5)構(gòu)造模糊隸屬函數(shù):為連續(xù)量化,取偏大型柯西分布和對數(shù)函數(shù)作為隸屬函數(shù):
式中,α、β、a、b為待定常數(shù)。當“很滿意”時,隸屬度為1,即f(5)=1;當“較滿意”時,隸屬度為0.8,即f(3)=0.8;當“很不滿意”時,隸屬度為0.01,即f(1)=0.01;據(jù)此計算得α=1.108 6,β=0.894 2,a=0.391 5,b=0.369 9,則
由此可計算隸屬度f(R)=f(3.61)=0.869 3,根據(jù)計算結(jié)果可知整體上很滿意。
圖2 隸屬函數(shù)
模糊綜合評價模型的因素權(quán)重需要采用主觀賦權(quán)的方式,這會導致模型最終的結(jié)果強烈依賴于因素權(quán)重的好壞,具有很強的主觀成分。針對這一問題,本文提出采用隨機森林[14]這種客觀的傳統(tǒng)機器學習算法來建立滿意度評價模型。
隨機森林(Random Forest)算法是一種通用的分類和回歸方法。它通過集成學習的思想將多棵決策樹集成,集成了所有的分類投票結(jié)果,將獲得投票次數(shù)最多的類別指定為最終的分類結(jié)果,其在變量數(shù)量遠遠大于觀察結(jié)果數(shù)量的情況下顯示出了出色的性能。隨機森林算法具有以下優(yōu)點:
(1)模型引入了隨機性,不容易過擬合,具有較強的魯棒性;
(2)訓練速度快,可以并行化計算;
(3)可以處理離散型、布爾型、連續(xù)型數(shù)據(jù),無需做規(guī)范化以及特征選擇,通過計算特征重要性可以判斷出不同特征的重要程度。
基于以上優(yōu)點,隨機森林模型可以很容易適應(yīng)各種特殊的學習任務(wù),并且適用于本文的評價模型。隨機森林算法的流程如圖3 所示。
圖3 隨機森林分類算法流程
本文應(yīng)用隨機森林算法對華為商城手機購物滿意度的評價數(shù)據(jù)進行分類預測。數(shù)據(jù)集包括關(guān)于電商平臺對手機(性能和價格)、服務(wù)(銷售和售后)以及物流等相關(guān)信息共2 000 條。消費者對購買手機時的各因素滿意程度進行打分,滿分為5 分,同時,消費者也會對整體的手機購物滿意度進行打分,分為兩個類別:“滿意”與“不滿意”,這將作為數(shù)據(jù)集的標簽。
本文對所有評論語料進行分詞,由于分詞后的詞組數(shù)量較大,全部計算會導致矩陣運算維度過高,因而需要依據(jù)詞組的信息增量選取區(qū)分度高的詞組作為候選特征,本文選取的特征維數(shù)為40,每個特征統(tǒng)計當前評論文本中當前特征詞集合詞組的出現(xiàn)總數(shù)。除此之外,本文將上文的二級指標手機性能、手機價格、手機外觀、售后服務(wù)、快遞速度、物流安全等因素的得分也作為候選特征,因而模型的輸入特征維度為n=50。
實驗中數(shù)據(jù)劃分為訓練數(shù)據(jù)占比80%,其余部分作為測試數(shù)據(jù)。模型在預測的過程中利用訓練集生成對應(yīng)的隨機森林,利用特征向量來預測滿意度情況。
隨機森林選取CART 樹作為弱分類器決策樹,總共建立19 棵CART 樹,最大特征數(shù)量m分別設(shè)置為5、10、20 進行對比。
為了驗證隨機森林算法的性能,本文選擇了常用的機器學習文本分類模型作為基線模型,包括邏輯回歸(Logistics Regression,LR)模型以及支持向量機(Support Vector Machine,SVM)模型,與本文所使用的隨機森林模型進行對比。實驗結(jié)果如表4所示。
表4 華為商城手機購物滿意度分類結(jié)果
由實驗結(jié)果可以看到,本文所提出電子商務(wù)滿意度評價模型,整體上的表現(xiàn)比兩個基線模型的性能要稍微好些,也證明了本問題所提出的評價模型的有效性和可行性。
對比m的不同取值可以看出,當m=10 的時候,模型的性能最佳。通過計算隨機森林模型的特征重要性可以看出,對最終的滿意度得分影響較大的特征包含了手機性能、手機外觀以及手機價格的得分,這說明顧客對華為手機的滿意度對整體的滿意度影響較大,這也與上文模糊綜合評價模型的因素集權(quán)重一致。另一方面,模型的特征重要性驗證了隨機森林具有在不需要做特征選擇的情況下可以判斷出不同特征的重要程度的優(yōu)點。
本文首先運用模糊綜合評價建立服務(wù)滿意度綜合評價模型,通過建立評價指標體系以及確定因素集權(quán)重,構(gòu)造隸屬函數(shù)可以計算出顧客滿意度。然而,由于這種評價模型屬于主觀評分,類似于體育比賽中對運動員的打分,所以這種主觀上的打分很可能受個人因素的影響,因而本文通過采用正態(tài)分布檢驗驗證了調(diào)查數(shù)據(jù)中評分的合理性。而針對上述問題,本文應(yīng)用機器學習算法隨機森林建立客觀的滿意度評價模型,對華為商城手機購物滿意度的評價數(shù)據(jù)進行分類預測。實驗表明,本文所提出的滿意度評價模型是有效的,并且相比于其他基線機器學習模型,具有更加良好的性能,同時能夠有效識別出對最終滿意度得分影響較大的特征,驗證了模糊綜合評價模型中因素集權(quán)重的合理性。
本文的工作還可以更深入研究精細的應(yīng)用場景,比如可以針對具體商品根據(jù)評論信息,分析消費者對商品屬性的滿意程度,以便更精準地評價影響電子商務(wù)滿意度的各個因素。