李春月
(黑龍江八一農(nóng)墾大學(xué),大慶 163319)
隨著我國互聯(lián)網(wǎng)技術(shù)的不斷進(jìn)步,電子商務(wù)也在快速的發(fā)展。且相比于線下的實體店而言,電商平臺的產(chǎn)品種類更為豐富,產(chǎn)品價格也相對較低,這些優(yōu)勢也就吸引著越來越多的消費者嘗試在線上進(jìn)行購物。根據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)所發(fā)布的互聯(lián)網(wǎng)絡(luò)發(fā)展報告顯示,截至2019年6月,我國網(wǎng)絡(luò)購物的用戶規(guī)模已達(dá)到6.39億,占網(wǎng)民總數(shù)的74.8%。由此可知,線上的電商平臺已經(jīng)成為了消費者購物的主要渠道。而在線評論作為消費者在制定購買決策時所要參考的內(nèi)容,其中包含著大量的信息。這些信息也能夠幫助電商企業(yè)了解消費者對產(chǎn)品及服務(wù)的關(guān)注情況以及滿意度的情況,從而能夠及時優(yōu)化自身服務(wù)進(jìn)而提高消費者對商家的整體滿意度,提高消費者的購買率,促進(jìn)企業(yè)更好更快的發(fā)展。
評論信息已然成為了口碑傳播的重要方式,通過在線評論,消費者能夠?qū)ιr電商提供的各項服務(wù)情況有著更為準(zhǔn)確的了解,同時,電商企業(yè)也能夠通過消費者的在線評論了解消費者的需求,以優(yōu)化自身的服務(wù)。近年來學(xué)者對在線評論的相關(guān)研究在不斷地增多。通過整理發(fā)現(xiàn),現(xiàn)有對在線評論的研究主要集中在兩個方面。
一為從評論區(qū)中所獲取的數(shù)值型信息,如Dellarocas[1]對評論數(shù)量進(jìn)行研究,結(jié)果表明,產(chǎn)品評論的總體數(shù)量會對產(chǎn)品的銷量產(chǎn)生顯著的影響;Liu[2]對Yahoo網(wǎng)站上的電影評論進(jìn)行分析,研究的結(jié)果證明了在電影行業(yè)中評論的數(shù)量會對電影票房產(chǎn)生顯著的正向的影響作用;Susan M.Mudambi[3]對亞馬遜網(wǎng)站產(chǎn)品評論的研究,證明評論深度、產(chǎn)品類型會對消費者的購買行為產(chǎn)生相應(yīng)的影響;廖俊云[4]從產(chǎn)品質(zhì)量的視角出發(fā),以團(tuán)購網(wǎng)站的酒店銷售為研究對象,通過研究表明評分的偏差會對酒店銷量產(chǎn)生負(fù)向影響;陳少龍[5]通過對產(chǎn)品的在線評論進(jìn)行研究,表明在線評論及賣家回復(fù)皆會對產(chǎn)品的顯著影響。另一種為對評論內(nèi)容的分析,如劉靈芝[6]以水禽熟食為調(diào)查對象,通過分析的方法表明消費者在熟食購買過程中最為注重的為產(chǎn)品的質(zhì)量屬性和安全屬性;吳維芳等[7]運(yùn)用情感分析的方法,對消費者對酒店的滿意度進(jìn)行研究,研究結(jié)果表明消費者對不同類型的酒店間的特征關(guān)注情況有著顯著的差異;Wenjing Duan[8]通過對電影行業(yè)的研究,證明電影評價能夠?qū)﹄娪捌鸬叫麄鞯男ЧM(jìn)而影響電影的票房;劉逸等[9]通過對中國游客評論數(shù)據(jù)的分析得出中國與國際游客之間關(guān)注特征的差異;趙楊等[10]通過對海淘APP評論數(shù)據(jù)的研究得出消費者最為關(guān)注的特征及對各特征的滿意度情況。
營銷大師Kotler[11]將消費者滿意度定義為:消費者對購買產(chǎn)品的實際感知與其期望值相比較后形成的一種感知態(tài)度?,F(xiàn)對消費者滿意度的研究較為豐富,Celik等[12]將滿意度理論與交通情況相結(jié)合,并提出一種新的方法以提高客戶對伊斯坦布爾交通情況的滿意度;王蓉[13]建立了三方物流企業(yè)的顧客滿意度模型,并將客戶的滿意度作為衡量物流服務(wù)質(zhì)量的重要指標(biāo);黃生權(quán)和文雅[14]則是以歐洲消費者滿意度指數(shù)模型為理論基礎(chǔ),建立了適用于餐飲行業(yè)特征的消費者滿意度模型,并將其進(jìn)行實際應(yīng)用。
隨著網(wǎng)絡(luò)交易的興起,網(wǎng)絡(luò)購物消費者滿意度也得到了重視。Tandon等[15]用北印度各州的410名在網(wǎng)絡(luò)購物的消費者的數(shù)據(jù)分析了網(wǎng)購環(huán)境中的消費者滿意度的影響因素,揭示了網(wǎng)站功能、網(wǎng)站設(shè)計以及交易安全性等都對網(wǎng)絡(luò)購物消費者滿意度有一定程度的作用;Alam[16]認(rèn)為網(wǎng)站設(shè)計、可靠性、產(chǎn)品種類和交付性能皆會對消費者網(wǎng)絡(luò)購物的滿意度產(chǎn)生影響;查金祥等[17]通過建模的方法驗證了產(chǎn)品的價格及質(zhì)量對網(wǎng)購消費者的滿意度影響最為顯著;李玉萍等[18]證明了產(chǎn)品品質(zhì)、服務(wù)態(tài)度及物流等因素會對網(wǎng)購消費者的滿意度產(chǎn)生影響;陳梅梅等[19]運(yùn)用多重對應(yīng)分析方法證明了在情緒效應(yīng)下,商品描述的詳細(xì)程度會影響消費者對產(chǎn)品的滿意程度;孫長偉[20]證明了酒店設(shè)施及前臺服務(wù)會對消費者對酒店的滿意度產(chǎn)生影響。
通過對文獻(xiàn)的梳理可以看出,學(xué)者對消費者滿意度的研究較為豐富,且涉及的領(lǐng)域眾多。但以往對消費者滿意度的研究多集中在旅游、企業(yè)發(fā)展、服裝等方面,對生鮮產(chǎn)品的網(wǎng)絡(luò)評論的研究相對較少。因此,運(yùn)用python編程獲取網(wǎng)購消費者對四種不同類型生鮮水果的評論信息,運(yùn)用情感分析等方法,探究消費者對不同類型的生鮮產(chǎn)品的滿意度情況。
權(quán)重能夠反映消費者對某一特征的關(guān)注程度,TF-IDF作為一種加權(quán)技術(shù)已被廣泛的運(yùn)用到數(shù)據(jù)挖掘領(lǐng)域。因此,采用TF-IDF方法計算各特征的權(quán)重,其計算方式是將文本中的詞轉(zhuǎn)換為向量,再計算向量的權(quán)重,這一方法保證計算結(jié)果的準(zhǔn)確性。
TF-IDF是由詞頻及逆文檔頻率兩個部分結(jié)合起來對權(quán)重進(jìn)行計算。其中詞頻表示某個詞語或者某個短語在文本中出現(xiàn)的頻率。某個詞語出現(xiàn)的次數(shù)多,也就說明這個詞語能夠描述文本內(nèi)容的可能性越高,詞語也可能會更為重要。計算公式為:
其中ni,j是詞語ti在文檔dj中的出現(xiàn)次數(shù),分母則是在文件dj中所有詞語的出現(xiàn)次數(shù)之和。但在文檔中某些詞如語氣助詞等無用詞的出現(xiàn)次數(shù)也較多,因此詞頻計算并不是絕對的,因此需要逆文檔頻率的配合,逆文檔頻率是指:一個詞若只在少量文本中出現(xiàn)會比一個詞大量出現(xiàn)在大量文本中更具有代表性,若包含詞語t的文檔越少,也就表示詞語t的文本區(qū)分程度更高,IDF值越高。由此可以看出,IDF能夠減少文本中無效詞對權(quán)重程度的影響,加強(qiáng)特征詞的重要程度,其計算公式如下:
其中|D|表示語料庫中的文件總數(shù),{j∶ti∈dj}表示包含詞條t的文件數(shù),為避免詞語不在語料庫中使得分母為0的情況出現(xiàn),因此一般使用 {j∶ti∈dj}+1。然后再計算TF與IDF的乘積,TF-IDF的值越大,則詞語的權(quán)重越高。
TF-IDFi,l=TFi,j*IDFi
選用Python程序的SnowNLP模塊進(jìn)行情感分析,SnowNLP模塊的計算原理為樸素貝葉斯分類算法,計算方法為,首先選取部分評論內(nèi)容進(jìn)行標(biāo)記作為訓(xùn)練集,對模型進(jìn)行訓(xùn)練,將訓(xùn)練后的模型進(jìn)行保存,對待處理的評論內(nèi)容進(jìn)行分析,計算并返回每一條評論的情感傾向分值用于后續(xù)的研究。對于類別C1的貝葉斯模型的基本運(yùn)算過程如下:
SnowNLP模塊的情感傾向計算方法為當(dāng)返回的評論計算分值大于0.5時,意味著這條評論為正向評論,當(dāng)返回的評論數(shù)值小于0.5時則以為這這條評論的總體情感傾向較低為負(fù)面評論。在研究過程中將特征評論內(nèi)容進(jìn)行提取并存入不同的文件中,隨后通過SnowNLP模塊對各特征的情感傾向進(jìn)行計算,計算出各特征情感傾向的平均值。這數(shù)值意味著消費者對生鮮電商企業(yè)中某一項特征的滿意情況。
信息來源于網(wǎng)站上消費者對生鮮水果的評論,京東平臺作為我國三大電子商務(wù)平臺之一,其銷售的產(chǎn)品眾多,有著較為完整的評價系統(tǒng)及消費群體,因此選取京東平臺的生鮮水果的評論信息作為研究對象,通過python爬蟲的方法對橙子、芒果、櫻桃、香蕉四類水果的評論文本信息進(jìn)行了爬取。
通過對所獲取的評論內(nèi)容的觀察發(fā)現(xiàn),評論中含有部分重復(fù)及消費者未進(jìn)行評論的信息,這些內(nèi)容可能會對后續(xù)數(shù)據(jù)分析的效率及分析結(jié)果產(chǎn)生影響。因此在對文本數(shù)據(jù)進(jìn)行分析前,需先對其進(jìn)行預(yù)處理工作。首先刪除評論中的重復(fù)及消費者未評論的信息內(nèi)容,得到有用的評論文本信息;運(yùn)用jieba模塊,對文本評論進(jìn)行分詞處理;創(chuàng)建停用詞詞表,將連詞、標(biāo)點符號及無用的低頻詞納入其中,對分詞后的評論進(jìn)行遍歷,去除評論中的停用詞,最終獲得有效的評論內(nèi)容。
對消費者生鮮水果的滿意度進(jìn)行研究,為準(zhǔn)確了解消費者的需求,了解消費者對各特征的滿意度情況,因此對評論中的特征詞進(jìn)行提取。通過對分詞后的評論進(jìn)行詞性標(biāo)注可知,滿意度的特征詞是由名詞及動詞構(gòu)成,因此對評論文本信息中出現(xiàn)的名次及動詞進(jìn)行提取,由于所提取到的特征詞過多,因此僅選取各類產(chǎn)品評論中詞頻排名前20的詞匯。提取結(jié)果如下圖所示:
表1 生鮮水果特征詞詞頻匯總Table 1 Frequency summary of characteristic words of fresh fruits
續(xù)表1 生鮮水果特征詞詞頻匯總Continued table 1 Frequency summary of characteristic words of fresh fruits
通過表1對高頻詞的提取選取消費者較為關(guān)注的幾項特征,然而,由于詞頻并不能完全表明消費者對生鮮水果各項特征的關(guān)注度情況,因此,對評論進(jìn)行了進(jìn)一步的分析,運(yùn)用上文所提到TF-IDF的方法計算所提取特征詞的權(quán)重情況,各類產(chǎn)品特征詞權(quán)重計算結(jié)果如下所示:
為更直觀的觀察消費者對各類產(chǎn)品特征的關(guān)注度情況,將上表所得結(jié)果繪制成雷達(dá)圖,如圖1所示:
表2 各類生鮮水果特征詞權(quán)重情況匯總Table 2 Summary of the weights of characteristic words of various fresh fruits
圖1 各特征權(quán)重雷達(dá)圖Fig.1 Radar chart of each feature weight
從表2與圖1可以看出,消費者對不同種類生鮮水果的特征的關(guān)注程度有所不同,消費者對芒果最為關(guān)注的5項特征分別為物流、包裝、味道、客服及發(fā)貨;對香蕉最為關(guān)注的5項特征分別為物流、味道、包裝、發(fā)貨及品質(zhì);對櫻桃最為關(guān)注的5項特征分別為物流、味道、個頭、包裝及發(fā)貨;對橙子最為關(guān)注的5項特征分別為物流、包裝、味道、個頭及發(fā)貨。雖然消費者對這四項產(chǎn)品的各項特征關(guān)注度情況上有所差異,但從總體上看,生鮮水果消費者較為關(guān)注的產(chǎn)品特征為物流、包裝、味道及發(fā)貨上。
為準(zhǔn)確計算出消費者對各特征的滿意度,在進(jìn)行情感分析前依次遍歷每一條評論中的每個詞語,定位評論中的特征詞,識別提取特征詞前后[-u,u]區(qū)間的詞語,將針對某一特定詞所提取出的評論內(nèi)容保存到新的文件中,運(yùn)用上文所提到的snownlp算法計算各類產(chǎn)品各特征的情感得分,計算結(jié)果如下:
表3 各類生鮮水果特征情感分析Table 3 Emotional analysis of the characteristics of various fresh fruits
從上表可以看出,消費者對芒果的滿意度最高的前三項分別為價格、味道及口感;對香蕉的滿意度最高的前三項分別服務(wù)、物流及包裝;對櫻桃的滿意度最高的前三項分別服務(wù)、物流及包裝;對橙子的滿意度最高的前三項分別服務(wù)、味道及物流;雖然消費者對各類水果的極限滿意度間有所差異,但對客服及發(fā)貨的滿意度皆相對較低,造成這種結(jié)果的原因可能為由于為保證水果的新鮮程度,賣家會在消費者下單后的一段時間內(nèi)統(tǒng)一進(jìn)行采摘、發(fā)貨,使得生鮮水果的發(fā)貨時間要長于其他類型產(chǎn)品,因此消費者對生鮮水果發(fā)貨的滿意度整體相對較低。對于客服而言,可能是由于消費者來說,客服回復(fù)的及時性及產(chǎn)品的描述情況不足使得消費者對客服的整體滿意度相對較低。
通過對這四類生鮮水果在線評論的分析可以看出,消費者對生鮮水果電商所提供的物流、包裝、味道、品質(zhì)、發(fā)貨、個頭、價格、服務(wù)、售后、口感情況較為關(guān)注,但不同類別的水果對各類特征的關(guān)注度及滿意度均有所差別。但總體看來消費者最為關(guān)注的為物流、包裝、味道及發(fā)貨這四項特征。從滿意度的計算結(jié)果看來,消費者對商家所提供的客服及發(fā)貨情況較為不滿,針對這一結(jié)果對生鮮水果電商提出了相應(yīng)的意見及建議。
對于產(chǎn)品的發(fā)貨情況,商家應(yīng)每日進(jìn)行庫存清點,并根據(jù)以往的銷售數(shù)據(jù)判斷現(xiàn)有庫存是否充足,發(fā)現(xiàn)庫存不足的情況,及時對產(chǎn)品進(jìn)行補(bǔ)充,以保證訂單出現(xiàn)時,能夠及時進(jìn)行發(fā)貨,減少消費者的等待時間,增加消費者對發(fā)貨方面的滿意度。
對于電商的客服情況,商家可對電商的客服進(jìn)行培訓(xùn)使其了解電商企業(yè)對消費者所提供的各項服務(wù)情況。并做到針對消費者所提出的問題能夠及時準(zhǔn)確的進(jìn)行解答,降低消費者的感知風(fēng)險。溝通時注意服務(wù)態(tài)度,減少消費者的不適,增加消費者的購買意愿。
通過分析計算結(jié)果,消費者對不同種類生鮮水果各特征關(guān)注情況有所不同。電商企業(yè)可根據(jù)銷售的產(chǎn)品對所提供的服務(wù)進(jìn)行進(jìn)一步的改進(jìn),以提高消費者對各項特征的滿意程度,吸引消費者再次進(jìn)行消費促進(jìn)生鮮電商更好更快的發(fā)展。