劉宏宇,高艷,陳寬
(1.黑龍江八一農(nóng)墾大學(xué),大慶 163319;2.青島創(chuàng)跡軟件有限公司)
生鮮電商經(jīng)歷了5 年的高速發(fā)展,2019 年的生鮮電商市場(chǎng)銷售額比上一年度增長(zhǎng)了65%。行業(yè)的快速發(fā)展引來(lái)諸多資本的進(jìn)入,也加劇了企業(yè)間的競(jìng)爭(zhēng)。但是頻繁發(fā)生的消費(fèi)者投訴與維權(quán)行為,難以掩蓋其過(guò)度粗放發(fā)展的事實(shí)。根據(jù)《2019 年度中國(guó)生鮮電商消費(fèi)投訴數(shù)據(jù)與典型案例報(bào)告》顯示,電商糾紛調(diào)解平臺(tái)“電訴寶”在2019 年共收到數(shù)百起消費(fèi)者對(duì)生鮮電商的不滿意投訴,其中物流是熱點(diǎn)被投訴問(wèn)題,而像中糧我買網(wǎng)、本來(lái)生活、順豐優(yōu)選、易果生鮮等知名度較高電商平臺(tái)被評(píng)為“不建議下單”,許多中小型生鮮電商企業(yè)也正面臨“吃虧”“關(guān)店”“行業(yè)洗牌”等煎熬。行業(yè)競(jìng)爭(zhēng)加劇的同時(shí),消費(fèi)者的需求也在不斷提高,生鮮物流中存在的生鮮不“鮮”、用戶體驗(yàn)不佳等諸多問(wèn)題,說(shuō)明已有發(fā)展模式已經(jīng)跟不上市場(chǎng)發(fā)展的需要[1-2]。物流活動(dòng)作為連接企業(yè)與消費(fèi)者的直接要素,不僅事關(guān)消費(fèi)體驗(yàn),也是企業(yè)競(jìng)爭(zhēng)力的保障。如何提高物流服務(wù)水平從而提升消費(fèi)者滿意度是生鮮電商企業(yè)突破當(dāng)前發(fā)展瓶頸的主要路徑。
電商消費(fèi)者常會(huì)利用平臺(tái)發(fā)表對(duì)物流服務(wù)的文字評(píng)論形成文本化的網(wǎng)絡(luò)評(píng)論,這些評(píng)論不但表達(dá)個(gè)人的滿意度,同時(shí)也會(huì)對(duì)其他消費(fèi)行為產(chǎn)生影響,如何從大量的網(wǎng)絡(luò)評(píng)論中分離出不同要素,并分析其對(duì)消費(fèi)者滿意度的影響,是當(dāng)前理論研究與企業(yè)實(shí)踐關(guān)注的熱點(diǎn)問(wèn)題[3]。已有電商平臺(tái)不是按照語(yǔ)義進(jìn)行評(píng)論分類,因而不能正確區(qū)分消費(fèi)者滿意度,為此,利用網(wǎng)絡(luò)爬蟲(chóng)獲取消費(fèi)者購(gòu)后網(wǎng)絡(luò)評(píng)論,并應(yīng)用機(jī)器學(xué)習(xí)方法根據(jù)評(píng)論文本語(yǔ)義進(jìn)行滿意度分類,通過(guò)數(shù)據(jù)挖掘方法建立物流詞匯與滿意度詞匯的關(guān)聯(lián)關(guān)系,分析物流要素對(duì)消費(fèi)者滿意度的影響機(jī)理,為企業(yè)科學(xué)改進(jìn)物流服務(wù)質(zhì)量、提高消費(fèi)者滿意度提供理論支持。
物流從本質(zhì)上講屬于一種服務(wù)產(chǎn)品。物流服務(wù)是從接收客戶訂單開(kāi)始到將商品送到客戶手中為止所發(fā)生的所有服務(wù)活動(dòng),是通過(guò)運(yùn)輸、存儲(chǔ)等活動(dòng)實(shí)現(xiàn)產(chǎn)品或服務(wù)增值,其本質(zhì)是更好地滿足顧客需求,即保證顧客需要的商品在顧客要求的時(shí)間內(nèi)準(zhǔn)時(shí)送達(dá),包括:產(chǎn)品準(zhǔn)備、產(chǎn)品輸送、品質(zhì)保證、合理的價(jià)值服務(wù)[4]。Perrault[5]認(rèn)為物流服務(wù)是指企業(yè)以滿足客戶需求為中心,在適當(dāng)?shù)臅r(shí)間、地點(diǎn)以適當(dāng)?shù)膬r(jià)格和方式,提供適當(dāng)?shù)姆?wù)產(chǎn)品,從而實(shí)現(xiàn)價(jià)值增值的過(guò)程。該觀點(diǎn)一直以來(lái)受到其他學(xué)者的廣泛認(rèn)可。因此,物流服務(wù)的質(zhì)量衡量應(yīng)以客戶的感知與體驗(yàn)為中心,即客戶感受到的物流服務(wù)和預(yù)期對(duì)比評(píng)價(jià)的結(jié)果[6]。而在大數(shù)據(jù)背景下,企業(yè)應(yīng)通過(guò)采集各類消費(fèi)者互聯(lián)網(wǎng)行為數(shù)據(jù),來(lái)分析其物流需求,判斷物流服務(wù)過(guò)程要素的水平與能力并進(jìn)行優(yōu)化,進(jìn)而滿足消費(fèi)者個(gè)性化需要[7]。張振華[8]認(rèn)為消費(fèi)在線網(wǎng)絡(luò)評(píng)論作為是發(fā)掘企業(yè)物流服務(wù)質(zhì)量問(wèn)題的重要途徑,企業(yè)應(yīng)當(dāng)從用戶感知視角,從在線評(píng)論數(shù)據(jù)中識(shí)別并分析存在的服務(wù)質(zhì)量問(wèn)題,進(jìn)而推動(dòng)物流服務(wù)創(chuàng)新,并以家具產(chǎn)品網(wǎng)絡(luò)評(píng)論為數(shù)據(jù)來(lái)源,構(gòu)建了電子商務(wù)物流服務(wù)質(zhì)量問(wèn)題發(fā)掘模型。侯玉林[9]認(rèn)為調(diào)查問(wèn)卷方式已很難滿足電商環(huán)境下企業(yè)把握顧客需求、監(jiān)測(cè)與提升快遞服務(wù)質(zhì)量的需求,因此,在研究中以快遞網(wǎng)絡(luò)評(píng)論為數(shù)據(jù)來(lái)源,提出一種基于文本意見(jiàn)挖掘的快遞服務(wù)質(zhì)量評(píng)價(jià)方法,通過(guò)對(duì)用戶評(píng)論文本的詞性情感分析判斷快遞服務(wù)水平,進(jìn)而提出了快遞企業(yè)快遞服務(wù)質(zhì)量評(píng)價(jià)以及監(jiān)測(cè)模式與策略。
生鮮電商是指企業(yè)或商戶借助網(wǎng)購(gòu)平臺(tái)經(jīng)營(yíng)生鮮產(chǎn)品的電子商務(wù)活動(dòng),近年來(lái)逐漸成為理論研究的熱點(diǎn)[10]。電商物流是包含著電子商務(wù)和物流兩個(gè)概念的復(fù)合名詞。沈坤華[11]從產(chǎn)品、物流、政府責(zé)任三個(gè)方面針對(duì)生鮮電商發(fā)展的問(wèn)題提出相關(guān)解決對(duì)策。余建海[12]認(rèn)為生鮮電商物流是電商物流的子集,但對(duì)運(yùn)輸、儲(chǔ)存、配送等物流服務(wù)方面要求更加嚴(yán)格,與一般物流服務(wù)相比,特殊性更加明顯。已有生鮮物流對(duì)消費(fèi)者滿意度影響的研究,Tang[13]指出我國(guó)農(nóng)產(chǎn)品在流通過(guò)程中存在基礎(chǔ)條件差、冷鏈設(shè)備不足、物流信息化水平低等問(wèn)題,導(dǎo)致農(nóng)產(chǎn)品流通環(huán)節(jié)貨損嚴(yán)重。針對(duì)生鮮電商發(fā)展瓶頸,許多學(xué)者從自營(yíng)冷鏈配送、優(yōu)化供應(yīng)鏈運(yùn)營(yíng)、原產(chǎn)地集中采購(gòu)、包裝工藝等方面提出解決對(duì)策[14-15]。而物流配送作為生鮮電商的重要環(huán)節(jié),已有研究也分析了電子商務(wù)物流服務(wù)對(duì)消費(fèi)者態(tài)度的影響關(guān)系[16-17]。Chou[18]通過(guò)采集臺(tái)灣地區(qū)用戶樣本,分析了配送服務(wù)質(zhì)量對(duì)消費(fèi)者品牌態(tài)度的影響,結(jié)果表明準(zhǔn)時(shí)交付、低貨損率、送貨員專業(yè)等被顧客視作配送可靠性,并會(huì)影響顧客品牌忠誠(chéng)。徐廣姝[19]通過(guò)問(wèn)卷調(diào)查與粗糙集數(shù)據(jù)處理方法,分析了生鮮電商服務(wù)要素對(duì)顧客滿意度的影響,實(shí)證結(jié)果顯示,產(chǎn)品質(zhì)量、發(fā)貨和運(yùn)送速度、多元配送增值服務(wù)等要素能夠提高顧客的滿意度。
通過(guò)文獻(xiàn)的查閱梳理,發(fā)現(xiàn)生鮮電商領(lǐng)域的研究主要集中在生鮮電商行業(yè)發(fā)展,相關(guān)研究大多處于宏觀層面,物流服務(wù)多作為電商服務(wù)的一個(gè)組成要素進(jìn)行整體分析,而從生鮮電商視角,從微觀層面針對(duì)物流服務(wù)要素,及其對(duì)滿意度影響機(jī)理的研究相對(duì)匱乏[20]。在研究方法上,已有文獻(xiàn)多通過(guò)定性研究,從宏觀層面進(jìn)行分析,提出行業(yè)發(fā)展對(duì)策,在定量研究方法的使用上,已有文獻(xiàn)主要以問(wèn)卷調(diào)查的實(shí)證分析為主。隨著消費(fèi)者網(wǎng)絡(luò)生成內(nèi)容的日益增多,應(yīng)用數(shù)據(jù)挖掘方法挖掘用戶評(píng)論逐漸成為定量研究的趨勢(shì)和熱點(diǎn)。如何從網(wǎng)絡(luò)評(píng)論文本中挖掘出用戶觀點(diǎn)對(duì)互聯(lián)網(wǎng)環(huán)境下的企業(yè)競(jìng)爭(zhēng)力提升具有重要的實(shí)用價(jià)值[21]。
意見(jiàn)挖掘又稱文本情感分析,是指對(duì)帶有情感色彩的主觀性文本進(jìn)行分析、處理、歸納和推理的過(guò)程,從而分析出用戶對(duì)于實(shí)體及其屬性所表達(dá)的觀點(diǎn)、情感、評(píng)價(jià)、態(tài)度和情緒,要從用戶生成內(nèi)容中挖掘出有用的信息和知識(shí),就需要對(duì)意見(jiàn)挖掘與情感分析問(wèn)題進(jìn)行研究,這已經(jīng)成為網(wǎng)絡(luò)社會(huì)媒體分析的核心問(wèn)題[22]。
Mudambi 和Schuff[23]以亞馬遜網(wǎng)站上的在線評(píng)論為研究對(duì)象,經(jīng)過(guò)研究得出,在線評(píng)論有用性具有顯著性影響的是評(píng)論的情感極性與評(píng)論字?jǐn)?shù),商品類型對(duì)滿意度也有一定影響。王新宇[24]采用情感詞典對(duì)文本特征空間進(jìn)行降維、應(yīng)用TF-IDF 計(jì)算權(quán)重,利用SVM 機(jī)器學(xué)習(xí)模型對(duì)文本情感進(jìn)行分類,結(jié)果表明,該方法對(duì)旅游評(píng)論文本情感分類有效。Wang等[25]利用情感分析方法構(gòu)建Logistic 回歸模型分析不同產(chǎn)品屬性對(duì)消費(fèi)者滿意度的影響。郭立秀[14]基于文本挖掘的方法對(duì)電商平臺(tái)網(wǎng)絡(luò)評(píng)論進(jìn)行挖掘,研究我國(guó)生鮮電商企業(yè)顧客滿意度的影響因素,研究結(jié)果表明物流配送作為整體要素,與電商品牌、產(chǎn)品質(zhì)量、客服態(tài)度,是影響顧客好評(píng)的關(guān)鍵要素。
以生鮮電商物流服務(wù)為研究對(duì)象,從消費(fèi)者滿意視角出發(fā),利用機(jī)器學(xué)習(xí)方法和Apriori 算法對(duì)電商平臺(tái)用戶在線評(píng)論進(jìn)行意見(jiàn)挖掘,旨在深入分析與探究生鮮物流服務(wù)影響顧客滿意度的機(jī)理,以此提出物流服務(wù)優(yōu)化對(duì)策,為生鮮電商企業(yè)提升競(jìng)爭(zhēng)優(yōu)勢(shì)提供理論支持。在平臺(tái)選擇上,選取京東生鮮作為網(wǎng)絡(luò)評(píng)論獲取平臺(tái)。京東生鮮作為國(guó)內(nèi)最大的生鮮電商綜合性平臺(tái)之一,其在平臺(tái)知名度、用戶使用率、物流滿意度等多個(gè)方面都位居國(guó)內(nèi)生鮮電商第一位。
首先對(duì)采集的網(wǎng)絡(luò)評(píng)論文本進(jìn)行清洗,應(yīng)用有監(jiān)督機(jī)器學(xué)習(xí)方法,依據(jù)已有研究的滿意度情感分類詞典,對(duì)部分評(píng)論文本進(jìn)行滿意度手工標(biāo)記,然后訓(xùn)練形成樸素貝葉斯分類模型,最終形成全部評(píng)論文本的滿意度情感分類。
2.1.1 網(wǎng)絡(luò)評(píng)論文本采集
以京東生鮮在售車?yán)遄赢a(chǎn)品的用戶評(píng)論為數(shù)據(jù)獲取對(duì)象,利用Python3.6 編寫(xiě)爬蟲(chóng)程序抓取了京東生鮮平臺(tái)上50 個(gè)商戶的車?yán)遄赢a(chǎn)品用戶評(píng)論,共抓取了4.6 萬(wàn)余條評(píng)論文本。
2.1.2 評(píng)論文本清洗
由于在網(wǎng)上抓取的文本存在一定程度的噪聲,所以有必要對(duì)采集的評(píng)論文本進(jìn)行數(shù)據(jù)清洗,以確保分析結(jié)果更加準(zhǔn)確。利用Excel 的len()語(yǔ)句刪除字符數(shù)量少于3,以及內(nèi)容重復(fù)的評(píng)論文本,保證評(píng)論文本的可用性和唯一性。經(jīng)過(guò)對(duì)評(píng)論文本的清洗,共計(jì)保留有效評(píng)論文本45 140 條。
2.2.1 評(píng)論文本分詞
由于中文語(yǔ)言文字的特殊性,在進(jìn)行文本挖掘前,必須對(duì)文本進(jìn)行分詞。使用的分詞工具是Python的“jieba”(結(jié)巴)中文分詞模塊。分詞示例:原句“物流很快,東西也很新鮮,為快遞小哥和商家點(diǎn)贊,下次還會(huì)購(gòu)買”,在結(jié)巴精確分詞模式輸出為:“物流/很快,東西/也/很/新鮮/,/為/快遞/小哥/和/商家/點(diǎn)贊/,/下次/還會(huì)/購(gòu)買/”。
2.2.2 滿意度情感分類的標(biāo)注
選擇有監(jiān)督的機(jī)器學(xué)習(xí)方法,通過(guò)人工標(biāo)注形式對(duì)訓(xùn)練集進(jìn)行分類,在標(biāo)記規(guī)則上基于情感詞語(yǔ)表達(dá)的情感強(qiáng)度進(jìn)行標(biāo)記,情感分類類型為滿意、中性、不滿意三種滿意度類型。李艷翠等(2014)針對(duì)亞馬遜網(wǎng)上收集的產(chǎn)品評(píng)論語(yǔ)料的情感分析實(shí)驗(yàn)表明,基于有監(jiān)督方法比無(wú)監(jiān)督學(xué)習(xí)對(duì)情感特征和評(píng)論質(zhì)量的分析效果有顯著提高[26]。消費(fèi)者滿意度情感分類詞典依據(jù)已有文獻(xiàn)研究結(jié)論形成[27],如表1 所示:
表1 滿意情感分類規(guī)則詞典示例Table 1 Emotional classification rules dictionary examples
根據(jù)已確定的分類規(guī)則詞典,對(duì)1 萬(wàn)條評(píng)論文本進(jìn)行手工標(biāo)記,部分標(biāo)記結(jié)果如表2 所示:
2.2.3 基于樸素貝葉斯的評(píng)論文本滿意情感分類的實(shí)現(xiàn)
應(yīng)用留出法,將上文人工標(biāo)記的1 萬(wàn)條評(píng)論文本中的8 000 條作為訓(xùn)練集,剩下的2 000 條作為測(cè)試集進(jìn)行情感分類精度測(cè)試,且滿足:人工標(biāo)記樣本訓(xùn)練集∪測(cè)試集,訓(xùn)練集∩測(cè)試集=φ??倶颖局惺O碌?5 140 條評(píng)論分為18 個(gè)文本集,然后依次利用訓(xùn)練好的模型進(jìn)行預(yù)測(cè)分類。
表2 評(píng)論情感極性手工標(biāo)記文本樣例Table 2 Comment on emotional polarity manual markup text samples
選取多項(xiàng)式樸素貝葉斯模型進(jìn)行預(yù)測(cè)分類。對(duì)分類任務(wù)來(lái)說(shuō),在所有相關(guān)概率都已知的理想情況下,貝葉斯模型考慮如何基于這些概率和誤判損失來(lái)選擇最優(yōu)的類別標(biāo)記[28]。樸素貝葉斯分類器采用屬性條件獨(dú)立性假設(shè)原則,即對(duì)于已知事物類別,假設(shè)所有的屬性互相獨(dú)立,并假設(shè)每個(gè)屬性單獨(dú)對(duì)分類結(jié)果發(fā)生影響,表達(dá)式見(jiàn)公式1:
其中d為屬性數(shù)目,xi為x在第i個(gè)屬性上的取值。由于對(duì)于所有類別來(lái)說(shuō)P(x)相同,因此貝葉斯的判定準(zhǔn)則如公式2:
(1)模型訓(xùn)練
通過(guò)Python 語(yǔ)言構(gòu)建多項(xiàng)式樸素貝葉斯模型,對(duì)標(biāo)注的1 萬(wàn)條文本中的8 000 條進(jìn)行分類學(xué)習(xí),2 000 條作為精度驗(yàn)證。模型分類精度如表3 所示:
表3 多項(xiàng)式樸素貝葉斯算法分類精度Table 3 Classification accuracy of polynomia naive Bayesian algorithm
由表3 可知,該算法的訓(xùn)練集與測(cè)試集的準(zhǔn)確率均大于85%,預(yù)測(cè)分類效果比較理想。
(2)網(wǎng)絡(luò)評(píng)論文本測(cè)試集滿意情感分類
該部分實(shí)驗(yàn)對(duì)總樣本余下的35 140 條評(píng)論分為18 個(gè)文本集,每個(gè)文本集2 000 條左右評(píng)論,依次利用訓(xùn)練好的模型進(jìn)行文本情感分類預(yù)測(cè)。
(3)評(píng)論文本滿意情感分類與統(tǒng)計(jì)
本部分對(duì)象文本集為:8 000 條訓(xùn)練集(人工標(biāo)記)、2 000 條測(cè)試集(人工標(biāo)記)、35 140 條預(yù)測(cè)集(機(jī)器自動(dòng)標(biāo)記),共計(jì)45 140 條評(píng)論文本,最終將全部評(píng)論分類為3 個(gè)文本集合,分別為“滿意”文本集、“中性”文本集、“不滿意”文本集,統(tǒng)計(jì)情況如表4 所示:
表4 總體評(píng)論文本滿意度情感分類分布Table 4 Satisfaction polarity distribution of general comment texts
在上文分類基礎(chǔ)上,本部分對(duì)不同情感分類下的物流評(píng)論進(jìn)行提取,并設(shè)定在“滿意”文本集中提取出的物流評(píng)論為正向物流評(píng)論,“中性”文本集中提取出的為中性物流評(píng)論,“不滿意”文本集中提取出的為負(fù)向物流評(píng)論。
參考搜狗平臺(tái)物流詞匯包,提取出了描述物流服務(wù)相關(guān)詞匯,構(gòu)建匹配詞典,并通過(guò)該詞典匹配出與物流相關(guān)評(píng)論文本集合。如表5 所示:
根據(jù)建立好的物流評(píng)論詞匯詞典,分別在“滿意”評(píng)論文本集、“中性”評(píng)論文本集與“不滿意”評(píng)論文本集中遍歷每一句評(píng)論,若評(píng)論語(yǔ)句中含有詞典中的任一詞匯,就將此評(píng)論文本語(yǔ)句提取出來(lái)。例如,“物流很給力,給小哥點(diǎn)贊”此句評(píng)論中含有“物流”和“小哥”等詞,所以就將此句評(píng)論提取出來(lái);“車?yán)遄游兜啦诲e(cuò),下次還會(huì)購(gòu)買”,此句評(píng)論中不含詞典中的詞語(yǔ),所以,此句不提取。此次實(shí)驗(yàn),在“滿意”評(píng)論文本集提取正向物流評(píng)論12 640 條,在“中性”評(píng)論文本集提取中性物流評(píng)論2 110 條,在“不滿意”評(píng)論文本集中提取負(fù)向物流評(píng)論5 299 條。由表6 可知,正向描述物流的占總物流評(píng)論文本為63%,負(fù)向文本占比26.5%。
表5 物流評(píng)論詞匯匹配詞典示例Table 5 Matching logistics comment text dictionary examples
表6 物流評(píng)論情感極性分類Table 6 Emotional polarity of logistics comments
本部分運(yùn)用詞頻分析法,對(duì)正向、負(fù)向物流評(píng)論進(jìn)行詞頻分析。
(1)正向物流評(píng)論文本詞頻分析
利用Python 語(yǔ)言的“結(jié)巴”分詞工具對(duì)正向物流評(píng)論文本進(jìn)行分詞并做詞頻統(tǒng)計(jì),詞頻統(tǒng)計(jì)信息如圖1 所示。
圖1 正向物流評(píng)論文本前20 位詞頻統(tǒng)計(jì)柱形圖Fig.1 Statistical column map of top 20 word frequency in positive logistics comment text
前20 位高頻詞在一定程度說(shuō)明消費(fèi)者在網(wǎng)購(gòu)中比較注重的因素,在這些因素中,與物流相關(guān)的詞有“物流”“包裝”“很快”“快遞”“速度”“發(fā)貨”。通過(guò)詞頻統(tǒng)計(jì),可以推理出消費(fèi)者首要關(guān)注的是物流服務(wù)能否保證生鮮品的新鮮程度。
(2)負(fù)向物流評(píng)論文本詞頻分析
由圖2 可知,在負(fù)向評(píng)論中消費(fèi)者關(guān)注詞匯的排序,為進(jìn)一步分析,下面統(tǒng)計(jì)出物流及相關(guān)詞匯的詞頻,如表7 所示:
圖2 負(fù)向物流評(píng)論文本前20 位詞頻統(tǒng)計(jì)柱形圖Fig.2 Statistical column map of top 20 word frequency in negative logistics comment text
表7 負(fù)向物流評(píng)論詞頻統(tǒng)計(jì)Table 7 Negative logistics comments on logistics related terms
由表7 可知,在負(fù)向物流評(píng)論中,與物流相關(guān)詞匯有“物流”“快遞”“慢”“發(fā)貨”“包裝”,并可推理出消費(fèi)者可能會(huì)因?yàn)槲锪饕蛩貙?dǎo)致的產(chǎn)品不新鮮而發(fā)表負(fù)向評(píng)論。下文將對(duì)具體的物流服務(wù)要素對(duì)滿意度的影響機(jī)理做進(jìn)一步分析。
為了能夠進(jìn)一步挖掘評(píng)論文本中的物流服務(wù)要素與消費(fèi)者態(tài)度的關(guān)聯(lián)關(guān)系,本部分基于關(guān)聯(lián)規(guī)則的Apriori 算法,挖掘消費(fèi)者評(píng)論文本中的物流評(píng)論詞匯與消費(fèi)者滿意詞匯的關(guān)聯(lián)關(guān)系,試圖發(fā)現(xiàn)影響消費(fèi)者滿意情感與不滿意情感的關(guān)鍵物流詞匯,并進(jìn)一步分析物流服務(wù)對(duì)消費(fèi)者滿意度影響機(jī)理。其中,文本數(shù)據(jù)來(lái)自于上文提取出的“滿意”和“不滿意”物流評(píng)論文本。消費(fèi)者滿意與不滿意詞匯來(lái)源上文滿意度情感詞典。
關(guān)聯(lián)規(guī)則能夠反映兩個(gè)項(xiàng)集同時(shí)出現(xiàn)的頻繁性。Apriori 算法主要是通過(guò)頻繁項(xiàng)集的發(fā)現(xiàn)來(lái)產(chǎn)生關(guān)聯(lián)規(guī)則[29]。本部分應(yīng)用關(guān)聯(lián)規(guī)則來(lái)挖掘正向、負(fù)向評(píng)論中物流詞匯與滿意度詞匯同時(shí)出現(xiàn)的關(guān)聯(lián)關(guān)系。描述關(guān)聯(lián)規(guī)則的度量包括支持度(support)、置信度(confidence),當(dāng)項(xiàng)集之間的支持度和置信度大于閾值則被認(rèn)為具有強(qiáng)關(guān)聯(lián)關(guān)系。在研究中,支持度support(A?B)表示詞匯A 和詞匯B 同時(shí)出現(xiàn)的概率,置信度confidence(A?B)表示詞匯A 出現(xiàn)的同時(shí)詞匯B 也出現(xiàn)的概率,表達(dá)式見(jiàn)公式3、4:
提升度lifi(A?B)用來(lái)反映詞匯A 和詞匯B 的相關(guān)性,如果lift>1,則A 和B 的出現(xiàn)是正相關(guān),lift<1表示A 和B 的出現(xiàn)為負(fù)相關(guān),lift=1 表示A 和B 是相互獨(dú)立的,表達(dá)式見(jiàn)公式5:
研究設(shè)定lift>1、support>0.01、confidence>平均值,作為閾值,用以挖掘詞匯間的關(guān)聯(lián)關(guān)系。
本部分應(yīng)用R 語(yǔ)言對(duì)評(píng)論文本進(jìn)行分詞并提取。提取出的詞匯進(jìn)行同義詞置換,將“物流”“快遞”“配送”等詞匯置換為“物流”,將“特別滿意”“非常滿意”“挺滿意的”等詞匯置換為“很滿意”,將“還可以”“還行”“不錯(cuò)”等詞匯置換為“很好”,將表示速度快相關(guān)詞匯,置換為“速度快”,并轉(zhuǎn)換形成transaction類型數(shù)據(jù)集,進(jìn)行Apriori 關(guān)聯(lián)分析。度量閾值為lift>1、support>0.01、confidence>0.328 5(均值),對(duì)關(guān)聯(lián)分析結(jié)果進(jìn)行篩選,數(shù)據(jù)處理結(jié)果及可視化如表8 和圖3 所示:
表8 正向評(píng)論物流與滿意詞匯關(guān)聯(lián)分析結(jié)果Table 8 Result of logistics and satisfaction vocabularies association analysis in positive comments
由表8 可知,在正向評(píng)論中的詞匯“包裝”“速度快”“物流”“送貨”“發(fā)貨”詞匯都會(huì)與表達(dá)滿意的詞匯“很滿意”“很好”存在有效的相關(guān)性(lift>1),可以看出生鮮電商企業(yè)的物流服務(wù)質(zhì)量積極影響消費(fèi)者滿意,尤其是上述詞匯代表的物流作業(yè)環(huán)節(jié)服務(wù)質(zhì)量與滿意度相關(guān)性較高。
根據(jù)置信度(confidence)值挖掘詞匯間的關(guān)聯(lián)度分析如下:{完好}=>{包裝} 置信度為0.888 2,{冰袋}=>{包裝}置信度為0.597 3,表明在“完好”詞匯出現(xiàn)的情況下,“包裝”詞匯出現(xiàn)的概率為88%以上,“冰袋”詞匯出現(xiàn)時(shí),“包裝”出現(xiàn)的概率為59%以上,一定程度說(shuō)明消費(fèi)者期望包裝內(nèi)附冰袋,并且完好無(wú)損;{送貨}=>{速度快} 置信度為0.608 8,{發(fā)貨}=>{速度快} 置信度為0.505 2,{發(fā)貨,速度快}=>{很滿意}置信度為0.333 3,說(shuō)明消費(fèi)者在提及送貨與發(fā)貨環(huán)節(jié)時(shí),期望更快的發(fā)、送速度;{物流}=>{速度快}置信度為0.401 3,{速度快,物流}=>{很滿意} 置信度為0.330 8,說(shuō)明消費(fèi)者同樣對(duì)整個(gè)物流過(guò)程的速度同樣有快速的需求。
根據(jù)詞匯支持度(support)值降序排序的前六項(xiàng)為:{物流} =>{速度快}(0.081)、{很滿意}=>{很新鮮}(0.048 2)、{包裝} =>{很新鮮}(0.046 7)、{很滿意}=>{物流}(0.041 7)、{發(fā)貨}=>{速度快}(0.027)、{送貨}=>{速度快}(0.025 5),支持度表明了詞匯組合在所有評(píng)論中同時(shí)出現(xiàn)的概率,也一定程度反映了消費(fèi)者關(guān)注度排序,而這其中“物流”“速度快”代表的相近詞匯在正向評(píng)論中出現(xiàn)的概率最高。
圖3 正向評(píng)論文本詞匯關(guān)聯(lián)分析有向圖Fig.3 The directed graph of positive comment text vocabulary association analysis
通過(guò)以上分析可以看出,消費(fèi)者對(duì)發(fā)貨、送貨速度、整個(gè)物流速度、包裝質(zhì)量有著較高的期望,并且會(huì)高比例正向影響消費(fèi)者滿意,可能因?yàn)橄M(fèi)者認(rèn)為快速的物流服務(wù)、高質(zhì)量的包裝會(huì)影響產(chǎn)品新鮮度,進(jìn)而影響消費(fèi)體驗(yàn)。物流詞匯與滿意度詞匯的整體關(guān)聯(lián)關(guān)系如圖3 所示,其中圓圈大小表示對(duì)應(yīng)箭頭鏈接的兩個(gè)詞匯的置信度,圓圈顏色表示兩個(gè)詞匯的提升度。
將負(fù)向物流評(píng)論文本進(jìn)行分詞以后,運(yùn)用R 語(yǔ)言的arules 包進(jìn)行關(guān)聯(lián)分析。首先將提取出的詞匯進(jìn)行同義詞置換,將“物流”“快遞”“順豐”“配送”等詞匯置換為“物流”,將“不太好”“太差了”等詞匯置換為“不滿意”,將“破損”“損壞”等次置換為“不可靠”,將表示速度慢的相關(guān)詞匯,置換為“速度慢”,并將評(píng)論詞匯轉(zhuǎn)換形成transaction 類型數(shù)據(jù)集,并進(jìn)行Apriori 關(guān)聯(lián)分析。度量閾值為lift>1、confidence>0.317 1(均值)、support>0.01 為,并對(duì)關(guān)聯(lián)分析結(jié)果進(jìn)行篩選,數(shù)據(jù)處理結(jié)果及可視化如表9 和圖4 所示。
表9 負(fù)向評(píng)論物流與滿意詞匯關(guān)聯(lián)分析結(jié)果Table 9 Result of logistics and satisfaction vocabularies association analysis in negative comments
由表9 可知,在負(fù)向評(píng)論中,與滿意度詞匯存在有效相關(guān)性的詞匯(lift/confidence)為{不會(huì)再買}=>{不新鮮}(1.175 3/0.793 3)、{不滿意}=>{不新鮮}(1.170 2/0.789 5),可見(jiàn)造成消費(fèi)者負(fù)面情緒的主要因素在于生鮮品的新鮮程度達(dá)不到預(yù)期;而與“不新鮮”詞匯存在有效相關(guān)性的詞匯組合為{不新鮮}=>{物流,包裝}(1.594 8/0.524 8)、{不新鮮}=>{速度慢,物流}(1.332 2/0.375 7)、{不新鮮}=>{速度慢,發(fā)貨}(1.321 7/0.372 8),這個(gè)結(jié)果與正向物流評(píng)論文本關(guān)聯(lián)分析結(jié)果相似,進(jìn)一步說(shuō)明了這些物流服務(wù)要素與消費(fèi)者滿意相關(guān)性較高。
根據(jù)置信度(confidence)值挖掘詞匯間的關(guān)聯(lián)度分析如下:{發(fā)貨}=>{速度慢}、{物流}=>{速度慢} 分別為0.510 4、0.457 8,說(shuō)明負(fù)向評(píng)論中詞匯“發(fā)貨”和“物流”的出現(xiàn)會(huì)有45%~50%的概率提到“速度慢”相近的詞匯,{不新鮮,速度慢}=>{物流}置信度0.524 8,說(shuō)明消費(fèi)者認(rèn)為物流速度慢會(huì)影響新鮮度因此會(huì)降低滿意度;{包裝}=>{不可靠}的置信度0.334 7,說(shuō)明負(fù)向評(píng)論中出現(xiàn)“包裝”詞匯時(shí),“不可靠”相近的詞匯出現(xiàn)的概率為33.5%左右。
根據(jù)詞匯支持度(support)值降序排序,{物流}=>{速度慢}(0.150 6)、{發(fā)貨}=>{速度慢}(0.091 9)、{不滿意}=>{不新鮮}(0.080 1)、{不會(huì)再買}=>{不新鮮}(0.075 9),支持度表明了詞匯組合在所有評(píng)論中出現(xiàn)的比例,也一定程度反映了消費(fèi)者關(guān)注度排序。其中“物流”“速度慢”代表的相近詞匯在負(fù)向評(píng)論中同時(shí)出現(xiàn)的概率最高。
物流詞匯與滿意度詞匯的整體關(guān)聯(lián)關(guān)系如圖4所示,其中圓圈大小表示對(duì)應(yīng)箭頭鏈接的兩個(gè)詞匯的置信度,圓圈顏色表示兩個(gè)詞匯的提升度。
通過(guò)上文對(duì)京東電商平臺(tái)車?yán)遄釉u(píng)論文本的意見(jiàn)挖掘,發(fā)現(xiàn)高質(zhì)量的物流服務(wù)與消費(fèi)者購(gòu)物體驗(yàn)高度相關(guān)。根據(jù)評(píng)論文的詞匯提取、情感分析與關(guān)聯(lián)分析,梳理出了影響消費(fèi)者滿意的物流要素,在此基礎(chǔ)上進(jìn)一步提出生鮮電商物流服務(wù)優(yōu)化策略。
圖4 負(fù)向評(píng)論文本詞匯關(guān)聯(lián)分析有向圖Fig.4 The directed graph of negative comment text vocabulary association analysis
通過(guò)評(píng)論文本挖掘,消費(fèi)者在線上購(gòu)買生鮮時(shí),對(duì)物流時(shí)效性要求非常高,消費(fèi)者可能認(rèn)為較短的物流運(yùn)作時(shí)長(zhǎng)可以降低生鮮品變質(zhì)的風(fēng)險(xiǎn)。但是,受到產(chǎn)地、季節(jié)等因素影響,部分生鮮品的運(yùn)輸距離過(guò)長(zhǎng),而電商模式下產(chǎn)地企業(yè)多需要以小單快遞物流模式面向終端用戶直接發(fā)貨,導(dǎo)致中轉(zhuǎn)環(huán)節(jié)增多,更容易增加物流時(shí)長(zhǎng)與貨損風(fēng)險(xiǎn)?;诖?,生鮮生產(chǎn)企業(yè)可以與渠道平臺(tái)或物流企業(yè)開(kāi)展前置倉(cāng)的布局,改變小單快遞零擔(dān)發(fā)貨模式為整車批量發(fā)貨至銷地倉(cāng)庫(kù),減少中間作業(yè)環(huán)節(jié),可以有效降低貨損率,同時(shí)可以大幅縮減消費(fèi)者下單后的物流響應(yīng)周期,甚至實(shí)現(xiàn)當(dāng)日或次日達(dá)。而銷地前置倉(cāng)布局不但需要增設(shè)銷地物流倉(cāng)儲(chǔ)節(jié)點(diǎn),更主要的是構(gòu)建產(chǎn)銷聯(lián)動(dòng)的銷售預(yù)測(cè)機(jī)制,通過(guò)引入機(jī)器學(xué)習(xí)算法,挖掘銷地用戶行為,有助于提高預(yù)測(cè)準(zhǔn)確率。
通過(guò)上文對(duì)網(wǎng)絡(luò)評(píng)論的挖掘,結(jié)果顯示“發(fā)貨”與“速度快”、“速度慢”的置信度分別為0.505 2、0.510 4,由此可知,消費(fèi)者較為重視發(fā)貨的速度。許多生鮮企業(yè)往往重視激勵(lì)消費(fèi)者下單,忽視了下單后與客戶溝通的環(huán)節(jié),因此消費(fèi)者在遭遇延遲發(fā)貨情況后常常得不到及時(shí)的賣家反饋。造成該問(wèn)題的原因,除了企業(yè)對(duì)顧客關(guān)系管理不夠重視因素,現(xiàn)有生鮮電商的產(chǎn)銷分離模式(生產(chǎn)節(jié)點(diǎn)企業(yè)負(fù)責(zé)生產(chǎn),而電商平臺(tái)負(fù)責(zé)銷售服務(wù)容易導(dǎo)致物流信息鏈的斷鏈,歸根結(jié)底還是生鮮產(chǎn)品供應(yīng)鏈的協(xié)調(diào)機(jī)制出了問(wèn)題。提出策略如下:(1)構(gòu)建產(chǎn)、銷節(jié)點(diǎn)信息共享機(jī)制,生產(chǎn)與銷售環(huán)節(jié)要實(shí)時(shí)共享雙方節(jié)點(diǎn)庫(kù)存信息,并聯(lián)合制定補(bǔ)貨計(jì)劃;(2)產(chǎn)、銷節(jié)點(diǎn)構(gòu)建聯(lián)合售后服務(wù)機(jī)制,共擔(dān)顧客關(guān)系維護(hù)責(zé)任,并構(gòu)建生產(chǎn)、銷售、消費(fèi)者三方互動(dòng)的服務(wù)平臺(tái);(3)形成有顧客參與的物流服務(wù)價(jià)值共創(chuàng)機(jī)制,在發(fā)貨、送貨等物流環(huán)節(jié)與消費(fèi)者展開(kāi)更多的互動(dòng)并給予消費(fèi)者更多的選擇決策權(quán),這樣既可以降低因選擇困境而給企業(yè)帶來(lái)的交易成本,同時(shí)也可以提高消費(fèi)者的品牌認(rèn)同與滿意度。
通過(guò)關(guān)聯(lián)分析,發(fā)現(xiàn){包裝}=>{不可靠}(支持度/置信度:0.023 9/0.334 7),{包裝}=>{很好}(支持度/置信度:0.056 5/0.432 5)具有顯著的關(guān)聯(lián)關(guān)系。而與“包裝”關(guān)聯(lián)性較高的詞匯還有“冰袋”和“完好無(wú)損”相近的詞匯。這說(shuō)明消費(fèi)者認(rèn)為生鮮品包裝不僅關(guān)系到產(chǎn)品品質(zhì),還能夠體現(xiàn)出企業(yè)對(duì)用戶的態(tài)度。而許多企業(yè)在包裝方式上單一從成本考慮,選擇簡(jiǎn)易且無(wú)保鮮措施的包裝,不但會(huì)增加貨損風(fēng)險(xiǎn),同時(shí)不利于品牌形象的構(gòu)建。{服務(wù)態(tài)度好} =>{物流}(支持度/置信度:0.014 9/0.445 2),說(shuō)明消費(fèi)者重視物流服務(wù)態(tài)度。通過(guò)兩部分分析,消費(fèi)者一定程度將物流服務(wù)視作生鮮企業(yè)品牌競(jìng)爭(zhēng)力的一部分,且能夠提高體驗(yàn)程度,生鮮企業(yè)需要與物流服務(wù)商展開(kāi)更加緊密的合作關(guān)系,在包裝、信息交互等方面展開(kāi)定制化的合作。
以生鮮網(wǎng)絡(luò)評(píng)論文本為研究對(duì)象,運(yùn)用意見(jiàn)挖掘方法深入分析了生鮮電商物流服務(wù)對(duì)消費(fèi)者滿意度的影響機(jī)理,發(fā)現(xiàn)了現(xiàn)有物流服務(wù)存在的問(wèn)題,并提出相應(yīng)的改進(jìn)策略。通過(guò)以上研究得出如下結(jié)論:(1)生鮮電商物流服務(wù)質(zhì)量與消費(fèi)者滿意度正向相關(guān),即高質(zhì)量的物流服務(wù)有助于消費(fèi)者產(chǎn)生滿意感,而低質(zhì)量的物流服務(wù)則容易導(dǎo)致消費(fèi)者給予差評(píng);(2)線上購(gòu)買生鮮時(shí)消費(fèi)者關(guān)注的物流因素有:物流運(yùn)輸時(shí)長(zhǎng)、發(fā)貨、送貨速度、生鮮包裝、物流服務(wù)態(tài)度;(3)消費(fèi)者對(duì)生鮮電商物流服務(wù)不滿意主要聚焦在:運(yùn)輸時(shí)間過(guò)長(zhǎng)、發(fā)貨速度慢、包裝體驗(yàn)差強(qiáng)人意。研究對(duì)評(píng)論文本情感的處理采用三級(jí)分類,未來(lái)可以提升至5 級(jí)情感分類,從而能夠更深入挖掘消費(fèi)者的內(nèi)在感知要素;同時(shí),未來(lái)的研究可以在數(shù)據(jù)采集的產(chǎn)品類別與電商平臺(tái)上進(jìn)行豐富,展開(kāi)不同平臺(tái)或不同產(chǎn)品的評(píng)論文本意見(jiàn)挖掘的比較研究。
黑龍江八一農(nóng)墾大學(xué)學(xué)報(bào)2021年2期