張炎亮 李小哲
摘要: 在線評(píng)論是售后問(wèn)題的文字化反映,分析其所包含的信息對(duì)售后問(wèn)題的解決有重要意義。文中基于案例推理技術(shù),應(yīng)用NLPIR軟件對(duì)Pathon軟件獲取的9家天貓店鋪3 964條售后評(píng)論進(jìn)行分析,通過(guò)信息挖掘獲取關(guān)鍵詞并建立案例庫(kù);引入向量空間模型思想進(jìn)行售后評(píng)論與歷史評(píng)論的相似度計(jì)算。通過(guò)分析發(fā)現(xiàn),關(guān)鍵詞詞匯量過(guò)大會(huì)使詞匯冗余從而造成問(wèn)題分類模糊,而考慮窮舉過(guò)程中詞匯相同的次數(shù)會(huì)使問(wèn)題分類變得更加準(zhǔn)確。
關(guān)鍵詞: 在線評(píng)論; 案例推理; 模型構(gòu)建; 數(shù)據(jù)獲取; 信息挖掘; 結(jié)果分析
中圖分類號(hào): TN911?34; F272.3 ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼: A ? ? ? ? ? ? ? ? ? ? ? 文章編號(hào): 1004?373X(2020)02?0057?03
Tmall shop online comment analysis based on case?based reasoning
ZHANG Yanliang, LI Xiaozhe
Abstract: Online comment is the literal reflection of the post?sales problems, in which the analysis of the comment information has great significance for the solution of after?sales problems. On the basis of the case?based reasoning technology, the 3 964 post?sales comments for 9 Tmall stores obtained with the Pathon software are analyzed with NLPIR software, and the keywords are obtained by means of information mining and the case library is built. The vector space model thought is introduced to perform the similarity calculation of after?sales comments and historical comments. It is found by analyzing that the excessive vocabulary of keywords can make the vocabulary redundant to cause the problem classification fuzzy, and considering the same number of words in the exhaustive process can make the problem classification more accurate.
Keywords: online comment; case?based reasoning; model construction; data acquisition; information mining; result analysis
0 ?引 ?言
網(wǎng)絡(luò)購(gòu)物過(guò)程中,在線評(píng)論數(shù)量、評(píng)論次數(shù)等因素影響消費(fèi)者的購(gòu)買決策[1]。商品的在線評(píng)論以其直觀表達(dá)顧客感受的優(yōu)點(diǎn)更容易獲得潛在顧客的青睞[2]。潛在顧客根據(jù)在線評(píng)論對(duì)產(chǎn)品進(jìn)行認(rèn)知與感受,從而決定是否進(jìn)行購(gòu)買[3]。在線評(píng)論是使用者對(duì)產(chǎn)品的真實(shí)感受,對(duì)其進(jìn)行處理是幫助顧客和商家從海量信息中找到有用信息的重要措施[4]。在線評(píng)論在表達(dá)顧客對(duì)產(chǎn)品感受的過(guò)程中,也表露了自身的情感傾向。畢建武等通過(guò)對(duì)在線評(píng)論的情感強(qiáng)度值進(jìn)行分析,從而對(duì)商品進(jìn)行排序,為消費(fèi)者進(jìn)行商品購(gòu)買提供了建議[5]。在線評(píng)論的情感傾向的不同影響了消費(fèi)者的購(gòu)買決策,進(jìn)而影響了產(chǎn)品的銷量[6]。阮光冊(cè)等指出商品的銷量排名與反映產(chǎn)品本質(zhì)的商品屬性的情感極性存在著正相關(guān)關(guān)系[7]。從上述分析可以看出在線評(píng)論對(duì)消費(fèi)者進(jìn)行產(chǎn)品購(gòu)買有著重要的影響作用。加大對(duì)在線評(píng)論的管理力度,消除負(fù)面在線評(píng)論是電子商務(wù)平臺(tái)店鋪關(guān)注的重點(diǎn)。
消除負(fù)面在線評(píng)論的主要方法是對(duì)在線評(píng)論中的差評(píng)進(jìn)行關(guān)注,找出差評(píng)的原因并對(duì)自身進(jìn)行改善[8]。基于此,本文對(duì)在線評(píng)論進(jìn)行研究,引入向量空間模型思想,根據(jù)窮舉策略對(duì)在線評(píng)論相似度進(jìn)行計(jì)算,從而尋找類似案例的處理方案。在線評(píng)論的互動(dòng)性可以幫助制造商了解顧客需求,從而獲得啟發(fā),提升產(chǎn)品質(zhì)量[9]。引入產(chǎn)品全生命周期思想,將問(wèn)題反饋到相對(duì)應(yīng)的階段,通過(guò)提升服務(wù)的質(zhì)量和產(chǎn)品的質(zhì)量,最終提升顧客的滿意度。
1 ?模型構(gòu)建
1.1 ?基于產(chǎn)品全生命周期的售后評(píng)論案例庫(kù)的構(gòu)建
產(chǎn)品的全生命周期可以分為三個(gè)階段,用[CB],[CM],[CE]表示產(chǎn)品需求分析階段、產(chǎn)品生產(chǎn)階段和產(chǎn)品售后服務(wù)階段的問(wèn)題類別集合,具體表述為:
[CB=CB1,CB2,…,CBn]
[CM=CM1,CM2,…,CMn]
[CE=CE1,CE2,…,CEn]
描述問(wèn)題時(shí),通常使用相關(guān)的關(guān)鍵詞來(lái)表明該問(wèn)題的種類,即:
[CBi=CBi1,CBi2,…,CBim]
[CMi=CMi1,CMi2,…,CMin]
[CEi=CEi1,CEi2,…,CEik]
因此,構(gòu)建案例庫(kù):
[C=CBiCBi1…CBimCMiCBi1…CBinCEiCEi1…CEik]
1.2 ?基于向量空間模型的案例相似度計(jì)算
利用NLPIR軟件對(duì)顧客所反映的售后問(wèn)題進(jìn)行分詞處理,確定不同種類售后問(wèn)題所特有的關(guān)鍵詞,并對(duì)這些關(guān)鍵詞做詞頻統(tǒng)計(jì)。針對(duì)不同類別的售后問(wèn)題的關(guān)鍵詞的詞頻表示為[FBi=FBi1,F(xiàn)Bi2,…,F(xiàn)Bim],[FMi=FMi1,F(xiàn)Mi2,…,F(xiàn)Min],[FEi=FEi1,F(xiàn)Ei2,…,F(xiàn)Eik],其中[FBi],[FMi],[FEi]分別表示[CBi],[CMi],[CEi]中對(duì)應(yīng)的關(guān)鍵詞的詞頻,則基于向量空間模型的關(guān)鍵詞的權(quán)重計(jì)算公式(以關(guān)鍵詞[CBi1]的權(quán)重計(jì)算為例)為:
[wBi1=FBi1j=1mFBij]
窮舉策略是對(duì)相似度進(jìn)行計(jì)算的一種有效方法,將句子進(jìn)行分詞處理,并將分詞后的詞匯分別與關(guān)鍵詞進(jìn)行對(duì)比,若句中詞匯[xi]與關(guān)鍵詞[CBij](以[CBi]中的關(guān)鍵詞為例)相同,則[wi(xi,CBij)=wBij],否則[wi=0]。如果評(píng)論在與文檔中的詞匯進(jìn)行對(duì)比的過(guò)程中,該評(píng)論中有較多的詞匯出現(xiàn)在該文檔中,那么說(shuō)明該評(píng)論與該篇文檔有較大的相關(guān)度,為了避免詞匯量對(duì)于詞匯權(quán)重的影響,應(yīng)該在計(jì)算句子與文檔之間的相似度的過(guò)程中加入對(duì)比相同詞匯量的指標(biāo),記為[ni]。句子與歷史售后評(píng)論之間的相似度計(jì)算公式表示為:
[Sim(Sen,d)=nii=1nwi]
2 ?實(shí)證分析
服飾作為必需品,需求越多,產(chǎn)生的問(wèn)題相對(duì)較多,因此本文根據(jù)上衣、褲子、鞋子隨機(jī)選取九家店鋪數(shù)據(jù)。利用Pathon軟件獲取所選取的天貓店鋪的評(píng)價(jià)數(shù)據(jù),并對(duì)獲取的售后評(píng)論進(jìn)行如下分類:尺寸、厚薄程度、顏色和舒適度。其中有關(guān)尺寸的在線評(píng)論有2 888條,厚薄程度的有639條,顏色的為306條,有關(guān)舒適度的評(píng)論有131條。
2.1 ?詞頻統(tǒng)計(jì)
利用NLPIR軟件對(duì)收集的數(shù)據(jù)進(jìn)行分詞處理,尺寸、厚薄程度、顏色和舒適度的詞匯分別有682,490,426,82條,部分統(tǒng)計(jì)結(jié)果(以部分尺寸詞頻統(tǒng)計(jì)為例)如表1所示。
2.2 ?關(guān)鍵詞獲取
對(duì)獲得的詞匯進(jìn)行分析,以尺寸詞匯為例。表1中類似于“非?!钡母痹~,并不含有實(shí)際的意義,應(yīng)進(jìn)行剔除?!按a子偏小一點(diǎn)”“尺碼有點(diǎn)偏小”再提取“碼子小”“尺碼小”,并分別將處理后的結(jié)果在“碼子”“尺碼”“小”上增加12,4,16。另外“買”“一”“好”等與相關(guān)的主題不相關(guān)的詞匯也應(yīng)當(dāng)予以去除。同理,以此篩選規(guī)則分別對(duì)薄厚程度、顏色、舒適度進(jìn)行詞匯的處理,最終處理的結(jié)果如表2所示。
2.3 ?案例分析
1) 關(guān)鍵詞有效性驗(yàn)證
選擇4條天貓店鋪中評(píng)論語(yǔ)句, “薄點(diǎn),號(hào)碼小點(diǎn),建議親們買的時(shí)候拍大一號(hào)”“料子很硬,不是軟的,但是很舒服,透氣一般,沒(méi)見(jiàn)掉色”“掉色很嚴(yán)重 味道也難聞 物流還慢 同樣是2尺3的黑的就可以穿 灰的就穿不了 說(shuō)是有運(yùn)費(fèi)險(xiǎn)還不是我自己掏的錢 也沒(méi)有給我返支付寶 什么意思也懶的問(wèn) 就當(dāng)花錢買教訓(xùn)了”“買給他的,這件他還挺喜歡的,178,50 kg左右,拍的碼大了,換了165剛剛好,面料也不錯(cuò),薄薄的,比另外一件一百多的好”,記為Sen1,Sen2,Sen3,Sen4。為了驗(yàn)證關(guān)鍵詞的有效性,利用本文提取的關(guān)鍵詞、全部詞匯和根據(jù)文獻(xiàn)[10]選取排序前20%的詞匯組成的關(guān)鍵詞分別對(duì)4條評(píng)論進(jìn)行相似度計(jì)算,并只進(jìn)行對(duì)比相一致的詞匯的權(quán)重的相加。計(jì)算結(jié)果如表3所示。
從上述計(jì)算可以看出,本文提取的關(guān)鍵詞對(duì)于相關(guān)度不大的問(wèn)題不會(huì)產(chǎn)生相似度值,而相關(guān)度大的問(wèn)題相似度值更高,說(shuō)明選取的關(guān)鍵詞可以對(duì)問(wèn)題種類進(jìn)行更有力的區(qū)別。因此本文選取的關(guān)鍵詞對(duì)問(wèn)題的刻畫有著一定的準(zhǔn)確性、快速性及有效性。
2) 基于向量空間模型的相似度計(jì)算
由以上分析可知該選取關(guān)鍵詞的規(guī)則具有一定的有效性,但是最高的兩個(gè)相似度相差卻很小,不易對(duì)在線評(píng)論進(jìn)行分類,本文考慮句子與案例庫(kù)關(guān)鍵詞間詞匯相一致的次數(shù)。根據(jù)本文提出基于向量空間模型的相似度計(jì)算方法對(duì)Sen1,Sen2,Sen3,Sen4進(jìn)行相似度計(jì)算,結(jié)果如表4所示。
根據(jù)上述計(jì)算結(jié)果將Sen1,Sen2,Sen3,Sen4分別歸類到尺寸、舒適度、顏色和尺寸。Sen1,Sen2,Sen3,Sen4與尺寸、舒適度、顏色和尺寸的關(guān)鍵詞相一致的詞匯分別為“號(hào)碼、小、大、號(hào)”“硬、透氣、料子”“掉色、黑”“碼、大”。從上述售后評(píng)論中的重要詞匯可以看出對(duì)應(yīng)的商品的問(wèn)題分別是尺碼不符、料子硬、掉色和尺碼偏大四種,商家可以根據(jù)以往對(duì)這類問(wèn)題的解決方案對(duì)新產(chǎn)生的售后問(wèn)題進(jìn)行相應(yīng)的處理。同時(shí)Sen1,Sen2,Sen3,Sen4四個(gè)評(píng)論反映了產(chǎn)品全生命周期的設(shè)計(jì)階段中尺碼設(shè)計(jì)不標(biāo)準(zhǔn)、材料選取、染色工藝選取等問(wèn)題,店鋪將涉及的產(chǎn)品進(jìn)行反饋可以促進(jìn)產(chǎn)品質(zhì)量的提升。
3 ?結(jié) ?論
本文以在線評(píng)論為研究對(duì)象,文中引入產(chǎn)品全生命周期和向量空間模型對(duì)案例庫(kù)進(jìn)行構(gòu)建及相似度計(jì)算,通過(guò)實(shí)例驗(yàn)證得到如下結(jié)論:將全生命周期的思想引入案例推理中,更有利于對(duì)案例庫(kù)進(jìn)行分類及產(chǎn)品問(wèn)題的解決,引入向量空間模型思想,使相似度計(jì)算變得更加簡(jiǎn)便,并減少了人工參與;在進(jìn)行相似度計(jì)算的過(guò)程中,句子詞匯與關(guān)鍵詞相同的次數(shù)越多說(shuō)明該句子與該案例庫(kù)的相關(guān)程度越大;進(jìn)行分詞后,去除所得的分詞中的詞匯冗余有利于更迅速地將問(wèn)題進(jìn)行分類,并且分類的結(jié)果更具有說(shuō)服力;詞匯量過(guò)大有可能會(huì)淹沒(méi)問(wèn)題與案例庫(kù)的相似度,導(dǎo)致相似度較低不易判斷問(wèn)題的種類。
參考文獻(xiàn)
[1] 李宗偉,張艷輝,欒東慶.哪些因素影響消費(fèi)者的在線購(gòu)買決策:顧客感知價(jià)值的驅(qū)動(dòng)作用[J].管理評(píng)論,2017,29(8):136?146.
[2] 張倩,郭曉林.在線商品評(píng)論對(duì)制造商收益的影響研究[J].商業(yè)經(jīng)濟(jì)研究,2016(11):72?74.
[3] 汪旭暉,張其林,杜航.在線顧客評(píng)論對(duì)產(chǎn)品銷量的影響:品牌強(qiáng)度和產(chǎn)品成熟度的調(diào)節(jié)作用[J].管理工程學(xué)報(bào),2018,32(3):9?18.
[4] 聶卉.隱主題模型下產(chǎn)品評(píng)論觀點(diǎn)的凝聚與量化[J].情報(bào)學(xué)報(bào),2017,36(6):565?573.
[5] 畢建武,劉洋,樊治平.依據(jù)在線評(píng)論的商品排序方法[J].系統(tǒng)工程學(xué)報(bào),2018,33(3):422?432.
[6] 石文華,王璐,繩娜,等.在線初次評(píng)論與在線追加評(píng)論對(duì)商品銷量影響的比較研究[J].管理評(píng)論,2018,30(1):144?153.
[7] 阮光冊(cè),周健超.商品屬性的情感表達(dá)與商品銷售熱度的相關(guān)性研究[J].圖書情報(bào)工作,2017,61(22):13?19.
[8] 林潔,王平春.電子商務(wù)貿(mào)易中在線評(píng)論有用性影響因素研究[J].商業(yè)經(jīng)濟(jì)研究,2017(10):73?75.
[9] 張倩,郭曉林.在線商品評(píng)論對(duì)制造商收益的影響研究[J].商業(yè)經(jīng)濟(jì)研究,2016(11):72?74.
[10] 李琦,趙輝.中文報(bào)紙中的水土保持新聞特點(diǎn)[J].水土保持通報(bào),2017,37(5):213?217.
作者簡(jiǎn)介:張炎亮(1979—),女,安徽人,副教授,主要研究方向?yàn)橘|(zhì)量管理、質(zhì)量控制、服務(wù)質(zhì)量等。
李小哲(1993—),男,河南人,碩士研究生,主要研究方向?yàn)楣I(yè)工程、電子商務(wù)、服務(wù)質(zhì)量等。