畢建武,劉 洋,樊治平
(東北大學(xué)工商管理學(xué)院,遼寧沈陽110167)
隨著互聯(lián)網(wǎng)的不斷發(fā)展,越來越多的電子商務(wù)網(wǎng)站和社交媒體平臺(tái)鼓勵(lì)消費(fèi)者在網(wǎng)站上發(fā)表他們已購買或使用過的商品的相關(guān)評(píng)論信急[1,2].與商品賣方提供的商品描述相比,這些由消費(fèi)者提供的商品在線評(píng)論信急能夠更加客觀的反應(yīng)商品的真實(shí)情況.一些研究結(jié)果表明,大眾消費(fèi)者在購買商品(尤其是價(jià)格較高的商品)之前通常會(huì)閱讀關(guān)于該商品的在線評(píng)論信急,并依據(jù)商品在線評(píng)論信急做出最終的購買決策[3?6].然而,由于商品在線評(píng)論屬于非結(jié)構(gòu)化文本數(shù)據(jù)而且其數(shù)量往往較大,如果讓消費(fèi)者逐條閱讀和分析大量在線評(píng)論信急進(jìn)而做出購買決策將會(huì)非常繁瑣和困難[7].因此,為了支持消費(fèi)者的購買決策,如何客觀的對(duì)大量的商品在線評(píng)論進(jìn)行自動(dòng)化分析并對(duì)相關(guān)商品進(jìn)行排序是一個(gè)非常值得關(guān)注的研究問題.
目前,基于在線評(píng)論的商品排序已經(jīng)引起了國內(nèi)外一些學(xué)者的關(guān)注,并取得了一些研究成果.例如Zhang等[8]較早的關(guān)注到了基于在線評(píng)論的商品排序問題并提出了相應(yīng)的排序方法,在其方法中,首先提出了一種動(dòng)態(tài)規(guī)劃技術(shù)來識(shí)別評(píng)論中的比較語句和評(píng)價(jià)語句,然后依據(jù)情感分析技術(shù)對(duì)比較語句和評(píng)價(jià)語句的情感傾向進(jìn)行判定,在此基礎(chǔ)上構(gòu)建了針對(duì)同類商品比較的有向加權(quán)圖,依據(jù)有向加權(quán)圖采用改進(jìn)的PageRank算法確定了商品排序.在文獻(xiàn)[8]的基礎(chǔ)上,Zhang等[9,10]通過考慮在線評(píng)論所涉及的商品屬性,評(píng)論獲得的有用性投票(點(diǎn)贊)數(shù)量和評(píng)論發(fā)表時(shí)間等因素,對(duì)文獻(xiàn)[8]所提出的方法進(jìn)行了改進(jìn).Peng等[11]通過統(tǒng)計(jì)商品在線評(píng)論中不同屬性特征詞出現(xiàn)的頻率,確定了消費(fèi)者所關(guān)注的重要商品屬性,在此基礎(chǔ)上,提出了一種基于模糊PROMETHEE的商品排序方法.Chen等[12]依據(jù)同類商品的在線評(píng)論信急,通過集成主題模型,TOPSIS和多維尺度分析提出了一種基于在線評(píng)論的市場結(jié)構(gòu)可視化方法,通過使用該方法可以確定同類商品的排序.Najmi等[13]通過考慮商品的品牌,評(píng)論的情感傾向和評(píng)論的有用性等因素,提出了一種基于在線評(píng)論的商品綜合排序方法.Yang等[14]同時(shí)考慮了消費(fèi)者針對(duì)商品的打分評(píng)級(jí),文本評(píng)論和對(duì)比性投票等三類信急,提出了一種基于有向加權(quán)圖的商品排序方法.
已有研究對(duì)于基于在線評(píng)論的商品排序做出了重要貢獻(xiàn).然而,目前針對(duì)此方面研究所取得的研究成果非常有限,仍顯不足.在已有的研究中[8?14],通常是首先識(shí)別在線評(píng)論的正向或負(fù)向的情感傾向,再依據(jù)得到正向和負(fù)向的情感傾向進(jìn)行商品排序.目前,一些學(xué)者已經(jīng)明確指出,僅識(shí)別在線評(píng)論的正向和負(fù)向的情感傾向而不考慮相同情感傾向評(píng)論的不同情感強(qiáng)度,是過于簡化的處理方式,容易導(dǎo)致信急損失[15,16].如果可以識(shí)別商品在線評(píng)論不同的情感強(qiáng)度,則可以基于大量在線評(píng)論的情感強(qiáng)度來確定商品的排序.為此,本文提出一種基于多粒度情感強(qiáng)度分析和隨機(jī)TOPSIS的商品排序方法.在該方法中,首先通過提出多粒度情感強(qiáng)度分析算法確定每條評(píng)論針對(duì)商品屬性的情感強(qiáng)度值,然后構(gòu)建備選商品針對(duì)商品屬性的多粒度情感強(qiáng)度分布形式的屬性值,進(jìn)而采用隨機(jī)TOPSIS方法確定備選商品的排序.
圖1展示了一類依據(jù)商品在線評(píng)論的商品排序問題.由圖1可以看出,消費(fèi)者在購買商品之前,通常會(huì)根據(jù)自身的需要和商品的價(jià)格等相關(guān)信急,初步確定幾款備選商品.為了從多個(gè)備選商品中選擇最適合的商品,消費(fèi)者可能會(huì)通過商品銷售和評(píng)論網(wǎng)站獲取備選商品的相關(guān)在線評(píng)論信急.依據(jù)消費(fèi)者關(guān)注的備選商品和屬性,如何依據(jù)在線評(píng)論確定備選商品針對(duì)屬性的評(píng)價(jià)結(jié)果,并依據(jù)屬性評(píng)價(jià)結(jié)果和屬性權(quán)重確定備選商品的排序,這是本文所要解決的問題.為了便于分析說明,下面的符號(hào)用來描述該問題中所涉及的集合和變量.
A={A1,A2,...,An}表示消費(fèi)者關(guān)注的n個(gè)備選商品集合,其中Ai表示消費(fèi)者關(guān)注的第i個(gè)備選商品,i=1,2,...,n.F={f1,f2,...,fm}表示消費(fèi)者關(guān)注的m個(gè)商品屬性集合,其中fj表示消費(fèi)者關(guān)注的第j個(gè)屬性,j=1,2,...,m.w=(w1,w2,...,wm)表示消費(fèi)者關(guān)注的備選商品屬性權(quán)重向量,其中wj表示屬性fj的權(quán)重,且滿足wj=1,wj≥0,j=1,2,...,m.備選商品屬性權(quán)重向量可以由消費(fèi)者根據(jù)自身偏好預(yù)先給定.Q=(q1,q2,...,qn)表示備選商品的評(píng)論數(shù)量向量,其中qi表示針對(duì)備選商品Ai的評(píng)論數(shù)量,i=1,2,...,n.Ri={Ri1,Ri2,...,Riqi}表示針對(duì)備選商品Ai的評(píng)論集合,其中Rik表示針對(duì)商品Ai的第k條評(píng)論,i=1,2,...,n,k=1,2,...,qi.本文所要解決的問題是,依據(jù)消費(fèi)者提供的屬性F,屬性權(quán)重w和在線評(píng)論信急Ri,i=1,2,...,n,如何確定備選商品A1,A2,...,An的排序,以支持消費(fèi)者進(jìn)行商品購買決策.
圖1 基于商品在線評(píng)論的商品排序問題Fig.1 The goods ranking problem based on online reviews
為了解決上述問題,這里給出一種基于多粒度情感強(qiáng)度分析和隨機(jī)TOPSIS的商品排序方法.該方法的基本思想是:首先,采用爬蟲軟件和ICTCLAS軟件對(duì)消費(fèi)者關(guān)注的備選商品的在線評(píng)論進(jìn)行獲取和預(yù)處理;然后,依據(jù)預(yù)處理后的評(píng)論,通過提出多粒度情感強(qiáng)度分析算法確定每條評(píng)論針對(duì)消費(fèi)者關(guān)注的商品屬性的情感強(qiáng)度值;再次,通過對(duì)得到的情感強(qiáng)度值進(jìn)行統(tǒng)計(jì)分析,構(gòu)建備選商品針對(duì)商品屬性的多粒度情感強(qiáng)度分布形式的屬性值;最后,依據(jù)得到屬性值,可以采用隨機(jī)TOPSIS方法確定備選商品的排序.下面給出該方法的具體描述.
2.2.1 備選商品在線評(píng)論獲取和預(yù)處理
備選商品在線評(píng)論獲取和預(yù)處理是備選商品在線評(píng)論多粒度情感強(qiáng)度分析的基礎(chǔ)工作.本文采用爬蟲軟件對(duì)商品在線評(píng)論進(jìn)行獲取,采用ICTCLAS漢語分詞系統(tǒng)(http://ictclas.nlpir.org/)對(duì)獲取的評(píng)論進(jìn)行預(yù)處理,具體過程如下:
1)備選商品在線評(píng)論獲取
根據(jù)消費(fèi)者關(guān)注的備選商品集合A={A1,A2,...,An},采用爬蟲軟件按照設(shè)定的規(guī)則對(duì)備選商品在線評(píng)論進(jìn)行獲取,可以得到備選商品在線評(píng)論Ri={Ri1,Ri2,...,Riqi},i=1,2,...,n.
2)備選商品在線評(píng)論預(yù)處理
針對(duì)備選商品在線評(píng)論的預(yù)處理包括兩個(gè)步驟,即分詞和詞性標(biāo)注和停用詞刪除.下面分別針對(duì)這兩個(gè)步驟給出具體的描述.
(a)分詞和詞性標(biāo)注.采用ICTCLAS漢語分詞系統(tǒng)對(duì)備選商品在線評(píng)論進(jìn)行分詞和詞性標(biāo)注.通過分詞和詞性標(biāo)注能夠?qū)⒕渥有问降脑u(píng)論分解成若干詞語并且在每個(gè)詞后標(biāo)注了相應(yīng)的詞性.例如,評(píng)論“畫質(zhì)非常好”經(jīng)過分詞和詞性標(biāo)注得到的結(jié)果為“畫質(zhì)/n非常/d好/a”,其中n,d和a分別表示名詞,副詞和形容詞.
(b)停用詞刪除.停用詞通常是指出現(xiàn)頻率高,但又沒有實(shí)際意義的詞,例如“了”,“的”,“呢”等.為了提高情感強(qiáng)度分析的效率,通常需要對(duì)評(píng)論中的停用詞進(jìn)行刪除.本文使用中文停用詞表對(duì)停用詞進(jìn)行刪除.具體的,將分詞及詞性標(biāo)注處理后的評(píng)論與中文停用詞表中的停用詞(保留標(biāo)點(diǎn)符號(hào))進(jìn)行比對(duì),并刪除在停用詞表中出現(xiàn)的詞.
將經(jīng)過預(yù)處理后得到的關(guān)于備選商品Ai的第k條評(píng)論的詞集合記為其中表示W(wǎng)Sik中的第v個(gè)詞,qik表示W(wǎng)Sik中的詞總數(shù),i=1,2,...,n,k=1,2,...,qi,v=1,2,...,qik.
2.2.2 備選商品屬性評(píng)論多粒度情感強(qiáng)度分析
依據(jù)備選商品在線評(píng)論預(yù)處理結(jié)果,為了進(jìn)行商品排序,需要確定備選商品在線評(píng)論針對(duì)消費(fèi)者關(guān)注的商品屬性的多粒度情感強(qiáng)度值.為此,這里給出一種基于情感詞典的在線評(píng)論多粒度情感強(qiáng)度分析方法,該方法主要包括三個(gè)步驟,包括備選商品屬性的同義詞合并,備選商品領(lǐng)域情感詞典建立和備選商品屬性評(píng)論多粒度情感強(qiáng)度識(shí)別.下面給出每個(gè)步驟的具體描述.
1)備選商品屬性的同義詞合并
不同的評(píng)論者在發(fā)表評(píng)論時(shí)描述同類商品的同一屬性可能使用不同的詞,因此有必要首先對(duì)描述同一商品屬性的同義詞進(jìn)行合并.本文采用基于詞語相似度的方法來對(duì)描述同一商品屬性的同義詞進(jìn)行合并.具體過程如下.
首先,依據(jù)備選商品在線評(píng)論預(yù)處理結(jié)果,從所有備選商品的評(píng)論詞集合中提取名詞.令WSnoun=表示從所有備選商品評(píng)論中提取的名詞集合,其中表示W(wǎng)Snoun中第l個(gè)名詞,qnoun表示名詞集合中名詞的數(shù)量,l=1,2,...,qnoun.
然后,令Wfj表示針對(duì)商品屬性fj的標(biāo)準(zhǔn)用詞,j=1,2,...,m.通常,針對(duì)消費(fèi)者可能關(guān)注的屬性,電子商務(wù)網(wǎng)站可以預(yù)先設(shè)定商品屬性的標(biāo)準(zhǔn)用詞,并且要求消費(fèi)者通過對(duì)所提供的標(biāo)準(zhǔn)用詞進(jìn)行勾選來確定消費(fèi)者所關(guān)注的商品屬性.因此,考慮針對(duì)各商品屬性的標(biāo)準(zhǔn)用詞為已知條件.這樣,通過文獻(xiàn)[17]提出的方法,可以計(jì)算詞與商品屬性標(biāo)準(zhǔn)用詞Wfj的相似度sim(Wfj,),即
其中Dis(Wfj,)表示依據(jù)同義詞詞林[17]計(jì)算得到的Wfj和之間的距離;α為可調(diào)參數(shù),α的默認(rèn)取值為1.6.
由sim(Wfj,)的值的大小可確定詞Wfj和是否為同義詞.具體的,若sim(Wfj,)≥0.5,則認(rèn)為詞Wfj是Wlnoun的同義詞;如果sim(Wfj,)<0.5,則認(rèn)為詞Wfj不是的同義詞[11,17].通過相似度計(jì)算,可以得到針對(duì)詞Wfj的同義詞集合其中,表示W(wǎng)Sj,將評(píng)論詞集合WSik中的替換為Wfj,即可完成同義詞合并,i=1,2,...,n,j=1,2,...,m,k=1,2,...,qi,p=1,2,...,qfi.
通常一條商品評(píng)論中可能包含針對(duì)多個(gè)屬性的評(píng)論信急,為了識(shí)別一條評(píng)論中關(guān)于不同屬性的多粒度情感強(qiáng)度值,需要首先識(shí)別一條評(píng)論中針對(duì)不同屬性的評(píng)論信急.記為WSik中的針對(duì)屬性j的評(píng)論信急,i=1,2,...,n,j=1,2,...,m,k=1,2,...,qi.關(guān)于的確定方式如下:將替換同義詞后得到的WSik中的詞與屬性標(biāo)準(zhǔn)用詞Wfj進(jìn)行比對(duì),如果Wfj∈WSik,則提取WSik中包含詞Wfj的兩個(gè)相鄰標(biāo)點(diǎn)符號(hào)之間的評(píng)論所包含的形容詞,動(dòng)詞和副詞[18],可以得到其中表示中的第 u個(gè)詞,qj表示中詞的總數(shù),i=1,2,...,n,j=1,2,...,m,k=1,2,...,qi.特別的,如果Wfj/∈WSik,則記= “? ”,i=1,2,...,n,j=1,2,...,m,k=1,2,...,qi.
2)備選商品領(lǐng)域情感詞典建立
考慮到針對(duì)不同商品的情感詞集合可能不同,為了提高多粒度情感強(qiáng)度分析的準(zhǔn)確性,有必要建立商品領(lǐng)域情感詞典.備選商品領(lǐng)域情感詞典建立的具體過程如下.
令WS′={W1,W2,...,Wq′}為針對(duì)備選商品評(píng)論的意見詞集合,其中Wg表示W(wǎng)S′中的第g個(gè)意見詞,q′表示 WS′中詞總數(shù),g=1,2,...,q′.WS′可以通過式(2)確定,即
依據(jù)得到的WS′,本文利用HowNet(http://www.keenage.com/)來構(gòu)建商品領(lǐng)域的正向情感詞典和負(fù)向情感詞典.具體的,令和分別為HowNet中通用的正向評(píng)價(jià)詞語和負(fù)向評(píng)價(jià)詞語的集合.根據(jù)和WS′初步構(gòu)建備選商品領(lǐng)域正向情感詞典和負(fù)向情感詞典其中
需要指出的是,由于可能出現(xiàn)WS′中的部分詞同時(shí)不屬于的情況,針對(duì)以上情況需要通過人工識(shí)別來確定相應(yīng)詞所隸屬的領(lǐng)域情感詞典,并最終得到備選商品領(lǐng)域情感詞典.記WS+和WS?分別表示最終確定的備選商品領(lǐng)域正向情感詞典和備選商品領(lǐng)域負(fù)向情感詞典.
3)備選商品屬性評(píng)論多粒度情感強(qiáng)度識(shí)別
步驟1判斷是否為空集,若= ?,則←0;否則跳轉(zhuǎn)到步驟2;
步驟2判斷是否為 “?”,若=“?”,則←“?”;否則跳轉(zhuǎn)到步驟3;
步驟3判斷與WS+的交集是否為空集,若WS+∩?= ?,則← 1;否則← 0;
步驟4判斷與WS?的交集是否為空集,若WS?∩?=?,則←1;否則←0;
步驟5判斷與WSneg的交集是否為空集,若WSneg?=?,則←1;否則←0;
步驟6判斷與WSd的交集是否為空集,若WSd= ?,則← 0;若則←1;否則←?1;
步驟7若==0或者=1,則←0;若=1,=0和=1或者=0,則←?2?否則
其中i=1,2,...,n,j=1,2,...,m,k=1,2,...,qi.
2.2.3 備選商品排序
其中i=1,2,...,n,j=1,2,...,m.
針對(duì)Pij(x),x=?1,?2,?3,0,1,2,3的表達(dá)式,相應(yīng)的累積分布函數(shù)可以寫為
在此基礎(chǔ)上,可以采用隨機(jī)TOPSIS方法[19],對(duì)備選商品進(jìn)行排序.
備選商品Ai關(guān)于屬性fj的多粒度情感強(qiáng)度分布形式的屬性值Pij(x)的累積分布函數(shù)Fij(x)到和的距離可以采用式(11)和式(12)進(jìn)行計(jì)算,即
可見,Ci的值越大,備選商品Ai越優(yōu).因此按照計(jì)算得到的Ci的值的大小對(duì)所有備選商品排序,可以得到所有備選商品的優(yōu)劣排序結(jié)果.
綜上,下面給出依據(jù)商品在線評(píng)論的基于多粒度情感強(qiáng)度分析和隨機(jī)TOPSIS的商品排序方法的具體計(jì)算步驟.
步驟1采用爬蟲軟件獲取備選商品在線評(píng)論Ri={Ri1,Ri2,...,Rqi},對(duì)Ri進(jìn)行預(yù)處理得到每條評(píng)論的詞集合
步驟2根據(jù)式(1),對(duì)備選商品屬性的同義詞進(jìn)行合并,并確定每條評(píng)論中針對(duì)不同屬性的評(píng)論信急=1,2,...,n,j=1,2,...,m,k=1,2,...,qi;
步驟3根據(jù)式(2)~式(4),建立商品領(lǐng)域正向情感詞典WS+和負(fù)向情感詞典WS?;
步驟4根據(jù)算法1,計(jì)算備選商品屬性評(píng)論多粒度情感強(qiáng)度值=1,2,...,n,j=1,2,...,m,k=1,2,...,qi;
步驟5根據(jù)式(5)~式(8),構(gòu)建備選商品針對(duì)商品屬性的多粒度情感強(qiáng)度分布形式的屬性值Pij(x),i=1,2,...,n,j=1,2,...,m;
步驟6根據(jù)式(9)~式(10),構(gòu)建正、負(fù)理想累積分布向量F+和F?;
步驟7根據(jù)式(11)~式(15),計(jì)算備選商品Ai的貼近度Ci,并根據(jù)Ci由大到小對(duì)備選商品進(jìn)行排序,i=1,2,...,n.
為了進(jìn)一步說明本文提出方法的潛在應(yīng)用,本部分給出一個(gè)依據(jù)在線評(píng)論信急對(duì)多款相機(jī)商品排序的算例分析.考慮某消費(fèi)者欲購買一款價(jià)格在1萬元左右的數(shù)碼相機(jī),通過多方面了解信急,初步確定了4款備選數(shù)碼相機(jī),即
A1:佳能6D套機(jī)(24 mm~105 mm);
A2:佳能7D套機(jī)(18 mm~135 mm);
A3:尼康D610套機(jī)(24 mm~120 mm);
A4:尼康D750套機(jī)(24 mm~120 mm).
該消費(fèi)者關(guān)注的備選相機(jī)屬性為:性價(jià)比(f1),操控(f2),畫質(zhì)(f3),電池(f4),鏡頭(f5),對(duì)焦(f6),快門(f7),并且該消費(fèi)者給出的備選相機(jī)屬性權(quán)重向量為w=(0.2,0.1,0.2,0.1,0.1,0.1,0.2).
為了支持該消費(fèi)者做出合理的購買決策,需要依據(jù)在線評(píng)論對(duì)以上4款備選相機(jī)進(jìn)行排序.
首先,以中關(guān)村在線(http://www.zol.com.cn/)提供的商品點(diǎn)評(píng)作為備選相機(jī)評(píng)論來源,使用Locoy Spider軟件采集備選相機(jī)在線評(píng)論,得到備選相機(jī)在線評(píng)論Ri={Ri1,Ri2,...,Riqi},對(duì)Ri進(jìn)行預(yù)處理得到每條評(píng)論的詞集合WSik=,i=1,2,3,4,k=1,2,...,qi,q1=402,q2=201,q3=220,q4=350.以備選相機(jī)A1為例,對(duì)其評(píng)論進(jìn)行預(yù)處理的結(jié)果如表1所示.
根據(jù)式(1),對(duì)描述相機(jī)屬性的同義詞進(jìn)行合并,并識(shí)別每條評(píng)論中針對(duì)不同屬性的評(píng)論信急,即確定這里以備選相機(jī)A1的第一條評(píng)論R11為例進(jìn)行說明,R11中僅包含畫質(zhì)(f3)的評(píng)論語句,對(duì)該條評(píng)論進(jìn)行同義詞合并,提取包含描述屬性f3的詞Wf3(畫質(zhì))的兩個(gè)相鄰標(biāo)點(diǎn)符號(hào)之間的形容詞,動(dòng)詞和副詞可以得到該條評(píng)論中針對(duì)畫質(zhì)(Wf3)的評(píng)論信急為={非常/d,好/a}.
表1 備選相機(jī)A1的評(píng)論預(yù)處理結(jié)果Table 1 The pre-processing results of the reviews concerning alternative camera A1
然后,根據(jù)式(2)~式(4),建立相機(jī)領(lǐng)域正向情感詞典WS+和負(fù)向情感詞典WS?,部分情感詞見表2.
表2 部分情感詞Table 2 Partial sentiment words
根據(jù)情感強(qiáng)度分析算法,計(jì)算備選相機(jī)針對(duì)屬性的評(píng)論的情感強(qiáng)度值=1,2,3,4,k=1,2,...,qi,q1=402,q2=201,q3=220,q4=350.這里以={非常/d,好/a}為例來進(jìn)一步說明如何通過情感強(qiáng)度分析算法確定的值.由于中僅存在正向情感詞“好”和情感強(qiáng)度增強(qiáng)詞“非?!?即由情感強(qiáng)度分析算法的步驟3,步驟4,步驟5和步驟6可分別確定各指示變量的值,即在此基礎(chǔ)上,可以由情感強(qiáng)度分析算法的步驟7確定的值,即=2+1=3.最終得到該條評(píng)論關(guān)于屬性f3的情感強(qiáng)度值為3.
依據(jù)表3和式(8),可以得到針對(duì)Pij(x)的累積分布函數(shù)Fij(x),i=1,2,3,4,j=1,2,...,7.為了節(jié)省篇幅,這里以F11(x)為例,簡要說明其計(jì)算過程.
表3 備選相機(jī)關(guān)于屬性的多粒度情感強(qiáng)度分布形式的屬性值Table 3 Feature values in the form of distribution concerning multi-granularity sentiment strengths on alternative cameras
表4 正、負(fù)理想累積分布向量Table 4 The probability distributions of the ideal and nadir solutions
由表3可知,備選相機(jī)A1關(guān)于屬性f1的多粒度情感強(qiáng)度分布形式的屬性值為
依據(jù)式(8),P11(x)的相應(yīng)累積分布函數(shù)F11(x)可以寫為
在此基礎(chǔ)上,依據(jù)式(9)和式(10),可構(gòu)建正、負(fù)理想累積分布向量和結(jié)果如表4所示.
根據(jù)式(11)~式(14),計(jì)算備選相機(jī)Ai到正向和負(fù)向理想累積分布向量F+和F?的距離,即i=1,2,3,4.計(jì)算結(jié)果為=0.533 1,=0.744 9,=0.724 1,=0.497 9,=0.872 4,=0.660 5,=0.681 3,=0.907 5.最后,依據(jù)式(15),可計(jì)算備選相機(jī)的貼近度,計(jì)算結(jié)果為C1=0.620 7,C2=0.470 0,C3=0.484 7,C4=0.645 7.通過比較4款備選相機(jī)的貼近度的值可得到4款相機(jī)排序結(jié)果為A4?A1?A3?A2,即該消費(fèi)者可以考慮購買備選相機(jī)A4.
本文給出了一種依據(jù)商品在線評(píng)論的基于多粒度情感強(qiáng)度分析和隨機(jī)TOPSIS的商品排序方法.在該方法中,首先,采用爬蟲軟件和ICTCLAS對(duì)消費(fèi)者關(guān)注的備選商品的在線評(píng)論信急進(jìn)行獲取和預(yù)處理.然后,依據(jù)預(yù)處理后的評(píng)論,通過提出的多粒度情感強(qiáng)度分析算法可以確定每條評(píng)論針對(duì)消費(fèi)者關(guān)注的商品屬性的情感強(qiáng)度值.進(jìn)一步地,通過對(duì)得到的情感強(qiáng)度值進(jìn)行統(tǒng)計(jì)分析,可以構(gòu)建備選商品針對(duì)商品屬性的多粒度情感強(qiáng)度分布形式的屬性值.在此基礎(chǔ)上,可以依據(jù)隨機(jī)TOPSIS方法確定備選商品的排序.該方法具有概念清晰、計(jì)算簡單等特點(diǎn),有較強(qiáng)的可操作性和實(shí)用性,為解決依據(jù)在線評(píng)論的商品排序問題提供了一種新的思路.
需要強(qiáng)調(diào)的是,在本文研究中,提出了一種多粒度情感強(qiáng)度分析算法.使用該算法,可以將在線評(píng)論的情感強(qiáng)度劃分為七個(gè)情感粒度,進(jìn)而通過統(tǒng)計(jì)分析,可以將海量在線評(píng)論中所蘊(yùn)含的針對(duì)商品的情感強(qiáng)度轉(zhuǎn)化為多粒度情感強(qiáng)度分布形式的屬性值.這種處理方式,一方面避免了僅考慮正向和負(fù)向情感傾向所造成的大量信急損失,另一方面方便借助已有的基于隨機(jī)(頻度)分布的信急處理和決策分析方法進(jìn)行基于海量在線評(píng)論信急的信急處理與決策分析,為進(jìn)一步開展基于在線評(píng)論信急的決策分析奠定了良好的基礎(chǔ).