李忠洵 華錦芝 劉震 鄭建賓
摘要:
針對多指標綜合評價問題中主客觀權重相悖時客觀權重淹沒主觀權重的問題,以G1法和客觀賦權法為基礎,提出了復合冪函數(shù)修正G1法的組合賦權模型。首先,建立指標體系并通過G1法確定各指標主觀排序和主觀初始向量;然后,利用客觀賦權法計算各指標客觀向量;其次,在不改變主觀排序的情況下利用復合冪函數(shù)算出主客觀結合的綜合權重;最后,利用各指標標準化后的值和綜合權重計算綜合評價值。采用大眾點評網(wǎng)的商戶數(shù)據(jù)進行綜合評價實驗:該模型的均方根誤差(RMSE)為3.891,均低于G1熵權法的8.818和標準差修正G1法的4.752,且覆蓋率優(yōu)于兩種對比方法;分別修改主觀初始向量和主觀排序進行對比實驗,修改主觀排序的均方根誤差為5.430,高于修改主觀初始向量的1.17。實驗結果表明,該模型得到的評價值與大眾點評網(wǎng)官方的評分的一致性較高,且該模型弱化了主觀初值對評分結果的影響,體現(xiàn)了主觀排序的基礎作用。
關鍵詞:
多指標綜合評價;序關系分析;權重;主觀排序;主客觀評價結合
中圖分類號:
TP311
文獻標志碼:A
Abstract:
Considering the issue of objective weight overwhelming subjective weight when the subjective weight and objective weight is inconsistent in multiindex evaluation problem, based on G1 method and the objective weighting method, an assembled weighting model combined with G1 method improved by composite power function was proposed. Firstly, an index system was built, and the subjective ranking and subjective initial vector were determined by G1 method. Thus, each objective index vector was calculated by objective weighting method. Secondly, without changing the ranking order, the comprehensive weights integrated with both subjective and objective components were obtained by utilizing composite power function. Lastly, comprehensive evaluation was calculated by using standardized values of indices and comprehensive weights. Merchants data crawled from Dianping.com was adopted for the experiments of comprehensive evaluation. The RootMeanSquare Error (RMSE) of the new model was 3.891, which is lower than the result of 8.818 obtained by the G1entropy weighting and the result of 4.752 obtained by the standard deviation improved G1. Meanwhile, the coverage rate obtained by the new model was better than the two baseline models as well. On the other hand, the comparison results performed by changing subjective initial vector and subjective ranking order showed that 英摘太長,這句可不要the RMSE obtained by changing subjective ranking order is 5.430, which is higher than the result of 1.17 that obtained by changing subjective initial vector. The experimental results demonstrate that the evaluation values obtained by the new model highly match with the counterparts given by the Dianping.com, and the model can significantly weaken the effect of initial subjective values, which reflects the fundamental status of the subjective ranking.
英文關鍵詞Key words:
multiindex comprehensive evaluation; rank correlation analysis; weight; subjective order; combination of subjective and objective evaluations
0引言
隨著電子商務的飛速發(fā)展,利用大量數(shù)據(jù)對商戶進行全面評價的系統(tǒng)被運用到了各類電商網(wǎng)站當中,對評價結果的準確性和合理性的要求也越來越高,精確合理地評價模型對電商網(wǎng)站發(fā)展和推廣有著重要的作用[1]。對商戶進行評價受到多種評價因素的影響,因此可以利用多指標綜合評價的理論建立評價模型。目前,國內外利用多指標綜合評價理論進行商戶評價的研究尚處于起步階段,需借鑒多指標綜合評價在其他領域的應用和研究。多指標綜合評價也叫作綜合評價,是指人們根據(jù)不同的評價目的,選擇相應的評價形式,據(jù)此選擇多個評價因素或者指標轉化為能反映評價對象總體特征的信息[2]。怎樣進行科學、合理的評價是綜合評價的核心問題。在多指標綜合評價中,指標的選擇、權重的確定和評價模型的選擇將直接影響評價結果的合理性[3]。賦權方法通常分為主觀賦權法、客觀賦權法和主客觀組合賦權法。利用主觀的層次分析法(Analytic Hierarchy Process, AHP)與客觀賦權法進行結合是目前國內外應用較為普遍的組合賦權方法,例如AHP和熵權法結合的方法已經(jīng)被廣泛使用[4]。在國際上,利用各種方法修正和改進AHP被運用到了各個領域的綜合評價當中。Rodriguez等[5]提出了利用模糊推理系統(tǒng)改進模糊層次分析法的方法,用于信息技術項目的風險評估;Oztaysi[6]利用灰色系統(tǒng)理論和TOPSIS(Technique for Order Preference by Similarity to an Ideal Solution)法改進AHP,用于信息系統(tǒng)的決策和綜合評價;Sivakumar等[7]利用Taguchi損失函數(shù)修正AHP進行采礦業(yè)外包供應商的綜合評價。在國內,王學軍等[8]提出了序關系分析法(Rank Correlation Analysis,也被稱為G1法),解決了AHP法中構造判斷矩陣很難達到一致性的難題。李剛等[9]提出了基于標準差修正G1組合賦權的方法(improved G1 by Standard Deviation, SDG1),利用標準差確定指標的重要性之比,解決了相鄰指標重要性之比人為主觀確定的問題;但該方法沒能解決主客觀權重相悖時客觀權重淹沒主觀權重的問題:當相鄰指標的標準差比值與主觀排序相反時,會判斷兩個指標同等重要、權重相等;當標準差比值過大時,會使得修正后比值過大,往往與實際情況不符。本文以大眾點評網(wǎng)的商戶為例進行綜合評價,提出了復合冪函數(shù)修正G1(G1 method improved by Composite Power function, CPG1)法,以解決主客觀權重相悖時客觀權重淹沒主觀權重的問題,并為商戶綜合評價提供一種合適的方法。
1點評網(wǎng)商戶綜合評價指標體系
合理的綜合評價指標體系是實施綜合評價的基礎[3]。點評網(wǎng)商戶的部分指標之間具有不同的性質,反映不同性質的指標之間往往難以進行合適的比較,因此指標體系應選用層次結構。將總的評價目標根據(jù)不同性質分為不同的部分,并逐步細分,構建層次結構,將反映類似性質的指標劃入同一部分。此外,還利用了皮爾森系數(shù)在關聯(lián)性和方向性上對指標進行檢測,保證各指標和最終評價目標之間是相關的,并且與預期的方向一致,即預期為正相關的指標不能成負相關性[10]。根據(jù)以上要求最終構建的點評網(wǎng)商戶綜合評價指標體系如圖1所示。
點評網(wǎng)商戶綜合評價指標體系總共分為五個層面的中級指標,每個中級指標又由各自的基礎指標構成。用戶評分層面由用戶評分基礎指標決定。商戶人氣層面由有效評論數(shù)基
礎指標決定。商戶信譽層面,點評網(wǎng)用戶評論分為有效評論、默認評論、全部評論三類。在全部評論中通過一定的篩選原則選取更公正客觀、更有參考價值的評論作為默認評論,在默認評論中過濾掉違規(guī)評論等無效評論得到有效評論。因此,被過濾掉的商戶比例越大,商戶存在刷分、違規(guī)的可能性越大,商戶信譽也就越低。潛力指數(shù)層面由四個基礎指標決定。人均價格層面由人均價格基礎指標決定。
2CPG1確定組合權重的原理
權重的確定是綜合評價體系中重要的組成部分,不同的權重往往會使評價結果大相徑庭,影響評價結果的合理性以及客觀性。構權方法一般分為主觀賦權法、客觀賦權法和主客觀結合的組合賦權法。主觀賦權法通常需要賦予一定的初值,通過計算或者分析得到最終權重。雖然人為地對指標重要性排序往往符合實際情況,有一定專業(yè)性和合理性,但是初值的設定往往具有隨意性,而且容易受到人為偏好的影響;而客觀賦權法基于客觀數(shù)據(jù),通過一定的數(shù)學方法確定權重,雖然不依賴人的主觀判斷、避免了人為的偏見,但算出的權重往往會脫離實際,不能真實反映實際的需要和重要程度。
通常來說,主觀確定各指標的重要性排序往往是合理的,但主觀賦予的初值往往是隨意和不可靠的[11]。復合冪函數(shù)修正G1法(CPG1)以G1法中用到的主觀排序為基礎,在不改變主觀排序的情況下利用客觀賦權法通過復合冪函數(shù)修正主觀賦予的初值,從而得到主客觀結合的組合權重。本文采用標準差法作為客觀賦權法,利用標準差的比值通過復合冪函數(shù)修正G1法確定權重。不同于通常使用的算數(shù)平均法、幾何平均法等確定組合權重的方法,該方法強調主觀對各指標進行排序的重要性,但又弱化了主觀設定的初值的作用;它在保證主觀排序不變的情況下,利用客觀數(shù)據(jù)對主觀初值進行修正,做到了主客觀結合,是一種新型的構權方法。
2.1G1法原理
G1法也叫序關系分析法,是對AHP的改進。AHP是解決多目標決策問題的常見方法,在綜合評價中利用AHP可以確定主觀權重,但在應用AHP解決實際問題的過程中常遇到判斷矩陣不能通過一致性檢驗而導致無法決策的問題[12]。而G1法無需進行判斷矩陣的一致性檢驗,計算量成倍減少。G1法需要對評價指標進行主觀排序,并設置主觀初始向量T,再通過計算得到各指標權重。
G1法構造權重具體步驟[8]如下:
1)設同一層次下有m個評價指標。若指標xi重要程度不弱于指標xj則記為xi≥xj。
2)確定序關系。根據(jù)專家意見或評價需要對m個評價指標進行兩兩比較,按重要程度的遞減方式排序得到關系式:x1≥x2≥…≥xm。
3)根據(jù)專家意見或評價需要主觀賦予相鄰評價指標xi與xi+1(i=1,2,…,m-1)的重要程度之比ti(ti≥1),得到主觀初始向量T={t1, t2,…,tm-1 }。
4)設任意兩個指標xi和xj的重要性比值為rij,則:
其中,xij表示第i個評價對象的第j個指標標準化后的值。利用指標標準差的比值反映指標的重要程度之比。
2.3組合權重的確定
主客觀結合的賦權法往往存在主客觀權重相悖時客觀權重淹沒主觀權重的情況,使得最終確定的組合權重值與實際情況相悖,甚至組合權重的排序與實際情況不符。而常用的組合權重合成方法如算術平均法、幾何平均法等不能有效地解決該問題。
通常主觀確定各指標的重要性排序是合理可靠的,但主觀賦予的初值具有隨意性且不那么可靠,需要一種能夠不改變主觀排序的組合賦權方法。CPG1法確定權重,利用復合冪函數(shù)修正G1法中的初始向量T,并將修正后的初始向量T′代回G1法計算出組合權重。該方法能保證各指標主觀排序不變的情況下,利用指標標準差的比值對主觀初值進行合理的修正。
CPG1法構造權重具體步驟如下:
1)確定主觀排序:按照G1法主觀確定m個評價指標的重要程度排序x1≥x2≥…≥xm。
2)確定主觀初始向量T:根據(jù)G1法主觀賦予相鄰評價指標xi與xi+1(i=1,2,…,m-1)的重要程度之比ti(ti≥1),得到主觀初始向量T={t1, t2,…,tm-1 }。
3)確定客觀向量R:根據(jù)相鄰指標標準差的比值確定指標的客觀比值。設相鄰指標xi與xi+1(i=1,2,…,m-1)的標準差之比為ri:
求出每一子層次的綜合評價值之后,再用加權求和評分法,便可得到商戶總的綜合評價值。
3點評網(wǎng)商戶綜合評價實例分析
3.1數(shù)據(jù)選擇和處理
3.1.1原始數(shù)據(jù)選擇
考慮到數(shù)據(jù)的完整性和合理性,本文以2014年大眾點評網(wǎng)北京站爬取的數(shù)據(jù)為基礎,從中選出評論數(shù)不小于10的火鍋行業(yè)數(shù)據(jù)作為原始數(shù)據(jù),共1645條。評論數(shù)限制為不小于10是為了過濾掉信息不完整的商戶的影響,限定為特定行業(yè)是因為特定行業(yè)的商戶才有可比性,不同行業(yè)商戶進行比較意義不大。原始數(shù)據(jù)片斷如表1所示。最后一列“點評網(wǎng)評分”是點評網(wǎng)對商戶進行官方評分的最終結果,用于跟本文算法得到的評分結果進行對比分析。官方評分中,5星商戶打50分,4星半商戶打45分,以此類推。
3.1.2指標數(shù)據(jù)轉換
根據(jù)點評網(wǎng)商戶綜合評價指標體系,將原始數(shù)據(jù)轉換為綜合評價指標體系所需的數(shù)據(jù),部分指標需要轉換和處理。
3.1.4主觀排序和初值設定
按照G1法的原理根據(jù)商戶綜合評價的評價需要和行業(yè)經(jīng)驗設定各指標的重要性排序。在中級指標層面:主觀評價≥商戶人氣≥商戶信譽≥潛力指數(shù)≥人均價格。商戶信譽層面:被過濾的默認評論≥被過濾的全部評論。潛力指數(shù)層面:收藏數(shù)≥瀏覽總數(shù)≥一周瀏覽數(shù)≥商圈是否熱門。
在同一層次下比較兩兩相鄰的指標,主觀賦予重要性比值,得到主觀初始向量。設中級指標層面初始向量為T,商戶信譽層面初始向量為T1,潛力指數(shù)層面初始向量為T2。根據(jù)評價需要和行業(yè)經(jīng)驗,主觀初始向量設為:T={5,1.2,1.2,2},T1={1},T2={1.2,1.2,1.6}。
沒有特別說明的情況下,本文的實驗都采用以上的主觀排序和主觀初始向量。
3.2對比方法的選擇
選擇傳統(tǒng)的G1熵權乘法合成構權方法(G1Entropy method,EG1)以及基于標準差修正G1組合賦權法(SDG1)這兩種方法作為對比方法。EG1法和SDG1法的數(shù)據(jù)選擇和處理參考3.1節(jié)的設定,并根據(jù)式(7)生成綜合評價值。
3.2.1EG1法
3.3重合率實驗
設點評網(wǎng)商戶集合為X,X中任意一家商戶為x,點評網(wǎng)官方評分為y(x),其中0≤y(x)≤50。 設閾值為a,y(x)≥a的商戶有n家,而這n家商戶在CPG1法求得的結果中排名前n的商戶中占了m家,則重合率p=m/n。按照前文的設定進行實驗,實驗結果如圖3所示。
圖3中,用戶評分曲線是指點評網(wǎng)官方評分與用戶評分(用戶評分的計算方法見3.1.2節(jié))之間的重合率。從圖3中
可以看出,采用CPG1法比用戶評分有著更高的重合率,即CPG1法與官方評價結果更為接近,也就是說CPG1法構造的綜合評價模型比單純采用用戶評分為依據(jù)進行商戶評級更準確。EG1曲線是指EG1法算出的評分與用戶評分之間的重合率,由于存在主觀權重被客觀權重淹沒的問題,指標之間的主觀排序發(fā)生了改變,影響了最終結果,因此重合率比CPG1法低。SDG1曲線是指SDG1法算出的評分與用戶評分之間的重合率,可以看出SDG1法效果比CPG1法差。
圖3中,當閾值a=40時,重合率大于0.8,說明官方評分四星級以上商戶在CPG1法求得的結果中往往也評分靠前,在一定程度上反映了模型的合理性。
3.4均方根誤差實驗
均方根誤差(Root Mean Square Error, RMSE)是衡量“平均誤差”的一種較方便的方法,用來衡量觀測值同真值之間的偏差。均方根誤差是均方誤差的算術平方根。設有n個觀測值,第i個觀測值與真值之間的誤差為di,則這組觀測值的均方根誤差為:
Re=1n∑ni=1di2
(16)
以商戶點評網(wǎng)的官方評分作為真值,CPG1法求得的評分作為觀測值,計算均方根誤差,共1645家商戶求得均方根誤差Re=3.891。因為商戶評分是50分制的,RMSE值3.891的相對誤差3.891/50<1屬于可以接受的范圍,說明了模型具有一定的準確性。計算官方評分與EG1的均方根誤差,得Re=8.818,比CPG1法得到的均方根誤差大得多。計算官方評分與SDG1的均方根誤差,得Re=4.752,比EG1誤差小,但比CPG1法大。由于1645家商戶數(shù)量過多不便于作圖觀察,隨機比較50家商戶的官方評分、CPG1法評分、EG1法評分、SDG1法并作圖,如圖4所示。
從圖4中可以看出各評分在總體趨勢上都很接近,而EG1法的評分與官方評分之間的差距最大。主要原因是EG1法存在主觀權重被客觀權重淹沒的問題,指標之間的主觀排序發(fā)生了改變,影響了評價效果。而SDG1法雖然保證了主觀排序不變,但在本例中存在相鄰指標標準差之比小于1的情況,求出的相鄰指標重要性相等,使得主觀排序的影響被弱化了。而CPG1法雖然相鄰指標標準差之比小于1,但由于復
合冪函數(shù)的作用,使得重要性排序依然能較好地發(fā)揮作用,因此效果好于SDG1法。
3.5主觀初始向量的實驗
根據(jù)3.1.4節(jié)的設定,主觀初始向量為:T={5,1.2,12,2},T1 ={1},T2 ={1.2,1.2,1.6}。將主觀初始向量改為:T={1.2,1.8,2,1.2},T1 ={1.6},T2={2,1.4,1.8}。以修改前的初始向量算出的評分作為真值,修改后的初始向量求得的評分作為觀測值,計算均方根誤差,共1645家商戶求得均方根誤差Re= 1.170。隨機比較50家商戶主觀初始向量修改前的評分和修改后的評分并作圖,如圖5所示。從RMSE的結果和圖5結果可以看出,主觀初始向量的變化對結果的影響不大,說明CPG1法模型在主客觀結合的情況下弱化了主觀設定的初值的影響。
3.6主觀排序的實驗
根據(jù)3.1.4節(jié)的設定,中級指標層面主觀排序為:主觀評價≥商戶人氣≥商戶信譽≥潛力指數(shù)≥人均價格。將排序修改為:潛力指數(shù)≥商戶信譽≥商戶人氣≥主觀評價≥人均價格。以修改前的排序算出的評分作為真值,修改后的排序求得的評分作為觀測值,計算均方根誤差,共1645家商戶求得均方根誤差Re= 5.430,相對誤差5.430/50>1。隨機比較50家商戶主觀初始向量修改前的評分和修改后的評分并作圖,如圖6所示。
從RMSE結果和圖6可以看出,修改主觀排序之后的評價結果與之前出入較大,修改主觀排序造成的影響比修改主觀初始向量造成的影響大很多,說明CPG1法模型在主客觀結合的情況下強化主觀排序的作用。從總體來說,修改主觀排序之后的結果與之前還是具有一致性,表明了CPG1模型具有一定的魯棒性,排序的改變不會對結果造成根本的改變。
4結語
1)采用CPG1法進行商戶的綜合評價與官方評價有著較
高的重合率和一致性,驗證了方法的有效性和可行性。該方法做到了主觀與客觀的結合,在保證主觀排序不變的情況下,用客觀權重進行修正,避免了客觀權重與主觀權重相悖淹沒主觀權重的問題。該方法強調了主觀排序的重要性,弱化了主觀初值的作用。
2)利用計算機可以在大量數(shù)據(jù)上進行快速批量的綜合評價,適用于需要強調主觀排序或主觀排序較為可靠的各類綜合評價問題。
3)本文選用標準差賦權法作為客觀賦權法,也可以選用其他的客觀賦權法,具體效果有待進一步研究。
4)該方法的前提是主觀排序較為可靠,不適用于主觀排序不可靠的情形。怎么保證主觀排序的可靠性以及在主觀排序不可靠的情形下該怎么改進需要進一步研究。
參考文獻:
[1]
呂品,鐘珞,唐琨皓.在線產(chǎn)品評論用戶滿意度綜合評價研究[J].電子學報,2014,42(4):740-746.(LYU P, ZHONG L,TANG K H. Customer satisfaction degree evaluation of online product review [J]. Acta Electronica Sinica, 2014, 42(4): 740-746.)
[2]
李鵬,俞國燕.多指標綜合評價方法研究綜述[J].機電產(chǎn)品開發(fā)與創(chuàng)新,2009,22(4):24-25.(LI P,YU G Y. Survey on the multiindex comprehensive evaluation method [J]. Development and Innovation of Machinery and Electrical Products, 2009, 22(4): 24-25.)
[3]
HOU H, GUO Y, YI P, et al. The rationality of comprehensive evaluation and a holistic solution [C]// Proceedings of the 2011 International Conference on Business Management and Electronic Information. Piscataway, NJ: IEEE, 2011, 5: 172-176.
[4]
LI L, LIU F, LI C B. Customer satisfaction evaluation method for customized product development using entropy weight and analytic hierarchy process [J]. Computers and Industrial Engineering, 2014, 77(C): 80-87.
[5]
RODRGUEZ A, ORTEGA F, CONCEPCIN R. A method for the evaluation of risk in IT projects [J]. Expert Systems with Applications: An International Journal, 2016, 45(C): 273-285.
[6]
OZTAYSI B. A decision model for information technology selection using AHP integrated TOPSISGrey: the case of content management systems [J]. KnowledgeBased Systems, 2014, 70(C): 44-54.
[7]
SIVAKUMAR R, KANNAN D, MURUGESAN P. Green vendor evaluation and selection using AHP and Taguchi loss functions in production outsourcing in mining industry [J]. Resources Policy, 2015, 46: 64-75.
[8]
王學軍,郭亞軍,蘭天.構造一致性判斷矩陣的序關系分析法[J].東北大學學報(自然科學版),2006,27(1):115-118.(WANG X J, GUO Y J, LAN T. Rank correlation analysis of formation of consistent judgment matrix [J]. Journal of Northeastern University (Natural Science), 2006, 27(1): 115-118.)
[9]
李剛,張明,宋兆杰,等.基于標準差修正G1組合賦權的科技評價模型及實證[J].科技管理研究,2011,31(20): 47-50.(LI G, ZHANG M, SONG Z J, et al. The science and technology evaluation model based on revised G1 by standard deviation and empirical research [J]. Science and Technology Management Research, 2011, 31(20): 47-50.)
[10]
PJ Benesty,J Chen,Y Huang, et al. Pearson correlation coefficient [J]. Noise Reduction in Speech Processing, 2009, 2: 1-4.
BENESTY PJ, CHEN J, HUANG Y, et al. Pearson correlation coefficient [C]// Noise Reduction in Speech Processing, Springer Topics in Signal Processing 2. Berlin: Springer, 2009: 1-4.
[11]
秦志斌,錢國平,馬文彬.基于熵權的瀝青路面使用性能多目標綜合評價[J].中南大學學報(自然科學版),2013,44(8):3474-3478.(QIN Z B, QIAN G P, MA W B. Multiobjective comprehensive evaluation for performance of asphalt concrete pavement based on fuzzy entropy [J]. Journal of Central South University (Science and Technology), 2013, 44(8): 3474-3478.)
[12]
DONG Q, COOPER O. A peertopeer dynamic adaptive consensus reaching model for the group AHP decision making [J]. SSRN Electronic Journal, 2014, 250(2): 521-530.
[13]
寧寶權,彭望書,郭樹勤,等.基于動態(tài)組合賦權的農(nóng)業(yè)機械綜合評價研究[J].農(nóng)機化研究,2015(7):79-82.(NING B Q, PENG W S, GUO S Q, et al. Research on comprehensive evaluation of agricultural machinery based on dynamic combination weighting [J]. Journal of Agricultural Mechanization Research, 2015(7): 79-82.)