,,, ,
(1. 浙江工業(yè)大學(xué) 計算機(jī)科學(xué)與技術(shù)學(xué)院,浙江 杭州 310023;2. 中國移動通信集團(tuán)浙江有限公司岱山分公司,浙江 岱山 316200; 3. 華立科技股份公司,浙江 杭州 310023)
近年來電力市場蓬勃發(fā)展,對電力系統(tǒng)進(jìn)行全方位的評估也越來越重要.電力用戶是電力系統(tǒng)重要的組成部分,很有必要對其進(jìn)行信用度管理.當(dāng)用戶拖欠的電費超過一定額度,或者用戶產(chǎn)生某些違規(guī)用電行為時,信用系統(tǒng)需要給出警示,通知電力管理部門對用戶采取一定措施,如催繳、罰款和斷電等.目前,電費的繳納情況已納入個人的誠信記錄.有效地進(jìn)行電力用戶信用度管理,可以提高用戶的誠信意識,減少欠費和違法用電行為,幫助電力公司減輕運營負(fù)擔(dān),獲得良好的經(jīng)濟(jì)效益和社會效益.現(xiàn)在已經(jīng)有一些評價電力用戶信用度的模型.盧雯嘉等[1]提出利用遺傳算法和BP神經(jīng)網(wǎng)絡(luò)建立電力用戶評價模型.該方法充分發(fā)揮了遺傳算法和神經(jīng)網(wǎng)絡(luò)的優(yōu)勢,使構(gòu)成的模型具有兩者的優(yōu)點.王輝[2]從用戶的購電水平、信用狀況、潛在價值、用電特性和可持續(xù)能力5 個方面構(gòu)建了電力用戶評價指標(biāo)體系,并使用J2EE開發(fā)模式實現(xiàn)了電力用戶信用評價及預(yù)測系統(tǒng).楊尚東等[3]利用LVQ神經(jīng)網(wǎng)絡(luò)建立了企業(yè)用戶風(fēng)險識別系統(tǒng),以期在電力大客戶發(fā)生欠費前對其財務(wù)狀況進(jìn)行檢測,以分析和預(yù)測其欠費發(fā)生的風(fēng)險.朱瑩[4]按用電類別、電價類別和行業(yè)分類等對電力用戶進(jìn)行了分類,并對不同類別的用戶建立了相應(yīng)的評價模型.王綿斌[5]采用層次分析法和理想點法來分析計算用戶的信用等級.許盈盈[6]主要考慮了用戶的繳費信息及財務(wù)信息,利用KMV信用等級評價管理模型.汪莉[7]通過德菲爾法構(gòu)建了電力客戶信用評分指標(biāo),并建立了AHP-logistic混合信用評分模型.
現(xiàn)有的研究成果有些使用了主觀性評價方法,有些使用了客觀性的評價方式.為了充分體現(xiàn)電力用戶信用度評價的公正性和客觀性,筆者通過分析電力用戶的特點,恰當(dāng)?shù)剡x取影響用戶信用度的相關(guān)指標(biāo),建立了信用度評價的指標(biāo)體系.層次分析法(Analytic hierarchy process,AHP)廣泛地應(yīng)用于各類評價系統(tǒng)中[8-10],k-means聚類算法能夠有效地進(jìn)行對象分類[11].筆者首先使用主觀性較強(qiáng)的層次分析法進(jìn)行信用度的計算,之后使用客觀性強(qiáng)的k-means算法修正得到的信用度,從而提高了用戶信用等級計算的準(zhǔn)確性.內(nèi)容組織結(jié)構(gòu)如下:1) 建立電力用戶信用度的評價指標(biāo)體系;2) 給出信用度評價公式和數(shù)據(jù)預(yù)處理的方法;3) 介紹基于AHP和k-means算法的電力用戶信用度評價算法;4) 以居民電力用戶為例,給出電力用戶信用度評價實例;5) 總結(jié)并給出下一步的研究方向.
影響電力用戶信用度的指標(biāo)很多,前人的研究也
給出了多種指標(biāo)體系[12-13].結(jié)合已有的研究成果和電力用戶的特性,筆者提出了一套電力用戶信用度評價指標(biāo).由于居民用戶和企業(yè)用戶的屬性相差較遠(yuǎn),因此為居民用戶和企業(yè)用戶分別建立了評價指標(biāo)體系.
影響居民用戶信用度的關(guān)鍵因素有用戶繳費情況、用電貢獻(xiàn)和違規(guī)用電記錄等.其中,用戶繳費情況對應(yīng)的指標(biāo)包括累計欠費金額、累計欠費率和累計欠費次數(shù).累計欠費率定義為累計的欠費額/三年應(yīng)繳的電費.用電貢獻(xiàn)的對應(yīng)指標(biāo)有累計用電電量和月平均繳費額.違規(guī)用電記錄的對應(yīng)指標(biāo)有累計竊電次數(shù)、累計竊電電量和累計違規(guī)用電次數(shù).所有累計值均是三年的累計值.居民用戶的具體指標(biāo)體系結(jié)構(gòu)如圖1所示.
圖1 居民用戶信用度評價指標(biāo)體系Fig.1 Credit index system for resident power consumers
影響企業(yè)用戶信用度的關(guān)鍵因素比較復(fù)雜.除了上面提到的因素外,還包括企業(yè)容量占比、企業(yè)注冊資金、企業(yè)負(fù)債率和用電管理等多個因素.圖2給出了企業(yè)用戶的信用度評價指標(biāo)體系.圖2中,企業(yè)的類型可以分為非工業(yè)電力用戶、普通工業(yè)電力用戶、大工業(yè)電力用戶、商業(yè)電力用戶和農(nóng)業(yè)電力用戶.
圖2 企業(yè)用戶信用度評價指標(biāo)體系Fig.2 Credit index system for company power consumers
從上述的信用度指標(biāo)可以看出:信用度指標(biāo)可以分為兩類,即信用度貢獻(xiàn)指標(biāo)和信用度損失指標(biāo).信用度貢獻(xiàn)指標(biāo)是指能夠提高用戶信用度的指標(biāo),如用戶的正常用電量、按時繳費和進(jìn)行電力設(shè)備節(jié)能改造等.相應(yīng)地,信用度損失指標(biāo)則指會降低用戶信用度的指標(biāo),如用戶違規(guī)用電、竊電和欠費等等.
以居民電力用戶為例,月平均繳費額和累計用電電量屬于信用度的貢獻(xiàn)指標(biāo),這類值越大,用戶信用度越高.而累計欠費金額、累計欠費率、累計欠費次數(shù)、累計竊電次數(shù)、累計竊電電量和累計違規(guī)用電次數(shù)這幾個指標(biāo),反映的是用戶不良的用電表現(xiàn),屬于信用度損失指標(biāo).
用戶信用度可定義為
(1)
其中信用度貢獻(xiàn)值計算式為
式中:coni為信用度貢獻(xiàn)指標(biāo)i的值;wi為該指標(biāo)對應(yīng)的權(quán)值;n為信用度貢獻(xiàn)指標(biāo)的個數(shù).式(1)中信用度損失值計算式為
式中:lossj為信用度損失指標(biāo)j的值;wj為該指標(biāo)對應(yīng)的權(quán)值;m為信用度損失指標(biāo)的個數(shù).從式(1)不難看出:用戶信用度的取值范圍是[0,1].根據(jù)電力用戶信任度的相關(guān)指標(biāo)值及其權(quán)值,就可以計算出其信用度.
電力用戶信用評價指標(biāo)體系是一個多指標(biāo)多層次的綜合評價體系.由于各評價指標(biāo)的性質(zhì)不同,其單位和量級往往差別很大,絕對值小的指標(biāo)在評價中的作用有可能被絕對值大的指標(biāo)所掩蓋.因此,必須對原始指標(biāo)的數(shù)值進(jìn)行相應(yīng)的預(yù)處理,以消除由于量級和單位的差別對評價結(jié)果的影響.
假設(shè)需要對n個用戶進(jìn)行分析.每個用戶有m種評價指標(biāo),將第i個用戶的第j個指標(biāo)記為xij(i=1,2,…,n;j=1,2,…,m).那么n個用戶的評價指標(biāo)值可以用矩陣X表示為
采用極值法進(jìn)行各指標(biāo)的無量綱化.具體算法分為兩步:
1) 求各列指標(biāo)的極值.第j列的最大值maxXj,最小值minXj的計算式為
maxXj=max{x1j,x2j,…,xnj}
(2)
minXj=min{x1j,x2j,…,xnj}
(3)
式中j=1,2,…,m.
(4)
采用層次分析法AHP進(jìn)行各信用度評價指標(biāo)的權(quán)值計算.AHP是一種定性與定量相結(jié)合的、系統(tǒng)化的以及層次化的分析方法[14-16],是進(jìn)行權(quán)值計算時常用的工具.
3.1.1 建立層次結(jié)構(gòu)模型
根據(jù)第1節(jié)建立的電力用戶信用度評價指標(biāo)體系,居民用戶和企業(yè)用戶的AHP層次結(jié)構(gòu)模型分別如圖1,2所示.模型分為三層,最上層為目標(biāo)層,最下層為方案層,中間是準(zhǔn)則層.
3.1.2 構(gòu)造成對比較矩陣
一般地,對于n個指標(biāo)A1,A2,…,An進(jìn)行兩兩的比較,可以使用成對比較矩陣.成對比較矩陣定義為
表1 AHP評價尺度Table 1 AHP evaluation criteria
3.1.3 一致性檢驗
為保證系統(tǒng)中使用的成對比較矩陣的有效性,需進(jìn)行一致性檢驗.
在成對比較矩陣A中,若aik·akj=aij,則稱A為一致陣.若成對比較矩陣是一致陣,取對應(yīng)于最大特征根n的歸一化特征向量w=[w1,w2,…,wn]作為權(quán)向量.若成對比較矩陣不是一致陣,則用其最大特征根λ對應(yīng)的歸一化特征向量作為權(quán)向量w,且Aw=λw.
需要對成對比較矩陣A進(jìn)行一致性檢驗,以確定其可用性,使用的指標(biāo)是一致性比率.
表2 隨機(jī)一致性指標(biāo)RI的數(shù)值Table 2 Values of RI
當(dāng)CR<0.1時,認(rèn)為A具有可以接受的一致性,其歸一化特征向量可以作為權(quán)向量.否則要重新構(gòu)造成對比較矩陣,即對A中各元素的取值加以調(diào)整.
層次分析法在權(quán)值的確定過程中主觀成分相對較重.為了更加客觀、準(zhǔn)確地評價電力用戶的信用度,應(yīng)結(jié)合客觀算法對用戶信用度進(jìn)行評價.k-means算法也稱為k-均值算法,是一種使用廣泛的聚類算法.它屬于典型的基于距離的聚類算法,采用距離作為相似性的評價指標(biāo),即認(rèn)為兩個對象的距離越近,其相似度就越大.該算法認(rèn)為簇是由距離靠近的對象組成的,因此把得到緊湊且獨立的簇作為最終目標(biāo),具有較強(qiáng)的客觀性[17-18].
k-means算法以k為參數(shù),把需要進(jìn)行分類的n個對象分為k個簇,簇內(nèi)對象具有較高的相似度.相似度的計算根據(jù)簇內(nèi)對象的平均值進(jìn)行[19-20].
假定有n個對象,每個對象有w個屬性.k-means算法的描述如下:
輸入:簇的數(shù)目k和n個對象
輸出:k個簇,使誤差平方和最小
k-means算法步驟為
1) 任意選擇k個對象作為初始的k個簇中心,
2) 計算每個對象與各簇平均值的距離,將對象賦給最近的簇.距離采用歐式距離,定義為
式中:xi,yj為對象i,j;xiu為xi的第u個屬性值.
4) 誤差平方和準(zhǔn)則函數(shù)為
5) 若E小于給定的閾值,算法結(jié)束;否則返回步驟2).
使用k-means算法對電力用戶進(jìn)行分類,對基于AHP方法得到的用戶信用度計算結(jié)果進(jìn)行檢驗和修正.
為了能夠更準(zhǔn)確地評價用戶的信用度,可將AHP方法計算出的信用度值和k-means方法計算的信用度值進(jìn)行加權(quán)平均計算,即
用戶i的信用度值=α×AHP法計算出的值+
β×k-means法計算出的值
(5)
式中ɑ+β=1.調(diào)節(jié)ɑ,β的值就可以調(diào)節(jié)主客觀算法對信用度計算的影響.
鑒于居民用戶和企業(yè)用戶的信用度計算方法類似,以居民電力用戶為例,進(jìn)行電力用戶信用度的計算.
選取了10 位電力用戶的數(shù)據(jù),對他們進(jìn)行信用評價.用戶原始數(shù)據(jù)如表3所示,預(yù)處理后的數(shù)據(jù)如表4所示.
表3 電力用戶信用指標(biāo)數(shù)值Table 3 Original value of the indexes
表4 預(yù)處理后的數(shù)據(jù)Table 4 Preprocessed value of the indexes
4.2.1 權(quán)值的計算
各層次的成對比較矩陣需要根據(jù)用戶資料數(shù)據(jù)、專家意見和決策分析人員的經(jīng)驗經(jīng)過反復(fù)研究確認(rèn).表5~8給出了專家對居民用戶信息分析后給出的各評分表,據(jù)此可以得到各對應(yīng)的成對比較矩陣.
表5 準(zhǔn)則層打分Table 5 Scores for criterion layer
表6 相對于繳費情況打分Table 6 Scores for the index of payment
表7 相對于用電貢獻(xiàn)打分Table 7 Scores for power consumption
表8 相對于違規(guī)用電記錄打分Table 8 Scores for illegal power usage
表5對應(yīng)的成對比較矩陣為
經(jīng)計算CR=0.071 3<0.1,此成對比較矩陣通過一致性驗證.
繳費信息對應(yīng)的成對比較情況見表6,其對應(yīng)的成對比較矩陣為
經(jīng)計算CR=0.037 2<0.1,此成對比較矩陣通過一致性驗證.
表7對應(yīng)的成對比較矩陣為
經(jīng)計算CR=0.000 0<0.1,此成對比較矩陣通過一致性驗證.
表8對應(yīng)的成對比較矩陣為
經(jīng)計算CR=0.091 9<0.1,此成對比較矩陣通過一致性驗證.
利用這些矩陣可以進(jìn)一步計算出各指標(biāo)的權(quán)值,如表9所示.其中累計欠費金額、月平均繳費額、累計欠費率和累計竊電次數(shù)排在權(quán)值前4 位,較符合實際.
表9 指標(biāo)權(quán)值Table 9 Weight of indexes
4.2.2 信用度計算
根據(jù)表9中各指標(biāo)的權(quán)值和表4給出的預(yù)處理數(shù)據(jù),使用信用度計算式(1),進(jìn)行最初的信用度值計算,得到表10中顯示的用戶初始信用度值.
表10 用戶信用度值Table 10 Consumers’ credit values
以用戶2為例,無量綱化后,他的信用度貢獻(xiàn)指標(biāo)值分別為月平均繳費額0.62,累計用電電量0.68.他的信用度損失指標(biāo)值分別為累計欠費金額0.86,累計欠費率0.21,累計欠費次數(shù)0.33,累計竊電次數(shù)0,累計竊電電量0,累計違規(guī)用電次數(shù)0.則信用度貢獻(xiàn)值為
0.62×0.204 1+0.68×0.068 0=0.172 8
同理,信用度損失值為
0.86×0.385 1+0.21×0.158 4+0.33×0.064 5+
0×0.081 2+0×0.023 1+0×0.015 7=0.385 7
根據(jù)式(1),用戶2的信用度為
0.172 8÷(0.178 2+0.385 7)=0.31
通常對用戶是按照信用度等級進(jìn)行管理的,因此需要將信用度的數(shù)值轉(zhuǎn)化為對應(yīng)的信用度等級.信用度等級和信用度數(shù)值對照表見表11.表12給
出了表10中各個用戶的初始信用等級劃分.
表11 信用度等級對照Table 11 Credit rank reference
表12 用戶信用度等級劃分Table 12 Rank of each power consumer
利用k-means算法對表4中的電力用戶數(shù)據(jù)進(jìn)行處理.因為用戶等級分為5 類,因此隨機(jī)選取5 個用戶數(shù)據(jù)(例如用戶1,2,4,5,8)作為各初始類中心(表13).迭代10 次后算法收斂,得出5 個類中心及每個類所包含的電力用戶信息,如表14所示.
根據(jù)k-means算法得到的分類結(jié)果,結(jié)合各指標(biāo)的權(quán)值,再對10 位用戶進(jìn)行信用度計算,得到的用戶信用度值,如表15所示.
表13 初始聚類中心Table 13 Initial clustering centers
表14 電力用戶分類結(jié)果Table 14 Clustering result of power consumers
表15 使用k-means得到的用戶信用度值和信用度等級Table 15 Credit values and credit ranks by k-means algorithm
對比表12,15,AHP和k-means計算出的結(jié)果基本一致,僅用戶4,7的等級分類有一些出入.
當(dāng)考慮AHP和k-means算法對最終的用戶信用度值計算同等重要時,可取α=β=0.5.則最終的信用度值計算結(jié)果和用戶信用度等級如表16所示.
表16用戶最終信用度值和信用度等級
Table16Finalcreditvaluesandcreditranksforpowerconsumers
戶號12345678910信用度值1.000.320.980.770.790.350.260.190.090.18信用等級ADABBDDEEE
由表16可以看到:電力用戶1,3信用度等級高,他們的用電習(xí)慣良好,是值得信賴的用戶;用戶4,5是B等級,他們用電習(xí)慣良好,有一定的用電貢獻(xiàn);用戶2,6,7有一定次數(shù)的違規(guī)和欠費行為,造成一定的用電損失;而用戶8,9,10屬于用電情節(jié)比較惡劣的,這些用戶違規(guī)用電次數(shù)很多,用電貢獻(xiàn)遠(yuǎn)小于違規(guī)行為所造成的損失,需要著重管理.
通過對電力用戶特性的分析,分別提出了居民用戶和企業(yè)用戶的信用度評價指標(biāo)體系.為了能夠準(zhǔn)確、客觀地評價用戶的信用度,結(jié)合層次分析法和k-means算法構(gòu)建了電力用戶信用度的評價模型.首先通過AHP方法計算電力用戶各個評價指標(biāo)的權(quán)值,并給出初始的用戶信用度等級.再用k-means方法對AHP方法計算的信用度進(jìn)行檢驗和修正.算法的解釋和驗證以居民用戶為例進(jìn)行.實驗結(jié)果表明筆者提出的方法有效可行.后續(xù)的研究將著重考慮如何在已有的用戶信用度計算模型的基礎(chǔ)上,完善信用度管理體系,并對不同信用度的用戶提供不同類型的服務(wù),以鼓勵用戶提高自身的信用度水平.