周艷梅 朱好 李松琛 夏通
【摘 要】對95598客服中心接到的工單數(shù)據(jù)進行分析,結(jié)合往年同期溫度、降雨量、極端天氣、節(jié)假日等外部因素,利用超限學(xué)習(xí)機訓(xùn)練得到95898故障工單預(yù)測模型,從而可以提前布置搶修隊伍、搶修車輛、搶修物資的合理化安排,從而綜合提升95598工單精準服務(wù)。測試實驗表明,該預(yù)測模型的預(yù)測精度能達到85%以上。利用該模型,能夠有效地實現(xiàn)故障報修服務(wù)的事前管控。
【關(guān)鍵詞】95598客服;故障工單;超限學(xué)習(xí)機;加權(quán)超限學(xué)習(xí)機;預(yù)測模型
中圖分類號: TM911.4文獻標識碼: A文章編號: 2095-2457(2019)31-0034-002
DOI:10.19694/j.cnki.issn2095-2457.2019.31.014
95598是全國電力系統(tǒng)公用的客服電話,屬于呼叫中心的一種,是目前國內(nèi)最好的服務(wù)熱線之一。服務(wù)熱線95598,主要功能是受理客戶的故障報修、業(yè)務(wù)咨詢、信息查詢、投訴、舉報、建議、意見等七大類,是供電公司營銷體系的重要組成部分。95598利用電話平臺,建立“一口對外”的客戶服務(wù)中心,為電力企業(yè)與用戶之間建立起直接的溝通渠道,為電力客戶提供快捷、優(yōu)質(zhì)的服務(wù)??s短了供電企業(yè)與客戶在時空上的距離、對外提高供電公司的客戶服務(wù)水平,樹立專業(yè)、高效的良好社會形象,對最終創(chuàng)建全國乃至世界一流的供電企業(yè)做出了重要的貢獻[1]。
95598收集到的客戶信息涵蓋了國網(wǎng)向客戶提供的所有服務(wù),通過客戶的來電可以全面了解客戶需求及關(guān)心的所有熱點、難點問題[2]。以浙江省麗水市為例,近期某個樣本時間段內(nèi)95598工單數(shù)26937件。其中,故障工單數(shù)19710件,投訴、咨詢、舉報、表揚、建議、意見、服務(wù)申請等非故障工單數(shù)7227件??梢?,故障工單數(shù)在總工單數(shù)中的占比是最高的。
此外,由于目前故障報修采用直派流程方式,故障服務(wù)熱點分散在不同類型的95598工單中,無法快速反應(yīng)當前供電服務(wù)的熱點問題,同時95598工單依賴人工統(tǒng)計分析,導(dǎo)致不能及時發(fā)現(xiàn)處理一些服務(wù)熱點問題,并且,依靠人工統(tǒng)計分析95598工單的數(shù)據(jù)有局限性和帶有主觀性。因此,有必要將數(shù)據(jù)進行整合分析,利用以往數(shù)據(jù)建立故障工單預(yù)測模型,實現(xiàn)故障報修服務(wù)的事前管控。
目前,故障工單預(yù)測模型的研究并不多見,文[3]設(shè)計了一種多元線性回歸模型來預(yù)測故障工單數(shù),但實際上,并沒有研究表明,故障工單數(shù)與相關(guān)因素是線性回歸的關(guān)系,因此本文利用超限學(xué)習(xí)機算法進一步對故障工單預(yù)測模型進行研究。
1 超限學(xué)習(xí)機
由于單隱層前饋神經(jīng)網(wǎng)絡(luò)(Single-hidden layer feedforward network,SLFN)能夠逼近任何非線性模型,且逼近效果好,速度快,這使得單隱層前饋神經(jīng)網(wǎng)絡(luò)在目標識別、樣本分類、自動控制等許多研究和應(yīng)用領(lǐng)域得到了廣泛的應(yīng)用。
圖1為一個單隱層前饋神經(jīng)網(wǎng)絡(luò)。
圖1 單隱層前饋神經(jīng)網(wǎng)絡(luò)
最近幾年,新加坡南洋理工大學(xué)的黃廣斌教授提出了一種稱為“超限學(xué)習(xí)機(Extreme Learning Machine,ELM)”[4]的單隱層前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,在該算法中,模型的隱層權(quán)和偏差為隨機設(shè)置,然后利用最小二乘法計算得到外權(quán)矩陣,訓(xùn)練過程為直接法,并不需要反復(fù)迭代和更新。與已知的其他神經(jīng)網(wǎng)絡(luò)算法,譬如BP算法以及支持向量機等方法相比,簡單高效且泛化性能好等特點。超限學(xué)習(xí)機理論最近也得到了生物和腦神經(jīng)學(xué)的直接生物驗證,彌補了機器學(xué)習(xí)和腦學(xué)習(xí)機制之間的空白,解決了計算機之父馮·諾依曼60年前的關(guān)于人腦和計算機結(jié)構(gòu)和能力的困惑。現(xiàn)在超限學(xué)習(xí)機已經(jīng)被廣泛應(yīng)用在模式識別、模式分類、預(yù)測等當中[5-6]。
超限學(xué)習(xí)機算法中,設(shè)輸入樣本為x,則其隱層輸出的形式表現(xiàn)為一個向量h(x)=[h1(x),h2(x),…,hL(x)]對于給定的N個訓(xùn)練樣本(xi,ti)學(xué)習(xí)機的數(shù)學(xué)模型為:
Hβ=T(1)
其中H為隱層輸出矩陣,β為輸出權(quán)矩陣,T為目標矩陣,其中:
■(2)
利用正交投影法計算H的廣義逆后可得:
當■時,
β=H■(HH■)■T(3)
當N>1時,
β=(H■H)■HTT(4)
為了進一步提高超限學(xué)習(xí)機的泛化性能,文[7]引入了一個正數(shù)C,將(3)式和(4)式分別修正為,
β=H■(■I+HH■)■T(5)
當N>L時,
β=(■I+H■H)■H■T(6)
其中I為N階單位矩陣.
當超限學(xué)習(xí)機作為預(yù)測算法使用時,期望輸出向量ti可按照實際情況定義為實數(shù)、向量或者矩陣。
2 故障工單數(shù)據(jù)的獲取與分析
與故障工單數(shù)相關(guān)的分析數(shù)據(jù)有氣象數(shù)據(jù)、極端氣候數(shù)據(jù)、節(jié)假日信息、月份信息等數(shù)據(jù)信息。分別從95598系統(tǒng)、麗水統(tǒng)計局網(wǎng)站、中國天氣網(wǎng)、麗水水文信息網(wǎng)等途徑收集數(shù)據(jù)。
首先對數(shù)據(jù)進行預(yù)處理。
第一步:剔除重復(fù)數(shù)據(jù)或者適當加入噪聲數(shù)據(jù),避免出現(xiàn)過擬合訓(xùn)練數(shù)據(jù)的情況。
第二步:利用熱卡填充的方法,對缺失數(shù)據(jù)進行填充,使得數(shù)據(jù)得以有效使用。
第三步:剔除異常點和強影響點。異常點是遠離數(shù)據(jù)集合中心的數(shù)據(jù)點,強影響點是數(shù)據(jù)集中的那些對統(tǒng)計量或參數(shù)的估值結(jié)果有非常大的影響力的數(shù)據(jù)點,通過剔除這些點,可對預(yù)測模型進行改進。
3 故障工單數(shù)預(yù)測模型
實驗中使用的仿真軟件為:Matlab R2017b。實驗的環(huán)境為: Window 10 64位操作系統(tǒng),Intel Core i3-6100 3.70GHz,8GB內(nèi)存。
輸入樣本屬性為5個,分別為氣溫、降水量、極端天氣、月份、節(jié)假日。其中,12、1、2月的氣溫數(shù)據(jù)采用每日最低溫度值,3、4、5、9、10、11月的氣溫數(shù)據(jù)采用每日平均溫度值,6、7、8月的氣溫數(shù)據(jù)采用每日最高溫度值。降水量按氣象學(xué)上的降水等級劃分小雨、中雨、大雨、暴雨、大暴雨分別對應(yīng)取值1、2、3、4、5。極端天氣主要考慮臺風(fēng)、雷暴、雪,按照嚴重程度分別對應(yīng)取值1、2、3。月份信息12、1、2對應(yīng)數(shù)值1,3、4、5、9、10、11月對應(yīng)取值2,6、7、8月對應(yīng)取值3。節(jié)假日信息中,節(jié)假日對應(yīng)數(shù)值1,非節(jié)假日對應(yīng)數(shù)值。以麗水市2018年的365天對應(yīng)生成365個輸入樣本數(shù)據(jù),對應(yīng)的365個故障工單數(shù)作為輸出數(shù)據(jù)。同時,生成已經(jīng)過去的2019年上半年麗水市的輸入樣本數(shù)據(jù)和輸出數(shù)據(jù)。對輸入數(shù)據(jù)進行標準化。
預(yù)測模型采用的激勵函數(shù)為Logistic函數(shù)f(a,b,x)=■;(5)式和(6)式中的參數(shù)C與單隱層節(jié)點個數(shù)L的取值采用grid搜索法,C的搜索范圍為2■,2■,…,2■,2■,L的搜索范圍為15,25,…,625,635。
對于測試集的預(yù)測值,如果預(yù)測的故障工單數(shù)和當天實際的故障工單數(shù)的誤差小于等于5,被認為是有效預(yù)測,否則為無效預(yù)測。
實驗中對于2018年的數(shù)據(jù)集采用5-折交叉驗證,運行50次。
經(jīng)過驗證,2018年的故障工單數(shù)的有效預(yù)測率達到了85%以上,2019年上半年的故障工單數(shù)的有效預(yù)測率達到了80%以上,說明該預(yù)測模型能夠滿足電網(wǎng)運監(jiān)對于故障工單數(shù)進行監(jiān)控工作的實際需要。
4 小結(jié)
本文以國網(wǎng)麗水供電公司為例,對95598客服中心接到的故障工單數(shù)據(jù)進行分析,首先對數(shù)據(jù)進行預(yù)處理,然后利用超限學(xué)習(xí)機訓(xùn)練得到一種故障工單預(yù)測模型,該預(yù)測模型訓(xùn)練速度快,泛化性好,有效預(yù)測率達到了85%以上。利用該模型,能夠有效地實現(xiàn)故障報修服務(wù)的事前管控,幫助提高運監(jiān)部門的工作效率。
【參考文獻】
[1]田媛,試論如何提高95598電力客戶服務(wù)工作[J].中國市場,2013(45):36-37.
[2]程超,張凱,程慧,95598系統(tǒng)數(shù)據(jù)的分析方法及其應(yīng)用[J].河北電力技術(shù),2015,34(3):37-38.
[3]董知周,陳顯輝,吳海峰,等,基于大數(shù)據(jù)的配電網(wǎng)搶修工單分析與預(yù)測研究[J].供用電,2018,35(4):60-67.
[4]HUANG G B,ZHU Q Y,SIEW C K, Extreme learning machine: Theory and applications[J].Neurocomputing,2006,70(1-3):489-501.
[5]盧誠波,梅穎.前饋網(wǎng)絡(luò)的一種高精度魯棒在線貫序?qū)W習(xí)算法[J].上海交通大學(xué)學(xué)報(自然版),2015,49(08):1137-1143.
[6]梅穎,盧誠波.面向不平衡數(shù)據(jù)流的自適應(yīng)加權(quán)在線超限學(xué)習(xí)機算法[J].模式識別與人工智能,2019(2),144-150.