陳羽中 郭松榮 陳宏 李婉華 郭昆 黃啟成
摘 要:針對供電企業(yè)“先消費后付款”的經(jīng)營模式可能造成用電客戶因失信引發(fā)的欠費風(fēng)險,需要在用電客戶欠費行為發(fā)生之前實時快速地分析海量的用電用戶的數(shù)據(jù),給出潛在的欠費客戶名單的問題,提出一種基于并行分類算法的電力客戶欠費預(yù)警方法。首先,該方法使用基于Spark的隨機森林(RF)分類算法對欠費用戶進行建模;其次,根據(jù)用戶以往歷史用電行為和繳費記錄使用時間序列進行預(yù)測得到其未來用電和繳費行為特征;最后,使用之前得到的模型對用戶進行分類得到未來潛在高危險欠費用戶。將該方法與并行化后的支持向量機(SVM)算法和在線序列極限學(xué)習(xí)機(OSELM)算法進行對比分析,實驗結(jié)果表明,所提方法相對于對比算法在準(zhǔn)確率上有較大提高,便于電費回收管理人員進行提前催繳,確保電費回收的及時性,有利于電力企業(yè)進行客戶欠費風(fēng)險管理。
關(guān)鍵詞:欠費預(yù)警;隨機森林;并行算法;時間序列;海量數(shù)據(jù)
中圖分類號: TP311.5 文獻標(biāo)志碼:A英文標(biāo)題