■ 楊辰晨
全球天然氣消費(fèi)在一次能源消費(fèi)中占比趨于穩(wěn)定,2017年,全球天然氣消費(fèi)占比23.36%,而中國(guó)占比則僅為6.60%,未來(lái)具備較大提升空間。據(jù)分析,未來(lái)30年,中國(guó)天然氣將進(jìn)入快速發(fā)展階段,能源消耗量將保持高速增長(zhǎng),城鎮(zhèn)燃?xì)馄髽I(yè)面臨巨大挑戰(zhàn)與機(jī)遇。從城鎮(zhèn)燃?xì)馄髽I(yè)發(fā)展的角度來(lái)看,供銷差率體現(xiàn)著燃?xì)膺\(yùn)營(yíng)企業(yè)的管理效果和盈利能力,偷盜燃?xì)馐怯绊懝╀N差率的重要因素,會(huì)給燃?xì)馄髽I(yè)帶來(lái)重大損失,預(yù)防和打擊偷盜燃?xì)庑袨槭瞧髽I(yè)的長(zhǎng)期工作。
據(jù)統(tǒng)計(jì),能源偷盜(能源公用事業(yè)公司往往同時(shí)經(jīng)營(yíng)電力和燃?xì)馀涫蹣I(yè)務(wù),因此有的統(tǒng)稱為能源偷盜)在發(fā)達(dá)國(guó)家造成的損失可達(dá)能源零售收入的0.5%~3%不等,在發(fā)展中國(guó)家的比例往往更高。國(guó)家發(fā)改委2017年6月發(fā)布的《關(guān)于加強(qiáng)配氣價(jià)格監(jiān)管的指導(dǎo)意見》對(duì)城市燃?xì)獾墓╀N差率給出了新的明確規(guī)定:供銷差率 (含損耗) 原則上不超過(guò)5%, 3年內(nèi)降低至不超過(guò)4%。隨著表端遠(yuǎn)傳監(jiān)控技術(shù)的發(fā)展,數(shù)據(jù)積累逐漸完善,城鎮(zhèn)燃?xì)庥脩魯?shù)量多、現(xiàn)場(chǎng)檢查工作量大,首先在后臺(tái)利用數(shù)據(jù)挖掘辨識(shí)用氣異常用戶,而后進(jìn)行重點(diǎn)現(xiàn)場(chǎng)核查,會(huì)大大提高打擊偷盜氣效率、降低成本。
本文以占據(jù)城鎮(zhèn)燃?xì)馄髽I(yè)用氣量較大的采暖鍋爐房用戶為例,對(duì)辨識(shí)異常用戶的統(tǒng)計(jì)方法進(jìn)行探索,以期為燃?xì)馄髽I(yè)利用大數(shù)據(jù)提供方法依據(jù)。
國(guó)內(nèi)關(guān)于辨識(shí)用氣異常用戶的相關(guān)文獻(xiàn)非常有限,2019年李曼曼等發(fā)表的《餐飲用戶用氣量異常數(shù)據(jù)查詢方法的研究與驗(yàn)證》一文指出,使用最小日用氣時(shí)間作為辨識(shí)用氣異常用戶的指標(biāo),但是該指標(biāo)受用戶類型和經(jīng)營(yíng)狀況的影響較大。
國(guó)內(nèi)城市燃?xì)馄髽I(yè)對(duì)于異常用戶的辨識(shí)均處于探索階段,投入大量人力進(jìn)行現(xiàn)場(chǎng)核查,尚未在后臺(tái)形成有效的方法庫(kù)。
本文借鑒目前對(duì)竊電異常用戶的辨識(shí)方法,選擇因子分析和神經(jīng)網(wǎng)絡(luò)兩種方法進(jìn)行探索。
因子分析法是從研究變量?jī)?nèi)部相關(guān)的關(guān)系出發(fā),把一些具有復(fù)雜關(guān)系的變量歸結(jié)為少數(shù)幾個(gè)綜合因子的一種多變量統(tǒng)計(jì)分析方法。它的基本思想是將觀測(cè)變量進(jìn)行分類,將相關(guān)性較高,即聯(lián)系比較緊密的分在同一類中,而不同類變量之間的相關(guān)性則較低,那么每一類變量實(shí)際上就代表了一個(gè)基本結(jié)構(gòu),即公共因子。對(duì)于所研究的問(wèn)題就是試圖用最少個(gè)數(shù)的不可測(cè)的所謂公共因子的線性函數(shù)與特殊因子之和來(lái)描述原來(lái)觀測(cè)的每一分量。根據(jù)得出的因子表達(dá)式,把原始變量數(shù)據(jù)帶入表達(dá)式得出因子得分值,根據(jù)因子得分在因子所構(gòu)成的空間中把樣品點(diǎn)畫出來(lái),形象直觀地達(dá)到分類目的。
多層感知器是一種前饋人工神經(jīng)網(wǎng)絡(luò)模型,其將輸入的多個(gè)數(shù)據(jù)集映射到單一的輸出的數(shù)據(jù)集上。多層感知器的一個(gè)重要特點(diǎn)就是多層,通常將第一層稱之為輸入層,最后一層稱之為輸出層,中間的層稱之為隱層。多層感知器并沒(méi)有規(guī)定隱層的數(shù)量,因此可以根據(jù)各自的需求選擇合適的隱層層數(shù),對(duì)于輸出層神經(jīng)元的個(gè)數(shù)也沒(méi)有限制。
針對(duì)于不同類型的用戶,辨識(shí)用戶用量異常的指標(biāo)不盡一致,本文以我國(guó)某大型城市燃?xì)馄髽I(yè)的采暖鍋爐房用戶為分析對(duì)象,根據(jù)查表及遠(yuǎn)傳采集監(jiān)控系統(tǒng)的數(shù)據(jù),得到7個(gè)對(duì)辨識(shí)異常用量有效的指標(biāo)名稱,并預(yù)測(cè)其合理值。
序號(hào) 指標(biāo)名稱 公式 合理值1 白天變異系數(shù)(8:00-19:00)C·V=(標(biāo)準(zhǔn)偏差SD/平均值Mean)×100% 最小值2 夜間變異系數(shù)(20:00-7:00)C·V=(標(biāo)準(zhǔn)偏差SD/平均值Mean)×100% 最小值3 白天和溫度的相關(guān)性 相關(guān)系數(shù) 1 4 夜間和溫度的相關(guān)性 相關(guān)系數(shù) 1 5白天單耗 單耗=供暖季耗用量/供暖面積/供暖季天數(shù) 最大值6夜間單耗 單耗=供暖季耗用量/供暖面積/供暖季天數(shù) 最大值7 白天夜間不平均值 白天和夜間不平均值=白天單耗/夜間單耗 2
使用312個(gè)監(jiān)控?cái)?shù)據(jù)比較完整的采暖鍋爐房,對(duì)上述7個(gè)指標(biāo)進(jìn)行因子分析,將變量降維,因子分析得出三個(gè)公因子,解釋程度為74.92%,第一個(gè)因子和白天變異系數(shù)、白天和溫度的相關(guān)性、夜間和溫度的相關(guān)性,三個(gè)變量高度相關(guān),可以稱為調(diào)節(jié)因子;第二個(gè)因子和白天單耗及夜間單耗高度相關(guān),可以成為單耗因子;第三個(gè)因子和夜間變異系數(shù)、白天夜間不平均值高度相關(guān),可以稱為嫌疑因子。根據(jù)因子載荷建立得分方程:
y=(1.845×調(diào)節(jié)因子+1.773×單耗因子+1.626×嫌疑因子)/5.244
按用戶得分從高到低排序后,得分越高的采暖鍋爐房用戶代表用氣最不規(guī)律,可以認(rèn)為這種用戶發(fā)生偷盜氣的嫌疑較大,需要進(jìn)行重點(diǎn)的現(xiàn)場(chǎng)核查。將已經(jīng)確認(rèn)的9個(gè)采暖鍋爐房偷盜氣數(shù)據(jù)帶入得分方程,排名均在37名以前,所以可以認(rèn)為此方法能有效篩選出疑似用戶,按照順序進(jìn)行現(xiàn)場(chǎng)核查。
在采暖鍋爐房用戶中,找到有遠(yuǎn)傳數(shù)據(jù)的7個(gè)已確定的破壞燃?xì)獗硗当I氣用戶,和11個(gè)用量穩(wěn)定且單耗較大、認(rèn)為不存在偷盜氣嫌疑的用戶,計(jì)算白天變異系數(shù)、夜間變異系數(shù)、白天和溫度的相關(guān)性、夜間和溫度的相關(guān)性、白天單耗、夜間單耗、白天和夜間的不平均值,7個(gè)指標(biāo)的值,使用多層感知器的方法,建立神經(jīng)網(wǎng)絡(luò)判斷模型。
因?yàn)闃颖玖枯^小,處理時(shí)間不足1秒,設(shè)置種子3以便模型可以重復(fù)使用,其中訓(xùn)練樣本11個(gè),測(cè)試樣本4個(gè),保持樣本3個(gè),輸入層7個(gè)單位,隱藏層5個(gè)單位,輸出層1個(gè)變量,分類1為偷盜氣用戶,分類2為用量正常用戶。
分類
使用神經(jīng)網(wǎng)絡(luò)多層感知器的方法,可以看出保持樣本錯(cuò)誤百分比33.3%,有66.7%的用戶可以正確預(yù)測(cè)進(jìn)入相應(yīng)分類。將此多層感知器模型應(yīng)用于新發(fā)現(xiàn)的2戶偷盜氣用戶,均被判別為偷盜氣用戶,所以此模型具有一定穩(wěn)定性。
本文通過(guò)對(duì)某城市燃?xì)夤静膳仩t房用戶的研究,總結(jié)出辨識(shí)異常用氣用戶的7個(gè)指標(biāo),使用因子分析和神經(jīng)網(wǎng)絡(luò)方法對(duì)采暖鍋爐房數(shù)據(jù)進(jìn)行數(shù)據(jù)分析。因子分析方法綜合使用7個(gè)辨識(shí)異常用戶的指標(biāo),得到因子得分方程,計(jì)算用戶得分,得分越高的用戶代表用氣最不規(guī)律,需要進(jìn)行現(xiàn)場(chǎng)排查。多層感知器方法通過(guò)對(duì)已知偷盜氣用戶的訓(xùn)練,得出神經(jīng)網(wǎng)絡(luò)模型,該模型預(yù)測(cè)錯(cuò)誤率33.3%。使用兩種方法驗(yàn)證已經(jīng)發(fā)現(xiàn)的偷盜氣用戶,發(fā)現(xiàn)結(jié)果具有穩(wěn)定性,可以應(yīng)用于實(shí)踐。
因子分析方法更適用于偷盜氣數(shù)據(jù)較少的情況下,按照得分大小確定現(xiàn)場(chǎng)排查優(yōu)先級(jí);在具備較多偷盜氣數(shù)據(jù)時(shí),應(yīng)用多層感知器的方法更能準(zhǔn)確定位疑似偷盜氣用戶。