嚴玉婷,薛 冰,方力謙,黃國權,張勇軍
(1.深圳供電局有限公司, 廣東 深圳 518001;2.華南理工大學電力學院,廣東 廣州 510641)
中國能源革命不斷向縱深推進,期間數字經濟加入并助推能源高效轉型,兩者的深度融合催生了一種新型經濟發(fā)展形態(tài)——能源數字經濟[1-3]。發(fā)展能源數字經濟,數字化是戰(zhàn)略性抓手,數據挖掘是關鍵出路。而作為社會能源供應的樞紐,電網企業(yè)應當充分發(fā)揮電力大數據實時監(jiān)控、直觀反饋的特點,分析負荷特性變化進而挖掘其深層價值。
近年來,基于電力大數據的用電分析研究逐漸深入,主要思路為①對負荷曲線聚類以提取典型負荷模式;②提出多個指標捕捉負荷的特定變化;③基于數據驅動方式分析用電行為。文獻[4]總結了負荷模式提取常用的對負荷曲線進行聚類的方法特點;文獻[5]提出了一種基于深度學習的YLP特征提取,捕獲負荷每日和季節(jié)性變化,并通過負荷聚類圖像觀察其全年特征;文獻[6-7]計算不同時間尺度下(年/月/日)的負荷率、最小負荷率和峰谷差率等時序特征指標,用以對比描述負荷的特性變化;文獻[8]采用三相電壓、電流、功率因數等建立多維數據特征,基于Graph模型聚類分析用電用戶行為并對用戶分類;文獻[9]借鑒股市指數計算京電指數,從電力交易角度分析用電特點。
但是,上述研究與用戶實際生產行為變化的聯(lián)系并不緊密,具體表現(xiàn):一方面上述所提指標均為負荷特性指標,與用戶調休、增產等實際生產活動無關;另一方面,僅對精細時間尺度下的日負荷曲線進行聚類,并未對受工作日效應影響的周期波動和受氣溫影響的隨機波動進行分離研究。因此,對于行業(yè)大用戶用電大數據的挖掘分析,關注其實際生產行為變動能更好挖掘該類用戶用電數據的潛在價值。
在證券交易中,股市指數被用于反映股市行情變動,按所包含股票樣本數可分為2類[10]:按一定標準選取部分上市股票作為樣本的成分指數(如滬深300等)和以全部上市股票作為樣本的綜合指數(如上證綜指等)。在電力大數據環(huán)境下,借鑒成分指數,通過科學客觀的方法挑選出少量最具代表性的樣本用戶來降低數據廣度,并分析行業(yè)大用戶群體的用電行為變化是值得探索的方向。
鑒于此,本文旨在構造一種負荷指數,展示行業(yè)大用戶群體的負荷波動情況,為分析行業(yè)用戶生產經營狀態(tài)以及未來經濟走勢提供數據基礎。首先,根據地區(qū)實際情況篩選出若干位具有代表性的行業(yè)大用戶作為樣本對象;然后,利用STL算法(seasonal-trend decomposition procedure based on loess)獲取樣本歷史日電量的周期分量,用以計算調整日電量,并提出工作強度系數指標,聯(lián)系用戶生產實際,再按樣本所屬行業(yè)及其個體地位,基于模糊專家評價法等方式賦予多項權重值,綜合上述構造企業(yè)用戶調整負荷成分指數;最后,以深圳市為案例分析負荷指數應用效果。
電力用戶成千上萬,每日產生大量數據,然而價值密度較低[11-12],通過篩選其中部分用戶的數據來降低數據廣度可以提高價值密度。
自改革開放以來,中國經濟總量快速攀升的同時發(fā)展不平衡問題也越發(fā)突出,利潤分配在不同行業(yè)、不同規(guī)模企業(yè)上嚴重失衡,此現(xiàn)象在經濟發(fā)達地區(qū)更為嚴重。以深圳市為例,2019年地區(qū)生產總值(gross regional product,GDP)約為2.7萬億元,而僅中國平安保險集團的凈利潤已將近0.15萬億元,占地區(qū)GDP超5%,營收總額排名前10位企業(yè)的凈利潤總和更是超過地區(qū)GDP的20%。在此意義上,少量的大型企業(yè)的經營狀態(tài)即可一定程度上代表地區(qū)經濟發(fā)展的景氣程度。因此,分析少量行業(yè)大用戶群體的負荷特性變化在宏觀上具備地區(qū)經濟表征性。
借鑒股市成分指數,考慮篩選地區(qū)若干位具有代表性的企業(yè)用戶作為樣本對象來計算負荷指數。
前述提及,用戶實際生產行為變動少有關注,而利潤分配嚴重失衡,這使得簡單加和樣本用戶用電量并不足以支撐深入分析。因此,需要針對上述情況相應處理樣本用戶日電量。
不同于小企業(yè)或個體戶等,多數大企業(yè)尤其是工業(yè)大企業(yè)一般會實行單休或雙休制度,且對于一些大規(guī)模的工業(yè)企業(yè),其工作計劃性強,在季度或月度等中短時間段內每日的工作量基本穩(wěn)定。因此,部分大企業(yè)用戶用電量存在著工作日效應,即一周內工作日負荷率明顯高于周末日負荷率[13]。這一工作日效應帶來的固有周期變化使得用戶負荷存在顯著的“正常”波動,而這種波動會影響對負荷受擾波動的辨別以及對異常波動嚴重程度的判斷。因此,需要區(qū)分開工作日效應這種固有波動的影響,但也不能忽略這部分電量的實際效益。
本文將用戶實際日用電量表示成N×7維矩陣D,拆解為
D=F+I·T
(1)
式中F為N×7維的非周期分量矩陣;I為N×1維的全1矩陣;T為1×7維的周期分量矩陣。
T通過STL算法[14]對歷史數據進行周期分解得到。STL是一個迭代的非參數回歸過程,是將魯棒局部加權回歸作為平滑方法的時間序列分解方法,能夠得到穩(wěn)健的周期項,而不會被數據中的異常行為扭曲,并且適用于有缺失值的時間序列。
STL利用局部加權散點平滑(locally weighted scatterplot smoothing,LOESS)對離散序列點進行平滑處理。對于一個時間序列yi(i=1, 2,…,n),選取平滑參數q≤n,由與時間點x最近的q個序列時間點xj構造時間點x上的鄰近權重:
(2)
式中λq為x與距其第q個遠的序列值xλ的距離。
以此對yi局部加權線性回歸的優(yōu)化目標為
(3)
基于LOESS,STL包含內、外2個循環(huán),其中內循環(huán)過程如下:
1)去趨勢,即減去上一輪結果的趨勢分量,D-T(k);2)周期子序列平滑,對每個子序列做LOESS回歸,并向前、后各延展一個周期,得到C(k+1);3)周期子序列低通濾波,對C(k+1)依次進行窗口長度為7(周期長度)、7、3的滑動平均,再LOESS回歸,得到H(k+1);4)周期子序列去趨勢,即S(k+1)=C(k+1)-H(k+1);5)去周期,即減去周期分量,D-S(k+1);6)趨勢平滑,對Y-S(k+1)進行LOESS平滑,得到趨勢分量T(k+1)。
外循環(huán)根據上述所得周期項S和趨勢項T計算余項R=D-S-T,并由此對時間點x賦予穩(wěn)健權重:
(4)
(5)
式中 median(·)表示取給定數值集合的中值。
進一步地,為保留周期分量電量帶來的實際效益,將T均攤到周一至周日,以日用電量調整值D′代替實際值D作為負荷指數基礎指標:
(6)
企業(yè)用戶雖有固定工作日效應,但由于每周任務量的差異會存在工作強弱區(qū)別,以ξ描述此種工作強度,其元素ξi的目標確定如下:
mingm=σ(Dm-ξm·T)
(7)
式中Dm為由D中第m行元素組成的行矩陣;σ(·)來計算給定數值集合的標準差。
利潤分配失衡問題使得各行業(yè)各企業(yè)對主體經濟的推動力不一。因此,考量企業(yè)用戶所屬行業(yè)及其個體的差異,為樣本用戶分配多項權重,并據此對其調整日電量進行加權整合。
2.2.1 行業(yè)層面
1)地位重要度權重。
相較于一些傳統(tǒng)行業(yè)的企業(yè)用戶,社會或是政府更關心一些高新技術行業(yè)的發(fā)展,同時這些高新技術和行業(yè)也匯聚了更多的社會資源投入,具有更高的經濟產值。因此,對于這部分用戶用電量波動應給予更多的重視。在指數中,結合一種經典的主觀賦權法——模糊專家評價法[15]對樣本涉及行業(yè)的相對重要性劃分5個等級,并以梯形模糊數M=(l,m,n,r)量化專家評判意見,其中,l、m、n、r分別為模糊數的下界值、上臨值、下臨值和上界值,取值如表1所示。
表1 梯形模糊數取值Table 1 Trapezoidal fuzzy value
首先,邀請k位專家評判樣本涉及行業(yè)的地位相對重要性,將所有專家評判結果對應的模糊數以等權重線性加權方式進行整合,得到第i個行業(yè)的重要程度判別模糊數:
(8)
式中Miq為第q位專家對第i個行業(yè)的評判結果對應的模糊數。
然后,計算梯形模糊數的重心:
(9)
式中μM(x)為梯形模糊數M對應的隸屬度函數,取值如下:
(10)
最后,對c(Mi)歸一化即可得到樣本涉及行業(yè)的地位重要性權重si。
2)行業(yè)貢獻率權重。
由于地區(qū)的發(fā)展規(guī)劃因地制宜,各有行業(yè)側重,使得不同行業(yè)對地區(qū)經濟發(fā)展的貢獻度不一,因此,對高貢獻行業(yè)應給予更多關注。定義行業(yè)貢獻率rC為各行業(yè)增加值增量與地區(qū)生產總值增量之比,即
(11)
式中 ΔEi為第i個行業(yè)的地區(qū)行業(yè)增加值增量;ΔZGDP為地區(qū)生產總值增量。
3)能耗產出關系權重。
高能耗并不與高經濟收益完全對等,相比于傳統(tǒng)的高能耗產業(yè),高產出的技術型行業(yè)更為重要。對此,行業(yè)能耗產出關系反映了其對主體經濟的貢獻度,根據用戶所屬行業(yè)對其賦予經濟貢獻度權重,該權重計算方式如下:
(12)
式中Ei為第i個行業(yè)的地區(qū)行業(yè)增加值;Pi為第i個行業(yè)的樣本電量總和;n為樣本涉及行業(yè)總數。
2.2.2 個體層面
同行業(yè)內企業(yè)用戶間的規(guī)模對比很大程度上在其用電量水平上有所體現(xiàn),因此無需額外考量該因素并賦權。而值得關注的是,企業(yè)用戶業(yè)擴潛力與該用戶的發(fā)展過程有直接的關系,相比于發(fā)展到達穩(wěn)定期用戶,日漸蓬勃的企業(yè)更是經濟走勢的潛力股,應當著重分析。對此提出年化業(yè)擴比例kp和容量飽和度SS,p指標,判斷第p個用戶的業(yè)擴潛力:
(13)
(14)
表2 容量使用比例分級靠檔Table 2 Category-weighted chart of the capacity usage ratio %
組合kp、SS,p這2項指標,計算第p個用戶的業(yè)擴潛力權重:
(15)
式中Ωi為第i個行業(yè)的用戶集合。
2.2.3 權重組合
組合上述業(yè)擴潛力權重,得到第i個行業(yè)內第p個用戶的綜合權重,即
ωp=(αsi+βrCi+θρi)·ep,p∈Ωi
(16)
式中 ɑ、β、θ為組合系數,此處取ɑ=β=θ=1/3。
(17)
式中D′sp為第p個用戶的調整日電量矩陣總和值;D′sp0為第p個用戶于t0日的調整日電量矩陣總和值。
環(huán)境因素是影響負荷變化的另一主要因素,尤其是氣溫因素。通過分析負荷與氣溫的相關性,剔除指數受氣溫因素的影響。
協(xié)變量可以用來解釋時間序列中的一些變化,考慮氣溫因素作為具有時變系數的協(xié)變量,其時變系數隨時間平穩(wěn)變化,但不呈現(xiàn)任何周期性。將指數拆解為
It=Lt+τtAt+ζt+ε
(18)
式中Lt為平滑的趨勢項;At為協(xié)變量,即氣溫值;τt為協(xié)變量的系數;ζt為隨機項;ε為擬合誤差。
剔除氣溫因素協(xié)變量的影響,即可得到負荷指數的趨勢曲線。
以深圳地區(qū)為例,所有用戶按2019年總用電量排序,以最大用電量作為基準值的對比結果如圖1所示,其中第1位用戶與第173位用戶的差異已超百倍,與第201位用戶差異更是將近千倍。因此,剔除用電量排序200名外的用戶,再參考行業(yè)挑選出深圳市100位企業(yè)用戶作為樣本構造2020年指數,電量數據規(guī)模大小由全量用戶的365×106維矩陣縮減至100位用戶的365×100維矩陣,樣本涉及行業(yè)及其代號對照如表3所示。
圖1 用電量排序結果Figure 1 Power consumption sorting result
表3 樣本涉及行業(yè)及其代號對照Table 3 Industries of samples and its code
首先,對樣本用戶前一自然年(2019年)的歷史日電量進行STL分解,獲取樣本用戶歷史日電量的周期分量,并據此對用戶2020年實際日電量進行調整,得到調整日電量D′。某用戶調整前、后的電量曲線如圖2所示,可見該用戶調整負荷值雖仍有細微波動,但與調整前負荷的波動性質已截然不同,不再表現(xiàn)出工作日效應,即不再固定于休息日大幅跌落至極小值。同時,由此得到的100位用戶的工作強度系數矩陣如表4所示。
圖2 某用戶調整前、后用電量對比Figure 2 Power consumption before and after adjustment
表4 工作強度系數矩陣Table 4 Matrix of working strength coefficient
然后,確定各樣本用戶涉及行業(yè)的權重。在深圳市統(tǒng)計局網站上查詢行業(yè)增加值增量及樣本電量總和等數據,如表5、6所示(由于2019年統(tǒng)計數據不全,就近取2018年數據作為代替計算)。
表5 2018年樣本涉及行業(yè)增加值增量及電量總和Table 5 Increment of value added by the industries of samples and total power consumption in 2018
表6 2018年地區(qū)生產總值增量Table 6 Increment of the regional GDP in 2018
采用問卷調查的方式咨詢專家意見,根據供電局客服經驗豐富的5位專家意見結果,按式(8)~(10)計算模糊數重心大小,得出行業(yè)重要度權重,如表7所示。結合表5、6,按式(11)、(12)可計算行業(yè)貢獻率、能耗產出關系權重;根據100位企業(yè)用戶近3年的容量擴裝情況計算其業(yè)擴潛力權重。
表7 行業(yè)權重值Table 7 The weights of industries of the samples
最后,整合上述權重并結合式(16)對企業(yè)2020年調整負荷進行計算,以2020年1月6日作為基期繪制指數,如圖3所示,進一步地,可去除氣溫因素影響的指數。
圖3 2020年指數及氣溫影響情況Figure 3 Index and its temperature impact in 2020
基于上述所得100位用戶的工作強度系數矩陣(表4)繪制熱力圖,如圖4所示(圖中色度于0~1為均勻分布,于1~10為對數分布),其中,每行代表一周,每列代表一位用戶,每個色塊的顏色表示用戶某一周的工作強度系數,系數值越大,說明用戶當周工作量越大。
圖4 2020年各周用戶工作強度情況Figure 4 Weekly working strength in 2020
由圖4中可見,第4至第8周(2月份)基本所有用戶工作強度系數接近0,當時處于春節(jié)期間,且受疫情影響直到3月才陸續(xù)復工復產,能看出部分企業(yè)疫情調休,復工復產后仍有幾周無工作日效應;第14、16、24、39周同樣出現(xiàn)了大部分用戶工作強度系數降至0的情況,其中,第14、16、24周分別為勞動節(jié)/端午節(jié)前后周,均于周末調休補班,而第39周為國慶節(jié)當周,假期工作暫停。
綜上,所提工作強度系數在分析用戶復工復產、工作安排、調休補班等生產經營行為上具有重要作用。具體地,當工作強度系數接近1時,該用戶當周處于正常生產經營狀態(tài);當接近0時,該用戶當周處于調休補辦或假期狀態(tài);當遠大于1時,該用戶當周生產經營活動較平常更為活躍。
當去除工作日特性的短期規(guī)律波動后,指數的趨勢更為明顯,可以清晰辨別用戶電量的整體水平和異常波動。如:2020年大部分時間下去氣溫影響指數值低于1 000,以電量角度來看,地區(qū)發(fā)展整體處于低迷狀態(tài),直至年底有所恢復;再如:1月底春節(jié)期間指數跌至550左右,之后受疫情影響直至3月中旬指數恢復至1月水平,說明大企業(yè)才基本實現(xiàn)復工復產;又如:指數在春節(jié)、勞動節(jié)、端午節(jié)、國慶節(jié)4個法定節(jié)假日前后明顯下跌,其中下降幅度為春節(jié)>國慶>勞動節(jié)>端午節(jié),這方面指數也側面反映了對節(jié)假日的重視程度。
此外,將2020年指數值與該年全社會總電量(以1月1日值標準化)對比,如圖5所示,可見原始指數與全社會總電量具有相似的變化趨勢,具有表征整體用戶用電行為的作用。
圖5 2020年指數值與全社會總電量對比Figure 5 Index and total electricity consumption in 2020
綜上,通過對比指數值可比較地區(qū)電量變動情況,一定程度上能反映地區(qū)發(fā)展態(tài)勢,當指數長期處于增長狀態(tài)則說明地區(qū)生產經營行為趨于活躍,發(fā)展向好,相反則說明地區(qū)發(fā)展較為低迷。
為進一步驗證指數對地區(qū)經濟的表征性,本文探討指數與地區(qū)GDP、固定資產投資(investment in fixed assets,F(xiàn)AI)、規(guī)模以上工業(yè)總產值(gross output value of industry above designated size,IDGO)以及居民消費價格指數(consumer price index,CPI)等指標間的關系。
計量經濟學中的格蘭杰因果檢驗[16]可用于判斷2個時間序列變量在統(tǒng)計學上的因果關系。利用格蘭杰因果檢驗可分析去除氣溫影響后的指數與多個經濟指標間的關系?;诳ǚ椒植紝χ笜伺c指數間關系假設進行檢驗,在1%的顯著性水平下作三階最大滯后數檢驗,并與未經加權處理的指數檢驗作對比,取顯著性水平最小的滯后階數結果,如表8所示;GDP與指數的相關性如表9所示。
表8 Granger因果檢驗結果Table 8 Granger causality test results
表9 GDP與指數的相關系數Table 9 Correlation coefficient between GDP and index
格蘭杰檢驗結果顯示,指數是引起IDGO、CPI等變化的Granger原因,并且均具有三階的滯后,故負荷指數所表征的用電行為變動可在一定程度上反映生產總值以及消費水平的變化;FAI是引起指數三階滯后變化的Granger原因,說明了固定生產投資對生產經營行為起到規(guī)劃作用。在GDP與指數的相關性分析中,多種方法均說明指數與GDP高度相關。同時,在指數加權與否的對比中發(fā)現(xiàn),加權指數與經濟指標關系檢驗結果的顯著性水平更低,即結果更為可信,且加權指數與GDP的相關性也優(yōu)于不加權指數的相關性,由此證明了加權方法的有效性。此外,指數與經濟值的關系也印證了樣本選取具備良好的表征性。
本文借鑒股價指數,構造了調整負荷成分指數,旨在展示行業(yè)大用戶的電力負荷發(fā)展情況,指數大于1 000時說明用電量比基期有所上漲,對比兩日指數值可比較用戶日電量變化情況。
1)指數構造過程所得到的工作強度系數在分析用戶復工復產、工作安排、調休補班等生產經營行為上具有重要作用;2)指數反映地區(qū)日用電行為模式時具有更加準確直觀的可視性,具有表征整體用戶用電行為的作用,且一定程度上能反映地區(qū)發(fā)展態(tài)勢;3)去除氣溫影響后的指數與經濟等指標具有明顯的統(tǒng)計因果關系,能夠為投入產出關系分析以及經濟走勢預測提供參考價值。
未來可在調整負荷成分指數的基礎上研究更細化、分類別的電力負荷指數,專門針對不同行業(yè)、不同體量、不同類型的用戶制定指數曲線,通過提煉指數背后的經濟價值為各方決策提供有效支持。