(1.國(guó)網(wǎng)四川省電力公司電力科學(xué)研究院,四川 成都 610041;2.國(guó)網(wǎng)四川省電力公司,四川 成都 610041)
隨著互聯(lián)網(wǎng)技術(shù)和大數(shù)據(jù)技術(shù)的不斷推廣和應(yīng)用,發(fā)展智能經(jīng)濟(jì)、數(shù)字經(jīng)濟(jì)已成為大勢(shì)所趨。在電力物聯(lián)網(wǎng)建設(shè)進(jìn)程不斷深入過(guò)程中,數(shù)字化轉(zhuǎn)型已經(jīng)上升為電網(wǎng)企業(yè)的重要戰(zhàn)略,激活數(shù)據(jù)價(jià)值、挖掘數(shù)據(jù)應(yīng)用場(chǎng)景、開(kāi)發(fā)數(shù)據(jù)產(chǎn)品、服務(wù)社會(huì)發(fā)展成為熱點(diǎn)[1-2]。
人員流動(dòng)情況摸查是電力數(shù)據(jù)應(yīng)用于提質(zhì)增效的重要場(chǎng)景。尤其是自新冠肺炎疫情發(fā)生以來(lái),由于疫情時(shí)值春節(jié),走親訪友的情況較多,加之城市社區(qū)人口密集,給工作人員本來(lái)就有限的社區(qū)排查、管控工作帶來(lái)極大的困難,導(dǎo)致人員摸排周期長(zhǎng)、摸排不準(zhǔn)確?;诤A坑秒姅?shù)據(jù)把握用戶的用電規(guī)律和用電特性從而辨別居民人口流動(dòng)情況,可以及時(shí)有效地解決上述問(wèn)題。
然而,在用戶行為分析方面,當(dāng)前研究主要集中在基于電力數(shù)據(jù)的用戶用電行為解析[3-5],基于用電信息的人員流動(dòng)情況評(píng)估方法較少。文獻(xiàn)[6]提出了一種基于細(xì)粒度用能數(shù)據(jù)的居民家庭活動(dòng)人口評(píng)估方法,評(píng)估結(jié)果具有較高的可行度。但上述方法數(shù)據(jù)要求較高,需要獲取采樣間隔為15 min的居民分項(xiàng)電器用電數(shù)據(jù)、空調(diào)和電熱負(fù)荷詳細(xì)數(shù)據(jù)。對(duì)于大部分小區(qū)尤其是老舊小區(qū)而言,分時(shí)、分項(xiàng)數(shù)據(jù)獲取基本無(wú)法實(shí)現(xiàn),嚴(yán)重限制了方法的應(yīng)用場(chǎng)景,也難以滿足實(shí)際需求。
鑒于此,提出了一種基于居民日電量數(shù)據(jù)的人口流動(dòng)情況評(píng)估方法。首先,通過(guò)歷史用電數(shù)據(jù)聚類挖掘居民的穩(wěn)定用電水平;然后,基于日電量變化情況和穩(wěn)定用電水平提出了人口流動(dòng)判據(jù);最后,基于上述判據(jù)對(duì)小區(qū)居民流動(dòng)情況進(jìn)行分析和研判,為社區(qū)疫情排查工作提供依據(jù),并以成都市某小區(qū)居民實(shí)際數(shù)據(jù)為例驗(yàn)證了所提方法的有效性。
在線采集上傳的日電量,真實(shí)反映客戶當(dāng)日生產(chǎn)生活用電情況,具有實(shí)時(shí)性強(qiáng)的特點(diǎn);但受到信號(hào)干擾、軟硬件故障、通信異常等情況的影響,數(shù)據(jù)可能會(huì)出現(xiàn)缺失、異常等情況。數(shù)據(jù)質(zhì)量直接關(guān)系到分析的結(jié)果,因此,需要對(duì)采集的數(shù)據(jù)進(jìn)行校核和清洗等預(yù)處理。
日電量是一個(gè)累積值,因此,對(duì)于缺失數(shù)據(jù)的處理有兩種方法。
1)用缺失日后1日的日電量作為平均值。計(jì)算方法為:
(1)
式中:N為數(shù)據(jù)缺失日期;Wnew(N)為更新數(shù)值;W(N+1)為數(shù)據(jù)缺失日的后一日的日電量采集數(shù)值;ε為隨機(jī)噪聲信號(hào)。該方法適用于對(duì)歷史數(shù)據(jù)的處理。
2)用前一段時(shí)間日電量均值代替。計(jì)算方法為
(2)
該方法適用于最新日電量的處理。
對(duì)于異常數(shù)據(jù)的校正,主要用于超出合理范圍的數(shù)據(jù)。一般而言,居民日用電量在0至允許容量之間,若日電量小于0,則用0替代;若日電量大于允許容量,則該日電量用最大容量或歷史均值替代,計(jì)算方法與式(2)相同。
聚類是樣本分類的常用算法[7],聚類分析的主要目的是通過(guò)分析數(shù)據(jù)的分布特征實(shí)現(xiàn)將數(shù)據(jù)對(duì)象劃分為若干數(shù)據(jù)子集,保證每個(gè)子集中數(shù)據(jù)的相似性。其中,k-means聚類方法因其簡(jiǎn)單高效而廣泛應(yīng)用于電力系統(tǒng)負(fù)荷分類中[8-9]。
考慮到居民用電情況可分為當(dāng)日不在家、當(dāng)日部分時(shí)間在家和當(dāng)日全天在家3種場(chǎng)景,可以通過(guò)聚類算法將居民歷史日電量分為3類,分別代表3種場(chǎng)景的用電量樣本。這里主要采用k-means算法對(duì)不同居民用電場(chǎng)景的電量進(jìn)行聚類。
假設(shè)在同一季節(jié),居民的用電量與在家時(shí)長(zhǎng)呈現(xiàn)正相關(guān),求取各類數(shù)據(jù)均值,均值數(shù)據(jù)由大到小分別對(duì)應(yīng)全天在家Wpart、部分時(shí)間在家Wfull和不在家Wno3類情況的穩(wěn)定用電量值。分別統(tǒng)計(jì)各類中的樣本數(shù)量,獲取各類場(chǎng)景的出現(xiàn)概率,從而了解居民的生活習(xí)慣。
由于歷史數(shù)據(jù)不足,部分用戶用電場(chǎng)景不一定齊全,因此,需要對(duì)模型進(jìn)行校正。校正判據(jù)為
(3)
式中:dmin為類間距離,是3類樣本均值之間的距離;Wmax為歷史日電量最大值,表示所選樣本中最大值,樣本一般為同一季節(jié)的日電量數(shù)據(jù)集合。
若上述判據(jù)滿足,則將距離最近的兩類合為一類。
由于日電量信息顆粒度較大,無(wú)法反映實(shí)時(shí)人口活動(dòng)情況,因此,日電量信息難以反應(yīng)具體的人數(shù)信息。對(duì)于居民流動(dòng)情況,這里重點(diǎn)關(guān)注人口流出后住房空置、由空置到入住的人口流入兩種情況。
考慮到居民離開(kāi)家當(dāng)天用電量可能介于全天在家場(chǎng)景和全天不在家場(chǎng)景,因此,居民用電變化量考慮次日電量變化和隔日電量變化兩個(gè)層次進(jìn)行指標(biāo)設(shè)計(jì),其計(jì)算方法為:
(4)
(5)
式中:W(t)為當(dāng)日日電量;W(t-1)為前一日日電量;W(t-2)為隔日日電量;Wmax為歷史日電量最大值。
若某居民用戶的日電量突變率滿足式(6)中的兩個(gè)判據(jù)之一,則該戶居民為用能突變用戶。
(6)
對(duì)于用能突變用戶而言,若突變率大于0,則居民為用能激增用戶;若突變率小于0,則該居民為用能驟減用戶。
考慮到居民流入、流出前后用電狀態(tài)的變化,對(duì)于用電量可劃分為3類的情況,定義底值系數(shù)為
(7)
式中,k2和k1分別為兩個(gè)系數(shù),其關(guān)系滿足k2+k1=1,且k1>2k2,這里取k1=5/6,k2=1/6。
對(duì)于模型校正后只有兩類的樣本,底值系數(shù)為
(8)
底值系數(shù)主要用于區(qū)分用戶的居家狀態(tài),若該日日電量與歷史日電量最大值的比值小于或等于底值系數(shù),則判定用戶不在家的概率較大。
1)疑似人口流入的判據(jù)
判據(jù)1:該用戶為用能驟增用戶。
判據(jù)2:電量激增前的日電量小于WmaxKcut。
同時(shí)滿足判據(jù)1和判據(jù)2,則認(rèn)為該戶為人口流入客戶,標(biāo)志位記為1。
2)人口流出的判定判據(jù)
判據(jù)3:該用戶為用能驟減用戶。
判據(jù)4:電量驟減后的日電量小于WmaxKcut。
同時(shí)滿足判據(jù)3和判據(jù)4,則認(rèn)為該戶為人口流出客戶,標(biāo)志位記為-1。
值得注意的是,若隔日突變率和次日突變率均大于1/3時(shí),可能存在連續(xù)兩天判定外出的情況。因此,需要對(duì)上述情況進(jìn)行校核,選取中間一天作為流入或流出的時(shí)間,保證流入和流出的準(zhǔn)確性。
由于在流出到流入之間的時(shí)段,房間處于空置狀態(tài),用電量變化一般很小,利用該特征可以進(jìn)一步校核判定結(jié)果的有效性。即:人口流出后到下一次人口流入前,(日電量變化量/歷史日電量最大值)小于0.01,則認(rèn)為該戶短時(shí)空置,人流測(cè)算有效。
根據(jù)流入流出判據(jù)標(biāo)記位按日累加,可以獲得該戶居民居家狀況曲線。若居民居家狀況的最小值為-1,則該曲線整體加1。居家狀況為1,代表該戶當(dāng)日非空置,否則代表該戶當(dāng)日空置。
小區(qū)總體居民人口流動(dòng)狀況可以反映總體的人口流動(dòng)狀態(tài),為社區(qū)防疫工作提供參考信息。具體包括:
1)小區(qū)持續(xù)空置戶數(shù)
持續(xù)空置客戶包含兩類:1)電表表底數(shù)據(jù)持續(xù)為空的未開(kāi)戶用戶;2)表計(jì)已開(kāi)戶但變化量持續(xù)為零的空置住房用戶。定義兩類用戶戶數(shù)的總和為持續(xù)空置戶數(shù)。
2)居民用電量突變戶數(shù)
定義除持續(xù)空置用戶外的居民中,居民次日電量突變率或隔日電量突變率絕對(duì)值大于1/3的居民戶數(shù),為當(dāng)日居民用能突變戶數(shù)。其中,次日突變率數(shù)值為正的居民戶數(shù)為用戶用電驟增戶數(shù),突變率數(shù)值為負(fù)的居民戶數(shù)為用戶用電驟減戶數(shù)。
3)穩(wěn)定用能戶數(shù)
當(dāng)日穩(wěn)定用能戶數(shù)定義為除持續(xù)空置用戶外的居民中,居民次日電量突變率或隔日電量突變率絕對(duì)值小于1/3的居民戶數(shù)。
4)短期空置戶數(shù)
小區(qū)內(nèi)短時(shí)空置的用戶數(shù)目。
5)非空置住宅數(shù)目
小區(qū)內(nèi)當(dāng)日有人居住的住宅數(shù)目。
以成都市某小區(qū)2020年1月14日至2月13日一個(gè)月的電量數(shù)據(jù)為例進(jìn)行分析。該小區(qū)總電表戶數(shù)為180戶,其中,表計(jì)未計(jì)數(shù)用戶數(shù)為48戶,統(tǒng)計(jì)期間未入住空置住宅戶數(shù)為36戶,空置率為46.67%。由于該小區(qū)為成都市內(nèi)的新小區(qū),入住率不高。
剩余96戶的用能曲線如圖1所示。由于該小區(qū)為別墅區(qū),部分負(fù)荷較高。從負(fù)荷曲線可以看出,當(dāng)人員離開(kāi)時(shí)負(fù)荷特征明顯。
居民的典型判定曲線如圖2所示。其中,居家情況為0表示該戶不在家,為1表示該戶在家。如圖2(a)所示,該居民2020年2月3日返回家中,居民電量在當(dāng)日出現(xiàn)上升,但次日上升電量較小,不滿足用能突變判據(jù),但隔日突變率滿足要求,可判定該戶用能突變。可見(jiàn),僅利用次日突變率判據(jù)可能出現(xiàn)漏判。根據(jù)居家情況判定結(jié)果可知,該算法能準(zhǔn)確反映人口流動(dòng)情況。圖2(b)所示為居民1月24日離開(kāi),1月28日返回;圖2(c)所示為居民1月23日返回,2月1日離開(kāi),居家判定結(jié)果準(zhǔn)確。
圖1 居民用能曲線
圖2 居民居家情況典型判定
從小區(qū)整體來(lái)看,用能驟增和用能驟減的居民戶數(shù)隨時(shí)間的變化曲線如圖3所示,其中圖3(a)為次日用能驟變居民戶數(shù),圖3(b)為隔日用能驟變居民戶數(shù)。
(a)
(b)圖3 小區(qū)用能驟變戶數(shù)
小區(qū)疑似人口流動(dòng)的戶數(shù)如圖4所示。由圖可見(jiàn),1月22日(春節(jié)前)疑似流出人口居民戶數(shù)大于當(dāng)日用能驟變數(shù)目或隔日用能驟變數(shù)目,說(shuō)明所采用的兩個(gè)指標(biāo)結(jié)合的方法性能更好。
圖4 小區(qū)疑似人口流動(dòng)戶數(shù)
該小區(qū)非空置住宅戶數(shù)如圖5所示。由圖可見(jiàn),1月15日至1月22日(春節(jié)前)流出戶數(shù)略大于流入戶數(shù),非空置住房數(shù)持續(xù)下降,整個(gè)小區(qū)人口流出明顯。1月23日(除夕)有所回升,但隨后繼續(xù)下降,至1月25日達(dá)到最低點(diǎn)。隨后,非空置住房數(shù)持續(xù)上升,到2月1日后基本保持穩(wěn)定。分析結(jié)果與實(shí)際情況基本相符。1月28日后非空置住房數(shù)回落疑似與國(guó)家將復(fù)工時(shí)間由1月30日調(diào)整至2月3日有關(guān)。
圖5 小區(qū)非空住宅數(shù)
由上述分析可知,雖然日電量數(shù)據(jù)顆粒度不高,但采用所提出的算法后仍能較好地監(jiān)測(cè)人口流動(dòng)情況。
鑒于城市社區(qū)人口密集,采用人工排查人口情況的方式工作量大、工作周期長(zhǎng),且受節(jié)假日等因素的影響其數(shù)據(jù)準(zhǔn)確性不高等問(wèn)題,提出了一種基于電力大數(shù)據(jù)的居民人口流動(dòng)情況評(píng)估方法,通過(guò)構(gòu)建用能突變判據(jù)和人口流動(dòng)判據(jù)實(shí)現(xiàn)了居民人口流入、流出情況的動(dòng)態(tài)監(jiān)測(cè)。利用所提方法應(yīng)用于某小區(qū)的人口流動(dòng)分析,得到結(jié)論如下:
1)根據(jù)居民數(shù)據(jù)分析結(jié)果與實(shí)際流入流出情況的對(duì)比可知,采用居民日電量數(shù)據(jù)可以較好地反映居民人口流動(dòng)情況。
2)采用隔日突變率和次日突變率相結(jié)合的方法,可以更好地反映用戶的實(shí)際用能變化情況,有效提高算法的準(zhǔn)確性。
3)由算例分析結(jié)果可知,小區(qū)居民流動(dòng)情況和非空置戶數(shù)情況受節(jié)假日(春節(jié))影響很大,假期前半段流出數(shù)量較多,后半段流入較多。分析結(jié)果與實(shí)際相符。
由于日電量維度較低,載有的信息量較少,因此,在用戶用能習(xí)慣變化極大的情況下,所提方法可能出現(xiàn)誤判或漏判。因此,未來(lái)將進(jìn)一步研究在有限信息下精確挖掘用戶習(xí)慣、提高算法準(zhǔn)確性的方法。