保富, 馬文, 高宇豆, 楊天純, 李珗
(1.云南電網(wǎng)有限責(zé)任公司信息中心, 云南, 昆明 650214;2.云南云電同方科技有限公司, 云南, 昆明 650214)
由于多方面原因的影響,任何地區(qū)都可能因為一些因素或者條件約束造成停電的現(xiàn)象[1]。一般電力公司的規(guī)模都十分巨大,生產(chǎn)經(jīng)營方面的情況也極為復(fù)雜,因此從大量的業(yè)務(wù)數(shù)據(jù)中通過各種渠道發(fā)現(xiàn)數(shù)據(jù)中的隱藏信息,可以有助于電力公司實現(xiàn)安全、可靠、平穩(wěn)、便捷的供電服務(wù)核心宗旨[2]。
邏輯回歸模型具有設(shè)計與操作十分簡單的優(yōu)勢,并且相比較其他預(yù)測方法,邏輯回歸模型在約束條件下對事物的預(yù)測精確率更高。電力用戶在我國分布密度十分巨大,因此在目前條件下邏輯回歸模型更加適合預(yù)測電力用戶的停電敏感度[2]。通過對電力用戶停電敏感度的大量收集進行邏輯回歸模型的設(shè)計,再通過設(shè)計的邏輯回歸模型對停電用戶敏感度進行有效的分析。
對電力用戶的停電敏感度數(shù)據(jù)收集主要來自用電行為[3]與用電信息處理。用電行為包括停電次數(shù)、停電時長、用電量、電價[4]。用電信息處理主要包括記錄電力用戶咨詢、報修、投訴、舉報等事務(wù),這幾方面都屬于收集的電力用戶停電敏感度數(shù)據(jù)[5]。對于基本屬性可以歸納為數(shù)據(jù)X,電力行為歸納為數(shù)據(jù)Y,用電信息處理歸納為數(shù)據(jù)e,而主要應(yīng)用的公式為
X=11+e-y
(1)
式(1)為邏輯回歸模型的通用公式,在本文將會應(yīng)用于預(yù)測電力用戶的停電敏感度。由于9558數(shù)據(jù)處理信息大多為電力用戶咨詢、保修、投訴、舉報等,獲取數(shù)據(jù)方式相同,且不受外界與特定因素影響[6]。因此收集方式與轉(zhuǎn)化數(shù)據(jù)的方式也相同,所以可以總體歸納為數(shù)據(jù)e,在該過程中收集的數(shù)據(jù)為接下來預(yù)測電力用戶停電敏感度提供了大量的數(shù)據(jù)參照,也為接下來的方法實施打下了堅實的基礎(chǔ)[7]。由于每個電力用戶的用電次數(shù)、用電時長與用電量都有所不同,所以在數(shù)據(jù)Y的分析中需要設(shè)立特定區(qū)間,多次審核區(qū)間范圍外的數(shù)據(jù),最終得到更加準確的數(shù)據(jù)y,從而達到分析目的。只有經(jīng)過數(shù)據(jù)分析得到的數(shù)據(jù)才可以應(yīng)用于邏輯回歸模型的設(shè)計當中,應(yīng)用該數(shù)據(jù)設(shè)計的邏輯回歸模型可以提高預(yù)測電力用戶停電敏感度的準確性。
針對設(shè)計的邏輯回歸模型來說,需要依據(jù)上文中提到的基本屬性轉(zhuǎn)化的數(shù)據(jù)集合x,用電行為轉(zhuǎn)化的數(shù)據(jù)集合y與用電信息處理轉(zhuǎn)化的數(shù)據(jù)e進行設(shè)計,其中數(shù)據(jù)集合x屬于目標變量,數(shù)據(jù)集合y屬于影響因素,數(shù)據(jù)e則為自然數(shù),而邏輯回歸模型預(yù)測計算的公式為
x=11+ey
(2)
在該計算過程中,當模型的因素變量即y過多時,通常應(yīng)用大數(shù)據(jù)邏輯回歸模型方法學(xué)習(xí)出來的模型會出現(xiàn)數(shù)據(jù)重復(fù)預(yù)測的現(xiàn)象,引入x的平均數(shù)據(jù)集合,可以減小因素變量數(shù)據(jù)集合y的影響,也可以減少重復(fù)預(yù)測的現(xiàn)象,增強預(yù)測的判斷性[8]。目標變量x的值受因素變量y的影響較大,但當因素變量之間存在較高的相關(guān)性時,目標變量可能存在預(yù)測錯誤的現(xiàn)象,無法避免。
應(yīng)用設(shè)計的邏輯回歸模型對電力用戶停電敏感度進行預(yù)測分析,電力用戶的數(shù)量逐步增加,意味著代表基本屬性的數(shù)據(jù)集合x也在逐步增大。受地域因素與人文因素的影響,電力用戶的用電情況并不相同,而上文中提到的用電行為即包括停電次數(shù)、停電時長、用電量、電價構(gòu)成的數(shù)據(jù)集合y,則是預(yù)測電力用戶停電敏感度的主要依據(jù)與干擾因素,因為電力用戶經(jīng)歷的停電次數(shù)、停電時長與用電量和對電價的反應(yīng)可以從側(cè)面反映出電力用戶的停電敏感度,而電力用戶的反映獲取則是通過用電信息處理來實現(xiàn)。
為檢測本文研究的邏輯回歸模型對電力用戶停電敏感度的高效性與精確性,設(shè)立對比實驗,與傳統(tǒng)的預(yù)測電力用戶停電敏感度方法進行對比,檢測本文邏輯回歸模型預(yù)測的效果。
該實驗的實驗參數(shù)如表1所示。
表1 實驗參數(shù)
根據(jù)上述實驗參數(shù),得出在相同時間內(nèi)本文研究的邏輯回歸模型預(yù)測方法與傳統(tǒng)預(yù)測方法對電力用戶停電敏感度的預(yù)測進度如圖1所示。
圖1 電力用戶停電敏感度的預(yù)測進度
根據(jù)圖1可知,在相同的時間內(nèi)針對相同的電力用戶進行停電敏感度預(yù)測,本文研究的邏輯回歸模型預(yù)測方法的預(yù)測進度遠遠快于傳統(tǒng)方法的預(yù)測進度,因為本文在獲取大量數(shù)據(jù)時主要依靠邏輯回歸模型計算預(yù)測,而傳統(tǒng)預(yù)測方法在獲取大量數(shù)據(jù)后還需要派遣人力進行走訪匯報總結(jié),最終對電力用戶停電敏感度進行預(yù)測,投入了更大的人力并且浪費了許多的數(shù)據(jù)。
根據(jù)上述實驗參數(shù),得出將預(yù)測范圍分別擴展于農(nóng)村與城市時,本文研究的邏輯回歸模型預(yù)測方法與傳統(tǒng)的預(yù)測方法對農(nóng)村與城市電力用戶停電敏感度的預(yù)測時間對比圖如圖2所示。
圖2 農(nóng)村與城市電力用戶停電敏感度的預(yù)測對比圖
根據(jù)圖2可知,針對相同范圍大小的電力用戶,無論是針對農(nóng)村電力用戶還是城市電力用戶,研究的邏輯回歸模型預(yù)測方法都比傳統(tǒng)的預(yù)測方法需要的時間短,甚至應(yīng)用研究的邏輯回歸模型預(yù)測方法對農(nóng)村電力用戶停電敏感度的預(yù)測時間比傳統(tǒng)預(yù)測方法對城市電力用戶停電敏感度的預(yù)測時間都要短,其中可能存在農(nóng)村地形因素以及分布度不均的影響,但也能體現(xiàn)出邏輯回歸模型預(yù)測電力用戶停電敏感度的高效性。
根據(jù)上述實驗參數(shù),得出本文研究的邏輯回歸模型預(yù)測電力用戶停電敏感度的精確率與傳統(tǒng)預(yù)測方法預(yù)測電力用戶停電敏感度精確率的對比圖,如圖3所示。
圖3 預(yù)測電力用戶停電敏感度精確率的對比圖
根據(jù)圖3可知,本文研究的邏輯回歸模型預(yù)測方法預(yù)測的精確率遠高于傳統(tǒng)預(yù)測方法預(yù)測的精確率,且預(yù)測的精確率也較為穩(wěn)定。
研究的邏輯回歸模型預(yù)測電力用戶進行停電敏感度方法是根據(jù)大量數(shù)據(jù)計算得來的,并將一些特定因素如地域因素人文因素都考慮其中,可以大大地增加預(yù)測電力用戶敏感度的精確率,并且較于傳統(tǒng)方法更加高效便捷,更加適用于當前的大部分電力公司,可以幫助電力公司更好地處理與電力用戶之間的關(guān)系,而且其預(yù)測的高效性與精確性可以隨著目前領(lǐng)域的研究力度加大出現(xiàn)提升的可能,具有充足的潛力和可觀的發(fā)展前景,這也是本文研究的價值所在。