李 娜,王 磊,張文月,王玉瑋,舒 艷,張 超
(1.國網(wǎng)天津市電力公司經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究院,天津 300171;2.國網(wǎng)天津市電力公司,天津 300010; 3.華北電力大學(xué),北京 102206)
?
基于高維數(shù)據(jù)優(yōu)化聚類的長(zhǎng)周期峰谷時(shí)段劃分模型研究
李娜1,王磊1,張文月2,王玉瑋3,舒艷3,張超3
(1.國網(wǎng)天津市電力公司經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究院,天津300171;2.國網(wǎng)天津市電力公司,天津300010; 3.華北電力大學(xué),北京102206)
峰谷分時(shí)電價(jià)是需求側(cè)管理中一種有效的經(jīng)濟(jì)手段,因此合理科學(xué)地引入需求側(cè)管理來設(shè)計(jì)峰谷分時(shí)電價(jià),通過運(yùn)用價(jià)格信號(hào)有效調(diào)整電力用戶的用電習(xí)慣和用電計(jì)劃,對(duì)提高資源利用率、優(yōu)化資源配置、實(shí)現(xiàn)削峰填谷、降低發(fā)電成本、促進(jìn)電源與電網(wǎng)的協(xié)調(diào)發(fā)展以及推動(dòng)整個(gè)電力行業(yè)健康發(fā)展起著決定性的作用。
峰谷分時(shí)電價(jià)制定的恰當(dāng)與否跟峰谷時(shí)段的劃分和用戶需求響應(yīng)密切相關(guān)[1]。峰谷時(shí)段的劃分是峰谷分時(shí)電價(jià)的定價(jià)基礎(chǔ),其劃分方法的選取直接影響用戶的需求響應(yīng)程度,從而影響電價(jià)的實(shí)施效果。因此,制定合理的峰谷分時(shí)電價(jià)的首要任務(wù)是科學(xué)合理地進(jìn)行峰谷時(shí)段的劃分。
目前已有的關(guān)于峰谷時(shí)段劃分的方法主要有:文獻(xiàn)[1,2]以日負(fù)荷曲線分布為基礎(chǔ),結(jié)合模糊聚類分析技術(shù),構(gòu)建了峰谷時(shí)段劃分模型;文獻(xiàn)[3]基于密度聚類算法,對(duì)年持續(xù)負(fù)荷曲線中各負(fù)荷所對(duì)應(yīng)的持續(xù)時(shí)間進(jìn)行聚類分析,然后通過分布集邊界所對(duì)應(yīng)的負(fù)荷大小劃分峰谷時(shí)段;文獻(xiàn)[4]采用因素分析法,將其與原始負(fù)荷電量相結(jié)合,構(gòu)建峰谷時(shí)段劃分模型;文獻(xiàn)[5]提出了一種基于不同時(shí)段供電成本差異的時(shí)段劃分模型。
在上述研究成果的基礎(chǔ)上,本文著重考慮峰谷時(shí)段劃分結(jié)果的客觀合理性及其是否能在一個(gè)較長(zhǎng)時(shí)間周期(如1a)內(nèi)適用這兩個(gè)問題。為此,本文提出以下研究思路:首先,通過數(shù)據(jù)高維化的處理方法構(gòu)建涵蓋較長(zhǎng)時(shí)間周期(例如1a)內(nèi)所有負(fù)荷信息的數(shù)據(jù)樣本集;其次,以K-均值算法為聚類分析工具,在高維數(shù)據(jù)樣本集上構(gòu)建峰谷時(shí)段劃分模型;最后,結(jié)合某區(qū)全年負(fù)荷數(shù)據(jù),對(duì)所構(gòu)建的模型進(jìn)行算例仿真,在驗(yàn)證模型的合理性基礎(chǔ)上,最終輸出時(shí)段劃分結(jié)果。
對(duì)全天進(jìn)行峰、平、谷時(shí)段劃分,其基本原理就是根據(jù)各時(shí)點(diǎn)(通常做法是將全天分為24個(gè)時(shí)點(diǎn)或時(shí)段)上所采集的負(fù)荷數(shù)值大小,將負(fù)荷取值相對(duì)大的各時(shí)點(diǎn)統(tǒng)一劃分為全天的峰時(shí)段、將負(fù)荷取值相對(duì)小的各時(shí)點(diǎn)統(tǒng)一劃分為全天的谷時(shí)段、將負(fù)荷取值相對(duì)中等的各時(shí)點(diǎn)統(tǒng)一劃分為全天的平時(shí)段。由此可見,基于峰、平、谷時(shí)段劃分原理的各類算法本質(zhì)上屬于數(shù)據(jù)挖掘中聚類分析(無導(dǎo)師學(xué)習(xí))的范疇,劃分效果的好壞主要取決于以下兩點(diǎn):
① 包含基本信息的數(shù)據(jù)樣本集合如何構(gòu)造,使對(duì)其進(jìn)行時(shí)段劃分的最終結(jié)果適用于一個(gè)較長(zhǎng)的時(shí)間周期(一季、一年或者更長(zhǎng));
② 判斷各樣本點(diǎn)取值(相當(dāng)于各時(shí)點(diǎn)負(fù)荷值)相對(duì)大小的分類標(biāo)準(zhǔn)如何確定,使據(jù)此進(jìn)行時(shí)段劃分的結(jié)果最大限度地反映出峰、平、谷各時(shí)段在負(fù)荷取值方面的差異。
對(duì)以上兩點(diǎn)問題的合理解決將是本文論述的關(guān)鍵。數(shù)據(jù)樣本點(diǎn)的高維化和聚類算法可通過迭代自動(dòng)收斂于最優(yōu)分類標(biāo)準(zhǔn)是這些目標(biāo)實(shí)現(xiàn)的基礎(chǔ)。接下來分別就數(shù)據(jù)樣本點(diǎn)的高維化和K-均值聚類算法展開研究。
為了使最終的時(shí)段劃分結(jié)果適用于一個(gè)較長(zhǎng)的時(shí)間周期,僅使用某天的各時(shí)點(diǎn)負(fù)荷數(shù)據(jù)構(gòu)造數(shù)據(jù)樣本集合顯然是不合理的。這是因?yàn)椋谝粋€(gè)較長(zhǎng)的時(shí)間周期內(nèi)(例如1a),各日負(fù)荷曲線的形狀差異會(huì)比較明顯,且這種差異程度會(huì)隨著周期加長(zhǎng)而增大,從而適用于某日的峰、平、谷時(shí)段劃分結(jié)果并不一定適用于另一日。面對(duì)這一問題,比較直觀的處理方法是:
① 在一個(gè)較長(zhǎng)的時(shí)間周期內(nèi)(以下稱其為全周期),分別以每一日的時(shí)點(diǎn)負(fù)荷數(shù)據(jù)為樣本集,采用一定的聚類方劃分出各日的峰、平、谷時(shí)段;
② 根據(jù)各日的時(shí)段劃分結(jié)果統(tǒng)計(jì)出24個(gè)時(shí)點(diǎn)分別被劃分為峰、平、谷各時(shí)段的天數(shù);
③ 根據(jù)最大天數(shù)原則,判斷某個(gè)時(shí)點(diǎn)最終應(yīng)當(dāng)被劃分于峰、平、谷某一時(shí)段,從而得到了考慮全周期所有日負(fù)荷時(shí)間分布特點(diǎn)的峰、平、谷時(shí)段劃分結(jié)果。
上述方法在所選全周期長(zhǎng)度較小時(shí)比較可行,但是當(dāng)周期長(zhǎng)度(天數(shù))增加時(shí),該方法的迭代次數(shù)會(huì)隨之成倍增長(zhǎng),且一旦出現(xiàn)某一時(shí)點(diǎn)被劃分于峰、平、谷各時(shí)段天數(shù)相等的情況,則最大天數(shù)原則失效,算法無法輸出最終的劃分結(jié)果。
為此,本文建立如下考慮全周期各日負(fù)荷信息的數(shù)據(jù)樣本集構(gòu)造方法。
設(shè)所分析全周期內(nèi)共含天數(shù)為n(n∈N,n>0),在第t(t=1,2,…,24)個(gè)時(shí)點(diǎn)上,所研究地區(qū)n天中對(duì)應(yīng)的負(fù)荷數(shù)據(jù)可組成如下向量:
(1)
式中:xt,i表示第i(i∈N,0
定義如下集合:
(2)
則向量S為集合Rn中的可數(shù)子集。Rn為
向量S即為所構(gòu)造的用于時(shí)段劃分的數(shù)據(jù)樣本集合,該集合包含了全周期內(nèi)各個(gè)時(shí)點(diǎn)t上所有日的負(fù)荷數(shù)據(jù)。
但是,上面定義的樣本集S并不能直接用于時(shí)段劃分的計(jì)算,其原因是集合中沒有表示元素之間“遠(yuǎn)近”的概念,因此無法進(jìn)行分類,需要做如下處理:
不影響最終分析結(jié)果,在集合Rn中定義如下歐式距離,從而Rn構(gòu)成n維實(shí)歐式空間:
(3)
式中:d(x,y)∈R表示空間Rn中任意兩點(diǎn)x,y之間的歐式距離。因S為Rn的子集,因此,S中任意兩個(gè)元素(樣本)之間的距離可表示為
(4)
式中:t1,t2=1,2,…,24。
定義距離概念之后,就可以根據(jù)距離的大小來判斷空間Rn中任意兩點(diǎn)的“遠(yuǎn)近”程度。顯然,這種“遠(yuǎn)近”的概念同樣適用于S中的元素。
以上方法所構(gòu)造的數(shù)據(jù)樣本集S具有以下兩項(xiàng)優(yōu)點(diǎn):
① S中包含了全周期各時(shí)點(diǎn)上所有負(fù)荷數(shù)據(jù),從而在S上進(jìn)行合理的聚類分析,可得到適用于全周期的峰、平、谷時(shí)段劃分結(jié)果;
② S中的元素,即樣本點(diǎn)是以n維向量的形式給出的,這種將數(shù)據(jù)高維化的構(gòu)造方式避免了算法迭代次數(shù)因全周期天數(shù)增加而成倍增長(zhǎng)的不足,可適用于較長(zhǎng)時(shí)間跨度(數(shù)年)全周期上峰、平、谷時(shí)段的劃分。
本文依據(jù)所建樣本集S中的數(shù)據(jù)(樣本點(diǎn))具有高維度、數(shù)值型、無標(biāo)記等特點(diǎn),選取K-均值算法(以下用K-means表示)作為分析工具,對(duì)樣本集S進(jìn)行峰、平、谷時(shí)段劃分。
K-means是最常用的聚類算法之一,能有效地處理規(guī)模較大和高維的數(shù)據(jù)集合,能對(duì)大型數(shù)據(jù)集進(jìn)行高效分類。該算法按照定義的劃分標(biāo)準(zhǔn),把數(shù)據(jù)分成幾組,使得同組內(nèi)數(shù)據(jù)相對(duì)聚攏,相異組之間數(shù)據(jù)相對(duì)疏散,按這樣的方法所形成的每一組就稱作一個(gè)聚類(或聚簇)。在K-means中,劃分準(zhǔn)則常常采用誤差平方和準(zhǔn)則函數(shù)來描述。此算法是通過迭代尋找K個(gè)聚類的一種劃分方案,使得用這K個(gè)均值來代表相應(yīng)各類樣本時(shí)所得到的總體誤差最小。
對(duì)于不同的聚類方案,誤差平方和準(zhǔn)則函數(shù)值J一般是不相同的。使J值最小的聚類方案即為在誤差平方和準(zhǔn)則下的最優(yōu)聚類結(jié)果。
誤差平方和J無法用解析的方法最小化,只能采用迭代的方法,通過不斷的調(diào)整樣本的類歸屬情況來獲得最優(yōu)解。
K-means的效率較高,其缺點(diǎn)是只能處理數(shù)值型數(shù)據(jù)。然而,峰谷時(shí)段劃分問題實(shí)質(zhì)上就是根據(jù)各時(shí)點(diǎn)上負(fù)荷數(shù)值的大小進(jìn)行聚類劃分,因此,該問題正好屬于該算法的適用范疇。
運(yùn)用K-means進(jìn)行峰谷時(shí)段劃分的原理及基本步驟如下:
如上節(jié)所述,所構(gòu)造的數(shù)據(jù)樣本集S中每一個(gè)樣本點(diǎn)xt即為一個(gè)n維向量(n為所選全周期中的總天數(shù)),S的樣本容量為24(即24個(gè)時(shí)點(diǎn)),需要將這24個(gè)樣本點(diǎn)重新劃分為峰時(shí)段、平時(shí)段、谷時(shí)段3類。因此,該算法運(yùn)用到本文所構(gòu)建的樣本集S上進(jìn)行峰、平、谷時(shí)段劃分的問題即可描述為:令K=3,即將24個(gè)樣本點(diǎn)(數(shù)據(jù)對(duì)象)劃分為3個(gè)聚類以便使得所獲得的聚類結(jié)果滿足同一聚類中的對(duì)象相似度較高,而不同聚類中的對(duì)象相似度較小。聚類相似度是利用各聚類中所有樣本點(diǎn)的均值所獲得一個(gè)“聚類中心”來進(jìn)行計(jì)算的。
第一步:在樣本集S中隨機(jī)選K=3個(gè)初始聚類中心X1,(1),X2,(1),X3,(1),其中括號(hào)內(nèi)的序號(hào)為尋找聚類中心的迭代運(yùn)算次序號(hào)。聚類中心的向量值可任意設(shè)定,例如可選開頭的3個(gè)模式樣本集中的向量值作為初始聚類中心。
第二步:逐個(gè)將S中的樣本點(diǎn)xt按最小歐式距離準(zhǔn)則分配給3個(gè)初始聚類中心中的某一個(gè)Xj,(1)(j=1,2,3)。對(duì)所有的xt,如果在第k次迭代中,xt到Xj,(k)的歐式距離比到其他任何中心點(diǎn)都近,則xt∈Sj,(k)。其中,Sj,(k)表示經(jīng)第k次迭代后所形成的第j(j=1,2,3)個(gè)聚類。其聚類中心為Xj,(k)。
第三步:在每一次形成新的聚類結(jié)果S1,(k)、S2,(k)、S3,(k)后,進(jìn)一步按類內(nèi)均值線性變換的方法計(jì)算各個(gè)聚類中心的新的向量值Xj,(k+1),類內(nèi)均值線性變換的具體公式為
(5)
式中:lj,(k)為Sj,(k)中所包含的樣本點(diǎn)個(gè)數(shù)。并在新的聚類中心基礎(chǔ)上,重新按照最小歐式距離準(zhǔn)則形成新的聚類結(jié)果S1,(k+1)、S2,(k+1)、S3,(k+1),即完成第k+1次迭代。
第四步:在每一次迭代完成后以均值向量作為新的聚類中心,可構(gòu)造如下誤差平方和準(zhǔn)則函數(shù):
(6)
迭代的目的是為了使J值達(dá)到極小,當(dāng)?shù)趉+1次迭代后的J(k+1)值與第k次迭代后的J(k)值相等,則迭代停止,輸出的S1,(k+1)、S2,(k+1)、S3,(k+1)即為使得同一聚類中的對(duì)象相似度最高,而不同聚類中的對(duì)象相似度最小的最優(yōu)聚類結(jié)果,各類按所含元素負(fù)荷值大小區(qū)分為對(duì)應(yīng)的峰時(shí)段聚類、平時(shí)段聚類以及谷時(shí)段聚類。否則,應(yīng)返回第二步開始新一輪的迭代計(jì)算。
以某地區(qū)負(fù)荷數(shù)據(jù)為例,利用以上所構(gòu)建的模型,對(duì)該區(qū)峰谷時(shí)段劃分進(jìn)行實(shí)例分析。
首先,為了驗(yàn)證所構(gòu)建模型的合理性與可行性,在全年數(shù)據(jù)中選擇日期相隔較遠(yuǎn)的兩天數(shù)據(jù),各自單獨(dú)進(jìn)行仿真分析。圖1、圖2分別是該區(qū)2013年7月1日和9月1日基于K-means單日時(shí)段劃分模型的仿真結(jié)果,分析方法可做如下簡(jiǎn)要介紹:
圖1 7月1日峰谷時(shí)段劃分仿真圖像
圖2 9月1日峰谷時(shí)段劃分仿真圖像
以對(duì)7月1日各時(shí)點(diǎn)(24個(gè)時(shí)點(diǎn))負(fù)荷數(shù)據(jù)進(jìn)行峰、平、谷時(shí)段劃分為例。第一步,將該日數(shù)據(jù)構(gòu)造成維度為1(1d),樣本點(diǎn)數(shù)量為24個(gè)(24個(gè)時(shí)點(diǎn),每個(gè)樣本點(diǎn)均按所在時(shí)點(diǎn)進(jìn)行編號(hào))的數(shù)據(jù)樣本集S;第二步,在數(shù)據(jù)樣本集上運(yùn)用第3節(jié)中所構(gòu)建的K-均值數(shù)據(jù)挖掘模型進(jìn)行聚類迭代運(yùn)算(將K值設(shè)為3),并最終將S中所包含的所有樣本點(diǎn)劃分為S峰、S平、S谷3個(gè)聚類,其中,相對(duì)應(yīng),S峰類中所包含的各樣本點(diǎn)的時(shí)點(diǎn)編號(hào)組成峰時(shí)段,S平類中所包含的各樣本點(diǎn)的時(shí)點(diǎn)編號(hào)組成平時(shí)段,S谷類中所包含的各樣本點(diǎn)的時(shí)點(diǎn)編號(hào)組成谷時(shí)段。
從對(duì)以上2日各自的分析結(jié)果中可以看出,7月1日時(shí)段劃分結(jié)果(圖中階梯線表征,其中最低梯級(jí)線表示谷時(shí)段的位置與長(zhǎng)度,中間梯級(jí)表示平時(shí)段的位置與長(zhǎng)度,最高梯級(jí)表示峰時(shí)段的位置與長(zhǎng)度)明顯與9月1日存在差異(主要差異體現(xiàn)在下午14-15點(diǎn)的劃分類別不同),這主要是由于這兩日各自具體的負(fù)荷曲線形狀不同所引起的。
類似地,若希望將一個(gè)日峰、平、谷時(shí)段劃分結(jié)果夠推廣到至少1a的時(shí)間周期內(nèi)長(zhǎng)期使用,則得到這個(gè)劃分結(jié)果的過程中必須同時(shí)考慮到在1a的時(shí)間周期內(nèi),各日整點(diǎn)負(fù)荷數(shù)值的大小分布情況,這顯然不是簡(jiǎn)單進(jìn)行某個(gè)單日數(shù)據(jù)的分析所能得到的。上述仿真分析驗(yàn)證了本文第2節(jié)一開始便提出的結(jié)論:為了使最終的時(shí)段劃分結(jié)果適用于一個(gè)較長(zhǎng)的時(shí)間周期,僅使用某天的各時(shí)點(diǎn)負(fù)荷數(shù)據(jù)構(gòu)造數(shù)據(jù)樣本集合顯然是不合理的。
其次,為了解決上述問題,得到一組可以在1a的時(shí)間周期內(nèi)推廣的日峰、平、谷時(shí)段劃分結(jié)果,本文以該地區(qū)2013年全年的負(fù)荷數(shù)據(jù)進(jìn)行仿真,如圖3是全年峰谷時(shí)段劃分的仿真圖像。分析方法可做如下簡(jiǎn)要介紹:
第一步,將全年整點(diǎn)負(fù)荷數(shù)據(jù)構(gòu)造成維度為365(365d),樣本點(diǎn)數(shù)量為24個(gè)(24個(gè)時(shí)點(diǎn),每個(gè)樣本點(diǎn)均按所在時(shí)點(diǎn)進(jìn)行編號(hào))的數(shù)據(jù)樣本集S;第二步,在數(shù)據(jù)樣本集上運(yùn)用第3節(jié)中所構(gòu)建的K-均值數(shù)據(jù)挖掘模型進(jìn)行聚類迭代運(yùn)算(將K值設(shè)為3),并最終將S中所包含的所有樣本點(diǎn)劃分為S峰、S平、S谷3個(gè)聚類,其中,相對(duì)應(yīng),S峰類中所包含的各樣本點(diǎn)的時(shí)點(diǎn)編號(hào)組成峰時(shí)段,S平類中所包含的各樣本點(diǎn)的時(shí)點(diǎn)編號(hào)組成平時(shí)段,S谷類中所包含的各樣本點(diǎn)的時(shí)點(diǎn)編號(hào)組成谷時(shí)段。
圖3中,階梯線依然表征峰、平、谷各時(shí)段的位置及長(zhǎng)度,曲線簇代表該地區(qū)2013年全年各日(365d)按整點(diǎn)數(shù)據(jù)所繪制的負(fù)荷曲線。本文模型所得出的峰谷時(shí)段劃分結(jié)果如下:
峰時(shí)段:10:00—14:00,15:00—21:00;平時(shí)段:8:00—10:00,14:00—15:00,21:00—23:00;谷時(shí)段:0:00—8:00。
圖3 全年峰谷時(shí)段劃分仿真圖像
該區(qū)2013年的時(shí)段劃分情況如下:
峰時(shí)段:8:00—11:00,16:00—21:00;平時(shí)段:6:00—8:00,11:00—16:00,21:00—22:00;谷時(shí)段:22:00—6:00。
將以上兩種時(shí)段的劃分結(jié)果進(jìn)行對(duì)比分析可知:峰谷時(shí)段的劃分是以“三平兩峰一谷”的形式存在,仿真結(jié)果比實(shí)際的時(shí)段劃分更加合理。可舉例說明:從圖3中全年各日負(fù)荷曲線分布上可以看出(圖中曲線簇),在中午12時(shí)左右的負(fù)荷水平基本處于全天的最高峰(不符合這一規(guī)律的日負(fù)荷曲線在該地區(qū)2013年全年中未找到),即便從直觀上分析,亦理應(yīng)將該時(shí)點(diǎn)劃分于全天的峰時(shí)段才更合適。
最后,通過算例仿真結(jié)果可知,本文所建模型的輸出結(jié)果(即峰、平、谷時(shí)段劃分結(jié)果),既可在一個(gè)較長(zhǎng)的時(shí)間周期內(nèi)適用,同時(shí)又客觀地反映出所分各時(shí)段之間的負(fù)荷差異,其合理性與可行性在一定程度上得到了驗(yàn)證。
本文通過研究可得以下結(jié)論:
① 通過數(shù)據(jù)高維化處理所構(gòu)造的峰谷時(shí)段劃分?jǐn)?shù)據(jù)樣本集S具有以下兩項(xiàng)優(yōu)點(diǎn):
a.其包含了一個(gè)較長(zhǎng)時(shí)間周期(如1a)內(nèi)24個(gè)時(shí)點(diǎn)上的所有負(fù)荷信息,從而為得到長(zhǎng)期適用的峰谷時(shí)段劃分結(jié)果提供了完整的數(shù)據(jù)依據(jù)。
b.樣本集S將全周期中相同時(shí)點(diǎn)上浩繁的負(fù)荷數(shù)據(jù)整合為同一向量(樣本點(diǎn))上不同的坐標(biāo)分量,這樣一來大大簡(jiǎn)化了樣本容量(無論所研究周期有多長(zhǎng),S的樣本容量總是為24個(gè)樣本點(diǎn)),從而降低了模型的迭代次數(shù)并保證了其一致收斂性。
② 引入K-means進(jìn)行建模克服了處理高維度、數(shù)值型樣本聚類問題難以收斂的困難,并且算法的迭代過程本身就是一個(gè)時(shí)段劃分的優(yōu)化過程,上述兩點(diǎn)可保證得到同一聚類中的對(duì)象相似度最高,而不同聚類中的對(duì)象相似度最小的峰、平、谷時(shí)段劃分優(yōu)化結(jié)果。
③ 通過算例仿真,除了驗(yàn)證模型的合理性以及得到針對(duì)某地區(qū)全年負(fù)荷數(shù)據(jù)的最優(yōu)時(shí)段劃分結(jié)果外,還可以看出,針對(duì)某一日負(fù)荷數(shù)據(jù)得到的時(shí)段劃分結(jié)果與針對(duì)全年數(shù)據(jù)得到的時(shí)段劃分結(jié)果不同,這一點(diǎn)從實(shí)驗(yàn)的角度驗(yàn)證了本文所提出的觀點(diǎn):為了使峰谷時(shí)段劃分結(jié)果能夠客觀反映出各時(shí)段的負(fù)荷差異,且能夠在一個(gè)較長(zhǎng)的時(shí)間周期(例如月、季、半年、年等)內(nèi)適用,因此在高維數(shù)據(jù)樣本集的基礎(chǔ)上引入K-means來構(gòu)建適用于一定周期內(nèi)的時(shí)段劃分模型。
[1]連振洲,溫步瀛,江岳文.基于負(fù)荷曲線分布特征的峰谷時(shí)段劃分和修正策略研究[J].電網(wǎng)與清潔能源,2014(7):15-19.
[2]丁寧.基于DSM的峰谷時(shí)段劃分及分時(shí)電價(jià)的研究[D].南京:南京理工大學(xué),2002.
[3]喬慧婷.基于密度聚類的峰谷時(shí)段劃分方法研究[D].北京:華北電力大學(xué),2011.
[4]劉菁菁.基于因素分析法的峰谷時(shí)段劃分的研究[D].天津:河北工業(yè)大學(xué),2006.
[5]林旻,朱艷卉,胡百林.基于供電成本的峰谷時(shí)段劃分及分時(shí)電價(jià)研究[J].華東電力,2005(12):90-91.
[6]趙娟,譚忠富,李強(qiáng).我國峰谷分時(shí)電價(jià)的狀況分析[J].現(xiàn)代電力,2005,22(2):82-85.
[7]戴詩容,雷霞,程道衛(wèi)等.電動(dòng)汽車峰谷分時(shí)充放電電價(jià)研究[J].電網(wǎng)與清潔能源,2013,29(7):77-82.
[8]翟娜娜.基于用戶需求響應(yīng)的峰谷時(shí)段劃分研究[D].北京:華北電力大學(xué),2011.
[9]李泓澤,李婷婷.峰谷分時(shí)電價(jià)對(duì)供需雙方的影響分析[J].現(xiàn)代電力,2008(4):87-92.
[10]劉嚴(yán),譚忠富,乞建勛.峰谷分時(shí)電價(jià)設(shè)計(jì)的優(yōu)化模型[J].中國管理科學(xué),2005,13(5):87-92.
[11]周東華.數(shù)據(jù)挖掘中聚類分析的研究與應(yīng)用[D].天津:天津大學(xué),2006.
(責(zé)任編輯:林海文)
Research on the Partition Model of Long Period Peak and Valley Time Based on High Dimensional Data Clustering
LI Na1,WANG Lei1,ZHANG Wenyue2,WANG Yuwei3,SHU Yan3,ZHANG Chao3
(1.State Grid Tianjin Economic Research Institute,Tianjin 300171,China;2.State Grid Tianjin Electric Power Company, Tianjin 300010,China;3.North China Electric Power University,Beijing 102206,China)
為了使峰谷時(shí)段劃分結(jié)果客觀反映出各時(shí)段的負(fù)荷差異,且能夠在一個(gè)較長(zhǎng)的時(shí)間周期(例如1a)內(nèi)適用,本文提出一種以數(shù)據(jù)樣本集高維化處理和K-均值聚類分析相結(jié)合的時(shí)段劃分模型。首先,通過數(shù)據(jù)高維化的處理方法構(gòu)建涵蓋較長(zhǎng)時(shí)間周期(例如1a)內(nèi)所有負(fù)荷信息的數(shù)據(jù)樣本集;其次,以K-均值算法為聚類分析工具,在高維數(shù)據(jù)樣本集上構(gòu)建峰谷時(shí)段劃分模型。最后,結(jié)合某區(qū)全年負(fù)荷數(shù)據(jù),對(duì)所構(gòu)建的模型進(jìn)行算例仿真,在驗(yàn)證模型的合理性基礎(chǔ)上,最終輸出時(shí)段劃分結(jié)果。
時(shí)段劃分;聚類分析;K-均值算法;數(shù)據(jù)高維化
In this paper,in order to make the results of peak and valley time division reflect the load difference of each period objectively and be applicable in a long period of time (e.g.,1 year),a time division model is presented by combining processing of high-dimension data sampling set and K-means clustering analysis.First of all,a data sample set covering all load information within a long period of time (e.g.,1 year) is built by using the processing method of high-dimension data.Secondly,the peak and valley time division model based on the high-dimension data sample set is built by using K- means clustering analysis.Finally,the numerical simulation of proposed model is carried out by combining the load data of the whole year in certain district,and the final division result of the peak and valley time can be output on the basis of verifying the rationality of the model.
peak-valley-time division; clustering analysis; K-means clustering algorithm; high-dimensional data
1007-2322(2016)04-0067-05
A
TM715
國網(wǎng)天津市電力公司科技項(xiàng)目(KJ15-1-28)
2015-08-26
李娜(1985—),女,博士,工程師,研究方向?yàn)殡娏κ袌?chǎng)理論與應(yīng)用技術(shù)研究,E-mail:linajiamie@163.com;
王磊(1981—),女,博士,工程師,研究方向?yàn)殡娏κ袌?chǎng)理論與應(yīng)用技術(shù)研究,E-mail:leiwendy@126.com;
張文月(1982—),女,工程師,研究方向?yàn)殡娏κ袌?chǎng)理論與應(yīng)用技術(shù)研究,E-mail:zhangwenyue2005@126.com。