張正文,李 津,孫樹娟
(國(guó)網(wǎng)雄安新區(qū)供電公司,河北 保定 071600)
隨著云服務(wù)在互聯(lián)網(wǎng)上日益占據(jù)主導(dǎo)地位,以及基于云服務(wù)的物聯(lián)網(wǎng)的出現(xiàn)[1-4]。預(yù)計(jì)到2021年,云數(shù)據(jù)中心流量將占數(shù)據(jù)中心總流量的95%[5]。隨著萬(wàn)物物聯(lián)理念的提出,電網(wǎng)作為傳統(tǒng)行業(yè),也在積極的對(duì)自身進(jìn)行升級(jí)和改革[6-7]。為了解決海量數(shù)據(jù)處理造成的流量大、時(shí)間長(zhǎng)等問題[8-9],在此智能電網(wǎng)引入了多站融合的概念,通過將分布密集的變電站建設(shè)運(yùn)營(yíng)成為數(shù)據(jù)中心等,從而解決該問題。但一個(gè)數(shù)據(jù)中心擁有數(shù)千臺(tái)服務(wù)器、存儲(chǔ)設(shè)備、冷卻設(shè)施和電力變壓器,數(shù)據(jù)中心部門估計(jì)占全球電力消耗的1.4%。如果直接將變電站轉(zhuǎn)化為數(shù)據(jù)中心,而不是考慮給其分配有限能量,這可能導(dǎo)致發(fā)電站超載,對(duì)電網(wǎng)造成嚴(yán)重破壞,同時(shí),還可能剝奪更需要電力的其他數(shù)據(jù)中心的能量。為了克服這一問題,提出了一種針對(duì)數(shù)據(jù)中心用電量的博弈論方案(G-Power),其中每個(gè)數(shù)據(jù)中心由博弈中的一個(gè)參與者表示。該方案的基本思想是根據(jù)數(shù)據(jù)中心的收費(fèi)優(yōu)先級(jí)、關(guān)鍵運(yùn)行應(yīng)用程序的優(yōu)先級(jí)和其他數(shù)據(jù)中心的優(yōu)先級(jí)3個(gè)指標(biāo)為每個(gè)數(shù)據(jù)中心分配最優(yōu)的功率,以達(dá)到公平的功率分配。
在提出的系統(tǒng)中,智能電網(wǎng)控制器(公用事業(yè)公司)負(fù)責(zé)供電,響應(yīng)用戶的用電需求。電力來自與云數(shù)據(jù)中心通信的多個(gè)發(fā)電站(雙向通信)。因此,智能電網(wǎng)控制器可以查看每個(gè)數(shù)據(jù)中心的電源行為。智能電網(wǎng)和云數(shù)據(jù)中心的系統(tǒng)架構(gòu)如圖1所示。
在提出的系統(tǒng)中,數(shù)據(jù)中心的目標(biāo)是購(gòu)買最大功率,以便為其存儲(chǔ)的能量充電并處理最大的應(yīng)用程序。這將提高云提供商的利潤(rùn)。此外,每個(gè)數(shù)據(jù)中心都試圖增加其充電狀態(tài)并以自私的方式要求電力,而不考慮計(jì)劃用于數(shù)據(jù)中心的有限能源。這可能使發(fā)電站過載,并對(duì)電網(wǎng)造成嚴(yán)重?fù)p害。
在這里介紹了G-Power的原理,首先用非合作博弈理論對(duì)數(shù)據(jù)中心的功率分配進(jìn)行了建模。因此,考慮對(duì)策:G=(I,Si,gaini)i∈T,其中I表示一組玩家(數(shù)據(jù)中心),d1,d2,…,dn,其中n是參與博弈的數(shù)據(jù)中心的數(shù)量。
在提出的方案中,設(shè)計(jì)了回報(bào)函數(shù)來反映4個(gè)主要函數(shù):第1個(gè)函數(shù)計(jì)算數(shù)據(jù)中心對(duì)具有高功率的需求(效用函數(shù));其余3個(gè)函數(shù)是優(yōu)先級(jí)成本函數(shù),分別計(jì)算數(shù)據(jù)中心收費(fèi)優(yōu)先級(jí)的成本、關(guān)鍵應(yīng)用程序優(yōu)先級(jí)的成本以及總關(guān)鍵應(yīng)用程序優(yōu)先級(jí)的成本。支付函數(shù)包括以下4個(gè)函數(shù)。
(1) 效用函數(shù)。在G-Power中,效用函數(shù)被建模為,當(dāng)每個(gè)參與者增加其電力需求值時(shí),會(huì)獲得更多的利潤(rùn)。在網(wǎng)絡(luò)研究中常用的效用函數(shù)[16],選擇使用對(duì)數(shù)函數(shù)來設(shè)計(jì)G-Power的效用函數(shù)。因此,選擇一個(gè)效用函數(shù):
γi(xi)=log(xi+1),?i∈I
(1)
式中,xi為玩家di需求的電量。
(2)數(shù)據(jù)中心的費(fèi)用函數(shù)優(yōu)先權(quán)。該函數(shù)定義了玩家根據(jù)其電量需求xi和其收費(fèi)優(yōu)先級(jí)Dvi支付的懲罰。在提出的方法中,優(yōu)先級(jí)是根據(jù)活躍服務(wù)器ASi和玩家di的荷電狀態(tài)SoCi計(jì)算的,具體公式見式(2):
(2)
因此,有以下函數(shù):
ρi(xi,Dpi)=xi×Dpi
(3)
(3)關(guān)鍵應(yīng)用程序優(yōu)先級(jí)的成本函數(shù)。在這個(gè)優(yōu)先級(jí)成本函數(shù)中,考慮了一個(gè)玩家di的關(guān)鍵運(yùn)行應(yīng)用程序。在G-Power中,將實(shí)時(shí)應(yīng)用程序視為關(guān)鍵應(yīng)用程序。該功能基于玩家的電量需求xi及其關(guān)鍵應(yīng)用優(yōu)先Api。將優(yōu)先級(jí)Api計(jì)算為關(guān)鍵應(yīng)用程序記錄Critical_appsi占總應(yīng)用程序記錄Total_appsi的比率。因此,定義函數(shù)如下:
σi(xi,Ani)=xi×Ani
(4)
(5)
(4)總關(guān)鍵應(yīng)用優(yōu)先級(jí)的成本函數(shù)。該優(yōu)先級(jí)成本函數(shù)基于玩家功率量需求xi及其總關(guān)鍵應(yīng)用優(yōu)先級(jí)TPi。優(yōu)先級(jí)TPi是玩家關(guān)鍵應(yīng)用與所有玩家關(guān)鍵應(yīng)用之和的比率。因此,有以下成本函數(shù):
τi(xi,Tpi)=xi×Tpi
(6)
(7)
在定義了玩家di的4個(gè)函數(shù)之后,可以得出支付函數(shù):
gaini(xi,x-i)=αiγi(xi)+βiρi(xi,Dpi)+ωiσi(xi,Api)+ψiτi(xi,Tpi)
(8)
其中,x-i={xk}(k∈i)且是除玩家di外的所有玩家的電力需求量(策略)向量。s=(xi,x-i)是策略配置文件。αi,βi,ωi和ψi分別是γi,ρi,σi和τi的玩家偏好系數(shù)。這些參數(shù)的設(shè)置是為了滿足系統(tǒng)的目標(biāo)和要求,例如,當(dāng)ωi值越大,獲得具有高關(guān)鍵應(yīng)用率的玩家和那些具有低關(guān)鍵應(yīng)用比率的玩家的功率之間的差異就越大,反之亦然。
在博弈論中,納什均衡(NE)是一個(gè)基本概念,常用于預(yù)測(cè)所有參與者的未來行為和確定永久狀態(tài)。這意味著博弈中的每個(gè)玩家都沒有興趣改變自己的策略,并執(zhí)行相同的操作。因此,如果存在一個(gè)NE,則非合作博弈有一個(gè)解。在G-Power的對(duì)策G=(I,Si,gaini)i=T中,如果沒有一個(gè)玩家能夠通過改變策略來增加其收益,那么一組策略代表一個(gè)NE。
(9)
綜上所述,在計(jì)算G的對(duì)策解之前,證明了NE的存在性和唯一性。
當(dāng)時(shí),每個(gè)參與者的策略集是閉有界的。那么,集合Si,?i∈I是緊的。
考慮2點(diǎn)y1,y2∈Si和ε=[0,1]。因此,得到
通過計(jì)算s={xi},?i∈I的增益的Hessian矩陣,可以證明的支付函數(shù)的凹性如下:
(10)
(11)
因此,可以看到H(S)對(duì)于所有策略s∈S是負(fù)定的,因此,gainxi,x-i)在Si,?i∈I中是嚴(yán)格凹的。 根據(jù)Nikaido-Isoda定理[10],G-Power的博弈G至少具有一個(gè)NE。
(2)納什均衡的唯一性。設(shè)u=(u1,u2,…,un)是正參數(shù)的隨機(jī)向量,使用Rosen定理[11]來得到支付函數(shù)的加權(quán)正和,其定義如下:
(12)
這里δ(xi,x-i;u)偽梯度給出的:
(13)
并且
(14)
另外,g的Jacobian矩陣J(xi,x-i;u)可以定義如式(15)所示。
(15)
式中,Bij=uiDij,?i,j∈I。
由此可見,對(duì)于所有對(duì)稱矩陣是負(fù)定的。因此,函數(shù)是根據(jù)Rosen定理(18)對(duì)角線嚴(yán)格凹的。因此,博弈G在其純策略空間中具有唯一的NE,這也符合Rosen定理。
(16)
約束條件為:
為了解決問題(F),使用拉格朗日乘子法使G-Power的函數(shù)在2個(gè)不等式約束下最大化。引入了2個(gè)拉格朗日乘子λi和li,函數(shù)可定義為式(17):
(17)
因此,對(duì)于每個(gè)玩家di,G-Power的拉格朗日函數(shù)滿足以下KKT條件,如式(18)所示:
(18)
(19)
在這里條件1和條件2可以用公式(20)和(21)表示:
βiρi(xi,Dpi)+ωiσi(xi,Api)+ψiτi(xi,Tpi≥αi
(20)
(21)
圖2分別使用式(2)、式(5)和式(7)顯示了每個(gè)數(shù)據(jù)中心在1 d內(nèi)不同的成本(數(shù)據(jù)中心的費(fèi)用優(yōu)先級(jí)、關(guān)鍵應(yīng)用程序優(yōu)先級(jí)和總關(guān)鍵應(yīng)用程序優(yōu)先級(jí))。
圖2 數(shù)據(jù)中心成本變化
可以觀察到,在每個(gè)數(shù)據(jù)中心,數(shù)據(jù)中心的收費(fèi)優(yōu)先級(jí)在非高峰時(shí)段較低,而在高峰時(shí)段較高。這可以解釋為這樣一個(gè)事實(shí):數(shù)據(jù)中心沒有太多活動(dòng)服務(wù)器,在非高峰時(shí)間存儲(chǔ)能量,相反,在高峰時(shí)間,數(shù)據(jù)中心已對(duì)其能量進(jìn)行了充電并擁有大量活動(dòng)服務(wù)器。另一方面,關(guān)鍵應(yīng)用程序和總的關(guān)鍵應(yīng)用程序優(yōu)先級(jí)在非高峰時(shí)段較高,而在高峰時(shí)段較低。這意味著,與數(shù)據(jù)中心中運(yùn)行的應(yīng)用程序總數(shù)相比,在高峰時(shí)段運(yùn)行的關(guān)鍵應(yīng)用程序要比在非高峰時(shí)段運(yùn)行的應(yīng)用程序多得多。
圖3描述了使用基于博弈的功率分配方案在一個(gè)特定小時(shí)內(nèi)(0:00)4個(gè)數(shù)據(jù)中心的功率分配??梢钥吹剑珿-Power方案根據(jù)每個(gè)數(shù)據(jù)中心的優(yōu)先級(jí)成本進(jìn)行了公平的分配。
圖3 基于博弈的電量分配
與自私方案的性能比較如圖4所示。
圖4 與自私方案的性能比較
圖4(a)顯示了隨機(jī)選擇的一個(gè)數(shù)據(jù)中心,G-Power與自私方案的功率分配比較??梢杂^察到自私方案總是以所需的總功率供應(yīng),而不管數(shù)據(jù)中心有什么關(guān)鍵應(yīng)用或能量消耗。這可能會(huì)使電網(wǎng)過載并使發(fā)電站超載。另一方面,在G-Power中分配的能量隨著時(shí)間的推移而變化,可能會(huì)減少到1.27 MW。這通常發(fā)生在非高峰時(shí)段(例如圖4(a)中的3:00),此時(shí)數(shù)據(jù)中心正在充電,并且沒有很多正在運(yùn)行的應(yīng)用程序。此外,它可能會(huì)達(dá)到最大值5 MW,如上午11:00和19:00。所呈現(xiàn)的結(jié)果是由于提出的方案中使用的博弈論,該方案考慮到:①每個(gè)數(shù)據(jù)中心的活動(dòng)服務(wù)器和充電狀態(tài);②在數(shù)據(jù)中心運(yùn)行的關(guān)鍵應(yīng)用程序;③在所有數(shù)據(jù)中心運(yùn)行的關(guān)鍵應(yīng)用程序,如圖4(b)、圖4(c)和圖4(d)所示。在圖4(b)中顯示了根據(jù)數(shù)據(jù)中心在活動(dòng)服務(wù)器和充電狀態(tài)方面的收費(fèi)優(yōu)先級(jí)的功率分配值??梢钥吹?,在G-Power中,分配的電力隨著優(yōu)先級(jí)的降低而減少。然而,自私方式方案在不考慮任何優(yōu)先級(jí)的情況下,總是具有穩(wěn)定的功率分配。此外,圖4(c)和圖4(d)還表明,關(guān)鍵應(yīng)用程序優(yōu)先級(jí)和總關(guān)鍵應(yīng)用程序優(yōu)先級(jí)分別與功率分配成反比關(guān)系。當(dāng)一個(gè)玩家的關(guān)鍵應(yīng)用程序增加時(shí),它的能力就會(huì)增強(qiáng),反之亦然。
本文研究了智能電網(wǎng)與云數(shù)據(jù)中心之間的交互作用,以獲得公平的功率分配。將數(shù)據(jù)中心的功率分配建模為一個(gè)非合作博弈。證明了納什均衡的存在性和唯一性。然后計(jì)算分配給每個(gè)玩家的最佳功率。仿真結(jié)果表明,與其他方案相比,該方法能顯著降低電網(wǎng)負(fù)荷。