盧彪 李悅 張萬(wàn)禮
(宿州學(xué)院信息工程學(xué)院 安徽宿州 234000)
基于云計(jì)算系統(tǒng)使用率的能耗模型的研究與設(shè)計(jì)
盧彪李悅張萬(wàn)禮
(宿州學(xué)院信息工程學(xué)院安徽宿州234000)
文章針對(duì)云計(jì)算系統(tǒng)的CPU使用率、內(nèi)存使用率和存儲(chǔ)使用率三個(gè)能耗模型的分析,結(jié)合非線性回歸分析方法:拉索回歸分析、拉索變量多元回歸分析和方差齊性回歸分析數(shù)學(xué)方法,設(shè)計(jì)了基于云計(jì)算平臺(tái)的系統(tǒng)使用率的能耗模型。通過(guò)實(shí)驗(yàn)環(huán)境搭建和模型測(cè)試,基于系統(tǒng)使用率的能耗模型的誤差率和實(shí)際監(jiān)測(cè)結(jié)果相差較小達(dá)到了94%左右。結(jié)論是基于系統(tǒng)使用率的能耗模型能夠滿足能耗優(yōu)化的具體需求。
云計(jì)算;能耗模型;系統(tǒng)使用率;拉索回歸
云計(jì)算平臺(tái)中心需要使用一定技術(shù)手段針對(duì)云計(jì)算中心能耗過(guò)大問(wèn)題來(lái)采取相應(yīng)的節(jié)能措施,從而達(dá)到優(yōu)化云平臺(tái)持續(xù)存儲(chǔ)過(guò)程中的能耗問(wèn)題[1]。能耗模型的建立是云計(jì)算系統(tǒng)的能耗優(yōu)化的關(guān)鍵之一,精確高效的能耗模型能夠?yàn)樵朴?jì)算系統(tǒng)的資源調(diào)度和能耗優(yōu)化提供重要的技術(shù)支撐[2]。本文針對(duì)云計(jì)算系統(tǒng)的CPU使用率、內(nèi)存使用率和存儲(chǔ)使用率三個(gè)能耗模型的分析和結(jié)合非線性回歸分析方法,設(shè)計(jì)了基于系統(tǒng)使用率的能耗模型。最后,通過(guò)實(shí)驗(yàn)環(huán)境搭建和模型測(cè)試,得出了該能耗模型的誤差率和實(shí)際監(jiān)測(cè)結(jié)果相差較小,能夠滿足能耗優(yōu)化的具體需求。
(一)能耗模型建立的原則。設(shè)計(jì)一個(gè)準(zhǔn)確高效的云平臺(tái)能耗模型能夠?yàn)樵拼鎯?chǔ)資源調(diào)度、能耗優(yōu)化提供重要的技術(shù)支撐,能耗模型設(shè)計(jì)原則主要包括[3]:(1)能耗模型采樣數(shù)據(jù)應(yīng)該是整個(gè)云系統(tǒng)的能耗情況統(tǒng)計(jì);(2)能耗模型精確度決定了模型實(shí)際使用效果,所以能耗優(yōu)化算法必須設(shè)計(jì)合理;(3)能耗模型具備實(shí)時(shí)預(yù)測(cè)功能;(4)能耗模型具備通用性;(5)數(shù)學(xué)模型具備伸縮性,能支持實(shí)時(shí)變化。(6)數(shù)學(xué)模型在設(shè)計(jì)的過(guò)程中在不影響能耗整體效果情況下盡量不要過(guò)度復(fù)雜化。
(二)能耗模型設(shè)計(jì)流程。能耗模型的設(shè)計(jì)流程主要包括3個(gè)步驟[4]:(1)數(shù)據(jù)采樣:在云平臺(tái)正常工作的情況下收集云存儲(chǔ)系統(tǒng)的能耗情況和分析影響能耗數(shù)據(jù)因子,這里我們主要是通過(guò)對(duì)云平臺(tái)的系統(tǒng)使用率來(lái)進(jìn)行數(shù)學(xué)分析建模包括了CPU、內(nèi)存和硬盤的使用情況參數(shù);(2)模型建立:根據(jù)不同的回歸方法建立能耗模型,提取預(yù)測(cè)需要的采樣參數(shù)。(3)預(yù)測(cè)系統(tǒng)能耗。能耗建模的基本流程見(jiàn)圖1。
圖1 能耗建模的基本流程圖
(三)能耗采樣硬件平臺(tái)。智能電表能夠采集能耗模型服務(wù)器的電流以及電壓信息上傳至后臺(tái)數(shù)據(jù)存儲(chǔ)服務(wù)器上,能耗采樣平臺(tái)要確保智能電表和數(shù)據(jù)存儲(chǔ)服務(wù)器只能為能耗模型服務(wù)器進(jìn)行服務(wù)以確保數(shù)據(jù)采樣的可靠性[5]。通過(guò)P=UI可以得到能耗模型服務(wù)器的電能消耗情況,服務(wù)器也可以通過(guò)特定的數(shù)據(jù)采集手段來(lái)存儲(chǔ)自身硬件CPU、內(nèi)存和硬盤使用率信息。通過(guò)對(duì)電能消耗數(shù)據(jù)和系統(tǒng)使用率信息的數(shù)據(jù)采樣,能耗模型的數(shù)據(jù)來(lái)源便得到了可靠性保障。能耗采樣平臺(tái)示意圖見(jiàn)圖2。
圖2 能耗采樣平臺(tái)
能耗模型服務(wù)器B的性能參數(shù)是通過(guò)在該服務(wù)器上運(yùn)行一組操作程序Benchmark來(lái)實(shí)現(xiàn)的,Benchmark程序主要完成的功能是采集計(jì)算機(jī)硬件的性能參數(shù)。在云存儲(chǔ)平臺(tái)中的系統(tǒng)CPU、系統(tǒng)內(nèi)存和系統(tǒng)硬盤運(yùn)轉(zhuǎn)是最為耗能的且狀態(tài)可調(diào)節(jié)的硬件。我們選取這三個(gè)部件的使用率作為能耗模型基本參數(shù),并將使用率參數(shù)引入到多種回歸模型中。
云系統(tǒng)能耗模型的系統(tǒng)使用率參數(shù)來(lái)源主要包括[6]:CPU處理器使用率、內(nèi)存使用率和存儲(chǔ)使用率三個(gè)方面。系統(tǒng)使用率數(shù)據(jù)主要為能耗模型提供相應(yīng)的參數(shù),所以能耗模型的數(shù)據(jù)采樣只采集與云系統(tǒng)能耗關(guān)系最主要的部分。隨著硬件技術(shù)的演進(jìn),云平臺(tái)的能耗數(shù)據(jù)與系統(tǒng)使用率之間的關(guān)系從簡(jiǎn)單的線性關(guān)系逐漸演變成非線性關(guān)系。
(一)基于CPU使用率的能耗模型。CPU處理器使用率占據(jù)了云系統(tǒng)的主要能耗,通過(guò)對(duì)CPU使用率的調(diào)整來(lái)控制云系統(tǒng)的整體能耗是云系統(tǒng)節(jié)約能耗的主要方向之一[7]。
數(shù)學(xué)模型1的設(shè)計(jì)是利用云系統(tǒng)的CPU使用率參數(shù)來(lái)預(yù)測(cè)能耗模型,如公式(1)所示。能耗預(yù)測(cè)數(shù)學(xué)模型設(shè)計(jì)為CPU使用率的線性函數(shù),M為代表的是網(wǎng)絡(luò)硬盤能耗數(shù)據(jù),它作為常數(shù)來(lái)對(duì)待。i表示CPU處理器使用率對(duì)云系統(tǒng)能耗的經(jīng)驗(yàn)參數(shù),通過(guò)簡(jiǎn)單的線性回歸得到基于CPU處理器使用率的能耗模型如公式(1)所示:
數(shù)學(xué)模型1描述的是能耗與CPU使用率的線性相關(guān),但是線性關(guān)系模型已經(jīng)不能正確描述二者之間的關(guān)系。通過(guò)對(duì)數(shù)學(xué)模型1的改進(jìn),在數(shù)學(xué)模型2中引入影響因子j和N+CPU來(lái)調(diào)整能耗與CPU使用率之間的關(guān)系,改進(jìn)模型公式表示方法如公式(2):
(二)基于內(nèi)存使用率的能耗模型。系統(tǒng)內(nèi)存使用率是云計(jì)算系統(tǒng)的硬件能耗來(lái)源之一,內(nèi)存耗能在一定條件下可以占據(jù)云平臺(tái)總能耗的70%左右。多核CPU處理器在進(jìn)行業(yè)務(wù)處理時(shí)大量使用內(nèi)存虛擬方法造成了云存儲(chǔ)數(shù)據(jù)中心的整體能耗大幅度提高[8]。
內(nèi)存的能源消耗數(shù)據(jù)與CPU處理器的能源消耗數(shù)據(jù)之間存在著正比關(guān)系,當(dāng)CPU使用頻率增加時(shí)會(huì)導(dǎo)致內(nèi)存的能耗隨之增加。云系統(tǒng)內(nèi)存與云CPU處理器相關(guān)的線性能耗模型記為公式(3)所示。
(三)基于存儲(chǔ)使用率的能耗模型。系統(tǒng)硬盤存儲(chǔ)使用率也是云硬件系統(tǒng)的能耗來(lái)源,硬盤存儲(chǔ)耗能在一定條件下可以占據(jù)云平臺(tái)總能耗的65%左右。傳統(tǒng)存儲(chǔ)主要通過(guò)自動(dòng)調(diào)節(jié)磁陣技術(shù)來(lái)實(shí)現(xiàn)磁陣空閑不工作狀態(tài)的轉(zhuǎn)換,基于閃存的磁陣存儲(chǔ)技術(shù)也可以降低網(wǎng)絡(luò)存儲(chǔ)的能耗。由于云平臺(tái)服務(wù)器可以為多個(gè)云存儲(chǔ)磁陣進(jìn)行相關(guān)服務(wù)并且存儲(chǔ)磁陣是具備擴(kuò)展功能的,存儲(chǔ)磁陣的數(shù)量越多導(dǎo)致存儲(chǔ)消耗的能耗也就越多。在云計(jì)算存儲(chǔ)集群系統(tǒng)中,磁盤陣列的互相備份等安全保護(hù)技術(shù)也會(huì)增加云計(jì)算平臺(tái)的能源消耗[9]。
考慮到磁盤陣列在云計(jì)算系統(tǒng)能耗的工作影響程度,基于存儲(chǔ)使用率的云系統(tǒng)存儲(chǔ)與云CPU處理器相關(guān)的線性能耗模型記為公式(4)所示。
通過(guò)對(duì)云系統(tǒng)的能耗情況深度分析,CPU處理器、內(nèi)存使用率和存儲(chǔ)使用率的能耗模型能耗數(shù)據(jù)在云系統(tǒng)工作過(guò)程中存在很大的波動(dòng)情況,是能耗模型的主要參數(shù)來(lái)源。
(四)能耗模型數(shù)據(jù)回歸分析應(yīng)用。能耗數(shù)學(xué)模型的數(shù)據(jù)回歸分析技術(shù)主要研究?jī)?nèi)容是能耗變量P與CPU處理器、內(nèi)存Memory和存儲(chǔ)Disk的使用率(用x來(lái)表示)之間的非線性關(guān)系,找到能耗變量P與x之間的函數(shù)P=f(x)的具體表達(dá)式是回歸分析技術(shù)在本文中的主要目標(biāo)。f(x)稱為能耗P對(duì)使用率x的回歸函數(shù),或者稱為能耗P對(duì)使用率x的回歸[10]。
由于能耗與資源使用率之間存在非線性關(guān)系,我們通過(guò)對(duì)線性關(guān)系的研究改進(jìn)推導(dǎo)出能耗非線性目標(biāo)函數(shù)模型。通過(guò)對(duì)線性回歸的函數(shù)轉(zhuǎn)換和添加因子的處理,非線性模型的目標(biāo)函數(shù)可以用公式(5)表示:
1.變量多元拉索回歸分析模型(PWL)。變量多元拉索模型的基礎(chǔ)函數(shù)由自變量形式表示。為了防止非線性數(shù)學(xué)模型的數(shù)據(jù)采樣參數(shù)過(guò)多影響能耗模型結(jié)果,這里使用拉索回歸進(jìn)行參數(shù)選取。
2.變量多元+指數(shù)拉索回歸分析模型(PEWL)。在多形式模型的基礎(chǔ)上,f(x)還增加了指數(shù)函數(shù)ex,在這里同樣使用拉索回歸進(jìn)行資源使用率參數(shù)的選取。
3.方差齊性回歸分析模型(SVM)。方差齊性(SVM)是從多維角度來(lái)使用非線性函數(shù)進(jìn)行最優(yōu)化目標(biāo)的實(shí)現(xiàn),回歸分析與SVM的結(jié)合能到得到更優(yōu)的能耗非線性數(shù)學(xué)模型。
給定一組測(cè)試樣本集 (Mi,Ni,1≤i≤n),Mi為因變量,Ni是自變量,n是樣本數(shù)目。對(duì)于實(shí)驗(yàn)數(shù)據(jù)集為非線性的情況,通過(guò)非線性能耗目標(biāo)函數(shù)f(x)將實(shí)驗(yàn)數(shù)據(jù)到高維線性特征空間。在此情況下,能耗估計(jì)目標(biāo)函數(shù)f(x)為如公式(6)形式:
能耗模型目標(biāo)函數(shù)的最優(yōu)化條件為公式(7)所示:
在上式中引入彈性因子ξi和ξj,公式(10)最優(yōu)化條件改進(jìn)為公式(8)
在Unix系統(tǒng)中,通過(guò)局部變量clockis的值來(lái)計(jì)算出系統(tǒng)CPU使用率(用戶clockis+系統(tǒng)clockis)/總clockis。在本次試驗(yàn)中服務(wù)器使用Linux操作系統(tǒng),我們通過(guò)系統(tǒng)文件/Process/start文件來(lái)提取量clockis值計(jì)算系統(tǒng)CPU使用率。/Process/start文件中還能查看本次試驗(yàn)的CPU負(fù)載情況。
通過(guò)上述方法可以得到CPU使用率UtilizationCPU,/process/information文件里可以提取相應(yīng)的參數(shù)可以計(jì)算出系統(tǒng)內(nèi)存使用率和存儲(chǔ)使用率。當(dāng)計(jì)算出CPU、內(nèi)存和存儲(chǔ)使用率的數(shù)據(jù)之后,進(jìn)一步研究三者之間的聯(lián)系。通過(guò)收集系統(tǒng)各個(gè)時(shí)間段的300多組能耗數(shù)據(jù),能耗數(shù)據(jù)由CPU能耗、內(nèi)存能耗和存儲(chǔ)能耗三部分組成,能耗數(shù)據(jù)使用率的值如圖3所示。
圖3 內(nèi)存使用率、CPU使用率對(duì)系統(tǒng)能耗的影響
根據(jù)采樣到的CPU使用率、內(nèi)存使用率和存儲(chǔ)使用率的非線性模型拉索回歸分析、變量多元指數(shù)拉索回歸分析和方差齊性回歸(SVR)的回歸分析和數(shù)學(xué)模型特點(diǎn),我添加了針對(duì)本文的數(shù)學(xué)模型影響因子如圖4所示。
通過(guò)回歸分析技術(shù)對(duì)能耗模型的影響以及采樣數(shù)據(jù)對(duì)能耗模型的影響,我們最終設(shè)計(jì)了能耗數(shù)學(xué)模型,能耗模型的目標(biāo)函數(shù)f(U)表示方法如公式(10)所示。
圖4 能耗模型影響因子
本次實(shí)驗(yàn)云平臺(tái)的主控制芯片采用SUN公司生產(chǎn)的同構(gòu)四核處理器Athlon64,該64位處理器由2組Athlon64 X2內(nèi)置芯片和2組Athlon64X4內(nèi)置芯片組成,系統(tǒng)核心內(nèi)存值為 96G,Unix平臺(tái)的操作系統(tǒng)版本為 2.6.18-128. ELsmp,編譯環(huán)境為Cygwin。
本次試驗(yàn)判定一個(gè)能耗模型目標(biāo)函數(shù)公式(10)是否精確標(biāo)準(zhǔn)是使用相對(duì)誤差率Q誤差的值來(lái)判定,Q估計(jì)表示我們能耗模型預(yù)測(cè)得到的結(jié)果,Q電表表示用電表監(jiān)測(cè)到的實(shí)際能耗。誤差結(jié)果用公式(11)表示。
通過(guò)對(duì)比能耗目標(biāo)Q誤差值,就可以推斷各個(gè)能耗模型的誤差率。具體能耗模型誤差率的實(shí)驗(yàn)測(cè)試結(jié)果見(jiàn)圖5。
圖5 能耗模型精確度測(cè)試
從上圖中可以看出線性模型的回歸分析誤差率達(dá)到了30%,其誤差明顯高于非線性模型的回歸分析?;貧w分析中的變量多元拉索回歸分析和變量多元指數(shù)函數(shù)回歸分析的誤差范圍在(-10%,+10%)左右,將CPU處理器和內(nèi)存使用率的指數(shù)函數(shù)ex引入變量多元中對(duì)能耗模型結(jié)果基本上沒(méi)有任何影響。方差齊性回歸(SVM)的誤差值范圍在(-6%,+6%)之間,是線性回歸的偏差的一半,也是3個(gè)回歸分析技術(shù)中誤差范圍最小的。實(shí)驗(yàn)結(jié)果表明,方差齊性回歸分析的能耗模型在系統(tǒng)穩(wěn)定后只監(jiān)控系統(tǒng)使用率的情況下,能耗預(yù)測(cè)精度可達(dá)到94%以上。
云計(jì)算平臺(tái)在系統(tǒng)應(yīng)用時(shí)產(chǎn)生了大量的能耗浪費(fèi),針對(duì)云計(jì)算平臺(tái)的能耗優(yōu)化問(wèn)題是當(dāng)前云技術(shù)發(fā)展重點(diǎn)研究的對(duì)象之一。本文針對(duì)云計(jì)算系統(tǒng)的CPU使用率、內(nèi)存使用率和存儲(chǔ)使用率三個(gè)能耗模型的分析,結(jié)合非線性回歸分析數(shù)學(xué)方法,設(shè)計(jì)了使基于云計(jì)算平臺(tái)的系統(tǒng)使用率的能耗模型。通過(guò)實(shí)驗(yàn)環(huán)境搭建,得出了基于系統(tǒng)使用率的能耗模型的誤差率和實(shí)際監(jiān)測(cè)結(jié)果相差較小,能夠滿足能耗優(yōu)化的實(shí)際需求。
[1]金海,吳松,廖小飛,等.云計(jì)算的發(fā)展與挑戰(zhàn)[M].中國(guó)計(jì)算機(jī)學(xué)會(huì)學(xué)術(shù)工作委員會(huì).中國(guó)計(jì)算機(jī)科學(xué)技術(shù)發(fā)展報(bào)告.北京:清華大學(xué)出版社,2014:15.
[2]KAYZRH.Highperformancenetworkandchannelbased storage[J].ProceedingsoftheIEEE,2014,23(2):128-135.
[3]孫民,沈紅松.論云計(jì)算的體系結(jié)構(gòu)[J].云計(jì)算通訊技術(shù),2014,18(1):38-39.
[4]王慶波,等.虛擬化與云計(jì)算[M].北京:電子工業(yè)出版社,2015:112.
[5]張虹.含風(fēng)電場(chǎng)的連續(xù)潮流法研究[J].吉林化工學(xué)院學(xué)報(bào),2014,31(5):59-61.
[6]PAYYERSON D A,GIBSON G,KAYZ R H.A nice for redundant arrays of inexpensive disks(RAID)[J].SIGMOD RENORD,2013,12(2):58-60.
[7]孫明革.HART智能儀表通用組態(tài)軟件開(kāi)發(fā)[J].吉林化工學(xué)院學(xué)報(bào),2014,31(3):56-60.
[8]CACHIN C,KEIDAR I,SHRAER A.Trusting the cloud [J].ACM SIGACT News,2006,35(1):28-35.
[責(zé)任編輯鄭麗娟]
TP393
A
2095-0438(2016)09-0148-04
2016-05-16
盧彪(1985-),男,安徽毫州人,宿州學(xué)院信息工程學(xué)院助教,碩士,研究方向:物聯(lián)網(wǎng)及云計(jì)算。
安徽省高校自然科學(xué)研究重點(diǎn)項(xiàng)目(KJ2016A777);安徽省大學(xué)生創(chuàng)新創(chuàng)業(yè)項(xiàng)目(201510379098);安徽省級(jí)質(zhì)量工程教學(xué)研究重點(diǎn)項(xiàng)目(2014jyxm380)。