高曉欣
【摘要】? ? 近年來,數(shù)據(jù)中心的重要性日益突出,需要高效的運行和管理。因此,直流基礎(chǔ)設(shè)施管理(DCIM)成為了一個熱點話題,它可以管理 ICT 設(shè)備、電力設(shè)備、 HVAC 系統(tǒng)等。在本研究中,我們利用計算流體動力學(xué)(CFD)技術(shù),提出了一種設(shè)計服務(wù)器機房 ICT 設(shè)備布局的方法。對該方法的有效性進行了評估,并對其實現(xiàn)高效數(shù)據(jù)中心運行和管理的能力進行了驗證。在此基礎(chǔ)上, 越來越多的應(yīng)用程序轉(zhuǎn)移到云計算中,而云計算實際上是由地面上的大型數(shù)據(jù)中心支持的。這些數(shù)據(jù)中心是需要管理的復(fù)雜系統(tǒng),集中解決方案可能無法滿足所需規(guī)模,也無法有效利用其網(wǎng)絡(luò)。本文提出了一種數(shù)據(jù)中心動態(tài)資源管理的層次化方法,利用數(shù)據(jù)中心網(wǎng)絡(luò)的拓撲結(jié)構(gòu)設(shè)計管理層次結(jié)構(gòu)。我們在層次結(jié)構(gòu)中的各個級別定義了一組聚合度量,以將系統(tǒng)狀態(tài)信息傳遞給更高的管理級別,并定義了管理者的職責(zé)和交互。我們通過仿真對我們提出的方法進行了評估。實驗結(jié)果表明,該管理方法大大減少了數(shù)據(jù)中心網(wǎng)絡(luò)中管理數(shù)據(jù)的流量,從而降低了網(wǎng)絡(luò)開銷。
【關(guān)鍵詞】? ? 數(shù)據(jù)中心運營? ? 運營管理? ? 工作組織
引言
越來越多的應(yīng)用程序轉(zhuǎn)移到了云中。思科預(yù)測,到2017年,將近三分之二的工作負載將在云中處理。大規(guī)模數(shù)據(jù)中心的增加為這種增長提供了支持,這些數(shù)據(jù)中心的明確目的是托管這些云工作負載。這些大型數(shù)據(jù)中心構(gòu)成了一個有趣的管理挑戰(zhàn): 一方面,數(shù)據(jù)中心供應(yīng)商希望盡量減少能源消耗以降低成本,而另一方面,數(shù)據(jù)中心客戶希望其應(yīng)用程序的資源需求在任何時候都能得到滿足。協(xié)商這兩個目標是困難的,并已成為許多研究工作的目標。
數(shù)據(jù)中心由集群組成,每個集群由機架組成,每個機架由物理服務(wù)器組成。通過使用系統(tǒng)虛擬化,多個應(yīng)用程序可以駐留在單個物理服務(wù)器(或主機)中,每個應(yīng)用程序都在自己的虛擬機(VM)中運行。此外,資源可能會被超額預(yù)訂(也就是說,在一臺主機中,可以承諾將總共更多的資源提供給共存的虛擬機組,而不是主機實際擁有的資源) ,從而大幅度提高主機的資源利用率。
然而,考慮到應(yīng)用程序資源需求的動態(tài)特性,如果共用位置的虛擬機的總資源需求超過其主機的容量,這種安排可能會出現(xiàn)問題。如果不采取任何行動,虛擬機將無法滿足其資源需求,這將導(dǎo)致違反服務(wù)水平協(xié)議(SLA)。但是,通過利用 VM 實時遷移,可以將 VM 從資源壓力較大的主機重新遷移,從而在本地釋放可以分配給剩余 VM 的資源。遷移后的 VM 將在不同的主機上恢復(fù)執(zhí)行,過程中只經(jīng)歷了最小的停機時間。這被稱為動態(tài) VM 管理。
大多數(shù)資源管理系統(tǒng)都是為集群設(shè)計的,似乎不會擴展到單個集群之外,通常都是集中式的。集中管理者的假設(shè)通常反映在提出的動態(tài)資源管理系統(tǒng)中。然而,這些系統(tǒng)可能無法滿足大型數(shù)據(jù)中心的規(guī)模以滿足現(xiàn)實需求。此外,通過將整個數(shù)據(jù)中心視為單一資源池,管理數(shù)據(jù)(包括通信和 VM 遷移)在不考慮管理費用的情況下通過網(wǎng)絡(luò)發(fā)送,導(dǎo)致數(shù)據(jù)中心資源的使用效率低下。
一、數(shù)據(jù)中心運營管理工作概述
近年來,信息和通信技術(shù)系統(tǒng)已成為支持社會生活基礎(chǔ)設(shè)施的重要工具。因此,數(shù)據(jù)中心(DCs)管理信息的作用變得越來越重要。此外,云計算和信通技術(shù)虛擬化的發(fā)展導(dǎo)致發(fā)展中國家出現(xiàn)高熱密度和增加能源消耗的趨勢[1]。因此,DC 運營管理者需要在考慮各種因素的同時管理復(fù)雜的環(huán)境。這些因素包括空氣調(diào)節(jié)、電力、建筑物以及虛擬服務(wù)器數(shù)量超過物理服務(wù)器數(shù)量的情況。在這樣的環(huán)境下,如何構(gòu)建一個安全、節(jié)能的直流電源系統(tǒng),并對其進行高效、持續(xù)的運行和維護,已成為一個重要課題。因此,這項研究的目的是檢驗一種管理方法,這種管理方法可以通過對信息通信技術(shù)設(shè)備、機架、空氣調(diào)節(jié)系統(tǒng)、電力、建筑物和發(fā)展中國家的空間進行單獨管理,從而有效地、持續(xù)地管理安全、節(jié)能的發(fā)展中國家。本文描述了 DC 基礎(chǔ)設(shè)施管理(DCIM)的概念、問題和預(yù)期作用,并報告了使用 DCIM 設(shè)計 ICT 設(shè)備布局的效果。
二、DCIM 概述
DCIM 包括監(jiān)控 DCs 中各種設(shè)備故障的系統(tǒng)(ICT 設(shè)備、電力設(shè)備、空氣調(diào)節(jié)設(shè)備) ,并管理各種能力(空間、機架安裝狀態(tài)、 ICT 設(shè)備的負載比、電力和空氣調(diào)節(jié))。它具有分析這些因素的信息的功能。這是一個整合和提高信息和通信技術(shù)效率以及管理單獨管理的調(diào)頻系統(tǒng)的工具。
在發(fā)展中國家,“資訊及通訊科技管理人員”主要負責(zé)設(shè)計、操作及維修與資訊及通訊科技有關(guān)的設(shè)備,而“設(shè)施管理人員”則負責(zé)設(shè)計、操作及維修樓宇、空氣調(diào)節(jié)系統(tǒng)及電力設(shè)施等。
每個基金經(jīng)理各自節(jié)省能源、空間和資產(chǎn)管理。雖然支持集成的 DCIM 概念已經(jīng)存在很長一段時間了,但許多 DCIM 供應(yīng)商都是軟件公司和空氣調(diào)節(jié)設(shè)備制造商。因此,許多 DCIM 功能僅限于每家公司的專業(yè)領(lǐng)域,沒有一個能夠支持控制、操作和維護的所有三個領(lǐng)域。另一個問題是,盡管 DCIM 中注冊了大量的數(shù)據(jù),但它還是不能解決它特有的一個問題:創(chuàng)建和維護數(shù)據(jù)的困難。由于這些原因,對 DCIM 的需求正在變得越來越普遍,但是沒有像預(yù)期的那樣廣泛或迅速地擴散。
資訊及通訊科技設(shè)備(例如伺服器及網(wǎng)絡(luò)設(shè)備)與設(shè)施(例如建筑物、空調(diào)及電力設(shè)施)彼此關(guān)系密切。例如,由于信息和通信技術(shù)設(shè)備不是簡單地安裝在一個空曠的空間里,因此重要的是要從電力供應(yīng)、空氣調(diào)節(jié)容量、運行效率等方面對其做出全面的判斷。通過使用 DCIM,可以準確有效地完成這些任務(wù)。主要角色如下所示:
1、整個直流系統(tǒng)的管理和可視化不僅需要服務(wù)器機房內(nèi)部的管理和可視化,而且需要整個直流系統(tǒng)的管理和可視化,包括熱源設(shè)備、電源接收設(shè)備、應(yīng)急發(fā)電機和蓄電池。為此,必須能夠與建筑和能源管理系統(tǒng)、出入境管理系統(tǒng)以及其他業(yè)務(wù)管理系統(tǒng)等相關(guān)系統(tǒng)進行合作。
2、先進的數(shù)據(jù)分析和環(huán)境改善與控制為了實現(xiàn)各種效益,如提高節(jié)能和降低運行和維護成本,對 DCIM 收集的大量信息進行分析是非常重要的。
3、集成化管理與建設(shè)和維護信息集成化管理由 DCs 處理的信息多種多樣,變化頻繁。為了有效地利用 DCIM,必須有一個能夠適當(dāng)反映信息的報表管理功能。
三、DCIM 效果實例
當(dāng)增加機架和 ICT 設(shè)備到直流電,不僅要考慮物理空間和容量,而且要考慮對安全的影響(溫度環(huán)境的變化)和節(jié)能(空氣調(diào)節(jié)消耗)。
首先,一個可以添加 ICT 設(shè)備的機架是從物理空間、負載、現(xiàn)有電力容量和空氣調(diào)節(jié)中選擇的。其次,利用 DCIM 收集的信息進行熱流體模擬。在發(fā)展中國家,ICT 設(shè)備進氣溫度的上限和下限被歸納為 SLA?;?DCIM 收集的信息和將要添加的 ICT 設(shè)備的功耗,進行了熱流體模擬,預(yù)測了 ICT 設(shè)備在假定的最壞情況或年份下的進氣溫度,滿足 SLA 的位置是有限的。
四、現(xiàn)有云數(shù)據(jù)中心計算平臺
目前最先進的云基礎(chǔ)設(shè)施,如亞馬遜 EC2既不支持考慮消費者對節(jié)能計劃偏好的能源效率資源分配,也不利用復(fù)雜的經(jīng)濟模型設(shè)定正確的激勵機制,讓消費者準確地披露有關(guān)其服務(wù)需求的信息。因此,供應(yīng)商無法與消費者進行必要的信息交換,因此無法實現(xiàn)有效的服務(wù)分配,而這種分配滿足了消費者對綠色云計算的節(jié)能偏好的需求和期望。
在本文中,我們研究了一種層次化的方法來管理數(shù)據(jù)中心。分層方法提供了更高的可伸縮性,但代價是只有系統(tǒng)的部分視圖。
我們將管理域劃分為管理范圍,每個范圍包含一個托管元素子集,并在其中封裝管理數(shù)據(jù)和管理操作。我們利用數(shù)據(jù)中心網(wǎng)絡(luò)的拓撲結(jié)構(gòu)來定義范圍,范圍包括主機、機架、集群和數(shù)據(jù)中心。通過使層次結(jié)構(gòu)具有拓撲感知性,我們限制了跨越數(shù)據(jù)中心的管理數(shù)據(jù)流。我們假設(shè),這種組織將導(dǎo)致更有效地使用數(shù)據(jù)中心,大大減少網(wǎng)絡(luò)流量。
使用分層方法進行動態(tài)數(shù)據(jù)中心管理的挑戰(zhàn)包括: (Ⅰ)定義一組度量標準來表示機架和集群的系統(tǒng)狀態(tài)。集群管理器可以向數(shù)據(jù)中心管理器發(fā)送關(guān)于其所有主機的信息,但這將代表需要傳輸和分析的大量數(shù)據(jù); (Ⅱ)確定管理器的職責(zé)以及它們之間的交互。這兩個挑戰(zhàn)都在這項工作中得到了解決。
目標基礎(chǔ)設(shè)施由一組集群組成,每個集群是一組機架,每個機架是一組物理服務(wù)器。虛擬機(vm)被托管在物理服務(wù)器(或主機)中,在那里它們被分配資源來運行。數(shù)據(jù)中心有兩個網(wǎng)絡(luò): 數(shù)據(jù)網(wǎng)絡(luò)和管理網(wǎng)絡(luò)。
虛擬機使用數(shù)據(jù)網(wǎng)絡(luò)進行應(yīng)用程序的通信,而管理網(wǎng)絡(luò)則用于管理數(shù)據(jù)(即通信和 VM 遷移)。兩個網(wǎng)絡(luò)具有相同的架構(gòu)。機架中的主機通過放置在機架中的兩個交換機(每個網(wǎng)絡(luò)一個交換機)連接到網(wǎng)絡(luò)。集群中的機架通過集群級交換機相互連接,集群級交換機連接到數(shù)據(jù)中心級的中央交換機。從現(xiàn)在開始,當(dāng)我們談?wù)摂?shù)據(jù)中心網(wǎng)絡(luò)時,我們將指的是管理網(wǎng)絡(luò)。
使用分層管理方法背后的思想是對主機集合進行邏輯分組,并將每個主機集合作為一個單元進行管理,盡可能在單元內(nèi)封裝詳細的監(jiān)控和管理操作。此外,每個級別的元素再次組合,形成上面級別的元素。這些結(jié)果導(dǎo)致了管理范圍的創(chuàng)建,從而限制了管理數(shù)據(jù)在整個數(shù)據(jù)中心的傳播。在每個范圍內(nèi)收集監(jiān)控數(shù)據(jù),并與上級管理層共享數(shù)據(jù)摘要。盡可能多的 VM 遷移也限制在它們自己的范圍內(nèi)。我們決定利用數(shù)據(jù)中心網(wǎng)絡(luò)的組織,使用主機、機架和集群來劃定管理范圍。此外,數(shù)據(jù)中心作為一個整體形成了一個龐大的、包羅萬象的管理范圍。
主機管理器定期從主機和(托管)虛擬機收集監(jiān)視數(shù)據(jù)。收集的數(shù)據(jù)包括每個虛擬機和主機本身的資源利用率(CPU、內(nèi)存、網(wǎng)絡(luò)帶寬和存儲)、主機功耗以及當(dāng)前傳入和傳出的虛擬機遷移次數(shù)。這些信息被打包并以狀態(tài)更新的形式發(fā)送給主機所屬的機架的管理員。機架管理員處理各主機管理員在其范圍內(nèi)發(fā)送的狀態(tài)更新,并根據(jù)所收到的信息更新其知識庫。
五、小結(jié)
未來,數(shù)據(jù)中心(DC)業(yè)務(wù)將在全球范圍內(nèi)蓬勃發(fā)展。信息和通信技術(shù)的發(fā)展可望使發(fā)展中國家的規(guī)模更大、密度更高,但也可望帶來對更廉價和更可靠的發(fā)展中國家服務(wù)的需求。為了實現(xiàn)這一目標,管理和分析綜合信息和節(jié)能方法以降低運行和維護成本將變得越來越重要。我們相信,通過使用直流基礎(chǔ)設(shè)施管理來管理和分析 ICT 設(shè)備以及空氣調(diào)節(jié)、電力和建筑設(shè)施,不僅有可能實現(xiàn)本報告所示的 ICT 設(shè)備放置計劃,還有可能實現(xiàn)直流設(shè)備和設(shè)施的高效運行/維護。
參? 考? 文? 獻
[1]毋江波. 競合環(huán)境下基于信息和關(guān)系的企業(yè)戰(zhàn)略匹配研究[D].山西大學(xué),2019.
[2]趙瑞勝. 內(nèi)蒙古鐵塔公司運營流程優(yōu)化研究[D].內(nèi)蒙古工業(yè)大學(xué),2019.
[3]黃圓圓. 跨界破產(chǎn)承認與救濟制度研究[D].對外經(jīng)濟貿(mào)易大學(xué),2019.
[4]劉壯. 西非水務(wù)工程項目中推進人力資源屬地化進程的研究[D].湖南大學(xué),2019.
[5]何秋. 美國氣候變化法律制度研究[D].中南財經(jīng)政法大學(xué),2018.