杜有翔 付渲理 明麗洪
[摘 要]本文根據(jù)大部分數(shù)據(jù)中心IaaS層的建設(shè)現(xiàn)狀,分析其基礎(chǔ)資源管理存在的問題,以此提出云化需求。從計算、存儲、網(wǎng)絡(luò)3個層面來分析虛擬化技術(shù)在云化IaaS層中的應(yīng)用,提出數(shù)據(jù)中心IaaS層云化架構(gòu)的設(shè)想,并在基礎(chǔ)資源虛擬化的基礎(chǔ)上,搭建云管理平臺,實現(xiàn)對異構(gòu)的物理資源和虛擬化資源的統(tǒng)一規(guī)范和可視化管理,分析數(shù)據(jù)中心云化IaaS的應(yīng)用成效。
[關(guān)鍵詞]IaaS;虛擬化;云管理;智能運維;數(shù)據(jù)備份
doi:10.3969/j.issn.1673 - 0194.2019.24.027
[中圖分類號]TP393.09[文獻標(biāo)識碼]A[文章編號]1673-0194(2019)24-00-03
0 ? ? 引 言
云架構(gòu)因高效的資源整合和運維、低功耗資源管理、低成本擴展、推動大數(shù)據(jù)融合分析等優(yōu)勢,已成為IT架構(gòu)的整體發(fā)展趨勢。從實現(xiàn)層面上來說,通常分為3個層次,自下而上分別是基礎(chǔ)設(shè)施即服務(wù)(Infrastructure as a Service,IaaS)、平臺即服務(wù)(Platform as a Service,PaaS)、軟件即服務(wù)(Software as a Service,SaaS)。其中,IaaS層是IT架構(gòu)的基礎(chǔ)層,也是實現(xiàn)云架構(gòu)的核心所在,是PaaS和SaaS層的實際載體。本文基于目前大部分中心機房實際情況,從IaaS層分析數(shù)據(jù)中心云化的方式和應(yīng)用前景。
1 ? ? 數(shù)據(jù)中心基礎(chǔ)設(shè)施現(xiàn)狀
目前,很多單位都有自己的數(shù)據(jù)中心,但大部分只是實現(xiàn)了所有硬件設(shè)備的集中擺放和連接,將林立的“煙囪”堆在了一起。即使采用了虛擬化平臺,但數(shù)據(jù)中心沒有一個統(tǒng)一的資源整合和運維平臺,易造成硬件資源浪費,難以管理。從基礎(chǔ)設(shè)施的使用來看,可以從以下兩方面分析數(shù)據(jù)中心存在的問題。
1.1 ? 非虛擬化平臺
①舊設(shè)備改造的投入成本過高,且難以徹底改造;②部分新設(shè)備性能配置高,運行其上的業(yè)務(wù)未能充分利用設(shè)備資源,造成資源浪費;③物理設(shè)備一旦開機,能耗較為穩(wěn)定(不包括制冷能耗),不會因利用率高低而產(chǎn)生較大的能耗變化,造成能源浪費;④部分業(yè)務(wù)應(yīng)用系統(tǒng)為了降低建設(shè)初期投入,沒有過多考慮高可用性和負載均衡。
1.2 ? 虛擬化平臺
①虛擬化平臺相互之間是獨立的,且應(yīng)用范圍不廣,限制了其在資源節(jié)約上的優(yōu)勢;②未建設(shè)可實現(xiàn)資源自動按需分配的云管理平臺,運維人力成本較高。因此,數(shù)據(jù)中心IaaS層云化的目標(biāo)是最小化改造成本、提高硬件資源利用率、保證業(yè)務(wù)高可用和數(shù)據(jù)安全,實現(xiàn)資源管理自動化和運維智能化。
2 ? ? 虛擬化技術(shù)在數(shù)據(jù)中心的應(yīng)用
虛擬化技術(shù)是所有IT“云”的基礎(chǔ),也是目前最有效的資源整合技術(shù)。通過利用虛擬化技術(shù),在實現(xiàn)應(yīng)用高可用性的同時,提高了設(shè)備的資源利用率,能以較低的建設(shè)和改造成本,降低數(shù)據(jù)中心的能耗。從功能上分,數(shù)據(jù)中心虛擬化技術(shù)主要包括3類:存儲虛擬化、服務(wù)器虛擬化(計算資源虛擬化)和網(wǎng)絡(luò)虛擬化。
2.1 ? 存儲虛擬化
存儲虛擬化是為了實現(xiàn)對物理存儲資源的抽象、隱藏和隔離,提高設(shè)備利用率和可擴展性??梢詫⒁粋€物理存儲設(shè)備(卷)虛擬成多個邏輯存儲卷,也可以將多個物理存儲設(shè)備(卷)虛擬成一個邏輯存儲卷,供上層的應(yīng)用服務(wù)端調(diào)用,如圖1所示。
存儲虛擬化按實現(xiàn)位置可分為基于主機、基于存儲設(shè)備和基于網(wǎng)絡(luò)3類,比較結(jié)果如表1所示。
2.2 ? 服務(wù)器虛擬化
服務(wù)器虛擬化是將一臺或多臺利用率低的服務(wù)器通過虛擬化軟件整合在一起,形成一個或多個計算資源池,為多個應(yīng)用系統(tǒng)提供計算資源,又稱為計算資源虛擬化。由于各虛擬機內(nèi)部運行環(huán)境之間是相互獨立的,且物理服務(wù)器如何為虛擬機提供計算資源,對于運行在其上應(yīng)用系統(tǒng)來說也是完全透明的,因此,從效果上來看,各應(yīng)用系統(tǒng)仍然各自“獨占”一臺物理服務(wù)器,如圖2所示。
除了整合計算資源以外,以共享存儲為前提,服務(wù)器虛擬化的一個重要作用還體現(xiàn)在對于運行其上的業(yè)務(wù)系統(tǒng)的一個連續(xù)性保護,主要通過虛擬化遷移、虛擬化平臺的高可用、恢復(fù)自動化等技術(shù)實現(xiàn)。
2.3 ? 網(wǎng)絡(luò)虛擬化
網(wǎng)絡(luò)虛擬化可描述為將網(wǎng)絡(luò)資源進行虛擬化整合和改造,在對用戶透明的前提下,實現(xiàn)物理網(wǎng)絡(luò)虛多、多虛功能,以達到提高物理網(wǎng)絡(luò)設(shè)備利用率、簡化物理網(wǎng)絡(luò)的目的。在服務(wù)器虛擬化中,要運用網(wǎng)絡(luò)虛擬化技術(shù)實現(xiàn)多個不同IP的虛擬機通過少量的物理網(wǎng)口對外連接,如圖3所示。
數(shù)據(jù)中心的資源整合主要有3種實現(xiàn)方式:“服務(wù)器虛擬化+共享物理存儲”“服務(wù)器虛擬化+存儲虛擬化”、超融合架構(gòu)。其中,超融合架構(gòu)是將服務(wù)器虛擬化、存儲虛擬化、網(wǎng)絡(luò)虛擬化等虛擬化技術(shù)融合在一起的扁平化部署架構(gòu)。但由于其存儲和計算資源都是在同一臺物理設(shè)備上,因此,如果要對任何一種資源進行單獨擴容,為了保證平臺整體性能,需要對每臺物理設(shè)備進行同樣的擴容改造,成本較高。因此,此架構(gòu)適用于對計算、存儲資源需求同步增長的應(yīng)用。通過對常用應(yīng)用系統(tǒng)(如門戶、OA)的分析可知,服務(wù)端的計算資源需求量增長遠不如存儲資源。而特殊應(yīng)用系統(tǒng),如桌面云,計算資源需求的增長和存儲資源需求的增長就有較強的關(guān)聯(lián)性。比如,新增一個桌面云用戶,不僅要為其分配磁盤空間(存儲資源),還要為其分配CPU和內(nèi)存(計算資源)。因此,通過上述虛擬化技術(shù)對比分析,對于數(shù)據(jù)中心中的通用應(yīng)用系統(tǒng),應(yīng)通過重建、數(shù)據(jù)遷移、P2V等方式將其遷入“服務(wù)器虛擬化+基于網(wǎng)絡(luò)的存儲虛擬化”的虛擬化平臺中,并將替換下的舊設(shè)備納入虛擬化平臺管理,進一步提高資源整合度和利用率,而對于桌面云等特殊應(yīng)用系統(tǒng)可建設(shè)在超融合架構(gòu)的虛擬化平臺中。
3 ? ? 數(shù)據(jù)中心云管理平臺的應(yīng)用構(gòu)想
在各虛擬化平臺之上構(gòu)建一個統(tǒng)一的運維管理云平臺,接管數(shù)據(jù)中心所有硬件資源及其承載的虛擬化資源的監(jiān)控、調(diào)度、分配等日常管理運維工作,屏蔽下層復(fù)雜的運行環(huán)境,簡化運維人員操作,并通過可視化監(jiān)控、統(tǒng)計分析報表、告警機制等功能為運維人員進行決策分析提供依據(jù),完整的數(shù)據(jù)中心IaaS層云化架構(gòu),詳見圖4所示。
3.1 ? 基礎(chǔ)資源管理自動化
對基礎(chǔ)資源的管理包括對物理資源的管理和虛擬資源的管理。
3.3.1 ? 對物理資源的管理
要對物理設(shè)備在云化架構(gòu)中的壽命進行全生命周期管理,主要包括以下幾個方面。①設(shè)備自動發(fā)現(xiàn):平臺通過主動詢問機制主動發(fā)現(xiàn)新入網(wǎng)設(shè)備,并將設(shè)備信息(如設(shè)備型號、IP地址、MAC地址)告知運維人員,由其決定是否將其納入平臺管理。②設(shè)備狀態(tài)監(jiān)控:定期監(jiān)控設(shè)備運行狀態(tài),如開關(guān)機情況、溫度、CPU和內(nèi)存占用等,并根據(jù)既定的監(jiān)控策略定時生成監(jiān)控報表呈現(xiàn)給運維人員,一旦狀態(tài)有異常,立即發(fā)出告警信息,實現(xiàn)日常巡檢自動化。③設(shè)備移除:運維人員通過平臺可將作廢的設(shè)備移出管理范圍,不再進行管理監(jiān)控。
3.3.2 ? 對虛擬資源的管理
除了進行全生命周期管理,還應(yīng)具有資源自動按需分配功能。即用戶可在線發(fā)起虛擬資源申請,由相關(guān)管理人員審批通過后,平臺自動按照用戶需求為其分配虛擬計算、存儲資源供其使用,一旦用戶告知不再使用,或超過申請的使用期限,自動回收資源。
3.2 ? 基礎(chǔ)資源運維智能化
基礎(chǔ)資源運維智能化主要包括虛擬資源的智能化調(diào)度和故障的智能化處理。
3.2.1 ? 虛擬資源的智能化調(diào)度
要實現(xiàn)智能化調(diào)度,需要確定不同的優(yōu)化目標(biāo)以判斷調(diào)度優(yōu)劣,比如性能(響應(yīng)速度)、服務(wù)質(zhì)量、總成本控制(能耗低)等,并據(jù)此制定出合理的調(diào)度策略。此處應(yīng)遵循以下3條資源調(diào)度原則。①確定好虛擬資源利用優(yōu)先級的劃分。在進行資源優(yōu)化調(diào)度時,平臺會優(yōu)先考慮優(yōu)先級靠前的虛擬機資源占用。一旦資源池中的資源匱乏時,平臺會優(yōu)先保證重要應(yīng)用的資源占用,確保重要業(yè)務(wù)的連續(xù)性。②保持資源利用率的平衡。在虛擬化實踐中,常常會因為資源利用率失衡導(dǎo)致資源不充分。如計算資源利用率很低,而存儲資源利用率很高,導(dǎo)致新的應(yīng)用無法遷入(存儲資源不夠),造成計算資源浪費,反之亦然。因此,在分配虛擬資源時,要充分考慮運行其上的應(yīng)用對資源的要求。一旦出現(xiàn)失衡,要及時調(diào)整現(xiàn)有資源分配,改進原調(diào)度策略。如果無法通過調(diào)整實現(xiàn),則需要對利用率較高的一方進行擴展(增加物理資源)。③處理好能耗與計算性能的關(guān)系。如果優(yōu)化目標(biāo)設(shè)定為成本控制(能耗低),則虛擬化平臺會根據(jù)調(diào)度策略,在確保計算資源足夠的情況下,將低利用率主機上的虛擬機遷至別的主機,然后休眠此主機,以降低能耗。但如果優(yōu)化目標(biāo)設(shè)定為性能,在各主機計算資源性能相同的前提下,盡量平均各臺主機的資源利用率,以保證各個應(yīng)用的資源占用和負載均衡。因此,需要根據(jù)具體的應(yīng)用需求、物理主機性能、機房環(huán)境,制定合理的調(diào)度策略,控制虛擬機的遷移和資源的動態(tài)分配。
3.2.2 ? 故障的智能化處理
快速解決故障、提高用戶體驗,一直是運維人員面臨的難題。①建立完善的預(yù)警機制。平臺自動進行告警過濾、壓縮,避免海量告警,只將關(guān)鍵告警通過消息發(fā)送給責(zé)任人。②建立業(yè)務(wù)級的運維視圖,快速呈現(xiàn)業(yè)務(wù)與硬件設(shè)備、各業(yè)務(wù)系統(tǒng)之間的邏輯關(guān)系,實現(xiàn)故障快速定位,提高故障處理效率。③建立運維知識庫。對運維流程進行梳理,制定故障判斷和預(yù)處理策略。故障發(fā)生時,平臺據(jù)此自動執(zhí)行抓取故障日志,排查解決故障等操作,實現(xiàn)一般故障的自動化處理。對于需要技術(shù)人員處理的故障,平臺自動通過消息告知運維技術(shù)人員。同時,平臺自動關(guān)聯(lián)知識庫,協(xié)助技術(shù)人員處理。技術(shù)人員處理結(jié)束后處理方案自動轉(zhuǎn)入,實現(xiàn)知識累積。
3.3 ? 數(shù)據(jù)云備份
在平臺中融入災(zāi)備云管理,集中統(tǒng)一管理所有的容災(zāi)設(shè)備、數(shù)據(jù)備份恢復(fù)策略,實現(xiàn)對平臺數(shù)據(jù)的持續(xù)性保護。
3.3.1 ? 保護應(yīng)用系統(tǒng)數(shù)據(jù)
應(yīng)用系統(tǒng)數(shù)據(jù)可分為操作系統(tǒng)、虛擬機、非結(jié)構(gòu)化數(shù)據(jù)(文件)、數(shù)據(jù)庫四大類。應(yīng)根據(jù)數(shù)據(jù)類型和數(shù)據(jù)重要性的不同,制定不同的數(shù)據(jù)備份策略,確保故障發(fā)生后,數(shù)據(jù)不丟失或少丟失、業(yè)務(wù)可恢復(fù)。
3.3.2 ? 保護用戶數(shù)據(jù)
用戶可像申請?zhí)摂M計算、存儲資源一樣,在線申請災(zāi)備資源,并自定義災(zāi)備策略,實現(xiàn)“自己災(zāi)備數(shù)據(jù),自己管理”。
4 ? ? 結(jié) 語
在數(shù)據(jù)中心建立一套IaaS層云化架構(gòu),將所有的基礎(chǔ)資源納入統(tǒng)一的管理平臺下,可實現(xiàn)基礎(chǔ)資源的統(tǒng)一規(guī)范管理,有效提升數(shù)據(jù)中心的資源利用率和運維效率,降低數(shù)據(jù)中心的整體能耗和運維成本,可為數(shù)據(jù)中心的相關(guān)管理人員和部門提供足夠的決策支撐。充分體現(xiàn)該架構(gòu)的應(yīng)用價值。
主要參考文獻
[1][美]阿爾杰.大數(shù)據(jù)云計算時代數(shù)據(jù)中心經(jīng)典案例賞析[M].曾少寧,譯.北京:人民郵電出版社,2014.
[2]戴元順.云計算技術(shù)簡述[J].信息通信技術(shù),2010(2).
[3]鄭偉偉.IaaS云管理平臺的設(shè)計與實現(xiàn)[D].北京:北京郵電大學(xué),2012.
[4]李喬,鄭嘯.云計算研究現(xiàn)狀綜述[J].計算機科學(xué),2011(4).