譚志遠(yuǎn),宮云平,周文紅
(1.中國電信股份有限公司廣東研究院 廣州510630;2.中國電信集團(tuán)公司 北京100032)
云計算虛擬化技術(shù)的引入為業(yè)務(wù)網(wǎng)絡(luò)演進(jìn)、資源整合提供了新的技術(shù)手段。云計算虛擬化技術(shù)越來越成熟,應(yīng)用越來越廣泛,并經(jīng)過近兩年來基于云計算技術(shù)對業(yè)務(wù)平臺進(jìn)行關(guān)停并轉(zhuǎn)的現(xiàn)場試驗,驗證了基于云計算虛擬化技術(shù)在整合資源、提高資源利用率、降低維護(hù)成本、增加業(yè)務(wù)平臺的整體容災(zāi)性能等方面的能力,能給現(xiàn)階段業(yè)務(wù)平臺的運(yùn)營維護(hù)帶來質(zhì)的變化。
現(xiàn)階段對于重要業(yè)務(wù)平臺(如WAP網(wǎng)關(guān)、彩信中心、短信中心等),是否進(jìn)行云化始終存在顧慮,因為這些業(yè)務(wù)平臺其承載的業(yè)務(wù)量大、用戶量多、影響面廣,擔(dān)心云化后可能給這些業(yè)務(wù)平臺的安全運(yùn)行帶來諸多不可預(yù)測的隱患,因此在推進(jìn)重要業(yè)務(wù)平臺云化方面始終比較慎重。
究竟哪些業(yè)務(wù)平臺適合云化,哪些業(yè)務(wù)平臺不適合云化,如何評估,其評估的依據(jù)和方法是什么?本文結(jié)合云計算技術(shù)的特點和業(yè)務(wù)平臺的實際情況,探索了一套針對業(yè)務(wù)平臺是否可云化的評估方法,并形成了可量化、可操作的評估體系,希望能對業(yè)務(wù)平臺的云化起到指導(dǎo)作用。
(1)業(yè)務(wù)平臺云化
業(yè)務(wù)平臺云化是把現(xiàn)有業(yè)務(wù)平臺遷移到云計算資源池承載的簡稱,即針對現(xiàn)有業(yè)務(wù)平臺,經(jīng)過云化評估后,把可云化的業(yè)務(wù)平臺通過P2V(physical-to-virtual,把物理機(jī)中的應(yīng)用系統(tǒng)遷移到虛擬機(jī)中)模式或者新建模式(在云計算資源池中的虛擬機(jī)上重新部署業(yè)務(wù)平臺運(yùn)行環(huán)境)把業(yè)務(wù)平臺遷移到云計算資源池中。
(2)部分云化
根據(jù)業(yè)務(wù)平臺的實際情況或需要,把業(yè)務(wù)平臺中部分模塊遷移或部署到云資源池中,而業(yè)務(wù)平臺中的其他模塊保持傳統(tǒng)的承載方式不變(直接使用物理機(jī))。
(3)融合云
本文中融合云的概念是指x86云與小型機(jī)云混合組網(wǎng)的解決方案,即根據(jù)實際需要,把業(yè)務(wù)平臺的部分模塊遷移或部署到x86云,部分遷移或部署到小型機(jī)云的混合解決方案。
根據(jù)目前云計算服務(wù)器虛擬化技術(shù)的發(fā)展,主要存在兩個不同的發(fā)展方向,即“1變多”和“多變1”兩種方式,兩種方式的比較見表1。根據(jù)現(xiàn)網(wǎng)業(yè)務(wù)平臺云化實際應(yīng)用場景和云資源池的建設(shè)情況,本文主要討論“1變多”的情況(大型機(jī)的虛擬化除外),即把一臺物理服務(wù)器虛擬成多臺虛擬機(jī)供業(yè)務(wù)平臺使用。根據(jù)資源池服務(wù)器類型的不同,云資源池也存在如下幾種情況:使用小型機(jī)虛擬化技術(shù)構(gòu)建的云資源池(以下簡稱小型機(jī)云)、使用x86服務(wù)器構(gòu)建的云資源池(以下簡稱x86云)以及小型機(jī)云和x86云混合使用構(gòu)建的融合云資源池。
表1 服務(wù)器虛擬化的兩個方向
服務(wù)器虛擬化后,最顯著的特點是實現(xiàn)計算、內(nèi)存、存儲、網(wǎng)絡(luò)等資源的共享,并且各虛擬機(jī)的資源可按需分配。與傳統(tǒng)的業(yè)務(wù)平臺部署不同,各虛擬機(jī)與底層硬件之間多了如圖1所示的虛擬化層(hypervisor),因此需要結(jié)合這些特征以及業(yè)務(wù)平臺的實際情況綜合評估業(yè)務(wù)平臺是否可云化,是否適合云化。
圖1 服務(wù)器虛擬化“1變多”
基于云計算的虛擬化技術(shù)可以把現(xiàn)網(wǎng)設(shè)備老化、資源利用率低、生命周期短、業(yè)務(wù)突發(fā)性高且符合云化條件的各種業(yè)務(wù)平臺(優(yōu)先考慮對小業(yè)務(wù)平臺、短生命周期平臺、離線分析平臺、硬件故障率高、過?;蚓S保即將到期的業(yè)務(wù)平臺)遷移到云平臺統(tǒng)一承接,實現(xiàn)業(yè)務(wù)平臺的資源整合。
根據(jù)現(xiàn)網(wǎng)業(yè)務(wù)平臺實際云化的經(jīng)驗和云計算技術(shù)的特點,不是所有的業(yè)務(wù)平臺都適合遷移到云資源池中,業(yè)務(wù)平臺是否可以云化會受制于諸多因素,因此在實施業(yè)務(wù)平臺云化前務(wù)必做好充分的評估,什么類型的業(yè)務(wù)平臺適合云化,需要從哪些方面評估業(yè)務(wù)平臺是否可云化。
為了更充分地評估業(yè)務(wù)平臺是否可以云化,在評估前需要先收集現(xiàn)有待云化業(yè)務(wù)平臺的一些基本數(shù)據(jù),通過業(yè)務(wù)平臺的現(xiàn)狀,再結(jié)合云計算的特點綜合評估業(yè)務(wù)平臺是否可云化。
收集待云化平臺的基本資料,主要包括平臺設(shè)備使用情況和業(yè)務(wù)特性方面的資料。在物理設(shè)備方面,收集業(yè)務(wù)平臺的服務(wù)器設(shè)備、網(wǎng)絡(luò)設(shè)備、存儲設(shè)備以及其他特殊設(shè)備(信令卡、加密狗等)等相關(guān)資料,主要包括平臺涉及服務(wù)器的數(shù)量,各服務(wù)器的操作系統(tǒng)種類和版本、CPU數(shù)量、核數(shù)和CPU利用率、內(nèi)存容量及當(dāng)前平均利用率、已使用磁盤空間大小、使用網(wǎng)絡(luò)帶寬大小,平臺使用外接存儲資源大小、IP地址情況,使用防火墻情況以及安全控制策略、外接設(shè)備情況等。
業(yè)務(wù)特性方面收集的資料包括業(yè)務(wù)的忙/閑時情況、業(yè)務(wù)實時性要求、業(yè)務(wù)的重要程度、用戶量、業(yè)務(wù)所需的I/O吞吐量等。
待云化業(yè)務(wù)平臺需要采集的信息包括表2和表3所涉及的評估數(shù)據(jù)。
收集到待遷移平臺的資料后,從虛擬化技術(shù)特性、業(yè)務(wù)特性、維護(hù)管理要求等幾個方面分析是否對業(yè)務(wù)平臺進(jìn)行可云化或部分云化評估。
4.2.1 云計算技術(shù)制約
根據(jù)表1所示,目前“1變多”虛擬化技術(shù)根據(jù)平臺架構(gòu)的不同主要有x86云和小型機(jī)云兩種技術(shù)實現(xiàn)方式(兩者組合可以構(gòu)建融合云),而不同實現(xiàn)方式下,各廠商的虛擬化產(chǎn)品所實現(xiàn)的功能是有所差異的,因此在進(jìn)行云化評估時,首先必須根據(jù)現(xiàn)有資源池所使用虛擬化產(chǎn)品的功能情況進(jìn)行評估。主要有如下幾個方面的評估內(nèi)容。
表2 待云化平臺資源使用情況匯總(1)
表3 待云化平臺資源使用情況匯總(2)
(1)平臺架構(gòu)
待云化的業(yè)務(wù)平臺如果是x86架構(gòu),可接入x86架構(gòu)的云資源池(如使用VMware、Citrix、RedHat等廠商虛擬化技術(shù)的資源池);非x86架構(gòu)(RISC架構(gòu))的平臺,如可通過軟件移植方式轉(zhuǎn)換成x86架構(gòu),也可以接入x86架構(gòu)的云資源池,否則只能根據(jù)平臺所使用操作系統(tǒng)的種類選擇對應(yīng)廠商的小型機(jī)云(如使用HP UX的業(yè)務(wù)平臺只能接入HP小型機(jī)云,使用IBM AIX的業(yè)務(wù)平臺只能接入IBM小型機(jī)云)。
(2)x86資源池支持的客戶操作系統(tǒng)
待接入x86云資源池的業(yè)務(wù)平臺各模塊或子系統(tǒng)(業(yè)務(wù)平臺全部云化或部分云化)所使用的操作系統(tǒng)必須是資源池所使用虛擬化軟件支持的客戶操作系統(tǒng)(含版本)。虛擬化產(chǎn)品所支持的客戶操作系統(tǒng)及版本情況可查詢對應(yīng)公司虛擬化產(chǎn)品支持GuestOS的兼容性列表。
(3)不能虛擬化的特殊外接設(shè)備
對于業(yè)務(wù)平臺中使用特殊外接設(shè)備(如信令卡、語音板卡、傳真卡、調(diào)制解調(diào)器、安全軟件狗、硬件加密設(shè)備等)的模塊,當(dāng)服務(wù)器虛擬化軟件不支持對特殊設(shè)備的虛擬化,且無法通過其他技術(shù)(如通過USB over Network技術(shù)解決虛擬化軟件不支持特殊USB設(shè)備的問題)解決業(yè)務(wù)平臺使用特殊設(shè)備的問題時,將無法云化,這種情況下可對平臺中符合條件的模塊進(jìn)行部分云化。
4.2.2 業(yè)務(wù)特性需求制約
云計算虛擬化“1變多”的技術(shù)就是把物理機(jī)虛擬成多臺虛擬機(jī)使用,其目的是提高服務(wù)器資源的利用率,但當(dāng)需要把一個本身對資源要求高且平時資源利用率就很高的平臺遷移到虛擬機(jī)上運(yùn)行時,這就違背了虛擬化的初衷,并且由于實施虛擬化后物理服務(wù)器上需要運(yùn)行Hypervisor軟件,將更加降低服務(wù)器的利用率。這種業(yè)務(wù)平臺就不建議遷移到云資源池中。同時對于高I/O要求的業(yè)務(wù)平臺也不建議云化,一方面虛擬化層的增加會對I/O處理有所犧牲(雖然虛擬化產(chǎn)品廠商承諾影響較?。?;另一方面資源池需要使用共享存儲以實現(xiàn)高可靠性和動態(tài)遷移等功能,如果大量高I/O要求的平臺統(tǒng)一承載在一個共享存儲上,共享存儲將是一個較大的瓶頸。另外,鑒于目前云計算技術(shù)在安全領(lǐng)域尚未給人們足夠的信心,對于承載安全性比較重要的業(yè)務(wù)平臺,也是必須要評估的因素。綜上所述,在業(yè)務(wù)特性方面,結(jié)合云計算的特點建議從如下幾個方面進(jìn)行評估。
(1)CPU資源
對于CPU資源要求非常高的業(yè)務(wù)平臺,如現(xiàn)有系統(tǒng)或應(yīng)用運(yùn)行在8核及以上(因目前虛擬化廠商的產(chǎn)品最大支持8核,今后可根據(jù)虛擬化廠商產(chǎn)品的發(fā)展,修訂評估依據(jù))的CPU物理服務(wù)器上,且平時平均利用率超過50%,暫不建議進(jìn)行虛擬化或把該平臺對CPU資源需求低的模塊進(jìn)行部分云化。
(2)I/O吞吐量
對于I/O吞吐量大的業(yè)務(wù)平臺,如系統(tǒng)或應(yīng)用運(yùn)行在每塊網(wǎng)卡上的平均網(wǎng)絡(luò)帶寬需求超過100 Mbit/s,對存儲LUN的平均IOPS大于2 000,平均吞吐量大于100 Mbit/s的DISK I/O暫不建議進(jìn)行虛擬化或采用部分云化吞吐量小的模塊。
(3)安全敏感性
對于安全等級高或涉及敏感數(shù)據(jù)的業(yè)務(wù)平臺,暫不建議云化。
4.2.3 維護(hù)管理制約
業(yè)務(wù)平臺云化后,在日常維護(hù)管理手段和云化可操作性方面也必須進(jìn)行一定的評估,主要評估內(nèi)容如下所述。
表4 業(yè)務(wù)平臺云化評估
(1)維護(hù)手段或方式
對于云化后,無法按照維護(hù)界面要求或無技術(shù)手段實現(xiàn)對業(yè)務(wù)平臺遠(yuǎn)程監(jiān)控和維護(hù)的平臺,不建議云化。
(2)網(wǎng)絡(luò)遷移的可行性
評估業(yè)務(wù)平臺云化后網(wǎng)絡(luò)遷移的可行性,特別是部分云化的業(yè)務(wù)平臺,從效益、效率、可執(zhí)行性方面進(jìn)行組網(wǎng)方案的評估。
(3)業(yè)務(wù)的忙/閑時
在實際云化時,可根據(jù)業(yè)務(wù)平臺的忙、閑時的不同,把能實現(xiàn)錯峰填谷效果的業(yè)務(wù)平臺配置在資源池的同一個集群中,將能更好地提高資源池的利用率,不建議把峰谷同步的業(yè)務(wù)平臺整合在一個集群中承載。
4.2.4 云化評估
將上述評估要素整理成評估模板,見表4,在云化過程中可根據(jù)業(yè)務(wù)平臺的實際情況,對照評估模板進(jìn)行評估,可得到業(yè)務(wù)平臺是否可云化的結(jié)論。
本文總結(jié)筆者近幾年在實施業(yè)務(wù)平臺云化方面的工作經(jīng)驗,結(jié)合云計算虛擬化技術(shù)發(fā)展的現(xiàn)狀,根據(jù)業(yè)務(wù)平臺的實際情況,摸索出了一套業(yè)務(wù)平臺云化的評估方法,探討了在實施業(yè)務(wù)平臺云化過程中需要重點關(guān)注和評估的3個方面,并針對3個方面的評估提出了具體的評估要求和參考指標(biāo),希望能在實施業(yè)務(wù)平臺云化工作中給讀者以指導(dǎo)和啟迪。
1 譚志遠(yuǎn),宮云平.云計算給業(yè)務(wù)平臺的發(fā)展與運(yùn)維帶來的機(jī)遇與挑戰(zhàn)探討.電信科學(xué),2011,27(10A):6~10
2 譚志遠(yuǎn).中國電信移動增值業(yè)務(wù)平臺快速云化解決方案.中國電信集團(tuán)公司網(wǎng)絡(luò)運(yùn)行維護(hù)事業(yè)部,2012