辛笛
當(dāng)前,某省級運營商已成功建設(shè)了IT云資源池,有多個IT系統(tǒng)已經(jīng)遷移或部署到云資源池中,在IT系統(tǒng)的云化遷移和建設(shè)方面,已取得初步成效。如何選擇合理、高效的遷移方案,仍是今后需要重點關(guān)注和思考的問題。
(一)云化遷移總體方案探討
當(dāng)前,IT系統(tǒng)云化遷移方案總體上分為兩種,即:IT系統(tǒng)整體云化;IT系統(tǒng)部分云化。
所謂IT系統(tǒng)整體云化是指:IT系統(tǒng)的功能模塊全部部署在IT云資源池中,IT系統(tǒng)既要在軟件的設(shè)計上符合云資源池技術(shù)要求和資源管理原則,同時,在網(wǎng)絡(luò)設(shè)計上又要依托IT云資源池的統(tǒng)一網(wǎng)絡(luò)進(jìn)行IT系統(tǒng)承載。IT系統(tǒng)部分云化是指:IT系統(tǒng)的一部分功能模塊由IT云資源池提供資源并將其納入IT云資源池管理平臺進(jìn)行管理。IT系統(tǒng)在軟件設(shè)計上根據(jù)功能模塊、體系架構(gòu)等特點進(jìn)行相應(yīng)模塊的云化部署,在網(wǎng)絡(luò)設(shè)計上,IT云資源池網(wǎng)絡(luò)作為IT系統(tǒng)網(wǎng)絡(luò)的實現(xiàn)分支。
省級運營商在IT系統(tǒng)云化遷移前,首先應(yīng)綜合全面考慮IT系統(tǒng)的模塊構(gòu)成、系統(tǒng)流量以及系統(tǒng)運行、維護(hù)需求等因素,然后再選擇IT系統(tǒng)整體云化或者IT系統(tǒng)部分云化方案。由于IT系統(tǒng)部分云化會帶來額外的網(wǎng)絡(luò)設(shè)計、系統(tǒng)邏輯設(shè)計等問題,建議在方案選擇上,優(yōu)先選擇IT系統(tǒng)整體云化方案。
在進(jìn)行IT系統(tǒng)云化總體方案選擇時,應(yīng)遵循如下要求:
新建IT系統(tǒng),原則上采用整體云化方案設(shè)計、建設(shè)。
現(xiàn)有IT系統(tǒng),具備整體云化遷移條件的,應(yīng)結(jié)合擴(kuò)容改造工程進(jìn)行整體云化遷移。
擴(kuò)容IT系統(tǒng)的新增硬件需求,原則上由IT云資源池統(tǒng)一進(jìn)行提供。
另一方面,在部分云化/整體云化選擇上,可遵循如下策略:
對于割接復(fù)雜,部分模塊擴(kuò)容頻繁的IT系統(tǒng),可選擇部分云化,如IT系統(tǒng)云化割接需全國其他網(wǎng)元配合的系統(tǒng),其中頻繁擴(kuò)容部分資源可由IT云資源池提供。
對于割接相對便利,比如可帶地址遷移或者通過負(fù)載均衡以及DNS完成網(wǎng)絡(luò)割接的,可選擇整體云化,重要系統(tǒng)可形成原節(jié)點、云節(jié)點雙節(jié)點互為備份。
(二)IT系統(tǒng)云化遷移思路
省級運營商在進(jìn)行IT系統(tǒng)云化遷移時,應(yīng)以“安全、高效”為前提,確保IT系統(tǒng)平滑部署在IT云資源池上。IT系統(tǒng)遷移應(yīng)盡量保持對外地址不變,減少全網(wǎng)聯(lián)調(diào)。
IT系統(tǒng)云化遷移工作總體上可以分為三個階段:
第一階段:方案評估階段。該階段主要完成以下內(nèi)容:
評估IT系統(tǒng)是否適合部署在云資源池上;評估計算、網(wǎng)絡(luò)和存儲的基礎(chǔ)架構(gòu)部件需求;收集IT系統(tǒng)服務(wù)器性能及使用效率數(shù)據(jù)。
第二階段:方案設(shè)計階段。該階段主要完成以下內(nèi)容:
云化總體思路及方案;基礎(chǔ)資源方案設(shè)計;系統(tǒng)配置參數(shù)規(guī)劃;軟件系統(tǒng)設(shè)計;網(wǎng)絡(luò)配置方案設(shè)計;遷移方案設(shè)計;備份方案設(shè)計;高可靠性方案設(shè)計。
第三階段:方案實施階段。該階段主要完成以下內(nèi)容:
軟件兼容性測試;網(wǎng)絡(luò)連通測試、安全加固;性能測試、功能測試;遷移部署。
(三)IT系統(tǒng)數(shù)據(jù)庫云化遷移的注意點
IT系統(tǒng)數(shù)據(jù)庫云化遷移適用于規(guī)模較小的數(shù)據(jù)庫場景,如對數(shù)據(jù)庫服務(wù)器性能要求很高(處理能力超過單臺物理機(jī)50%以上)、且I/O讀寫相對頻繁的,建議可采用物理機(jī)方式承載。
1、數(shù)據(jù)庫云化部署
IT系統(tǒng)數(shù)據(jù)庫云化可以采用單機(jī)虛擬化承載,在數(shù)據(jù)庫單機(jī)部署模式下,可以采用服務(wù)器虛擬化環(huán)境進(jìn)行承載。虛擬化環(huán)境中數(shù)據(jù)庫單機(jī)系統(tǒng)基本可以正常運行并正常提供數(shù)據(jù)庫的定義、操作、訪問控制等功能,性能損失在可接受范圍內(nèi)(5%~26%)。
IT系統(tǒng)數(shù)據(jù)庫云化可以采用集群虛擬化承載,數(shù)據(jù)庫HA(High Available,高可用性集群)雙機(jī)集群和數(shù)據(jù)庫網(wǎng)格集群可在部分廠商虛擬化環(huán)境中部署,可以提供較高和實時的可用性服務(wù)保障,但RAC(Real Application Clusters,實時應(yīng)用集群)系統(tǒng)搭建、部署配置工作復(fù)雜,同時RAC在虛擬化環(huán)境中擴(kuò)展性能較弱,需要進(jìn)一步研究和優(yōu)化。
2、數(shù)據(jù)庫高可靠性設(shè)計
對于可靠性要求不高的數(shù)據(jù)庫,可采用虛擬機(jī)的HA技術(shù)進(jìn)行設(shè)計,數(shù)據(jù)庫服務(wù)器發(fā)生故障時,故障時間為虛擬機(jī)服務(wù)器開啟時間,一般在3-6分鐘左右。此模式下應(yīng)用層的數(shù)據(jù)庫故障時,虛擬機(jī)HA不會觸發(fā)。
對于I/O要求較高的數(shù)據(jù)庫,通常采用“緩存數(shù)據(jù)庫+主庫”的方式配置,從而適當(dāng)降低I/O 開銷。
當(dāng)單機(jī)虛擬機(jī)開銷占用物理機(jī)50%以上時可采用物理機(jī)資源直接部署數(shù)據(jù)庫及相應(yīng)的 HA或者RAC。
當(dāng)需要多臺物理機(jī)運行大型數(shù)據(jù)庫時,可考慮采用分布式數(shù)據(jù)庫(包括關(guān)系型和非關(guān)系型)技術(shù)解決I/O問題。
(四)IT系統(tǒng)云化遷移后的原設(shè)備利舊
IT系統(tǒng)遷移到云資源池后,原有設(shè)備應(yīng)充分利用,其用途如下:
原有設(shè)備系統(tǒng)作為原IT系統(tǒng)的災(zāi)備系統(tǒng),主要適用于大型能力類平臺;
設(shè)備遷移到云資源池中,但需要對遷移到云資源池中的設(shè)備做利舊評估;
設(shè)備遷移到云資源池中后,經(jīng)過評估無法遷移到云資源池的可以按照設(shè)備退網(wǎng)、報廢處理;
對于IT系統(tǒng)擴(kuò)容升級工程中,如果IT系統(tǒng)部分或全部遷移到云資源池中,設(shè)計方案中應(yīng)提出IT系統(tǒng)云化后原設(shè)備的再利用或退網(wǎng)方案。
根據(jù)具體需求,IT云資源池可向外提供如下表1的資源能力,省級運營商在遷移IT系統(tǒng)之前需要了解資源池的資源承載能力。
今后,IT系統(tǒng)云化遷移方案規(guī)劃要承接該運營商所屬集團(tuán)公司和省公司發(fā)展戰(zhàn)略,支撐綜合IT系統(tǒng)落地,提升集約運營能力。一方面,改變傳統(tǒng)資源提供方式,利用云計算技術(shù)支撐差異化產(chǎn)品部署,進(jìn)一步夯實綜合IT系統(tǒng)的資源基礎(chǔ);另一方面,實現(xiàn)各類IT系統(tǒng)硬件基礎(chǔ)資源的整合集中,統(tǒng)一管理,提升效率,降低運營成本。
作者單位:中通服咨詢設(shè)計研究院有限公司