楊錦洲 何 進(jìn) 張 國(guó)
中國(guó)聯(lián)通研究院 北京 100032
在IT系統(tǒng)云化驗(yàn)證和應(yīng)用實(shí)踐中,中國(guó)聯(lián)通進(jìn)行了多方面的研究和探索,具有一定的技術(shù)儲(chǔ)備,形成“中間厚、兩頭薄”的格局,證明云化是必走之路,但是需要本著科學(xué)審慎的態(tài)度,將基礎(chǔ)設(shè)施云化作為首要任務(wù),把底層做大,同時(shí),建立適合云化的完善配套體系。
現(xiàn)階段,業(yè)界對(duì)重要業(yè)務(wù)系統(tǒng)是否云化、何時(shí)云化的問(wèn)題一直有所顧慮,這些平臺(tái)承載的業(yè)務(wù)量大、用戶多、影響面廣,一旦出現(xiàn)問(wèn)題代價(jià)難以估量。當(dāng)前很難找到一個(gè)科學(xué)量化的模型來(lái)評(píng)估,對(duì)云化遷移的風(fēng)險(xiǎn)也不好評(píng)估。國(guó)內(nèi)外在企業(yè)級(jí)業(yè)務(wù)平臺(tái)和系統(tǒng)的云化評(píng)估上也做了一些探索。譚志遠(yuǎn)等提出的業(yè)務(wù)平臺(tái)云化評(píng)估方法[1]主要從平臺(tái)架構(gòu)、外接設(shè)備、計(jì)算要求(CPU)、I/O要求、安全等級(jí)、維護(hù)界面劃分、維護(hù)手段、網(wǎng)絡(luò)遷移可行性、平臺(tái)操作系統(tǒng)等維度進(jìn)行評(píng)估,以現(xiàn)有平臺(tái)資源使用情況為基礎(chǔ),對(duì)部分指標(biāo)進(jìn)行明確量化,具有一定可行性,但是評(píng)價(jià)維度不夠全面和體系化,未從系統(tǒng)或平臺(tái)的集成關(guān)系及數(shù)據(jù)庫(kù)方面進(jìn)行研究,且某些評(píng)價(jià)項(xiàng)主觀性較強(qiáng),未考慮效益的影響。張洪良、周振勇等提出的應(yīng)用系統(tǒng)云化遷移評(píng)估方法[2-3]中的模型從適用性指標(biāo)、短期不適用性指標(biāo)、不適用性指標(biāo)等三部分按照不同權(quán)重和分級(jí)打分,值得一提的是該模型針對(duì)應(yīng)用系統(tǒng)復(fù)雜度進(jìn)行分級(jí)評(píng)估,按應(yīng)用系統(tǒng)特點(diǎn)、數(shù)據(jù)庫(kù)特點(diǎn)、系統(tǒng)關(guān)聯(lián)度(分簡(jiǎn)單、中等、復(fù)雜三個(gè)等級(jí))進(jìn)行相應(yīng)的描述,具有一定參考價(jià)值。國(guó)外ODCA(開(kāi)放數(shù)據(jù)中心聯(lián)盟)云計(jì)算評(píng)估模型[4]介紹了一套云服務(wù)使用模型,幫助企業(yè)建立一套適合自身的商業(yè)策略,明確自適應(yīng)云服務(wù)和商業(yè)轉(zhuǎn)型的關(guān)鍵關(guān)注點(diǎn)。其中,對(duì)決定應(yīng)用和系統(tǒng)遷移到云的條件和方式進(jìn)行了較為詳細(xì)的說(shuō)明,提供了較為全面的影響因素。本文提出一套相對(duì)全面的量化評(píng)估模型,并有針對(duì)性地提出相應(yīng)的遷移策略。
IT系統(tǒng)云化是將現(xiàn)有IT系統(tǒng)遷移到云計(jì)算資源池承載的簡(jiǎn)稱,即對(duì)現(xiàn)有IT系統(tǒng)或平臺(tái)經(jīng)過(guò)云化評(píng)估之后,把適合云化、可云化的系統(tǒng)或平臺(tái)按照一定的遷移策略部署到云計(jì)算資源池上。云化架構(gòu)包括IaaS(基礎(chǔ)設(shè)施即服務(wù))、PaaS(平臺(tái)即服務(wù))、SaaS(軟件即服務(wù))三層,其中IaaS是云化的基礎(chǔ)也是相對(duì)最成熟最能體現(xiàn)云化價(jià)值的部分,故這里的云化側(cè)重IaaS層面。這個(gè)層面兩個(gè)關(guān)鍵的技術(shù)方式為虛擬化和分布式。
虛擬化,是指通過(guò)虛擬化技術(shù)將一臺(tái)計(jì)算機(jī)虛擬為多臺(tái)邏輯計(jì)算機(jī)。但其有兩個(gè)不適用的場(chǎng)景。1)對(duì)資源使用情況的評(píng)估,要求大CPU大內(nèi)存且實(shí)時(shí)性要求高,不適合做虛擬化;2)對(duì)中間件、數(shù)據(jù)庫(kù)等嚴(yán)重依賴數(shù)據(jù)庫(kù)的組件或模塊超過(guò)IO承受能力,不適合做虛擬化。
分布式,它研究如何把一個(gè)需要非常巨大的計(jì)算能力才能解決的問(wèn)題分成許多小的部分,然后把這些部分分配給許多計(jì)算機(jī)進(jìn)行處理,最后把這些計(jì)算結(jié)果綜合起來(lái)得到最終的結(jié)果。其適用場(chǎng)景:1)單臺(tái)服務(wù)器無(wú)法承受壓力;2)發(fā)生錯(cuò)誤時(shí)能自動(dòng)切換;3)提供多個(gè)對(duì)外的接口,按照一定規(guī)則,分派不同請(qǐng)求由不同接口來(lái)處理;4)把一個(gè)功能拆分成多個(gè)功能,不同功能分布部署到不同服務(wù)器上。
遷移服務(wù)是IT服務(wù)最復(fù)雜的部分。如何評(píng)估遷移的核心視角是ITSM(關(guān)注目錄、方案、TCO)、輔助視角是BCM(關(guān)注業(yè)務(wù)連續(xù)性)和ITAM(關(guān)注架構(gòu)、性能、容量),涉及從技術(shù)影響性到業(yè)務(wù)影響性到TCO效益評(píng)估??紤]到諸多影響及遷移成本,能夠成熟穩(wěn)定運(yùn)行、資源占用合理的現(xiàn)有系統(tǒng)可不必強(qiáng)行進(jìn)行云化遷移。沒(méi)有一種IT技術(shù)或架構(gòu)能解決一切的IT系統(tǒng)和平臺(tái)問(wèn)題,一定是針對(duì)應(yīng)用特點(diǎn),采用不同技術(shù)和架構(gòu),以達(dá)到更好的性價(jià)比。
本套模型原則適用云化升級(jí)改造與遷移(具體根據(jù)現(xiàn)有情況及目標(biāo)架構(gòu)共同決定),定位于云化可行性評(píng)估模型,側(cè)重IaaS層面的分析評(píng)估,目的是為了加快新業(yè)務(wù)上線與硬件交付并降低成本。該云化遷移模型通過(guò)評(píng)估打分為系統(tǒng)云化遷移的順序及方式進(jìn)行優(yōu)先級(jí)排列,從而為遷移策略提供相對(duì)科學(xué)的參考。
1)須對(duì)現(xiàn)有系統(tǒng)IT資產(chǎn)、架構(gòu)性能、數(shù)據(jù)、運(yùn)維狀況、集成關(guān)系、涉及人員、運(yùn)營(yíng)等級(jí)及時(shí)間進(jìn)行充分調(diào)研;2)須明確目標(biāo)架構(gòu)及性能指標(biāo),預(yù)估業(yè)務(wù)及用戶增長(zhǎng)量;3)須對(duì)系統(tǒng)進(jìn)行服務(wù)模塊級(jí)拆分,以使粒度橫向縱向相對(duì)統(tǒng)一且模塊間獨(dú)立;4)原則上對(duì)資源利用率較低、遷移影響較少難度較小的系統(tǒng)優(yōu)先云化遷移,對(duì)運(yùn)行良好且遷移對(duì)架構(gòu)版本改動(dòng)較大的暫緩遷移;5)主要針對(duì)擬遷移系統(tǒng)的業(yè)務(wù)價(jià)值較高,能在未來(lái)發(fā)揮效益的系統(tǒng)進(jìn)行評(píng)估。
評(píng)估脈絡(luò)從業(yè)務(wù)出發(fā)到技術(shù)因素為主進(jìn)行評(píng)價(jià),最后根據(jù)TCO進(jìn)行效益評(píng)估。涉及總部規(guī)劃計(jì)劃人員、研究院規(guī)劃人員、統(tǒng)一需求與方案組、業(yè)務(wù)人員、建設(shè)部門項(xiàng)目經(jīng)理、運(yùn)維人員、總部公共資源相關(guān)人員、設(shè)計(jì)院相關(guān)人員、外部抽樣專家(如研究院、科研機(jī)構(gòu)、中立咨詢廠商、類似研發(fā)/集成廠商)等角色,責(zé)任主體為項(xiàng)目經(jīng)理。
規(guī)劃人員將制定的涉及各項(xiàng)內(nèi)容和指標(biāo)的評(píng)估模型調(diào)研表發(fā)給建設(shè)部門項(xiàng)目經(jīng)理協(xié)調(diào)相關(guān)人員(見(jiàn)調(diào)研及評(píng)估人員分工)進(jìn)行填寫,對(duì)各系統(tǒng)進(jìn)行充分摸底、統(tǒng)一口徑;調(diào)研表匯總后,根據(jù)調(diào)研情況確定基線性能架構(gòu),由相關(guān)人員進(jìn)行評(píng)估打分;由總部牽頭確定目標(biāo)性能架構(gòu)(可指導(dǎo)落地,確定新業(yè)務(wù)上線周期、資源利用率、運(yùn)維故障率等目標(biāo)),并據(jù)此補(bǔ)充經(jīng)濟(jì)效益評(píng)估等內(nèi)容,根據(jù)調(diào)研表詳細(xì)內(nèi)容進(jìn)行打分,打分結(jié)果統(tǒng)計(jì)之后進(jìn)行遷移策略分類,并提交領(lǐng)導(dǎo)進(jìn)行決策,最終指導(dǎo)項(xiàng)目實(shí)施。建議對(duì)于規(guī)劃落地目標(biāo)明確相對(duì)成熟的系統(tǒng)用1~2周的時(shí)間完成調(diào)研及評(píng)估過(guò)程,涉及系統(tǒng)運(yùn)行數(shù)據(jù)采樣收集等其它工作的則根據(jù)實(shí)際情況完成,但最長(zhǎng)不超過(guò)兩個(gè)月(采樣收集一般一個(gè)月)。
調(diào)研及評(píng)估人員分工:1)業(yè)務(wù)應(yīng)用特點(diǎn)——業(yè)務(wù)人員(業(yè)務(wù)需求接口人)、統(tǒng)一需求與方案組;2)數(shù)據(jù)庫(kù)特點(diǎn)——相應(yīng)研發(fā)/集成廠商專家、業(yè)務(wù)人員;3)系統(tǒng)關(guān)聯(lián)度——項(xiàng)目經(jīng)理、研發(fā)/集成廠商專家、業(yè)務(wù)人員、設(shè)計(jì)院相關(guān)人員;4)IT系統(tǒng)能力——運(yùn)維人員、公共資源、設(shè)計(jì)院相關(guān)人員;5)運(yùn)維管理水平——項(xiàng)目經(jīng)理、運(yùn)維人員。
外部抽樣專家可抽取幾個(gè)系統(tǒng)進(jìn)行全面打分作為參考,規(guī)劃人員跟進(jìn)某些系統(tǒng)打分過(guò)程,以便發(fā)現(xiàn)問(wèn)題、并盡早修改完善。
1)投資TCO;2)新業(yè)務(wù)上線時(shí)間(硬件交付時(shí)間縮短);3)資源利用率(節(jié)省硬件資源);4)業(yè)務(wù)保障能力(降低異常故障率)。以上4點(diǎn)中,TCO評(píng)估是難點(diǎn),比較重要的如PM(物理機(jī))的替代成本,即VM(虛擬機(jī))的許可費(fèi);虛擬化遷移對(duì)傳統(tǒng)架構(gòu)帶來(lái)的影響性評(píng)估需要關(guān)注兩個(gè)瓶頸,一是應(yīng)用所需的內(nèi)存大小(以VMWARE為例,單VM上限64GB 32核),二是所需的共享存儲(chǔ)IO大小(即VM密度提高,IO壓力線性增大,且vSwitch對(duì)CPU的消耗達(dá)到10~15%開(kāi)銷)。另外,建議一個(gè)VM的CPU計(jì)算能力控制在50萬(wàn)tpmC(OLTP的基礎(chǔ)程序每分鐘的吞吐量),否則,粒度太大不利于遷移,反而犧牲了云化價(jià)值。
本模型繼承中國(guó)聯(lián)通2014~2016年信息系統(tǒng)規(guī)劃,針對(duì)業(yè)務(wù)價(jià)值高的系統(tǒng)(及滿足遷移必要性的系統(tǒng))進(jìn)行評(píng)估。評(píng)估維度參考ODCA(開(kāi)放數(shù)據(jù)中心聯(lián)盟)云計(jì)算評(píng)估模型[4],同時(shí),廣泛征求專家建議,充分討論完善并借鑒實(shí)際評(píng)估案例,從業(yè)務(wù)應(yīng)用特點(diǎn)、數(shù)據(jù)庫(kù)特點(diǎn)、系統(tǒng)關(guān)聯(lián)度、IT系統(tǒng)能力、運(yùn)維管理水平、現(xiàn)有系統(tǒng)效益分析六大類維度進(jìn)行評(píng)估。具體分析維度會(huì)有簡(jiǎn)單、中等、復(fù)雜三種類別,并對(duì)應(yīng)不同分?jǐn)?shù)區(qū)間,分值越低說(shuō)明系統(tǒng)復(fù)雜度越高(或目前運(yùn)行較好),遷移難度及成本越高,可以暫緩云化遷移。另外,每個(gè)具體維度會(huì)有一個(gè)權(quán)值,采用三段權(quán)值法,權(quán)值越低,評(píng)價(jià)維度對(duì)云化遷移結(jié)果影響越大,該權(quán)值可循環(huán)學(xué)習(xí)、不斷修正。
表1中,分析維度level0列,如現(xiàn)有系統(tǒng)效益分析,下方括號(hào)內(nèi)的數(shù)字表示這一難度的權(quán)重合計(jì),一定程度上反映了對(duì)云化遷移過(guò)程的影響程度。三個(gè)等級(jí)的評(píng)分為0-10分,系統(tǒng)越復(fù)雜評(píng)分越低。
需要說(shuō)明的是,系統(tǒng)打分需要經(jīng)過(guò)前期充分的調(diào)研,包括運(yùn)維側(cè)提供的詳實(shí)數(shù)據(jù),表1中部分缺失的數(shù)據(jù)需要根據(jù)調(diào)研情況確定,TCO部分需要明確基線指標(biāo)及目標(biāo)架構(gòu)和指標(biāo)。系統(tǒng)評(píng)估打分之后,根據(jù)結(jié)果選擇合適的遷移策略,如表2所示。
表1 IT系統(tǒng)云化遷移評(píng)估模型-評(píng)分依據(jù)表
表2 遷移總體策略表
將待評(píng)估系統(tǒng)經(jīng)過(guò)評(píng)估打分后得到各自的分?jǐn)?shù)和排名,按照這個(gè)結(jié)果進(jìn)行分類并制定相應(yīng)的遷移策略,指導(dǎo)工程實(shí)踐。
IT系統(tǒng)云化應(yīng)該先易后難有步驟有層次地進(jìn)行,最大限度地降低遷移風(fēng)險(xiǎn),云化層次上應(yīng)該從初級(jí)向高級(jí)演進(jìn),即按照IaaS、PaaS、SaaS的層級(jí)有選擇地根據(jù)現(xiàn)有系統(tǒng)特點(diǎn)進(jìn)行云化,新建業(yè)務(wù)系統(tǒng)采用云化方式建設(shè)。需要強(qiáng)調(diào)的一點(diǎn)是,云化離不開(kāi)與之特點(diǎn)相適應(yīng)的資源及運(yùn)營(yíng)保障,建立科學(xué)的云運(yùn)營(yíng)運(yùn)維體系非常有必要。云化遷移評(píng)估模型并非一個(gè)精準(zhǔn)的模型,需要在實(shí)踐中迭代驗(yàn)證,并根據(jù)使用情況和效果對(duì)該模型進(jìn)行不斷修正和完善。
參考文獻(xiàn)
[1]譚志遠(yuǎn),宮云平,周文紅.業(yè)務(wù)平臺(tái)云化評(píng)估方法研究[J].云技術(shù)與應(yīng)用,2013:61-64
[2]張洪良,張?jiān)品?高 ,等.應(yīng)用系統(tǒng)云化遷移評(píng)估[J].技術(shù)交流,2012(8):16-20
[3]周振勇.電信業(yè)務(wù)平臺(tái)的云化評(píng)估研究[J].數(shù)據(jù)通信,2013(3):29-34
[4]OPEN DATA CENTER ALLIANCE,Master USAGE MODEL:Business Strategy Enabled by Cloud Rev 1.0[EB/OL].(2015-04-02)[2015-04-06].http://www.docin.com/p-1114757785.html