徐亞平 中國鐵道科學研究院
為確保小型機虛擬化平臺數(shù)據(jù)安全穩(wěn)定,避免業(yè)務(wù)運轉(zhuǎn)受到影響,于2017 年6 月到2018 年6月公司信息專業(yè)工程搬遷期間,在公司領(lǐng)導的大力支持下實施了異地在線遷移系統(tǒng)建設(shè)。公司借鑒各領(lǐng)域信息系統(tǒng)災備建設(shè)經(jīng)驗,按照統(tǒng)一規(guī)劃、統(tǒng)一建設(shè)的原則,先異地、再同城,最終建立“兩地兩中心” 保障體系的思路積極推進,同時遵循國家標準、創(chuàng)新性、有效性等多種建設(shè)思想,大膽嘗試,力圖尋找一個對于小型機虛擬化平臺建設(shè)最具效率的先進遷移體系路線,實現(xiàn)高起點、高標準的建設(shè)目標,實現(xiàn)“信息互通、資源共享、協(xié)同配合、反應敏捷、科學施救”的在線遷移管理模式,最終建立既有機房—新建機房異地在線遷移體系。
目前,既有小型機虛擬化平臺由于多數(shù)業(yè)務(wù)系統(tǒng)均為在線生產(chǎn)業(yè)務(wù),停機時間忍耐極限時間短,離線搬遷不可行,IBM LPM動態(tài)分區(qū)遷移(是IBM 最新的虛擬化技術(shù)之一,它允許將正在運行的AIX或Linux 分區(qū),以及它們所承載的應用程序從一臺Power服務(wù)器遷移到另一臺Power服務(wù)器,而不會對基礎(chǔ)服務(wù)產(chǎn)生影響。
現(xiàn)有虛擬化平臺主機主要包括兩臺P780小型機及X86服務(wù)器虛擬化平臺集群,所有虛擬化集群主機通過存儲網(wǎng)關(guān)VPLEX存儲虛擬化連接底層存儲。
業(yè)務(wù)遷移切換后業(yè)務(wù)本身無變化,架構(gòu)的變化主要在遷移的業(yè)務(wù)。虛擬化平臺中,小型機部分除原有P780外,加入了新購兩臺P780。存儲虛擬化除原有虛擬化存儲外,新加兩臺過渡存儲。所有存儲統(tǒng)一通過存儲網(wǎng)關(guān)VPLEX實施虛擬化。業(yè)務(wù)系統(tǒng)分布原P780虛擬化平臺業(yè)務(wù)遷移至新購P780上。
此次項目實施關(guān)鍵節(jié)點流程簡要描述如下:
(1)新采購P780虛擬化平臺設(shè)備到貨上架加電,完成基礎(chǔ)軟件安裝配置;
(2)新采購的Vplex升級安裝配置,完成存儲統(tǒng)一虛擬化實現(xiàn);
(3)原有P780業(yè)務(wù)主機到新采購P780虛機LPM實施,完成所有業(yè)務(wù)系統(tǒng)的在線遷移;
(4)原有P780設(shè)備搬遷至新數(shù)據(jù)中心;
在小型機虛擬化平臺系統(tǒng)擴容的建設(shè)過程中,也遇到了很多技術(shù)難點,我們將難點轉(zhuǎn)化為亮點,實現(xiàn)系統(tǒng)建設(shè)的創(chuàng)新。
生產(chǎn)機房VPLEX Local 目前運行版本是5.2.1.02.00.03,為了實現(xiàn)“兩地兩中心”,需要將VPLEX Local升級為VPLEX Metro,但VPLEX Local升級為VPLEX Metro EMC 官網(wǎng)建議版本是5.4.1.03.00.04,故需要對現(xiàn)有運行的存儲網(wǎng)關(guān)進行在線升級操作,前期需要全面檢查設(shè)備狀態(tài)和主機運行多路徑狀態(tài)。
VPLEX LOCAL升級METRO的過程就是將單邊存儲設(shè)備升級為雙活存儲設(shè)備的過程。將LOCAL升級為METRO后就將可以生產(chǎn)機房中生產(chǎn)數(shù)據(jù)在線遷移至新機房。但是將VPLEX LOCAL升級為METRO需要兩邊機房同步進行調(diào)試工作,造成系統(tǒng)宕機的可能性比較高,現(xiàn)有生產(chǎn)機房建議在停機情況下升級為METRO和添加WAN口卡。針對無法忍受停機的業(yè)務(wù)我們建議通過使用VMAX或新HDS存儲直接分配新磁盤空間同原有磁盤做GPFS鏡像,或考慮VM虛擬機將部分業(yè)務(wù)暫時在線遷移到新分配的臨時空間上,減少停機所帶來的業(yè)務(wù)風險。
由于新機器780自帶的HMC控制臺版本為V8.6.0,考慮到VIOS版本,微碼版本和HMC版本接管問題,最終經(jīng)過各方論證討論采取以下方案:
4臺小機都選擇使用一臺單獨的HMC去管理,可以選擇新機器的HMC控制臺接管4臺power小機實施LPM。(高版本的HMC操作系統(tǒng)能管理到VIOS2.2.2.2)
高版本的HMC操作系統(tǒng)由于向下兼容機器微碼,是能正常管理到4臺power780(包括新機器P780)考慮到LPM實施的穩(wěn)定性和兼容性,在新機器780上搭載的VIOS版本也與之前的虛擬化平臺環(huán)境的VIOS版本一致,為VIOS2.2.2.2,后續(xù)LPM實施完成后,再酌情對現(xiàn)有的VIOS版本進行升級。
隨著公司業(yè)務(wù)的發(fā)展,公司開展的各種運營業(yè)務(wù)對信息化的需求日益增多,小型機虛擬化平臺的支撐作用也越來越明顯。通過此次公司信息專業(yè)搬遷的契機,將既有小型機虛擬化平臺進行了擴容和改造,進一步完善了虛擬化系統(tǒng),為未來所承載業(yè)務(wù)的信息安全,容災備份,穩(wěn)定運行等方面奠定了重要基礎(chǔ)。不斷完善的信息化架構(gòu)體系建設(shè),全面提升了企業(yè)信息化工作的安全生產(chǎn)能力。