王月春+張少芳
摘要:在大數(shù)據(jù)背景下,海量數(shù)據(jù)的處理對(duì)網(wǎng)絡(luò)中數(shù)據(jù)中心的虛擬化、數(shù)據(jù)遷移等問(wèn)題提出了非常高的要求。作為一種典型的網(wǎng)絡(luò)虛擬化技術(shù),針對(duì)傳統(tǒng)數(shù)據(jù)中心存在的諸多問(wèn)題,VXLAN技術(shù)通過(guò)在三層網(wǎng)絡(luò)上建立二層的邏輯隧道,使二層網(wǎng)絡(luò)數(shù)據(jù)能夠穿越三層承載網(wǎng)絡(luò)傳遞,實(shí)現(xiàn)了租戶虛擬機(jī)跨三層網(wǎng)絡(luò)的遷移,有效提高了數(shù)據(jù)中心的數(shù)據(jù)傳輸效率和硬件資源的利用率。
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)中心;虛擬機(jī);VXLAN;報(bào)文
中圖分類號(hào):TP393.1 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2017)25-0030-02
Abstract: In the background of large data, the processing of massive data puts forward very high requirements for the virtualization of data centers and data migration in the network. As a kind of typical network virtualization technology, aiming at the problems existing in the traditional data center, VXLAN technology through the establishment of two logical tunnel in the three layer network, the two network data through three layers of network transmission, realizes the virtual machine migration tenants across the three layer network, effectively improve the utilization the data center data transmission efficiency and the rate of hardware resources.
Key words: big data; data center; virtual machine; vxlan; message
1 概述
大數(shù)據(jù)又被稱為海量數(shù)據(jù)或巨量數(shù)據(jù),指的是其所涉及的數(shù)據(jù)量的規(guī)模巨大到了無(wú)法通過(guò)人工在合理的時(shí)間內(nèi)達(dá)到截取、管理、處理,并整理成人類所能夠解讀的信息。隨著大數(shù)據(jù)時(shí)代的到來(lái),網(wǎng)絡(luò)中的數(shù)據(jù)量呈指數(shù)級(jí)增長(zhǎng),而網(wǎng)絡(luò)中數(shù)據(jù)的存儲(chǔ)、交換和管理則依賴于網(wǎng)絡(luò)中的數(shù)據(jù)中心。數(shù)據(jù)中心(Data Center)通常是指在一個(gè)物理空間內(nèi)實(shí)現(xiàn)信息集中處理、存儲(chǔ)、傳輸、交換、管理的場(chǎng)所,它是對(duì)海量數(shù)據(jù)進(jìn)行運(yùn)算、交換和存儲(chǔ)的中心。在大數(shù)據(jù)時(shí)代,隨著云計(jì)算、虛擬化等相關(guān)技術(shù)的不斷發(fā)展和應(yīng)用,傳統(tǒng)的數(shù)據(jù)中心架構(gòu)已經(jīng)很難滿足分布式處理中數(shù)據(jù)遷移的需求,因此產(chǎn)生了諸如VXLAN、NVGRE、STT等技術(shù)。其中VXLAN由于支持的廠商眾多而得到了廣泛的應(yīng)用。
2 傳統(tǒng)數(shù)據(jù)中心的結(jié)構(gòu)和存在的問(wèn)題
2.1 傳統(tǒng)數(shù)據(jù)中心的結(jié)構(gòu)
傳統(tǒng)的數(shù)據(jù)中心的網(wǎng)絡(luò)結(jié)構(gòu)按照經(jīng)典的三層架構(gòu),即接入層、匯聚層和核心層,進(jìn)行部署。在接入層連接的大量的服務(wù)器則按照不同的業(yè)務(wù)功能進(jìn)行分區(qū),包括內(nèi)網(wǎng)服務(wù)器區(qū)、外網(wǎng)服務(wù)器區(qū)、互聯(lián)網(wǎng)服務(wù)器區(qū)以及數(shù)據(jù)中心管理區(qū)等。在傳統(tǒng)的數(shù)據(jù)中心中,一個(gè)業(yè)務(wù)區(qū)域通常集中了該業(yè)務(wù)所需的計(jì)算、網(wǎng)絡(luò)及存儲(chǔ)資源,不同的分區(qū)通過(guò)劃分為不同的安全分區(qū)或VLAN進(jìn)行隔離,分區(qū)之間或者禁止互訪,或者經(jīng)由三層網(wǎng)絡(luò)進(jìn)行互訪,數(shù)據(jù)中心的網(wǎng)絡(luò)流量大部分集中于南北向。這種數(shù)據(jù)中心結(jié)構(gòu)是IT資源獨(dú)立、軟件硬件緊密耦合時(shí)代的產(chǎn)物,很好地滿足了當(dāng)時(shí)對(duì)數(shù)據(jù)處理的需求。
2.2 傳統(tǒng)數(shù)據(jù)中心存在的問(wèn)題
2.2.1 東西向流量延遲太高
隨著數(shù)據(jù)量的不斷增大,為充分利用硬件資源,在數(shù)據(jù)中心引入了虛擬化技術(shù),而虛擬化技術(shù)需要將數(shù)據(jù)中心各個(gè)業(yè)務(wù)分區(qū)間的資源進(jìn)行池化,實(shí)現(xiàn)數(shù)據(jù)中心資源的有效利用,這就使數(shù)據(jù)流量模型從傳統(tǒng)的南北向流量轉(zhuǎn)變?yōu)闁|西向流量。而由于同一物理服務(wù)器上可能部署了大量的虛擬機(jī),造成流量的并發(fā)量大增,使數(shù)據(jù)中心網(wǎng)絡(luò)中存在大量的多對(duì)一、多對(duì)多的東西向流量。而東西向的流量又必須通過(guò)匯聚層的三層網(wǎng)絡(luò)進(jìn)行傳遞,這就造成了東西向流量傳遞的高延遲,而這種高延遲對(duì)于數(shù)據(jù)中心而言是不可接受的。
2.2.2 虛擬機(jī)動(dòng)態(tài)遷移受限
虛擬機(jī)動(dòng)態(tài)遷移是指在保證虛擬機(jī)上的服務(wù)能夠正常運(yùn)行的同時(shí),將一個(gè)虛擬機(jī)系統(tǒng)在物理上從一個(gè)服務(wù)器移動(dòng)到另一個(gè)服務(wù)器的過(guò)程,這種技術(shù)在數(shù)據(jù)中心的實(shí)際應(yīng)用中非常常見(jiàn)。例如,當(dāng)需要對(duì)一臺(tái)服務(wù)器進(jìn)行升級(jí)維護(hù)的時(shí)候,就需要通過(guò)虛擬機(jī)動(dòng)態(tài)遷移技術(shù)將該服務(wù)器上的虛擬機(jī)系統(tǒng)暫時(shí)遷移到另一臺(tái)物理服務(wù)器上,然后等服務(wù)器升級(jí)維護(hù)完成后,再將虛擬機(jī)系統(tǒng)遷移回來(lái)即可。需要注意的是,該遷移過(guò)程對(duì)用戶而言是無(wú)感知的,即遷移過(guò)程中虛擬機(jī)系統(tǒng)提供的服務(wù)不能中斷,這就要求參與遷移的物理服務(wù)器之間必須二層可達(dá),一旦跨越三層網(wǎng)絡(luò),就需要改變IP地址,那么其所承載的服務(wù)必然會(huì)中斷。而傳統(tǒng)的數(shù)據(jù)中心匯聚層即為三層網(wǎng)絡(luò),這就限制了虛擬機(jī)的動(dòng)態(tài)遷移范圍只能在同一匯聚層交換機(jī)之下,而無(wú)法實(shí)現(xiàn)數(shù)據(jù)中心內(nèi)部的任意遷移,更遑論跨數(shù)據(jù)中心的遷移。
3 VXLAN技術(shù)
通過(guò)對(duì)傳統(tǒng)數(shù)據(jù)中心存在的問(wèn)題進(jìn)行分析可以發(fā)現(xiàn),問(wèn)題的核心在于跨三層網(wǎng)絡(luò)帶來(lái)的限制,因此在解決方案中需要通過(guò)Overlay技術(shù)增加封裝,將MAC地址封裝在IP地址之上,將網(wǎng)絡(luò)拓?fù)溆晌锢砣龑愚D(zhuǎn)變?yōu)檫壿嫸?,進(jìn)而在數(shù)據(jù)中心內(nèi)部以及數(shù)據(jù)中心之間建立二層的邏輯隧道,如圖1所示,從而提高東西向流量的傳遞效率,實(shí)現(xiàn)跨數(shù)據(jù)中心的虛擬機(jī)動(dòng)態(tài)遷移。endprint
3.1 VXLAN組網(wǎng)架構(gòu)
作為NVO3(Network Virtualization Over Layer 3)定義的標(biāo)準(zhǔn)技術(shù)之一,VXLAN(Virtual eXtensible Local Area Network)技術(shù)可將二層報(bào)文用三層協(xié)議進(jìn)行封裝,從而實(shí)現(xiàn)二層網(wǎng)絡(luò)在三層范圍內(nèi)的擴(kuò)展,以滿足數(shù)據(jù)中心大二層虛擬機(jī)遷移的需求。其具體的組網(wǎng)邏輯架構(gòu)如圖2所示。
在圖2所示的組網(wǎng)結(jié)構(gòu)中,NVE(Network Virtualization Edge)被稱為網(wǎng)絡(luò)虛擬邊緣,部署在VXLAN網(wǎng)絡(luò)的邊緣,主要負(fù)責(zé)進(jìn)行VLAN網(wǎng)絡(luò)和VXLAN網(wǎng)絡(luò)之間數(shù)據(jù)的封裝和解封裝,經(jīng)過(guò)NVE的封裝轉(zhuǎn)換以后,NVE之間就可以基于三層基礎(chǔ)網(wǎng)絡(luò)建立Overlay的二層虛擬化網(wǎng)絡(luò)。NVE可以分為軟件NVE和硬件NVE兩種,軟件NVE一般是在服務(wù)器上安裝的軟件包,而硬件NVE則集成在交換機(jī)上,由于交換機(jī)同時(shí)是劃分和連接VLAN的設(shè)備,因此NVE又是VXLAN的二層或三層網(wǎng)關(guān),其中二層網(wǎng)關(guān)主要實(shí)現(xiàn)VXLAN與VLAN、MAC地址等之間的二層映射,而三層網(wǎng)關(guān)主要實(shí)現(xiàn)VXLAN報(bào)頭與IP報(bào)頭之間的映射。當(dāng)然不管是二層VXLAN網(wǎng)關(guān)還是三層VXLAN網(wǎng)關(guān),都是用來(lái)實(shí)現(xiàn)VXLAN網(wǎng)絡(luò)與非VXLAN網(wǎng)絡(luò)之間的連接。
3.2 VXLAN報(bào)文封裝
VXLAN采用MAC in UDP的封裝方式將二層報(bào)文用三層協(xié)議進(jìn)行封裝,具體的封裝結(jié)構(gòu)如圖3所示。
從上圖的報(bào)文封裝結(jié)構(gòu)中可以看出,原始的二層報(bào)文外部增加了VXLAN的封裝。在VXLAN的封裝中,VNI字段是VXLAN的網(wǎng)絡(luò)標(biāo)識(shí),用于區(qū)分不同的VXLAN段,VXLAN提供了24bit的VNI字段,最多可滿足16M租戶。外層的UDP封裝中,目的端口號(hào)為4789,而源端口號(hào)則是內(nèi)層以太網(wǎng)報(bào)頭通過(guò)哈希算法計(jì)算后的值。外層IP頭封裝中,源IP地址和目的IP地址分別為源虛擬機(jī)和目的虛擬機(jī)所屬VTEP(VLAN Tunnel End Point)的IP地址。外層Ethernet頭封裝中,源MAC地址和目的MAC地址為當(dāng)前報(bào)文所處鏈路的兩端設(shè)備的MAC地址。
在VXLAN報(bào)文從Ingress NVE到Egress NVE的傳遞過(guò)程中,外層的MAC地址逐跳改變,但VXLAN內(nèi)部封裝的原始報(bào)文則一直保持不變,從而使源終端的二層報(bào)文能夠穿越三層IP網(wǎng)絡(luò)到達(dá)目的終端。實(shí)際上,VXLAN網(wǎng)絡(luò)對(duì)于進(jìn)行通信的跨三層網(wǎng)絡(luò)的主機(jī)而言,相當(dāng)于是一個(gè)Bridge Fabric,用來(lái)實(shí)現(xiàn)邏輯上的二層通信。
4 總結(jié)
VXLAN技術(shù)通過(guò)在原有數(shù)據(jù)報(bào)文外部增加封裝的方式,使用MAC in UDP技術(shù)在三層IP網(wǎng)絡(luò)中建立了二層邏輯隧道,實(shí)現(xiàn)了網(wǎng)絡(luò)的邏輯扁平化,使二層數(shù)據(jù)報(bào)文可以穿越承載網(wǎng)絡(luò),提高了數(shù)據(jù)中心網(wǎng)絡(luò)東西向流量的傳遞效率,實(shí)現(xiàn)了跨數(shù)據(jù)中心的虛擬機(jī)動(dòng)態(tài)遷移,有效提高了大數(shù)據(jù)、云計(jì)算背景下數(shù)據(jù)中心的資源利用率和管理效率。
參考文獻(xiàn):
[1] 華為公司.HCNP-R&S-IENP教材[EB/OL]. http://support.huawei.com/learning/Certificate!showCertificate?lang=zh&pbiPath =term 1000025451&id=Node1000004373
[2] 劉軍,周超.策略驅(qū)動(dòng)型數(shù)據(jù)中心ACI技術(shù)詳解[M].北京:人民郵電出版社,2015.
[3] 李翔.基于VXLAN和SDN的云數(shù)據(jù)中心解決方案[J].電子科學(xué)技術(shù),2015,2(5):587-592.
[4] 王永建,張健,張富根,董真.基于VXLAN的云數(shù)據(jù)中心網(wǎng)絡(luò)研究[J].信息技術(shù),2017,50(1):78-83.
[5] 龐楊,史凡.基于SDN的VXLAN組網(wǎng)方案研究[J].電信技術(shù),2016,6:19-24.
[6] 葉柯.VXLAN網(wǎng)絡(luò)技術(shù)在SDN環(huán)境下應(yīng)用的研究[J].寧波廣播電視大學(xué)學(xué)報(bào),2015,13(3):124-128.
[7] 周偉,陳兵.基于VXLAN的運(yùn)營(yíng)商二層以太網(wǎng)演進(jìn)方案[J].電信技術(shù),2016,8(9):56-60.
[8] 石晶.基于SDN+VXLAN在DCI部署方案[J].信息通信,2016(7):209-210.endprint