□ 文 程?hào)|亮 曹小剛
(作者單位:中國(guó)人民銀行武漢分行;中國(guó)人民銀行黃石市中心支行)
近年來(lái),隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)不斷向縱深發(fā)展,以大數(shù)據(jù)、人工智能為代表的現(xiàn)代信息科技正在逐步從根本上改變現(xiàn)代金融的運(yùn)營(yíng)模式。作為大數(shù)據(jù)、人工智能底層的云計(jì)算技術(shù)也得到蓬勃發(fā)展。傳統(tǒng)金融業(yè)IT架構(gòu)中,網(wǎng)絡(luò)僅具備高穩(wěn)定與高性能,但靈活性和敏捷性不夠,如根據(jù)業(yè)務(wù)需求部署上線周期較長(zhǎng),如果業(yè)務(wù)需求發(fā)生變動(dòng),重新修改相應(yīng)網(wǎng)絡(luò)架構(gòu)及配置是一件非常繁瑣的事情。同時(shí),多數(shù)據(jù)中心及多活數(shù)據(jù)中心成為關(guān)鍵業(yè)務(wù)在現(xiàn)實(shí)中的新常態(tài),數(shù)據(jù)中心間網(wǎng)絡(luò)流量調(diào)度問(wèn)題影響資源效率。此時(shí),迫切需要一種網(wǎng)絡(luò)技術(shù),與應(yīng)用實(shí)現(xiàn)一定程度互動(dòng),既能實(shí)現(xiàn)網(wǎng)絡(luò)靈活彈性管理,也能實(shí)現(xiàn)網(wǎng)絡(luò)流量精細(xì)化控制。軟件定義網(wǎng)絡(luò)(Software-Defined Network,SDN)成為一個(gè)重要解決手段。
圖1 B4網(wǎng)絡(luò)整體架構(gòu)圖
SDN于2006年誕生于美國(guó)GENI項(xiàng)目資助的斯坦福大學(xué)Clean Slate課題。SDN是一種新型的網(wǎng)絡(luò)結(jié)構(gòu),它的設(shè)計(jì)理念是將網(wǎng)絡(luò)的控制平面與數(shù)據(jù)轉(zhuǎn)發(fā)平面進(jìn)行分離,通過(guò)集中的控制器去實(shí)現(xiàn)可編程化控制底層硬件,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)資源靈活的按需調(diào)配。SDN的核心是網(wǎng)絡(luò)可編程。一個(gè)典型的SDN架構(gòu)分為三層:最上層是應(yīng)用層,通過(guò)控制器層編程接口控制底層網(wǎng)絡(luò)設(shè)備,實(shí)現(xiàn)各種業(yè)務(wù)應(yīng)用;中間為控制器層,集中管理整個(gè)網(wǎng)絡(luò)設(shè)備,并提供網(wǎng)絡(luò)資源;底層為設(shè)備層,負(fù)責(zé)與控制器層通信,實(shí)現(xiàn)相應(yīng)功能。
本文重點(diǎn)分析和研究SDN行業(yè)應(yīng)用較為成功的三個(gè)案例:谷歌、阿里巴巴和騰訊,提出金融行業(yè)應(yīng)用策略,以此推動(dòng)金融網(wǎng)絡(luò)下一步發(fā)展。
谷歌SDN應(yīng)用主要用于其世界各地的數(shù)據(jù)中心之間流量傳輸。其傳輸?shù)臄?shù)據(jù)可以分為三大類:(1)用戶數(shù)據(jù)備份,包括視頻、圖片、語(yǔ)音和文字等;(2)遠(yuǎn)程跨數(shù)據(jù)中心計(jì)算資源和存儲(chǔ)資源訪問(wèn);(3)因分布式訪問(wèn)負(fù)載均衡而進(jìn)行的大規(guī)模數(shù)據(jù)同步。這三類從前往后數(shù)據(jù)量依次變大,對(duì)延時(shí)的敏感度和優(yōu)先級(jí)依次降低。
B4網(wǎng)絡(luò)從低到高分為三個(gè)層次,分別是物理設(shè)備層(Switch Hardware)、局部網(wǎng)絡(luò)控制層(Site Controllers)和全局控制層(Global)。第一層的物理交換機(jī)和第二層的Controller在每個(gè)數(shù)據(jù)中心出口的地方部署,而第三層的SDN網(wǎng)關(guān)和TE服務(wù)器是在一個(gè)全局統(tǒng)一的控制池。第一層是谷歌自行設(shè)計(jì)并請(qǐng)其他廠商代工的物理交換機(jī),運(yùn)行OpenFlow協(xié)議,把BGP/IS-IS協(xié)議報(bào)文送到Controller層進(jìn)行處理。第二層在每個(gè)數(shù)據(jù)中心出口有一個(gè)Controller服務(wù)器集群,下層交換機(jī)可連接到多個(gè)Controller,由Paxos來(lái)選出leader(即決定工作狀態(tài)的Controller)。第三層中全局的TE Server通過(guò)SDN Gateway從各個(gè)數(shù)據(jù)中心的控制器收集鏈路信息、路徑信息。這些路徑被以IP-In-IP 隧道的方式創(chuàng)建,通過(guò)Gateway到Onix Controller,最終下發(fā)到交換機(jī)中。當(dāng)一個(gè)新的業(yè)務(wù)數(shù)據(jù)要開(kāi)始傳輸時(shí),應(yīng)用程序會(huì)評(píng)估該應(yīng)用所需要耗用的帶寬,為它選擇一條最優(yōu)路徑(如負(fù)載最輕的但非最短路徑,不丟包但延時(shí)大),然后把這個(gè)應(yīng)用對(duì)應(yīng)的流,通過(guò)Controller安裝到交換機(jī)中,并跟選擇的路徑綁定在一起。B4網(wǎng)絡(luò)整體架構(gòu)圖如圖1所示。
改造前,谷歌使用基于靜態(tài)Hash的負(fù)載均衡方式,需使用過(guò)量鏈路,提供比實(shí)際需要更多的帶寬,實(shí)際鏈路帶寬利用率只有30%-40%,網(wǎng)絡(luò)無(wú)法對(duì)上述三大類數(shù)據(jù)進(jìn)行精細(xì)匹配分流,數(shù)據(jù)傳輸路徑無(wú)法做到最優(yōu)。改造后,通過(guò)使用程序來(lái)控制網(wǎng)絡(luò),實(shí)現(xiàn)流量大小及方向的控制。鏈路數(shù)量減少,成本明顯降低,但B4網(wǎng)絡(luò)鏈路帶寬利用率提高了3倍以上,達(dá)97%,并且簡(jiǎn)化了網(wǎng)絡(luò)的流量管理和控制。
圖2 阿里云網(wǎng)絡(luò)架構(gòu)圖
圖3 SDN數(shù)據(jù)中心整體架構(gòu)視圖
阿里云主要利用SDN技術(shù)構(gòu)建一張Overlay虛擬網(wǎng)絡(luò),來(lái)實(shí)現(xiàn)海量的租戶相互之間的隔離以及高性能、安全、互聯(lián)、可靠性要求。網(wǎng)絡(luò)分為上下兩層,上層是虛擬網(wǎng)絡(luò),下層是物理網(wǎng)絡(luò)。在虛擬網(wǎng)絡(luò)的里面,租戶可以看到路由器、交換機(jī)、ECS主機(jī)以及在主機(jī)里運(yùn)行的各種服務(wù)(如SLS負(fù)載均衡服務(wù)、RDS數(shù)據(jù)庫(kù)服務(wù)、OCS cache服務(wù)等)。在虛擬網(wǎng)絡(luò)上,它既可以從ECS去訪問(wèn)對(duì)應(yīng)的RDS,也可以從ECS通過(guò)交換機(jī)和路由器來(lái)訪問(wèn)公網(wǎng)。實(shí)際承載的是它之下的物理網(wǎng)絡(luò)。通過(guò)Overlay技術(shù),物理網(wǎng)絡(luò)不再是一個(gè)復(fù)雜的節(jié)點(diǎn),減少了網(wǎng)絡(luò)出問(wèn)題的概率,網(wǎng)絡(luò)結(jié)構(gòu)穩(wěn)定。
阿里通過(guò)自研設(shè)備來(lái)實(shí)現(xiàn)互通需求。在網(wǎng)絡(luò)的架構(gòu)圖中部署了三類自研設(shè)備:虛擬交換機(jī)、數(shù)據(jù)層自研網(wǎng)絡(luò)設(shè)備和自研控制器。如圖2所示,左側(cè)是數(shù)據(jù)面,右側(cè)是控制面。虛擬交換機(jī)的主要作用是實(shí)現(xiàn)ECS之間的私網(wǎng)互聯(lián)(東西向流量)。自研網(wǎng)絡(luò)設(shè)備主要用于連接兩個(gè)不同的網(wǎng)絡(luò),完成南向流量的下發(fā),流量主要來(lái)自用戶的IDC和公網(wǎng)。所有的虛擬交換機(jī)和自研網(wǎng)絡(luò)設(shè)備中的轉(zhuǎn)發(fā)表都是由控制器下發(fā),在控制器之上的是控制臺(tái),它的分流策略架構(gòu)保證了網(wǎng)絡(luò)能夠滿足互通的需求。
不同于傳統(tǒng)的SDN,阿里云將SDN開(kāi)放給云上的每個(gè)用戶,讓用戶可以調(diào)用Open API。在基于云的網(wǎng)絡(luò)上可以自由地連接,配置路由、劃分子網(wǎng)、進(jìn)行流量控制。同時(shí)在ECS上,用戶可以按照自己的需求創(chuàng)建、釋放虛擬機(jī)來(lái)承載其流量,以實(shí)現(xiàn)彈性伸縮。通過(guò)阿里云彈性伸縮的能力,微博能應(yīng)對(duì)除夕當(dāng)天或春晚直播期間的大規(guī)模流量。微博可以在10分鐘內(nèi)使它云上的上千臺(tái)ECS規(guī)模翻倍,擴(kuò)充能力超過(guò)了流量增長(zhǎng)的數(shù)量級(jí),成本比使用SDN技術(shù)前下降了40%左右。
騰訊是目前流量最高的門戶網(wǎng)站、國(guó)內(nèi)用戶數(shù)量最大的即時(shí)通信在線社區(qū)。騰訊SDN應(yīng)用于數(shù)據(jù)中心內(nèi)部和數(shù)據(jù)中心之間。在數(shù)據(jù)中心內(nèi),集中控制器進(jìn)行控制,采用VXLAN+Service Chain,負(fù)責(zé)串接和虛擬網(wǎng)絡(luò)與物理網(wǎng)絡(luò)的解耦。流的轉(zhuǎn)發(fā)利用控制器openflow協(xié)議進(jìn)行控制。采用兼容現(xiàn)網(wǎng)的漸進(jìn)式南向協(xié)議,構(gòu)建基于騰訊運(yùn)營(yíng)場(chǎng)景的控制器和業(yè)務(wù)編排系統(tǒng),借助SDN彈性的網(wǎng)絡(luò)架構(gòu)模型來(lái)應(yīng)對(duì)數(shù)據(jù)中心云化帶來(lái)的復(fù)雜多變的網(wǎng)絡(luò)需求,如圖3所示。
在數(shù)據(jù)中心之間,SDN控制器與路由器之間運(yùn)行BGP-LS/SNMP協(xié)議,路由器將通過(guò)IGP搜集的網(wǎng)絡(luò)拓?fù)浜蛶捛闆r通過(guò)BGP-LS傳遞給SDN控制器,使用集中式路徑計(jì)算與調(diào)整,來(lái)實(shí)現(xiàn)流量的差異化實(shí)時(shí)調(diào)度。通過(guò)SDN思路和技術(shù)解決廣域網(wǎng)絡(luò)利用率、差異化QoS網(wǎng)絡(luò)質(zhì)量保障、業(yè)務(wù)冗余調(diào)度等問(wèn)題。
三個(gè)典型案例對(duì)比分析如表1所示。
金融行業(yè)網(wǎng)絡(luò)面對(duì)金融科技發(fā)展浪潮,必須結(jié)合自身實(shí)際,積極應(yīng)對(duì)業(yè)務(wù)快速發(fā)展和變化的需要。SDN為未來(lái)金融業(yè)網(wǎng)絡(luò)發(fā)展插上了智能和開(kāi)放的翅膀,成為重構(gòu)金融業(yè)數(shù)據(jù)中心網(wǎng)絡(luò)和數(shù)據(jù)中心互聯(lián)網(wǎng)絡(luò)的重要技術(shù)。
一是主動(dòng)適應(yīng)傳統(tǒng)數(shù)據(jù)中心向云數(shù)據(jù)中心、虛擬化數(shù)據(jù)中心發(fā)展趨勢(shì),積極引入SDN技術(shù)和思想,采用VXLAN等大二層技術(shù),結(jié)合SDN控制器,實(shí)現(xiàn)多租戶的云化、自動(dòng)化運(yùn)維的數(shù)據(jù)中心虛擬網(wǎng)絡(luò),大幅提升網(wǎng)絡(luò)運(yùn)維效率,支持更靈活和更便捷的業(yè)務(wù)發(fā)展需求。
二是基于金融業(yè)普遍“兩地三中心”甚至多中心的格局,積極在數(shù)據(jù)中心間互聯(lián)的廣域網(wǎng)部分引入SDN技術(shù),實(shí)現(xiàn)更加高效、便捷的廣域網(wǎng)流量調(diào)度和運(yùn)維管理,進(jìn)一步提升廣域網(wǎng)帶寬價(jià)值。
三是盡量采用公有、標(biāo)準(zhǔn)化的SDN技術(shù)和產(chǎn)品,實(shí)現(xiàn)最廣泛軟硬件兼容,提升投資價(jià)值。
四是利用SDN全局視角特點(diǎn),進(jìn)一步采集各種流量、告警、狀態(tài)等數(shù)據(jù),結(jié)合大數(shù)據(jù)分析、人工智能等技術(shù),分析應(yīng)用流量和安全流量,逐步實(shí)現(xiàn)真正智能的SDN網(wǎng)絡(luò)。■