袁文亮
【摘要】 當今,互聯(lián) 網(wǎng)業(yè)務的發(fā)展日新月異,傳統(tǒng)分布式IP網(wǎng)絡已經(jīng)成為業(yè)務發(fā)展的瓶頸。為破解業(yè)務開展過程中的諸多問題,SDN網(wǎng)絡架構(gòu)應運而生。本文對傳統(tǒng)分布式IP網(wǎng)絡和SDN網(wǎng)絡架構(gòu)進行分析,重點對提升SDN網(wǎng)絡可靠性可用性的策略進行探討,并應用到實際SDN網(wǎng)絡部署中。
【關(guān)鍵詞】 SDN 網(wǎng)絡架構(gòu) 可靠性 可用性 策略
一、背景
隨著互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)的高速發(fā)展,網(wǎng)絡的靈活性和敏捷性要求更高,現(xiàn)有的傳統(tǒng)分布式IP網(wǎng)絡的局限性日益突顯,主要表現(xiàn)為:
1.網(wǎng)絡剛性。網(wǎng)絡設(shè)備大量由單一功能的專用設(shè)備構(gòu)成,造成網(wǎng)絡復雜、無法協(xié)同、缺乏靈活性等弊端。
2.網(wǎng)元封閉。硬件和軟件一體化的封閉結(jié)構(gòu),導致設(shè)備擴展性差、價格昂貴、不同廠家的網(wǎng)元互通困難。
3.業(yè)務僵硬。不同廠家的網(wǎng)元設(shè)備功能單一封閉,新業(yè)務開發(fā)周期長、成本高,難以滿足快速靈活提供業(yè)務的要求。
4.運營復雜。大量廠家的各類專用設(shè)備以及相關(guān)的協(xié)議眾多,網(wǎng)絡規(guī)劃復雜,整合難度高,運營復雜,造成運營成本居高不下。
多年來積累的問題已經(jīng)使得今天的IP網(wǎng)絡患有“動脈硬化癥”,網(wǎng)絡架構(gòu)重構(gòu)迫在眉睫。2006年,SDN概念于是應運而生。
SDN(Software Defined Network)即軟件定義網(wǎng)絡,是一種開放靈活和可持續(xù)演進的新型網(wǎng)絡架構(gòu),采用軟件化、虛擬化的“分離”方法,將現(xiàn)有傳統(tǒng)的分布式網(wǎng)絡架構(gòu)進行重構(gòu),讓網(wǎng)絡中的控制面和數(shù)據(jù)轉(zhuǎn)發(fā)面進行分離,由傳統(tǒng)分布控制向集中控制的網(wǎng)絡轉(zhuǎn)變。
關(guān)于SDN網(wǎng)絡架構(gòu),不同的組織有不同的定義,當前較為主流的是開放網(wǎng)絡基金會ONF(Open Networking Foundation)對SDN分層架構(gòu)的定義,如圖1所示。
該分層架構(gòu)模型得到了產(chǎn)業(yè)界的廣泛認可和推廣使用。
SDN的核心是“S”即軟件,也就是網(wǎng)絡不再是“硬”的,固化封閉的,難以擴展的,而是可以通過軟件程序?qū)崿F(xiàn)靈活的新業(yè)務開發(fā)和部署,網(wǎng)絡資源可以靈活調(diào)度,使得網(wǎng)絡作為一個管道變得更加智能和彈性可用,較好地解決運營商現(xiàn)有網(wǎng)絡運營的痛點,因此,SDN概念一經(jīng)提出,就受到了運營商的青睞和積極響應。2014年以來,隨著SDN技術(shù)的逐步成熟,國內(nèi)運營商開始進行局部試點商用。
二、傳統(tǒng)分布式IP網(wǎng)絡和SDN網(wǎng)絡架構(gòu)分析
SDN是對運營商現(xiàn)有網(wǎng)絡架構(gòu)進行重構(gòu),重構(gòu)后的網(wǎng)絡是否能夠穩(wěn)定運行,是否出了故障能及時恢復,是否能達到或接近傳統(tǒng)分布式IP網(wǎng)絡的可靠性可用性要求,是運營商關(guān)注的重點之一。
2.1可靠性、可用性
網(wǎng)絡的可靠性使用網(wǎng)絡運行階段平均業(yè)務失效故障間隔時間來描述,用無故障運行時間來衡量。網(wǎng)絡的可用性使用網(wǎng)絡穩(wěn)定不出現(xiàn)故障的時間與總的時間的百分比來表示。
從通俗的角度來理解,可靠性高是指網(wǎng)絡持續(xù)一段較長時間(如一年或兩年)運行穩(wěn)定,不出現(xiàn)業(yè)務失效的故障;可用性高是指網(wǎng)絡穩(wěn)定運行不易出現(xiàn)故障,并且一旦出現(xiàn)故障能夠快速恢復。
要提升網(wǎng)絡的可靠性和可用性,通常采用冗錯技術(shù)來實現(xiàn),也就是在網(wǎng)絡設(shè)計中增加冗余資源,避免單點故障造成業(yè)務失效。
2.2傳統(tǒng)分布式IP網(wǎng)絡基本架構(gòu)分析
傳統(tǒng)分布式IP網(wǎng)絡的基本架構(gòu)如圖2所示,分為管理平面、控制平面和數(shù)據(jù)平面。管理平面為網(wǎng)管系統(tǒng),負責網(wǎng)絡監(jiān)控和業(yè)務配置,當業(yè)務配置下發(fā)后即使脫網(wǎng)也不影響網(wǎng)絡的正常運轉(zhuǎn)。控制平面和數(shù)據(jù)平面由路由器等設(shè)備組成,路由器負責按路由表轉(zhuǎn)發(fā)數(shù)據(jù)包,采用IGP和BGP兩種核心分布式動態(tài)路由協(xié)議,當網(wǎng)管把業(yè)務配置上傳到路由器后,如果網(wǎng)絡狀態(tài)發(fā)生變化,控制平面即路由器會在網(wǎng)絡中自動擴散這些變化,各自根據(jù)新的狀態(tài)自動重新計算路由,全網(wǎng)采用冗余路由技術(shù)和路由快速收斂技術(shù),當故障發(fā)生時能夠在秒級時間內(nèi)使受到影響的業(yè)務得以恢復,網(wǎng)絡具有故障快速自愈能力。
2.3 SDN網(wǎng)絡基本架構(gòu)分析
SDN網(wǎng)絡的基本架構(gòu)如下圖3所示,分為應用層、控制層、基礎(chǔ)設(shè)施層。應用層由各類商業(yè)應用軟件程序組成,通過北向接口向控制器提交各種網(wǎng)絡應用;控制層由SDN控制器組成,它是整個網(wǎng)絡的控制中心和指揮中心,是整個網(wǎng)絡的“大腦”,擁有全局網(wǎng)絡視圖,負責實時采集全網(wǎng)設(shè)備狀態(tài)、網(wǎng)絡拓撲和各鏈路流量,生成流表并通過南向接口下發(fā)給網(wǎng)絡設(shè)備,同時根據(jù)網(wǎng)絡狀態(tài)變化或應用層提交的功能更改重新生成流表并下發(fā);基礎(chǔ)設(shè)施層由網(wǎng)絡設(shè)備和線路組成,一方面負責接收控制器下發(fā)的流表并按之進行數(shù)據(jù)包轉(zhuǎn)發(fā),另一方面負責將網(wǎng)絡資源信息和狀態(tài)上報給SDN控制器,是執(zhí)行單元,本身不做決策。
從SDN網(wǎng)絡的架構(gòu)來看,SDN控制器作為網(wǎng)絡的“大腦”是關(guān)鍵部位,成為單點故障引發(fā)全網(wǎng)故障的風險點。
2.4兩種架構(gòu)的可靠性可用性比較
從傳統(tǒng)分布式IP網(wǎng)絡和SDN網(wǎng)絡的基本架構(gòu)來看,傳統(tǒng)分布式IP網(wǎng)絡的控制功能是分布式的,任何一個單點故障發(fā)生時網(wǎng)絡具有快速自愈能力,而SDN網(wǎng)絡的控制功能全部集中在SDN控制器,有單點故障引發(fā)所有業(yè)務失效風險,因此,傳統(tǒng)分布式IP網(wǎng)絡的可靠性和可用性較高,但是,SDN具有簡化網(wǎng)絡、快速業(yè)務開發(fā)和部署、低成本等核心價值,值得研究對策,讓SDN網(wǎng)絡可用。
三、提升SDN網(wǎng)絡可靠性可用性的策略
可靠性和可用性是基于網(wǎng)絡故障來考慮的,如果能夠識別出各層可能發(fā)生的故障及對網(wǎng)絡的影響程度,拿出應對策略,避免網(wǎng)絡因單點故障而癱瘓。
從SDN網(wǎng)絡架構(gòu)來看,各層可能出現(xiàn)的故障如下:
應用層
設(shè)備方面:服務器故障、應用程序故障、服務器所在機房出現(xiàn)斷電等故障。
鏈路方面:服務器與SDN控制器的通信鏈路故障。
安全方面:非法侵入等。
控制層
設(shè)備方面:服務器故障、SDN控制器軟件故障、服務器所在機樓出現(xiàn)坍塌等故障。
鏈路方面:SDN控制器和網(wǎng)絡設(shè)備之間的鏈路故障。
安全方面:非法接入或受DDOS攻擊等。
基礎(chǔ)設(shè)施層
設(shè)備方面:網(wǎng)絡設(shè)備故障。
鏈路方面:網(wǎng)絡設(shè)備之間的鏈路故障。
安全方面:非法侵入等。
針對以上各層可能出現(xiàn)的故障,以及各層在網(wǎng)絡中的重要程度,權(quán)衡成本投入以及可接受的可靠性、可用性等因素采取以下的應對策略:
3.1應用層的應對策略
應用層的設(shè)備方面故障對網(wǎng)絡的運行影響并不大,當應用需求通過北向接口提交給控制器,由控制器生成相關(guān)的業(yè)務邏輯變成相關(guān)流表下發(fā)給網(wǎng)絡設(shè)備執(zhí)行,此后,應用程序的服務器即使出現(xiàn)脫網(wǎng)等故障也暫時不會影響網(wǎng)絡的運行。因此,應用層的服務器、應用程序采用冷備份冗余設(shè)計,考慮到機房安全問題,在異地機樓部署冷備份系統(tǒng)。當主用系統(tǒng)出現(xiàn)異常時切換到冷備份系統(tǒng)上運行。
防范鏈路方面的故障,可采用一條主鏈路和一條備用鏈路。由于與應用程序通信的外部設(shè)備是可知的,因此,防范安全方面造成的故障,采取對連接的設(shè)備進行白名單設(shè)置并進行嚴格的身份認證。
3.2控制層的應對策略
SDN控制器是網(wǎng)絡的控制中心和指揮中心,一旦SDN控制器無法提供服務,假設(shè)基礎(chǔ)設(shè)施層的網(wǎng)絡沒有發(fā)生變化,網(wǎng)絡設(shè)備仍按原有的流表進行轉(zhuǎn)發(fā),不影響網(wǎng)絡運行,但是此時基礎(chǔ)設(shè)施層的網(wǎng)絡拓撲如果發(fā)生變化,沒有SDN控制器重新計算路由生成新的轉(zhuǎn)發(fā)流表,對網(wǎng)絡的運行就會造成重大影響。因此,控制層健壯性設(shè)計非常關(guān)鍵。
防范設(shè)備方面的故障,采取SDN控制器異地機樓的熱備份設(shè)計顯得尤為重要,承載SDN控制器軟件的服務器采用云化虛擬機集群,這些虛擬機獨占物理設(shè)備不與其他用戶分享,軟件采用分布式部署,主用控制器和備份控制器同時運行,都在處理業(yè)務,是負載均擔關(guān)系,因此具有超強的自愈能力來應對單臺或多臺服務器故障,冗余保護措施在故障情況下自動生效,對外服務不中斷,故障服務器修復后重新上線,系統(tǒng)自動平衡工作負載。
控制器和網(wǎng)絡設(shè)備之間的通信鏈路如果中斷導致控制器無法控制網(wǎng)絡,會造成重大影響,為了防范鏈路故障的影響,應采用控制器通過多條鏈路連接到網(wǎng)絡設(shè)備,采取帶外專門的鏈路通道,輔以帶內(nèi)控制通道作為冗余鏈路,使得任何一條鏈路故障,都不影響控制器與網(wǎng)絡設(shè)備的通信。
為防范非法接入或受DDOS攻擊,應采取在SDN控制器和網(wǎng)絡邊界處部署防火墻、入侵檢測設(shè)備以及流量清洗系統(tǒng)。通過防火墻和入侵檢測設(shè)備進行訪問控制、病毒木馬防治、非法入侵檢測、安全漏洞掃描等,采取只對特定的IP地址提供服務并按需開放端口原則,阻斷非法IP接入或攻擊;通過清洗系統(tǒng)對進出控制器的流量進行分析,一旦發(fā)現(xiàn)非法攻擊流量,立即引導非法流量到清洗部件。
3.3基礎(chǔ)設(shè)施層的應對策略
基礎(chǔ)設(shè)施層的網(wǎng)絡設(shè)備或鏈路故障,會造成部分業(yè)務中斷,故障發(fā)生后,SDN控制器會根據(jù)網(wǎng)絡變化情況,重新進行路由計算并生成新的流表下發(fā)給在線運行的網(wǎng)絡設(shè)備,實現(xiàn)網(wǎng)絡收斂。在設(shè)計網(wǎng)絡節(jié)點時采用傳統(tǒng)的設(shè)備冗余、鏈路冗余技術(shù),部署IP FRR快速重路由,一旦節(jié)點故障發(fā)生,網(wǎng)絡設(shè)備在沒有控制器控制下也能自動完成路徑切換。適當加大資源冗余度,以輕載為主,鏈路帶寬利用率控制在50%以下。防范非法侵入網(wǎng)絡設(shè)備產(chǎn)生的故障,采取管理控制網(wǎng)絡與公網(wǎng)隔離,對遠程登錄進行嚴格設(shè)置和身份認證。
四、SDN可靠性可用性策略在實際網(wǎng)絡部署中的應用
中國電信廣西公司從2014年以來,積極推進SDN網(wǎng)絡的試點工作,在實際SDN試點網(wǎng)絡部署中綜合考慮以上可靠性可用性策略,采用如圖4的方式部署:
應用層和控制層的軟件使用云資源池分配的虛擬機來承載,同時在異地機樓云資源池上部署備用系統(tǒng)。應用層和控制層的虛擬機各自獨占一個VLAN與云資源池中的其它網(wǎng)絡進行隔離。這些虛擬機獨占物理設(shè)備不與其他用戶分享。SDN控制器采用熱備份部署。
SDN控制器與網(wǎng)絡設(shè)備的通信鏈路,采用帶外管理控制網(wǎng)絡和帶內(nèi)控制通道相結(jié)合的方式。
基礎(chǔ)設(shè)施層采用設(shè)備、鏈路冗余配置。
在控制層部署防火墻、入侵檢測設(shè)備和流量清洗系統(tǒng),保障SDN控制器的安全。
通過在SDN試點網(wǎng)絡進行了專線業(yè)務開通、業(yè)務流量優(yōu)化、新業(yè)務開發(fā)和部署、模擬攻擊、設(shè)備主備倒換等一系列實驗,各項業(yè)務功能達到了預期效果,網(wǎng)絡可靠性可用性也達到商用的要求。
五、結(jié)束語
SDN網(wǎng)絡架構(gòu)具有傳統(tǒng)網(wǎng)絡無可比擬的優(yōu)勢,雖然SDN網(wǎng)絡的可靠性可用性相對于傳統(tǒng)分布式IP網(wǎng)絡而言,還有一些差距,但是可以通過以上的策略來提升SDN網(wǎng)絡的可靠性可用性,從而使SDN網(wǎng)絡達到可商用的目的。
參 考 文 獻
[1]閆長江,吳東君,熊怡 .SDN原理解析—轉(zhuǎn)控分離的SDN架構(gòu)[M].北京:人民郵電出版社,2016
[2]劉文懋,裘曉峰,王翔 .軟件定義安全:SDN/NFV新型網(wǎng)絡的安全揭秘[M].北京:機械工業(yè)出版社,2016
[3]中興通訊學院編著 .信息通信技術(shù)百科全書[M]. 北京:人民郵電出版社,2015
[4]邵廣祿 .SDN/NFV重構(gòu)未來網(wǎng)絡 電信運營商愿景與實踐[M]. 北京:人民郵電出版社,2016