摘要:分布式鏈路聚合技術(shù)實(shí)現(xiàn)多個(gè)數(shù)據(jù)終端設(shè)備上任意鏈路之間的業(yè)務(wù)互為備份和負(fù)載分擔(dān),同時(shí)實(shí)現(xiàn)節(jié)點(diǎn)保護(hù)功能。該技術(shù)是鏈路聚合技術(shù)發(fā)展的新階段,易于實(shí)現(xiàn)和升級(jí),極大提高了現(xiàn)有技術(shù)在鏈路備份、負(fù)載分擔(dān)、節(jié)點(diǎn)保護(hù)、故障隔離、業(yè)務(wù)倒換方面的能力。
關(guān)鍵詞: 分布式鏈路聚合;節(jié)點(diǎn)保護(hù);鏈路備份;業(yè)務(wù)保護(hù)
鏈路聚合技術(shù)已在2000年左右在IEEE802.3ad完成標(biāo)準(zhǔn)化,后由802.1AX標(biāo)準(zhǔn)對(duì)該技術(shù)的模型、操作、控制協(xié)議以及管理進(jìn)行全面規(guī)范。該技術(shù)可以將數(shù)據(jù)終端設(shè)備和數(shù)據(jù)終端設(shè)備之間的多條全雙工點(diǎn)到點(diǎn)鏈路聚合起來形成一個(gè)鏈路聚合組(LAG)。上層功能模塊則可以將鏈路聚合組當(dāng)成一條邏輯鏈路使用,從而達(dá)到平滑擴(kuò)展鏈路帶寬的目的,同時(shí)LAG組的物理鏈路之間互為備份提高了鏈路可靠性。
鏈路聚合技術(shù)采用鏈路聚合控制協(xié)議來管理鏈路配置并在鏈路間分布負(fù)載,它在增加數(shù)據(jù)終端設(shè)備之間的連接帶寬、實(shí)現(xiàn)傳輸鏈路的彈性和冗余方面起到了重要的作用。
隨著網(wǎng)絡(luò)的進(jìn)一步發(fā)展,傳統(tǒng)的鏈路聚合技術(shù)由于LAG組成員無法跨節(jié)點(diǎn)進(jìn)行鏈路捆綁,逐漸無法滿足現(xiàn)網(wǎng)應(yīng)用的需求,因此需要一種分布式LAG技術(shù)(如圖1所示)來實(shí)現(xiàn)跨節(jié)點(diǎn)的鏈路負(fù)載備份。
1應(yīng)用場(chǎng)景及需求分析
1.1應(yīng)用場(chǎng)景1:城域以太網(wǎng)
如圖2所示,在城域以太網(wǎng)通用架構(gòu)規(guī)范(MEF 4)中,兩個(gè)城域以太網(wǎng)業(yè)務(wù)提供商的網(wǎng)絡(luò)設(shè)備和以太網(wǎng)業(yè)務(wù)的分界點(diǎn)被定義為外部網(wǎng)絡(luò)間接口(ENNI)。ENNI是連接兩個(gè)網(wǎng)絡(luò)管理域之間的參考點(diǎn),也是某管理域的邊界點(diǎn)。對(duì)于某一個(gè)管理域來說,ENNI是所連接的另一個(gè)管理域的唯一參考點(diǎn)。
ENNI可以由一條或多條物理鏈路來實(shí)現(xiàn),MEF的規(guī)范中要求當(dāng)ENNI由多條物理鏈路來實(shí)現(xiàn)時(shí),則采用LAG來進(jìn)行鏈路的冗余保護(hù)。當(dāng)ENNI一端的城域網(wǎng)外部邊界由兩個(gè)或兩個(gè)以上的節(jié)點(diǎn)組成時(shí),ENNI實(shí)際上是由一個(gè)互連區(qū)域來實(shí)現(xiàn)(如圖3所示)。采用互連區(qū)域?qū)崿F(xiàn)ENNI除了可以應(yīng)付鏈路失效的情況,還可以提供節(jié)點(diǎn)失效保護(hù),更進(jìn)一步提高了ENNI的可靠性,如圖3所示為一個(gè)經(jīng)過冗余ENNI的E-LINE業(yè)務(wù)。已有的LAG技術(shù)無法滿足該組網(wǎng)需求,需采用分布式LAG技術(shù)實(shí)現(xiàn)[1]。
1.2 應(yīng)用場(chǎng)景2:移動(dòng)回程網(wǎng)
如圖4所示,在長(zhǎng)期演進(jìn)(LTE)移動(dòng)回程網(wǎng)中,可以采用eNodeB連接分組傳送網(wǎng)(PTN)二層網(wǎng)絡(luò),再由PTN連到路由器,從而連接到服務(wù)網(wǎng)關(guān)(S-GW)和移動(dòng)管理實(shí)體(MME)的方式組網(wǎng),路由器作為eNodeB、S-GW和MME的三層網(wǎng)關(guān)。路由器和PTN之間通常采用雙節(jié)點(diǎn)多鏈路互聯(lián)來提高可靠性,若采用傳統(tǒng)路由和以太網(wǎng)技術(shù),需要設(shè)計(jì)十分復(fù)雜的故障檢測(cè)、故障聯(lián)動(dòng)和倒換同步機(jī)制,對(duì)設(shè)備能力和網(wǎng)絡(luò)維護(hù)都帶來很大的壓力。這種組網(wǎng)場(chǎng)景下,采用分布式的LAG技術(shù)可以很好地解決多節(jié)點(diǎn)多鏈路互備保護(hù)和同步的問題,并大大簡(jiǎn)化路由器和PTN之間的組網(wǎng)。圖4所示的虛線方框?yàn)樗墓?jié)點(diǎn)的互連區(qū)域,對(duì)PTN下掛的eNodeB來說,兩臺(tái)路由器必須等同于同一個(gè)網(wǎng)關(guān),而對(duì)于S-GW和MME來說,兩臺(tái)路由器還是各自獨(dú)立的[2]。
1.3應(yīng)用場(chǎng)景3:云計(jì)算數(shù)據(jù)中心
如圖5所示,在云計(jì)算數(shù)據(jù)中心網(wǎng)絡(luò)內(nèi)部通常采用大二層三級(jí)組網(wǎng)模式:接入層由架頂交換機(jī)組成,以連接數(shù)十臺(tái)服務(wù)器或者內(nèi)置Blade Switch的服務(wù)器網(wǎng)絡(luò)出口,架頂交換機(jī)與匯聚層交換機(jī)通過雙歸方式進(jìn)行互連;核心層是網(wǎng)絡(luò)的L2/L3分割點(diǎn),是服務(wù)器的三層網(wǎng)關(guān),通過部署MC-LAG、vPC、虛擬路由器冗余協(xié)議+多生成樹協(xié)議(VRRP+MSTP)等提供網(wǎng)關(guān)備份和流量的負(fù)荷分擔(dān)。這些技術(shù)的實(shí)現(xiàn)、網(wǎng)絡(luò)規(guī)劃和運(yùn)營(yíng)比較復(fù)雜。如果采用分布式LAG技術(shù),可以在接入、匯聚、核心層交換機(jī)之間升級(jí)LAG技術(shù),實(shí)現(xiàn)鏈路與網(wǎng)關(guān)節(jié)點(diǎn)保護(hù)和流量的負(fù)載分擔(dān),克服傳統(tǒng)技術(shù)存在的擴(kuò)展性差和帶寬利用率低等問題[3]。
2 LAG技術(shù)原理及實(shí)現(xiàn)
分布式LAG技術(shù),指LAG組的兩端可以終結(jié)在一個(gè)或多個(gè)數(shù)據(jù)終端設(shè)備上,即增加了跨節(jié)點(diǎn)的能力,同時(shí)兼容原有的鏈路聚合技術(shù)的所有功能和能力。
如圖1所示,如果LAG的一端是由多個(gè)聚合系統(tǒng)組成,則這一端稱為門戶(Portal),即在分布式鏈路聚合模型中,LAG一端的單個(gè)聚合系統(tǒng)被一個(gè)Portal取代了。
除了繼承原鏈路聚合所能提供的能力外,分布式LAG還能提供:
·兼容性。多系統(tǒng)門戶可以連接單系統(tǒng)門戶或者傳統(tǒng)的聚合系統(tǒng)。
·管理隔離。分布式LAG所連接的兩個(gè)網(wǎng)絡(luò)屬于不同的管理域,運(yùn)行不同的故障恢復(fù)協(xié)議。
·管理獨(dú)立。分布式鏈路聚合協(xié)議并不取代分布式LAG兩端的兩個(gè)網(wǎng)絡(luò)內(nèi)部的控制協(xié)議。
·互連網(wǎng)絡(luò)的故障隔離。一個(gè)網(wǎng)絡(luò)內(nèi)的鏈路或節(jié)點(diǎn)的故障或恢復(fù),由本網(wǎng)絡(luò)內(nèi)的控制協(xié)議動(dòng)作與通過分布式鏈路聚合組連接的另一網(wǎng)絡(luò)內(nèi)的控制協(xié)議相互隔離。
·網(wǎng)絡(luò)和分布式LAG互連區(qū)域的故障隔離。門戶間的聚合鏈路故障、恢復(fù)對(duì)其連接的兩個(gè)網(wǎng)絡(luò)內(nèi)部來說是透明的。
·快速故障恢復(fù)。門戶內(nèi)的系統(tǒng)間通過內(nèi)部通信協(xié)商快速響應(yīng)故障或恢復(fù)。
·分發(fā)獨(dú)立。滿足自身網(wǎng)絡(luò)需求的幀分發(fā)算法和在聚合組內(nèi)幀分發(fā)到各聚合鏈路的分發(fā)算法不同。
2.1分布式鏈路聚合模型
為了能讓兩個(gè)或多個(gè)系統(tǒng)的鏈路加入到一個(gè)分布式LAG中,每個(gè)門戶內(nèi)的每個(gè)系統(tǒng)都需要通過分布式中繼互連起來。門戶內(nèi)的每個(gè)系統(tǒng)(為了區(qū)分傳統(tǒng)聚合組的系統(tǒng),這里稱為門戶系統(tǒng))運(yùn)行鏈路聚合協(xié)議,每個(gè)門戶系統(tǒng)對(duì)應(yīng)一個(gè)聚合器。通過分布式中繼連接多個(gè)聚合系統(tǒng)形成門戶系統(tǒng)作為鏈路聚合組的一端。從鏈路聚合組的另一端來看,該鏈路聚合組終結(jié)在一個(gè)模擬系統(tǒng)端。原則上,分布式中繼支持任意多的門戶系統(tǒng)互連,但這需要引入一些協(xié)議處理。每一個(gè)鏈路聚合功能均包括一個(gè)或多個(gè)媒體接入控制(MAC)[4]。
為了能更好地描述分布式中繼,這里用示例來說明。如圖6所示,系統(tǒng)A和系統(tǒng)B都可以執(zhí)行上層功能,這里的上層功能可以是某些幀的轉(zhuǎn)發(fā)功能,如路由器或交換機(jī)。系統(tǒng)A和系統(tǒng)B都獨(dú)自運(yùn)行了鏈路聚合子層。假設(shè)現(xiàn)在我們需要將系統(tǒng)A和系統(tǒng)B上的鏈路聚合關(guān)聯(lián)起來形成一個(gè)門戶,系統(tǒng)A和系統(tǒng)B上的聚合鏈路形成一個(gè)聚合組。這時(shí)我們就需要用到分布式中繼,如圖7所示,通過分布式中繼,使得系統(tǒng)A和系統(tǒng)B呈現(xiàn)出存在第3個(gè)模擬系統(tǒng)C。模擬系統(tǒng)C和系統(tǒng)A或系統(tǒng)B之間是上層功能層和鏈路聚合層之間的虛擬鏈路連接起來,即本端的系統(tǒng)A和系統(tǒng)B模擬成為了一個(gè)模擬系統(tǒng)C。聚合組的另一端門戶或系統(tǒng)是和系統(tǒng)C連接的,系統(tǒng)C是存在的。
分布式中繼依據(jù)的原則有:
·模擬系統(tǒng)C上的分布式中繼是一個(gè)N +1端口中繼(N 為門戶內(nèi)的系統(tǒng)個(gè)數(shù)),即N 個(gè)網(wǎng)關(guān)端口和一個(gè)模擬鏈路聚合子層。圖7中包括了2個(gè)用于連接門戶系統(tǒng)的網(wǎng)關(guān)端口以及1個(gè)模擬鏈路聚合子層。
·聚合端口移到了模擬系統(tǒng)上,對(duì)于其他系統(tǒng)來說,這些聚合端口是對(duì)等的。
·分布式中繼網(wǎng)關(guān)是虛擬連接,它將分布式中繼連接到系統(tǒng)上。
系統(tǒng)A和系統(tǒng)B的實(shí)際結(jié)構(gòu)如圖8所示,每個(gè)系統(tǒng)A和系統(tǒng)B都有自己的分布式中繼功能模塊,用于實(shí)現(xiàn)分布式中繼。分布式中繼的原則是:
·系統(tǒng)A和系統(tǒng)B中和系統(tǒng)C關(guān)聯(lián)的端口均移到分布式中繼功能的鏈路聚合子層下面。
·分布式中繼功能和上層功能層間有虛擬鏈路,稱為網(wǎng)關(guān)鏈路。
·每對(duì)分布式中繼功能間由內(nèi)連鏈路(IPL)連接,而IPL終結(jié)在分布式中繼功能上的內(nèi)連端口(IPP)上。
·有一個(gè)網(wǎng)關(guān)算法用于決定幀從哪個(gè)網(wǎng)關(guān)鏈路進(jìn)入/離開模擬分布式中繼。
·有一個(gè)端口算法用于決定從哪個(gè)門戶系統(tǒng)中的聚合端口進(jìn)入/離開模擬分布式中繼。
·分布式中繼功能用于在網(wǎng)關(guān)鏈路、IPL和鏈路聚合子層間傳送幀。
2.2會(huì)話感知的幀分發(fā)與收集
LAG聚合器的幀分發(fā)器負(fù)責(zé)根據(jù)幀分發(fā)算法將聚合器客戶層所發(fā)送的幀發(fā)送到正確的聚合端口上,幀收集器則負(fù)責(zé)將從各個(gè)聚合端口上收到的幀發(fā)送給聚合器客戶層。
LAG聚合器的幀分發(fā)器和幀接收器也可以按會(huì)話的方式實(shí)現(xiàn)幀的接收和分發(fā)。會(huì)話就是一組需要保持其序列的幀,在分布式鏈路聚合技術(shù)中,會(huì)話標(biāo)志是一個(gè)12位的數(shù)值,代表一組幀,因此每一個(gè)幀都有一個(gè)對(duì)應(yīng)的會(huì)話標(biāo)志。會(huì)話標(biāo)志可以依據(jù)幀攜帶的C-tag、S-tag、I-tag等標(biāo)簽的值或經(jīng)過映射處理之后的值確定。
會(huì)話標(biāo)志可以分為網(wǎng)關(guān)會(huì)話標(biāo)志和端口會(huì)話標(biāo)志,每個(gè)幀對(duì)應(yīng)一個(gè)網(wǎng)關(guān)會(huì)話標(biāo)志和端口會(huì)話標(biāo)志。對(duì)于下行流量(從網(wǎng)關(guān)鏈路到聚合鏈路),則依據(jù)幀的端口會(huì)話標(biāo)志來進(jìn)行幀的分發(fā);對(duì)于上行流量(從聚合鏈路到網(wǎng)關(guān)),則依據(jù)幀的網(wǎng)關(guān)會(huì)話標(biāo)志來進(jìn)行幀的分發(fā)。一般來說,網(wǎng)關(guān)會(huì)話標(biāo)志和端口會(huì)話標(biāo)志可以是一樣的。因此有如下一些要求:
·鏈路聚合協(xié)議數(shù)據(jù)單元(LACPDU)中需要攜帶能指明幀分發(fā)器所用的分發(fā)算法信息。
·幀分發(fā)器給每個(gè)幀分配一個(gè)端口會(huì)話ID,并按照端口會(huì)話ID給每個(gè)幀分配一個(gè)聚合端口。
·幀接收器和幀分發(fā)器執(zhí)行一樣的幀映射會(huì)話ID的算法。
· LACPDU中攜帶相應(yīng)信息用于說明幀分發(fā)器會(huì)將哪些會(huì)話ID分發(fā)到哪些聚合端口上。
· 幀接收器將從聚合端口上接收到的幀按分發(fā)算法進(jìn)行計(jì)算,將本不應(yīng)通過該聚合端口的會(huì)話丟棄。
通過這種幀收集器僅能從某特定聚合端口上接收某特定會(huì)話的方式可以保證幀的不亂序。因此對(duì)于分布式鏈路聚合來說,一個(gè)門戶內(nèi)的多個(gè)系統(tǒng)上的接收器需要統(tǒng)一協(xié)商確定某會(huì)話僅能從某一個(gè)聚合端口上接收。
幀收集器根據(jù)分發(fā)算法獲取幀的端口會(huì)話ID,并判斷此會(huì)話是否應(yīng)該從接收該幀的端口上收到,如果信息吻合,則該會(huì)話則會(huì)被上送到客戶側(cè)端口。
實(shí)現(xiàn)會(huì)話感知的幀分發(fā)和收集需要擴(kuò)展鏈路匯聚控制協(xié)議(LACP)協(xié)議,對(duì)每個(gè)聚合端口來說,LACP協(xié)議需要維護(hù)協(xié)商一致的配置信息、與對(duì)端系統(tǒng)交互配置信息來驗(yàn)證每端口會(huì)話ID配置選擇的一致性、以及依據(jù)從對(duì)端系統(tǒng)鏈路聚合控制實(shí)體所獲得的信息來使能或禁用基于端口會(huì)話ID的聚合器幀收集和幀分發(fā)。其中一種會(huì)話感知的流量分發(fā)算法為按幀所屬業(yè)務(wù)來劃分會(huì)話。按幀業(yè)務(wù)來確定會(huì)話ID來進(jìn)行流量分發(fā),可以實(shí)現(xiàn):
·CFM一致性。連通性錯(cuò)誤管理(CFM)的檢測(cè)幀和數(shù)據(jù)平面一致。按業(yè)務(wù)幀分發(fā)方式可以保證CFM幀和數(shù)據(jù)幀走同一條物理鏈路。
·雙向同路。對(duì)于一個(gè)特定的業(yè)務(wù)流量,其在聚合組的兩端向聚合鏈路上發(fā)的時(shí)候使用的是同一條物理鏈路,從而保證了在鏈路發(fā)生故障需要切換時(shí),受影響的業(yè)務(wù)最少;也給那些需要在發(fā)送和接收路徑嚴(yán)格對(duì)稱的協(xié)議(如IEEE 1588協(xié)議)提供支持。
·入口的可預(yù)測(cè)性。有時(shí)需要按業(yè)務(wù)對(duì)入口流量進(jìn)行測(cè)量。將一個(gè)業(yè)務(wù)的流量限制在一條鏈路上,可以方便這一動(dòng)作的執(zhí)行。
按業(yè)務(wù)分發(fā)可以應(yīng)用在分布式中繼和/或聚合器上。在使能了這種分發(fā)方式后,幀按照其幀中的Tag來分發(fā)到不同的物理聚合鏈路上。Tag的格式包括了IEEE802.1Q-2011中定義的幾種Tag:
·用戶VLAN Tag(C-TAG)。
·業(yè)務(wù)VLAN Tag或者骨干VLAN Tag(S-TAG或者B-TAG)。
·骨干業(yè)務(wù)實(shí)例Tag(I-SID)。
2.3 分布式中繼轉(zhuǎn)發(fā)原理
如果采用了會(huì)話感知的幀分發(fā)方式,幀分發(fā)器、幀接收器和分布式中繼功能都會(huì)查看幀的Tag。如果是封裝了上述幾種Tag類型,則會(huì)根據(jù)這些Tag來決定其對(duì)應(yīng)的業(yè)務(wù)ID。如果幀沒有封裝Tag,則其對(duì)應(yīng)的業(yè)務(wù)ID為0。
門戶系統(tǒng)中的分布式中繼功能有3種類型的端口:
·IPP。IPP指同一個(gè)門戶內(nèi)的門戶系統(tǒng)間IPL兩端的端口。
·虛擬網(wǎng)關(guān)端口。虛擬網(wǎng)關(guān)端口通過一條虛擬鏈路連接到分布式中繼功能所在的門戶系統(tǒng)。
·聚合器端口。聚合器下面有多個(gè)聚合端口。
分布式中繼用于將從聚合端口上收到的幀(上行幀)發(fā)送到一個(gè)網(wǎng)關(guān),或者丟棄;同時(shí),將從一個(gè)網(wǎng)關(guān)收到的幀(下行幀)發(fā)送到一個(gè)聚合端口,或者丟棄。為了轉(zhuǎn)發(fā)到正確的聚合端口或網(wǎng)關(guān),分布式中繼功能可能需要從IPL上發(fā)送幀。當(dāng)分布式中繼功能模塊在進(jìn)行幀轉(zhuǎn)發(fā)時(shí),需要為幀分配網(wǎng)關(guān)會(huì)話ID和端口會(huì)話ID,并為相應(yīng)的會(huì)話ID配置相應(yīng)的網(wǎng)關(guān)、聚合端口和IPL。通過網(wǎng)關(guān)收發(fā)的雙向幀都需要應(yīng)用網(wǎng)關(guān)算法。對(duì)于上行幀,分布式中繼功能網(wǎng)關(guān)算法決定該幀是否應(yīng)從本門戶系統(tǒng)的網(wǎng)關(guān)鏈路轉(zhuǎn)發(fā),還是通過其他鄰接門戶系統(tǒng)的網(wǎng)關(guān)鏈路發(fā)送。如果該幀的網(wǎng)關(guān)會(huì)話ID屬于本門戶系統(tǒng),則發(fā)送該幀到本門戶系統(tǒng)的網(wǎng)關(guān)鏈路;如果該幀的網(wǎng)關(guān)會(huì)話ID屬于其他鄰接門戶系統(tǒng),則發(fā)送該幀到和該鄰接門戶系統(tǒng)相連的內(nèi)連鏈路。對(duì)于下行幀,分布式中繼功能的端口算法決定是否從本門戶系統(tǒng)的聚合端口發(fā)送,還是從其他鄰接門戶系統(tǒng)的聚合鏈路發(fā)送。如果該幀的端口會(huì)話ID屬于本門戶系統(tǒng),則發(fā)送該幀到本門戶系統(tǒng)的聚合端口;如果該幀的端口會(huì)話ID屬于其他的鄰接系統(tǒng),則發(fā)送該幀到和該鄰接門戶系統(tǒng)相連接的內(nèi)連鏈路上[5]。
網(wǎng)關(guān)算法包含兩個(gè)功能:一是為幀分配網(wǎng)關(guān)會(huì)話ID,二是將網(wǎng)關(guān)會(huì)話ID配置到網(wǎng)關(guān)上。端口算法的功能也是相似的,即為幀分配端口會(huì)話ID和將端口會(huì)話ID配置到聚合端口。
在任意時(shí)刻,需要保證任意給定網(wǎng)關(guān)會(huì)話ID分配到最多一個(gè)網(wǎng)關(guān),任意給定端口會(huì)話ID配置到最多一個(gè)聚合端口。
可以給某幀配置相同的網(wǎng)關(guān)會(huì)話ID和端口會(huì)話ID(非強(qiáng)制)。當(dāng)一個(gè)幀從網(wǎng)關(guān)進(jìn)入分布式中繼功能時(shí),由端口算法決定向聚合端口或特定的IPP端口轉(zhuǎn)發(fā)該幀。當(dāng)一個(gè)幀從聚合端口收上來進(jìn)入分布式中繼功能時(shí),則由網(wǎng)關(guān)算法決定向網(wǎng)關(guān)或特定的IPP端口轉(zhuǎn)發(fā)。當(dāng)一個(gè)幀從IPL上收到時(shí),分布式中繼功能需要同時(shí)應(yīng)用網(wǎng)關(guān)算法和端口算法。
2.4分布式中繼控制協(xié)議
分布式鏈路聚合技術(shù)中本端與對(duì)端進(jìn)行鏈路聚合協(xié)商時(shí),兩端都需要分別使用統(tǒng)一的聚合參數(shù)進(jìn)行協(xié)商,才能聚合成功。本端可以是多個(gè)系統(tǒng),但對(duì)于對(duì)端來說,本端應(yīng)該是一個(gè)系統(tǒng),即本端聚合為一個(gè)模擬系統(tǒng)。這樣才符合鏈路聚合條件。
因此利用分布式中繼控制協(xié)議(DRCP),可以通過IPL建立門戶系統(tǒng)之間的通信,確保門戶系統(tǒng)上的配置(如端口算法、網(wǎng)關(guān)算法、門戶內(nèi)各系統(tǒng)的標(biāo)志等)的一致性,并確定門戶模擬系統(tǒng)的標(biāo)志。DRCP在門戶系統(tǒng)之間交互各自的狀態(tài)以及聚合端口信息(如業(yè)務(wù)的初始和備用網(wǎng)關(guān)、聚合端口列表),計(jì)算需要穿過IPL的幀并和鄰接的門戶系統(tǒng)交換信息以防止成環(huán)或重復(fù)發(fā)送。
此外,分布式中繼需要對(duì)有些鏈路聚合中的變量進(jìn)行特殊的設(shè)計(jì),以將多個(gè)聚合系統(tǒng)創(chuàng)建成一個(gè)單獨(dú)的模擬聚合系統(tǒng)。
·分布式中繼的每一個(gè)聚合端口的標(biāo)志符由該聚合端口所在的系統(tǒng)的編號(hào)和聚合端口號(hào)組成。
·分布式中繼的每一個(gè)聚合端口的管理鍵值由聚合端口所在的系統(tǒng)的編號(hào)和聚合端口物理特征碼所組成。
3結(jié)束語
文章主要研究了分布式鏈路聚合技術(shù)在承載網(wǎng)中的幾種典型的應(yīng)用場(chǎng)景和需求,介紹了分布式LAG的基本原理和功能。分布式LAG技術(shù)能夠?yàn)閮蓚€(gè)獨(dú)立網(wǎng)絡(luò)之間的一組設(shè)備提供冗余連接,以提供網(wǎng)絡(luò)互連區(qū)域的多鏈路、多節(jié)點(diǎn)的保護(hù),實(shí)現(xiàn)兩個(gè)網(wǎng)絡(luò)的管理與控制協(xié)議的獨(dú)立性,并保證同一業(yè)務(wù)流量走同一物理路徑。分布式LAG對(duì)單節(jié)點(diǎn)LAG進(jìn)行了重大改進(jìn),同時(shí)又具備后向兼容的特性。
·IPP。IPP指同一個(gè)門戶內(nèi)的門戶系統(tǒng)間IPL兩端的端口。
·虛擬網(wǎng)關(guān)端口。虛擬網(wǎng)關(guān)端口通過一條虛擬鏈路連接到分布式中繼功能所在的門戶系統(tǒng)。
·聚合器端口。聚合器下面有多個(gè)聚合端口。
分布式中繼用于將從聚合端口上收到的幀(上行幀)發(fā)送到一個(gè)網(wǎng)關(guān),或者丟棄;同時(shí),將從一個(gè)網(wǎng)關(guān)收到的幀(下行幀)發(fā)送到一個(gè)聚合端口,或者丟棄。為了轉(zhuǎn)發(fā)到正確的聚合端口或網(wǎng)關(guān),分布式中繼功能可能需要從IPL上發(fā)送幀。當(dāng)分布式中繼功能模塊在進(jìn)行幀轉(zhuǎn)發(fā)時(shí),需要為幀分配網(wǎng)關(guān)會(huì)話ID和端口會(huì)話ID,并為相應(yīng)的會(huì)話ID配置相應(yīng)的網(wǎng)關(guān)、聚合端口和IPL。通過網(wǎng)關(guān)收發(fā)的雙向幀都需要應(yīng)用網(wǎng)關(guān)算法。對(duì)于上行幀,分布式中繼功能網(wǎng)關(guān)算法決定該幀是否應(yīng)從本門戶系統(tǒng)的網(wǎng)關(guān)鏈路轉(zhuǎn)發(fā),還是通過其他鄰接門戶系統(tǒng)的網(wǎng)關(guān)鏈路發(fā)送。如果該幀的網(wǎng)關(guān)會(huì)話ID屬于本門戶系統(tǒng),則發(fā)送該幀到本門戶系統(tǒng)的網(wǎng)關(guān)鏈路;如果該幀的網(wǎng)關(guān)會(huì)話ID屬于其他鄰接門戶系統(tǒng),則發(fā)送該幀到和該鄰接門戶系統(tǒng)相連的內(nèi)連鏈路。對(duì)于下行幀,分布式中繼功能的端口算法決定是否從本門戶系統(tǒng)的聚合端口發(fā)送,還是從其他鄰接門戶系統(tǒng)的聚合鏈路發(fā)送。如果該幀的端口會(huì)話ID屬于本門戶系統(tǒng),則發(fā)送該幀到本門戶系統(tǒng)的聚合端口;如果該幀的端口會(huì)話ID屬于其他的鄰接系統(tǒng),則發(fā)送該幀到和該鄰接門戶系統(tǒng)相連接的內(nèi)連鏈路上[5]。
網(wǎng)關(guān)算法包含兩個(gè)功能:一是為幀分配網(wǎng)關(guān)會(huì)話ID,二是將網(wǎng)關(guān)會(huì)話ID配置到網(wǎng)關(guān)上。端口算法的功能也是相似的,即為幀分配端口會(huì)話ID和將端口會(huì)話ID配置到聚合端口。
在任意時(shí)刻,需要保證任意給定網(wǎng)關(guān)會(huì)話ID分配到最多一個(gè)網(wǎng)關(guān),任意給定端口會(huì)話ID配置到最多一個(gè)聚合端口。
可以給某幀配置相同的網(wǎng)關(guān)會(huì)話ID和端口會(huì)話ID(非強(qiáng)制)。當(dāng)一個(gè)幀從網(wǎng)關(guān)進(jìn)入分布式中繼功能時(shí),由端口算法決定向聚合端口或特定的IPP端口轉(zhuǎn)發(fā)該幀。當(dāng)一個(gè)幀從聚合端口收上來進(jìn)入分布式中繼功能時(shí),則由網(wǎng)關(guān)算法決定向網(wǎng)關(guān)或特定的IPP端口轉(zhuǎn)發(fā)。當(dāng)一個(gè)幀從IPL上收到時(shí),分布式中繼功能需要同時(shí)應(yīng)用網(wǎng)關(guān)算法和端口算法。
2.4分布式中繼控制協(xié)議
分布式鏈路聚合技術(shù)中本端與對(duì)端進(jìn)行鏈路聚合協(xié)商時(shí),兩端都需要分別使用統(tǒng)一的聚合參數(shù)進(jìn)行協(xié)商,才能聚合成功。本端可以是多個(gè)系統(tǒng),但對(duì)于對(duì)端來說,本端應(yīng)該是一個(gè)系統(tǒng),即本端聚合為一個(gè)模擬系統(tǒng)。這樣才符合鏈路聚合條件。
因此利用分布式中繼控制協(xié)議(DRCP),可以通過IPL建立門戶系統(tǒng)之間的通信,確保門戶系統(tǒng)上的配置(如端口算法、網(wǎng)關(guān)算法、門戶內(nèi)各系統(tǒng)的標(biāo)志等)的一致性,并確定門戶模擬系統(tǒng)的標(biāo)志。DRCP在門戶系統(tǒng)之間交互各自的狀態(tài)以及聚合端口信息(如業(yè)務(wù)的初始和備用網(wǎng)關(guān)、聚合端口列表),計(jì)算需要穿過IPL的幀并和鄰接的門戶系統(tǒng)交換信息以防止成環(huán)或重復(fù)發(fā)送。
此外,分布式中繼需要對(duì)有些鏈路聚合中的變量進(jìn)行特殊的設(shè)計(jì),以將多個(gè)聚合系統(tǒng)創(chuàng)建成一個(gè)單獨(dú)的模擬聚合系統(tǒng)。
·分布式中繼的每一個(gè)聚合端口的標(biāo)志符由該聚合端口所在的系統(tǒng)的編號(hào)和聚合端口號(hào)組成。
·分布式中繼的每一個(gè)聚合端口的管理鍵值由聚合端口所在的系統(tǒng)的編號(hào)和聚合端口物理特征碼所組成。
3結(jié)束語
文章主要研究了分布式鏈路聚合技術(shù)在承載網(wǎng)中的幾種典型的應(yīng)用場(chǎng)景和需求,介紹了分布式LAG的基本原理和功能。分布式LAG技術(shù)能夠?yàn)閮蓚€(gè)獨(dú)立網(wǎng)絡(luò)之間的一組設(shè)備提供冗余連接,以提供網(wǎng)絡(luò)互連區(qū)域的多鏈路、多節(jié)點(diǎn)的保護(hù),實(shí)現(xiàn)兩個(gè)網(wǎng)絡(luò)的管理與控制協(xié)議的獨(dú)立性,并保證同一業(yè)務(wù)流量走同一物理路徑。分布式LAG對(duì)單節(jié)點(diǎn)LAG進(jìn)行了重大改進(jìn),同時(shí)又具備后向兼容的特性。
·IPP。IPP指同一個(gè)門戶內(nèi)的門戶系統(tǒng)間IPL兩端的端口。
·虛擬網(wǎng)關(guān)端口。虛擬網(wǎng)關(guān)端口通過一條虛擬鏈路連接到分布式中繼功能所在的門戶系統(tǒng)。
·聚合器端口。聚合器下面有多個(gè)聚合端口。
分布式中繼用于將從聚合端口上收到的幀(上行幀)發(fā)送到一個(gè)網(wǎng)關(guān),或者丟棄;同時(shí),將從一個(gè)網(wǎng)關(guān)收到的幀(下行幀)發(fā)送到一個(gè)聚合端口,或者丟棄。為了轉(zhuǎn)發(fā)到正確的聚合端口或網(wǎng)關(guān),分布式中繼功能可能需要從IPL上發(fā)送幀。當(dāng)分布式中繼功能模塊在進(jìn)行幀轉(zhuǎn)發(fā)時(shí),需要為幀分配網(wǎng)關(guān)會(huì)話ID和端口會(huì)話ID,并為相應(yīng)的會(huì)話ID配置相應(yīng)的網(wǎng)關(guān)、聚合端口和IPL。通過網(wǎng)關(guān)收發(fā)的雙向幀都需要應(yīng)用網(wǎng)關(guān)算法。對(duì)于上行幀,分布式中繼功能網(wǎng)關(guān)算法決定該幀是否應(yīng)從本門戶系統(tǒng)的網(wǎng)關(guān)鏈路轉(zhuǎn)發(fā),還是通過其他鄰接門戶系統(tǒng)的網(wǎng)關(guān)鏈路發(fā)送。如果該幀的網(wǎng)關(guān)會(huì)話ID屬于本門戶系統(tǒng),則發(fā)送該幀到本門戶系統(tǒng)的網(wǎng)關(guān)鏈路;如果該幀的網(wǎng)關(guān)會(huì)話ID屬于其他鄰接門戶系統(tǒng),則發(fā)送該幀到和該鄰接門戶系統(tǒng)相連的內(nèi)連鏈路。對(duì)于下行幀,分布式中繼功能的端口算法決定是否從本門戶系統(tǒng)的聚合端口發(fā)送,還是從其他鄰接門戶系統(tǒng)的聚合鏈路發(fā)送。如果該幀的端口會(huì)話ID屬于本門戶系統(tǒng),則發(fā)送該幀到本門戶系統(tǒng)的聚合端口;如果該幀的端口會(huì)話ID屬于其他的鄰接系統(tǒng),則發(fā)送該幀到和該鄰接門戶系統(tǒng)相連接的內(nèi)連鏈路上[5]。
網(wǎng)關(guān)算法包含兩個(gè)功能:一是為幀分配網(wǎng)關(guān)會(huì)話ID,二是將網(wǎng)關(guān)會(huì)話ID配置到網(wǎng)關(guān)上。端口算法的功能也是相似的,即為幀分配端口會(huì)話ID和將端口會(huì)話ID配置到聚合端口。
在任意時(shí)刻,需要保證任意給定網(wǎng)關(guān)會(huì)話ID分配到最多一個(gè)網(wǎng)關(guān),任意給定端口會(huì)話ID配置到最多一個(gè)聚合端口。
可以給某幀配置相同的網(wǎng)關(guān)會(huì)話ID和端口會(huì)話ID(非強(qiáng)制)。當(dāng)一個(gè)幀從網(wǎng)關(guān)進(jìn)入分布式中繼功能時(shí),由端口算法決定向聚合端口或特定的IPP端口轉(zhuǎn)發(fā)該幀。當(dāng)一個(gè)幀從聚合端口收上來進(jìn)入分布式中繼功能時(shí),則由網(wǎng)關(guān)算法決定向網(wǎng)關(guān)或特定的IPP端口轉(zhuǎn)發(fā)。當(dāng)一個(gè)幀從IPL上收到時(shí),分布式中繼功能需要同時(shí)應(yīng)用網(wǎng)關(guān)算法和端口算法。
2.4分布式中繼控制協(xié)議
分布式鏈路聚合技術(shù)中本端與對(duì)端進(jìn)行鏈路聚合協(xié)商時(shí),兩端都需要分別使用統(tǒng)一的聚合參數(shù)進(jìn)行協(xié)商,才能聚合成功。本端可以是多個(gè)系統(tǒng),但對(duì)于對(duì)端來說,本端應(yīng)該是一個(gè)系統(tǒng),即本端聚合為一個(gè)模擬系統(tǒng)。這樣才符合鏈路聚合條件。
因此利用分布式中繼控制協(xié)議(DRCP),可以通過IPL建立門戶系統(tǒng)之間的通信,確保門戶系統(tǒng)上的配置(如端口算法、網(wǎng)關(guān)算法、門戶內(nèi)各系統(tǒng)的標(biāo)志等)的一致性,并確定門戶模擬系統(tǒng)的標(biāo)志。DRCP在門戶系統(tǒng)之間交互各自的狀態(tài)以及聚合端口信息(如業(yè)務(wù)的初始和備用網(wǎng)關(guān)、聚合端口列表),計(jì)算需要穿過IPL的幀并和鄰接的門戶系統(tǒng)交換信息以防止成環(huán)或重復(fù)發(fā)送。
此外,分布式中繼需要對(duì)有些鏈路聚合中的變量進(jìn)行特殊的設(shè)計(jì),以將多個(gè)聚合系統(tǒng)創(chuàng)建成一個(gè)單獨(dú)的模擬聚合系統(tǒng)。
·分布式中繼的每一個(gè)聚合端口的標(biāo)志符由該聚合端口所在的系統(tǒng)的編號(hào)和聚合端口號(hào)組成。
·分布式中繼的每一個(gè)聚合端口的管理鍵值由聚合端口所在的系統(tǒng)的編號(hào)和聚合端口物理特征碼所組成。
3結(jié)束語
文章主要研究了分布式鏈路聚合技術(shù)在承載網(wǎng)中的幾種典型的應(yīng)用場(chǎng)景和需求,介紹了分布式LAG的基本原理和功能。分布式LAG技術(shù)能夠?yàn)閮蓚€(gè)獨(dú)立網(wǎng)絡(luò)之間的一組設(shè)備提供冗余連接,以提供網(wǎng)絡(luò)互連區(qū)域的多鏈路、多節(jié)點(diǎn)的保護(hù),實(shí)現(xiàn)兩個(gè)網(wǎng)絡(luò)的管理與控制協(xié)議的獨(dú)立性,并保證同一業(yè)務(wù)流量走同一物理路徑。分布式LAG對(duì)單節(jié)點(diǎn)LAG進(jìn)行了重大改進(jìn),同時(shí)又具備后向兼容的特性。