劉洪宇
InfiniBand以其高帶寬、低延遲、易擴(kuò)展的技術(shù)特性,被認(rèn)為是刀片服務(wù)器以及集群節(jié)點之間最佳的互聯(lián)技術(shù)之一。尤其在高性能計算領(lǐng)域,這種服務(wù)器與存儲連接方案占據(jù)著絕對上風(fēng)。我國目前速度最快的高性能計算機(jī)曙光5000A就是基于Mellanox提供的ConnectX DDR Infiniband互聯(lián)技術(shù)搭建網(wǎng)絡(luò)的,它實現(xiàn)了20Gbps的傳輸速率、1.3us的低通信延遲。
I/O不該成為瓶頸
3月30日,Mellanox宣布,其第四代架構(gòu)的QDR模式Infiniband解決方案已將上兩個數(shù)字刷新為40Gbps和1us。在產(chǎn)品性能按計劃提升的同時,Mellanox還計劃將該方案向企業(yè)級數(shù)據(jù)中心及云計算市場擴(kuò)展。
Infiniband的思路是以網(wǎng)絡(luò)為中心搭建系統(tǒng),將計算、存儲與網(wǎng)絡(luò)分開,但三者一定要保持相對平衡,這樣才能保證整體性能。目前,企業(yè)級應(yīng)用及數(shù)據(jù)密集型應(yīng)用需要進(jìn)行大數(shù)據(jù)量計算和存儲,這就對網(wǎng)絡(luò)的I/O帶寬提出了高要求,服務(wù)器虛擬化還提高了對網(wǎng)絡(luò)可用性的要求。
網(wǎng)絡(luò)帶寬和延遲在很大程度上決定了系統(tǒng)的整體效率以及處理器與存儲的使用率,進(jìn)而影響到性能與功耗。在以太網(wǎng)難以滿足部分用戶對于集群、存儲網(wǎng)絡(luò)和高速服務(wù)器互聯(lián)所需的傳輸效率和延遲水平時,用戶對更快、更可靠的渴求就開始促動Infiniband在數(shù)據(jù)中心推廣應(yīng)用了。
網(wǎng)絡(luò)一體化優(yōu)勢何在
在整個系統(tǒng)中,服務(wù)器 — 交換機(jī) — 路由器 — 存儲之間通過線纜相連,Mellanox目前的解決方案包括了網(wǎng)卡、交換機(jī)、路由器及線纜在內(nèi)的全套產(chǎn)品,均支持最高40Gbps的傳輸速度。雖然以Infiniband技術(shù)見長,但Mellanox并不排斥其他互聯(lián)技術(shù),相反,它通過虛擬協(xié)議支持(VIP)技術(shù),可以使單一光纖線纜上運行多種協(xié)議,應(yīng)用保持并行狀態(tài),設(shè)備自動為各協(xié)議應(yīng)用分配相應(yīng)的傳輸帶寬。每個通路都有獨立資源,這才是網(wǎng)絡(luò)一體化的真正優(yōu)勢。
Mellanox技術(shù)負(fù)責(zé)人利特·申納爾(Gilad Shainer)表示,支持VPI技術(shù)的ConnectX網(wǎng)卡端口是一種高整合性設(shè)備,能根據(jù)接入的網(wǎng)絡(luò)設(shè)備類型,被配置成Infiniband、以太網(wǎng)、數(shù)據(jù)中心以太網(wǎng)(DCE)、FCoE等端口,以單一網(wǎng)卡取代混差的多個不同類型的網(wǎng)卡。這種網(wǎng)絡(luò)一體化的解決方案簡化了不同系統(tǒng)之間的網(wǎng)絡(luò)互聯(lián),實現(xiàn)了降低網(wǎng)絡(luò)復(fù)雜度的目標(biāo)。更重要的意義是,其提供的廣泛支持使企業(yè)級數(shù)據(jù)中心、高性能計算及嵌入式應(yīng)用在選擇設(shè)備時能獲得盡可能大的靈活性。
ConnectX本身就具有高可靠性傳輸、低延遲和高帶寬的特性,并通過由適配卡完成網(wǎng)絡(luò)協(xié)議處理及RDMA收發(fā)操作,將處理器從這部分工作中解放出來。通過合理配置,數(shù)據(jù)中心用戶可以獲得從性能到成本及管理復(fù)雜度等多方面明顯的改觀,其可擴(kuò)展性可以勝任1萬個以上的節(jié)點互聯(lián)。利特·申納爾舉例說,通過I/O整合,JP摩根的數(shù)據(jù)中心利用率已從15%提高到了75%。在虛擬化方面,ConnectX適配卡支持硬件I/O虛擬化,并提供專用適配器資源隔離和保護(hù)虛擬機(jī),將虛擬機(jī)性能提升到接近物理機(jī)的程度,增強(qiáng)了虛擬化性能。
未來網(wǎng)絡(luò)是動態(tài)的
Infiniband的發(fā)展已經(jīng)有了明確的路線圖,而越過這些指標(biāo)與技術(shù)細(xì)節(jié),我們不妨設(shè)想,未來高性能系統(tǒng)或數(shù)據(jù)中心的網(wǎng)絡(luò)究竟該是什么模樣?隨著計算模塊以英特爾至強(qiáng)5500為開端走向智能化,網(wǎng)絡(luò)等模塊最終勢必也將走向智能化,最終實現(xiàn)智能的數(shù)據(jù)中心。利特·申納爾認(rèn)為,走向簡化的網(wǎng)絡(luò)一體化是當(dāng)前的大趨勢,而目前有兩個不同的路徑。有的廠商強(qiáng)制用戶走一種固定的方向,當(dāng)這種互聯(lián)沒辦法滿足應(yīng)用需求時,用戶為了實現(xiàn)一體化,還必須使用這樣的網(wǎng)絡(luò),這并不是成功的網(wǎng)絡(luò)一體化解決方案。
“理想的解決方案是,硬件只是介質(zhì),上面進(jìn)行不同的應(yīng)用傳輸,都有相應(yīng)的虛擬協(xié)議來支持,對用戶不要做任何限制,完全是透明的?!?利特·申納爾說,“未來的網(wǎng)絡(luò)將是動態(tài)網(wǎng)絡(luò),網(wǎng)卡和交換機(jī)都是智能的,它們都是傳輸介質(zhì),不必分為各種模式,而是集各種協(xié)議為一體的單一產(chǎn)品,至于他們工作在什么狀態(tài)下,是高性能計算模式下的MPI還是通信模式下的的TCP/IP……這些完全都由應(yīng)用來決定。網(wǎng)卡和交換機(jī)可以自動識別應(yīng)用類型,工作在相應(yīng)模式下,并為應(yīng)用分配相應(yīng)的獨立資源。
利特·申納爾反問記者,預(yù)計動態(tài)網(wǎng)絡(luò)何時才會實現(xiàn)?他隨即給出了自己的答案:“2011年,這種想法就可以實現(xiàn)了,一開始可能先實現(xiàn)部分功能,后來就會逐漸實現(xiàn)全部功能了?!?/p>