張歡
近日,在第26屆操作系統(tǒng)原理大會上,世界領(lǐng)先的高性能計算、數(shù)據(jù)中心端到端互連方案提供商Mellanox宣布, 互聯(lián)網(wǎng)搜索巨頭百度公司現(xiàn)已采用Mellanox端到端RDMA以太網(wǎng)互連解決方案為其打造全球頂尖的AI平臺。會上百度提交了關(guān)于 “高性能RDMA協(xié)議棧關(guān)鍵技術(shù)” 的Poster。該Poster通過建立一種類Socket的RDMA通信庫,可將現(xiàn)有業(yè)務(wù)無縫遷移到高性能RDMA協(xié)議棧。百度是國內(nèi)第一家大規(guī)模部署Mellanox 100G RDMA (支持RoCE v2) 以太網(wǎng)網(wǎng)絡(luò)的企業(yè),使得百度AI集群的訓(xùn)練速度獲得了大幅度的提升,AI訓(xùn)練參數(shù)的同步時間也進一步縮短。
作為高性能互連網(wǎng)絡(luò)核心組件,Mellanox以太網(wǎng)解決方案在百度HPC集群和高性能存儲集群中發(fā)揮關(guān)鍵作用。目前, 百度人工智能研究成果已全面應(yīng)用于百度產(chǎn)品, 讓數(shù)億網(wǎng)民受益; 同時, 百度還將語音、圖像、機器翻譯等難度高、投入大的領(lǐng)先技術(shù)向業(yè)界開放, 以降低大眾創(chuàng)業(yè)、萬眾創(chuàng)新的門檻, 進一步釋放創(chuàng)業(yè)創(chuàng)新活力。endprint