文|戴爾科技集團(tuán)
在2019 年超算大會(huì)上,戴爾科技集團(tuán)(下簡(jiǎn)稱“戴爾”)推出了新的解決方案、參考架構(gòu)以及升級(jí)的產(chǎn)品組合,旨在簡(jiǎn)化并加速企業(yè)的高性能計(jì)算 (HPC) 和人工智能 (AI) 工作。
目前,各行各業(yè)的都開始采用 AI技術(shù)來解決問題,這刺激了整個(gè) HPC 行業(yè)的增長(zhǎng)。根據(jù) Hyperion Research 最近報(bào)告顯示,到 2023 年,全球 HPC 行業(yè)預(yù)計(jì)增長(zhǎng) 7.1%,而基于 HPC 服務(wù)器的 AI 市場(chǎng)預(yù)計(jì)將在 2018 年到 2023 年之間增長(zhǎng)超過 29%,達(dá)到 27 億美元的規(guī)模。
戴爾HPC副總裁 Thierry Pellegrino 表示:“企業(yè)機(jī)構(gòu)所積累的數(shù)據(jù)具有很大價(jià)值,而采用HPC 和 AI 手段可以幫助企業(yè)機(jī)構(gòu)充分利用這些數(shù)據(jù)。我們致力于構(gòu)建各種解決方案,讓不同規(guī)模的機(jī)構(gòu)在部署應(yīng)用的各個(gè)階段中,能夠更簡(jiǎn)便地使用這些技術(shù)。”
戴爾推出配置ThinkParQ BeeGFS 文件系統(tǒng)和 ArcaStream’s PixStor 文件系統(tǒng)的全新交鑰匙解決方案,擴(kuò)展了戴爾易安信HPC 存儲(chǔ)解決方案產(chǎn)品組合?;诮?jīng)過工程和測(cè)試設(shè)計(jì)的戴爾易安信HPC 存儲(chǔ)解決方案,能夠?qū)⒓夹g(shù)合作伙伴的軟件與戴爾易安信硬件、網(wǎng)絡(luò)和支持服務(wù)相結(jié)合,以簡(jiǎn)化、加快解決方案的部署和管理。
戴爾易安信HPC BeeGFS 存儲(chǔ)解決方案可借助 ThinkParQ 軟件定義的并行文件系統(tǒng),加快輸入/輸出 (I/O) 密集型工作負(fù)載,具備從小型群集擴(kuò)展到企業(yè)級(jí)系統(tǒng)(本地或云端)的能力。
此外,戴爾易安信HPC PixStor存儲(chǔ)解決方案提供高性能并行文件系統(tǒng),支持大規(guī)模數(shù)據(jù)管理,并能夠執(zhí)行
歸檔和分析。該解決方案擁有經(jīng)過驗(yàn)證的可擴(kuò)展設(shè)計(jì),包括對(duì)象、磁錄和云分層功能,可在 PowerEdge 服務(wù)器、PowerSwitch 和 Mellanox 網(wǎng)絡(luò),以及 PowerVault 存儲(chǔ)設(shè)備上運(yùn)用 PixStor Ngenea,并由戴爾提供部署和支持服務(wù)。 有了這些解決方案,企業(yè)在應(yīng)用性能和規(guī)模方面都有所提高。例如,澳大利亞國(guó)家級(jí)科研機(jī)構(gòu)聯(lián)邦科學(xué)與工業(yè)研究組織(CSIRO),是擁有全球最大型的 NVMe 存儲(chǔ)系統(tǒng)的組織之一,它所有 NVMe 存儲(chǔ)系統(tǒng)中就有 2 PB 使用了戴爾易安信HPC BeeGFS 存儲(chǔ)解決方案。該存儲(chǔ)系統(tǒng)目前在IO-500序列中排名全球第 8 位,該序列展示了全球 HPC 領(lǐng)域最快存儲(chǔ)系統(tǒng)的基準(zhǔn)排名。在倫敦帝國(guó)理工學(xué)院,戴爾易安信HPC PixStor 存儲(chǔ)解決方案可同時(shí)為現(xiàn)有的2500 節(jié)點(diǎn)的高性能計(jì)算系統(tǒng)提供服務(wù),并提供超過 20GB/s 的數(shù)據(jù)吞吐量,而不會(huì)降低交互應(yīng)用性能。
戴爾還擴(kuò)展了戴爾易安信PowerVault ME4 的存儲(chǔ)容量,提供 16TB 硬盤,讓企業(yè)可以在 15U 機(jī)架空間中將存儲(chǔ)容量擴(kuò)展到 4PB,將存儲(chǔ)密度提升 25%,從而在更小的空間中提供更高的 HPC 存儲(chǔ)容量。PowerVault 采用簡(jiǎn)化管理方式,為 HPC 配置帶來了規(guī)模、帶寬和內(nèi)置數(shù)據(jù)保護(hù)等優(yōu)勢(shì)。
戴爾易安信PowerVault ME4
戴爾易安信正在擴(kuò)展其 AI 解決方案產(chǎn)品組合,為 Domino Data Science 平臺(tái)提供全新驗(yàn)證設(shè)計(jì)。該驗(yàn)證設(shè)計(jì)由戴爾易安信與 Domino Data Lab 合作開發(fā),讓數(shù)據(jù)科學(xué)家能夠更快地開發(fā)和交付模型,同時(shí)提供一個(gè)跨整個(gè)數(shù)據(jù)科學(xué)生命周期的中心化可擴(kuò)展平臺(tái),從而加快構(gòu)思和部署過程。 Domino Data Labs 聯(lián)合創(chuàng)始人兼首席執(zhí)行官Nick Elprin 表示:“戴爾科技集團(tuán)正在將面向Domino Data Science 平臺(tái)的驗(yàn)證設(shè)計(jì)推廣至開展模型驅(qū)動(dòng)轉(zhuǎn)型的企業(yè),這一工作毋庸置疑。我們極為重視戴爾科技集團(tuán)在推行這一解決方案上的第一手觀點(diǎn)和經(jīng)驗(yàn),并期待通過戴爾易安信AI 解決方案來幫助全球企業(yè)交付集中、可重復(fù)和可測(cè)量的數(shù)據(jù)科學(xué)結(jié)果?!?/p>
為進(jìn)一步簡(jiǎn)化 AI 部署,戴爾還引入了五項(xiàng)新的參考架構(gòu),與領(lǐng)先的 AI 合作伙伴一起對(duì)戴爾易安信技術(shù)進(jìn)行優(yōu)化。這些合作伙伴包括了 DataRobot、Grid Dynamics、H2O.ai 和 Iguazio 平臺(tái)上的架構(gòu),以及 Red Hat OpenShift 平臺(tái)上的 Kubeflow。利用上述架構(gòu),各機(jī)構(gòu)可使用業(yè)界領(lǐng)先的戴爾易安信融合基礎(chǔ)架構(gòu)、服務(wù)器、存儲(chǔ)和數(shù)據(jù)保護(hù)技術(shù),以加快 AI 解決方案的部署,這些架構(gòu)針對(duì)英特爾至強(qiáng)可擴(kuò)展處理器進(jìn)行了優(yōu)化,讓各組織機(jī)構(gòu)能夠通過戴爾易安信融合基礎(chǔ)架構(gòu)、服務(wù)器、存儲(chǔ)和數(shù)據(jù)保護(hù)技術(shù),來加快部署用于AI 訓(xùn)練和推理的解決方案,最終實(shí)現(xiàn)組織機(jī)構(gòu)數(shù)據(jù)中心的現(xiàn)代化、自動(dòng)化和轉(zhuǎn)型。
戴爾易安信PowerSwitch Z 系列網(wǎng)絡(luò)交換機(jī)
戴爾推出一款戴爾易安信PowerSwitch Z 系列網(wǎng)絡(luò)交換機(jī)——戴爾易安信PowerSwitch Z9332F-ON,這是一款專為高性能工作負(fù)載設(shè)計(jì)的 400GbE 開放式網(wǎng)絡(luò)交換機(jī)。作為開放式網(wǎng)絡(luò)的先行者,戴爾兌現(xiàn)了其在軟件定義網(wǎng)絡(luò)方面的承諾,使網(wǎng)絡(luò)操作更加靈活、可編程且更易于管理。
戴爾易安信PowerSwitch Z9332FON 專為需要密集計(jì)算和存儲(chǔ)流量的云服務(wù)提供商的數(shù)據(jù)中心網(wǎng)絡(luò)而打造。相較于現(xiàn)有的 100GbE 平臺(tái),戴爾易安信新型交換機(jī)的吞吐量為現(xiàn)有平臺(tái)的四倍,性價(jià)比提高兩倍,能效也幾乎翻了一番。
加州理工大學(xué)物理學(xué)教授Harvey Newman 表示:“多年來,我們一直在研發(fā)網(wǎng)絡(luò)和 HPC 設(shè)施,如在全球大型強(qiáng)子對(duì)撞機(jī)(LHC)網(wǎng)絡(luò)的組成部分中使用戴爾易安信 PowerSwitch Z 系列產(chǎn)品。我們對(duì)高性能計(jì)算環(huán)境中交換機(jī)的成本、性能和可靠性都非常重視。它對(duì)軟件定義網(wǎng)絡(luò) (SDN) 的支持,讓我們能夠開發(fā)新的分布式系統(tǒng)和智能網(wǎng)絡(luò),更好地服務(wù)于高能物理和其他數(shù)據(jù)密集型科學(xué)學(xué)科。新款 Z9332FON 是一款功能強(qiáng)大的 400GbE 開放式網(wǎng)絡(luò)交換機(jī),能夠提供必要的寬管道,讓我們能夠?qū)?SDN 和系統(tǒng)開發(fā)擴(kuò)展到新的規(guī)模,以滿足 2021 ~ 2023 年及更遠(yuǎn)的未來在 LHC 上運(yùn)行下一波數(shù)據(jù)采集的需求?!?/p>
戴爾易安信DSS 8440 服務(wù)器
戴爾將NVIDIA T4 Tensor Core GPU 作為戴爾易安信DSS 8440 服務(wù)器的新加速器選件。該 GPU 帶有多達(dá) 16 個(gè)加速器,提供高容量和高性能的機(jī)器學(xué)習(xí)推理能力,并且能效極其出色(每 GPU 70W)。該 GPU 專為需要在企業(yè)或部門之間共享機(jī)器學(xué)習(xí)資源的多租戶環(huán)境而設(shè)計(jì)。
戴爾還將為其 PowerEdge 服務(wù)器引入新的 GPU 和 FPGA 支持,包括:
◎ NVIDIA Tesla V100S GPU,帶寬增加 25%,可直接與 Mellanox InfiniBand 互聯(lián),還可與PowerEdge Express Flash NVMe Performance PCIe SSD 通信,以實(shí)現(xiàn)更快的數(shù)據(jù)傳輸。
◎ NVIDIA RTX GPU 通過比傳統(tǒng)渲染集群低得多的成本、空間和功率需求來提升性能,并能以前所未有的速度生成高質(zhì)量?jī)?nèi)容。
◎ 戴 爾PowerEdge R740xd 和 R940xa 服務(wù)器搭載英特爾 FPGA 可編程加速卡 D5005,可增強(qiáng)推理、流分析、視頻轉(zhuǎn)碼以及金融和基因組方面的應(yīng)用性能。