NVIDIA發(fā)布全新DPU處理器，為多個(gè)行業(yè)應(yīng)用助力

2020-02-08 08:43:56齊健

智能制造 2020年11期

齊健

日前，NVIDIA GTC 2020秋季大會(huì)在線上舉行，在本次大會(huì)中，NVIDIA的硬件、軟件以及行業(yè)解決方案等多條產(chǎn)品線均推出了重要更新。其中包括全新處理器DPU，基于NVIDIA Ampere架構(gòu)的NVIDIA RTX A6000和NVIDIA A40，本地或遠(yuǎn)程實(shí)時(shí)協(xié)作平臺(tái)Omniverse的公測(cè)版本，一站式AI基礎(chǔ)設(shè)施NVIDIA DGX SuperPODTM的企業(yè)版解決方案，云AI視頻流平臺(tái)NVIDIA Maxine平臺(tái)，以及NVIDIA與全球醫(yī)療健康公司葛蘭素史克（GSK）及其AI 團(tuán)隊(duì)在醫(yī)療健康領(lǐng)域的創(chuàng)新突破。

全新處理器BlueField DPU系列

“數(shù)據(jù)中心已成為新型計(jì)算單元。在現(xiàn)代化、安全的加速數(shù)據(jù)中心中，DPU已成為其重要的組成部分。CPU、GPU和DPU的結(jié)合，可構(gòu)成完全可編程的單一AI計(jì)算單元，提供前所未有的安全性和算力?！盢VIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示，數(shù)據(jù)中心已經(jīng)成為NVIDIA的主要業(yè)務(wù)之一，其在NVIDIA的總營(yíng)收占比中也日益增加。

隨著各行業(yè)對(duì)數(shù)據(jù)應(yīng)用重視度的不斷上升，NVIDIA對(duì)數(shù)據(jù)應(yīng)用產(chǎn)品的研發(fā)投入也逐步攀升。NVIDIA推出的最新處理器DPU（Data Processing Unit，數(shù)據(jù)處理單元），是一款由新型DOCA（Data-Center-Infrastructure-On-A-Chip Architecture）架構(gòu)支持的處理器產(chǎn)品。其可實(shí)現(xiàn)具有突破性的網(wǎng)絡(luò)、存儲(chǔ)和安全性能。其中，DOCA架構(gòu)是一款全新的數(shù)據(jù)中心IOC（Infrastructure On A Chip - 基礎(chǔ)架構(gòu)級(jí)芯片）架構(gòu)。

經(jīng)過(guò)優(yōu)化的BlueField-2 DPU可從CPU上卸載關(guān)鍵的網(wǎng)絡(luò)、存儲(chǔ)和安全任務(wù)，使企業(yè)能夠?qū)⑵銲T基礎(chǔ)設(shè)施轉(zhuǎn)變?yōu)樽钕冗M(jìn)的數(shù)據(jù)中心。此類數(shù)據(jù)中心可實(shí)現(xiàn)加速、具有完全可編程性，并具有“零信任”安全功能，防止數(shù)據(jù)泄露和網(wǎng)絡(luò)攻擊。

單個(gè)BlueField-2 DPU可以提供相當(dāng)于消耗125個(gè)CPU內(nèi)核所提供的數(shù)據(jù)中心服務(wù)。由此釋放CPU內(nèi)核，以運(yùn)行各種其他企業(yè)應(yīng)用程序。NVIDIA當(dāng)前的DPU系列中包括兩款PCIe產(chǎn)品：NVIDIA BlueField-2 DPU和NVIDIA BlueField-2X DPU。

同NVIDIA CUDA編程模型助力開(kāi)發(fā)者構(gòu)建GPU加速應(yīng)用程序類似，全新NVIDIA DOCA 軟件開(kāi)發(fā)套件可助力開(kāi)發(fā)者在DPU加速數(shù)據(jù)中心基礎(chǔ)設(shè)施服務(wù)上構(gòu)建應(yīng)用程序。DOCA為開(kāi)發(fā)者提供全面的開(kāi)放式平臺(tái)，助力構(gòu)建運(yùn)行于BlueField系列DPU上的軟件定義硬件加速的網(wǎng)絡(luò)、存儲(chǔ)、安全及管理應(yīng)用程序。DOCA已完全集成于NVIDIA NGC中，該軟件目錄可提供便捷的容器化軟件環(huán)境，使第三方應(yīng)用程序提供商能夠利用先進(jìn)的DPU數(shù)據(jù)中心加速服務(wù)，為客戶開(kāi)發(fā)、認(rèn)證并分發(fā)應(yīng)用程序。

基于NVIDIA Ampere架構(gòu)的NVIDIA RTX A6000和NVIDIA A40

與上一代產(chǎn)品相比，NVIDIA Ampere GPU架構(gòu)能夠提供驚人性能。Blackmagic、Chaos Group和Luxion等軟件合作伙伴的早期測(cè)試顯示了用戶通過(guò)該全新GPU所獲得的性能提升。

NVIDIA RTX A6000和NVIDIA A40通過(guò)突破性的技術(shù)提供更強(qiáng)大的性能，包括：第二代RT Core：最高可提供2倍于上一代的吞吐量，以及并行光線追蹤、著色和計(jì)算功能。第三代Tensor Core：最高可提供5倍于上一代的吞吐量，并支持全新TF32和BF16數(shù)據(jù)格式，結(jié)合稀疏運(yùn)算特性提供10倍加速性能。

全新CUDA Core最高可提供2倍于上一代的FP32吞吐量，能夠顯著提高圖形和計(jì)算能力。48 GB GPU內(nèi)存，其中單個(gè)GPU可提供的最大內(nèi)存通過(guò)NVLink連接兩個(gè)GPU可以擴(kuò)展到96 GB。

通過(guò)添加NVIDIA虛擬工作站等NVIDIA虛擬GPU軟件，為遠(yuǎn)程用戶提供針對(duì)圖形工作負(fù)載和強(qiáng)大虛擬工作站實(shí)例的大規(guī)模支持，賦力高端設(shè)計(jì)、AI和計(jì)算工作負(fù)載的更大規(guī)模工作流程。PCIe Gen 4可提供2倍于上一代的帶寬，加速Lenovo ThinkStation P620等PCIe Gen 4服務(wù)器和工作站中數(shù)據(jù)密集型工作負(fù)載（如數(shù)據(jù)科學(xué)、混合渲染和視頻流）的GPU數(shù)據(jù)傳輸。

公測(cè)版Omniverse

在GTC的主題演講中，黃仁勛宣布NVIDIA Omniverse平臺(tái)已進(jìn)入公測(cè)階段，他表示：“物理和虛擬世界將會(huì)日益融合。Omniverse讓位于全球各地或居家辦公的創(chuàng)作者團(tuán)隊(duì)，能夠像編輯文檔一樣在同一個(gè)設(shè)計(jì)上輕松開(kāi)展協(xié)作。這是《星際迷航》全息甲板的初始，它終成現(xiàn)實(shí)?！?img src="https://cimg.fx361.com/images/2021/02/08/qkimagescadccadc202011cadc20201119-2-l.jpg"/>

Omniverse整合了NVIDIA在圖形、仿真和AI領(lǐng)域的突破，是全球首個(gè)基于NVIDIA RTX的3D仿真模擬和協(xié)作平臺(tái)。該平臺(tái)融合了物理和虛擬世界，能夠?qū)崟r(shí)模擬出細(xì)節(jié)逼真的現(xiàn)實(shí)世界。遠(yuǎn)程團(tuán)隊(duì)可以通過(guò)該平臺(tái)同時(shí)開(kāi)展項(xiàng)目協(xié)作，例如負(fù)責(zé)3D建筑設(shè)計(jì)迭代的建筑師、修改3D場(chǎng)景的動(dòng)畫(huà)師以及協(xié)作開(kāi)發(fā)自動(dòng)駕駛汽車(chē)的工程師，整個(gè)協(xié)作就像是在線上共同編輯文檔一樣簡(jiǎn)單。

NVIDIA在為期一年的搶先體驗(yàn)計(jì)劃之后發(fā)布了公測(cè)版Omniverse。搶先體驗(yàn)項(xiàng)目期間，愛(ài)立信、Foster + Partners、工業(yè)光魔（ILM）和其他40多家公司以及多達(dá)400位個(gè)人創(chuàng)作者和開(kāi)發(fā)者對(duì)該平臺(tái)進(jìn)行了評(píng)估并向NVIDIA工程團(tuán)隊(duì)提供了反饋。

Omniverse基于皮克斯應(yīng)用廣泛的Universal Scene Description（USD），一種能夠在3D應(yīng)用中實(shí)現(xiàn)通用互換的先進(jìn)格式。該平臺(tái)還使用了多項(xiàng)NVIDIA技術(shù)，例如實(shí)時(shí)照片級(jí)逼真渲染、物理效果、材質(zhì)以及在業(yè)內(nèi)領(lǐng)先3D軟件產(chǎn)品之間的交互式工作流程。Omniverse所能實(shí)現(xiàn)的協(xié)作和仿真模擬對(duì)于機(jī)器人、汽車(chē)、建筑、工程與建設(shè)、制造以及媒體和娛樂(lè)行業(yè)的客戶而言至關(guān)重要。

企業(yè)版NVIDIA DGX SuperPODTM解決方案

企業(yè)版NVIDIA DGX SuperPODTM解決方案是NVIDIA推出的首個(gè)一站式AI基礎(chǔ)設(shè)施，能夠讓企業(yè)以驚人的速度安裝功能強(qiáng)大的AI超級(jí)計(jì)算機(jī)——通常只需短短幾周時(shí)間。已上市的DGX SuperPOD是由包含20個(gè)到140個(gè)獨(dú)立的NVIDIA DGX A100TM系統(tǒng)構(gòu)建的集群，現(xiàn)已發(fā)往韓國(guó)、英國(guó)、瑞典和印度，預(yù)計(jì)在年底前安裝完畢。

DGX SuperPOD系統(tǒng)以借助NVIDIA Mellanox HDR InfiniBand網(wǎng)絡(luò)互聯(lián)的20個(gè)模塊來(lái)銷售，AI性能最低可達(dá)到100 petaflops，最高可達(dá)700 petaflops，可運(yùn)行最復(fù)雜的AI工作。

從定制化容量規(guī)劃和數(shù)據(jù)中心設(shè)計(jì)服務(wù)，到應(yīng)用程序性能測(cè)試和開(kāi)發(fā)人員操作培訓(xùn)，企業(yè)版DGX SuperPOD解決方案是實(shí)現(xiàn)大規(guī)模AI創(chuàng)新的捷徑。每臺(tái)DGX SuperPOD均由NVIDIA認(rèn)證的合作伙伴進(jìn)行調(diào)試、堆疊和配置。這些精心選拔而出的NVIDIA AI專家可確保安裝輕松易行，即便是通過(guò)大量電纜連接數(shù)十甚至數(shù)百個(gè)節(jié)點(diǎn)的AI基礎(chǔ)設(shè)施的安裝流程也十分簡(jiǎn)單。

安裝后，NVIDIA和認(rèn)證專家將與客戶合作，以確保其AI工作負(fù)載通過(guò)NGC中的最新NVIDIA軟件進(jìn)行優(yōu)化，包括云原生GPU優(yōu)化型容器、模型和適用于特定行業(yè)的SDK。

企業(yè)版DGX SuperPOD解決方案是基于NVIDIA多年致力于創(chuàng)造全球最先進(jìn)的AI系統(tǒng)的成果打造而成，旨在推動(dòng)NVIDIA在汽車(chē)、醫(yī)療健康、對(duì)話式AI、推薦系統(tǒng)、數(shù)據(jù)科學(xué)和計(jì)算機(jī)圖形等領(lǐng)域的工程。

NVIDIA Selene是一款280節(jié)點(diǎn)的DGX SuperPOD，在今年早些時(shí)候發(fā)布的TOP500和MLPerf測(cè)試中均名列前茅，奠定了AI更高的門(mén)檻。其DGX SuperPOD架構(gòu)還實(shí)現(xiàn)了效率突破，其20 gigaflops /瓦的效率創(chuàng)造了Green500性能記錄。

AI基礎(chǔ)設(shè)施需要極高的存儲(chǔ)速度，以并行處理各類數(shù)據(jù)，例如文本、表格數(shù)據(jù)、音頻和視頻。NVIDIA 企業(yè)版DGX SuperPOD解決方案采用全閃存存儲(chǔ)并經(jīng)過(guò)優(yōu)化，能滿足客戶的特定要求以及AI工作負(fù)載的獨(dú)特需求。DDN是企業(yè)版DGX SuperPOD解決方案首個(gè)通過(guò)NVIDIA認(rèn)證的存儲(chǔ)合作伙伴。

目前，NVIDIA正在基于NVIDIA DGX SuperPODTM解決方案推動(dòng)一項(xiàng)名為Cambridge-1的超級(jí)計(jì)算機(jī)建造計(jì)劃，這是一款80節(jié)點(diǎn)的DGX SuperPOD，具備400 petaflops 的AI性能。2020年年底一經(jīng)部署便將成為英國(guó)最快的超級(jí)計(jì)算機(jī)。該系統(tǒng)將被用于英國(guó)學(xué)術(shù)界、業(yè)界和初創(chuàng)企業(yè)在AI和醫(yī)療健康領(lǐng)域的合作研究。

NVIDIA發(fā)布全新DPU處理器，為多個(gè)行業(yè)應(yīng)用助力

NVIDIA發(fā)布全新DPU處理器，為多個(gè)行業(yè)應(yīng)用助力