齊健
日前,NVIDIA GTC 2020秋季大會(huì)在線上舉行,在本次大會(huì)中,NVIDIA的硬件、軟件以及行業(yè)解決方案等多條產(chǎn)品線均推出了重要更新。其中包括全新處理器DPU,基于NVIDIA Ampere架構(gòu)的NVIDIA RTX A6000和NVIDIA A40,本地或遠(yuǎn)程實(shí)時(shí)協(xié)作平臺(tái)Omniverse的公測(cè)版本,一站式AI基礎(chǔ)設(shè)施NVIDIA DGX SuperPODTM的企業(yè)版解決方案,云AI視頻流平臺(tái)NVIDIA Maxine平臺(tái),以及NVIDIA與全球醫(yī)療健康公司葛蘭素史克(GSK)及其AI 團(tuán)隊(duì)在醫(yī)療健康領(lǐng)域的創(chuàng)新突破。
全新處理器BlueField DPU系列
“數(shù)據(jù)中心已成為新型計(jì)算單元。在現(xiàn)代化、安全的加速數(shù)據(jù)中心中,DPU已成為其重要的組成部分。CPU、GPU和DPU的結(jié)合,可構(gòu)成完全可編程的單一AI計(jì)算單元,提供前所未有的安全性和算力?!盢VIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示,數(shù)據(jù)中心已經(jīng)成為NVIDIA的主要業(yè)務(wù)之一,其在NVIDIA的總營(yíng)收占比中也日益增加。
隨著各行業(yè)對(duì)數(shù)據(jù)應(yīng)用重視度的不斷上升,NVIDIA對(duì)數(shù)據(jù)應(yīng)用產(chǎn)品的研發(fā)投入也逐步攀升。NVIDIA推出的最新處理器DPU(Data Processing Unit,數(shù)據(jù)處理單元),是一款由新型DOCA(Data-Center-Infrastructure-On-A-Chip Architecture)架構(gòu)支持的處理器產(chǎn)品。其可實(shí)現(xiàn)具有突破性的網(wǎng)絡(luò)、存儲(chǔ)和安全性能。其中,DOCA架構(gòu)是一款全新的數(shù)據(jù)中心IOC(Infrastructure On A Chip - 基礎(chǔ)架構(gòu)級(jí)芯片)架構(gòu)。
經(jīng)過(guò)優(yōu)化的BlueField-2 DPU可從CPU上卸載關(guān)鍵的網(wǎng)絡(luò)、存儲(chǔ)和安全任務(wù),使企業(yè)能夠?qū)⑵銲T基礎(chǔ)設(shè)施轉(zhuǎn)變?yōu)樽钕冗M(jìn)的數(shù)據(jù)中心。此類數(shù)據(jù)中心可實(shí)現(xiàn)加速、具有完全可編程性,并具有“零信任”安全功能,防止數(shù)據(jù)泄露和網(wǎng)絡(luò)攻擊。
單個(gè)BlueField-2 DPU可以提供相當(dāng)于消耗125個(gè)CPU內(nèi)核所提供的數(shù)據(jù)中心服務(wù)。由此釋放CPU內(nèi)核,以運(yùn)行各種其他企業(yè)應(yīng)用程序。NVIDIA當(dāng)前的DPU系列中包括兩款PCIe產(chǎn)品:NVIDIA BlueField-2 DPU和NVIDIA BlueField-2X DPU。
同NVIDIA CUDA編程模型助力開(kāi)發(fā)者構(gòu)建GPU加速應(yīng)用程序類似,全新NVIDIA DOCA 軟件開(kāi)發(fā)套件可助力開(kāi)發(fā)者在DPU加速數(shù)據(jù)中心基礎(chǔ)設(shè)施服務(wù)上構(gòu)建應(yīng)用程序。DOCA為開(kāi)發(fā)者提供全面的開(kāi)放式平臺(tái),助力構(gòu)建運(yùn)行于BlueField系列DPU上的軟件定義硬件加速的網(wǎng)絡(luò)、存儲(chǔ)、安全及管理應(yīng)用程序。DOCA已完全集成于NVIDIA NGC中,該軟件目錄可提供便捷的容器化軟件環(huán)境,使第三方應(yīng)用程序提供商能夠利用先進(jìn)的DPU數(shù)據(jù)中心加速服務(wù),為客戶開(kāi)發(fā)、認(rèn)證并分發(fā)應(yīng)用程序。
基于NVIDIA Ampere架構(gòu)的NVIDIA RTX A6000和NVIDIA A40
與上一代產(chǎn)品相比,NVIDIA Ampere GPU架構(gòu)能夠提供驚人性能。Blackmagic、Chaos Group和Luxion等軟件合作伙伴的早期測(cè)試顯示了用戶通過(guò)該全新GPU所獲得的性能提升。
NVIDIA RTX A6000和NVIDIA A40通過(guò)突破性的技術(shù)提供更強(qiáng)大的性能,包括:第二代RT Core:最高可提供2倍于上一代的吞吐量,以及并行光線追蹤、著色和計(jì)算功能。第三代Tensor Core:最高可提供5倍于上一代的吞吐量,并支持全新TF32和BF16數(shù)據(jù)格式,結(jié)合稀疏運(yùn)算特性提供10倍加速性能。
全新CUDA Core最高可提供2倍于上一代的FP32吞吐量,能夠顯著提高圖形和計(jì)算能力。48 GB GPU內(nèi)存,其中單個(gè)GPU可提供的最大內(nèi)存通過(guò)NVLink連接兩個(gè)GPU可以擴(kuò)展到96 GB。
通過(guò)添加NVIDIA虛擬工作站等NVIDIA虛擬GPU軟件,為遠(yuǎn)程用戶提供針對(duì)圖形工作負(fù)載和強(qiáng)大虛擬工作站實(shí)例的大規(guī)模支持,賦力高端設(shè)計(jì)、AI和計(jì)算工作負(fù)載的更大規(guī)模工作流程。PCIe Gen 4可提供2倍于上一代的帶寬,加速Lenovo ThinkStation P620等PCIe Gen 4服務(wù)器和工作站中數(shù)據(jù)密集型工作負(fù)載(如數(shù)據(jù)科學(xué)、混合渲染和視頻流)的GPU數(shù)據(jù)傳輸。
公測(cè)版Omniverse
在GTC的主題演講中,黃仁勛宣布NVIDIA Omniverse平臺(tái)已進(jìn)入公測(cè)階段,他表示:“物理和虛擬世界將會(huì)日益融合。Omniverse讓位于全球各地或居家辦公的創(chuàng)作者團(tuán)隊(duì),能夠像編輯文檔一樣在同一個(gè)設(shè)計(jì)上輕松開(kāi)展協(xié)作。這是《星際迷航》全息甲板的初始,它終成現(xiàn)實(shí)?!?img src="https://cimg.fx361.com/images/2021/02/08/qkimagescadccadc202011cadc20201119-2-l.jpg"/>
Omniverse整合了NVIDIA在圖形、仿真和AI領(lǐng)域的突破,是全球首個(gè)基于NVIDIA RTX的3D仿真模擬和協(xié)作平臺(tái)。該平臺(tái)融合了物理和虛擬世界,能夠?qū)崟r(shí)模擬出細(xì)節(jié)逼真的現(xiàn)實(shí)世界。遠(yuǎn)程團(tuán)隊(duì)可以通過(guò)該平臺(tái)同時(shí)開(kāi)展項(xiàng)目協(xié)作,例如負(fù)責(zé)3D建筑設(shè)計(jì)迭代的建筑師、修改3D場(chǎng)景的動(dòng)畫(huà)師以及協(xié)作開(kāi)發(fā)自動(dòng)駕駛汽車(chē)的工程師,整個(gè)協(xié)作就像是在線上共同編輯文檔一樣簡(jiǎn)單。
NVIDIA在為期一年的搶先體驗(yàn)計(jì)劃之后發(fā)布了公測(cè)版Omniverse。搶先體驗(yàn)項(xiàng)目期間,愛(ài)立信、Foster + Partners、工業(yè)光魔(ILM)和其他40多家公司以及多達(dá)400位個(gè)人創(chuàng)作者和開(kāi)發(fā)者對(duì)該平臺(tái)進(jìn)行了評(píng)估并向NVIDIA工程團(tuán)隊(duì)提供了反饋。
Omniverse基于皮克斯應(yīng)用廣泛的Universal Scene Description(USD),一種能夠在3D應(yīng)用中實(shí)現(xiàn)通用互換的先進(jìn)格式。該平臺(tái)還使用了多項(xiàng)NVIDIA技術(shù),例如實(shí)時(shí)照片級(jí)逼真渲染、物理效果、材質(zhì)以及在業(yè)內(nèi)領(lǐng)先3D軟件產(chǎn)品之間的交互式工作流程。Omniverse所能實(shí)現(xiàn)的協(xié)作和仿真模擬對(duì)于機(jī)器人、汽車(chē)、建筑、工程與建設(shè)、制造以及媒體和娛樂(lè)行業(yè)的客戶而言至關(guān)重要。
企業(yè)版NVIDIA DGX SuperPODTM解決方案
企業(yè)版NVIDIA DGX SuperPODTM解決方案是NVIDIA推出的首個(gè)一站式AI基礎(chǔ)設(shè)施,能夠讓企業(yè)以驚人的速度安裝功能強(qiáng)大的AI超級(jí)計(jì)算機(jī)——通常只需短短幾周時(shí)間。已上市的DGX SuperPOD是由包含20個(gè)到140個(gè)獨(dú)立的NVIDIA DGX A100TM系統(tǒng)構(gòu)建的集群,現(xiàn)已發(fā)往韓國(guó)、英國(guó)、瑞典和印度,預(yù)計(jì)在年底前安裝完畢。
DGX SuperPOD系統(tǒng)以借助NVIDIA Mellanox HDR InfiniBand網(wǎng)絡(luò)互聯(lián)的20個(gè)模塊來(lái)銷售,AI性能最低可達(dá)到100 petaflops,最高可達(dá)700 petaflops,可運(yùn)行最復(fù)雜的AI工作。
從定制化容量規(guī)劃和數(shù)據(jù)中心設(shè)計(jì)服務(wù),到應(yīng)用程序性能測(cè)試和開(kāi)發(fā)人員操作培訓(xùn),企業(yè)版DGX SuperPOD解決方案是實(shí)現(xiàn)大規(guī)模AI創(chuàng)新的捷徑。每臺(tái)DGX SuperPOD均由NVIDIA認(rèn)證的合作伙伴進(jìn)行調(diào)試、堆疊和配置。這些精心選拔而出的NVIDIA AI專家可確保安裝輕松易行,即便是通過(guò)大量電纜連接數(shù)十甚至數(shù)百個(gè)節(jié)點(diǎn)的AI基礎(chǔ)設(shè)施的安裝流程也十分簡(jiǎn)單。
安裝后,NVIDIA和認(rèn)證專家將與客戶合作,以確保其AI工作負(fù)載通過(guò)NGC中的最新NVIDIA軟件進(jìn)行優(yōu)化,包括云原生GPU優(yōu)化型容器、模型和適用于特定行業(yè)的SDK。
企業(yè)版DGX SuperPOD解決方案是基于NVIDIA多年致力于創(chuàng)造全球最先進(jìn)的AI系統(tǒng)的成果打造而成,旨在推動(dòng)NVIDIA在汽車(chē)、醫(yī)療健康、對(duì)話式AI、推薦系統(tǒng)、數(shù)據(jù)科學(xué)和計(jì)算機(jī)圖形等領(lǐng)域的工程。
NVIDIA Selene是一款280節(jié)點(diǎn)的DGX SuperPOD,在今年早些時(shí)候發(fā)布的TOP500和MLPerf測(cè)試中均名列前茅,奠定了AI更高的門(mén)檻。其DGX SuperPOD架構(gòu)還實(shí)現(xiàn)了效率突破,其20 gigaflops /瓦的效率創(chuàng)造了Green500性能記錄。
AI基礎(chǔ)設(shè)施需要極高的存儲(chǔ)速度,以并行處理各類數(shù)據(jù),例如文本、表格數(shù)據(jù)、音頻和視頻。NVIDIA 企業(yè)版DGX SuperPOD解決方案采用全閃存存儲(chǔ)并經(jīng)過(guò)優(yōu)化,能滿足客戶的特定要求以及AI工作負(fù)載的獨(dú)特需求。DDN是企業(yè)版DGX SuperPOD解決方案首個(gè)通過(guò)NVIDIA認(rèn)證的存儲(chǔ)合作伙伴。
目前,NVIDIA正在基于NVIDIA DGX SuperPODTM解決方案推動(dòng)一項(xiàng)名為Cambridge-1的超級(jí)計(jì)算機(jī)建造計(jì)劃,這是一款80節(jié)點(diǎn)的DGX SuperPOD,具備400 petaflops 的AI性能。2020年年底一經(jīng)部署便將成為英國(guó)最快的超級(jí)計(jì)算機(jī)。該系統(tǒng)將被用于英國(guó)學(xué)術(shù)界、業(yè)界和初創(chuàng)企業(yè)在AI和醫(yī)療健康領(lǐng)域的合作研究。