2016年11月15日 —如今,高性能計(jì)算(HPC)在企業(yè)以及各行各業(yè)中的應(yīng)用日益普遍,從天氣預(yù)報(bào)、產(chǎn)品開(kāi)發(fā)到疾病診斷,在各種復(fù)雜問(wèn)題處理中都能看到它的身影。因此,降低HPC系統(tǒng)復(fù)雜性,平衡性能及按需擴(kuò)展等需求也不斷增長(zhǎng)。此外,業(yè)界也在尋求如何降低人工智能在多種商業(yè)、政府和學(xué)術(shù)中應(yīng)用的門(mén)檻。在今天于猶他州鹽湖城舉行的2016年全球超級(jí)計(jì)算大會(huì)上,英特爾宣布對(duì)其HPC產(chǎn)品組合做出多項(xiàng)重大更新,并將研發(fā)多項(xiàng)新技術(shù),以期幫助解決這些棘手問(wèn)題。
英特爾 可擴(kuò)展系統(tǒng)框架 (英特爾 SSF)致力于平衡和優(yōu)化計(jì)算、內(nèi)存、存儲(chǔ)、能效及其他各方面的性能。英特爾 SSF是一種高級(jí)架構(gòu)方法,可簡(jiǎn)化HPC系統(tǒng)的采購(gòu)、部署和管理。英特爾致力于通過(guò)提供經(jīng)過(guò)驗(yàn)證的可靠、模塊化的整合性HPC軟件平臺(tái)來(lái)簡(jiǎn)化系統(tǒng)管理,從而引領(lǐng)整個(gè)生態(tài)系統(tǒng)的轉(zhuǎn)型。
英特爾 HPC Orchestrator現(xiàn)已上市,HPC系統(tǒng)構(gòu)建商、應(yīng)用開(kāi)發(fā)商和最終用戶可利用此軟件平臺(tái)提高系統(tǒng)設(shè)置和管理效率,支持大規(guī)模測(cè)試并簡(jiǎn)化用戶部署。英特爾 HPC Orchestrator 是一種可定制平臺(tái),既支持傳統(tǒng)HPC工作負(fù)載,也支持機(jī)器學(xué)習(xí)、高性能數(shù)據(jù)分析和無(wú)人駕駛等新興用途。
英特爾 HPC Orchestrator基于OpenHPC 社區(qū)系統(tǒng)軟件堆棧,包括多種編譯器選項(xiàng)、MPI系列、基本操作系統(tǒng)組合以及協(xié)助自動(dòng)安裝的工具。此外還集成了具有90天評(píng)估許可的英特爾 Parallel Studio XE Cluster Edition 產(chǎn)品,可提供初始下載后的便捷安裝。
作為英特爾 SSF的重要組件,英特爾 HPC Orchestrator包括60余種預(yù)集成的模塊化組件,并提供持續(xù)更新和技術(shù)支持服務(wù)。這可幫助HPC系統(tǒng)開(kāi)發(fā)人員和用戶將其技術(shù)資源專注于增強(qiáng)HPC解決方案并建立差異化優(yōu)勢(shì)。
英特爾 HPC Orchestrator現(xiàn)通過(guò)OEM啟動(dòng)系統(tǒng)供應(yīng)商戴爾 和富士通 進(jìn)行發(fā)售,很快將會(huì)推出其他發(fā)售渠道。
上市僅9個(gè)月的時(shí)間,英特爾 Omni-Path 高速互聯(lián)架構(gòu) (英特爾 OPA)已成為100 GB 系統(tǒng)的標(biāo)準(zhǔn)架構(gòu)。在2016年全球超級(jí)計(jì)算大會(huì)上公布的全球超級(jí)計(jì)算機(jī)500強(qiáng)中,有28套使用了英特爾 OPA,且在100 GB系統(tǒng)中占比66%1。這些全球500強(qiáng)系統(tǒng)包括Oakforest-PACS、MIT林肯實(shí)驗(yàn)室和CINECA。
在此次大會(huì)評(píng)選出的500強(qiáng)超級(jí)計(jì)算機(jī)名單中,共計(jì)28套集群部署了英特爾OPA,該數(shù)據(jù)是InfiniBand EDR系統(tǒng)的兩倍,在所有100GB系統(tǒng)中的比例約為66%。此外,還有兩個(gè)系統(tǒng)位居前15位:Oakforest-PACS以8,208個(gè)節(jié)點(diǎn)排名第6,CINECA則以3,556個(gè)節(jié)點(diǎn)排名第12。在本次榜單中,英特爾 OPA系統(tǒng)的每秒總浮點(diǎn)運(yùn)算達(dá)到43.7千萬(wàn)億次(Rmax),這是所有InfiniBand EDR系統(tǒng)浮點(diǎn)運(yùn)算次數(shù)的2.5倍。
英特爾 OPA具有高性能、高性價(jià)比以及錯(cuò)誤檢測(cè)和無(wú)額外延遲糾正等創(chuàng)新架構(gòu)功能,可提供極為顯著的客戶優(yōu)勢(shì),因此在大規(guī)模發(fā)售僅9個(gè)月內(nèi),市場(chǎng)采用率迅速增長(zhǎng)。
英特爾 OPA是一種端到端互連解決方案,可提高不同規(guī)模集群的HPC工作負(fù)載。與InfiniBand EDR相比,該解決方案將應(yīng)用性能提高了9%,并將平均架構(gòu)成本降低了37%之多2。
目前已部署安裝英特爾 OPA的包括日本東京大學(xué)、筑波大學(xué)(JCAHPC)、德州理工大學(xué)、華盛頓大學(xué)、科羅拉多大學(xué)波爾德分校、麻省理工學(xué)院林肯實(shí)驗(yàn)室和馬來(lái)西亞氣象局。目前全球已成功部署了100多套英特爾 OPA集群,這主要得益于其富有競(jìng)爭(zhēng)力的基準(zhǔn)性能和領(lǐng)先的性價(jià)比。
借助英特爾 Deep Learning Inference Accelerator加速AI實(shí)現(xiàn)
憑借其業(yè)內(nèi)領(lǐng)先的性能和強(qiáng)大的軟件生態(tài)系統(tǒng),基于英特爾的平臺(tái)幾乎為所有HPC和機(jī)器學(xué)習(xí)工作負(fù)載提供支持。借助英特爾 Deep Learning Inference Accelerator,英特爾在2017年擴(kuò)大了AI解決方案產(chǎn)品組合。英特爾 Deep Learning Inference Accelerator是一種基于現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)的集成軟硬件解決方案,可用于神經(jīng)網(wǎng)絡(luò)加速。
英特爾 Deep Learning Inference Accelerator 可為圖像識(shí)別應(yīng)用提供可擴(kuò)展的加速解決方案,為數(shù)據(jù)中心帶來(lái)出色的吞吐量和能效,從而使用戶能夠在數(shù)分鐘內(nèi)部署深度學(xué)習(xí)解決方案。
其硬件采用了專為卷積神經(jīng)網(wǎng)絡(luò)(CNN)目標(biāo)拓?fù)鋬?yōu)化的英特爾 Arria 10 FPGA插入板。其基于FPGA的架構(gòu)可支持遠(yuǎn)程更新,因此可隨著AI領(lǐng)域的快速創(chuàng)新及時(shí)更新硬件。
可通過(guò)英特爾 Distribution for Caffe 和 英特爾 Math Kernel Library for Deep Neural Networks (英特爾 MKL-DNN)等行業(yè)標(biāo)準(zhǔn)框架對(duì)英特爾 Deep Learning Inference Accelerator進(jìn)行軟件編程。 英特爾 Deep Learning Inference Accelerator 將于 2017年上市。
擴(kuò)展英特爾SSF生態(tài)系統(tǒng)
英特爾及其生態(tài)聯(lián)盟合作伙伴不斷發(fā)布大型系統(tǒng)、優(yōu)化解決方案、新工具和資源以及新英特爾 SSF 計(jì)劃,以擴(kuò)展英特爾 SSF生態(tài)系統(tǒng)。
最近,下列企業(yè)和組織采用了英特爾 SSF:MIT林肯實(shí)驗(yàn)室等領(lǐng)先大學(xué)和研究中心在其500強(qiáng)的超級(jí)計(jì)算機(jī)中部署了英特爾 SSF。HPE 將英特爾 SSF 集成至HPE下一代測(cè)序解決方案版本中,以提高基因測(cè)序的速度和成本效益。戴爾將英特爾 SSF 集成到用于生命科學(xué)領(lǐng)域的戴爾HPC系統(tǒng),以加快包括藥物設(shè)計(jì)、癌癥研究、農(nóng)業(yè)和法醫(yī)學(xué)在內(nèi)的多個(gè)領(lǐng)域的信息轉(zhuǎn)化。英特爾發(fā)布了英特爾 Cluster Checker 2017更新。這款全面診斷工具在英特爾 Parallel Studio XE 2017 中發(fā)行,支持英特爾 至強(qiáng) 處理器、英特爾 至強(qiáng)融核 處理器、英特爾 OPA和適用于Lustre 的英特爾 企業(yè)版軟件。
英特爾 至強(qiáng)融核處理器系列更新
英特爾 至強(qiáng)融核 處理器 7210、7230、7250 和 7290 系列現(xiàn)已發(fā)售,集成英特爾 OPA的處理器計(jì)劃于本月大量發(fā)售。50余種基于英特爾 至強(qiáng)融核 處理器的HPC設(shè)計(jì)已在業(yè)內(nèi)得到廣泛采用。 最新的英特爾 至強(qiáng)融核 處理器已部署于全球超級(jí)計(jì)算機(jī)500強(qiáng)中的9個(gè)新系統(tǒng),其中有2套系統(tǒng)排名前10,它們分別是排名第5的Cori系統(tǒng)和排名第6的Oakforest-PAC系統(tǒng)。此外,英特爾也是支持排名第20位的系統(tǒng)——Theta系統(tǒng)中橡樹(shù)嶺、阿貢、勞倫斯利弗莫爾合作項(xiàng)目(CORAL)的主要合約方。Theta系統(tǒng)將有助于提高美國(guó)在科學(xué)研究中的領(lǐng)導(dǎo)力。英特爾擴(kuò)大了在日本、韓國(guó)、歐洲和美國(guó)的全球合作,因而推動(dòng)了針對(duì)基于英特爾 至強(qiáng)融核 處理器的平臺(tái)的開(kāi)發(fā)者使用計(jì)劃。 英特爾 至強(qiáng)融核 協(xié)處理器將于2017年初上市。
英特爾 至強(qiáng) 處理器不斷創(chuàng)新
英特爾 至強(qiáng) 平臺(tái)幾乎為所有HPC和機(jī)器學(xué)習(xí)工作負(fù)載提供支持。為了進(jìn)一步推進(jìn)該成果,英爾推出了速度最快的雙路處理器——英特爾 至強(qiáng) 處理器 E5-2699A v4系列。
* 英特爾 至強(qiáng) 處理器E5-2699A v4 系列可提供面向數(shù)據(jù)密集型應(yīng)用所需的業(yè)界領(lǐng)先性能,為想通過(guò)廣泛部署的數(shù)據(jù)中心獲得高性能的用戶提供了絕佳的選擇。 在2016年全球超級(jí)計(jì)算大會(huì)上,英特爾將公開(kāi)展示一款搭載下一代英特爾 至強(qiáng) 處理器早期版本的HPC集群,該處理器集成了英特爾 OPA、英特爾 高級(jí)矢量擴(kuò)展指令集-512 (英特爾 AVX-512)以及英特爾 至強(qiáng)融核 處理器。英特爾 AVX-512 處理器指令集于2016年6月與最新一代英特爾 至強(qiáng)融核 處理器一同發(fā)布,致力于加快壓縮和加密算法的速度。它可提供硬件增強(qiáng)型數(shù)據(jù)保護(hù)并加快信息轉(zhuǎn)化,同時(shí)提高多種HPC應(yīng)用中所采用的浮點(diǎn)運(yùn)算的速度。