意法半導(dǎo)體全資子公司、全球領(lǐng)先的獨(dú)立高性能計(jì)算(HPC)編譯器及開發(fā)工具供應(yīng)商Portland Group宣布,可支持新的圖形處理其 (GPU)和圖形加速器指令式編程模型OpenACC?1.0標(biāo)準(zhǔn)的PGI AcceleratorTMFortran和 C編譯器已經(jīng)上市。OpenACC?編程標(biāo)準(zhǔn)讓程序員在所寫程序中提供暗示或指示。
OpenACC標(biāo)準(zhǔn)由PGI、Cray和NVIDIA 3家公司聯(lián)合創(chuàng)立,同時(shí)得到CAPS的支持,于2011年11月在 SC11大會(huì)上首次發(fā)布,與NVIDIA?CUDA?并行編程架構(gòu)完全兼容,并可與其互操作。OpenACC 1.0技術(shù)規(guī)范是這三個(gè)創(chuàng)辦公司聯(lián)合開發(fā)的,大部分內(nèi)容來(lái)自 PGI Accelerator編程模型。OpenACC應(yīng)用程序接口(API)描述了一系列把采用標(biāo)準(zhǔn)C、C++和Fortran語(yǔ)言編寫的循環(huán)調(diào)度語(yǔ)句和代碼段從主CPU轉(zhuǎn)移到所連接的加速器的編譯器指令,讓開發(fā)人員能夠跨操作系統(tǒng)、主CPU和加速器進(jìn)行代碼移植。采用指令編譯方法后,開發(fā)人員只需一個(gè)多平臺(tái)多廠商兼容代碼庫(kù),為跨平臺(tái)和多代應(yīng)用開發(fā)帶來(lái)諸多優(yōu)勢(shì)和便利。
在采用OpenACC標(biāo)準(zhǔn)后,并行程序員可把代碼從主CPU移到所連接的加速器上,通過(guò)指示(又稱指令識(shí)別)適合加速的代碼段。除向編譯器帶來(lái)并行計(jì)算機(jī)會(huì)外,指令還能用于說(shuō)明如何向一個(gè)特定的加速器高效復(fù)制循環(huán)語(yǔ)句和如何優(yōu)化數(shù)據(jù)移動(dòng)。指令編程模型為開發(fā)人員提供更多開發(fā)資源,讓編譯器執(zhí)行主CPU減負(fù)的精細(xì)過(guò)程,把計(jì)算任務(wù)轉(zhuǎn)移到加速器,讓開發(fā)人員專心優(yōu)化算法和應(yīng)用功能。指令編程模型的主要好處是可大幅提升應(yīng)用軟件性能,而無(wú)需修改底層源代碼。
支持OpenACC的PGI Accelerator編譯器
PGI Accelerator編譯器于2008年首次發(fā)布,新版在以下幾個(gè)方面進(jìn)一步強(qiáng)化了OpenACC標(biāo)準(zhǔn),為用戶提供更強(qiáng)的功能和更優(yōu)的設(shè)計(jì)靈活性:
1)自動(dòng)生成最佳的循環(huán)調(diào)度指令;2)自動(dòng)占用共享內(nèi)存空間;3)自動(dòng)執(zhí)行歸約求和運(yùn)算(automatic sum reductions);4)與CUDA Fortran和CUDA C/C++互操作;5)在有無(wú)加速器的條件下,PGI Unified BinaryTM技術(shù)可執(zhí)行文件均能正常工作。