張碩+何發(fā)智+周毅+鄢小虎
摘 要:基于統(tǒng)一計算設(shè)備架構(gòu)(CUDA)對圖形處理器(GPU)下的并行粒子群優(yōu)化(PSO)算法作改進研究。根據(jù)CUDA的硬件體系結(jié)構(gòu)特點,可知Block是串行執(zhí)行的,線程束(Warp)才是流多處理器(SM)調(diào)度和執(zhí)行的基本單位。為了充分利用Block中線程的并行性,提出基于自適應(yīng)線程束的GPU并行PSO算法:將粒子的維度和線程相對應(yīng);利用GPU的Warp級并行,根據(jù)維度的不同自適應(yīng)地將每個粒子與一個或多個Warp相對應(yīng);自適應(yīng)地將一個或多個粒子與每個Block相對應(yīng)。與已有的粗粒度并行方法(將每個粒子和線程相對應(yīng))以及細(xì)粒度并行方法(將每個粒子和Block相對應(yīng))進行了對比分析,實驗結(jié)果表明,所提出的并行方法相對前兩種并行方法,CPU加速比最多提高了40。
關(guān)鍵詞:粒子群優(yōu)化算法;并行計算;圖形處理器;統(tǒng)一計算設(shè)備架構(gòu);自適應(yīng)線程束
中圖分類號: TP301.6
文獻標(biāo)志碼:A
文章編號:1001-9081(2016)12-3274-06