金鐘
中國科學(xué)院計算機網(wǎng)絡(luò)信息中心,北京 100083
隨著創(chuàng)新算力與新一代人工智能技術(shù)的發(fā)展,超算與人工智能的融合已成為驅(qū)動科技創(chuàng)新的關(guān)鍵力量,將長期為我國各行業(yè)轉(zhuǎn)型升級和數(shù)字經(jīng)濟發(fā)展提供核心驅(qū)動力。近年來,中國超算通過國產(chǎn)先進計算架構(gòu)、高性能多核處理器、高速互連網(wǎng)絡(luò)、大規(guī)模存儲等關(guān)鍵技術(shù)構(gòu)建,在通用CPU 計算能力、網(wǎng)絡(luò)能力、存儲能力以及應(yīng)用服務(wù)能力等多方面實現(xiàn)倍增,用以支持高性能計算、AI 大模型訓(xùn)練以及大數(shù)據(jù)分析各類應(yīng)用模式。基于國產(chǎn)異構(gòu)加速計算平臺的計算資源,通過聯(lián)合產(chǎn)業(yè)鏈上下游企業(yè)、高校、科研院所、重點用戶單位等相關(guān)創(chuàng)新力量,對于協(xié)同技術(shù)攻關(guān),以期實現(xiàn)合力打造“共享、共贏、共創(chuàng)”可信賴的合作伙伴平臺,完善“芯、端、邊、云、智、網(wǎng)”更開放融合的計算產(chǎn)業(yè)生態(tài),構(gòu)建“實用、好用、易用”高水平的商業(yè)應(yīng)用體系的美好愿景具有重要意義。
本次“超算互聯(lián)網(wǎng)及應(yīng)用”專題,就是基于國產(chǎn)異構(gòu)加速計算平臺的計算資源,廣泛征集相關(guān)技術(shù)創(chuàng)新及應(yīng)用案例,最終收錄4 篇文章,從基礎(chǔ)算法、應(yīng)用軟件向國產(chǎn)異構(gòu)加速計算平臺進行適配、移植、優(yōu)化等方面分享超算賦能行業(yè)應(yīng)用最新成果和經(jīng)驗,共同探討超算、智算、人工智能、大數(shù)據(jù)等先進技術(shù)的融合發(fā)展之路。
在《聚合物分子動力學(xué)軟件PyGAMD 及在國產(chǎn)異構(gòu)計算平臺的適配》一文中,于卓辰等汲取自主開發(fā)聚合物分子動力學(xué)模擬軟件的經(jīng)驗,基于解釋型語言Python 開發(fā)了分子動力學(xué)模擬解釋器PyGAMD。該解釋器支持用戶自定義分子動力學(xué)模擬功能,還包括了聚合物建模工具、異構(gòu)加速庫、數(shù)據(jù)處理等工具,用戶可以通過PyGAMD輕松組合所需模塊完成分子動力學(xué)模擬工作。在計算效率方面,PyGAMD 的表現(xiàn)在多數(shù)場合都非常出色。未來,PyGAMD 的發(fā)展將側(cè)重于構(gòu)建高度自由的多模塊化框架,同時開發(fā)機器學(xué)習(xí)勢能和細粒化等功能。
由鄭亮等人撰寫的《基于Kokkos 模板元編程的性能可移植求解器開發(fā)》一文中,在Kokkos代數(shù)算子庫基礎(chǔ)上,開發(fā)一套面向國產(chǎn)E級計算環(huán)境的“性能可移植”模板元接口開源框架,用于線性代數(shù)求解器編程。給出其用于Krylov子空間算法的簡單編程示范,實現(xiàn)了面向國產(chǎn)異構(gòu)處理器的線性代數(shù)求解器移植,部分求解器相較于10 核超線程Xeon CPU 有數(shù)十倍以上加速??梢娦阅芸梢浦簿幊炭沙蔀閼?yīng)對多樣化異構(gòu)計算的解決方案。
徐順等撰寫的《eMD:基于異構(gòu)計算的大規(guī)模分子動力學(xué)模擬軟件》一文介紹了自研分子動力學(xué)模擬軟件eMD的系統(tǒng)設(shè)計及其異構(gòu)計算應(yīng)用。首先介紹eMD 軟件的目標定位,包括應(yīng)用功能和計算性能兩方面;然后介紹軟件概要設(shè)計,包括框架、模塊和接口等組成部分;重點圍繞面向異構(gòu)計算的軟件架構(gòu)設(shè)計和移植優(yōu)化技術(shù)進行闡述。eMD軟件系統(tǒng)基于GPU異構(gòu)計算可實現(xiàn)大規(guī)模體系模擬,同時提供特色的分子動力學(xué)模擬算法和模型。eMD 將充分發(fā)揮GPU 異構(gòu)計算算力,以提升分子動力學(xué)模擬應(yīng)用效率,助力分子建模理論方法的創(chuàng)新應(yīng)用和分子科學(xué)問題的研究。
李維釗等撰寫的《基于國產(chǎn)異構(gòu)計算平臺的快速SVD 算法及其在海洋資料同化的應(yīng)用》一文在大規(guī)模計算環(huán)境下并行策略及實現(xiàn)方法基礎(chǔ)上,設(shè)計并實現(xiàn)了基于國產(chǎn)異構(gòu)計算平臺的CPU 和類GPU 卡協(xié)同批量SVD 解算的實現(xiàn)流程和數(shù)據(jù)結(jié)構(gòu),并給出了實際性能提升測試數(shù)據(jù),同時,完整地使用C/C++實現(xiàn)了資料同化程序。該算法充分利用國產(chǎn)異構(gòu)計算平臺CPU和計算卡的計算資源,實現(xiàn)了基于奇異值分解(SVD)的矩陣求逆的高效實現(xiàn)算法,從基礎(chǔ)算法上顯著提高了資料同化的計算效率。其應(yīng)用可以擴展到量子計算、人工智能、圖像處理、信號降噪等領(lǐng)域的算法實現(xiàn),具有廣泛的應(yīng)用價值,使用C/C++語言的資料同化應(yīng)用軟件,豐富了國產(chǎn)異構(gòu)計算平臺的應(yīng)用生態(tài)。
通過本次專題內(nèi)容的推薦,期望能夠?qū)π袠I(yè)科研人員提供幫助,推進實際應(yīng)用問題的解決,推動國產(chǎn)異構(gòu)加速計算平臺的計算資源創(chuàng)新發(fā)展,提供更高效、更精準的計算平臺,共同打造我國科技創(chuàng)新平臺,支撐國家算力網(wǎng)絡(luò)建設(shè)戰(zhàn)略。