金 鐘 陸忠華 李會(huì)元 遲學(xué)斌* 孫家昶
1 中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心 北京 100190
2 中國(guó)科學(xué)院計(jì)算科學(xué)應(yīng)用研究中心 北京 100190
3 中國(guó)科學(xué)院軟件研究所 北京 100190
科學(xué)計(jì)算是指應(yīng)用計(jì)算機(jī)處理科學(xué)研究和工程技術(shù)中所遇到的數(shù)學(xué)計(jì)算問(wèn)題。在現(xiàn)代科學(xué)研究和工程技術(shù)中,常常遇到大量復(fù)雜數(shù)學(xué)計(jì)算。其復(fù)雜程度往往超越了人腦運(yùn)算的能力,必須使用計(jì)算機(jī)進(jìn)行求解。而計(jì)算科學(xué)的應(yīng)用水平已成為衡量國(guó)家科技發(fā)展水平的重要標(biāo)志之一;其應(yīng)用的深入程度則反映出對(duì)科學(xué)問(wèn)題探索與理解的深度。2013 年 10月,美國(guó)哈佛大學(xué) Martin Karplus 教授、斯坦福大學(xué) Michael Levitt 教授和南加州大學(xué) Arieh Warshel 教授 3 位科學(xué)家獲得了諾貝爾化學(xué)獎(jiǎng),獲獎(jiǎng)理由是“為復(fù)雜化學(xué)系統(tǒng)創(chuàng)立了多尺度模型”。評(píng)選委員會(huì)在聲明中指出,對(duì)當(dāng)今的化學(xué)家而言,計(jì)算機(jī)已成為與試管同等重要的工具,計(jì)算機(jī)對(duì)生命現(xiàn)象的模擬已為化學(xué)大部分研究成果的取得立下了“汗馬功勞”。這無(wú)疑會(huì)進(jìn)一步加深各學(xué)科對(duì)計(jì)算模型和計(jì)算科學(xué)的認(rèn)識(shí)與應(yīng)用,并將引領(lǐng)學(xué)科發(fā)展進(jìn)入下一波浪潮。
自 20 世紀(jì)中葉后,高性能計(jì)算機(jī)的發(fā)展取得了長(zhǎng)足進(jìn)步,其計(jì)算能力不斷地得到提高。特別是進(jìn)入 21 世紀(jì)以來(lái),高性能計(jì)算在重大科學(xué)發(fā)現(xiàn)的前沿基礎(chǔ)科學(xué)研究領(lǐng)域已逐漸成為不可或缺的重要手段之一。近年來(lái),高度異構(gòu)和內(nèi)部網(wǎng)絡(luò)高速互聯(lián)是現(xiàn)代高性能計(jì)算機(jī)體系架構(gòu)的重要發(fā)展方向。而對(duì)于若干典型的高性能計(jì)算應(yīng)用,通訊與計(jì)算能力不匹配的矛盾較為突出[1,2]。一般說(shuō)來(lái),現(xiàn)代計(jì)算機(jī)的處理器和加速部件往往達(dá)到幾千億次至幾萬(wàn)億次的浮點(diǎn)運(yùn)算能力,而目前性能較好的內(nèi)部互聯(lián)網(wǎng)絡(luò)的帶寬雖達(dá)到了 200 Gb,仍然相對(duì)較慢。
超大規(guī)??茖W(xué)計(jì)算的顯著特征是可計(jì)算問(wèn)題的規(guī)模巨大,TOP500①http://www.top500.org.排名前十的超級(jí)計(jì)算機(jī)系統(tǒng)一般擁有千萬(wàn)個(gè)以上數(shù)量的處理器核心,按照單處理器核心可處理 100 萬(wàn)個(gè)未知量來(lái)計(jì),這意味著可計(jì)算處理具有 1 萬(wàn)億個(gè)自由度的復(fù)雜系統(tǒng)。即便如此,當(dāng)今世界上計(jì)算能力最強(qiáng)的這些高性能計(jì)算機(jī)在那些復(fù)雜度更高的科學(xué)計(jì)算應(yīng)用對(duì)計(jì)算能力幾乎無(wú)止境的需求面前,也顯得杯水車薪[3,4]。因此,應(yīng)用和計(jì)算科學(xué)家往往不得不采用簡(jiǎn)化模型、對(duì)計(jì)算問(wèn)題進(jìn)行預(yù)條件處理和采用混合精度等手段來(lái)降低計(jì)算量。從算法的角度來(lái)說(shuō),美國(guó)超算領(lǐng)域的著名數(shù)學(xué)算法專家 Colella[5]于 2004 年提出了科學(xué)計(jì)算的 7 種算法模型,即結(jié)構(gòu)性網(wǎng)格、非結(jié)構(gòu)性網(wǎng)格、快速傅立葉變換(FFT)、稠密線性代數(shù)(Dense Linear Algebra)、稀疏線性代數(shù)(Sparse Linear Algebra)、粒子動(dòng)力學(xué)(Particles)、蒙特卡洛(Monte Carlo),被稱為“七個(gè)小矮人”。這 7 種算法模型對(duì)高性能計(jì)算機(jī)提出了不同方面和層次的需求,也基本覆蓋了常見高性能計(jì)算應(yīng)用。
高性能計(jì)算應(yīng)用的發(fā)展和進(jìn)步需要數(shù)學(xué)、計(jì)算科學(xué)、應(yīng)用領(lǐng)域等學(xué)科的深度交叉融合。20 世紀(jì) 90 年代中期[6,7],中國(guó)科學(xué)院軟件研究所、生物物理研究所、物理研究所以及北京科技大學(xué)、國(guó)家智能中心的科學(xué)家聯(lián)合攻關(guān),在國(guó)產(chǎn)“曙光 1000”并行計(jì)算機(jī)上,完成了多個(gè)應(yīng)用軟件,并在天然 DNA 的整體電子結(jié)構(gòu)理論計(jì)算、激光晶體材料(LBO)電子態(tài)理論分析及廣義本征值并行計(jì)算等方面取得了令人矚目的高水平成果。生物物理學(xué)、物理學(xué)等應(yīng)用領(lǐng)域的科學(xué)家設(shè)計(jì)出便于在“曙光 1000”上實(shí)現(xiàn)的新方案,并在運(yùn)維人員的密切配合下,使其付諸實(shí)施。而計(jì)算科學(xué)家則針對(duì)“曙光 1000”的特點(diǎn),提出了“黑匣子并行”的思想和并行方案;同時(shí),在理論上證明了若干收斂性定理,為保證計(jì)算結(jié)果的正確性及準(zhǔn)確預(yù)估迭代時(shí)間提供了可靠的理論保證。這是中國(guó)科學(xué)院非常具有代表性的多領(lǐng)域科學(xué)家聯(lián)合攻關(guān),發(fā)揮物理模型、算法和高性能計(jì)算技術(shù)多學(xué)科優(yōu)勢(shì)和深度交叉的力量,取得高水平成果的成功案例。后來(lái),參與攻關(guān)的中國(guó)科學(xué)院物理研究所王鼎盛與中國(guó)科學(xué)院生物物理研究所陳潤(rùn)生分別因在計(jì)算物理學(xué)與計(jì)算生物學(xué)上的成就而被增選為中國(guó)科學(xué)院院士。
近年來(lái),我國(guó)科學(xué)家在高性能計(jì)算應(yīng)用領(lǐng)域又取得了新突破。在大氣科學(xué)的全球大氣動(dòng)力學(xué)的高性能計(jì)算研究方面,由中國(guó)科學(xué)院軟件研究所楊超、清華大學(xué)薛巍和付昊桓領(lǐng)銜的應(yīng)用成果——“千萬(wàn)核可擴(kuò)展全球大氣動(dòng)力學(xué)全隱式模擬”[8]在 2016 年 11月美國(guó)鹽湖城舉辦的“全球超級(jí)計(jì)算大會(huì) 2016”(SC16)上一舉拿下高性能計(jì)算應(yīng)用領(lǐng)域最高獎(jiǎng)——“戈登·貝爾”獎(jiǎng)②“戈登·貝爾”獎(jiǎng)旨在獎(jiǎng)勵(lì)國(guó)際前沿的并行計(jì)算研究成果,尤其是高性能計(jì)算創(chuàng)新應(yīng)用的杰出成就。其設(shè)立于1987年,由美國(guó)計(jì)算機(jī)協(xié)會(huì)(ACM)于每年11月頒發(fā)。該獎(jiǎng)項(xiàng)主要注重高性能計(jì)算應(yīng)用水平,是高性能計(jì)算應(yīng)用的最高獎(jiǎng)項(xiàng)之一和發(fā)展的“風(fēng)向標(biāo)”。,實(shí)現(xiàn)了我國(guó)高性能計(jì)算應(yīng)用在此項(xiàng)大獎(jiǎng)上零的突破,成為我國(guó)高性能計(jì)算應(yīng)用發(fā)展的一個(gè)新的里程碑。該課題在應(yīng)用與算法 2 個(gè)層面實(shí)現(xiàn)了重大突破:① 應(yīng)用層面。大氣動(dòng)力過(guò)程的模擬速度較美國(guó)下一代大氣模擬系統(tǒng) AM3(GFDL 開發(fā))的計(jì)算效率提升近 1 個(gè)數(shù)量級(jí)。全隱式求解方法是未來(lái)超高分辨率大氣模式構(gòu)建的一種新選擇。② 算法層面。實(shí)現(xiàn)目前世界上第一個(gè)可擴(kuò)展到千萬(wàn)核,峰值效率超過(guò) 6% 的隱式求解器,它將模擬分辨率提升至 500 米以內(nèi),并行度和峰值效率較 2015 年“戈登 · 貝爾”獎(jiǎng)工作均提升一個(gè)數(shù)量級(jí)。該成果可應(yīng)用于全球高分辨率氣候模擬和高精細(xì)數(shù)值天氣預(yù)報(bào),并在航空、地學(xué)、工程學(xué)等領(lǐng)域的挑戰(zhàn)性計(jì)算問(wèn)題中有廣闊應(yīng)用前景。
多年來(lái),中國(guó)科學(xué)院一直走在我國(guó)科學(xué)計(jì)算應(yīng)用發(fā)展的前列。無(wú)論是應(yīng)用水平、計(jì)算規(guī)模還是成果顯示度均取得了長(zhǎng)足的進(jìn)步。除了上述代表性成果,中國(guó)科學(xué)院的應(yīng)用成果還有許多。但因篇幅所限,以下僅選取幾個(gè)中國(guó)科學(xué)院典型傳統(tǒng)科學(xué)計(jì)算應(yīng)用領(lǐng)域,從科學(xué)家視角,談?wù)効茖W(xué)計(jì)算應(yīng)用現(xiàn)狀與發(fā)展和一些思考,以期窺一斑見全貌,更希望能引發(fā)讀者更深入的思考與關(guān)注。
3.1.1 現(xiàn)狀
全球氣候海洋模式是氣候系統(tǒng)模式的重要組成部分,也是氣候研究、氣候預(yù)測(cè)和預(yù)估不可或缺的工具??臻g分辨率的持續(xù)增加是海洋環(huán)流模式發(fā)展的重要趨勢(shì)之一。全球高分辨率海洋模式的發(fā)展要追溯到 20 世紀(jì) 90 年代初,第一個(gè)全球 25 公里的海洋模式使用了美國(guó)地球物理流體力學(xué)實(shí)驗(yàn)室(GFDL)發(fā)展的 MOM 模式。21 世紀(jì)開始,隨著以日本的“地球模擬器”為代表的大型超算平臺(tái)的發(fā)展,國(guó)際上有 20 多家模式開發(fā)中心開始進(jìn)行全球渦分辨(10 公里)模式的發(fā)展和研究,包括日本的 JAMSTEC,美國(guó)的NCAR、NOAA GFDL、FSU,以及德國(guó)的 MPI 氣象研究所等。
我國(guó)國(guó)內(nèi)的高分辨率全球海洋模式多是引進(jìn)國(guó)外的模式,如在氣候模式應(yīng)用的 MOM 和 POP 模式,以及在預(yù)報(bào)系統(tǒng)中采用的 HYCOM 和 NEMO 模式。中國(guó)科學(xué)院大氣物理研究所在全球海洋模式發(fā)展方面進(jìn)行了長(zhǎng)期攻關(guān),所發(fā)展的渦分辨率全球海洋環(huán)流模式——LASG/IAP 氣候系統(tǒng)海洋模式(LASG/IAP Climate System Ocean Model,LICOM)[10]也是我國(guó)唯一自主發(fā)展的全球海洋環(huán)流模式。LICOM 海洋模式的模擬結(jié)果參與了歷次國(guó)際耦合模式比較計(jì)劃(CMIP)并被政府間氣候變化專門委員會(huì)(IPCC)引用,其最新版本的模式被國(guó)際同行認(rèn)為是對(duì) ENSO(El Ni?o-Southern Oscillation)模擬能力最好的模式之一。不僅如此,基于 LICOM 海洋模式成功地研制了水平分辨率為 10 公里的海洋環(huán)流模式,可顯式地模擬海洋中尺度渦旋。中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心王文浩等[11]采用 MIC 并行優(yōu)化 LICOM,實(shí)現(xiàn)了較好的加速效果,加速比達(dá)到 2.09。高分辨率的 LICOM 支撐了國(guó)家和中國(guó)科學(xué)院的多項(xiàng)大型專項(xiàng),也應(yīng)用在國(guó)家海洋局環(huán)境預(yù)報(bào)中心等海洋業(yè)務(wù)中,為日常經(jīng)濟(jì)活動(dòng)等提供了海洋環(huán)境保障。
3.1.2 對(duì)領(lǐng)域應(yīng)用的促進(jìn)
對(duì)歷年參加 CMIP 計(jì)劃模式中海洋分量模式分辨率的分析表明,氣候海洋模式最高分辨率的增長(zhǎng)基本與計(jì)算機(jī)發(fā)展的摩爾定律相吻合,即模式的分辨率受限于計(jì)算能力。隨著高性能計(jì)算的發(fā)展,近期美國(guó)國(guó)家航空航天局(NASA)采用 MITgcm 海洋模式,進(jìn)行了全球 2 公里的試驗(yàn)。雖然試驗(yàn)受限于計(jì)算量和存儲(chǔ)量,僅僅運(yùn)行了 1 年左右,但其結(jié)果第一次實(shí)現(xiàn)了對(duì)全球次中尺度渦的垂直輸送的估算,發(fā)現(xiàn)了次中尺度渦在海洋上層熱量收支中的重要作用,對(duì)于海洋科學(xué)和氣候變化研究都有重要的意義。與此同時(shí),國(guó)內(nèi)的多家海洋研究單位,也在著手嘗試聯(lián)合進(jìn)行此方面的研發(fā),有逐步趕超國(guó)際的發(fā)展趨勢(shì)。
3.1.3 發(fā)展趨勢(shì)
隨著 E 超級(jí)計(jì)算平臺(tái)的研發(fā),全球海洋模式的水平分辨率必然也會(huì)向公里級(jí)、百米級(jí)發(fā)展,可分辨種類更齊全的海洋運(yùn)動(dòng)形式,如次中尺度渦、內(nèi)波等。在數(shù)值模式中分辨更多的海洋運(yùn)動(dòng)形式也是海洋科學(xué)的重要發(fā)展趨勢(shì),而國(guó)產(chǎn)計(jì)算系統(tǒng)的建設(shè)是發(fā)展我國(guó)自主研制超高分辨率海洋模式的絕佳契機(jī)。
3.2.1 現(xiàn)狀
為了應(yīng)對(duì)大氣污染問(wèn)題,歐盟、美國(guó)、日本和中國(guó)均建立了依托高性能計(jì)算機(jī)的空氣質(zhì)量數(shù)值預(yù)報(bào)中心。我國(guó)于 2015 年建立了國(guó)家空氣質(zhì)量預(yù)測(cè)預(yù)警裝置,包括峰值達(dá) 130 萬(wàn)億次的高性能計(jì)算機(jī)系統(tǒng)、環(huán)境空氣質(zhì)量數(shù)值預(yù)報(bào)模式系統(tǒng)、環(huán)境空氣質(zhì)量數(shù)值預(yù)報(bào)模式系統(tǒng)并行環(huán)境系統(tǒng)、支撐保障系統(tǒng)。這一裝置成為我國(guó)近年來(lái)應(yīng)對(duì)大氣重污染事件的核心工具,有效支撐了我國(guó)大氣污染防治計(jì)劃的開展。
西班牙 Martn等[12]采用 OpenMP 對(duì) STEM-II(Sulphur Transport Eulerian Model 2)進(jìn)行了并行化,并在SGI O2000 多處理器、富士通 AP3000 多計(jì)算機(jī)和 PC 集群上開展了測(cè)試,結(jié)果表明并行代碼的模式程序可以顯著減小模式運(yùn)行所需的 CPU 計(jì)算時(shí)間。德國(guó) Lieber 和 Wolke[13]發(fā)展了一種能有效解決化學(xué)傳輸模式負(fù)載不均衡問(wèn)題的改進(jìn)耦合方案,有效提高了化學(xué)傳輸模式的并行計(jì)算效率。朱云等[14]研究了 CMAQ 模型在 64 位 Linux 操作系統(tǒng)上不同 CPU 核心數(shù)目并行計(jì)算模擬耗時(shí)以及結(jié)果的差異情況。研究結(jié)果表明,并行計(jì)算能大幅縮短 CMAQ 模擬耗時(shí),以 16 個(gè) CPU 核心并行處理為性價(jià)比最佳值;多于 16 個(gè)核心并行處理時(shí),隨核心數(shù)量的增加模型性能提升的趨勢(shì)減緩。王自發(fā)等[15]基于高性能計(jì)算集群建立了具備多模式集合預(yù)報(bào)功能的空氣質(zhì)量多模式集成預(yù)報(bào)業(yè)務(wù)系統(tǒng),有效支撐了北京奧運(yùn)會(huì)的空氣質(zhì)量保障,推動(dòng)了我國(guó)空氣質(zhì)量預(yù)報(bào)預(yù)警能力的快速提升。Wang 等[16]針對(duì)空氣質(zhì)量模式中計(jì)算耗時(shí)大的氣相化學(xué)模塊,設(shè)計(jì)了化學(xué)動(dòng)力學(xué)模擬的新框架,以適應(yīng)下一代處理器中單一指令多數(shù)據(jù)(SIMD)技術(shù)的使用,通過(guò)矢量化實(shí)現(xiàn)細(xì)粒度級(jí)并行化,可使空氣質(zhì)量預(yù)報(bào)模式實(shí)現(xiàn) 3 倍以上的加速計(jì)算。Wang 等[17]利用“地球系統(tǒng)數(shù)值模擬裝置”的原型系統(tǒng)“硅立方”首次實(shí)現(xiàn)了中國(guó)區(qū)域 5 公里水平分辨率多年的大氣污染高精度模擬。
3.2.2 對(duì)領(lǐng)域應(yīng)用的促進(jìn)
基于高性能計(jì)算的城市、區(qū)域和國(guó)家空氣質(zhì)量預(yù)報(bào)雖然已取得了長(zhǎng)足的進(jìn)步并具備了較強(qiáng)的預(yù)報(bào)預(yù)警能力,但全球空氣質(zhì)量的預(yù)報(bào)預(yù)警能力仍然非常有限且不確定性大。一方面,由于空氣質(zhì)量數(shù)值模擬與預(yù)報(bào)涉及非常復(fù)雜的多尺度大氣物理化學(xué)過(guò)程以及毫秒級(jí)大氣化學(xué)反應(yīng)和微物理過(guò)程的模擬,計(jì)算代價(jià)高昂,全球空氣質(zhì)量模擬預(yù)報(bào)仍停留在較粗的空間分辨率(>25 公里),難以合理表征很多次網(wǎng)格尺度過(guò)程(如機(jī)動(dòng)車、電廠等排放過(guò)程以及局地環(huán)流過(guò)程)。目前,尚未有國(guó)家實(shí)現(xiàn)高分辨率(<10 公里)的全球空氣質(zhì)量預(yù)報(bào)。另一方面,受計(jì)算資源約束,現(xiàn)有全球模式對(duì)很多物理化學(xué)過(guò)程都進(jìn)行大幅簡(jiǎn)化處理,同時(shí)排放源、氣象場(chǎng)等輸入數(shù)據(jù)不確定性大,進(jìn)一步加大了全球空氣質(zhì)量預(yù)報(bào)的難度和不確定性。因此,我國(guó)空氣質(zhì)量預(yù)報(bào)能力提升亟待超級(jí)計(jì)算資源和技術(shù)的支撐。
3.2.3 發(fā)展趨勢(shì)
未來(lái),隨著我國(guó)超算能力的不斷增強(qiáng)以及國(guó)產(chǎn)計(jì)算系統(tǒng)的研發(fā),給我國(guó)乃至全球空氣質(zhì)量預(yù)報(bào)、預(yù)警提升提供了巨大的機(jī)會(huì)。目前,我國(guó)在建的國(guó)家重大科技基礎(chǔ)設(shè)施“地球系統(tǒng)數(shù)值模擬裝置”將研發(fā)全國(guó) 3 公里、重點(diǎn)地區(qū) 1 公里水平分辨率的區(qū)域高精度大氣污染模式,建成后將大幅提升我國(guó)區(qū)域大氣污染模擬預(yù)報(bào)能力。此外,依托國(guó)產(chǎn)計(jì)算系統(tǒng)也正在研制高分辨率全球空氣質(zhì)量智能化網(wǎng)格預(yù)報(bào)系統(tǒng),必將大幅提升我國(guó)在全球空氣質(zhì)量預(yù)報(bào)上技術(shù)能力和研究水平。
3.3.1 現(xiàn)狀
自 20 世紀(jì) 70 年代以來(lái),基于計(jì)算的藥物發(fā)現(xiàn)與設(shè)計(jì)(Computational Drug Discovery and Design,CDDD),也稱之為計(jì)算機(jī)輔助藥物設(shè)計(jì)(Computer-Assisted Drug Design,CADD),經(jīng)歷了顯著提升。隨著分子生物學(xué)和結(jié)構(gòu)生物學(xué)的快速發(fā)展,大量重要疾病相關(guān)的生物大分子的三維結(jié)構(gòu)和生物功能得以確定。同時(shí),隨著高性能計(jì)算機(jī)的快速發(fā)展,計(jì)算方法在藥物發(fā)現(xiàn)和分子模擬中的應(yīng)用不斷增加。量子力學(xué)、分子力學(xué)、分子動(dòng)力學(xué)以及這些方法的組合已廣泛用于疾病靶點(diǎn)及藥物開發(fā)研究。
近 10 年,基于國(guó)產(chǎn)超級(jí)計(jì)算機(jī)的發(fā)展,中國(guó)科學(xué)家在生物大分子分子動(dòng)力學(xué)模擬研究領(lǐng)域取得了較大進(jìn)展,尤其是中國(guó)科學(xué)院上海藥物研究所的(以下簡(jiǎn)稱“上海藥物所”)藥物靶標(biāo)動(dòng)態(tài)行為研究取得了系列創(chuàng)新成果,闡明了眾多藥物靶標(biāo)功能及藥物作用機(jī)制。目前,基于國(guó)產(chǎn)超級(jí)計(jì)算機(jī),上海藥物所研究團(tuán)隊(duì)開展了 40 萬(wàn)個(gè)原子體系的全原子十微秒尺度的分子動(dòng)力學(xué)模擬,其水平不落后于世界最高水平。但在中小規(guī)模(~5 萬(wàn)個(gè)原子)的全原子分子動(dòng)力學(xué)模擬中,國(guó)外的超級(jí)計(jì)算機(jī),如 Anton[18]已可以支撐十毫秒級(jí)分子動(dòng)力學(xué)模擬,而我國(guó)現(xiàn)有超級(jí)計(jì)算機(jī)只能支撐百微秒級(jí)分子動(dòng)力學(xué)模擬。
同時(shí),作為藥物分子設(shè)計(jì)重要手段之一的高通量虛擬篩選(High Throughput Virtual Screening,HTVS)技術(shù),亦稱為并行分子對(duì)接(Parallel Molecular Docking)技術(shù)的發(fā)展,使得藥物分子設(shè)計(jì)的速度、成功率均得到了大幅提高。但高通量虛擬篩選計(jì)算需要消耗大量的高性能計(jì)算資源,計(jì)算開銷非常昂貴。
3.3.2 對(duì)領(lǐng)域應(yīng)用的促進(jìn)
傳統(tǒng)上,在制藥行業(yè)中上市新藥是非常困難的過(guò)程。在美國(guó),一種新藥的上市往往需花費(fèi)超過(guò) 10 億美元并耗費(fèi) 10——17 年的時(shí)間?;谏锎蠓肿樱ㄈ绲鞍踪|(zhì)和核酸)三維結(jié)構(gòu)的一系列 CDDD 方法,如高通量虛擬篩選方法,極大地提高了藥物發(fā)現(xiàn)的效率。根據(jù)美國(guó)政府報(bào)告,由于 CDDD 技術(shù)應(yīng)用,每種藥物平均開發(fā)成本減少了約 1.3 億美元,研發(fā)時(shí)間縮短了約 1 年。
目前,國(guó)際各大制藥企業(yè)均開始重視高性能計(jì)算在藥物研發(fā)中的應(yīng)用,采用自建高性能計(jì)算或與高性能計(jì)算服務(wù)商及超級(jí)計(jì)算中心合作的方式來(lái)解決創(chuàng)新藥物研發(fā)進(jìn)程緩慢的問(wèn)題。特別是 D. E. Shaw Research③對(duì)沖基金經(jīng)理David E. Shaw博士(同時(shí)也是一位計(jì)算機(jī)科學(xué)家)設(shè)立的私人研究機(jī)構(gòu),主要從事計(jì)算化學(xué)/計(jì)算生物學(xué)方面的高性能計(jì)算的研究,特別是分子動(dòng)力學(xué)(MD)模擬。通過(guò)招募數(shù)百名數(shù)學(xué)、化學(xué)、生物學(xué)等專業(yè)以及計(jì)算機(jī)軟硬件方面的優(yōu)秀人才,開發(fā)了蛋白質(zhì)模擬專用機(jī) Anton[18]和 Anton 2[19],多次獲得“戈登 · 貝爾”獎(jiǎng);為其專用機(jī)發(fā)展的分子動(dòng)力學(xué)模擬 Desmond 程序已經(jīng)成為藥物研發(fā)軟件 Schrodinger(薛定諤)的核心組件之一,是該軟件實(shí)現(xiàn)高精度自由能計(jì)算 FEP 的主要模塊。2016 年,美國(guó) 500 強(qiáng)企業(yè)吉利德科學(xué)公司(Gilead Sciences)投資 1.2 億美金購(gòu)買 Nimbus 制藥的治療肝病的藥物,該事件成為一時(shí)的熱點(diǎn),被美國(guó)著名媒體《福布斯》雜志報(bào)道。Nimbus 公司是美國(guó)薛定諤公司技術(shù)參股公司,該藥物完全是用 Schrodinger 軟件設(shè)計(jì),計(jì)算機(jī)設(shè)計(jì)加實(shí)驗(yàn)驗(yàn)證總耗時(shí)僅 1 年時(shí)間,時(shí)間之短令業(yè)界震驚。
“十二五”期間,上海藥物所依托我國(guó)自主研發(fā)的“天河二號(hào)”和“神威 · 太湖之光”超級(jí)計(jì)算機(jī)開發(fā)了大規(guī)模并行的分子動(dòng)力學(xué)模擬軟件、虛擬藥物篩選方法及軟件,實(shí)現(xiàn)了最高 156 萬(wàn)核并行,并行效率達(dá) 85%;在針對(duì)腫瘤、糖尿病、乙肝等重大疾病靶標(biāo)蛋白的藥物研發(fā)中獲得了顯著成果,多個(gè)化合物完成技術(shù)轉(zhuǎn)讓,取得了巨大經(jīng)濟(jì)效益。
3.3.3 發(fā)展趨勢(shì)
新發(fā)突發(fā)大規(guī)模感染性疾病和抗感染藥物耐藥問(wèn)題嚴(yán)重威脅人類生命與健康。應(yīng)對(duì)新發(fā)突發(fā)大規(guī)模感染性疾病,基本上無(wú)現(xiàn)成藥物可供選用。因此,快速實(shí)現(xiàn)從無(wú)到有的突破在應(yīng)急應(yīng)對(duì)中顯得無(wú)比重要,而采用超級(jí)計(jì)算機(jī)藥物虛擬篩選技術(shù)可在短時(shí)間內(nèi)獲得候選化合物,提供緊急應(yīng)對(duì)方案。對(duì)抗感染藥物耐藥問(wèn)題,只有采用新策略和新機(jī)制開展新類型抗感染藥物研究,方有可能緩解病原微生物對(duì)傳統(tǒng)抗感染藥物的耐受難題。與病菌耐藥相關(guān)的蛋白以及途徑種類繁多,且在結(jié)構(gòu)水平上的耐藥機(jī)制尚未完全闡明。因此,對(duì)細(xì)菌蛋白耐藥機(jī)制進(jìn)行研究十分必要,而這就需要對(duì)生物大分子的結(jié)構(gòu)與功能進(jìn)行研究。近 2 年內(nèi)的技術(shù)突破使超大復(fù)合物的高分辨結(jié)構(gòu)研究成為可能,高分辨冷凍電鏡技術(shù)的突破則成為重要的推動(dòng)手段之一??茖W(xué)家利用各種技術(shù)獲得蛋白質(zhì)三維結(jié)構(gòu)后,采用分子動(dòng)力學(xué)模擬進(jìn)行結(jié)構(gòu)功能研究和自由能微擾方法進(jìn)行小分子藥物設(shè)計(jì)改造。冷凍電鏡三維重構(gòu)、分子動(dòng)力學(xué)模擬均需要耗費(fèi)大量的高性能計(jì)算機(jī)時(shí),而隨著國(guó)產(chǎn)超級(jí)計(jì)算系統(tǒng)的應(yīng)用,將會(huì)大幅減少藥物設(shè)計(jì)對(duì)實(shí)驗(yàn)的依賴并顯著提高藥物研發(fā)效率。
3.4.1 現(xiàn)狀
高能物理的研究對(duì)象是物質(zhì)世界的基本結(jié)構(gòu)及基本相互作用。量子色動(dòng)力學(xué)(QCD)和電弱統(tǒng)一理論(EW)通稱為粒子物理的標(biāo)準(zhǔn)模型,是目前高能物理研究的基本理論體系。高能物理的前沿重要課題有強(qiáng)相互作用中的夸克禁閉、標(biāo)準(zhǔn)模型精確檢驗(yàn)和超出標(biāo)準(zhǔn)模型的新物理的尋找;與之相關(guān)的重大物理問(wèn)題有強(qiáng)子結(jié)構(gòu)和強(qiáng)相互作用低能特性、宇宙早期演化、中微子性質(zhì)和中微子質(zhì)量起源、暗物質(zhì)和暗能量等。
高性能計(jì)算在高能物理中發(fā)揮著日益重要的作用,應(yīng)用范圍包括海量的高能物理實(shí)驗(yàn)數(shù)據(jù)的分析(數(shù)據(jù)密集型)、對(duì)撞機(jī)和探測(cè)器的計(jì)算機(jī)模擬輔助設(shè)計(jì)(計(jì)算密集型),以及以格點(diǎn)量子色動(dòng)力學(xué)(格點(diǎn) QCD)為代表的高能物理理論計(jì)算(計(jì)算密集型)。隨著計(jì)算機(jī)技術(shù)的發(fā)展,高能物理中的高性能計(jì)算已經(jīng)成為與傳統(tǒng)的高能物理實(shí)驗(yàn)、理論研究并列的第三大分支;其中格點(diǎn) QCD 以其高強(qiáng)度、高可擴(kuò)展性、高并行效率等特點(diǎn),長(zhǎng)期成為高性能科學(xué)計(jì)算的主要應(yīng)用領(lǐng)域之一。曾于 1988 年、1998 年和 2006 年 3 次獲得“戈登 · 貝爾”獎(jiǎng),2018 年也入圍了該獎(jiǎng)項(xiàng)的候選名單。
歐、美、日等發(fā)達(dá)國(guó)家和地區(qū)歷來(lái)十分重視格點(diǎn)QCD 研究并保持在該領(lǐng)域的領(lǐng)先地位。目前,美國(guó)格點(diǎn) QCD 研究每年消耗的計(jì)算資源為幾百兆 CPU 核小時(shí),預(yù)計(jì)到 2025 年將達(dá)到目前的幾十至一百倍。格點(diǎn) QCD 已被美國(guó)列為其未來(lái)E級(jí)計(jì)算機(jī)的重點(diǎn)應(yīng)用之一,并組織研究隊(duì)伍在物理課題、算法研究和程序開發(fā)等方面開展研究。
我國(guó)的格點(diǎn) QCD 研究也有長(zhǎng)期積累,目前正在組織相關(guān)團(tuán)隊(duì)基于國(guó)內(nèi)的超級(jí)計(jì)算系統(tǒng)調(diào)試和開發(fā)格點(diǎn) QCD 的應(yīng)用軟件,期望在未來(lái)參與到該領(lǐng)域E計(jì)算應(yīng)用發(fā)展中。
3.4.2 對(duì)領(lǐng)域應(yīng)用的促進(jìn)
格點(diǎn) QCD 的研究手段是進(jìn)行大規(guī)模的 Monte Carlo數(shù)值模擬研究,屬于典型的高性能科學(xué)計(jì)算領(lǐng)域。其對(duì)于高能物理中的重大科學(xué)問(wèn)題研究有不可替代的作用,直接服務(wù)于未來(lái)高能物理的重大物理發(fā)現(xiàn)。在標(biāo)準(zhǔn)模型精確檢驗(yàn)和超出標(biāo)準(zhǔn)模型新物理尋找方面,格點(diǎn) QCD 可以提供標(biāo)準(zhǔn)模型基本參數(shù)(如夸克質(zhì)量、強(qiáng)耦合常數(shù)等)的最精確的理論結(jié)果;可以從第一性原理提供對(duì)新物理敏感的強(qiáng)子矩陣元的精確、可靠的理論輸入。在夸克禁閉等強(qiáng)相互作用低能特性方面,格點(diǎn) QCD 可以對(duì)新型強(qiáng)子態(tài)、強(qiáng)子-強(qiáng)子相互作用以及強(qiáng)子結(jié)構(gòu)等問(wèn)題給出模型無(wú)關(guān)的物理結(jié)果。
格點(diǎn) QCD 研究成果的物理意義和國(guó)際地位直接決定于對(duì)統(tǒng)計(jì)誤差和各種系統(tǒng)誤差的控制水平,而誤差大小直接決定于計(jì)算規(guī)模和計(jì)算資源。格點(diǎn) QCD 的系統(tǒng)誤差主要來(lái)自四維時(shí)空格點(diǎn)體系的物理大小、格點(diǎn)細(xì)密程度以及夸克質(zhì)量參數(shù)的選取。目前國(guó)際上格點(diǎn) QCD 研究的最大的格點(diǎn)體系大小為 1283×256,計(jì)算規(guī)模大約十萬(wàn)或數(shù)十萬(wàn)核;如果未來(lái)規(guī)模提高到2563×512,則計(jì)算規(guī)模將增大到數(shù)百萬(wàn)核,必須使用E級(jí)計(jì)算。正所謂“計(jì)算決定未來(lái)”,計(jì)算能力和資源對(duì)高能物理未來(lái)的重要發(fā)現(xiàn)和理論突破的意義是不言而喻的。
3.4.3 發(fā)展趨勢(shì)
美國(guó)面向格點(diǎn) QCD 研究的未來(lái)E級(jí)計(jì)算應(yīng)用早已開始布局,國(guó)產(chǎn)高性能計(jì)算系統(tǒng)將為我國(guó)的格點(diǎn) QCD研究直接參與國(guó)際競(jìng)爭(zhēng)提供十分重要的計(jì)算支撐。北京正負(fù)電子對(duì)撞機(jī)和北京譜儀(BEPCII/BESIII)是國(guó)際上工作在粲夸克能區(qū)獨(dú)一無(wú)二的高亮度的實(shí)驗(yàn)裝置。在輕強(qiáng)子性質(zhì)研究,尤其是在新型強(qiáng)子態(tài)(如膠球、混雜態(tài)和 XYZ 粒子)研究方面有潛在的重大物理發(fā)現(xiàn),但需要理論研究的支持,其中格點(diǎn) QCD 的研究必不可少。
我國(guó)格點(diǎn) QCD 研究將基于國(guó)產(chǎn)高性能計(jì)算系統(tǒng)開展與 BESIII 物理密切相關(guān)的研究,為實(shí)驗(yàn)研究提供精確可靠的物理判據(jù),以期產(chǎn)生重要物理成果。核子(質(zhì)子和中子)是宇宙可見物質(zhì)的主要組成,但我們對(duì)其結(jié)構(gòu)并不十分清楚,我國(guó)籌建的中國(guó)高能電子-離子對(duì)撞機(jī)(EicC)和美國(guó)的高能電子-離子對(duì)撞機(jī)(EIC)及 JLab 的重要目標(biāo)之一是研究核子結(jié)構(gòu)。中國(guó)的格點(diǎn) QCD 研究將針對(duì)核子質(zhì)量、自旋核子三維結(jié)構(gòu)以及對(duì)新物理敏感的強(qiáng)子矩陣元進(jìn)行具有原創(chuàng)性的科學(xué)研究。同時(shí),通過(guò)大規(guī)模的科學(xué)計(jì)算實(shí)踐,我國(guó)科學(xué)家可為格點(diǎn) QCD 研究的計(jì)算方案、算法和軟件作出貢獻(xiàn)。
3.5.1 現(xiàn)狀
第一性原理(First-principles)材料模擬的主要任務(wù)即從密度泛函理論(Density Functional Theory,DFT)出發(fā),在無(wú)任何經(jīng)驗(yàn)參數(shù)的條件下從頭計(jì)算分子和固體材料的物理化學(xué)性質(zhì)及其應(yīng)用。第一性原理電子結(jié)構(gòu)計(jì)算軟件包括了一些有史以來(lái)計(jì)算成本最高的科學(xué)應(yīng)用程序,無(wú)論是硬件還是軟件發(fā)展方面,它們(如VASP、Gaussian、NWChem等)總是經(jīng)常處于對(duì)高性能計(jì)算能力需求的最前沿。為了通過(guò)密度泛函理論數(shù)值計(jì)算求解具體的物理化學(xué)問(wèn)題,需要采用基組展開等方法將 DFT 方程離散成計(jì)算機(jī)可以識(shí)別和操作的數(shù)組和矩陣,從而獲得材料中所有原子周圍的電子密度,進(jìn)而計(jì)算出材料的電子結(jié)構(gòu)及其他重要特性。第一性原理軟件包大致可以分為平面波基組軟件、原子軌道線性組合(LCAO)基組軟件、混合型平面波和高斯基組軟件。如果從計(jì)算復(fù)雜度(包括計(jì)算時(shí)間和內(nèi)存)上區(qū)分,第一性原理電子結(jié)構(gòu)計(jì)算方法可以分為傳統(tǒng)的高標(biāo)度法和線性標(biāo)度法。
當(dāng)今國(guó)際上的高性能第一性原理計(jì)算軟件(包括低標(biāo)度和高標(biāo)度)并不多,僅有 LS3D、CP2K、NWChem、BigDFT、DGDFT 和 Qbox 等可實(shí)現(xiàn)中等規(guī)模高性能并行計(jì)算(10 000 個(gè) CPU 核以上),其中 LS3D 和Qbox 曾獲得“戈登 · 貝爾”獎(jiǎng)。另外,DGDFT 和國(guó)內(nèi)商業(yè)軟件 PWmat 還采用了圖形處理器(Graphics Processing Unit,GPU),GPU 加速大大地提高了計(jì)算效率。同時(shí),VASP、Gaussian、NWChem 和 BigDFT 等軟件也正在發(fā)展 GPU 加速模塊。
3.5.2 對(duì)領(lǐng)域應(yīng)用的促進(jìn)
通過(guò)輸入的材料結(jié)構(gòu)信息,第一性原理計(jì)算可較為準(zhǔn)確地預(yù)測(cè)已知材料的基態(tài)結(jié)構(gòu)和基本物理化學(xué)性質(zhì),并實(shí)現(xiàn)原子級(jí)別的精準(zhǔn)控制。這已成為 21 世紀(jì)解決實(shí)驗(yàn)理論問(wèn)題和預(yù)測(cè)新材料結(jié)構(gòu)性能的強(qiáng)有力工具和標(biāo)準(zhǔn)研究方法。該方法不需要開展真實(shí)的實(shí)驗(yàn),極大地節(jié)省了成本,縮短了新材料的開發(fā)周期,為材料的制備和改性、新材料的開發(fā)以及極端環(huán)境下材料的性質(zhì)研究提供了有效的理論指導(dǎo)。然而,由于計(jì)算量極大,第一性原理材料模擬領(lǐng)域的科研人員對(duì)軟件性能和計(jì)算資源的需求越來(lái)越大。高性能計(jì)算的快速發(fā)展為第一性原理計(jì)算提供了機(jī)遇,使其在凝聚態(tài)物理學(xué)、材料科學(xué)、化學(xué)和生物學(xué)等領(lǐng)域發(fā)揮著日漸重要的作用,包括模擬并解釋實(shí)驗(yàn)新現(xiàn)象,分析其本征物理機(jī)制,以及設(shè)計(jì)新型功能材料并預(yù)測(cè)新奇性質(zhì)等,取得了很多重要科研成果??梢哉f(shuō),第一性原理計(jì)算體現(xiàn)了量子力學(xué)理論與高性能計(jì)算之間的高度結(jié)合,實(shí)現(xiàn)了理論-模擬-實(shí)驗(yàn)三位一體的科研模式,并引發(fā)了材料科學(xué)的革新。
3.5.3 發(fā)展趨勢(shì)
事實(shí)上,第一性原理計(jì)算現(xiàn)已成為高性能計(jì)算中應(yīng)用最廣泛和最活躍的領(lǐng)域。該領(lǐng)域研究的快速發(fā)展不僅歸功于理論、算法和軟件進(jìn)步,更得益于計(jì)算機(jī)硬件能力的指數(shù)級(jí)增長(zhǎng),包括處理器速度和數(shù)目的增加、內(nèi)存容量和速度的增長(zhǎng)、大規(guī)模并行處理能力的提高等。隨著計(jì)算機(jī)硬件和算法軟件的發(fā)展,高性能計(jì)算機(jī)的計(jì)算能力飛速提高,第一性原理計(jì)算應(yīng)用領(lǐng)域也將大步前進(jìn)。更精確、更大體系的第一性原理計(jì)算以及更長(zhǎng)時(shí)間尺度的分子動(dòng)力學(xué)模擬都將成為可能,其計(jì)算結(jié)果也將更加接近真實(shí)體系,從而使第一性原理計(jì)算發(fā)揮更大作用。
3.6.1 現(xiàn)狀
由于結(jié)構(gòu)材料的復(fù)雜性和應(yīng)用對(duì)性能的多方面需求,一種新材料從設(shè)計(jì)到應(yīng)用往往需花費(fèi) 20 年以上。以航空發(fā)動(dòng)機(jī)用鈦合金為例,對(duì)其強(qiáng)度、模量、韌性、疲勞、蠕變、氧化、腐蝕等方面性能均有很高要求,此外還需長(zhǎng)壽命、高可靠、低成本。發(fā)達(dá)國(guó)家在航空航天材料方面有近百年的積累,而我國(guó)雖經(jīng)幾十年的研究,也有很多自己的合金牌號(hào),但許多關(guān)鍵材料仍無(wú)法自給,其原因之一是基礎(chǔ)研究不足。
21 世紀(jì)以來(lái),人們逐漸認(rèn)識(shí)到計(jì)算模擬對(duì)新材料研發(fā)的促進(jìn)作用,美國(guó)先后啟動(dòng)了“集成計(jì)算材料工程”(ICME)[20,21]和“材料基因組計(jì)劃”(MGI)[22-24],希望借助計(jì)算加速新材料的研發(fā),同時(shí)降低成本。我國(guó) 2016 年啟動(dòng)了材料基因工程計(jì)劃,希望結(jié)合計(jì)算及實(shí)驗(yàn),促進(jìn)鈦合金等多種關(guān)鍵材料的研發(fā),以滿足航空航天及燃?xì)廨啓C(jī)等的需求。
3.6.2 對(duì)領(lǐng)域應(yīng)用的促進(jìn)
在新材料的研發(fā)與優(yōu)化方面,多尺度模擬在合金化效應(yīng)計(jì)算與合金元素篩選,微觀原子變形機(jī)制的揭示,不同條件下的微觀組織演化以及熱加工工藝的優(yōu)化等方面都起到重要作用,而這些都需要以高性能計(jì)算為基礎(chǔ)。中國(guó)科學(xué)院金屬研究所在國(guó)內(nèi)率先集成多尺度模擬與實(shí)驗(yàn)研究,研發(fā)出應(yīng)用 600℃ 的高溫鈦合金 Ti60 和應(yīng)用于人體的低模量鈦合金 Ti2448,并對(duì) TiAl 合金葉片的應(yīng)用等方面起到了重要推動(dòng)作用,但仍無(wú)法滿足航空、航天、航海、能源等對(duì)新材料的巨大需求。上述對(duì)性能的多方面需求,均需以材料的成分和組織為保證。盡管先進(jìn)的測(cè)試手段不斷涌現(xiàn),但仍無(wú)法滿足合金形變、相變機(jī)制及組織演化等的理解。例如,保載疲勞從 20 世紀(jì) 70 年代開始,一直制約著鈦合金的高效應(yīng)用。
中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心張鑒團(tuán)隊(duì)與中國(guó)科學(xué)院金屬研究所合作開展合金微結(jié)構(gòu)演化相場(chǎng)模擬研究,研發(fā)了合金微組織演化大模擬并行軟件 ScETDPF。它是基于可擴(kuò)展緊致指數(shù)時(shí)間差分算法庫(kù)的相場(chǎng)模擬軟件,支持計(jì)算材料科學(xué)、計(jì)算物理學(xué)、計(jì)算生命科學(xué)等學(xué)科的計(jì)算模擬,實(shí)現(xiàn)了國(guó)際上最大規(guī)模的合金微結(jié)構(gòu)粗化相場(chǎng)模擬,有助于加快我國(guó)新型合金的設(shè)計(jì)和加工工藝優(yōu)化。團(tuán)隊(duì)?wèi)?yīng)用 ScETD-PF 軟件在“神威·太湖之光”超級(jí)計(jì)算機(jī)上運(yùn)行合金微結(jié)構(gòu)粗化過(guò)程相場(chǎng)模擬,規(guī)模較以往提高近百倍,實(shí)現(xiàn)了超過(guò)千萬(wàn)核的擴(kuò)展性能,相場(chǎng)模擬實(shí)際性能達(dá)到峰值的 40%,遠(yuǎn)高于普通軟件約 5% 的水平。該軟件入圍了 2016 年“戈登 · 貝爾”獎(jiǎng)候選名單[25]。
3.6.3 發(fā)展趨勢(shì)
國(guó)產(chǎn)計(jì)算系統(tǒng)的研發(fā)將改變我國(guó)過(guò)去以實(shí)驗(yàn)和仿制為主的新材料研發(fā)模式。通過(guò)計(jì)算模擬篩選合金成分,揭示形變、裂紋萌生的微觀機(jī)理,探索不同微觀組織的形成機(jī)制及其對(duì)性能的影響,為材料性能控制指明方向。甚至在材料制備之前即可模擬其在不同應(yīng)用下的性能,從而大幅度減少實(shí)驗(yàn)次數(shù)及時(shí)間,顯著提升創(chuàng)新能力。還可通過(guò)模擬,根據(jù)新部件設(shè)計(jì)對(duì)材料提出新要求,實(shí)現(xiàn)材料的按需設(shè)計(jì),最終提升航空航天等系統(tǒng)的水平。
3.7.1 現(xiàn)狀
材料是國(guó)民經(jīng)濟(jì)的基石,是實(shí)現(xiàn)制造業(yè)轉(zhuǎn)型升級(jí)的重要基礎(chǔ)。隨著計(jì)算機(jī)模擬技術(shù)的發(fā)展,流體力學(xué)、材料和醫(yī)療等專業(yè)領(lǐng)域也開始使用模型輔助科學(xué)研究。由于其問(wèn)題的復(fù)雜性,這些領(lǐng)域的模型參數(shù)優(yōu)化使用單一的優(yōu)化算法或者適應(yīng)度計(jì)算方法無(wú)法有效解決問(wèn)題,比如某些方法精度高但運(yùn)行時(shí)間長(zhǎng),而某些方法需要苛刻的前置條件。因此,在這些領(lǐng)域通常采用多種方法結(jié)合的方式進(jìn)行參數(shù)優(yōu)化,即由不同步驟組合起來(lái)進(jìn)行問(wèn)題求解,從而發(fā)揮各個(gè)方法的優(yōu)點(diǎn),更有效率的解決問(wèn)題。同時(shí),應(yīng)用領(lǐng)域有很多商業(yè)軟件,不提供相應(yīng) SDK(軟件開發(fā)工具包),整個(gè)流程通常只能采用腳本語(yǔ)言(如 Shell 語(yǔ)言)對(duì)各個(gè)步驟進(jìn)行連接。
3.7.2 對(duì)領(lǐng)域應(yīng)用的促進(jìn)
多步驟參數(shù)優(yōu)化算法的典型場(chǎng)景是材料學(xué)領(lǐng)域的晶體結(jié)構(gòu)預(yù)測(cè)算法。目前常見的結(jié)構(gòu)能量計(jì)算方法有分子動(dòng)力學(xué)模擬的方法和基于第一性原理的密度泛函理論(DFT)方法。DFT 方法能夠提供更準(zhǔn)確的結(jié)構(gòu)能量,但計(jì)算成本很高。以 TiO2晶體為例,采用分子動(dòng)力學(xué)軟件 LAMMPS 計(jì)算其能量,平均耗時(shí)為 169 ms(100 次實(shí)驗(yàn)的統(tǒng)計(jì)結(jié)果,下同);而采用 DFT 軟件 VASP 計(jì)算其能量,平均耗時(shí)為 10 309.27 s,兩者相差將近 6 萬(wàn)倍。在 DFT 軟件的基礎(chǔ)上采用參數(shù)優(yōu)化算法搜索結(jié)構(gòu)晶體狀態(tài),其時(shí)間成本很可能超出科學(xué)家可接受時(shí)間上限。由此可見,單純采用分子動(dòng)力學(xué)方法進(jìn)行結(jié)構(gòu)能量模擬,很難獲得和 DFT 方法同等的模擬精度;而單純采用 DFT 方法,隨著分子結(jié)構(gòu)復(fù)雜度上升,其時(shí)間成本越來(lái)越昂貴。
3.7.3 發(fā)展趨勢(shì)
多步驟參數(shù)優(yōu)化算法較好地解決了這個(gè)問(wèn)題。目前該領(lǐng)域通常是將兩種方法結(jié)合,在不明顯影響系統(tǒng)效率的情況下,有效提升模擬方法的精確度。美國(guó) Ames 國(guó)家實(shí)驗(yàn)室提出一種 AGA(Adaptive Genetic Algorithm)算法,其采用遺傳算法進(jìn)行給定結(jié)構(gòu)的晶體狀態(tài)搜索,在 GA 計(jì)算個(gè)體適應(yīng)度時(shí),采用分子動(dòng)力學(xué)方法模擬結(jié)構(gòu)能量。同時(shí),創(chuàng)造性地添加了 Adaptive loop 模塊,將 GA 生成的數(shù)個(gè)最優(yōu)結(jié)構(gòu)交與第一性原理 DFT 方法重新精確計(jì)算其結(jié)構(gòu)能量,再采用 Force-Matching 方法基于精確信息對(duì)分子動(dòng)力學(xué)方法的勢(shì)參數(shù)進(jìn)行耦合,從而提升分子動(dòng)力學(xué)方法的精確性。如此組成大循環(huán),直至收斂。
3.8.1 現(xiàn)狀
宇宙學(xué)模擬是理解星系形成、暗物質(zhì)、暗能量等重大科學(xué)問(wèn)題的重要手段,從計(jì)算技術(shù)方面來(lái)講,宇宙學(xué)模擬涉及的物理過(guò)程之多、動(dòng)力學(xué)范圍之大、計(jì)算方法之復(fù)雜、計(jì)算規(guī)模之大,一直是反映國(guó)際高性能計(jì)算發(fā)展水平的典型代表。其中最核心的 N 體問(wèn)題模擬及其應(yīng)用先后 9 次獲得“戈登 · 貝爾”獎(jiǎng),這充分顯示 N 體問(wèn)題相關(guān)算法及其應(yīng)用的重要性和并行實(shí)現(xiàn)的技術(shù)難度。
日本東京大學(xué)的 Ishiyama 和 Makino 等開發(fā)了 N 體問(wèn)題并行數(shù)值模擬軟件 GreeM,并在富士通“京”超級(jí)計(jì)算機(jī)上通過(guò)各種性能優(yōu)化技術(shù),在國(guó)際上率先實(shí)現(xiàn)了萬(wàn)億粒子規(guī)模的宇宙學(xué) N 體模擬。
我國(guó)在宇宙學(xué) N 體問(wèn)題大規(guī)模模擬方面近幾年取得重要突破。中國(guó)科學(xué)院國(guó)家天文臺(tái)計(jì)算天體物理重點(diǎn)實(shí)驗(yàn)室和中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心合作,在國(guó)際上率先發(fā)展了基于 MIC/CPU 混合架構(gòu)的宇宙學(xué) N 體模擬軟件 PhontoNs。該軟件在“Intel 并行應(yīng)用挑戰(zhàn)賽 2014”的兩個(gè)獎(jiǎng)項(xiàng)上均獲得了亞軍。
3.8.2 對(duì)領(lǐng)域應(yīng)用的促進(jìn)
2015 年北京師范大學(xué)張同杰率領(lǐng)的研究團(tuán)隊(duì)開發(fā)了 Tian-Nu 軟件,在“天河二號(hào)”上成功進(jìn)行 3 萬(wàn)億粒子數(shù)的中微子和暗物質(zhì)的宇宙學(xué) N 體問(wèn)題模擬,揭示了宇宙大爆炸 1 600 萬(wàn)年后至今的 137 億年的演化進(jìn)程[26]。該軟件基于 P2P 和 PM 的耦合算法,模擬結(jié)果已發(fā)表在《自然-天文》(Nature Astronomy)上,獲得了國(guó)際宇宙學(xué)領(lǐng)域的高度關(guān)注。
3.8.3 發(fā)展趨勢(shì)
目前國(guó)際上成熟的宇宙學(xué)模擬軟件均基于純 CPU的傳統(tǒng)超級(jí)計(jì)算機(jī),而大型超級(jí)計(jì)算機(jī)的主流發(fā)展方向是深度異構(gòu)。在異構(gòu)計(jì)算環(huán)境下對(duì)超大規(guī)模粒子體系進(jìn)行快速模擬需要研究如何提高算法的并行可擴(kuò)展性,尤其需要解決動(dòng)態(tài)模擬過(guò)程中粒子分布不均時(shí)的負(fù)載均衡問(wèn)題。另外,還需要研究眾核異構(gòu)平臺(tái)上的性能優(yōu)化技術(shù)、分布式八叉樹周游的計(jì)算與通信重疊技術(shù)、三維 FFT 大規(guī)??蓴U(kuò)展性并行劃分與通信。中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心正在與中國(guó)科學(xué)院國(guó)家天文臺(tái)合作,針對(duì)國(guó)產(chǎn)超級(jí)計(jì)算機(jī),通過(guò)并行異構(gòu)算法設(shè)計(jì)以及代碼優(yōu)化,研發(fā)能夠滿足宇宙學(xué)超大規(guī)模數(shù)值模擬需求的引力場(chǎng) N 體模擬軟件?;趪?guó)產(chǎn)計(jì)算系統(tǒng)的天文 N 體計(jì)算模擬軟件將實(shí)施千億量級(jí)及以上規(guī)模的高效率宇宙學(xué)模擬,為國(guó)際大型星系巡天、暗物質(zhì)、暗能量大型探測(cè)計(jì)劃,以及我國(guó)重大科學(xué)工程 500 米口徑球面射電望遠(yuǎn)鏡(FAST)和空間站巡天望遠(yuǎn)鏡等大科學(xué)裝置提供必要的數(shù)值模擬支撐。
3.9.1 現(xiàn)狀
從管中窺豹的 DNA 分子排列,到暗藏殺機(jī)的復(fù)雜遺傳疾病;從小分子代謝物流轉(zhuǎn)不息,到眼角眉梢的巧笑嫣然;見微知著地貫通微觀到宏觀是無(wú)數(shù)遺傳學(xué)家思考畢生的問(wèn)題。前瞻性隊(duì)列研究是流行病學(xué)的基本觀察性研究設(shè)計(jì)之一, 自 20 世紀(jì) 70——80 年代起,世界各國(guó)陸續(xù)開始建立長(zhǎng)期隨訪的人群隊(duì)列。新建立的人群隊(duì)列,如中國(guó)法醫(yī)分子畫像樣本庫(kù)、荷蘭 Rotterdam 隊(duì)列、英國(guó)雙生子隊(duì)列、英國(guó) ALSPAC 隊(duì)列、美國(guó)波士頓隊(duì)列、澳大利亞 QIMR 隊(duì)列、拉丁美洲 CANDELA 隊(duì)列等,其規(guī)模越來(lái)越大,且包含較為全面的健康結(jié)局信息、環(huán)境暴露信息和社會(huì)學(xué)信息。這些數(shù)據(jù)具備部分大數(shù)據(jù)的特征:大型隊(duì)列的規(guī)模已經(jīng)達(dá)到了 50 萬(wàn)種樣本以上,且采樣精度不斷提高,通過(guò)整合基因組學(xué)、轉(zhuǎn)錄組學(xué)、表觀組學(xué)、蛋白組學(xué)、代謝組學(xué)、免疫組學(xué)和影像組學(xué)等多維數(shù)據(jù),數(shù)據(jù)量迅速擴(kuò)大;表型數(shù)據(jù)包含非結(jié)構(gòu)化圖像、音、視頻等高度異質(zhì)性數(shù)據(jù),并且存在復(fù)雜的關(guān)聯(lián)關(guān)系,呈現(xiàn)出多樣性和異質(zhì)性;借助電子健康記錄及智能傳感設(shè)備,數(shù)據(jù)更新頻繁。深入解析這些數(shù)據(jù)是精準(zhǔn)醫(yī)學(xué)和 DNA 表型刻畫等多領(lǐng)域的核心目標(biāo),在復(fù)雜疾病的個(gè)性化預(yù)防、診療和指導(dǎo)公安刑偵破案等方面有重要的應(yīng)用價(jià)值。
3.9.2 對(duì)領(lǐng)域應(yīng)用的促進(jìn)
隨著測(cè)序技術(shù)不斷發(fā)展和各國(guó)對(duì)普惠健康領(lǐng)域投入的增加,新建立的人群隊(duì)列規(guī)模越來(lái)越大,且包含較為全面的健康結(jié)局信息、環(huán)境暴露信息和社會(huì)學(xué)信息,這些數(shù)據(jù)具備部分大數(shù)據(jù)的特征。未來(lái)由隊(duì)列聯(lián)盟整合的跨國(guó)人群隊(duì)列的樣本規(guī)模會(huì)達(dá)到千萬(wàn)級(jí),傳統(tǒng)分析手段的處理效率難以適應(yīng)數(shù)據(jù)的產(chǎn)生速度。與此同時(shí),借助電子健康記錄及智能傳感設(shè)備的實(shí)用,頻繁更新的多維表型組學(xué)數(shù)據(jù)形成了高度異質(zhì)的數(shù)據(jù)集合。深入解析這些數(shù)據(jù)需設(shè)計(jì)高效合理的數(shù)據(jù)庫(kù)架構(gòu)以對(duì)多源、異構(gòu)數(shù)據(jù)的清洗、標(biāo)準(zhǔn)化和存儲(chǔ),并引入新算法進(jìn)行處理。
3.9.3 發(fā)展趨勢(shì)
面對(duì)樣本量和數(shù)據(jù)維度的爆炸性增加,生物信息學(xué)也迎來(lái)了技術(shù)拐點(diǎn)。科研界和工業(yè)界共同發(fā)力,許多經(jīng)典的生物信息學(xué)算法和流程通過(guò)使用高性能計(jì)算資源,提高了生產(chǎn)效率,增強(qiáng)了系統(tǒng)易用性,降低了存儲(chǔ)管理難度;而針對(duì)高性能計(jì)算平臺(tái)開發(fā)的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)算法,也在解析多維數(shù)據(jù)復(fù)雜因果關(guān)系及交互作用網(wǎng)絡(luò)方面嶄露頭角。以經(jīng)典的全基因組關(guān)聯(lián)分析為例,配合高性能運(yùn)算平臺(tái)的高算力開發(fā)的新統(tǒng)計(jì)學(xué)習(xí)算法,可以極大提高統(tǒng)計(jì)效力,從而發(fā)現(xiàn)以前未發(fā)現(xiàn)的影響人類復(fù)雜表型的遺傳因子,深入理解其遺傳結(jié)構(gòu)。對(duì)于復(fù)雜疾病來(lái)說(shuō),這能夠提供明確的分子通路和基因靶標(biāo),進(jìn)而完善復(fù)雜疾病的個(gè)性化預(yù)防、診療、分子分型、預(yù)后等健康管理方案。對(duì)于人類復(fù)雜外貌表型來(lái)說(shuō),也可以基于發(fā)現(xiàn)的遺傳因子建立外貌表型預(yù)測(cè)模型,推動(dòng)協(xié)助刑事案件偵查、海關(guān)檢驗(yàn)和移民管理等工作進(jìn)入主動(dòng)、精確、智能的新時(shí)代。將來(lái),高性能計(jì)算將進(jìn)一步推動(dòng)面向生命科學(xué)研究的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的算法開發(fā),助力數(shù)據(jù)聚類、建模預(yù)測(cè)、文本挖掘、圖像識(shí)別等領(lǐng)域開展數(shù)據(jù)驅(qū)動(dòng)型研究。
歷經(jīng) 30 年,我國(guó)的科學(xué)計(jì)算由起步發(fā)展至今,在諸多研究領(lǐng)域取得了長(zhǎng)足的進(jìn)步,但仍需面對(duì)E級(jí)超算④E級(jí)超算是指每秒可進(jìn)行百億億次浮點(diǎn)運(yùn)算(1018 Flops)的超級(jí)計(jì)算機(jī),是全世界公認(rèn)的“超級(jí)計(jì)算機(jī)的下一頂皇冠”。的新挑戰(zhàn)。高性能計(jì)算機(jī)的體系結(jié)構(gòu)越來(lái)越復(fù)雜,其特征是處理器和加速器部件的復(fù)雜深度異構(gòu)、單處理器內(nèi)眾核、單節(jié)點(diǎn)內(nèi)多處理器、數(shù)萬(wàn)計(jì)算結(jié)點(diǎn)、多級(jí)存儲(chǔ)系統(tǒng)和超高速內(nèi)部互聯(lián)網(wǎng)絡(luò),這對(duì)應(yīng)用軟件的研制提出了眾多挑戰(zhàn)。
我國(guó)經(jīng)過(guò)多年的努力和投入,超級(jí)計(jì)算機(jī)硬件基礎(chǔ)設(shè)施能力已達(dá)國(guó)際先進(jìn)水平。但由于在科學(xué)計(jì)算軟件方面如基礎(chǔ)算法庫(kù)、并行算法庫(kù)、高性能計(jì)算應(yīng)用中間件和各學(xué)科領(lǐng)域應(yīng)用軟件缺乏穩(wěn)定投入和長(zhǎng)期積累,導(dǎo)致我國(guó)科學(xué)計(jì)算應(yīng)用各環(huán)節(jié)均嚴(yán)重依賴國(guó)外。特別是使用國(guó)外軟件占比高達(dá) 90% 以上,這已成為制約我國(guó)高性能計(jì)算進(jìn)一步發(fā)展的“卡脖子”問(wèn)題。
為了更好地發(fā)展我國(guó)的科學(xué)計(jì)算應(yīng)用和加強(qiáng)研發(fā)應(yīng)用軟件,今后應(yīng)戰(zhàn)略性布局和規(guī)劃我國(guó)科學(xué)計(jì)算的發(fā)展路線和實(shí)施計(jì)劃,具體給出 5 點(diǎn)建議。
(1)設(shè)立國(guó)家級(jí)高性能計(jì)算軟件研發(fā)中心,并給予長(zhǎng)期穩(wěn)定支持。針對(duì)國(guó)產(chǎn)處理器研發(fā)若干重要領(lǐng)域的科學(xué)計(jì)算軟件;通過(guò)挖掘若干應(yīng)用領(lǐng)域的科學(xué)問(wèn)題,以應(yīng)用需求為導(dǎo)向,設(shè)立長(zhǎng)期穩(wěn)定的科學(xué)目標(biāo)。圍繞該目標(biāo),開展長(zhǎng)期、持續(xù)的軟件研發(fā)。
(2)大力加強(qiáng)高性能計(jì)算應(yīng)用中間件的開發(fā)。近年來(lái),在國(guó)家“863”計(jì)劃和重點(diǎn)研發(fā)計(jì)劃“高性能計(jì)算”專項(xiàng)的支持下,我國(guó)科研工作者成功研制了三維并行結(jié)構(gòu)自適應(yīng)軟件框架 JASMIN[[27]和三維并行自適應(yīng)有限元軟件平臺(tái) PHG[[28]。中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心科研人員在計(jì)算科學(xué)應(yīng)用研究中心支持下,正研發(fā)并行計(jì)算框架 SC Tangram。通過(guò)框架支撐,并行計(jì)算細(xì)節(jié)可對(duì)應(yīng)用科學(xué)計(jì)算研究人員屏蔽,使其可集中于物理模型和計(jì)算方法創(chuàng)新并加速計(jì)算程序與新方法、新模型的融合,最終實(shí)現(xiàn)大規(guī)模并行計(jì)算應(yīng)用軟件的快速開發(fā)。
(3)進(jìn)一步在國(guó)家戰(zhàn)略層面加強(qiáng)科學(xué)計(jì)算應(yīng)用軟件的規(guī)劃和開發(fā)??茖W(xué)計(jì)算應(yīng)用軟件是計(jì)算科學(xué)和應(yīng)用科學(xué)領(lǐng)域交叉融合的產(chǎn)物,涉及面廣。僅僅依靠高等院校和科研院所的研究人員憑興趣自發(fā)或是零散的研發(fā)應(yīng)用是遠(yuǎn)遠(yuǎn)不夠的,應(yīng)從國(guó)家戰(zhàn)略層面和科學(xué)問(wèn)題的需要出發(fā),以需求為牽引,以需要解決問(wèn)題為目標(biāo),制定 10 年甚至更長(zhǎng)時(shí)間的規(guī)劃并堅(jiān)定地執(zhí)行方才能見到成效。
(4)提高科學(xué)計(jì)算應(yīng)用的基礎(chǔ)研究水平??茖W(xué)計(jì)算能力包括計(jì)算機(jī)軟件硬件、支撐軟件以及算法的能力。只有提高科學(xué)計(jì)算應(yīng)用的基礎(chǔ)研究水平,才能對(duì)高性能計(jì)算機(jī)的軟硬件提出更高的需求,從而推動(dòng)高性能計(jì)算應(yīng)用向著更深層次和更高水平發(fā)展。大力發(fā)展復(fù)雜異構(gòu)系統(tǒng)上的各種精度的混合計(jì)算方法,加強(qiáng)高性能體系結(jié)構(gòu)發(fā)展與算法、軟件的互動(dòng)。
(5)大力加強(qiáng)計(jì)算科學(xué)和應(yīng)用學(xué)科的復(fù)合型人才培養(yǎng)??茖W(xué)計(jì)算涉及應(yīng)用科學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)等多個(gè)學(xué)科,必須在高等教育、繼續(xù)教育以及研究院所等層面開展相關(guān)培養(yǎng)工作,加大經(jīng)費(fèi)支持,建立適合的評(píng)價(jià)機(jī)制,鼓勵(lì)研究人員從事計(jì)算應(yīng)用軟件的研發(fā),提高待遇,從而形成可持續(xù)性發(fā)展的局面。
致謝 感謝中國(guó)科學(xué)院大氣物理研究所劉海龍和唐曉、中國(guó)科學(xué)院上海藥物研究所于坤千、中國(guó)科學(xué)院高能物理研究所陳瑩、中國(guó)科學(xué)技術(shù)大學(xué)胡偉、中國(guó)科學(xué)院金屬研究所徐東生、中國(guó)科學(xué)院北京基因組研究所劉凡、中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心王彥堈和王武提供了相關(guān)科學(xué)計(jì)算應(yīng)用的文字材料;感謝中國(guó)科學(xué)院物理研究所王鼎盛院士提供珍藏了 20 多年的、發(fā)表在《人民日?qǐng)?bào)》和《中國(guó)科學(xué)報(bào)》上的有關(guān) 曙光 1000 攻關(guān)的報(bào)道。