周倩
超算領域的國際競逐并非只有一個維度,而是運算速度、體系規(guī)模、產業(yè)應用的協(xié)同共進。中國超算研發(fā)的全面崛起,是建立在強悍的計算個體芯片、先進的運算管理技術、可靠的操作系統(tǒng)支持基礎之上的。
2018國際超算大會發(fā)布最新一期《Top500全球超算排行榜》,不出意外,美國橡樹嶺國家實驗室的超級計算機Summit(頂點),以峰值計算性能每秒20億億次(200 PFlops)的速度登頂全球最快超級計算機,中國的神威·太湖之光和天河二號退居第2位和第4位。
現(xiàn)今,超算領域的最強爭奪已是中國、美國、日本和歐洲的競爭,幾乎沒有哪一方能長久保持超算速度之冠。不過,中國超算的研發(fā)實力已經躋身世界第一陣營。2016年,美國國家安全局和能源部在一份有關高性能計算的報告中指出:中國超算已經和美國接近并跑(near-peer),如果不加大投資,尋求改變,中國將取代美國在超算領域的領導地位。超算強國并不僅僅贏在速度,速度永遠在刷新。超算領域的全球競逐遠遠沒有外界看到的那么簡單。
超算競逐的三個維度
超級計算(Supercomputing)這一概念最早出現(xiàn)在1929年《紐約世界報》的一則報道中,當時計算機還沒有發(fā)明出來,新聞背景是IBM給哥倫比亞大學建造大型報表機(tabulator)。隨著20世紀后半段IT技術的持續(xù)突破,超級計算機的完整定義是“由超過百個處理器組成的、能夠完成普通PC機和服務器不能完成的大型復雜課題的計算機?!?976年,中國第一臺超級計算機的運算峰值速度只有每秒1.6億次;2016年,神威·太湖之光的運算峰值速度超過10億億次,運算能力相當于200多萬臺普通個人電腦。
有人認為,人類未來的最大痛點是“日益增長的數(shù)據(jù)處理與有限算力之間的矛盾”。諸如蘋果、谷歌、亞馬遜、阿里巴巴、騰訊、百度等這些公眾熟知的IT產業(yè)巨頭,對算力盡管都有著無窮無盡的緊迫需求,然而,這些公司都不是超級計算機的主要用戶。那些與民生相關的天氣預報、地震海嘯預測、橋梁結構分析,或者與國家相關的導彈模擬、風洞實驗、核聚變模型檢測等,才是超級計算機的高頻應用領域。
速度,當然是超算的核心,運算速度更快意味著一切繁復的運算、模擬將能做到更快、更準確,相應的,設計、制造周期將大幅縮短,這在軍事和民用上都將獲得無可比擬的領先優(yōu)勢。不過,超算領域的國際競逐并非只有一個維度,而是運算速度、體系規(guī)模、產業(yè)應用的協(xié)同共進。
速度節(jié)點
最近十幾年來,超級計算機主要邁過了三個速度節(jié)點:
千萬億次:2010年以前,美國IBM“藍色基因”超級計算機曾連續(xù)五年雄踞世界第一,峰值速度達到每秒367萬億次。2010年11月,中國“天河一號”首次成為世界上最快的超級計算機,實測運算速度可以達到每秒2570萬億次。2011年10月,落戶濟南的“神威藍光”,全部采用國產處理器和系統(tǒng)軟硬件,峰值速度也超過千萬億次。
一億億次:2011年,日本K-computer超越了天河一號成為世界第一,而且成為人類歷史上第一次突破每秒一億億次計算能力的超級計算機。2013年,由國防科技大學研制的“天河二號” 以每秒5.49億億次的峰值計算速度,成為“全球最快”。
十億億次:2016年,由國家并行計算機工程技術研究中心研制的“神威·太湖之光”,峰值計算速度達到每秒12.5億億次,性能也更加穩(wěn)定,成為世界上第一臺運算速度超過十億億次的超級計算機。直到兩年之后,“神威·太湖之光”創(chuàng)造的世界記錄才被美國IBM“頂點”超級計算機完成超越。
體系規(guī)模
美國“頂點”盡管拿回超算速度之冠,但世界超算大會(ISC)發(fā)布的2018年《Top500全球超算排行榜》當中,中國體系規(guī)模上增加到206臺,美國下跌到124臺。而且在制造商方面,聯(lián)想成為第一個在榜單上排名第一的中國供應商,從惠普分拆出去的慧與科技排名第二,其后則是中國企業(yè)浪潮、美國企業(yè)Cray和中國企業(yè)中科曙光。世界五大超級計算機供應商,中國占了三個。
中國超算的研發(fā)布局也更具有體系優(yōu)勢,目前來看,中國超級計算機的研發(fā)機構主要有四個,其中三個在北京,一個在長沙。在長沙的是國防科技大學計算機研究所,主要從事計算機系統(tǒng)結構、高可信系統(tǒng)結構、工程工藝、操作系統(tǒng)、編譯系統(tǒng)及應用軟件的研究與開發(fā),兩次問鼎世界超算冠軍的天河一號、天河二號以及未來的天河三號都是這個研究所研制的。
北京的三個超算研發(fā)機構分別是國家并行計算機工程技術中心、中科院計算技術研究所、聯(lián)想數(shù)據(jù)中心集團。其中,2016年登頂世界的“神威·太湖之光”即由國家并行計算機工程技術中心研制。中科院計算機技術研究所的超算品牌為“曙光”系列,聯(lián)想數(shù)據(jù)中心集團的超算品牌為“深騰”系列。
產業(yè)應用
制造最快的超級計算機固然很了不起,能否真正推進產業(yè)應用才是關鍵,這就必須知道超算到底要用來解決什么問題。日本在設計一個超級計算機的時候,如果想做地球系統(tǒng)的模擬,那么它的名字就叫地球模擬器。設計完了之后馬上就做這個事情。
在企業(yè)級超算應用方面,國內還有不小的缺失。美國較大的汽車、石油企業(yè)有10個大型超算系統(tǒng),此外還有一堆小的超算機器。在中國汽車產業(yè),超算主要用來算部件,而美國算的是整車。如果拿中美同等規(guī)模的公司作對比,美國公司的超算系統(tǒng)規(guī)模是中國公司的10倍多。這才是不可忽視的差距。
另外,超級計算機也不能不考慮性價比,消耗少、干活多,才更有商用化價值?!懊客唠娔芩懔Α本褪窃u價超算性價比的指標,Green500(綠色500)就是按照這一指標對超級計算機進行排名。日本有幾個超級計算機型號能排進Green500的前30名,但在峰值速度榜單上甚至排不進前300名。
“模塊化”思維
中國超算研發(fā)實力的突飛猛進始于一篇論文,在2007年“國際計算機體系結構年會”上,“天河一號”總設計師楊學軍教授的一篇論文《64位流處理器體系結構研究》,引起各方專家高度關注,他們從中看到突破更高性能計算機的方法——采用“異構協(xié)同計算技術”。其實,“異構協(xié)同計算技術”就是一套很好的體系結構,將很多芯片連接起來。
經過一段時間的實驗驗證,“異構協(xié)同計算技術”應用于“天河一號”的工程研制中,國防科技大學的科研人員在國際上首創(chuàng)CPU(中央處理器)和GPU(圖形加速處理)相結合的異構融合計算體系結構。在理論探索和工程實現(xiàn)上的全面突破,締造了此后“天河二號”“神威·太湖之光”的登頂世界。
計算機研發(fā)有一個重要思維方式:任何極其復雜的事情,都能被拆分成為若干個小問題去解決,用少數(shù)簡單的模塊,可以搭建出各種復雜功能。簡而言之,這就是計算機研發(fā)的“模塊化”思維。
美國有一個天體物理學家,用16臺索尼PS3游戲機、一個千兆以太網交換機和Linux操作系統(tǒng)(全球頂尖的500臺超級計算機中有60%安裝了Linux操作系統(tǒng)),搭建了一個超級計算機,用于模擬“兩個黑洞碰撞時所產生的重力波的特性”。為什么用索尼PS3游戲機可以搭建超級計算機?答案是PS3游戲機所用的Cell處理器(由IBM研發(fā)),正是針對高密度計算和大規(guī)模并行計算網格所設計的,是非常理想的“算力積木”。
模塊化其實就是“搭積木”,你要設計一個功能非常強大的程控交換機,里面基本的模塊是非常簡單的。你要設計一個超級計算機,用大量相同的模塊搭建就可以了。有學者講,超算產品其實在計算機科學方面水平并不高,更多是工程成就。在IT產品中,常常是大量相同模塊的復制,這也是IT產業(yè)能夠發(fā)展很快,摩爾定律能夠成立的重要原因。這不像一輛內燃機汽車或者一臺鋼琴,里面有幾千幾萬個零部件,形狀各異,功能各不相同,要依靠長期技術積累才能做好。
“天河一號”連接了1.4萬多顆英特爾“至強”CPU、7000多顆英偉達GPU和2000多顆國產飛騰FT-1000 CPU。“神威·太湖之光”連接了超過4萬塊處理器,幾乎都是國產的,有40個運算機柜、8個網絡機柜,每個運算機柜比家用雙門冰箱都要大。
當然,超級計算機并不像大部分外行人想象的那樣容易,并不只是將很多芯片連接起來那么簡單,如果系統(tǒng)體系結構設計不好,將它們連接起來的性能是非常差的。所以,獲得很高計算性能的前提,是設計一套很好的系統(tǒng)體系結構將很多芯片搭建在一起。
E級超算
中國在2001年幾乎沒有世界級的超算產品,構建一整套全球頂級的超算系統(tǒng),也并非堆砌處理器這么簡單。中國超算研發(fā)的全面崛起,是建立在強悍的計算個體芯片、先進的運算管理技術、可靠的操作系統(tǒng)支持基礎之上的。
核心硬件
芯片無疑是超級計算機的核心部分,一臺超算產品至少裝有幾千枚甚至數(shù)萬枚CPU和GPU芯片,同時配備特殊的操作系統(tǒng),負責管理這些芯片之間如何合作,進行一系列復雜的運算,才能真正使之擁有十分可靠的強大算力。
國防科技大學分別在2010和2013年建造的“天河一號”和“天河二號”超級電腦,都曾登頂世界超算TOP500榜單,兩者都主要使用Intel和AMD提供的芯片。2015年4月,美國政府宣布制裁中國四家超算中心,禁止向中國超算中心出售Intel的Xeon Phi超算芯片。天河二號就因為美國的制裁,耽擱了升級計劃,不得已調整技術路線,并且采用國產矩陣2000替換Intel的Xeon Phi。但這無法阻止中國超算研發(fā)的強勢崛起。2017年,廣州超算中心宣布使用國產矩陣-2000芯片,升級了天河二號超算系統(tǒng),并成功實現(xiàn)算力翻倍。而神威·太湖之光超級計算機起初就安裝了40960個中國自主研發(fā)的“申威26010”眾核處理器,而且性能不俗。
多年以來,計算機CPU芯片一直遵循摩爾定律進行升級迭代。但摩爾定律也是有極限的,集成電路上的元器件已經足夠小,已經逼近“原子尺度”了,很難再延續(xù)過往路徑進行升級迭代。這個時候,就要想辦法挖掘計算機的系統(tǒng)潛力。
系統(tǒng)潛力
在挖掘計算機系統(tǒng)潛力方面,有兩個思維路徑:一個是阿里方案,一個是聯(lián)想方案。
阿里方案其實就是“大規(guī)模并行化處理非結構化數(shù)據(jù)”,即“云計算”。計算機科學的精髓在于自頂向下的遞歸,先在最頂層將一個大任務分解成為幾千個、幾萬個小任務,然后將每一個小任務分配到每一個服務器上。最后,再將每一個服務器上的結果綜合起來,得到原來大任務的最后結果。國內主要互聯(lián)網公司包括阿里巴巴、百度、京東商城等,都是用大量廉價的服務器取代一臺超級計算機。前者的價格不到后者的1/5,大大降低了運營成本。
這就像一個公司CEO,如果事無巨細、什么都管,那就是中心化的“control模式”,也就是一個超級計算機,control是“控制”的意思。而互聯(lián)網公司普遍采用去中心化的“context模式”,context是“上下文語境”的意思,就是CEO將任務和資源分解,讓更多人根據(jù)上下文語境做出決策,充分發(fā)掘系統(tǒng)中每一個環(huán)節(jié)的潛力。
而聯(lián)想作為商業(yè)公司,在幫助用戶“挖掘算力潛力”上是做得比較好的。在2018全球最強500臺超級電腦中,聯(lián)想獨占117臺,中國制造商還是第一次搶下這個世界第一。一般使用的服務器包括臺式機、筆記本,CPU和整機性能的負載不超過50%,即使是現(xiàn)在技術非常領先的互聯(lián)網用戶的服務器負載也不超過70%。但在高性能場景下,聯(lián)想可以把一臺機器能壓榨出來的性能壓榨到了極限。聯(lián)想超算產品在全世界最好的25所大學中有廣泛應用,尤其是北京大學的水冷超算機型,理論峰值是100%,最后聯(lián)想釋放出來的算力達到了92.7%。同時,應用層面的持續(xù)反饋,也是在給超算產品的研發(fā)方向探路。
超級計算機就算是速度再快、算力再強,目的仍是要解決問題,如何用好才是關鍵。僅有超算技術的突破是不夠的,更重要是,能夠對超算背后的諸多產業(yè)形成一個正面反饋,不斷實現(xiàn)對產業(yè)的輻射和支撐,也就是擴大各個產業(yè)應用超級計算機的“朋友圈”。
E級超算被視為超級計算機前沿競爭的下一個戰(zhàn)略高地——“E級”意味著每秒能夠達到百億億次的運算速度,相當于目前最快超級計算能力(美國Summit)的5倍左右。按照中國的時間表,中國最早有望在2020年發(fā)布E級超算。目前中國同時啟動了三大E級超算原型系統(tǒng)的研發(fā),分別是國防科技大學和天津超算中心的“天河三號”、中科曙光的E級超算,以及江南所和濟南超算中心的“神威”E級超算。
2018年8月5日,國產超算研制向著皇冠又邁進了一步:神威E級超算原型機在國家超級計算濟南中心完成部署,并正式啟用??梢灶A期,中國超算未來可以贏得很多世界第一,但這并不表示可以贏得未來。
長期以來,國內更關注升級技術、做好產品,很少去想如何提出一個好的問題。很多基礎的概念都是別人提出來的,別人設立這個跑道,我們在上面跟著跑。也許我們速度更快,但從超級計算機最初的體系架構,到人工智能的測試,我們都是在里面做跟進。我們很少找出問題和邏輯的源頭,所以,哪怕中國超算的研發(fā)實力已經十分強大,但未能提出更多真正有價值的問題,也就不能真正掌握未來。因為,偉大的創(chuàng)新往往源于一個絕佳的問題。