羅亮
自2013年6月起成為全球最快的超級計算機,天河二號的霸主位置就沒有被動搖過。
2014年6月23日,國際TOP500組織公布全球超級計算機500強排行榜最新榜單,天河二號以比第二名美國“泰坦”快近一倍的速度連續(xù)第三次獲得冠軍。(注:榜單每半年公布一次)
連續(xù)三次獲得全球超計算機冠軍,讓外界對于這臺龐大的超級計算機產(chǎn)生了濃厚的興趣。人們希望迫切了解這臺超級計算機的研發(fā)和應(yīng)用現(xiàn)狀。
天河二號誕生
天河二號目前位于廣州的超級計算中心,主機房面積在4000平方米以上。
天河二號是國家科技部“十二五”863重大項目立項研制的項目,國防科技大學(xué)牽頭進行了研發(fā)工作。近300人的研發(fā)團隊從2011年開始,歷時兩年多才研制完成。
在天河二號之前,國防科技大學(xué)的團隊曾在2010年研制出了天河一號,并首次讓中國超級計算機站到了世界冠軍的領(lǐng)獎臺上。
然而,僅僅過了不到8個月,日本一臺名為“京”的超級計算機就將天河一號擠下冠軍臺。之后,美國研制的“紅杉”、“泰坦”超級計算機也先后坐上世界第一的交椅,天河一號排名滑落至第8名。
實際上,當外界還稱贊天河一號奪得世界第一時,天河二號的開發(fā)工作已經(jīng)悄然展開。2013年6月,經(jīng)過280多人長達2年多的潛心研發(fā),天河二號正式研制成功,并很快奪回超級計算機冠軍的寶座。至今,天河二號已經(jīng)連續(xù)3次成為全球最快的超級計算機。
“上學(xué)的時候,最煩的和最驕傲的事情就是學(xué)校停電。”畢業(yè)于國防科技大學(xué)的穆童(化名)每每回憶起校園生活時都會這樣說到,“學(xué)校里的那個‘龐然大物一旦全速運轉(zhuǎn),全校就會停電,無論你是在看電視、打電腦游戲,都需要接受這一事實,就連校長也不例外。”
穆童所指的龐然大物就是天河二號,一臺運算能力驚人的超級計算機。穆童還清楚地記得,那兩年里,為了保障天河二號的研發(fā)工作,該校的校黨委還專門下發(fā)過通知,號召全校師生一起節(jié)約用電。
“在長沙30多度的夏天里,國防科技大學(xué)的校長、院長還有學(xué)生們要響應(yīng)號召,關(guān)掉空調(diào)等大功率的電器,換上電風扇?!被貞涍@個場景時,穆童的臉上閃過一絲得意之情。
如今,國防科技大學(xué)的新生們再也體會不到這種“停電”帶來的驕傲了,因為天河二號已經(jīng)從長沙的國防科技大學(xué)搬遷到廣州超級計算中心。而隨著專線電源的提供,未來天河N號的研發(fā)可能再也不會讓全校的師生們?nèi)淌荛L沙的酷暑了。
天河二號能夠做什么
天河二號歷時兩年多研制完成,耗資上億美元。如此巨額的投資,最終當然是為了服務(wù)國家經(jīng)濟建設(shè),而非只是標榜國家在超級計算機領(lǐng)域的能力已經(jīng)達到怎樣的高度。
除了助力探月工程、載人航天等政府科研項目外,天河二號目前已經(jīng)逐漸應(yīng)用于民用領(lǐng)域,如石油勘探、汽車飛機的設(shè)計制造、基因測序等。
在“天河二號”一排排高大的黑色機柜里,一共裝有32000顆主CPU和48000個協(xié)處理器,共300多萬個計算核心。擁有如此多的計算核心讓它的運算速度也非常驚人。
據(jù)測算,天河二號的峰值計算速度達到每秒5.49億億次,而持續(xù)計算時的速度每秒可達3.39億億次。假設(shè)每人每秒鐘進行一次運算,“天河二號”運算一小時,相當于13億人同時用計算器算上1000年。
據(jù)專家介紹,傳統(tǒng)手段研發(fā)新車,一般要經(jīng)過上百次碰撞實驗、歷時兩年多才能完成,而利用天河二號進行模擬,只需3-5次實車碰撞、兩個月即可實現(xiàn)。
此外,天河二號還可應(yīng)用于娛樂產(chǎn)業(yè),現(xiàn)在通過超級計算機制作動漫和3D電影已經(jīng)成為潮流。電影《阿凡達》動漫渲染制作耗時一年多完成。如果用天河二號,僅用1個月就可制作出與《阿凡達》動漫渲染效果相當?shù)挠捌?/p>
中國商用飛機設(shè)計有限公司北京研究中心利用約2.4萬CPU核開展了大型民機全參數(shù)氣動優(yōu)化設(shè)計,在天河二號計算6天,完成了其自身計算平臺約需2年的工作量,極大地提高了優(yōu)化工作效率。
華大基因互聯(lián)網(wǎng)支撐與發(fā)展中心負責人說,天河二號具有強大的計算能力,以500人規(guī)模的全基因組信息關(guān)聯(lián)性分析為例,華大基因利用原有計算機需1年時間,利用天河二號只需3個小時。華大基因是天河一號和天河二號的大商業(yè)客戶。
據(jù)該負責人表示,華大基因使用的生物信息軟件能迅速在天河二號上運行,不需要再另外進行編程;同時天河二號強大的計算能力,可以快速滿足華大基因海量基因數(shù)據(jù)分析所需的計算資源,節(jié)省大量分析時間。
截至目前,國家超算廣州中心的天河二號在短短幾個月的運行中為120多家用戶提供了300多項典型應(yīng)用計算。
更為重要的是,天河二號這樣的技術(shù)實際上可以進行復(fù)制。據(jù)天河二號主任設(shè)計師盧宇彤透露,天河一號和天河二號的技術(shù)可以用在規(guī)模小一點、用戶可以定制的“小天河”超級計算機上?!?010年,天河一號研制成功以后,實際上到2012年,‘小天河這樣的系統(tǒng)已經(jīng)推廣了11套?!?/p>
早在2013年9月,天河二號剛剛第一次拿下“全球最快超級計算機”的名號時,新浪科技曾采訪過盧宇彤,只是當時外界對于天河二號的關(guān)注度遠沒有今天高。
能耗難題:年耗電上億元
從目前天河二號來看,計算節(jié)點的能耗約為18兆瓦,再加上散熱系統(tǒng)的整體能耗在20兆瓦以上。如果正常運行,天河二號每年的電費就會超過1億元,年耗電量約為2億度。
對于外界對天河二號的耗電量高的質(zhì)疑,中科院計算所計算機體系結(jié)構(gòu)國家重點實驗室研究員張云泉表示,雖然目前天河二號的能耗絕對值很高,但是外界應(yīng)該看到它的性能也高。
張云泉的意思是說,外界也應(yīng)該注意到這一點:天河二號在單位耗能內(nèi)實現(xiàn)的計算速度更快。
目前天河二號的運算能耗比約為1.90千萬億次/秒兆瓦,落后于計算能力排名第二、第三的“泰坦”和“紅杉”,但是遠高于排名第四位的日本“京”的0.83千萬億次/秒兆瓦,也高于排名第五的“米拉”的0.92千萬億次/秒兆瓦。endprint
“泰坦”和“紅杉”的運算能耗比分別是1.95千萬億次/秒兆瓦和2.17千萬億次/秒兆瓦,運算能耗比略高于天河二號。
現(xiàn)如今,天河二號作為世界排名第一的超級計算機,其理論峰值性能超過了5億億次/秒,但是距離未來將要實現(xiàn)的100億億次/秒目標依然有著不小的差距。
目前天河二號擁有1萬多個計算節(jié)點,未來計劃將節(jié)點數(shù)量增加到3萬甚至5萬個。但隨著節(jié)點數(shù)量的提升,在管理和能耗方面的問題也將徹底凸顯出來。
“如果按現(xiàn)在的趨勢這樣增加下去,100億億次/秒的超算系統(tǒng)功耗將達到400兆瓦,肯定是無法接受的?!睆堅迫嬖V新浪科技,國際上公認的100億億次/秒的超算標準是,功耗必須控制在20兆瓦內(nèi)。
“實際上,這就要求未來的超算系統(tǒng)能夠進行體系結(jié)構(gòu),硬件、軟件和制冷等多方面的創(chuàng)新。” 張云泉說。
超算的難題:應(yīng)用軟件缺失
計算能力的不斷提高是一個重要的課題,但將超級計算機應(yīng)用起來顯然意義更大。
中國已經(jīng)連續(xù)四屆拿下超級計算機的桂冠,但根據(jù)國際TOP500組織今年6月公布的最新全球超級計算機500強排行榜,美國仍然是擁有超級計算機最多的國家,在500強名單中占據(jù)233席。中國有76個超級計算機進入最新的500強榜單,位居世界第二。第三位至第六位,分別是日本、英國、法國和德國。
目前,我國國家級超算中心主要有天津中心、濟南中心、長沙中心、深圳中心以及廣州超算中心。這些超算中心承擔了超算推廣與應(yīng)用的任務(wù)。
據(jù)行業(yè)人士介紹,按運行時間看,國內(nèi)超算中心的資源利用率普遍都在70%以上,有的甚至超過80%。相比之下,國外超算中心的利用率普遍在60%左右。不過,受限于軟件開發(fā)和應(yīng)用支持,國內(nèi)超級計算機運行時的資源利用率低下。
上海超算中心主任奚自立在2012年接受新浪科技采訪時曾表示,上海超算中心擁有200萬億次計算能力,但是只有20%-30%運算任務(wù)能夠擴展到10萬億次,有20%-30%的計算任務(wù)能夠利用的計算力低于2萬億次。很多計算資源由于應(yīng)用的問題實際上用不到,造成一定的浪費。
對于應(yīng)用落后的問題,國家863計劃“高性能計算機及其核心軟件”重大專項總體組組長錢德沛教授曾指出,這主要有三個原因:第一,中國開展超級計算機業(yè)務(wù)的時間還很短;第二,超級計算人才缺乏;第三,中國軟件發(fā)展體制存在問題,由于盜版等因素沒人愿意進行大型應(yīng)用開發(fā)。
據(jù)他當時透露,“十一五”期間國家在超級計算機項目上投資了9.4億元,但是真正用于應(yīng)用開發(fā)的費用還不到1億元?!皯?yīng)用瓶頸是一個過程問題,未來這個問題還會長期存在?!?/p>
浪潮集團高性能服務(wù)器產(chǎn)品部總經(jīng)理劉軍認為,國內(nèi)超級計算機發(fā)展速度超過應(yīng)用和人才方面的成長速度,導(dǎo)致超級計算機硬件與應(yīng)用軟件之間出現(xiàn)了很大的鴻溝。而正是這種鴻溝的存在,讓國內(nèi)企業(yè)和機構(gòu)更加有緊迫感去培養(yǎng)人才和開發(fā)超級計算機的應(yīng)用。?
(本文轉(zhuǎn)自新浪科技)endprint