中國巨型計算機事業(yè)開拓者,
“神威”超級計算機總設計師,
有“中國巨型計算機之父”美譽,
中國前總理朱镕基稱贊他是“做大事的人”
他,就是中國高性能計算機領域著名專家,金怡濂!
他推動并實現(xiàn)中國巨型計算機向大規(guī)模并行處理方向發(fā)展,使中國高性能計算機峰值運算速度從每秒十億次跨越到每秒三千億次以上。
2003年他成為第三屆"國家最高科學技術獎"唯一獲獎者,2010年5月國際永久編號"100434"這顆小行星以金怡濂的名字命名。
1946年,世界上第一臺全電子數(shù)字計算機在美國賓夕法尼亞大學問世。這標志人類邁向信息時代的第一步。新中國的領導人敏銳地預見到這一科技領域的廣闊前景,立即將電子計算機列入重點發(fā)展的學科。1952年,在華羅庚先生的倡議下中國科學院成立了一個計算機小組;1956年,周恩來總理在12年中國科學技術遠景規(guī)劃中提出“四項緊急措施”,其中一項就是急速發(fā)展計算機技術。
金怡濂與計算機結緣,是在新中國成立后的1956年。當時,國家把計算機技術列為科學發(fā)展的重點學科之一。不久后,20個年輕人被選派赴蘇聯(lián)學習計算機研制,時年27歲、自清華大學電機系畢業(yè)后進入研究所工作的金怡濂幸運入選。
“當時,電子計算機剛問世10年。中國沒多少人知道什么是計算機,國家急缺人才,與其說我選擇了計算機,不如說計算機選擇了我。”金怡濂回憶道,他除了聽說過“計算機”這個名詞外,其它一無所知,更無從預料計算機技術的發(fā)展將給全世界帶來如此巨大而深刻的影響。但祖國的重托,足以激發(fā)他全部的熱情,夜以繼日地學習。
據(jù)他追憶:“我們當時住在莫斯科的南邊——蘇聯(lián)科學院宿舍區(qū),而研究所在北邊。每天早晨,我們很早就起床,先倒兩次公交車,再坐地鐵,爾后又轉乘公交,路上一般要花上一個半小時。我們在那里主要是做一些有關加法器方面的實驗,回宿舍的時候就借些資料看一看,盡管已是很累,但我們常常學習到深夜,畢竟在國內當時還沒開這門課?!彼屯瑢W們每天輾轉奔波于位于莫斯科南北兩端的宿舍和研究所之間,廢寢忘食,心無旁騖,埋頭鉆研。由于忙,在莫斯科呆了一年半的金怡濂,居然從沒聽過《莫斯科郊外的晚上》《紅莓花兒開》等風靡全蘇聯(lián)且唱紅到中國的名曲。
1958年7月,金怡濂從莫斯科回到北京,隨即就被派往中科院計算所,參與中國第一臺大型計算機104機的研制。
104機,是以蘇聯(lián)的БЭСМ-Ⅱ機為藍本研制,金怡濂在莫斯科時就已研究過蘇方的圖紙很多遍,所以,在原理和結構上問題不大。但時值國內“大躍進”時期,在“大干快上”的熱潮中,質量往往不太受重視,所以,如何確保計算機的穩(wěn)定性和可靠性,成了重點和難點。
當時的計算機體積都很龐大。世界上的第一臺電子計算機“埃尼阿克”(ENIAC)占地170平方米,重達30噸,能在1秒內進行5000次加法和500次乘法運算。而104機的主機和電機組機房各占地200平方米,共有22個機柜,使用了4200個電子管、4000個晶體二極管,每秒能運算1萬次。
金怡濂頗有感觸地說:“計算機是個很特別的東西。算一個數(shù),需要很多器件一起工作,若是在某個瞬間斷一下,計算結果就會出大錯。所以,工藝質量和設計質量一樣至關重要。”
那段時間,除吃飯、睡覺和非參加不可的集體活動,金怡濂和同事們幾乎所有的時間都泡在機房。除了研究設計,他們還花了大量時間,想了許多辦法,排查機器的每一個工藝環(huán)節(jié),以確?!耙粋€焊點也不能出問題”。經過多輪調試,1959年國慶節(jié)期間,104機正式宣布完成,《人民日報》頭版頭條報道了這一喜訊。隨后,它圓滿完成了包括中國第一顆原子彈在內的許多重大課題的相關科學運算。
此時,金怡濂已離開104機研究小組,又陸續(xù)投入到四臺大型計算機的研制工作。時值三年困難時期,金怡濂和同事們雖然吃不飽,但為了趕進度,白天黑夜連軸轉,困了就到機房隔壁的庫房睡一覺,醒了再回到機房接著干。
金怡濂主攻的運算控制,被稱為計算機的大腦和心臟。他提出了一系列可行性建議和改進方案,攻克了“穿通進位鏈加法器”等課題,逐步成長為中國大型計算機研制領域的骨干力量,被破格提拔為研究室副主任。
1963年,金怡濂攜家眷隨單位遷往大西南。平靜的生活沒有持續(xù)太久,“文革”就開始了。在全國許多科研單位逐漸“停擺”時,金怡濂所在的研究所“基本還在前進”;他本人經組織鑒別,被劃為“可以改造好的人”,雖被免去“副主任”的頭銜,但仍可以繼續(xù)從事科研,這讓金怡濂感到自己實在幸運。
1969年,金怡濂作為主要技術負責人和總體組組長,主持國家重點工程九〇五乙機的研制。當時,國家的電子工業(yè)基礎異常薄弱,金怡濂一方面與同事們下大力氣幫助合作的元器件生產廠家提高質量,另一方面在國內首次提出“雙機并行”的處理器系統(tǒng)結構,以雙機并行提高機器的速度和穩(wěn)定性,彌補元器件的可靠性不足。
雙機并行,這在當時不少人看來是個極其大膽新穎的構想。但金怡濂說,這并非他異想天開,而是源自多年來堅持追蹤國際新技術的心得。即使在鼓吹“知識無用”的年代,即使身在大西南信息閉塞的山區(qū),他仍然想方設法獲取最新的學術信息。每次到大城市開會或辦事,他必定要去圖書館或資料室查閱學術資料。他說:“搞科研的人,不跟蹤了解本專業(yè)的先進技術,無異于瞎子、聾子,長此以往,思維會遲鈍,會失去想象力和創(chuàng)造力,失去創(chuàng)新的靈感和激情?!?/p>
山區(qū)的科研條件十分簡陋,當時國家電子工業(yè)基礎薄弱,大型機研制舉步維艱:一些元器件由玩具廠生產;數(shù)以萬計的組件,要靠鉗子、螺絲刀、電烙鐵,一個一個組裝起來。由于地處偏僻,參考資料 也極其匱乏。為查詢資料,金怡濂要跑上海、北京等地。為此,得先在崎嶇的山路坐大卡車顛簸半天,然后擠上列車,在硬座車廂里度過兩三個晝夜的旅途。查完資料,匆匆背上一大包同事們讓他捎帶的肥皂、牙膏、糖果回到大山里,繼續(xù)他的研制工作。由于國外對技術的封鎖,大型計算機全靠我國自主設計生產,金怡濂主要負責硬件部分的設計把關,每一張圖紙都自行設計繪制,一臺機器下來,圖紙不下數(shù)萬張,摞起來像個小山。盡管如此,憑著“革命加拼命”的精神,1976年,九〇五乙機宣布研制完成,運算速度達每秒350萬次,開創(chuàng)了中國并行機研制的先河。
“科研條件固然重要,但起決定性的因素還是人。”金怡濂總結說。
1978年,中國迎來科學的春天。金怡濂代表九〇五乙機的全體參研人員、設計組和他個人,在第一次全國科學大會上捧回了三張獎狀。兩個月后,他又被派往美國和日本考察大型計算機。這次行程雖然收獲不小,也讓他們清醒地認識到了差距。
據(jù)金怡濂回憶,改革開放之初,國家百廢待興,急需更高性能的巨型機,迫不得已花巨資從國外進口了一臺。然而,購機同時還須花錢“聘請”兩位“洋監(jiān)工”,由他們在控制室中監(jiān)視機器的使用。并在雙方簽訂的協(xié)議上明確規(guī)定:中方人員不得進入控制室;開機、關機須由外方負責操作;中方不得將機器派作他用等等,這讓金怡濂大感屈辱,他由此深刻地認識到,高科技是花錢買不到的,必須發(fā)展中國自己的巨型機,否則只能受制于人。
“核心技術是花錢買不來的?!备惺艿角心w之痛的金怡濂下定決心,一定要研制出屬于中國人自己的、不輸給任何人的高性能計算機。鄧小平同志也明確提出:“中國要搞四個現(xiàn)代化,不能沒有巨型機?!?/p>
在中國科研人員廢寢忘食的努力下,上世紀80年代,“銀河”向量億次機和九〇五工程億次機兩臺運算速度達億次級的巨型機相繼成功研制。1991年,金怡濂所在的研究所又成功研制出速度達每秒10億次級的中國第一臺大規(guī)模并行處理計算機,逐漸縮小與美、日等國的差距。
那么,下一個目標,定在100億,還是1000億?各方爭議不斷。金怡濂是少數(shù)贊成直接研制1000億次級巨型機的人之一。
他支持直接研制千億次級絕非一時沖動,而是反復研究國外同行的成果近一年后得出的結論。“當我說出1000億時,心中至少已有了七八成的把握,剩下兩三成,也有一個初步判斷,預計那些問題可以解決?!?/p>
“計算機發(fā)展太快,早一年是先進的,晚一年就落后了?!彼€有另一層考慮,直接挑戰(zhàn)千億次級,將是一次在該領域迎頭趕上美日等國的機遇,機不可失。
最終,新一代巨型機——“神威”的目標被確定為1000億次級。當時已退居二線的金怡濂被邀請出山,擔任總設計師。他提出以平面格柵網為基礎的“分布共享存儲器大規(guī)模并行結構”總體方案,同時提出網上多種集合操作以及無匹配高速信號傳送等技術構想和解決方案,均獲成功。這一成果實現(xiàn)了中國高性能計算機的歷史性跨越,江澤民同志為該系統(tǒng)親筆題名“神威”。
在“神威”的研制過程中,金怡濂提出了比從前任何一個項目都更為嚴苛的質量要求。他說:“我們的目標是,哪怕一個焊點、一枚螺絲釘,也要體現(xiàn)世界先進水平。在金怡濂的“高壓”下,無論是在5厘米見方的器件上完美地焊接500多條腿的高難度工藝,還是在研制進程中臨時決定更換新一代性能更高的芯片……各種大大小小起初看起來不可能完成的任務,最終都被一一實現(xiàn)。
1996年9月,“神威”研制完成。經測試,峰值運算速度達到每秒3120億次,跨入國際領先行列。這意味,僅用4年時間,中國高性能計算機的水平就提高了300多倍,遠超“摩爾定律”每四年提升一個數(shù)量級的速度。
1999年秋,無論是國家領導人,抑或是普通老百姓,誰不盼望建國50周年大慶盛會這天的北京艷艷麗日、朗朗晴空?可是,“十一”前一天的下午,首都大雨傾盆,且一夜未停。億萬人都在關注天氣預報,甚至有許多人在心中祈禱:“老天爺呀,‘十一露個笑臉吧!”
天公意愿誰先知?只有依靠“神威”。當時,“神威”的判斷結論是:雨將在國慶早晨5時停,3個小時過后將云開霧散。在天安門廣場盛況空前的國慶閱兵典禮現(xiàn)場,當太陽如期露出笑顏,受邀參加觀禮的“神威”總設計師金怡濂也笑了……
現(xiàn)實與他們的預報完全吻合,巨大的壓力頃刻化作滿腔欣慰。此刻,作為“神威”的總設計師和國慶觀禮代表的金怡濂,一顆高度緊張的心總算放松了,置身在天安門廣場歡樂的海洋之中……國家氣象中心利用“神威”計算機精確完成極為復雜的中尺度數(shù)值天氣預報,在國慶50周年和澳門回歸等重大活動的氣象保障中發(fā)揮了關鍵作用。然而,金怡濂傾畢生精力為國家研制巨型計算機,并不僅僅是為了氣象預報。他介紹,超級計算機通常是指當時性能最高、運算速度最快的一類計算機,是氣象氣候、石油物探、生命科學、航空航天、藥物篩選和基礎科學等領域不可缺少的高端計算工具,因此,中國未來的現(xiàn)代化建設不能沒有巨型機。
此后,金怡濂帶領他的團隊再次向世界最先進水平發(fā)起沖擊。這次,他們的目標更加明確——要在出機時達到世界第一。2001年底,“神威Ⅱ”研制完成,速度達到每秒13.1萬億次,其峰值速度和持續(xù)速度均超過了當時排名第一的高性能計算機;機器體積大為縮小,功耗也較低。因為對中國巨型計算機的發(fā)展做出重大貢獻,金怡濂榮獲2002年度國家最高科技獎。
當前,中國在高性能計算機領域已處于世界領先水平。2013年11月18日,國際TOP500組織公布最新全球超級計算機500強排行榜。中國的“天河二號”以峰值計算速度每秒5.49億億次、持續(xù)計算速度每秒3.39億億次雙精度浮點運算的優(yōu)異性能位居榜首。但從入榜的超級計算機數(shù)量上看,美國仍然優(yōu)勢明顯,共有253臺,中國以65臺位列第二,日、英、法、德四國分列第三至六位。
金怡濂介紹說,目前,完全采用國產自主CPU設計的超級計算機“神威藍光”速度已達到千萬億次級。但是,中國在基礎研究、前瞻性研究、核心元器件及應用研究方面,與美、日等國相比,仍有相當差距。未來,預計到2020年前后,超級計算機的運算能力將突破每秒100億億次,全世界的同行都正在朝這個目標努力。
“沒有最好,只有更好?!苯疴フf,計算機領域最大的特點就是“新”,不斷創(chuàng)新,不斷有新東西出現(xiàn),這也是多年來他一直不斷大膽重用年輕人的原因。他還提到:“現(xiàn)在的年輕人與我們這一代人不同,希望待遇高一點,工作跟自己的愛好結合更緊密一點。這種變化有其合理之處,但也有一些不好的地方。時代在發(fā)展,社會總會有變化,但是,搞科研,奉獻精神還是不可少。
在許多人眼里,金怡濂是一個典型的知識分子、一位勤奮的科技工作者。他常趴在圖紙上或泡在機房里,一待就是一整天。因一直忙于科研,他三十歲時仍然單身,后與研究所新來的女大學生陳敬擦出火花,還是得益于鬼靈精的助手幫忙“撮合”,終得以成就一段美滿姻緣。
談起他的業(yè)余愛好,他說過去打打籃球,現(xiàn)在就沒精力再玩球了,至于看書一般很少看小說,看的多是專業(yè)書?!拔业膼酆帽容^少,沒什么特殊的愛好。”
電視,金怡濂也很少看,難得同家人一塊“消遣消遣”,但他笑言這時“控制器一般不在我手里,他們看什么我跟著看什么”。
這就是金怡濂的生活,外人看來是如此的單調乏味,毫無色彩??墒牵诰扌蜋C的研制卻樂在其中。他說:“我沒有什么業(yè)余愛好,最大樂趣就是琢磨計算機。解決一個問題后的快樂,是無法用語言形容的。自己的三個孩子是如何長大的,記不太清楚,倒是那些巨型計算機的每一點進步,都在心里留下了深刻的印象?!?/p>
對大型計算機研究的每一點向前推進都能如數(shù)家珍,他的同事們說,那些機器就是被他百般呵護的孩子。多少年里,他帶領項目組夜以繼日地工作,精神抖擻、一絲不茍地指揮著研制工作的千頭萬緒。每天深夜回到家中,他總要在沙發(fā)上先躺上半個小時,才有力氣和老伴說話。跟隨金怡濂工作20多年的高工老趙清楚地記得,“神威”穩(wěn)定性測試的那天,金怡濂坐在機房不說不笑,一聲不吭,直到預定測試時間已過,機器一切指標正常,他才突然跳了起來,像個孩子似的大喊大叫。他忘情歡呼,這情緒極大感染了周圍的人,以至聽到在實驗室里傳出來的歡呼聲,人們可品味出成果的含金量。
助手們親切地稱他“老爺子”,他同助手們之間的關系,真說得上“學為師長,情同父子”。年輕人說,我們敬重“老爺子”,是因為他不吃老本,從不停止向科學的未知領域進軍,是與時俱進的專家;他常常會為某個問題和我們爭得面紅耳赤,鼓勵我們把想法全部說出來,有時深更半夜還會把技術資料親自送到小青年的家里。
誰的業(yè)務突出可以破格評定職稱,金怡濂心里都有一本賬,會親自出面力爭,所以“神威”集體里最年輕的高級工程師只有27歲;誰的妻子下崗了,金怡濂也會想辦法幫助聯(lián)系工作。當今IT業(yè)人才流動頻繁,但在金怡濂的“神威”集體里,人才卻相對穩(wěn)定??梢哉f,參與研制“神威”的科研人員都容易在外企找到高薪的工作??墒悄贻p人愿意在這里工作,不是因為這里待遇高,而是這里能為年輕人提供盡情發(fā)揮才智的舞臺。他們說:“在‘老爺子指導下從事巨型機研制,是一生的幸事。”
金怡濂常說,計算機是年輕的學科,也是年輕人的事業(yè)。他以博大的胸懷和廣闊的視野,打破用人論資排輩的觀念和做法,不拘一格,惟才是舉。他委任的50個主管、副主管設計師平均年齡只有28歲,這在當時我國大型計算機研制工程中絕無僅有。他不論學歷,用人所長。有一位年輕的課題主管,沒有專業(yè)學歷,但他刻苦鉆研,富有實踐經驗。金怡濂任用他時,就有爭議,特別是在第一次工藝技術試驗失敗后,金怡濂又頂住各方壓力繼續(xù)任用他,并且親自找他談話,給予鼓勵、啟發(fā),激發(fā)出了他的創(chuàng)造力。最終他沒有辜負期望,帶領全組完成了這項重大改革。如今,這位主管已成為高級工程師,并走上了領導崗位。
金怡濂知人善任,使許多“丑小鴨”變成了“白天鵝”。他在研制國內領先水平巨型機的事業(yè)中,同時為國家培養(yǎng)出了一批優(yōu)秀科技人才。當年的小字輩如今多已成才,其中還有幾位成了院士,有的獲得了中國青年科學家獎,有的獲得國家科技進步獎、中國科協(xié)“求是”獎。為此,計算機界的一位專家說,金怡濂在人才培養(yǎng)上的貢獻,不亞于為我國又研制了一臺“神威”巨型機。