算力,作為衡量一個(gè)國家數(shù)據(jù)處理能力的關(guān)鍵指標(biāo),指的是數(shù)據(jù)中心處理數(shù)據(jù)并輸出結(jié)果的計(jì)算能力。據(jù)了解,我國現(xiàn)有算力總規(guī)模位居全球第二,在此成就的背后,不得不提及一位杰出的貢獻(xiàn)者,他就是中國工程院院士、清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系教授鄭緯民。
鄭緯民作為計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)領(lǐng)域的權(quán)威專家,傾盡一生,在計(jì)算機(jī)領(lǐng)域取得了卓越的研究成果,多次榮獲國家科技進(jìn)步獎(jiǎng),為我國超算領(lǐng)域的發(fā)展作出了杰出貢獻(xiàn)。
自強(qiáng)不息,不墜青云之志
1946年鄭緯民在浙江寧波鄞州出生。1959年,步入初中求學(xué)階段的鄭緯民上學(xué)路程需要從位于東錢湖陶公山曹家山頭的家中,穿越1小時(shí)的石子路,前往所就讀的中學(xué)——錢湖中學(xué)(現(xiàn)今東錢湖旅游學(xué)校)。這段充滿“坎坷”的路程,他幾乎每日都赤腳小跑,風(fēng)雨無阻,但從未遲到。正因“少年當(dāng)有凌云志,萬里長空競風(fēng)流”,這段不易的經(jīng)歷,為他的人生帶來了深遠(yuǎn)的影響,鑄就了他堅(jiān)韌不拔、吃苦耐勞的品格。鄭緯民說:“大學(xué)教我知識(shí),中學(xué)教我做人,培養(yǎng)了我吃苦耐勞、集體主義的精神。”
1965年,鄭緯民考入清華大學(xué)自動(dòng)控制系。當(dāng)時(shí),計(jì)算機(jī)還只是自動(dòng)控制系的一個(gè)專業(yè),算法、存儲(chǔ)、系統(tǒng)等基礎(chǔ)理論的研究,在國內(nèi)還比較落后,沒有人能準(zhǔn)確判斷中國的計(jì)算機(jī)事業(yè)將有怎樣的未來。
1970年畢業(yè)后,鄭緯民留校執(zhí)教,并留任至今。如今,他擔(dān)任清華大學(xué)教授及博士生導(dǎo)師,同時(shí)兼任多家國家重點(diǎn)實(shí)驗(yàn)室學(xué)術(shù)委員會(huì)委員。他專注于網(wǎng)絡(luò)存儲(chǔ)、網(wǎng)格計(jì)算等方面的科研教學(xué),成績卓著,榮獲國家科技進(jìn)步獎(jiǎng)一等獎(jiǎng)1次,國家科技進(jìn)步獎(jiǎng)二等獎(jiǎng)2次,以及國家技術(shù)發(fā)明獎(jiǎng)二等獎(jiǎng)1次。
鄭緯民作為計(jì)算機(jī)領(lǐng)域的權(quán)威專家,不僅在科研領(lǐng)域取得了斐然成就,獨(dú)特的教學(xué)風(fēng)格也贏得了廣大學(xué)子的深度認(rèn)可與敬愛,他培養(yǎng)了數(shù)百位博士和碩士,這些學(xué)生在中國計(jì)算機(jī)領(lǐng)域的研究中發(fā)揮著重要作用。
此外,鄭緯民還曾榮獲感動(dòng)中國2022年度人物“銀發(fā)知播”稱號(hào),他充分利用視頻與直播等平臺(tái),打破傳統(tǒng)教室的界限,構(gòu)建了一所沒有門檻的大學(xué)學(xué)堂。他秉承著“師者,所以傳道受業(yè)解惑也”理念,將畢生所學(xué)和人生經(jīng)歷傾囊相授給青年們,他孜孜不倦地通過網(wǎng)絡(luò)拉近與青年的距離,傳播科學(xué)知識(shí)、解讀技術(shù)熱點(diǎn)。
鄭緯民在B站上擁有17.7萬粉絲,他開設(shè)的網(wǎng)絡(luò)課堂內(nèi)容豐富多彩,小到精準(zhǔn)預(yù)報(bào)冬奧會(huì)各個(gè)場館的天氣,大到模擬核試驗(yàn)等宏大議題。同時(shí),他還對(duì)當(dāng)前熱門的元宇宙、區(qū)塊鏈、芯片等技術(shù)進(jìn)行全面地解讀。鄭緯民以風(fēng)趣幽默的方式,將晦澀難懂的技術(shù)語言簡化成通俗易懂的知識(shí),贏得了大量年輕網(wǎng)友的喜愛。
鄭緯民在知識(shí)傳播的道路上從未止步。他的熱情源于對(duì)知識(shí)的不懈追求、對(duì)他“師者”身份的責(zé)任擔(dān)當(dāng)以及對(duì)理想的敬畏。他慷慨地分享自己的知識(shí)和經(jīng)驗(yàn),毫不吝嗇地將自己的所思所得,傾囊相授,讓更多的人從中受益。與此同時(shí),他始終關(guān)注著年輕一代,希望他們能夠在知識(shí)的海洋中茁壯成長。
是師者,敬業(yè)者,亦為士者
作為計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的學(xué)科帶頭人,為師者,他傳學(xué),受業(yè),解惑;為敬業(yè)者,他專心致志,以事其業(yè)也;為士者,他肩擔(dān)國家重任,創(chuàng)行業(yè)領(lǐng)域之新。如今,年近八旬的鄭緯民院士,仍然在存儲(chǔ)領(lǐng)域進(jìn)行技術(shù)難題攻關(guān)。他認(rèn)為:“研制具有自主知識(shí)產(chǎn)權(quán)的國產(chǎn)存儲(chǔ)系統(tǒng),是國家信息安全的戰(zhàn)略需要,科研人員得不怕吃苦,勇爭第一。”這是他的個(gè)人理念,也是他近幾十年科研生涯的真實(shí)寫照。
據(jù)鄭緯民的學(xué)生回憶,他與學(xué)生們每日投入的工作時(shí)長常達(dá)十多個(gè)小時(shí),他一直鼓勵(lì)學(xué)生們要以沉穩(wěn)的心態(tài)深入研究,并且認(rèn)為,做計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)方面的研究,要做好吃苦的準(zhǔn)備,腳踏實(shí)地把實(shí)際工作推進(jìn),才能成就一番事業(yè)。
此外,鄭緯民在科研工作中,對(duì)團(tuán)隊(duì)中的每位成員的要求就是“做事,就要做有用的事,做對(duì)國民經(jīng)濟(jì)有用的事。”鄭緯民認(rèn)為,做出來的產(chǎn)品也要切實(shí)服務(wù)于現(xiàn)實(shí)需求?!艾F(xiàn)在很多人覺得多發(fā)論文最重要,不是說這些沒有價(jià)值,而是真正做研究,要能讓理論落地,不能在紙上空比畫。做事,還是得務(wù)實(shí)一些。”鄭緯民說。
在科研創(chuàng)新領(lǐng)域上,鄭緯民成就顯著。他與團(tuán)隊(duì)創(chuàng)新性地提出軟件定義的IO控制器設(shè)計(jì)方法,解決了可擴(kuò)展問題。與此同時(shí),又成功開發(fā)自維護(hù)大容量存儲(chǔ)系統(tǒng),在攻克這三大難題上又前進(jìn)了一大步,將集群計(jì)算機(jī)、CPU設(shè)計(jì)、網(wǎng)格計(jì)算、高性能存儲(chǔ)等確定為高性能計(jì)算技術(shù)研究所的研究方向。
此外,在他的帶領(lǐng)下,用一年的時(shí)間研制成功了中國當(dāng)時(shí)運(yùn)行頻率最高的高性能嵌入式CPU-THUMP107,其最高頻率為500兆赫,功耗<0.5瓦。此外,由他牽頭完成的生物信息學(xué)網(wǎng)格已經(jīng)投入實(shí)際運(yùn)行,每天的用戶訪問量超過了5萬人次,并且所研制的網(wǎng)格中間件、網(wǎng)格監(jiān)控系統(tǒng)和網(wǎng)格互聯(lián)互通技術(shù)已應(yīng)用于國家科技大平臺(tái)、上??萍即笃脚_(tái)和某國防單位。
“數(shù)據(jù)是戰(zhàn)略資源。存儲(chǔ)系統(tǒng)承載數(shù)據(jù),是網(wǎng)絡(luò)空間安全的核心基礎(chǔ)設(shè)施,但是目前面臨三大技術(shù)挑戰(zhàn):可擴(kuò)展性、可靠性和集約性?!编嵕暶裾f。
截至2009年7月,由鄭緯民領(lǐng)導(dǎo)的網(wǎng)格計(jì)算研究組取得了多項(xiàng)具有自主知識(shí)產(chǎn)權(quán)的成果,已推廣到20多家重點(diǎn)大學(xué)使用。
在網(wǎng)絡(luò)存儲(chǔ)方面,鄭緯民主導(dǎo)研發(fā)的“高可擴(kuò)展海量存儲(chǔ)網(wǎng)絡(luò)系統(tǒng)TH-MSNS”,已通過中國軟件評(píng)測中心評(píng)測和教育部的鑒定,其中帶外虛擬存儲(chǔ)技術(shù)、大容量內(nèi)存虛擬磁盤技術(shù)進(jìn)入國際領(lǐng)先行列。TH-MSNS系統(tǒng)是中國國內(nèi)具有自主知識(shí)產(chǎn)權(quán)的國產(chǎn)網(wǎng)絡(luò)存儲(chǔ)系統(tǒng),分別獲2004年北京市科學(xué)技術(shù)二等獎(jiǎng)、2005年首屆“中國計(jì)算機(jī)學(xué)會(huì)創(chuàng)新獎(jiǎng)”二等獎(jiǎng)等,2005年國家863計(jì)劃首屆“浪潮高性能計(jì)算創(chuàng)新集體獎(jiǎng)”二等獎(jiǎng)。
后來,鄭緯民在TH-MSNS系統(tǒng)的基礎(chǔ)上,創(chuàng)造性地提出了另一思路——社區(qū)共享。如果能夠?qū)崿F(xiàn)社區(qū)共享,則不需要重復(fù)存儲(chǔ),這就是現(xiàn)在流行的云盤技術(shù)的基本原理。21世紀(jì)初期,該技術(shù)原理仍處于探索階段,鄭緯民便通過網(wǎng)格技術(shù)將各高校的資源進(jìn)行有效整合,實(shí)現(xiàn)了存儲(chǔ)一份、全網(wǎng)下載的目標(biāo)?;谏鐓^(qū)概念的網(wǎng)絡(luò)數(shù)據(jù)共享和存儲(chǔ)技術(shù),他主持研制了國內(nèi)首個(gè)云計(jì)算平臺(tái)Tsinghua Cloud,并為社會(huì)公眾提供了優(yōu)質(zhì)服務(wù)。使命在肩勇奮楫,重任千鈞為擔(dān)當(dāng)。“每一個(gè)創(chuàng)新成果的取得,都非常不容易,需要付出常人難以想象的努力?!痹谡劶皠?chuàng)新成果的取得時(shí),鄭緯民表示,“有可能是8年,也有可能是10年。研制四大存儲(chǔ)系統(tǒng),我們花了近30年?!?/p>
鄭緯民所率領(lǐng)的團(tuán)隊(duì),不僅成功突破了計(jì)算機(jī)存儲(chǔ)系統(tǒng)領(lǐng)域中的一系列關(guān)鍵技術(shù)瓶頸,還憑借其在自主研發(fā)產(chǎn)品上所展現(xiàn)的卓越性能,獲得了國際同行的廣泛認(rèn)可。
然而,步履不停,創(chuàng)新不止。2016年11月,在美國舉行的全世界高性能計(jì)算大會(huì)上,鄭緯民和他的團(tuán)隊(duì)斬獲戈登·貝爾獎(jiǎng),實(shí)現(xiàn)中國科學(xué)家在此獎(jiǎng)項(xiàng)上零的突破。第二年,鄭緯民團(tuán)隊(duì)再次殺入大賽,在我國超級(jí)計(jì)算機(jī)“太湖之光”上,成功“回放”唐山大地震全過程,第二次摘得此獎(jiǎng)。
以啟新章,擔(dān)重任,再奮進(jìn)
鄭緯民作為我國超算領(lǐng)域?qū)<?,不僅帶領(lǐng)著清華大學(xué)研究團(tuán)隊(duì)斬獲多項(xiàng)殊榮,還在新興科技領(lǐng)域取得了令人矚目的成績,為我國超算事業(yè)的發(fā)展作出了杰出的貢獻(xiàn)。
在當(dāng)前人工智能應(yīng)用日益普及,成為各行業(yè)智能化轉(zhuǎn)型發(fā)展的顯著趨勢下,鄭緯民已與團(tuán)隊(duì)在人工智能領(lǐng)域深耕多年,所獲成果斐然。他們的研究主要集中在AI與算力基礎(chǔ)設(shè)施的設(shè)計(jì)、評(píng)測與優(yōu)化上。在此領(lǐng)域,他們提出了AI算力基礎(chǔ)設(shè)施的架構(gòu)和平衡設(shè)計(jì)原則,并推出大規(guī)模人工智能算力基準(zhǔn)測試程序AIPerf,該程序于2020年11月15日正式發(fā)布,為業(yè)界提供了一個(gè)客觀評(píng)估AI算力性能的標(biāo)準(zhǔn)。
不僅如此,鄭緯民及團(tuán)隊(duì)還提出百萬億參數(shù)超大規(guī)模訓(xùn)練模型的加速方法,將數(shù)據(jù)并行、模型并行、專家并行三種訓(xùn)練模型開源到FastMOE系統(tǒng)當(dāng)中,得到業(yè)界的認(rèn)可與應(yīng)用,有效推動(dòng)了AI技術(shù)的發(fā)展。
鄭緯民表示,人工智能發(fā)展有三駕馬車,其中一駕就是算力,算力不足就沒辦法做好人工智能。目前,我國算力基礎(chǔ)設(shè)施規(guī)模位居全球第二,截至2023年底,我國在用數(shù)據(jù)中心機(jī)架總規(guī)模超過810萬架,算力總規(guī)模達(dá)到230EFlops。存力規(guī)模不斷擴(kuò)大,先進(jìn)存力建設(shè)穩(wěn)步提速,截至2023年6月底,我國存儲(chǔ)總量達(dá)到1080EB,存力規(guī)模增長速度達(dá)到23%,其中以閃存技術(shù)為代表的先進(jìn)存力占比不斷提高,部分行業(yè)超過25%。隨著我國算力基礎(chǔ)設(shè)施規(guī)模高速增長,存力規(guī)模不斷擴(kuò)大,網(wǎng)絡(luò)設(shè)施不斷完善,到2025年算力規(guī)模將超過300EFlops,存儲(chǔ)總量超過1080EB,先進(jìn)存儲(chǔ)容量占比達(dá)到30%。
算力的重要性無可爭議。鄭緯民認(rèn)為,人工智能未來更重要的是基于大模型研發(fā)行業(yè)細(xì)分領(lǐng)域的垂直模型,加強(qiáng)AI算力芯片設(shè)計(jì)、軟硬件生態(tài)建設(shè)與產(chǎn)業(yè)化應(yīng)用。通過完善開放的產(chǎn)業(yè)生態(tài),推動(dòng)各行各業(yè)數(shù)字化轉(zhuǎn)型,從而真正促進(jìn)數(shù)字經(jīng)濟(jì)和大模型產(chǎn)業(yè)的健康發(fā)展。
然而,我國當(dāng)前的人工智能發(fā)展所面臨的困難重重。國產(chǎn)AI芯片的系統(tǒng)有著國產(chǎn)卡應(yīng)用不足、生態(tài)系統(tǒng)有待改善等問題。對(duì)此,鄭緯民表示,改善基于國產(chǎn)AI芯片的大模型訓(xùn)練生態(tài)系統(tǒng)是關(guān)鍵,途徑則是要盡快做好10個(gè)軟件,即編程框架、并行加速、通信庫、算子庫、AI 編譯器、編程語言、調(diào)度器、內(nèi)存分配、容錯(cuò)系統(tǒng)、存儲(chǔ)系統(tǒng)。并且鄭緯民還指出,作為一種替代方案,做好軟硬件協(xié)同設(shè)計(jì),超級(jí)計(jì)算機(jī)和目前眾多的計(jì)算中心也可以進(jìn)行大模型訓(xùn)練。
由于當(dāng)下人工智能、區(qū)塊鏈、元宇宙等尖端技術(shù)的迅速崛起,高性能計(jì)算、并行處理、存儲(chǔ)系統(tǒng)等核心基礎(chǔ)技術(shù)的地位呈現(xiàn)越來越重要。與此同時(shí),國際的技術(shù)競爭日趨激烈,歐美國家的技術(shù)制裁及封鎖在一定程度上限制了AI技術(shù)發(fā)展進(jìn)步,因此打破技術(shù)壁壘、實(shí)現(xiàn)技術(shù)自主的任務(wù)顯得尤為艱巨?!拔覀兗缲?fù)的責(zé)任與使命依然重要?!编嵕暶裾f。
回看鄭緯民的科研人生,每一階段都充滿了挑戰(zhàn)與堅(jiān)持,他以堅(jiān)韌不拔的毅力,不斷攀登科學(xué)的高峰,在存儲(chǔ)系統(tǒng)領(lǐng)域,將我國實(shí)現(xiàn)了“從0到1”再到“世界領(lǐng)先”的奇跡跨越,現(xiàn)在又全身心地投入人工智能的研究。這樣的精神激勵(lì)著無數(shù)的科研工作者對(duì)科學(xué)事業(yè)的全情投入和對(duì)推動(dòng)國家向前發(fā)展的滿腔熱情。
此外,無論在科研領(lǐng)域的卓越貢獻(xiàn),還是在教育事業(yè)的崇高地位,鄭緯民始終都保持著低調(diào)謙遜的品格,不將個(gè)人的光輝放大。他一生都在貫徹著“做有用的事,做對(duì)國民經(jīng)濟(jì)有用的事”的要求,將個(gè)人的努力和付出默默奉獻(xiàn)給國家的科技進(jìn)步,這正是他科學(xué)精神的體現(xiàn)和崇高追求。