詹劍鋒
1 中國科學院計算技術研究所 北京 100190
2 中國科學院大學 北京 100049
全球分工與合作是和平時期發(fā)展科技產(chǎn)業(yè)的標準模式。各個國家的產(chǎn)業(yè),一方面參與全球分工與合作,節(jié)省研究與開發(fā)成本,提升競爭力;另一方面,相互開展競爭,力爭成為產(chǎn)業(yè)鏈的上游,乃至規(guī)則的制定者,鞏固和加強本國民用產(chǎn)業(yè)和國防工業(yè)的生存能力和競爭優(yōu)勢。
一個科技產(chǎn)業(yè)通常會形成兩到多個全球相互競爭的體系,例如大型民用航空工業(yè)包括波音和空客兩個體系。不幸的是,由于知識產(chǎn)權壁壘森嚴和垂直分工的體系①信息技術產(chǎn)業(yè)有著垂直分工的體系,從底到上包括芯片、操作系統(tǒng)、編程系統(tǒng)、數(shù)據(jù)庫、行業(yè)應用等基礎部件。,信息技術產(chǎn)業(yè)沒有發(fā)展出相互競爭的體系。目前,美國主導的體系是信息技術產(chǎn)業(yè)規(guī)則的絕對制定者。即使在和平時期,某些領先國家的決策者一旦認為產(chǎn)業(yè)或者整個經(jīng)濟遇到事實或者潛在威脅,自由市場和自由貿易的原則就可能被放棄,貿易戰(zhàn)一觸即發(fā),從而導致內部協(xié)作分工瓦解,弱勢的一方可能被逐出體系,付出慘痛的代價。信息技術產(chǎn)業(yè)缺少競爭體系的局面加劇了這種風險。
為了應對這種風險,我國乃至德國這樣的發(fā)達國家早已意識到發(fā)展自主可控的信息技術產(chǎn)業(yè)的重要性。例如,我國互聯(lián)網(wǎng)產(chǎn)業(yè)開展了多年的“去 IOE(IBM、Oracle、EMC)”運動,目標是以成本效益更高的 Intel x86 平臺和開源軟件取代以 IBM 小型機、Oracle 數(shù)據(jù)庫和 EMC 高端存儲所組成的 IT 技術架構。中國科學院計算技術研究所(簡稱“中科院計算所”)胡偉武研究員領導的龍芯團隊付出了艱苦卓絕的努力,目標是用 MIPS 處理器架構(通過購買商業(yè)許可證獲得)和 Linux 操作系統(tǒng)(開源和自由軟件)取代 Windows-Intel 架構。德國柏林理工大學教授 Volker Markl 研發(fā)大數(shù)據(jù)流處理器系統(tǒng) Flink,旨在和美國加州大學伯克利分校研究的 Spark 展開競爭。
可以清楚地看到,這些不同程度的自主可控系統(tǒng)也是部分建立在全球分工與合作基礎之上。以“去IOE”運動為例,在軟件方面借助了全球協(xié)作分工的開源軟件運動,而 x86 是 Intel 的商業(yè)產(chǎn)品。顯而易見,應對某些領先國家可能發(fā)起的科技戰(zhàn)和貿易戰(zhàn),“去 IOE”運動無法做到真正的自主可控。另外一方面,美國主導了信息技術產(chǎn)業(yè),實現(xiàn)了真正意義上的“自主可控”,同時充分利用全球分工與協(xié)作來節(jié)省研究與開發(fā)成本。由此可見發(fā)展科技產(chǎn)業(yè),自主可控和開放合作并不矛盾。
對于科技產(chǎn)業(yè),尤其是在知識產(chǎn)權壁壘森嚴和分工協(xié)作緊密的信息技術產(chǎn)業(yè),只有從技術的源頭或者主干開始創(chuàng)新,才能做到自主可控;相反,僅僅是全盤復制,或在枝干或旁枝末節(jié)處進行技術改進,不可能做到真正的自主可控。
信息技術產(chǎn)業(yè)有著垂直分工的體系, 從底到上包括芯片、操作系統(tǒng)、編程系統(tǒng)、數(shù)據(jù)庫、行業(yè)應用等基礎部件。經(jīng)過幾十年發(fā)展,每一個基礎部件從最初的技術源頭或者主干開始,都形成了錯綜復雜的競爭與合作的分工體系。只有從技術源頭和主干開始的基礎性技術創(chuàng)新才能真正實現(xiàn)自主可控,并充分享有國際分工與合作的好處。芯片和操作系統(tǒng)是信息技術領域 2 個最基礎和最核心的部件,以下通過分析移動芯片 ARM 和移動操作系統(tǒng)安卓(Android)來闡述這一觀點。
手機芯片在架構設計、集成電路設計、制造、封裝和銷售方面有著細致的垂直分工體系。來自英國的 ARM 公司是移動芯片體系的主角,ARM 將設計的芯片授權給世界絕大部分移動芯片產(chǎn)商。根據(jù) 2018 年市場份額統(tǒng)計,美國的高通(Qualcomm)和蘋果、中國臺灣的聯(lián)發(fā)科(MediaTek)、韓國的三星以及中國的華為海思是智能手機芯片市場的主要玩家,但 ARM 授權的技術是中國臺灣的聯(lián)發(fā)科(MediaTek)設計的芯片、三星 Exynos、高通“驍龍”、蘋果Apple A11、華為“麒麟”等芯片的基礎。以聯(lián)發(fā)科為例,ARM 公司負責架構和指令集設計,相當于書的章節(jié)和核心思想;聯(lián)發(fā)科購買 ARM 的授權進行芯片 IC 設計,相當于書本內容的完善;臺積電進行生產(chǎn)制造和封裝,相當于書的印刷。
在 ARM 發(fā)展史上,采用精簡指令集 RISC 架構這一決定起著至關重要的作用。RISC 架構是20世紀80年代美國的斯坦福大學和加州大學伯克利分校的實驗性處理器架構,2017 年圖靈獎獲得者 John L. Hennessy(負責 MIPS 項目)和 David Patterson(負責 RISC 項目) 是主要的貢獻者。采用精簡指令集 RISC 的處理器通常比采用復雜指令集 CISC 架構的處理器更為省電、成本更低。ARM 公司在 RISC 處理器的主干上發(fā)展了低功耗的移動芯片架構。在產(chǎn)業(yè)鏈上,ARM 公司聚焦芯片架構的設計,而將其他下游產(chǎn)業(yè)交付給國際分工和協(xié)作。需要指出的是,RISC 的項目的另一個分支 SPARC 芯片也曾在服務器芯片市場獲得成功,而斯坦福的 MIPS 項目是國產(chǎn)龍芯 CPU 的技術源頭。
在 2019 年爆發(fā)的中美經(jīng)貿摩擦中,美國對華為進行出口管控。根據(jù) BBC 報道, ARM 已經(jīng)要求員工必須中止與華為合作。ARM 聲稱,它的相關產(chǎn)品設計當中包含了“美國原產(chǎn)技術”,可能是指 MIPS 等相關技術。因此,該公司認為將受到美國政府貿易禁令的影響。據(jù)中美兩國執(zhí)業(yè)律師金依依分析②詹劍鋒, 金依依. 貿易戰(zhàn)出口管控對全球科技產(chǎn)業(yè)的影響. 公開報告, 未出版.,ARM 認為其提供給華為的技術中美國原產(chǎn)技術的價值超過該技術總價值的 25%,因而暫停與華為的合作。這也充分地說明 ARM 在主干上進行創(chuàng)新,能實現(xiàn)一定程度的自主可控(實際上仍然受到出口管控的約束),并享有開放分工與合作的好處。而在產(chǎn)業(yè)鏈下游創(chuàng)新,則更難以實現(xiàn)真正的自主可控,只有在和平時期的非管控狀態(tài)下才能享有國際分工與合作的好處。華為是業(yè)界公認的 5G 技術領袖之一,這也意味著美國的公司不能獲得華為 5G 產(chǎn)品和技術的許可。
Unix 操作系統(tǒng)由 Ken Thompson 和 Dennis Ritchie 負責研發(fā),他們由此獲得 1983 年的圖靈獎。據(jù)稱,開發(fā)Unix 的初衷是運行一款計算機游戲—— Space Travel,使一臺計算機能同時為多個用戶提供交互性好的服務,即研究開發(fā)分時操作系統(tǒng)以取代笨拙和用戶體驗差的批處理操作系統(tǒng)。1970 年,貝爾實驗室開始向美國大學提供非商業(yè)的許可證,由此產(chǎn)生了大量的 Unix 變種,包括加州大學伯克利分校的 BSD、SUN 公司的 Solaris和 IBM 的 AIX 等。
由于美國貝爾實驗室改變許可證,將 Unix 作為專有產(chǎn)品銷售,用戶在法律上不允許修改 Unix。美國人Richard Stallman 和芬蘭裔美國人 Linus Torvalds 先后發(fā)起了自由和開源軟件項目,開發(fā)出與 Unix 完全兼容的軟件系統(tǒng)——Linux。Linux 是 Unix 操作系統(tǒng)主干上的變種,在服務器操作系統(tǒng)市場占據(jù)主導地位。
Linux 操作系統(tǒng)包括 Linux 內核和 Linux 系統(tǒng)工具/庫。1991 年 10 月 5 日,芬蘭裔美國人 Linus Torvalds 首次發(fā)布 Linux 內核。Linus Torvalds 同時發(fā)起了 Linux 基金會(Linux Foundation)維護該項目。1983 年,Richard Stallman 發(fā)起 GNU 計劃,負責提供 Linux 系統(tǒng)工具/庫。Linux 系統(tǒng)工具/庫由自由軟件基金會(Free Software Foundation,F(xiàn)SF)維護。Linux 基金會和自由軟件基金會均注冊在美國,根據(jù)美國聯(lián)邦法律,屬于501(c) 非營利性組織。
Linux 是最成功的開源軟件。Linux GNU 采用通用公共許可證(General Public License,GPL),最新的許可證是 GPL 3.0。GPL 保證任何個人和機構可以自由地使用、修改和再發(fā)布軟件。GPL 強制要求包含 GPL 源代碼的項目必須開源。Linux 項目集中了全球程序員的智慧。根據(jù)中科院計算所徐志偉③經(jīng)微信交流,徐志偉研究員同意作者公開引用他的分析.對 2016 年和2017 年 Linux Kernel Development Report 的分析,Linux 內核 2 000 多萬行代碼由全球開發(fā)者社區(qū)開發(fā)維護,中國(未包含港澳臺地區(qū)數(shù)據(jù),下同)貢獻者和貢獻比例均不到 1%,中國華為公司貢獻了 0.3%,但社區(qū)核心志愿者“Greg”一人貢獻量超過華為,接近中國。
安卓是在 Linux 內核和其他開源軟件基礎上開發(fā)的。在移動操作系統(tǒng)市場,安卓占據(jù)主導地位,蘋果的 iOS 遠遠地落在第二位。2003 年,初創(chuàng)公司 Android Inc 在美國加州創(chuàng)建了安卓。2005 年 Google 收購Android 公司。2007 年,Google 聯(lián)合 84 家軟硬件公司和電信運營商成立聯(lián)盟,負責改進安卓。隨后,聯(lián)盟發(fā)布了安卓的源代碼,安卓的核心源代碼稱為 Android Open Source Project(AOSP)。開放安卓源代碼的計劃加速了安卓的普及,安卓隨之逐漸拓展到平板電腦及其他領域。
Google 將安卓許可證修改為 Apache 免費開放源代碼許可證 (Apache License)。 該許可證與 GPL 有著顯著不同,不再強制要求開源在安卓基礎上開發(fā)的軟件(開源軟件的衍生品)。Apache 軟件基金會和自由軟件基金會達成了協(xié)議,承認 Apache 2.0 許可證是自由軟件許可證。這意味著分別采用 GPL 3.0 和 Apache 2.0 許可證的開源軟件可以一起使用。這些協(xié)議的簽署掃清了法律上的障礙。
Google 借助開源的力量改進了安卓,然后在安卓的基礎上開發(fā)了專有產(chǎn)品,包括 Google Chrome 瀏覽器、搜索引擎、電子郵件 Gmail、應用商店和地圖導航。這些 Google 的專有產(chǎn)品通常預裝在手機上。
同樣,Google 公司遵從美國出口管控條例,限制華為使用安卓系統(tǒng)。中國所有智能手機幾乎都基于安卓系統(tǒng)。由于安卓被認為是開源軟件,Google 迅速采取的行動引起了中國科技界的震驚。
據(jù)西方媒體報道,Google 對華為的限制具體如下:華為僅僅可以使用安卓開源版本,不能訪問 Google 的專有應用和服務。Google 指出已經(jīng)擁有華為智能手機的用戶不受影響,服務可以繼續(xù)。市場分析師又進一步指出用戶可以自行在安卓平臺上下載 Google 專有應用和服務。這些舉動和措施可能會影響華為手機在海外市場的增長。
本章首先分析智能計算機的發(fā)展淵源,然后討論智能計算機復興的原因,最后分析在我國發(fā)展自主可控和開放的智能計算機產(chǎn)業(yè)的可能性。
馮 · 諾依曼體系結構(Von Neumann architecture)是現(xiàn)代數(shù)字計算機的基礎結構,而對智能計算機的探索甚至早于馮 · 諾依曼對數(shù)字計算機的探索。計算機產(chǎn)業(yè)的領袖們在馮 · 諾依曼體系結構的基礎上發(fā)展出了一個復雜而又具有活力的信息技術產(chǎn)業(yè)體系,深遠地影響了人類社會生活。而對智能計算機的探索則更多地限于理論層次。
馮 · 諾依曼體系結構的本質是以計算單元為中心,同時采用存儲程序原理。也就是說存儲設備與中央處理器分開,程序指令存儲器和數(shù)據(jù)存儲器合在一起。在馮 · 諾依曼體系結構提出前,計算機需要固定程序,改變程序就需要調整和變化計算機的結構。馮 · 諾依曼體系結構破除了這種結構限制,憑借它的簡潔和靈活打敗了所有的競爭結構。對智能計算機的探索有時候游離于馮 · 諾依曼體系結構,有時又回歸到這個結構。
1943 年,神經(jīng)生理學家 Warren McCulloch 和數(shù)學家 Walter Pitts[1]開始思考大腦中的神經(jīng)元如何工作,第一次使用電路對神經(jīng)網(wǎng)絡(neural network)建模。他們采用的是模擬計算(analog computation),神經(jīng)元的輸出結構不是 0 或者 1,原理上和現(xiàn)代的數(shù)字計算機顯著不同。
當代開展的一些神經(jīng)形態(tài)計算(neuromorphic computing)正是起源于 Warren McCulloch 和 Walter Pitts 的工作。盡管不少神經(jīng)形態(tài)計算的項目仍然基于馮 · 諾依曼體系結構,但神經(jīng)形態(tài)計算的最終目標確是要發(fā)展完全不同于馮 · 諾依曼體系結構的硬件類型??紤]到現(xiàn)有的信息技術產(chǎn)業(yè)都建立在馮 · 諾依曼體系結構基礎之上,已經(jīng)有大半個世紀的智力和基礎設施投資,對神經(jīng)形態(tài)計算的探索短時間內恐怕無法獲得回報。從基礎研究的角度,神經(jīng)形態(tài)計算非常有價值,但顯然不適合以大工程的方式開展研究工作。
20 世紀 80 年代日本開展的第五代計算機計劃(Fifth Generation Computer Systems, FGCS)確實是在馮 · 諾依曼體系結構基礎上開展的一次發(fā)展智能計算機的嘗試。第五代計算機有 2 個發(fā)展動力:① 并行計算,即在計算機內部引入多處理器提高性能,這后來獲得了產(chǎn)業(yè)上的成功;② 大規(guī)模知識處理(Knowledge Information Processing systems),采用邏輯編程(logic programming)來實現(xiàn)這一目標。這一努力促進了專家系統(tǒng)這一概念的普及。專家系統(tǒng)包括知識庫和推理引擎——知識表達為 if-then 規(guī)則的集合,推理引擎則使用邏輯推理規(guī)則。然而,知識規(guī)則的表達和獲取,需要計算機專家與領域專家一起工作。通常這些規(guī)則是剛性的,難以適應現(xiàn)實世界的真實環(huán)境。與此同時,領域知識獲取困難,缺少靈活性,成本又高,這些原因直接導致了日本第五代機計劃的失敗。
當代智能計算機本質上是基于神經(jīng)網(wǎng)絡加速器和通用計算部件建立起來的計算機系統(tǒng)。它的復興取決于 3 個條件:① 深度神經(jīng)網(wǎng)絡理論體系的完善;② 計算能力的快速增長和專業(yè)領域數(shù)據(jù)的積累;③ 通用計算機體系結構發(fā)展遇到技術障礙。
現(xiàn)代神經(jīng)網(wǎng)絡的數(shù)學基礎是統(tǒng)計學。在統(tǒng)計學的學習方法(Learning Method)基礎上,現(xiàn)代神經(jīng)網(wǎng)絡發(fā)展為成熟的非線性建模工具。通過統(tǒng)計學的標準數(shù)學方法,可以獲得大量可以用函數(shù)來表達的局部結構空間④這是有關神經(jīng)網(wǎng)絡數(shù)學基礎的常規(guī)解釋,作者沒有找到最早的引用出處。,這比依賴領域專家編寫 if-then 規(guī)則進行邏輯推理更容易,成本更低。
計算力的增長使得復雜神經(jīng)網(wǎng)絡計算成為可能。實際上,在 20 世紀 90 年代已經(jīng)出現(xiàn)了大量的神經(jīng)網(wǎng)絡加速器的工作[2]。然而,受制于當時有限的計算能力和匱乏的專業(yè)領域數(shù)據(jù),神經(jīng)網(wǎng)絡的成功應用乏善可陳,神經(jīng)網(wǎng)絡加速器缺少足夠的市場需求,未能獲得發(fā)展。
通用計算機體系結構發(fā)展遇到的技術障礙也為神經(jīng)網(wǎng)絡加速器的發(fā)展創(chuàng)造了條件。2017 年,圖靈獎獲得者 John L. Hennessy 和 David Patterson 指出通用計算機體系結構發(fā)展遇到巨大技術障礙,如芯片的性能增長比摩爾定律預測的緩慢;串行程序的并行遇到結構化的限制;芯片散熱受到物理極限因素的制約。在這些條件的綜合約束下,針對特定領域應用開展軟件和硬件的協(xié)同設計成為國際學術界的共識。這種學術趨勢可謂返璞歸真,馮 · 諾伊曼結構出現(xiàn)之前的數(shù)字計算機就是為每個程序設計一個計算機結構。當然從直覺上來說,應用越單一,系統(tǒng)效率越高。然而新的趨勢并不是放棄馮 · 諾伊曼結構,而是采用一種異構的體系結構來提高效率:保留基于馮 · 諾伊曼結構的通用計算部件,再增加針對特定領域應用開發(fā)的加速器,如神經(jīng)網(wǎng)絡加速器。
深度學習在圖像識別、語音識別等眾多領域取得成功,甚至在單一問題上超過人的平均能力。與此同時,基于深度學習的應用領域越來越廣。如藥物篩選、疾病診斷等[3]。有理由相信,在深度學習加速器(所謂智能芯片)、智能系統(tǒng)、算法和行業(yè)應用基礎上有希望發(fā)展出一個大規(guī)模的智能計算產(chǎn)業(yè)。
盡管智能芯片通常以加速器(PCI-E卡)的方式依附于通用計算機部件,獨立性受限,但是以智能芯片、系統(tǒng)、算法和行業(yè)應用為代表的智能計算機產(chǎn)業(yè)仍是一個難得的產(chǎn)業(yè)機會,至少為我們提供了在特定應用領域建立自主可控和開放產(chǎn)業(yè)的機會。
(1)通用計算機發(fā)展遇到了巨大的技術障礙,在特定領域做軟硬件協(xié)同設計是國際學術界的共識。人工智能和大數(shù)據(jù)有融合的趨勢,無論在端(IoT)、數(shù)據(jù)中心、高性能計算機,還是在最新涌現(xiàn)的邊緣計算(edge computing),應用的深度和廣度都在增加,而我國在智能計算領域有一批和國際同行齊頭并進的企業(yè)和研發(fā)機構。例如,中科院計算所的“寒武紀”[4]是大規(guī)模深度學習加速器的國際先行者;本文作者擔任執(zhí)行委員會主席的國際開放基準測試委員會(BenchCouncil, http://www.benchcouncil.org)聯(lián)合國內外領先機構研究與開發(fā)了面向 IoT(端)、Edge(邊緣)、數(shù)據(jù)中心和高性能計算機的人工智能和大數(shù)據(jù)測試標準BigDataBench[5],將為產(chǎn)業(yè)的良性競爭提供評價依據(jù)。Bench Council 在 2019 年發(fā)起了人工智能實驗床“泰”計劃,為人工智能等新技術的評測、模擬、驗證、教育、培訓和推廣提供統(tǒng)一的平臺,有望成為智能計算產(chǎn)業(yè)的加速器,受到國際高性能計算權威媒體 HPC Wire⑤https://www.hpcwire.com/2019/06/05/china-launches-ai-testbed-in-shenzhen.、新華社⑥http://www.gd.xinhuanet.com/newscenter/2019-06/03/c_1124578327.htm.等媒體廣泛關注。我國不少企業(yè)也積累了海量的應用領域數(shù)據(jù)和針對特定領域應用優(yōu)化的深度學習算法。
(2)我國在超級計算機領域有著深厚的積累,智能計算又為這個領域夯實了基礎。例如,在高能物理、天氣預報、宇宙學,基于深度學習的算法提供了新的計算途徑[6]。智能超級計算機將成為新的增長點。
(3)智能計算機整體上仍然依賴于通用計算機體系結構,我們不需要重起爐灶,可以借助整體計算機產(chǎn)業(yè)的發(fā)展;而智能計算機作為一個重要的主干分支,可以相對獨立發(fā)展,獲得完整的知識產(chǎn)權體系。
(4)隨著對智能計算這個領域有著更深地理解,我們會發(fā)展出更通用的計算抽象,從而研發(fā)出能適用更多應用場景的相對通用的計算系統(tǒng)。例如,我們最近的工作將大數(shù)據(jù)分析和機器學習算法(深度學習是其中一個分支)統(tǒng)一為 8 類基本計算單元[7],包括矩陣計算、圖計算、邏輯計算、變換計算、采樣計算、集合計算、排序計算、統(tǒng)計計算,而每一個大數(shù)據(jù)分析或者機器學習負載都可以認為是一個或者多個計算單元的組合。在這個工作基礎上研究的計算機系統(tǒng)有望適應更多的大數(shù)據(jù)和人工智能應用場景。這樣的研究努力旨在避免為每一類應用單獨設計一個加速器。不難想象,如果在一個通用計算部件上增加大量不同類型的加速器,必然給資源共享設置技術障礙。
綜合以上原因,有理由相信我國有機會在此基礎上發(fā)展一個相對自主可控并兼顧開放的產(chǎn)業(yè)。當然,我國在產(chǎn)業(yè)基礎上仍然存在顯著不足。例如,在智能系統(tǒng)上,我們依賴于 TensorFlow 等開源系統(tǒng);而在算法上,我們依賴于大量的開源項目??紤]到 Google 等公司申請了大量的專利,這些可能成為先進國家出口管控的依據(jù)。據(jù)中美兩國執(zhí)業(yè)律師金依依的分析⑦詹劍鋒, 金依依. 貿易戰(zhàn)出口管控對全球科技產(chǎn)業(yè)的影響. 公開報告, 未出版.,這些國家已經(jīng)發(fā)布了征求意見的管控草案。另外,智能芯片以 PCI-E 卡的方式存在,依賴于現(xiàn)有通用計算機系統(tǒng)。一旦通用芯片和系統(tǒng)被管控,仍然會出現(xiàn)“卡脖子”現(xiàn)象。然而冰凍三尺非一日之寒,我國如果無法建立有競爭力的應用科學技術體系,只能全盤復制,或在枝干或旁枝末節(jié)處改進已發(fā)展好的成熟技術。
基于這些理由,Bench Council 聯(lián)合相關方于 2019年 6 月將共同主辦 BenchCouncil 2019 國際智能計算機大會⑧http://www.benchcouncil.org/bc19/cn/cn.html.,以研討、展覽和路演智能芯片、系統(tǒng)、算法、腦科學、智慧醫(yī)療、金融、社會治理、教育、產(chǎn)業(yè)互聯(lián)網(wǎng)為目標;并同期舉辦 Bench Council 國際人工智能系統(tǒng)大賽,在 Bench Council 人工智能實驗床上舉辦“寒武紀”、RISC-V、X86 系統(tǒng)競賽以及算法競賽,培養(yǎng)人工智能后備人才。
對于物理和數(shù)學等基礎學科來說,開展重大理論研究摘取科學皇冠是毋庸置疑的目標。以計算機學科為代表的應用科學,如何建立有競爭力的應用科學技術體系?作者認為,殊途同歸,最終的目標都是建立有競爭力的教育和科學技術研究體系。 這需要我們改變應用科學評價體系,改變頭重腳輕的學科布局,重視知識產(chǎn)權、建立公平競爭環(huán)境,并充分利用國際智力進行分工與合作。
美國計算機學界建制派在學科評價方面的觀點認為,計算機學科評價分 3 個層次。在第一個層次,對助理教授的評價以論文為主,強調一定數(shù)量的高質量論文,這些論文通常發(fā)表在本領域競爭最激烈的會議上。助理教授通常難以獲得較多資源,不可能建立較大規(guī)模的團隊,對他們的評價聚焦于新概念和原型系統(tǒng)是合理的,這些工作通常也需要大浪淘沙。而在第二個層次,則以對整個社區(qū)交付的獨一無二的系統(tǒng)和工具作為主要的評價指標。例如,俄亥俄大學計算機系的 D. K. Panda 教授,近 20 年都關注于如何實現(xiàn)高性能計算機編程工具 MPI。 MPI 最新的功能通常由他的團隊首先完成,Top 500 超級計算機排名上,不少機器直接使用他的工具,全球幾千個單位下載他們的系統(tǒng)。Rice 大學的 John Mellor-Crummey 教授 (ACM Fellow)近十幾年來一直孜孜不倦的研發(fā)高性能計算的性能分析工具,被美國數(shù)量眾多的國家實驗室用于優(yōu)化大規(guī)模的并行應用性能。這兩位教授都是卓越的學術界代表,直接向國際社區(qū)交付具有獨一無二價值的工具,所有的研究都圍繞這些工作展開,而團隊 1 年通常需要數(shù)百萬美元經(jīng)費的支持。在第三個層次,則更進一大步,關注對整個人類社會基礎設施的核心貢獻。像前文提到的 Unix、Linux、安卓、MIPS、RISC、ARM 正是這樣的工作。
而我國目前應用科學的評價基本還停留在第一個層次,以 SCI 論文或者分檔的會議論文數(shù)量及引用作為主要的評價工具。有抱負的研究人員不敢輕易放棄論文這個“緊箍咒”。例如,在作者參加的一個會議上,一個著名高校的助理教授分享了他在系統(tǒng)領域研究工作,大家覺得工作非常有價值,問他為什么不把這些工作貢獻給 Linux 社區(qū)。他回答道,論文壓力太大了,沒有十幾篇中國計算機學會(CCF) A 類會議論文,不能評副教授。長此以往,我國學術界只能產(chǎn)出價值相對較低的論文和概念系統(tǒng),難以向整個國際社區(qū)或者人類社會提供有獨特價值的系統(tǒng)、工具和核心基礎設施,難以為產(chǎn)業(yè)提供從源頭或者主干開始的基礎性技術創(chuàng)新。
頭重腳輕的學科布局體現(xiàn)在 2 個方面:
(1)在體系結構和系統(tǒng)等基礎學科方面投入的科研人員極少,大部分科研人員投入在應用方向。以論文為主的評價體系導致人才評價、獎勵和人才流往應用方向傾斜。以論文發(fā)表數(shù)目為例,一些應用方向年度發(fā)表的論文數(shù)目是體系結構和系統(tǒng)等基礎學科的近百倍。而在人才評價方面,以所謂頂級會議論文的數(shù)目或者論文的引用數(shù)作為主要指標進行評價。長此以往,我們就無法在基礎學科方面積聚足夠多的科研人才,研究人員也無法像美國一流學者那樣做出更高、更遠的追求,企圖實現(xiàn)自主可控顯然是奢侈的愿望。有人也許會認為,在美國等先進國家,投入在體系結構和系統(tǒng)等基礎學科方面的科研人員比應用領域的也要少。本文認為需要澄清 2 點:① 美國人已經(jīng)建立起了自主可控和開放的產(chǎn)業(yè)體系,不需要在基礎學科投入那么高比例的人才。② 美國投入人才的比例懸殊沒有我們這么大。例如,在美國從事體系結構研究的高校數(shù)目遠遠高于中國相應的數(shù)目。
(2)在美國等研究生教育發(fā)達的國家,以導師實際科研需求為依據(jù)制定研究生招生計劃,而我國則以計劃經(jīng)濟的模式制定研究生招生計劃。這導致北大、清華和中科院等科研資源相對較多的機構一個老師每年只能招收數(shù)量極少的學生,而在科研資源較少的一些大學,一個老師卻能招收較多數(shù)量的學生。這種不合理的研究生資源配置方式也對人才的培養(yǎng)和學科的布局造成了不利的影響。
從 Unix、Linux、安卓、MIPS、RISC 和 ARM 等基礎性技術創(chuàng)新的發(fā)展過程可以看出,小團隊的力量起著至關重要的作用。從一個概念的提出,到系統(tǒng)原型的實現(xiàn),再成為整個產(chǎn)業(yè)的關鍵一環(huán),知識產(chǎn)權保護起著至關重要的作用。沒有知識產(chǎn)權保護,小企業(yè)和小團隊的生存必將受大公司和大團隊的威脅。下面以某智能芯片初創(chuàng)公司 A 和某大公司 B 的合作為例闡述知識產(chǎn)權保護對構建公平競爭環(huán)境的重要性。
B 和 A 合作,獲得 A 的知識產(chǎn)權,然后在此基礎上發(fā)展自己的技術,B 的技術成熟后,再棄用 A 的技術。在一個充分保護知識產(chǎn)權的體系里,A 可以通過出售許可證的方式獲得商業(yè)成功(ARM 就是以這樣的方式獲得成功),成為一個更大規(guī)模公司。而事實上,由于知識產(chǎn)權缺少保護,在與 B 合作的領域,A 已經(jīng)成為弱者,沒有競爭力。A 只能開展新的產(chǎn)品線研發(fā),走上更艱難的征程。
缺少知識產(chǎn)權保護,小的初創(chuàng)公司或者小的團隊處處受到生存的威脅,更無力從事類似于 Linux、安卓、MIPS、RISC 或者 ARM 這樣的主干創(chuàng)新,因此打造自主可控的產(chǎn)業(yè)體系里缺少了一支活力四射的生力軍。
在 Linux、安卓、MIPS、RISC 和 ARM 的發(fā)展過程中,充分利用國際智力開展分工與合作非常重要。例如,Linux 和安卓都是以開源軟件運動的方式開展國際分工與合作;MIPS 和 RISC 的發(fā)展體現(xiàn)了學術圈和產(chǎn)業(yè)界在國際范圍內合作分工的重要性。而 ARM 的發(fā)展更是初創(chuàng)公司吸收國際學術界精英研究成果的典范,ARM 起步后,在國際上展開了廣泛的產(chǎn)業(yè)鏈分工與合作。
在一個封閉的小體系里打造自主可控的產(chǎn)業(yè)是不持久的,因為封閉的小體系一方面無法充分利用外部智力,另外一方面也難以分攤研究與開發(fā)的巨額成本。我國發(fā)展自主可控的技術體系,一定要充分利用國際智力。
本文分析計算機產(chǎn)業(yè)發(fā)展史上的重要技術創(chuàng)新:移動芯片 ARM 和移動操作系統(tǒng)安卓(Android)以及正在發(fā)展的智能計算機產(chǎn)業(yè),得出 2 點結論:① 只有從源頭開始的基礎性技術創(chuàng)新才可能真正做到自主可控,并享有國際分工與合作的好處;而智能計算機正是我國發(fā)展自主可控和開放產(chǎn)業(yè)的一個機會。② 建立有競爭力的應用科學技術體系,必須改變現(xiàn)有評價體系。要從機械地統(tǒng)計論文數(shù)目和引用轉向重視從源頭或者主干開始的基礎性技術創(chuàng)新,改變頭重腳輕的學科布局,重視知識產(chǎn)權保護,充分開展國際分工與合作。
致謝 感謝中美兩國執(zhí)業(yè)律師金依依在理解美國法律體系上給予的幫助,感謝博士生戴紹鵬和郝天舒在參考文獻格式整理方面提供的幫助。