向治霖
9月的開始,美國芯片大廠英偉達(dá),卷入了大麻煩。
據(jù)外媒9月1日報(bào)道,美國官員命令英偉達(dá),停止對中國出口兩款頂級計(jì)算芯片,A100和H100。另外,英偉達(dá)的競爭對手AMD,也被要求停止對中國出口MI250芯片。
英偉達(dá)和AMD兩大巨頭,牢牢占據(jù)著全球獨(dú)立GPU的市場。這也意味著,美國對中國的前沿、高端領(lǐng)域,再一次升級“追殺令”。
長遠(yuǎn)影響暫且不提,然而英偉達(dá),率先繃不住了。
受到上述消息影響,一夜之間,英偉達(dá)的股價(jià)一度暴跌11%,股票市值蒸發(fā)了約400億美元。另有數(shù)據(jù)顯示,美國半導(dǎo)體公司的股價(jià)集體下挫,損失超過1000億美元。
美國推行的技術(shù)封鎖,由于逆全球化的趨勢而行,“損人不利己”并不奇怪。但是這一次,市場的波動為何如此之大?
原因至少有兩個(gè)方面:
一方面是,限制高端GPU(圖形處理器)對中國出口,直接影響到了英偉達(dá)等公司的業(yè)績。中國一直是英偉達(dá)、AMD等眾多芯片企業(yè)的排名前三大市場。英偉達(dá)透露,新的限制政策,讓公司可能在本季度損失4億美元的銷售額。
限制消息放出的當(dāng)天,英偉達(dá)創(chuàng)始人黃仁勛“緊急公關(guān)”,第一時(shí)間發(fā)信稱“:將立即與中國客戶合作,以我們最好的替代品滿足客戶需求,或是以申請?jiān)S可證方式協(xié)助?!?/p>
不過,黃仁勛也承認(rèn),替代品比起A100,表現(xiàn)會有明顯的差距。
另一方面,市場的震蕩也因?yàn)?,美國的技術(shù)限制“超出了以往的打擊范圍,從消費(fèi)電子開始,現(xiàn)在擴(kuò)散到最前沿的領(lǐng)域”。這就造成不確定性的加強(qiáng),市場信心被打擊。
或許是因?yàn)橛ミ_(dá)“跌得太慘”,9月2日,美國政府打了個(gè)“補(bǔ)丁”。
據(jù)英偉達(dá)9月2日公告稱,公司已經(jīng)得到批準(zhǔn),可以繼續(xù)為中國出口A100芯片(明年3月前),也可以繼續(xù)履行A100和H100的訂單(明年9月1日前)。不過,時(shí)間受到了限制。
政策改過去、改回來,信心就能恢復(fù)嗎?
或者,我們更應(yīng)該關(guān)注的是,朝令夕改的表象間,有什么東西永遠(yuǎn)地變了?
“我們也是(新聞發(fā)出的)這一天才知道的,其實(shí)也挺意外?!?月1日晚,董超告訴南風(fēng)窗。
董超是AI領(lǐng)域的學(xué)者,曾就職于商湯科技。2021年,他被斯坦福大學(xué)評選為世界前2%頂尖科學(xué)家?,F(xiàn)在的他,是中國科學(xué)院深圳先進(jìn)技術(shù)研究院數(shù)字所副研究員、博士生導(dǎo)師,同時(shí),他也在上海人工智能實(shí)驗(yàn)室擔(dān)任職務(wù)。
董超告訴南風(fēng)窗,A100的“斷供”沒有先聲,發(fā)生得突然,“我們前一段時(shí)間,才剛到貨了一批,已經(jīng)預(yù)計(jì)了還有多少要到。我們的規(guī)劃,是規(guī)劃到了2025年的,然后一下子停了”。
“這個(gè)(政策生效的話)影響將會很大?!倍寡?。
以他從事的AI領(lǐng)域?yàn)槔壳皣H競爭主要在通用大模型上,這也是 AI領(lǐng)域中最頂級的一塊。董超說,一旦頂級的顯卡被限制了,我們再做大模型的競爭,可能就很困難,“相當(dāng)于未來的通用人工智能的趨勢,可能就都掌握在他們手里了”。
被限制的3款GPU,無疑就是目前最新、最先進(jìn)的3款。
3款GPU中,目前最多用到的是A100。董超介紹,A100的價(jià)格在一款8萬元左右,只有非常大型的公司和研究院用得起,他所服務(wù)的上海人工智能實(shí)驗(yàn)室中,主流芯片基本換成了A100,這已經(jīng)是最高級別的GPU了。
對GPU的評價(jià)指標(biāo)是多樣的,僅以顯存為例,董超介紹,A100的顯存最高可達(dá)80個(gè)G,而上一代產(chǎn)品中,能達(dá)到40G的就非常高了,普通產(chǎn)品的顯存一般在20到40G之間。
A100這樣頂級的芯片,對尖端研發(fā)來說,屬于不可或缺的硬件。
頂級的性能只是一個(gè)方面,另外需要注意的是,高端GPU的迭代速度也很快。
仍然以AI中大模型的訓(xùn)練為例,“這些模型的特點(diǎn),就是它的規(guī)模非常大,是有億級以上的參數(shù)”,董超說。
十億級甚至百億級的數(shù)據(jù)量,對于顯存要求非常高,“即便是A100這樣的顯卡,可能都需要32塊同時(shí)進(jìn)行計(jì)算”,董超說,如果說沒有這種頂級顯卡,那么我們可能要付出相當(dāng)大的代價(jià)。
頂級的性能只是一個(gè)方面,另外需要注意的是,高端GPU的迭代速度也很快。
“大概半年多、一年間,GPU就會有一次升級。每出一款新的,相應(yīng)的人工智能算法,也就會提升一大步。迭代方面,算法與顯卡是相關(guān)聯(lián)的?!倍榻B。
這意味著,在高端GPU徹底斷供后,只需要半年一年的時(shí)間,尖端領(lǐng)域的差距就會體現(xiàn)出來。
而這一次,美國官方所針對的,自然就是AI、超算等“主戰(zhàn)場”。
中國是美國在AI領(lǐng)域的主要競爭對手。早在2019年,聯(lián)合國下屬的世界知識產(chǎn)權(quán)組織(WIPO)公布了一份研究報(bào)告,認(rèn)為在全球人工智能領(lǐng)域的競爭中,中國和美國處于領(lǐng)先地位。
到了2021年,斯坦福大學(xué)發(fā)布的《人工智能指數(shù)報(bào)告》顯示,中國在專利申請、會議出版物、期刊發(fā)表和期刊引用等四項(xiàng)指標(biāo)上已經(jīng)領(lǐng)先于美國,躋身世界第一。
對待激烈的競爭,美國給出了行政干預(yù)手段。董超告訴南風(fēng)窗,禁掉高端的GPU,對消費(fèi)級市場影響不大,普通人很難有感知,但是“對于AI的國際競爭,這相當(dāng)于釜底抽薪”。
對此,外交部發(fā)言人汪文斌9月1日表示,美方的做法是典型的科技霸權(quán)主義,美方一再泛化國家安全概念,濫用國家力量,企圖利用自身科技優(yōu)勢,遏制打壓新興市場和發(fā)展中國家發(fā)展,此舉違反市場經(jīng)濟(jì)規(guī)則,破壞國際經(jīng)貿(mào)秩序,中方對此堅(jiān)決反對。
美國官方的動作頻頻,今年7月,美國政府?dāng)U大了芯片制造設(shè)備的限制范圍,14nm以下的設(shè)備出口中國受到限制。8月,“芯片法案”出臺、限制高端EDA。再到這次限制高端GPU,動作一氣呵成,環(huán)環(huán)相扣。
受到影響的,自然不只有AI。
“(先進(jìn)GPU)主要用在高性能計(jì)算領(lǐng)域,比如高端的AI訓(xùn)練、數(shù)據(jù)中心、超級計(jì)算、智能計(jì)算?!毙局\研究分析師商君曼對南風(fēng)窗表示。
在應(yīng)用層面,受此影響的主要是科研、醫(yī)療、自動駕駛、AI等等。
GPU為何擁有如此之多的用途?我們不妨簡單了解一下它的發(fā)展。
其實(shí),GPU早期最大的用途,只是作為電腦游戲的顯卡,用來對圖像進(jìn)行渲染。
GPU相比CPU,在圖像處理上具備優(yōu)勢。比如一張4k的圖像,如果用CPU來處理,是串行處理的,從第一個(gè)像素處理到最后一個(gè)像素,它的速度再快,也得處理完前一個(gè)才能處理后一個(gè)。
但是,GPU擁有并行處理的能力,這相當(dāng)于,GPU在工作時(shí)要開非常多的計(jì)算單元,每一個(gè)計(jì)算單元,相當(dāng)于一個(gè)很小型的CPU。然后,GPU就可以把這些像素同時(shí)處理。
并行計(jì)算的特點(diǎn),使得GPU能夠快速處理和響應(yīng)。這一時(shí)期,GPU為CPU“打下手”,處理一些特定的工作。
2012年,深度學(xué)習(xí)成為火熱的賽道。在原理上,深度學(xué)習(xí)與渲染很類似,這迅速帶動了GPU的發(fā)展。
董超回憶說,2012年,他還在香港中文大學(xué)。“那個(gè)時(shí)候,我們決定進(jìn)入深度學(xué)習(xí)領(lǐng)域,第一件事情就是要開始買顯卡(GPU)?!?/p>
隨著深度學(xué)習(xí)越來越火,董超發(fā)現(xiàn),做人工智能算法的實(shí)驗(yàn)室,如果不用深度學(xué)習(xí)來做,可能就達(dá)不到最好的性能。這再一次助推了GPU發(fā)展。
而英偉達(dá)瞄準(zhǔn)了這股趨勢,“英偉達(dá)很聰明的一點(diǎn)就是,瞄準(zhǔn)了計(jì)算能力、做計(jì)算卡,一下子就起來了”。
英偉達(dá)的奇跡,造就了“黃氏定律”。英偉達(dá)首席科學(xué)家Bill Dally 曾總結(jié)說,從2012年的K20X到2020年的A100,GPU的推理性能提高到原來的 317倍。這就是“黃氏定律”,發(fā)展速度比“摩爾定律”還快。
董超回憶說,十年前的GPU賽道上,產(chǎn)品很多,然而GPU成為通用芯片的時(shí)代到來,英偉達(dá)崛起,很少聽到別的廠商了。
競爭對手少了,但市場“蛋糕”越來越大。商君曼表示,隨著大數(shù)據(jù)時(shí)代、AI時(shí)代的來臨,我們需要處理的這種圖形信息、數(shù)據(jù)信息,增長的速度非???,“順勢而為地,GPU受到越來越多的關(guān)注”。
在講求“厚積薄發(fā)”的芯片領(lǐng)域,“巨人”的斷供,無疑也帶來巨大壓力。
GPU賽道的火熱,自然也引起了各國重視。
董超表示,在中國,不是沒有自己的GPU,也不是沒有自己的高端顯卡,但是,我們沒有一個(gè)完整的生態(tài)。
“中國現(xiàn)在已經(jīng)有很多企業(yè)進(jìn)入了GPU賽道,目前來說,國產(chǎn)GPU還處在一個(gè)發(fā)展比較初期的階段。”商君曼稱,其中的差距是比較明顯的。
而在董超看來,美國此次的技術(shù)限制,最“誅心”的是,一方面,它針對尖端科技進(jìn)行打壓,另一方面,它依然“壓著”國產(chǎn)GPU的發(fā)展。
董超解釋,美國只禁了高端、不禁低端,這就意味著,你還可以買它的低端顯卡,這就不影響它的整個(gè)銷量。
而且,這在中國市場的占有量其實(shí)仍然很大。因?yàn)樵贏100之外,英偉達(dá)和AMD的低端顯卡,在中國仍然很難有國產(chǎn)顯卡替代。
“如果說,政策是對全部的GPU進(jìn)行限制,那反而是件好事?!倍f。
這就意味著,我們必須選擇國產(chǎn)GPU。董超表示,在中國,不是沒有自己的GPU,也不是沒有自己的高端顯卡,但是,我們沒有一個(gè)完整的生態(tài)。
對于顯卡,除了要有計(jì)算能力,其實(shí)還要有配套的一些軟件,相應(yīng)的一些代碼庫等等。這些配套的東西,會形成一個(gè)生態(tài)。
一個(gè)成熟的生態(tài),意味著使用的人很多、教程很多,解決方案都是現(xiàn)成的。
如同擁有“蘋果全家桶”的人,在轉(zhuǎn)向安卓手機(jī)后,學(xué)習(xí)和使用的成本就會上升。這正是國產(chǎn)GPU面臨的桎梏。
這些成本包括,“它的使用非常麻煩,要求用戶重新學(xué)習(xí),而且它的里面的那些流程一旦出了問題,沒有人幫你解決”,董超解釋。
因此,假如我們不得不用國產(chǎn)GPU,那就意味著,國產(chǎn)的生態(tài)就可以建立起來,大家強(qiáng)制性地進(jìn)行學(xué)習(xí)。這樣,國內(nèi)的GPU可以借機(jī)發(fā)展起來,國內(nèi)的生態(tài)也可以發(fā)展起來。
“如果大家都用起來的話,我覺得,其實(shí)也挺有希望(突破)?!倍f。
然而,美國官方的政策“只限高端,不限低端”。在技術(shù)的壁壘和生態(tài)的加持下,哪怕是最高端的國產(chǎn)GPU,在對標(biāo)別人的次旗艦產(chǎn)品時(shí),仍然缺乏優(yōu)勢。
不過,層層推進(jìn)的美國政策下,不切實(shí)際的幻想早該拋棄。
董超告訴南風(fēng)窗,科技水平的評價(jià),標(biāo)準(zhǔn)在于最尖端領(lǐng)域。國際競爭當(dāng)中,如果人家已經(jīng)穩(wěn)操勝券、穩(wěn)居第一,這個(gè)對我們是很危險(xiǎn)的。
“相當(dāng)于倒逼了,我們的國產(chǎn)化,技術(shù)要繼續(xù)往上提升?!鄙叹硎?。一個(gè)中國版的“英偉達(dá)”出現(xiàn),并非不可能。只不過,這一切還需要時(shí)間。