隨著無線通信技術(shù)和人工智能技術(shù)的廣泛應(yīng)用,現(xiàn)在信息世界里的數(shù)據(jù)呈現(xiàn)了三大變化。
第一,數(shù)據(jù)量呈指數(shù)級(jí)爆發(fā)。
第二,數(shù)據(jù)形態(tài)日趨多樣化。
第三,對于數(shù)據(jù)實(shí)時(shí)處理的需求快速增長。
為了應(yīng)對這些變化,未來十年,架構(gòu)創(chuàng)新將成為計(jì)算創(chuàng)新的關(guān)鍵驅(qū)動(dòng)力。
目前,主流的計(jì)算架構(gòu)有四種:標(biāo)量、矢量、矩陣、空間。
標(biāo)量是指一個(gè)一個(gè)去計(jì)算數(shù)據(jù),有前后的順序;矢量是指把一組數(shù)一起做,比如把兩個(gè)數(shù)組直接相加或相乘;矩陣是指把3×3或8×8這類的矩陣數(shù)據(jù)同時(shí)做運(yùn)算;空間是指這些數(shù)據(jù)本身有很強(qiáng)的稀疏性,對它的處理需要采用特殊的方法。
現(xiàn)在,人工智能領(lǐng)域的數(shù)據(jù)處理,至少是矢量級(jí)別的,很多是矩陣的,甚至在某些應(yīng)用場景中需要運(yùn)用空間數(shù)據(jù)結(jié)構(gòu)來加速計(jì)算。
把四種計(jì)算架構(gòu)整合在一起,稱為XPU超異構(gòu)計(jì)算,X代表有多種可能性。
超異構(gòu)是什么概念?
在傳統(tǒng)異構(gòu)領(lǐng)域,傳統(tǒng)的SoC做法是把不同的計(jì)算能力或不同計(jì)算架構(gòu)整合到一個(gè)單芯片上;或者把不同的芯片,比如CPU、GPU、FPGA整合到一個(gè)板上,進(jìn)行板級(jí)的整合,這是另外一種異構(gòu)計(jì)算。這兩種異構(gòu)計(jì)算各有優(yōu)劣勢。
超異構(gòu)計(jì)算希望把這兩種異構(gòu)計(jì)算的優(yōu)勢集中在一起,而把他們的不足之處去掉。也就是說,我們可以把已經(jīng)做好的多種不同架構(gòu)的芯片單元,通過異構(gòu)封裝的方式組合到一個(gè)芯片里面,然后把高性能芯片之間的傳輸通道建立起來,這樣可以把很多不同架構(gòu)的芯片整合在一起,在小空間、低功耗的情況下提高計(jì)算的能效比。
我們認(rèn)為,在架構(gòu)方面還需要有更多的探索。現(xiàn)在常用的架構(gòu)有兩種,一種是標(biāo)準(zhǔn)計(jì)算,一種是深度神經(jīng)網(wǎng)絡(luò)。
標(biāo)準(zhǔn)計(jì)算是在知道問題和知道如何建模的情況下,用流程圖的方式把處理問題的步驟表示出來,然后去編程,由人工選定怎么做。
深度神經(jīng)網(wǎng)絡(luò)是在我們知道輸入的數(shù)據(jù)是什么和數(shù)據(jù)會(huì)產(chǎn)生什么結(jié)果的情況下,用深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,訓(xùn)練出一個(gè)符合解決特定任務(wù)的架構(gòu)和模式。
我們把標(biāo)準(zhǔn)計(jì)算和深度神經(jīng)網(wǎng)絡(luò)整合到一個(gè)架構(gòu),從而形成了Loihi神經(jīng)擬態(tài)芯片。
Loihi神經(jīng)擬態(tài)芯片,把計(jì)算單元和需要的存儲(chǔ)空間緊密地整合在一起,一個(gè)芯片里面有128個(gè)同構(gòu)多核,每個(gè)核都一樣,每個(gè)核里可以做1000個(gè)神經(jīng)元的模型,這種芯片核可以模擬人腦神經(jīng)元的結(jié)構(gòu)以及數(shù)據(jù)處理和存儲(chǔ)方式。每一個(gè)核可以和另外的999個(gè)核互相連接,構(gòu)造類似人腦里面的突觸結(jié)構(gòu)。最終,一個(gè)小的芯片可以模擬人腦的13萬個(gè)神經(jīng)元,并且可以產(chǎn)生1.3億個(gè)突觸,這是一項(xiàng)針對比較復(fù)雜的神經(jīng)網(wǎng)絡(luò)的突破。
Loihi神經(jīng)擬態(tài)芯片體積小、能耗低,是真正的“綠色”芯片,它助力AI從2.0時(shí)代向3.0時(shí)代邁進(jìn)。
AI2.0時(shí)代利用數(shù)據(jù)驅(qū)動(dòng),做端到端的學(xué)習(xí),構(gòu)建針對學(xué)習(xí)數(shù)據(jù)量比較大時(shí)的好用模型;在AI3.0時(shí)代,我們希望AI能夠完成邏輯的自洽,可以通過少量的數(shù)據(jù)去自主學(xué)習(xí),不一定需要非常大量的數(shù)據(jù),因?yàn)楹芏囝I(lǐng)域的大數(shù)據(jù)不容易獲得。
Loihi憑借其靈活的架構(gòu),可以支持多種事件驅(qū)動(dòng)的學(xué)習(xí)模式。比如,常規(guī)使用的無監(jiān)督學(xué)習(xí)模式,這是在2.0時(shí)代深度學(xué)習(xí)中非常常用的模式。
自監(jiān)督學(xué)習(xí)是關(guān)聯(lián)不同的事件,產(chǎn)生出因果關(guān)系強(qiáng)化學(xué)習(xí),利用觀察到的事件和作出的決策之間的關(guān)系,去反復(fù)做迭代,優(yōu)化出一個(gè)好的決策方案。
2017年,Loihi系統(tǒng)推出第一個(gè)單芯片,隨后其規(guī)模逐漸擴(kuò)大。目前,我們能夠用768個(gè)芯片集成在一個(gè)大的系統(tǒng)里,這樣可以提供接近1億個(gè)神經(jīng)元的規(guī)模。
這是硬件的規(guī)模,還需要很多軟件和算法,才能實(shí)現(xiàn)Loihi系統(tǒng)的智能。英特爾成立了一個(gè)面向全球的研究社區(qū),把大家聚合起來,共同推動(dòng)這個(gè)領(lǐng)域的發(fā)展。
現(xiàn)在,我們可以提供計(jì)算的平臺(tái)和能力,不僅可以提供在設(shè)備上直接使用的能力,而且還可以提供在云端使用這些服務(wù)和測試系統(tǒng)的能力。
對于嶄新的硬件架構(gòu),編程對它能力的釋放非常重要。如果把它們統(tǒng)一做成一個(gè)異構(gòu)系統(tǒng),如何讓開發(fā)者或科研人員更方便地去使用?于英特爾而言,這件事情非常重要。
當(dāng)前,數(shù)據(jù)變革催生多元化計(jì)算架構(gòu),未來,架構(gòu)創(chuàng)新將成為計(jì)算創(chuàng)新的關(guān)鍵驅(qū)動(dòng)力。英特爾將持續(xù)推動(dòng)超異構(gòu)計(jì)算,大跨步邁向智能時(shí)代。
英特爾通過創(chuàng)造改變世界的技術(shù)來造福地球上的每一個(gè)人,我們希望通過異構(gòu)計(jì)算,通過開源的技術(shù)和平臺(tái),讓新的技術(shù)快速覆蓋到全球,產(chǎn)生造福人類的技術(shù)。