十五年來(lái)最強(qiáng)？解析Imagination全新A系列移動(dòng)GPU

2020-04-15 07:17:41張平

微型計(jì)算機(jī) 2020年2期

張平

Imagination是業(yè)內(nèi)傳奇的GPU公司之一，從2008年開始，旗下移動(dòng)GPU產(chǎn)品在很長(zhǎng)一段時(shí)間幾乎代表了移動(dòng)SoC圖形技術(shù)的巔峰。好花不常開，好景不常在，隨著產(chǎn)業(yè)進(jìn)步、市場(chǎng)競(jìng)爭(zhēng)和變化，Imagination的產(chǎn)品逐漸在市場(chǎng)中銷聲匿跡。尤其是蘋果在2017年宣布不再使用Imagination的授權(quán)后，Imagination一落千丈，空有技術(shù)而找不到市場(chǎng)，最后被中資公司股權(quán)收購(gòu)。不過(guò)，近期Imagination又發(fā)布了全新的A系列移動(dòng)GPU產(chǎn)品，并且市場(chǎng)上又傳出消息稱蘋果再度和Imagination聯(lián)手移動(dòng)GPU。那么，Imagination A系列GPU究竟如何？又有哪些獨(dú)特之處呢？請(qǐng)看本文給你帶來(lái)的詳細(xì)分析。

Imagination是GPU市場(chǎng)的“老玩家—了，在個(gè)人PC發(fā)展的初期，Imagination就曾經(jīng)和ATI、英偉達(dá)在市場(chǎng)上扳過(guò)手腕，不過(guò)由于技術(shù)路徑、市場(chǎng)策略等原因，Imagination在2000年宣布放棄了桌面市場(chǎng)，全面轉(zhuǎn)向超低功耗領(lǐng)域，并終于在2006年之后的移動(dòng)計(jì)算市場(chǎng)大放異彩，借著蘋果iPhone的東風(fēng)，成為移動(dòng)計(jì)算市場(chǎng)的GPU霸主之一。

早期的移動(dòng)計(jì)算市場(chǎng)在架構(gòu)和技術(shù)路徑上的競(jìng)爭(zhēng)還是頗為激烈的，除了有Imagination、ARM這樣的巨頭外，還出現(xiàn)了Vivante這樣的小廠商提供相關(guān)GPU授權(quán)，也有一些廠商嘗試自研GPU架構(gòu)或者授權(quán)GPU架構(gòu)，典型的比如英偉達(dá)和AMD，都有自己的移動(dòng)GPU部門或者授權(quán)定制的產(chǎn)品。隨著市場(chǎng)的進(jìn)一步發(fā)展變化，移動(dòng)GPU市場(chǎng)基本呈現(xiàn)寡頭化的態(tài)勢(shì)。2015年，主要采用Imagination技術(shù)授權(quán)的蘋果、ARM的Mali以及高通的AdrenoGPU三足鼎立，這也是Imagination最為輝煌的時(shí)候。隨后的2017年，蘋果宣布和Imagination解約并開啟自研移動(dòng)GPU的道路，同時(shí)像高通、三星、華為等廠商要么已經(jīng)自有頂尖的移動(dòng)GPU，要么表示有自研移動(dòng)GPU的必要，這意味著移動(dòng)GPU市場(chǎng)發(fā)生了重大變化，甚至有可能回歸到之前的“戰(zhàn)亂時(shí)代”。

全新A系列GPU：有史以來(lái)最快的GPU IP

在這種情況下，Imagination公司發(fā)布了全新A系列移動(dòng)GPU產(chǎn)品。Imagination宣稱這次發(fā)布堪稱公司15年發(fā)展歷史上最重要的GPU產(chǎn)品和IP發(fā)布。新產(chǎn)品的定位也非常明確，扭轉(zhuǎn)Imagination在移動(dòng)GPU市場(chǎng)上份額持續(xù)損失的趨勢(shì)，并且使得使用Imagination GPU IP的廠商重新占領(lǐng)移動(dòng)GPU的性能巔峰。

A系列GPU是Imagination的第十代產(chǎn)品。在品牌使用上，Imagination將放棄之前使用多年的PowerVR，轉(zhuǎn)而使用字母和數(shù)字命名的方式。使用這種方法的原因是Imagination希望市場(chǎng)徹底改變對(duì)旗下產(chǎn)品的看法，并樹立一個(gè)全新的技術(shù)起點(diǎn)。當(dāng)然，在一些技術(shù)場(chǎng)合，Imagination可能還會(huì)使用PowerVR的名稱，尤其是其在專利的、基于圖塊的延遲渲染技術(shù)方面。新產(chǎn)品的名稱采用的是A+“系列后綴”的方式完成，比如頂級(jí)的產(chǎn)品依1日被稱為XE系列，中端和入門級(jí)依次被稱作XM、XT系列。組合起來(lái)就有AXE、AXM和AXT等多款產(chǎn)品。

在本次發(fā)布會(huì)上，Imagination帶來(lái)了AXT、AXM和AXE系列，當(dāng)然其中的主角是AXT系列，AXM和AXE系列是進(jìn)一步精簡(jiǎn)的版本。性能方面，Imagination宣稱AXT比第九代類似定位的產(chǎn)品快2.5倍。需要注意的是，Imagination并沒有在不同代次的XT系列GPU之間進(jìn)行精確的對(duì)比，而是和“市場(chǎng)上廣泛使用的”第九代XT系列型號(hào)進(jìn)行對(duì)比。不過(guò)，考慮到目前市場(chǎng)上根本沒有公開宣布的第八代和第九代8XT或者9XTP產(chǎn)品，這樣的對(duì)比顯得有些空洞，但這依1日是新品性能對(duì)比時(shí)可以選擇的唯—方法。據(jù)悉，Imagination采用的對(duì)比對(duì)象有可能是聯(lián)發(fā)科Helio P90中所采用的GM9446，這款移動(dòng)GPU架構(gòu)基于較老的Rogue，具有一定可比性。值得一提的是，在性能對(duì)比方面，Imagination希望A系列產(chǎn)品的性能、面積等參數(shù)更為透明，并且在性能基準(zhǔn)和上代產(chǎn)品對(duì)比上更為容易，供應(yīng)商都可以據(jù)此獨(dú)立驗(yàn)證和比較性能指標(biāo)。

架構(gòu)方面，A系列架構(gòu)的改進(jìn)主要包括了GPU計(jì)算單元的重新設(shè)計(jì)和ALU架構(gòu)的大幅度調(diào)整，Imagination宣稱新的架構(gòu)帶來(lái)了4倍的性能提升、8倍的AI計(jì)算效能提升和在維持同等性能的基礎(chǔ)下?lián)碛辛?0%的功耗降低。

本次發(fā)布會(huì)上，Imagination發(fā)布了四款新品，其中兩款型號(hào)為AXT系列，兩款為進(jìn)一步精簡(jiǎn)版本的AXM系列。在產(chǎn)品命名上，Imagination米用了非常直觀、獨(dú)特的命名方式。以本次發(fā)布的頂級(jí)產(chǎn)品AXT-64-2048為例，這個(gè)名稱意味著這款GPU在每個(gè)時(shí)鐘周期可以完成64個(gè)像素計(jì)算或者2048個(gè)FP 32的計(jì)算。因此，在1GHz的GPU頻率下，其最大計(jì)算性能為圖形2TFLOPS，AI計(jì)算采用的是INT8格式，因此其性能是FP32的圖形計(jì)算能力的4倍，為8TFLOPS，另外，整體填充速率為64 Gigatexels/s。值得注意的是，Imagination在產(chǎn)品宣傳中不再使用的Gigapixels/s的單位，轉(zhuǎn)而使用更容易理解的Gigatexel/s單位。做出這樣改動(dòng)的原因是因?yàn)椴糠钟脩魰?huì)混淆紋理圖案率的含義，因此這里改用Gigatexels/s，更為清晰且容易理解。

除了AXT-64-2048外，Imagination還發(fā)布了AXT-32-1024、ATM-8-256、AXE-1-16等產(chǎn)品。其中AXE-1-16采用了一個(gè)單獨(dú)的自定義結(jié)構(gòu)。實(shí)際上，從命名就可以看出不同型號(hào)的產(chǎn)品的性能檔次和基本的產(chǎn)品區(qū)間了。Imagination認(rèn)為AXT-32-1024將會(huì)成為中高端移動(dòng)SoC的最佳選擇，至于性能更強(qiáng)的AXT-64-2048，則有機(jī)會(huì)出現(xiàn)在更大尺寸的設(shè)備之中。

全新的ISA和ALU：一個(gè)更寬的GPU架構(gòu)

在看完型號(hào)后，再來(lái)看看相關(guān)的架構(gòu)設(shè)計(jì)。和前文所說(shuō)的一樣，全新A系列GPU在架構(gòu)設(shè)計(jì)上尤其是ISA和ALU上和之前的Imagination GPU結(jié)構(gòu)存在根本的不同，并且和其他任何公開披露的GPU架構(gòu)都存在很大差異。

全新ALU設(shè)計(jì)的關(guān)鍵點(diǎn)在于，新的架構(gòu)比之前Rogue架構(gòu)和Furian架構(gòu)的寬度更寬，每個(gè)集群的密度高達(dá)128個(gè)執(zhí)行單元，因此Imagination稱之為128寬度的架構(gòu)。

從之前的架構(gòu)發(fā)展來(lái)看，Rogue架構(gòu)的波前陣列的寬度為32，但是單個(gè)SIMD寬度僅為16，因此Rogue需要2個(gè)周期才能完成一個(gè)32寬度的陣列的執(zhí)行。在8XT的Furian中，SIMD的寬度擴(kuò)大到了32寬，一個(gè)周期就可以完成32寬度波前數(shù)據(jù)的執(zhí)行，在9XT的架構(gòu)中，SIMD的寬度進(jìn)一步提升到了40單位。

和其他移動(dòng)GPU橫向比較來(lái)看的話，像是ARM最新發(fā)布的架構(gòu)中，SIMD寬度也大幅度提升，從之前Mali-G72的4個(gè)單元增加到了新的G76中的2個(gè)4單元的模塊，也就是實(shí)際上8寬度的設(shè)計(jì)更新一些的Mali-G77中，SIMD計(jì)算單元的寬度被進(jìn)一步提升至16，并且ARM還涉及了與之匹配的波前陣列。除了移動(dòng)GPU之外，在桌面GPU方面，英偉達(dá)的GPU采用的一直都是32寬度的波前陣列，AMD方面則從之前4x16寬度ALU、匹配64寬度的波前陣列轉(zhuǎn)向了32寬度的SIMD和波次，AMD在此處的設(shè)計(jì)也比較靈活，當(dāng)兩個(gè)ALU集群或者CU單元聚合在一起的時(shí)候，可以執(zhí)行64寬度的波前并實(shí)現(xiàn)向后兼容。

通過(guò)比較可以看出，Imagination的新設(shè)計(jì)相比目前所有的GPU方案來(lái)說(shuō)，都要寬數(shù)倍，這也是迄今為止在商業(yè)GPU設(shè)計(jì)中最寬的SIMD方案。從技術(shù)角度來(lái)說(shuō)，為了更高的效率，人們一般會(huì)選擇一個(gè)合適的SIMD寬度并匹配相應(yīng)的控制單元。更寬的SIMD雖然能夠在一個(gè)周期內(nèi)處理更多的數(shù)據(jù)，但是如何將更多的線程有效的捆綁在一起，并使得所有計(jì)算單元保持忙碌狀態(tài)，是其中的難點(diǎn)所在。為了解決這個(gè)難題，A系列的設(shè)計(jì)也做了相應(yīng)的更改，對(duì)ISA和ALU做出了極大的簡(jiǎn)化。

和Rogue架構(gòu)相比，新的A系列將執(zhí)行單元從兩個(gè)MADD乘加單元簡(jiǎn)化為僅有一個(gè)MADD單元。在之前的第八代架構(gòu)和第九代Furian架構(gòu)中，這樣的設(shè)計(jì)也曾出現(xiàn)過(guò)，但當(dāng)時(shí)Imagination在MADD單元邊還保留了一個(gè)輔助的MUL單元，不過(guò)在新的A系列架構(gòu)上，MUL單元都已經(jīng)被精簡(jiǎn)掉了o

Imagination給出了進(jìn)入MADD單元的三個(gè)箭頭，代表了用于存儲(chǔ)操作數(shù)據(jù)的三個(gè)寄存器源，其中2個(gè)用于乘法，1個(gè)用于加法，和之前的Furian架構(gòu)的MADD單元的ISA相比，新的A系列加入了一個(gè)額外的乘法寄存器源。

實(shí)際上，Imagination新的架構(gòu)，是從面向指令集并行的ILP架構(gòu)的設(shè)計(jì)轉(zhuǎn)向了最大化線程級(jí)并行TLP架構(gòu)的設(shè)計(jì)，并且付出了巨大的努力。在這方面，AMD在從之前的4D架構(gòu)轉(zhuǎn)向GCN架構(gòu)時(shí)曾做過(guò)類似的工作，當(dāng)時(shí)AMD從ILP的繁重設(shè)計(jì)中過(guò)渡到GCN這類幾乎完全受到TLP約束的架構(gòu)，并得到了性能的大幅度提升。

根據(jù)一些消息，由于簡(jiǎn)化了指令和相關(guān)執(zhí)行部分，轉(zhuǎn)向“大規(guī)?！盩LP架構(gòu)帶來(lái)的更高的ALU利用率，大幅度提高了芯片中ALU的實(shí)際占比密度，同樣也帶來(lái)了每平方毫米性能的提升。自然的，相對(duì)應(yīng)的是芯片面積的降低和消除冗余晶體管等，這都帶來(lái)了功率效能的提高。

進(jìn)一步深入的話，在著色器方面A系列GPU也有頗多創(chuàng)新。Imagination還給出了一些資料用于介紹整個(gè)A系列著色器的工作流程。這些資料顯示，在一個(gè)典型的著色器工作流程中，從根據(jù)內(nèi)存中的命令隊(duì)列啟動(dòng)的數(shù)據(jù)主機(jī)開始，3D數(shù)據(jù)母版開始預(yù)處理其它的固定功能，然后觸發(fā)著色器程序執(zhí)行隱藏表面的移除和工作量生成。接下來(lái)GPU將會(huì)把一些三角形組合在一起成為一組任務(wù)，以便更好地填充波前陣列所需要的128寬度以及更好地利用ALU。

另外，可編程數(shù)據(jù)定序器也就是PDS擁有資源和管理器的分配的功能。PDS可以為工作負(fù)載保留本地寄存器空間，并且在任務(wù)分配給線程時(shí)管理任務(wù)。PDS能夠?qū)⒓磳⒌絹?lái)的線程進(jìn)行數(shù)據(jù)預(yù)取或者預(yù)加載至本地內(nèi)存，一旦線程數(shù)據(jù)可用，它就開始標(biāo)記活動(dòng)槽，并由指令調(diào)度程序和解碼器將活動(dòng)槽進(jìn)行分派并解碼，再送入執(zhí)行單元。

除了之前介紹的主ALU外，A系列架構(gòu)還擁有輔助ALU。尤其值得注意的是，Imagination在設(shè)計(jì)中為整數(shù)和按位運(yùn)算等功能設(shè)計(jì)了單獨(dú)的執(zhí)行單元，這些單元雖然在執(zhí)行上是分開的，但是和浮點(diǎn)單元共享相同的數(shù)據(jù)路徑，因此會(huì)和浮點(diǎn)單元以排他的方式運(yùn)作，也就是要么使用這個(gè)要么使用那個(gè)。這些整數(shù)單元的作用是提高AI計(jì)算效能，并且具有四倍速率的INT8吞吐能力。在速度上，輔助ALU管道以1/4的速度運(yùn)行，因此每個(gè)周期并行執(zhí)行32個(gè)線程。從某種意義上講，Imagination的這種設(shè)計(jì)和ARM在Mali-G76、Mali-G77上的整數(shù)乘積指令NN的功能非常相似。不過(guò)Imagination沒有詳細(xì)說(shuō)明這種設(shè)計(jì)可行性。

此外，一些更復(fù)雜指令也可以在專用的單元上獲得較好的執(zhí)行效果，比如數(shù)據(jù)移動(dòng)、數(shù)據(jù)轉(zhuǎn)換、迭代器、原子操作等。

固定功能的更改和GPU的可伸縮性

在更高的層級(jí)，可以看到A系列GPU設(shè)計(jì)的架構(gòu)總圖。從圖中可以看出，A系列GPU在架構(gòu)布局上和之前的PowerVR GPU相似度很高。圖中顯示ALU依1日占據(jù)最大一部分面積，被稱為usc也就是unified shading cluster也就是統(tǒng)一渲染簇。usc以及各種其他固定功能塊又容納在SPU或者著色器處理單元中，通常被稱之為“核心”。

每個(gè)SPU在當(dāng)前的配置中包含2個(gè)USC，這意味著最終一個(gè)SPU中將有2個(gè)1 28寬度的ALU集群。所有的AXT配置都是這樣的。但是，更低端一些的AXM-8-256單元只有一個(gè)USC，是其中的例外。實(shí)際上，AXT-16-512是帶有完整SPU的最小配置方案了。

每個(gè)SPU都擁有自己的幾何流水線以及最多2個(gè)紋理處理單元。A系列繼承了Fu rian架構(gòu)的TPU的吞吐量設(shè)計(jì)，這意味著每個(gè)該模塊的每個(gè)時(shí)鐘周期都能夠采樣8個(gè)雙線性濾波紋理像素。A系列現(xiàn)在每個(gè)SPU的容量增加了一倍，并且AXT型號(hào)具有2個(gè)TPU，從而使總紋理填充率達(dá)到每個(gè)SPU每個(gè)時(shí)鐘周期16個(gè)。

A系列的紋理單元微架構(gòu)也做出了重大調(diào)整。Imagination宣稱新架構(gòu)的一個(gè)重大改進(jìn)來(lái)自于LO緩存的處理和位置信息。LO緩存在紋理化工作流程中，被重新定位在處理和過(guò)濾階段之間，這樣可以使得LO緩存保留處理階段的輸出，并實(shí)現(xiàn)Imagination所謂的大量數(shù)據(jù)的復(fù)用，因?yàn)椴恍枰看味紝?duì)像素進(jìn)行重新處理。鑒于在各向異性過(guò)濾處理期間可能要對(duì)紋理采樣的次數(shù)，因此這樣做的優(yōu)勢(shì)應(yīng)該還是比較明顯的。

Imagination還談到了如何大大改善新架構(gòu)各向異性過(guò)濾的質(zhì)量。在使用傳統(tǒng)的紋理隧道的一組比較截圖中可以看出，Imagination的新的各向異性過(guò)濾更接近角度獨(dú)立，這也是ANISO過(guò)濾的理想結(jié)果，反之則是角度依賴的過(guò)濾。有趣的是，Imagination聲稱即使使用更少的樣本也可以實(shí)現(xiàn)這種改進(jìn)后的角度獨(dú)立性過(guò)濾，但是Imag.nation沒有說(shuō)其中具體的實(shí)現(xiàn)方法?？偟膩?lái)看，新的紋理架構(gòu)設(shè)計(jì)有助于提高計(jì)算效率和硬件密度，但是由于目前A系列和比較老的Rogue系列進(jìn)行對(duì)比，因此不是很確定A系列是否能夠相對(duì)第九代9XM依1日能夠獲得如此顯著的i生能和特性優(yōu)勢(shì)。

固定功能單元的另一個(gè)變化是像素管線。盡管從表面上看，X系列和我們之前在Furia n上看到的相比吞吐量沒有任何變化。但是實(shí)際上A系列具有2個(gè)PBE單元，每個(gè)PCE每時(shí)鐘周期可以吞吐4個(gè)像素，因此每個(gè)SPU每周期可以處理8個(gè)像素。此外，每個(gè)核心中還有更多的設(shè)計(jì)，包括前核心和后核心，因此每個(gè)周期可以處理16個(gè)像素混合，不過(guò)在1：1的像素和紋理上，只能每周期處理8 PPC。總的來(lái)看，Imagination的新設(shè)計(jì)使得紋理吞吐率提高了一倍，同時(shí)又保持了穩(wěn)定的像素吞吐率。這意味著新的A系列產(chǎn)品和其他廠商的設(shè)計(jì)保持了一致，像素和紋理填充率則維持在了1：2的水平。

在Alpha操作上，Alpha操作現(xiàn)在是在像素管線的專用硬件單元上完成的，不再使用ALU資源，通過(guò)固定功能引薦，可以改善心梗并且允許全速率的FP16操作，并且解放ALU，使其可以將計(jì)算資源用在其他更需要的地方。此外，這樣做還提高了硬件效率和芯片密度，改善了電源情況。

值得注意的是，對(duì)于AXM系列的產(chǎn)品，Imagination使用定制的固定功能單元提高面積利用率，而不是簡(jiǎn)單縮放單元。

GPU規(guī)模：進(jìn)一步擴(kuò)大

由于Imagination設(shè)計(jì)了SPU模塊，這是整個(gè)GPU中最基本的模塊，因此可以通過(guò)簡(jiǎn)單的搭載更多的SPU模塊來(lái)擴(kuò)大GPU的規(guī)模并提高性能。

Imagination給出了四款配置模式，分別使用1、2、3、4個(gè)SPU，對(duì)應(yīng)了ATX系列下的四個(gè)不同的型號(hào)。值得注意的是，AXT下SPU擴(kuò)扎的型號(hào)，其紋理、FLOPS均以16-512為倍數(shù)發(fā)生。其中32-1024的規(guī)格是比較適合高端智能手機(jī)的，48-1536可以在較低的時(shí)鐘頻率下提供較高的計(jì)算能力。而最強(qiáng)大的AXT-64-2048則是規(guī)模最大也是性能最強(qiáng)的GPU，如果有意向客戶的話，Imagination可以幫助客戶構(gòu)建這個(gè)巨大的GPU。

橫向?qū)Ρ葋?lái)看的話，AXT-16-512這種單個(gè)SPU、2個(gè)USC的配置和之前幾代類似配置相比，A系列的確存在巨大的體系結(jié)構(gòu)變化。雖然相比9系列，A系列增長(zhǎng)沒有4倍之多，但是512FLOPSXj比9XTP的240FLOPS，這也是超過(guò)2倍的性能提升。

另外值得注意的是，Imagination的A系列構(gòu)建的基礎(chǔ)模塊體積就已經(jīng)很大了。比如AXT系列的SPU要比Mali-G77大很多，后者性能僅為64FLOPS以及每周期像素填充率僅為2，因此AXT的一個(gè)SPU大概類似于Mali-G77 MP8方案。相對(duì)應(yīng)的，就每平方毫米性能和功率效率而言，幾個(gè)大核心和大量的小核心相比，總是幾個(gè)大核心更占優(yōu)勢(shì)，正如蘋果和高通的多核心設(shè)計(jì)那樣。

新的多任務(wù)和安全特性：HyperLane技術(shù)

A系列GPU的另一個(gè)特性是支持Imagination的HyperLane技術(shù)。這項(xiàng)技術(shù)的特點(diǎn)是在多任務(wù)和安全性上大大擴(kuò)展了該體系的靈活性。此外，Imagination在GPU虛擬化上也有獨(dú)特的創(chuàng)新，這使得它能夠在汽車設(shè)計(jì)等領(lǐng)域有著自己的優(yōu)勢(shì)。

HyperLane技術(shù)是虛擬化技術(shù)的擴(kuò)展，在單個(gè)GPU執(zhí)行任務(wù)時(shí)的分離能力上更勝一籌。在渲染流程中存在一些不同類型的主控制器，每種控制器都會(huì)將工作負(fù)載分配給GPU。比如幾何部分由幾何主數(shù)據(jù)處理，像素部分由3D主數(shù)據(jù)處理，2D則交給2D主數(shù)據(jù)部分，其余流程還包括計(jì)算和工作負(fù)載主數(shù)據(jù)。針對(duì)以上每個(gè)主數(shù)據(jù)，GPU各個(gè)模塊對(duì)于給定的任務(wù)都是活動(dòng)的，其他的模塊保持空閑狀況。

目前的消息顯示，在HyperLane功能的輔助下，GPU硬件能夠?qū)崿F(xiàn)完整的任務(wù)并發(fā)，多個(gè)數(shù)據(jù)主機(jī)都可以同時(shí)處于活動(dòng)狀態(tài)，因此可以跨GPU的硬件資源來(lái)動(dòng)態(tài)執(zhí)行工作任務(wù)。這使得GPU具備了多任務(wù)處理能力，可以從多達(dá)8個(gè)來(lái)源接受不同的任務(wù)提交。不僅如此，每個(gè)HyperLane都可以配置自己的虛擬內(nèi)存空間，也可以實(shí)現(xiàn)共享任意的內(nèi)存空間。在任務(wù)分配方面，既可以根據(jù)塊來(lái)分配不同的任務(wù)，也可以根據(jù)時(shí)間片來(lái)進(jìn)行HyperLane，之間的共享，還可以給與HyperLane優(yōu)先級(jí)，使得更重要的任務(wù)可以占用更多資源或者更快完成。

在安全特性方面，Imagination加入了隔離受保護(hù)的內(nèi)容和權(quán)限管理等功能，能有效保證一個(gè)設(shè)備內(nèi)部的信息安全和可靠。此外，在特色功能上還值得一提的是，Imagination在A系列產(chǎn)品上集成一個(gè)小型專用CPU（架構(gòu)可能基于RISC-V），這個(gè)CPU本來(lái)是用于處理GPU管理任務(wù)或者充當(dāng)固件處理器。一般來(lái)說(shuō)，其他的體系結(jié)構(gòu)中，GPU是受主CPU驅(qū)動(dòng)而工作的，但是A系列的這顆固件處理器甚至可以實(shí)現(xiàn)各種管理控制任務(wù)和操作處理等，包括調(diào)試GPU、數(shù)據(jù)記錄、DVFS算法等。這樣的設(shè)計(jì)還很少看到，可能在快速調(diào)試和優(yōu)化3D負(fù)載方面有比較顯著的作用。

面積性能比：持續(xù)優(yōu)化

面積性能比是SoC設(shè)計(jì)中最重要的一部分。如果能夠以更小的面積獲得更高的性能，那將顯著節(jié)約最終的生產(chǎn)成本等。Imagination帶來(lái)了一個(gè)比較有趣的對(duì)比，以驍龍855和Exynos9820為例，前者使用高通自家優(yōu)化定制的Adreno GPU，后者則使用Mali系列。一個(gè)鮮明的數(shù)據(jù)對(duì)比是，在GPU性能相當(dāng)?shù)那闆r下，通過(guò)面基性能優(yōu)化，高通使用100%的面積，完成100%的性能。但是同等性能在三星處理器上，需要184%的面積。

不過(guò)這里存在一個(gè)疑問，那就是這兩顆處理器并沒有采用完全一樣的工藝。高通采用了TSMC的7nm工藝，三星則采用了自家的8nm工藝。不過(guò)Imagination給出了另一個(gè)角度的對(duì)比，那就是都采用A系列GPU完成同樣的性能，比如都采用AXT-16-512實(shí)現(xiàn)，對(duì)比圖可以看出，A系列產(chǎn)品在同等性能下所需的芯片面積更小，其面積性能比更為出色。

當(dāng)然，客戶也可以選擇更大的AXT-32-1024來(lái)實(shí)現(xiàn)同樣的性能。但即使如此，依舊比ARM Mali系列所占面積更小，在合理的頻率下甚至能獲得75%的性能優(yōu)勢(shì)?；蛘呔S持同樣的性能，但同時(shí)將帶來(lái)極高的電源效率。

值得慶幸的是，Imagination雖然選擇了比較老的驍龍855進(jìn)行比較，但是由于其面積性能比的優(yōu)勢(shì)過(guò)于巨大，即使面對(duì)全新的驍龍865，Imagination的A系列產(chǎn)品也優(yōu)勢(shì)滿滿。當(dāng)然，目前這些數(shù)據(jù)都來(lái)自于Imagination，具體到實(shí)際產(chǎn)品上會(huì)怎么樣，還得看未來(lái)的產(chǎn)品發(fā)展。

Imagination的未來(lái)之路

Imagination帶來(lái)的全新A系列有著出色的性能，如果一切順利的話，它將給業(yè)內(nèi)帶來(lái)深遠(yuǎn)的影響。

Imagination的工作當(dāng)然不會(huì)止步于此。在發(fā)布會(huì)上，Imagination還帶來(lái)了未來(lái)的路線圖，在A系列之后，2020年Imagination將發(fā)布B系列，隨后的C系列、D系列，相比現(xiàn)在的產(chǎn)品，Imagination希望每年都帶來(lái)一些性能提升和更新，尤其是性能，Imagination希望以1.3倍或者30%的年復(fù)合增長(zhǎng)率提升，這是一個(gè)頗為龐大的目標(biāo)。

進(jìn)一步來(lái)看，Imagination的A系列將在2020年早期推向市場(chǎng)，具體產(chǎn)品可能會(huì)在2020年下半年出現(xiàn)。另外，B系列的研發(fā)也很順利，應(yīng)該在2020年夏天完成并適時(shí)發(fā)布。具體客戶方面，幾大巨頭中，目前Imagination還沒有固定的客戶資源，只有一些較小的SoC廠商，比如RockChip、紫光展銳等。至于華為等廠商，依舊存在極高的商業(yè)或者其它門檻，Imagination可能很難進(jìn)入。目前Imagination最大的勝利在于聯(lián)發(fā)科，近幾年聯(lián)發(fā)科在ARM Mali和Imagination之間搖擺，如果Imagination能夠固定下來(lái)這個(gè)大客戶那么將帶來(lái)很不錯(cuò)的市場(chǎng)期望，尤其是在聯(lián)發(fā)科努力沖刺高端市場(chǎng)的今天，Imagination出色的面積性能比將帶給聯(lián)發(fā)科更為優(yōu)秀的成本和市場(chǎng)表現(xiàn)。

長(zhǎng)遠(yuǎn)來(lái)看，隨著半導(dǎo)體工藝逐漸逼近極限，制造工藝的技術(shù)難以維持之前快速發(fā)展的態(tài)勢(shì)，這就對(duì)半導(dǎo)體架構(gòu)設(shè)計(jì)提出了更高的要求，通過(guò)更優(yōu)秀和完美的架構(gòu)設(shè)計(jì)，應(yīng)該能在一定程度上對(duì)沖工藝進(jìn)步緩慢的問題。Imagination的A系列似乎是這種變化的完美典范，相比之前的產(chǎn)品，A系列帶來(lái)了Imagination在移動(dòng)GPU上的世代跨越，如果能夠在商業(yè)實(shí)現(xiàn)上獲得成功，這將是Imagination-個(gè)難得的轉(zhuǎn)折點(diǎn)，也不枉Imagination將其視為公司發(fā)展歷史上最重要的產(chǎn)品，畢竟，這就是未來(lái)。

十五年來(lái)最強(qiáng)？解析Imagination全新A系列移動(dòng)GPU

十五年來(lái)最強(qiáng)？解析Imagination全新A系列移動(dòng)GPU