• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      十五年來(lái)最強(qiáng)?解析Imagination全新A系列移動(dòng)GPU

      2020-04-15 07:17:41張平
      微型計(jì)算機(jī) 2020年2期
      關(guān)鍵詞:紋理寬度架構(gòu)

      張平

      Imagination是業(yè)內(nèi)傳奇的GPU公司之一,從2008年開始,旗下移動(dòng)GPU產(chǎn)品在很長(zhǎng)一段時(shí)間幾乎代表了移動(dòng)SoC圖形技術(shù)的巔峰。好花不常開,好景不常在,隨著產(chǎn)業(yè)進(jìn)步、市場(chǎng)競(jìng)爭(zhēng)和變化,Imagination的產(chǎn)品逐漸在市場(chǎng)中銷聲匿跡。尤其是蘋果在2017年宣布不再使用Imagination的授權(quán)后,Imagination一落千丈,空有技術(shù)而找不到市場(chǎng),最后被中資公司股權(quán)收購(gòu)。不過(guò),近期Imagination又發(fā)布了全新的A系列移動(dòng)GPU產(chǎn)品,并且市場(chǎng)上又傳出消息稱蘋果再度和Imagination聯(lián)手移動(dòng)GPU。那么,Imagination A系列GPU究竟如何?又有哪些獨(dú)特之處呢?請(qǐng)看本文給你帶來(lái)的詳細(xì)分析。

      Imagination是GPU市場(chǎng)的“老玩家—了,在個(gè)人PC發(fā)展的初期,Imagination就曾經(jīng)和ATI、英偉達(dá)在市場(chǎng)上扳過(guò)手腕,不過(guò)由于技術(shù)路徑、市場(chǎng)策略等原因,Imagination在2000年宣布放棄了桌面市場(chǎng),全面轉(zhuǎn)向超低功耗領(lǐng)域,并終于在2006年之后的移動(dòng)計(jì)算市場(chǎng)大放異彩,借著蘋果iPhone的東風(fēng),成為移動(dòng)計(jì)算市場(chǎng)的GPU霸主之一。

      早期的移動(dòng)計(jì)算市場(chǎng)在架構(gòu)和技術(shù)路徑上的競(jìng)爭(zhēng)還是頗為激烈的,除了有Imagination、ARM這樣的巨頭外,還出現(xiàn)了Vivante這樣的小廠商提供相關(guān)GPU授權(quán),也有一些廠商嘗試自研GPU架構(gòu)或者授權(quán)GPU架構(gòu),典型的比如英偉達(dá)和AMD,都有自己的移動(dòng)GPU部門或者授權(quán)定制的產(chǎn)品。隨著市場(chǎng)的進(jìn)一步發(fā)展變化,移動(dòng)GPU市場(chǎng)基本呈現(xiàn)寡頭化的態(tài)勢(shì)。2015年,主要采用Imagination技術(shù)授權(quán)的蘋果、ARM的Mali以及高通的AdrenoGPU三足鼎立,這也是Imagination最為輝煌的時(shí)候。隨后的2017年,蘋果宣布和Imagination解約并開啟自研移動(dòng)GPU的道路,同時(shí)像高通、三星、華為等廠商要么已經(jīng)自有頂尖的移動(dòng)GPU,要么表示有自研移動(dòng)GPU的必要,這意味著移動(dòng)GPU市場(chǎng)發(fā)生了重大變化,甚至有可能回歸到之前的“戰(zhàn)亂時(shí)代”。

      全新A系列GPU:有史以來(lái)最快的GPU IP

      在這種情況下,Imagination公司發(fā)布了全新A系列移動(dòng)GPU產(chǎn)品。Imagination宣稱這次發(fā)布堪稱公司15年發(fā)展歷史上最重要的GPU產(chǎn)品和IP發(fā)布。新產(chǎn)品的定位也非常明確,扭轉(zhuǎn)Imagination在移動(dòng)GPU市場(chǎng)上份額持續(xù)損失的趨勢(shì),并且使得使用Imagination GPU IP的廠商重新占領(lǐng)移動(dòng)GPU的性能巔峰。

      A系列GPU是Imagination的第十代產(chǎn)品。在品牌使用上,Imagination將放棄之前使用多年的PowerVR,轉(zhuǎn)而使用字母和數(shù)字命名的方式。使用這種方法的原因是Imagination希望市場(chǎng)徹底改變對(duì)旗下產(chǎn)品的看法,并樹立一個(gè)全新的技術(shù)起點(diǎn)。當(dāng)然,在一些技術(shù)場(chǎng)合,Imagination可能還會(huì)使用PowerVR的名稱,尤其是其在專利的、基于圖塊的延遲渲染技術(shù)方面。新產(chǎn)品的名稱采用的是A+“系列后綴”的方式完成,比如頂級(jí)的產(chǎn)品依1日被稱為XE系列,中端和入門級(jí)依次被稱作XM、XT系列。組合起來(lái)就有AXE、AXM和AXT等多款產(chǎn)品。

      在本次發(fā)布會(huì)上,Imagination帶來(lái)了AXT、AXM和AXE系列,當(dāng)然其中的主角是AXT系列,AXM和AXE系列是進(jìn)一步精簡(jiǎn)的版本。性能方面,Imagination宣稱AXT比第九代類似定位的產(chǎn)品快2.5倍。需要注意的是,Imagination并沒有在不同代次的XT系列GPU之間進(jìn)行精確的對(duì)比,而是和“市場(chǎng)上廣泛使用的”第九代XT系列型號(hào)進(jìn)行對(duì)比。不過(guò),考慮到目前市場(chǎng)上根本沒有公開宣布的第八代和第九代8XT或者9XTP產(chǎn)品,這樣的對(duì)比顯得有些空洞,但這依1日是新品性能對(duì)比時(shí)可以選擇的唯—方法。據(jù)悉,Imagination采用的對(duì)比對(duì)象有可能是聯(lián)發(fā)科Helio P90中所采用的GM9446,這款移動(dòng)GPU架構(gòu)基于較老的Rogue,具有一定可比性。值得一提的是,在性能對(duì)比方面,Imagination希望A系列產(chǎn)品的性能、面積等參數(shù)更為透明,并且在性能基準(zhǔn)和上代產(chǎn)品對(duì)比上更為容易,供應(yīng)商都可以據(jù)此獨(dú)立驗(yàn)證和比較性能指標(biāo)。

      架構(gòu)方面,A系列架構(gòu)的改進(jìn)主要包括了GPU計(jì)算單元的重新設(shè)計(jì)和ALU架構(gòu)的大幅度調(diào)整,Imagination宣稱新的架構(gòu)帶來(lái)了4倍的性能提升、8倍的AI計(jì)算效能提升和在維持同等性能的基礎(chǔ)下?lián)碛辛?0%的功耗降低。

      本次發(fā)布會(huì)上,Imagination發(fā)布了四款新品,其中兩款型號(hào)為AXT系列,兩款為進(jìn)一步精簡(jiǎn)版本的AXM系列。在產(chǎn)品命名上,Imagination米用了非常直觀、獨(dú)特的命名方式。以本次發(fā)布的頂級(jí)產(chǎn)品AXT-64-2048為例,這個(gè)名稱意味著這款GPU在每個(gè)時(shí)鐘周期可以完成64個(gè)像素計(jì)算或者2048個(gè)FP 32的計(jì)算。因此,在1GHz的GPU頻率下,其最大計(jì)算性能為圖形2TFLOPS,AI計(jì)算采用的是INT8格式,因此其性能是FP32的圖形計(jì)算能力的4倍,為8TFLOPS,另外,整體填充速率為64 Gigatexels/s。值得注意的是,Imagination在產(chǎn)品宣傳中不再使用的Gigapixels/s的單位,轉(zhuǎn)而使用更容易理解的Gigatexel/s單位。做出這樣改動(dòng)的原因是因?yàn)椴糠钟脩魰?huì)混淆紋理圖案率的含義,因此這里改用Gigatexels/s,更為清晰且容易理解。

      除了AXT-64-2048外,Imagination還發(fā)布了AXT-32-1024、ATM-8-256、AXE-1-16等產(chǎn)品。其中AXE-1-16采用了一個(gè)單獨(dú)的自定義結(jié)構(gòu)。實(shí)際上,從命名就可以看出不同型號(hào)的產(chǎn)品的性能檔次和基本的產(chǎn)品區(qū)間了。Imagination認(rèn)為AXT-32-1024將會(huì)成為中高端移動(dòng)SoC的最佳選擇,至于性能更強(qiáng)的AXT-64-2048,則有機(jī)會(huì)出現(xiàn)在更大尺寸的設(shè)備之中。

      全新的ISA和ALU:一個(gè)更寬的GPU架構(gòu)

      在看完型號(hào)后,再來(lái)看看相關(guān)的架構(gòu)設(shè)計(jì)。和前文所說(shuō)的一樣,全新A系列GPU在架構(gòu)設(shè)計(jì)上尤其是ISA和ALU上和之前的Imagination GPU結(jié)構(gòu)存在根本的不同,并且和其他任何公開披露的GPU架構(gòu)都存在很大差異。

      全新ALU設(shè)計(jì)的關(guān)鍵點(diǎn)在于,新的架構(gòu)比之前Rogue架構(gòu)和Furian架構(gòu)的寬度更寬,每個(gè)集群的密度高達(dá)128個(gè)執(zhí)行單元,因此Imagination稱之為128寬度的架構(gòu)。

      從之前的架構(gòu)發(fā)展來(lái)看,Rogue架構(gòu)的波前陣列的寬度為32,但是單個(gè)SIMD寬度僅為16,因此Rogue需要2個(gè)周期才能完成一個(gè)32寬度的陣列的執(zhí)行。在8XT的Furian中,SIMD的寬度擴(kuò)大到了32寬,一個(gè)周期就可以完成32寬度波前數(shù)據(jù)的執(zhí)行,在9XT的架構(gòu)中,SIMD的寬度進(jìn)一步提升到了40單位。

      和其他移動(dòng)GPU橫向比較來(lái)看的話,像是ARM最新發(fā)布的架構(gòu)中,SIMD寬度也大幅度提升,從之前Mali-G72的4個(gè)單元增加到了新的G76中的2個(gè)4單元的模塊,也就是實(shí)際上8寬度的設(shè)計(jì)更新一些的Mali-G77中,SIMD計(jì)算單元的寬度被進(jìn)一步提升至16,并且ARM還涉及了與之匹配的波前陣列。除了移動(dòng)GPU之外,在桌面GPU方面,英偉達(dá)的GPU采用的一直都是32寬度的波前陣列,AMD方面則從之前4x16寬度ALU、匹配64寬度的波前陣列轉(zhuǎn)向了32寬度的SIMD和波次,AMD在此處的設(shè)計(jì)也比較靈活,當(dāng)兩個(gè)ALU集群或者CU單元聚合在一起的時(shí)候,可以執(zhí)行64寬度的波前并實(shí)現(xiàn)向后兼容。

      通過(guò)比較可以看出,Imagination的新設(shè)計(jì)相比目前所有的GPU方案來(lái)說(shuō),都要寬數(shù)倍,這也是迄今為止在商業(yè)GPU設(shè)計(jì)中最寬的SIMD方案。從技術(shù)角度來(lái)說(shuō),為了更高的效率,人們一般會(huì)選擇一個(gè)合適的SIMD寬度并匹配相應(yīng)的控制單元。更寬的SIMD雖然能夠在一個(gè)周期內(nèi)處理更多的數(shù)據(jù),但是如何將更多的線程有效的捆綁在一起,并使得所有計(jì)算單元保持忙碌狀態(tài),是其中的難點(diǎn)所在。為了解決這個(gè)難題,A系列的設(shè)計(jì)也做了相應(yīng)的更改,對(duì)ISA和ALU做出了極大的簡(jiǎn)化。

      和Rogue架構(gòu)相比,新的A系列將執(zhí)行單元從兩個(gè)MADD乘加單元簡(jiǎn)化為僅有一個(gè)MADD單元。在之前的第八代架構(gòu)和第九代Furian架構(gòu)中,這樣的設(shè)計(jì)也曾出現(xiàn)過(guò),但當(dāng)時(shí)Imagination在MADD單元邊還保留了一個(gè)輔助的MUL單元,不過(guò)在新的A系列架構(gòu)上,MUL單元都已經(jīng)被精簡(jiǎn)掉了o

      Imagination給出了進(jìn)入MADD單元的三個(gè)箭頭,代表了用于存儲(chǔ)操作數(shù)據(jù)的三個(gè)寄存器源,其中2個(gè)用于乘法,1個(gè)用于加法,和之前的Furian架構(gòu)的MADD單元的ISA相比,新的A系列加入了一個(gè)額外的乘法寄存器源。

      實(shí)際上,Imagination新的架構(gòu),是從面向指令集并行的ILP架構(gòu)的設(shè)計(jì)轉(zhuǎn)向了最大化線程級(jí)并行TLP架構(gòu)的設(shè)計(jì),并且付出了巨大的努力。在這方面,AMD在從之前的4D架構(gòu)轉(zhuǎn)向GCN架構(gòu)時(shí)曾做過(guò)類似的工作,當(dāng)時(shí)AMD從ILP的繁重設(shè)計(jì)中過(guò)渡到GCN這類幾乎完全受到TLP約束的架構(gòu),并得到了性能的大幅度提升。

      根據(jù)一些消息,由于簡(jiǎn)化了指令和相關(guān)執(zhí)行部分,轉(zhuǎn)向“大規(guī)?!盩LP架構(gòu)帶來(lái)的更高的ALU利用率,大幅度提高了芯片中ALU的實(shí)際占比密度,同樣也帶來(lái)了每平方毫米性能的提升。自然的,相對(duì)應(yīng)的是芯片面積的降低和消除冗余晶體管等,這都帶來(lái)了功率效能的提高。

      進(jìn)一步深入的話,在著色器方面A系列GPU也有頗多創(chuàng)新。Imagination還給出了一些資料用于介紹整個(gè)A系列著色器的工作流程。這些資料顯示,在一個(gè)典型的著色器工作流程中,從根據(jù)內(nèi)存中的命令隊(duì)列啟動(dòng)的數(shù)據(jù)主機(jī)開始,3D數(shù)據(jù)母版開始預(yù)處理其它的固定功能,然后觸發(fā)著色器程序執(zhí)行隱藏表面的移除和工作量生成。接下來(lái)GPU將會(huì)把一些三角形組合在一起成為一組任務(wù),以便更好地填充波前陣列所需要的128寬度以及更好地利用ALU。

      另外,可編程數(shù)據(jù)定序器也就是PDS擁有資源和管理器的分配的功能。PDS可以為工作負(fù)載保留本地寄存器空間,并且在任務(wù)分配給線程時(shí)管理任務(wù)。PDS能夠?qū)⒓磳⒌絹?lái)的線程進(jìn)行數(shù)據(jù)預(yù)取或者預(yù)加載至本地內(nèi)存,一旦線程數(shù)據(jù)可用,它就開始標(biāo)記活動(dòng)槽,并由指令調(diào)度程序和解碼器將活動(dòng)槽進(jìn)行分派并解碼,再送入執(zhí)行單元。

      除了之前介紹的主ALU外,A系列架構(gòu)還擁有輔助ALU。尤其值得注意的是,Imagination在設(shè)計(jì)中為整數(shù)和按位運(yùn)算等功能設(shè)計(jì)了單獨(dú)的執(zhí)行單元,這些單元雖然在執(zhí)行上是分開的,但是和浮點(diǎn)單元共享相同的數(shù)據(jù)路徑,因此會(huì)和浮點(diǎn)單元以排他的方式運(yùn)作,也就是要么使用這個(gè)要么使用那個(gè)。這些整數(shù)單元的作用是提高AI計(jì)算效能,并且具有四倍速率的INT8吞吐能力。在速度上,輔助ALU管道以1/4的速度運(yùn)行,因此每個(gè)周期并行執(zhí)行32個(gè)線程。從某種意義上講,Imagination的這種設(shè)計(jì)和ARM在Mali-G76、Mali-G77上的整數(shù)乘積指令NN的功能非常相似。不過(guò)Imagination沒有詳細(xì)說(shuō)明這種設(shè)計(jì)可行性。

      此外,一些更復(fù)雜指令也可以在專用的單元上獲得較好的執(zhí)行效果,比如數(shù)據(jù)移動(dòng)、數(shù)據(jù)轉(zhuǎn)換、迭代器、原子操作等。

      固定功能的更改和GPU的可伸縮性

      在更高的層級(jí),可以看到A系列GPU設(shè)計(jì)的架構(gòu)總圖。從圖中可以看出,A系列GPU在架構(gòu)布局上和之前的PowerVR GPU相似度很高。圖中顯示ALU依1日占據(jù)最大一部分面積,被稱為usc也就是unified shading cluster也就是統(tǒng)一渲染簇。usc以及各種其他固定功能塊又容納在SPU或者著色器處理單元中,通常被稱之為“核心”。

      每個(gè)SPU在當(dāng)前的配置中包含2個(gè)USC,這意味著最終一個(gè)SPU中將有2個(gè)1 28寬度的ALU集群。所有的AXT配置都是這樣的。但是,更低端一些的AXM-8-256單元只有一個(gè)USC,是其中的例外。實(shí)際上,AXT-16-512是帶有完整SPU的最小配置方案了。

      每個(gè)SPU都擁有自己的幾何流水線以及最多2個(gè)紋理處理單元。A系列繼承了Fu rian架構(gòu)的TPU的吞吐量設(shè)計(jì),這意味著每個(gè)該模塊的每個(gè)時(shí)鐘周期都能夠采樣8個(gè)雙線性濾波紋理像素。A系列現(xiàn)在每個(gè)SPU的容量增加了一倍,并且AXT型號(hào)具有2個(gè)TPU,從而使總紋理填充率達(dá)到每個(gè)SPU每個(gè)時(shí)鐘周期16個(gè)。

      A系列的紋理單元微架構(gòu)也做出了重大調(diào)整。Imagination宣稱新架構(gòu)的一個(gè)重大改進(jìn)來(lái)自于LO緩存的處理和位置信息。LO緩存在紋理化工作流程中,被重新定位在處理和過(guò)濾階段之間,這樣可以使得LO緩存保留處理階段的輸出,并實(shí)現(xiàn)Imagination所謂的大量數(shù)據(jù)的復(fù)用,因?yàn)椴恍枰看味紝?duì)像素進(jìn)行重新處理。鑒于在各向異性過(guò)濾處理期間可能要對(duì)紋理采樣的次數(shù),因此這樣做的優(yōu)勢(shì)應(yīng)該還是比較明顯的。

      Imagination還談到了如何大大改善新架構(gòu)各向異性過(guò)濾的質(zhì)量。在使用傳統(tǒng)的紋理隧道的一組比較截圖中可以看出,Imagination的新的各向異性過(guò)濾更接近角度獨(dú)立,這也是ANISO過(guò)濾的理想結(jié)果,反之則是角度依賴的過(guò)濾。有趣的是,Imagination聲稱即使使用更少的樣本也可以實(shí)現(xiàn)這種改進(jìn)后的角度獨(dú)立性過(guò)濾,但是Imag.nation沒有說(shuō)其中具體的實(shí)現(xiàn)方法??偟膩?lái)看,新的紋理架構(gòu)設(shè)計(jì)有助于提高計(jì)算效率和硬件密度,但是由于目前A系列和比較老的Rogue系列進(jìn)行對(duì)比,因此不是很確定A系列是否能夠相對(duì)第九代9XM依1日能夠獲得如此顯著的i生能和特性優(yōu)勢(shì)。

      固定功能單元的另一個(gè)變化是像素管線。盡管從表面上看,X系列和我們之前在Furia n上看到的相比吞吐量沒有任何變化。但是實(shí)際上A系列具有2個(gè)PBE單元,每個(gè)PCE每時(shí)鐘周期可以吞吐4個(gè)像素,因此每個(gè)SPU每周期可以處理8個(gè)像素。此外,每個(gè)核心中還有更多的設(shè)計(jì),包括前核心和后核心,因此每個(gè)周期可以處理16個(gè)像素混合,不過(guò)在1:1的像素和紋理上,只能每周期處理8 PPC。總的來(lái)看,Imagination的新設(shè)計(jì)使得紋理吞吐率提高了一倍,同時(shí)又保持了穩(wěn)定的像素吞吐率。這意味著新的A系列產(chǎn)品和其他廠商的設(shè)計(jì)保持了一致,像素和紋理填充率則維持在了1:2的水平。

      在Alpha操作上,Alpha操作現(xiàn)在是在像素管線的專用硬件單元上完成的,不再使用ALU資源,通過(guò)固定功能引薦,可以改善心梗并且允許全速率的FP16操作,并且解放ALU,使其可以將計(jì)算資源用在其他更需要的地方。此外,這樣做還提高了硬件效率和芯片密度,改善了電源情況。

      值得注意的是,對(duì)于AXM系列的產(chǎn)品,Imagination使用定制的固定功能單元提高面積利用率,而不是簡(jiǎn)單縮放單元。

      GPU規(guī)模:進(jìn)一步擴(kuò)大

      由于Imagination設(shè)計(jì)了SPU模塊,這是整個(gè)GPU中最基本的模塊,因此可以通過(guò)簡(jiǎn)單的搭載更多的SPU模塊來(lái)擴(kuò)大GPU的規(guī)模并提高性能。

      Imagination給出了四款配置模式,分別使用1、2、3、4個(gè)SPU,對(duì)應(yīng)了ATX系列下的四個(gè)不同的型號(hào)。值得注意的是,AXT下SPU擴(kuò)扎的型號(hào),其紋理、FLOPS均以16-512為倍數(shù)發(fā)生。其中32-1024的規(guī)格是比較適合高端智能手機(jī)的,48-1536可以在較低的時(shí)鐘頻率下提供較高的計(jì)算能力。而最強(qiáng)大的AXT-64-2048則是規(guī)模最大也是性能最強(qiáng)的GPU,如果有意向客戶的話,Imagination可以幫助客戶構(gòu)建這個(gè)巨大的GPU。

      橫向?qū)Ρ葋?lái)看的話,AXT-16-512這種單個(gè)SPU、2個(gè)USC的配置和之前幾代類似配置相比,A系列的確存在巨大的體系結(jié)構(gòu)變化。雖然相比9系列,A系列增長(zhǎng)沒有4倍之多,但是512FLOPSXj比9XTP的240FLOPS,這也是超過(guò)2倍的性能提升。

      另外值得注意的是,Imagination的A系列構(gòu)建的基礎(chǔ)模塊體積就已經(jīng)很大了。比如AXT系列的SPU要比Mali-G77大很多,后者性能僅為64FLOPS以及每周期像素填充率僅為2,因此AXT的一個(gè)SPU大概類似于Mali-G77 MP8方案。相對(duì)應(yīng)的,就每平方毫米性能和功率效率而言,幾個(gè)大核心和大量的小核心相比,總是幾個(gè)大核心更占優(yōu)勢(shì),正如蘋果和高通的多核心設(shè)計(jì)那樣。

      新的多任務(wù)和安全特性:HyperLane技術(shù)

      A系列GPU的另一個(gè)特性是支持Imagination的HyperLane技術(shù)。這項(xiàng)技術(shù)的特點(diǎn)是在多任務(wù)和安全性上大大擴(kuò)展了該體系的靈活性。此外,Imagination在GPU虛擬化上也有獨(dú)特的創(chuàng)新,這使得它能夠在汽車設(shè)計(jì)等領(lǐng)域有著自己的優(yōu)勢(shì)。

      HyperLane技術(shù)是虛擬化技術(shù)的擴(kuò)展,在單個(gè)GPU執(zhí)行任務(wù)時(shí)的分離能力上更勝一籌。在渲染流程中存在一些不同類型的主控制器,每種控制器都會(huì)將工作負(fù)載分配給GPU。比如幾何部分由幾何主數(shù)據(jù)處理,像素部分由3D主數(shù)據(jù)處理,2D則交給2D主數(shù)據(jù)部分,其余流程還包括計(jì)算和工作負(fù)載主數(shù)據(jù)。針對(duì)以上每個(gè)主數(shù)據(jù),GPU各個(gè)模塊對(duì)于給定的任務(wù)都是活動(dòng)的,其他的模塊保持空閑狀況。

      目前的消息顯示,在HyperLane功能的輔助下,GPU硬件能夠?qū)崿F(xiàn)完整的任務(wù)并發(fā),多個(gè)數(shù)據(jù)主機(jī)都可以同時(shí)處于活動(dòng)狀態(tài),因此可以跨GPU的硬件資源來(lái)動(dòng)態(tài)執(zhí)行工作任務(wù)。這使得GPU具備了多任務(wù)處理能力,可以從多達(dá)8個(gè)來(lái)源接受不同的任務(wù)提交。不僅如此,每個(gè)HyperLane都可以配置自己的虛擬內(nèi)存空間,也可以實(shí)現(xiàn)共享任意的內(nèi)存空間。在任務(wù)分配方面,既可以根據(jù)塊來(lái)分配不同的任務(wù),也可以根據(jù)時(shí)間片來(lái)進(jìn)行HyperLane,之間的共享,還可以給與HyperLane優(yōu)先級(jí),使得更重要的任務(wù)可以占用更多資源或者更快完成。

      在安全特性方面,Imagination加入了隔離受保護(hù)的內(nèi)容和權(quán)限管理等功能,能有效保證一個(gè)設(shè)備內(nèi)部的信息安全和可靠。此外,在特色功能上還值得一提的是,Imagination在A系列產(chǎn)品上集成一個(gè)小型專用CPU(架構(gòu)可能基于RISC-V),這個(gè)CPU本來(lái)是用于處理GPU管理任務(wù)或者充當(dāng)固件處理器。一般來(lái)說(shuō),其他的體系結(jié)構(gòu)中,GPU是受主CPU驅(qū)動(dòng)而工作的,但是A系列的這顆固件處理器甚至可以實(shí)現(xiàn)各種管理控制任務(wù)和操作處理等,包括調(diào)試GPU、數(shù)據(jù)記錄、DVFS算法等。這樣的設(shè)計(jì)還很少看到,可能在快速調(diào)試和優(yōu)化3D負(fù)載方面有比較顯著的作用。

      面積性能比:持續(xù)優(yōu)化

      面積性能比是SoC設(shè)計(jì)中最重要的一部分。如果能夠以更小的面積獲得更高的性能,那將顯著節(jié)約最終的生產(chǎn)成本等。Imagination帶來(lái)了一個(gè)比較有趣的對(duì)比,以驍龍855和Exynos9820為例,前者使用高通自家優(yōu)化定制的Adreno GPU,后者則使用Mali系列。一個(gè)鮮明的數(shù)據(jù)對(duì)比是,在GPU性能相當(dāng)?shù)那闆r下,通過(guò)面基性能優(yōu)化,高通使用100%的面積,完成100%的性能。但是同等性能在三星處理器上,需要184%的面積。

      不過(guò)這里存在一個(gè)疑問,那就是這兩顆處理器并沒有采用完全一樣的工藝。高通采用了TSMC的7nm工藝,三星則采用了自家的8nm工藝。不過(guò)Imagination給出了另一個(gè)角度的對(duì)比,那就是都采用A系列GPU完成同樣的性能,比如都采用AXT-16-512實(shí)現(xiàn),對(duì)比圖可以看出,A系列產(chǎn)品在同等性能下所需的芯片面積更小,其面積性能比更為出色。

      當(dāng)然,客戶也可以選擇更大的AXT-32-1024來(lái)實(shí)現(xiàn)同樣的性能。但即使如此,依舊比ARM Mali系列所占面積更小,在合理的頻率下甚至能獲得75%的性能優(yōu)勢(shì)?;蛘呔S持同樣的性能,但同時(shí)將帶來(lái)極高的電源效率。

      值得慶幸的是,Imagination雖然選擇了比較老的驍龍855進(jìn)行比較,但是由于其面積性能比的優(yōu)勢(shì)過(guò)于巨大,即使面對(duì)全新的驍龍865,Imagination的A系列產(chǎn)品也優(yōu)勢(shì)滿滿。當(dāng)然,目前這些數(shù)據(jù)都來(lái)自于Imagination,具體到實(shí)際產(chǎn)品上會(huì)怎么樣,還得看未來(lái)的產(chǎn)品發(fā)展。

      Imagination的未來(lái)之路

      Imagination帶來(lái)的全新A系列有著出色的性能,如果一切順利的話,它將給業(yè)內(nèi)帶來(lái)深遠(yuǎn)的影響。

      Imagination的工作當(dāng)然不會(huì)止步于此。在發(fā)布會(huì)上,Imagination還帶來(lái)了未來(lái)的路線圖,在A系列之后,2020年Imagination將發(fā)布B系列,隨后的C系列、D系列,相比現(xiàn)在的產(chǎn)品,Imagination希望每年都帶來(lái)一些性能提升和更新,尤其是性能,Imagination希望以1.3倍或者30%的年復(fù)合增長(zhǎng)率提升,這是一個(gè)頗為龐大的目標(biāo)。

      進(jìn)一步來(lái)看,Imagination的A系列將在2020年早期推向市場(chǎng),具體產(chǎn)品可能會(huì)在2020年下半年出現(xiàn)。另外,B系列的研發(fā)也很順利,應(yīng)該在2020年夏天完成并適時(shí)發(fā)布。具體客戶方面,幾大巨頭中,目前Imagination還沒有固定的客戶資源,只有一些較小的SoC廠商,比如RockChip、紫光展銳等。至于華為等廠商,依舊存在極高的商業(yè)或者其它門檻,Imagination可能很難進(jìn)入。目前Imagination最大的勝利在于聯(lián)發(fā)科,近幾年聯(lián)發(fā)科在ARM Mali和Imagination之間搖擺,如果Imagination能夠固定下來(lái)這個(gè)大客戶那么將帶來(lái)很不錯(cuò)的市場(chǎng)期望,尤其是在聯(lián)發(fā)科努力沖刺高端市場(chǎng)的今天,Imagination出色的面積性能比將帶給聯(lián)發(fā)科更為優(yōu)秀的成本和市場(chǎng)表現(xiàn)。

      長(zhǎng)遠(yuǎn)來(lái)看,隨著半導(dǎo)體工藝逐漸逼近極限,制造工藝的技術(shù)難以維持之前快速發(fā)展的態(tài)勢(shì),這就對(duì)半導(dǎo)體架構(gòu)設(shè)計(jì)提出了更高的要求,通過(guò)更優(yōu)秀和完美的架構(gòu)設(shè)計(jì),應(yīng)該能在一定程度上對(duì)沖工藝進(jìn)步緩慢的問題。Imagination的A系列似乎是這種變化的完美典范,相比之前的產(chǎn)品,A系列帶來(lái)了Imagination在移動(dòng)GPU上的世代跨越,如果能夠在商業(yè)實(shí)現(xiàn)上獲得成功,這將是Imagination-個(gè)難得的轉(zhuǎn)折點(diǎn),也不枉Imagination將其視為公司發(fā)展歷史上最重要的產(chǎn)品,畢竟,這就是未來(lái)。

      猜你喜歡
      紋理寬度架構(gòu)
      基于FPGA的RNN硬件加速架構(gòu)
      功能架構(gòu)在電子電氣架構(gòu)開發(fā)中的應(yīng)用和實(shí)踐
      汽車工程(2021年12期)2021-03-08 02:34:30
      基于BM3D的復(fù)雜紋理區(qū)域圖像去噪
      軟件(2020年3期)2020-04-20 01:45:18
      使用紋理疊加添加藝術(shù)畫特效
      TEXTURE ON TEXTURE質(zhì)地上的紋理
      Coco薇(2017年8期)2017-08-03 15:23:38
      LSN DCI EVPN VxLAN組網(wǎng)架構(gòu)研究及實(shí)現(xiàn)
      馬屁股的寬度
      消除凹凸紋理有妙招!
      Coco薇(2015年5期)2016-03-29 23:22:15
      紅細(xì)胞分布寬度與血栓的關(guān)系
      一種基于FPGA+ARM架構(gòu)的μPMU實(shí)現(xiàn)
      岑巩县| 蛟河市| 民和| 阿图什市| 高台县| 山丹县| 万州区| 吴桥县| 得荣县| 临高县| 拜泉县| 南开区| 通江县| 奉贤区| 长治市| 邵阳市| 吉林省| 赣州市| 静海县| 栾城县| 五家渠市| 丰城市| 龙里县| 城口县| 河池市| 高陵县| 佛教| 温州市| 屯昌县| 寿光市| 长岭县| 策勒县| 平谷区| 河北区| 平武县| 廉江市| 蒙山县| 龙门县| 邮箱| 通州区| 通海县|