《微型計算機》評測室
北京時間2020年10月9日零點,本年度最受期待的一場處理器發(fā)布會:“WHERE GAMINIG BEGINIS”(游戲從這里開始)終于召開,AMD公司總裁兼CEO蘇姿豐博士正式發(fā)布了采用新一代Zen 3架構(gòu)的AMD銳龍5000系列處理器,并帶來了一系列好消息:Zen 3核心架構(gòu)的每時鐘周期指令數(shù)(IPC)性能比上一代Zen 2產(chǎn)品提升了多達19%;銳龍5000系列處理器的單線程性能得到大幅提升,銳龍5000系列處理器中的高端產(chǎn)品在游戲性能上已經(jīng)全面超越現(xiàn)在的游戲處理器旗艦:酷睿i9-10900K。
如果真如AMD所言,這可是一次堪比從“推土機”到Zen之后的又一次重大升級,畢竟盡管Zen、Zen+、Zen 2架構(gòu)的問世讓AMD處理器在總體技術(shù)水準上能與競爭對手平分秋色,但在處理器單線程性能、游戲性能上與對手相比一直略有差距,對手也總是拿這兩點來打壓AMD產(chǎn)品。那么Zen 3真能改變AMD處理器的以上不足,在單線程性能與游戲性能上形成反超嗎?AMD又是怎樣辦到的?AMD Zen 3處理器架構(gòu)有何神奇之處?
如何實現(xiàn)19%的性能提升?
AMD Zen 3處理器架構(gòu)技術(shù)設(shè)計解析
在AMD發(fā)布銳龍3000系列處理器也就是Zen 2架構(gòu)之后,就公布了有關(guān)Zen 3架構(gòu)的相關(guān)內(nèi)容。當時AMD宣稱Zen 3相比Zen 2能帶來大約15%的IPC提升。考慮到Zen 2架構(gòu)的銳龍3000系列處理器的頻率較低,因此業(yè)內(nèi)普遍估計新的Zen 3架構(gòu)應(yīng)該是基于Zen 2架構(gòu)的小改款,核心架構(gòu)改變應(yīng)該不算太多,其性能增加主要來自于緩存設(shè)計的改變和頻率提升。但是,在Zen 3架構(gòu)和相關(guān)處理器發(fā)布后,人們驚訝地發(fā)現(xiàn),Zen 3架構(gòu)是基于Zen 2架構(gòu)做出了重大架構(gòu)更新和全面優(yōu)化的處理器架構(gòu),值得深入研究。
Zen 3架構(gòu)設(shè)計一覽
從宏觀來看,Zen 3架構(gòu)采用的仍是基于SMT同步多線程技術(shù)的設(shè)計,每個核心擁有2個線程。在Zen 3上,AMD首先提到的就是全新的分支預(yù)測單元,Zen 3架構(gòu)大幅度加強了分支預(yù)測設(shè)計,并宣稱其為目前最先進的分支預(yù)測單元。緩存方面,Zen 3的一級指令緩存和一級數(shù)據(jù)緩存都采用了8路設(shè)計,容量為32KB,Op緩存部分支持4K個指令排序,二級緩存采用了數(shù)據(jù)和指令混合的方案、8路設(shè)計,容量為512KB。
前端指令解碼方面,Zen 3每周期可以執(zhí)行4個指令解碼(依舊是4發(fā)射設(shè)計)或者從Op緩存中提取8個指令——這里需要注意的是,AMD設(shè)計Op緩存的意義就在于,將之前使用過的指令結(jié)果直接存儲在Op緩存中,如果下次流水線中重新出現(xiàn)這樣的指令,那么Zen 3架構(gòu)將會直接從Op緩存中取出結(jié)果進行宏指令執(zhí)行,每次可以提取并派送8個結(jié)果??紤]到Op緩存可以存儲高達4K指令,因此有比較大的概率可以實現(xiàn)更寬的指令分派,并允許更多的指令進入后續(xù)的執(zhí)行部分,這是一個非常巧妙的方案,后文我們還有針對這部分和Zen 2架構(gòu)的對比。另外,對整數(shù)或者浮點數(shù)據(jù)而言,每周期可以分派6個宏指令或者微指令,這里Zen 3依舊采用了協(xié)處理器執(zhí)行模型,且可以分別同時執(zhí)行整數(shù)和浮點計算。
Zen 3的執(zhí)行部分也經(jīng)過了加強,現(xiàn)在Zen 3的整數(shù)執(zhí)行單元有4個整數(shù)ALU單元、1個帶分支預(yù)測的ALU單元、3個AGU單元和1個專用分支預(yù)測單元。由于有3個AGU單元,在地址計算方面,Zen 3每周期可以進行3個地址計算。浮點計算部分是Zen 3加強的重點之一,Zen 3現(xiàn)在擁有6個浮點計算單元,每周期可以執(zhí)行2個256bit的FP乘積累加運算單元(FMAC)。FMAC計算是目前最重要的浮點計算基礎(chǔ)方法之一,包括常見的卷積運算、點積運算、矩陣運算、數(shù)字濾波器運算、多項式的求值運算等都可分解為數(shù)個FMAC指令來進行求解。因此高效率、加強的FMAC單元可以有效提高處理器在這些計算中的效率。
最后則是內(nèi)存單元部分。Zen 3的內(nèi)存單元現(xiàn)在每周期可以執(zhí)行3個數(shù)據(jù)加載或者執(zhí)行1個數(shù)據(jù)加載、2個數(shù)據(jù)存儲,這樣的混合模式也提高了數(shù)據(jù)存儲效率。從Zen 3的宏觀架構(gòu)來看,AMD試圖將Zen 3優(yōu)化為一個更高效率、更低延遲和更為符合現(xiàn)代計算任務(wù)的全新綜合體,這一點在和Zen 2架構(gòu)的對比中更明顯。
對比Zen 2:19%的IPC從何而來
在之前的發(fā)布會上,AMD宣稱Zen 3相比Zen 2帶來了大約19%的IPC提升,并且給出了一些詳細的數(shù)據(jù)。這一點在本刊之前的文章中也有一些解釋,包括Gache Prefetching(緩存數(shù)據(jù)預(yù)?。┴暙I了2.7%的力量;Execution Engine(執(zhí)行引擎)的改進貢獻了3.3%;更先進的Branch Predictor(分支預(yù)測)貢獻了1.3%;Micro-op Cache(微操作緩存)的改進貢獻了2.7%;處理器采用了新的Front End前端架構(gòu),為性能提升貢獻了多達4.6%的力量;在整數(shù)運算單元上,Zen 3架構(gòu)提升了Load/Store(數(shù)據(jù)載入和存儲)帶寬,貢獻同樣高達4.6%,這些數(shù)據(jù)加起來高達19%。
不過,由于當時AMD沒有公布每個部分詳細的設(shè)計細節(jié),因此這些性能提升如何還有待探尋?,F(xiàn)在,AMD給出了整個Zen 3架構(gòu)設(shè)計的簡圖,并給出了每個部分比較重要的改進以及相對于Zen 2架構(gòu)的對比,人們終于可以一窺Zen 3內(nèi)部架構(gòu)設(shè)計的奧秘了。
從Zen 3和Zen 2的架構(gòu)簡圖來看的話,前端部分,Zen 3的最大變化在于使用了Op排序單元和分派單元2個單元替換了原有的Micro-Op排序單元。具體來看,通過L1指令緩存、分支預(yù)測、解碼、Op緩存后,Zen 2可以每周期給出4個指令或融合后的8個指令(此處AMD將其描寫為Fused Ins,但應(yīng)該還是MacroOps),Zen 3則是每周期給出4個指令或8個宏指令(此處AMD直接寫為Macro Ops)。這一部分看起來似乎沒有變化,但是AMD宣稱微操作緩存部分進行了改進,帶來了2.7%的性能提升。另外,AMD數(shù)據(jù)顯示,Zen 3相比Zen 2,在緩存數(shù)據(jù)預(yù)取和分支預(yù)測部分帶來了2.7%和1.3%的IPC提升。這部分內(nèi)容后文還有詳細解釋。
值得注意的是,Zen 3相對于Zen 2,在前端架構(gòu)設(shè)計上的重要變化在于Zen 2的指令進入了微指令排序單元(Micro-OpQueue)后,直接輸出6個微指令給執(zhí)行單元的整數(shù)或者浮點部分。但是,Zen 3經(jīng)過指令排序單元(Op Queue)和指令分派單元( Dispatch)后,每周期可以輸出6個宏指令給執(zhí)行單元的整數(shù)部分或者6個微指令給浮點單元。
在這里,AMD所定義的“宏指令”可包含多條微指令,比如1條移動到某位置的內(nèi)存數(shù)據(jù),并和另外位置的數(shù)據(jù)直接相加的指令可以使用宏指令完成,但是實際上在執(zhí)行時需要進一步解碼為多條微指令,包括定位地址、取得數(shù)據(jù)、移動數(shù)據(jù)、相加等。因此,Zen 3允許宏指令最多以每周期執(zhí)行6個的方式發(fā)送給整數(shù)執(zhí)行單元,使得前端最終輸出給整數(shù)執(zhí)行單元的實際指令吞吐量大大提升(整數(shù)執(zhí)行模塊的性能和指令并行度呈現(xiàn)高相關(guān)性,因此更多的指令有助于實現(xiàn)高效率的并行)。綜合來看,前端部分的改進是Zen 3 IPC提升的最重要部分之_,AMD數(shù)據(jù)顯示高達4.6%。
在執(zhí)行引擎的整數(shù)部分,Zen 2擁有7個整數(shù)排序單元,Zen3精簡為4個,但是每個單元的性能有所變化。后端執(zhí)行部分,Zen 2只有4個整數(shù)ALU單元和3個AGU單元,Zen 3則同樣使用了4個ALU(其中1個有分支預(yù)測功能)、3個AGU以及1個額外的分支預(yù)測單元。AMD解釋為,在執(zhí)行部分新加入分支預(yù)測單元可以提供更多的分支吞吐量,并帶來關(guān)鍵延遲的降低。
在執(zhí)行引擎的浮點部分,Zen 2架構(gòu)只有1個浮點排序單元,Zen 3架構(gòu)提升至2個。后端執(zhí)行部分,Zen 2架構(gòu)擁有2個MUL和2個ADD單元,總計4個浮點計算單元。Zen 3架構(gòu)則改為2個ADD單元不變,但是2個MUL單元同時也可以執(zhí)行FMAC計算,另外還增加了2個F21單元,主要用于將浮點數(shù)據(jù)轉(zhuǎn)換為整數(shù),其中1個用于地址計算,另1個專用于轉(zhuǎn)換計算,總共6個浮點計算單元。根據(jù)AMD公布的數(shù)據(jù),綜合了整數(shù)和浮點部分的性能提升后,新的執(zhí)行引擎架構(gòu)設(shè)計帶來了3.3%的性能增幅。
在數(shù)據(jù)存儲和讀取部分,AMD提到Zen 2每周期只能完成2次數(shù)據(jù)讀取和1次數(shù)據(jù)存儲,Zen 3將其提高為每周期3個數(shù)據(jù)讀取和2個數(shù)據(jù)存儲。AMD宣稱數(shù)據(jù)存儲和讀取部分的改進也帶來了高達4.6%的性能提升。上述所有的改進綜合起來,實現(xiàn)了前文提到的總計19%的IPC提升,值得一提的是,這個數(shù)據(jù)并不包含頻率或者其他方面的增益,是AMD采用了8核心、4GHz固定頻率的Zen 3架構(gòu)處理器對比相同配置的Zen 2架構(gòu)處理器,綜合了25個測試后得出的結(jié)果,其中最低的性能提升在9%,最高的在39%,其算數(shù)平均值是19%。AMD也給出了相關(guān)的測試對比。其中提升最大的部分依舊是1 1款游戲,包括《CS:GO》、《英雄聯(lián)盟》《絕地求生》《戰(zhàn)地4》《地鐵:最后的光芒>等,這些游戲的性能提升最低都高達20%。
從前端到后端:詳細解讀Zen 3架構(gòu)進化
在基本了解了Zen 3架構(gòu)的宏觀內(nèi)容后,AMD還給出了從前端、執(zhí)行到后端各個部分比較具體的性能提升情況。在整個指令拾取和解碼階段,AMD的設(shè)計目標是更快速的指令拾取,尤其是在面對分支預(yù)測和占據(jù)比較大空間的代碼的時候。其中分支預(yù)測器依舊是Zen 3設(shè)計的重點之一。
之前Zen 2發(fā)布時,AMD宣稱自己采用了基于神經(jīng)網(wǎng)絡(luò)的分支預(yù)測器結(jié)構(gòu),還采用了TAGE分支預(yù)測器(Tagged geometriclength predictor標記幾何長度分支預(yù)測器)的設(shè)計。從分支預(yù)測器的發(fā)展來看,這幾乎是AMD能夠使用的最先進的分支預(yù)測器了。在Zen 3上,AMD繼續(xù)使用基于TAGE架構(gòu)的分支預(yù)測器,但做出了相當多細節(jié)上的改進。比如重新分配BTB(分支目標緩沖器)以獲得更好的預(yù)測延遲。之前AMD在Zen 2架構(gòu)上加大了BTB,其LO、L1、L2 BTB分別擁有1 6個、512個和7K個條目(entry)。在Zen 3上,L1 BTB進一步提高至1024條目,L2 BTB反而降低至6.5K條目。另外,Zen 3還使用了更大的ITA(Indirect Target Array,間接目標陣列),容量提升至1.5K,之前Zen 2為1K,更大的ITA有助于降低錯誤預(yù)測率。
除了上述內(nèi)容外,AMD在Zen 3的分支預(yù)測器部分還反復(fù)提到更低的分支預(yù)測錯誤延遲和“無氣泡”模式。其中前者的改進主要來自通過前端宏指令發(fā)射的設(shè)計,這帶來了流水線級數(shù)的降低,從而間接降低了分支預(yù)測錯誤后重新填充流水線的損失。后者提及的“氣泡”,是指在現(xiàn)代超標量流水線處理器中,如果不同指令之間出現(xiàn)互相等待結(jié)果的情況,并且分支預(yù)測器又沒有給出分支預(yù)測信息的話,那么整個處理器都會停擺來等待相關(guān)指令的完成,由于這個等待周期的存在,程序員形象地稱之為“氣泡”?!皻馀荨睍硖幚砥餍阅艿娘@著降低。現(xiàn)在,AMD采用了新的“無氣泡”模式的分支預(yù)測器,會在很大程度上避免這種問題的產(chǎn)生——即使這種問題已經(jīng)非常少見了。
另外,有關(guān)L1指令緩存,AMD提高了其拾取指令的速度和利用率。在Op緩存方面,AMD進一步加強了Op緩存拾取的速度,同時還可以在Op緩存和指令緩存之間更快速地切換,這有助于提高指令讀取的效率。
執(zhí)行部分:更寬、更快
AMD在執(zhí)行部分做出的改進也非常顯著,整個執(zhí)行單元主要是效率的提升,而不是規(guī)模的擴張。先來看整數(shù)部分。AMD在Zen 3上使用了4個整數(shù)排序單元,每個整數(shù)排序單元分別擁有24個條目,4個一共96個條目。相比之下,之前Zen 2架構(gòu)擁有7個整數(shù)排序單元共計92個條目。新的Zen 3架構(gòu)稍微擴大了整數(shù)排序單元的條目數(shù)量。隨后的整數(shù)寄存器部分,Zen 3擁有1 92個條目空間,Zen 2則只有180個,也只是小幅度增加。后續(xù)執(zhí)行部分,Zen 3的整數(shù)執(zhí)行部分每周期夠執(zhí)行1 0個操作,之前的Zen 2只能執(zhí)行7個,增加了大約42%,這是增加最顯著的部分。ROB部分,Zen 3也進一步擴大至256個,之前Zen 2只有224個。
從AMD在Zen 3整數(shù)部分的設(shè)計來看,AMD沒有大規(guī)模增加計算資源,而是通過微調(diào)和對計算單元的合理設(shè)置,比如依1日采用4個ALU設(shè)計、共享ALU和AGU調(diào)度器以跨工作任務(wù)平衡負載、沒有大幅度增加寄存器端口或者旁路網(wǎng)絡(luò)輸入端口等,但是通過這些優(yōu)化尤其是執(zhí)行部分每周期可執(zhí)行操作數(shù)提升了42%,帶來了整數(shù)部分性能的進一步提升。一般來說,整數(shù)部分的性能表現(xiàn)差異主要來自指令級并行是否能夠非常好地完成,之前Zen2的表現(xiàn)非常不錯,Zen 3自然不會有太大的問題。
在浮點部分,Zen 3的設(shè)計目標是通過更低的延遲和更大的結(jié)構(gòu)來實現(xiàn)指令級并行,同時提高執(zhí)行效能。具體的改進包括增加拾取帶寬、單獨的F21以及存儲單元、更大的排序窗口、更快的4周期FMAC單元等。另外,AMD還提到Zen 3的MUL和ADD單元還可以實現(xiàn)整數(shù)文件存儲和浮點寄存器文件處理,并且這兩者是獨立運作的,有助于同時執(zhí)行不同的操作,來獲得更大的數(shù)據(jù)吞吐量。
最后再來看看讀取和存儲單元兩個部分。這個部分AMD的設(shè)計目標是提供更大的結(jié)構(gòu)和更好的預(yù)取設(shè)計,以支撐更大規(guī)模的指令集并行。鑒于此目標,AMD在這部分做出了非常重大的改進。首先是存儲排序單元從之前的48條目提升至64條目,L2DTLB則保留了2K個條目的設(shè)計,這有助于提高這部分運作的效率。在32KB、8路的L1緩存方面:緩存Ops提升至之前設(shè)計的3倍,每周期可以執(zhí)行3個操作,但是在執(zhí)行浮點操作時,每周期則只能執(zhí)行2個,執(zhí)行存儲操作時更是回落至每周期1個操作。另外,AMD為讀取和存儲單元添加了新的指令,用于高效率復(fù)制較短的字符串,還改進了跨頁面邊界的預(yù)抓取操作的速度,以及更好的針對存儲、加載轉(zhuǎn)發(fā)關(guān)系的依賴等。
通過前文的介紹,AMD在Zen 3在前端、執(zhí)行、讀取和存儲三大部分最重要的改進總結(jié)如下:
前端部分的改進包括:
2倍容量的L1 TBL,現(xiàn)在尺寸是1 024單位。
提高了分支預(yù)測單元的帶寬
分支預(yù)測單元的“無氣泡”模式
可以從錯誤預(yù)測中更快速地恢復(fù)
Op緩存更快的排序速度
更細粒度的Op緩存管道切換
執(zhí)行部分
整數(shù)部分擁有專用的分支預(yù)測和地址選擇器
整數(shù)部分擁有更大的執(zhí)行窗口(增加了32個單位)
降低了整數(shù)和浮點指令通過Ops選擇的延遲
浮點計算部分現(xiàn)在變化為6個單元
浮點部分MAC計算降低了1個周期
讀取和存儲單元
更高的讀取和存儲帶寬(分別增加了1個單位)
更為靈活的加載和存儲操作
改進的內(nèi)存依賴性檢測
LB部分的walker表從2個增加至6個
總的來看,AMD在Zen 3架構(gòu)上的改進是多方面的,這些細微的改進加起來共同帶來了整個Zen 3高達19% IPC的提升。從2017到2020,AMD通過Zen奠定的基礎(chǔ)以及Zen 2、Zen 3兩代架構(gòu)的繼續(xù)努力,終于實現(xiàn)了CPU微架構(gòu)效能的大提升,值得慶賀。
銳龍5000:全新的SoC架構(gòu)設(shè)計
在AMD的定義中,Zen 3是CPU微架構(gòu)的代號,CPU微架構(gòu)要聯(lián)合其他部分,一起組成整個銳龍5000處理器。和之前的Zen 2-樣,AMD將處理器設(shè)計為CCX、CCD、Infinity Fabric以及cIOD等多個模塊,最終實現(xiàn)的銳龍5000處理器是以SoC的形式存在的。
現(xiàn)在,1個銳龍5000處理器將包含1個或者2個CCD,搭配1個cIOD來實現(xiàn)。CCD中包含了8個CPU核心組成的CCX和一個Infinity Fabric單元。其中前者采用Zen 3架構(gòu),8核心16線程,后者則執(zhí)行總線功能,實現(xiàn)外部數(shù)據(jù)聯(lián)通。對cIOD來說,內(nèi)部同樣包含了針對CPU通訊的Infinity Fabric總線,以及內(nèi)存控制器、IOHub控制器等設(shè)備。
以AMD給出的2個CCD搭配一個cIOD的“2+1”的處理器為例,兩個CCD都可以通過Infinity Fabric總線以寫入16 Bit/周期、讀取32Bit/周期的速度和cIOD的Infinity Fabric總線連接,AMD還為cIOD的Infinity Fabric總線定義了fclk頻率。接下來,cIOD的Infinity Fabric總線又會以32Bit/周期的速度和UnifiedMemory Controller也就是統(tǒng)一內(nèi)存控制器進行連接,同時以64Bit/周期的速度和IO Hub控制器連接。其中,統(tǒng)一內(nèi)存控制器的頻率被稱為uclk, 10 Hub控制器的頻率被稱為lclk。
繼續(xù)深入每一個CCD的話,可以看出,Zen 3相對Zen 2的最大變化在于CCX采用了8核心16線程,32MB L3,之前的Zen2則是每個CCX 4核心16線程,16MB L3。AMD也特別提到,新的設(shè)計使每個核心可以訪問2倍的L3緩存,這樣做可以加速核心和緩存之間的通訊,對游戲應(yīng)用非常有益,另外還降低了訪問內(nèi)存的次數(shù)和延遲等。
更具體一些來看的話,AMD還給出了更詳細的Zen 3和CCD的緩存層次結(jié)構(gòu)介紹。首先是緩存體系,Zen 3的每核心私有512KB L2緩存,同時8個核心共享32MB L3緩存。其中,L2緩存通過加強的讀取和存儲單元實現(xiàn)了帶寬的提升(前文已有介紹),這也有助于提高數(shù)據(jù)預(yù)取性能。在緩存模式設(shè)計上,Zen 3的L2和L3緩存采用了部分非包含式,L2中只包含了有關(guān)L3指針部分的篩選和快速緩存數(shù)據(jù)的標簽信息。換句話說,L2包含了L3部分信息的“標簽”,這有助于CPU在未命中L2緩存時通過查詢L2的方式快速尋找到L3內(nèi)的信息,算是一個比較常見的優(yōu)化做法。在信息處理方面,Zen 3每核心可以處理64個未在L2中命中的信息并轉(zhuǎn)而向L3查詢,L3一次可以處理192個未命中信息,并轉(zhuǎn)向內(nèi)存查詢。
在緩存帶寬方面,核心每周期可以執(zhí)行向32KB L1指令緩存的32Bit緩存拾取,針對32KB的數(shù)據(jù)緩存模式比較復(fù)雜,其模式是前文中提到處理器對普通數(shù)據(jù)每周期可以執(zhí)行3個操作,執(zhí)行浮點操作時每周期則只能執(zhí)行2個,執(zhí)行存儲操作時更是回落至每周期1個操作,每個操作都是256bit。L1數(shù)據(jù)緩存和L1指令緩存到L2的帶寬、L2緩存到L3緩存、L3緩存到Infinity Fabric等外部設(shè)施的帶寬分別都是每周期32Bit。
另外在Zen 3的CCD中,由于32MB L3要面對8顆核心,因此受制于較大的芯片面積占比,很難使用傳統(tǒng)的類crossbar總線。如果基于L3緩存分片區(qū)通訊,并采用mesh架構(gòu)的連接方式又不太符合AMD目前介紹的情況。因此AMD在CPU核心和L3緩存的連接方面采用了常見的環(huán)形總線,也就是設(shè)計了通訊環(huán)來掛接每個CPU核心并連接至L3的各個區(qū)塊。環(huán)形總線的優(yōu)勢在于設(shè)計簡單、實現(xiàn)方便,在優(yōu)化得當?shù)那闆r下能夠帶來多核心之間數(shù)據(jù)通信、緩存信息拾取等比較高效的信息傳輸。
最后再來看看Zen 3和銳龍5000系列處理器在安全性和新指令集方面的內(nèi)容。安全性方面,由于之前包括英特爾“幽靈”和“熔斷”在內(nèi)的CPU安全漏洞接連出現(xiàn),因此現(xiàn)在人們也頗為關(guān)注處理器的安全設(shè)計。AMD在Zen和Zen 2架構(gòu)設(shè)計上引入了SME、IBC、GMET、UMIP等安全特性,并得到了市場的廣泛好評后。在Zen 3上,AMD在繼承之前的安全特性的基礎(chǔ)上,又引入了名為CET(Control-flow Enforcement Techonlogy,控制流執(zhí)行技術(shù))的新安全方案,主要用于針對ROP攻擊。在指令集方面,之前AMD在Zen和Zen 2架構(gòu)的處理器上,也添加了包括ADX、SMAP、SHA1、CLWB、QOS等指令,現(xiàn)在在Zen 3上,AMD加入了新的VAES/VPCLMULQD,正式宣布了對AV2×指令集的兼容和支持,使得處理器在運行支持AVX2指令的應(yīng)用時,效能進一步提升。
從16核心到6核心 首發(fā)產(chǎn)品有四款
第一批上市的Zen 3處理器有四款,它們是銳龍9 5950X、銳龍9 5900X、銳龍7 5800X、銳龍5 5600X。其中銳龍95950X對應(yīng)Zen 2旗艦,同樣采用16核心、32線程設(shè)計的銳龍93950X,L3緩存總?cè)萘恳彩?4MB,TDP熱設(shè)計功耗為105VV,但最高加速頻率從銳龍9 3950X的4.7GHz提升到了4.9GHz,處理器在中國區(qū)的首發(fā)價格為6049元。銳龍9 5900X則是為了取代銳龍9 3900XT、銳龍9 3900X,對標酷睿i9 -10900K的產(chǎn)品,同樣采用12核心、24線程設(shè)計,L3緩存總?cè)萘咳詾?4MB,最高加速頻率達到4.8GHz,分別比銳龍9 3900XT、銳龍93900X高了100MHz、200MHz,其中國區(qū)售價為4099元,比酷睿i9-10900K還便宜了1 00元。
至于銳龍7 5800X則是為了替換現(xiàn)在的銳龍7 3800XT、銳龍7 3800X,對標酷睿i7-10700K的產(chǎn)品。單從規(guī)格上看,它與銳龍7 3800XT幾乎完全相同,最高加速頻率同為4.7GHz,L3緩存容量為32MB,TDP均為105W。當然就像我們在前面講的那樣,它們在內(nèi)部架構(gòu)上有大的區(qū)別,銳龍7 5800X采用單CCX設(shè)計,而銳龍7 3800XT需要兩個CCX才能實現(xiàn)8核心、32MB三級緩存的規(guī)格,目前銳龍7 5800X的中國區(qū)售價為3199元。
由于定位高端,以上三款處理器上市時都不會附送散熱器,用戶可以自行為它們購買高端風冷或水冷散熱器。作為面向主流用戶的銳龍5 5600X則會向用戶附送幽靈潛行(VVraith Stealth)65VV靜音版散熱器。作為替換銳龍5 3600X、銳龍5 3600的產(chǎn)品,它也采用了6核心、12線程設(shè)計。三級緩存總?cè)萘客瑸?2MB,但最高加速頻率從銳龍5 3600XT的4.5GHz提升到了4.6GHz。其中國區(qū)售價為2129元。
最后,為了讓用戶能方便地使用Zen 3處理器,AMD表示現(xiàn)有500系芯片組主板,如X570、B550、A520等主板只需將BIOS中的AGESA(AMD Generic Encapsulated SoftwareArchitecture,AMD通用封裝軟件架構(gòu))升級到1.0.8.0,就能讓Zen 3處理器通過自檢、引導(dǎo)。當然如果想獲得更好的體驗,則需用戶將AGESA升級到1.1.0.0或更新的版本。
多核心性能沒有對手游戲性能秒掉i 9—1 0900K
16核心旗艦銳龍9 5950X首發(fā)測試
銳龍9 5950X+ROG CROSSHAIR ⅧDARK HERO主板展示
接下來,就讓我們通過實際測試來看看新一代Zen 3處理器到底具備怎樣的實力。我們首先將對本次Zen 3架構(gòu)處理器中的旗艦:銳龍9 5950×進行測試。本著“好馬配好鞍”的原則,為了充分發(fā)揮出銳龍9 5950×處理器的最大性能,本次我們特別采用了ROG專為Zen 3處理器研發(fā)的X570游戲主板:ROGGROSSHAIRⅦDARK HERO。
在ROG主板中,HERO系列產(chǎn)品的定位偏主流、更凸顯性價比一些。不過在HERO前加入DARK即“變身”為黑暗英雄后,這款主板的各個方面相對以往的ROG X570主板都有一定的升級。首先在供電電路上,這款主板采用了與CROSSHAIRⅦHERO主板相同的14+2相供電設(shè)計。其中專為處理器核心供電的14相供電是由兩顆電感、兩顆一體式MOSFET通過兩兩并聯(lián)來實現(xiàn)的。雖然在電感部分它依然使用16顆粉末化超合金電感,但CROSSHAIR V_DARK HERO的MOSFET從.CROSSHAIRⅦHERO支持60A電流的IR3555M升級為了支持90A負載的Ti德州儀器CSD95410RRB Power Stages MOSFET,這也就意味著GROSSHAIRⅦDARK HERO的1 6相供電電路在理論上最高可支持高達1440A的電流,能輕松保證銳龍9 5950X處理器的正常工作與超頻。
在設(shè)計上,CROSSHAIR V_DARK HERO同樣有很大的改變。作為“黑暗英雄”,該主板采用了全板隱身黑設(shè)計,去掉了CROSSHAIRⅦHERO主板上原有的銀色元素,并在主板芯片組的“敗家之眼”LOGO與主板I/O部分的“ROG”英文設(shè)計了多顆Aura RGB LED燈珠,令主板的外觀更加炫酷。同時主板也支持AURA SYNIC神光同步功能,可連接其他支持AURA SYNIG技術(shù)的硬件或通過可編程接口、RGB接口,連接各類二代燈帶、5050燈帶以制造更加壯觀的“光污染”。CROSSHAIRⅦDARKHERO還擁有其他×570主板所不具備的靜謐性,在以往,由于X570芯片組完全支持PCle 4.0,技術(shù)規(guī)格提升的同時功耗也增加了,因此主板廠商往往為芯片組配備—具高速風扇進行散熱,但風扇的增加卻帶來了額外的噪音。因此在CROSSHAIRⅦDARKHERO主板上,工程師為其采用了一個超大面積的鋁合金散熱片,不僅覆蓋整個主板芯片組,更將散熱片延伸占據(jù)了兩根PCle 4.0x16顯卡插槽中間的空位。這個設(shè)計思維很簡單,通過擴大散熱材料與空氣的接觸面積來提升散熱性能。而根據(jù)華碩的官方報告來看,這個設(shè)計讓他們達到了目的,CROSSHAIR V_DARK HERO主板上X570芯片組的工作溫度只比采用主動散熱的X570芯片組溫度高了2.25%,但噪音卻得到了完全消除。
值得一提的是,在網(wǎng)絡(luò)方面CROSSHAIRⅦDARK HERO主板也采用了非常極致的設(shè)計。首先在無線方面,它搭配了支持最新WiFi 6技術(shù)(802.11ax)的英特爾AX200無線模塊。其不僅支持5GHz/2.4GHz雙頻和多用戶2x2 MIMO(MU-MIMO),峰值傳輸帶寬更達到2.4Gbps,比現(xiàn)有802.11ac標準的速度提升了至少37%。有線網(wǎng)絡(luò)部分,這款主板采用了雙網(wǎng)卡設(shè)計,除了傳統(tǒng)穩(wěn)定的英特爾1211-AT干兆網(wǎng)絡(luò)芯片外,主板還板載了瑞昱RTL8125-GG 2.5G有線網(wǎng)卡,網(wǎng)速是普通干兆網(wǎng)卡的2.5倍,配合ROG最新的GAMEFIRST VI網(wǎng)游優(yōu)化工具,在開啟Gaming First Mode后,可以強制將游戲數(shù)據(jù)包排列到隊列前面而不必檢查數(shù)據(jù)包,從而有效降低網(wǎng)游延遲。
音頻方面,這款主板也配備了SUPREMEF×電競信仰音效系統(tǒng)。其核心是一顆由瑞昱特供,輸出信噪比為120dB、輸入信噪比為113dB的81220 7.1聲道Codec,并搭配一顆可推動600Q高阻抗設(shè)備,具有偵測播放設(shè)備阻抗,提供合適放大等級的耳放芯片。為了讓電競耳機擁有更好的播放效果,GROSSHAIR ⅧDARK HERO主板的前置音頻輸出則交由諧波失真僅-94dB的ESS SABRE 9023 Hyperstream DAG芯片負責,可以為玩家?guī)砀珳实亩ㄎ弧⒏鸷车膭討B(tài)效果。當然像尼吉康音頻電容、專為防爆音設(shè)計的DE-POP MOSFET,以及鍍金音頻插孔等多種高品質(zhì)元件在這款主板也得到了一一應(yīng)用。此外,該主板還支持DTS Sound Unbound音頻技術(shù),這是一種結(jié)合空間音頻與HRTF高級音效定位算法的音頻技術(shù)。它不僅可以提升游戲與電影的臨場感,還能增強玩家在游戲中聽音辨位的能力,從而在FPS射擊類游戲中更好地了解敵人的動向,先發(fā)制人。目前該技術(shù)支持《戰(zhàn)爭機器5》《無主之地3》《使命召喚:現(xiàn)代戰(zhàn)爭》《極限競速:地平線4》等12款游戲大作。
CROSSHAIR MIIDARK HERO主板產(chǎn)品規(guī)格
接口 Socket AM4
板型 ATX
內(nèi)存插槽 DDR4 x4(最高128GB DDR4 5000)
顯卡插槽
PCle 4.0 x16 xl
PCle 4.0 x8×1
PCle 4.0 x4×1
擴展接口
PCle 4.0 xl×1
PCle 4.0 x4 M.2x2
SATA 6Gbps x8
音頻芯片 ROG SupremeFX S1220 8聲道音頻芯片
網(wǎng)絡(luò)芯片
瑞昱RTL8125-CG 2.5G有線網(wǎng)卡
英特爾1211-AT千兆網(wǎng)卡
英特爾Wi-Fi 6 AX200+Bluetooth v5.0無線網(wǎng)絡(luò)模塊
背板接口 USB 3.2 Gen l+USB 3.2 Gen2 Type-A/C+RJ45+模擬音頻7.1聲道接口+S/PDIF光纖輸出+Wi-Fi天線接口
參考價格 新品待定
充分發(fā)揮Zen 3處理器最大性能還有三員大將來助力
除了GROSSHAIRⅦDARK HERO主板,為了充分發(fā)揮出銳龍9 5950X處理器的最大性能,我們還請來了三員大將進行輔助,它們是:
三星980 Pr0 1TB NVMe M.2 SSD
從Pro的后綴就可以看出,它是三星最新的旗艦級SSD,采用了三星支持PGle 4.0技術(shù)的Elpis主控。該主控采用三星自研的8nm生產(chǎn)工藝打造,支持NVMe l.3c技術(shù)標準、PCle 4.0 x4傳輸帶寬。閃存方面,這款SSD使用了三星最新的1 36層堆疊V6 TLC閃存顆粒,相對上代的92層堆疊顆粒,增加了40%的存儲密度,并減少了15%的能耗,帶來了更強的性能。其處理讀取、編程請求的響應(yīng)速度提升了10%。經(jīng)我們實測在基于銳龍9 5950×的PCle4.0平臺上,其最大連續(xù)讀寫速度突破6700MB/s,單線程隨機4KB性能突破21000 IOPS,AS SSD BENICHMARK總分達到8987分。
美商海盜船復(fù)仇者LPX DDR4 4133內(nèi)存16GB套裝
雖然低矮的外形、沒有RGB LED的設(shè)計讓這套內(nèi)存從外表看起來很主流,但在性能上它卻超過了很多高端產(chǎn)品。該內(nèi)存采用8層PCB設(shè)計,從軟件偵測來看,它使用了編號為“K4A8G085\NB-BGPB”的三星B-Die顆粒,因此其官標默認頻率就達到了DDR4 4133。值得一提的是,海盜船還隨內(nèi)存附贈了一套內(nèi)置風扇的主動式內(nèi)存散熱器,可以安裝在內(nèi)存上方,自上而下向內(nèi)存輸送強勁的風力,使內(nèi)存保持在很低的工作溫度。經(jīng)我們測試即便在DDR4 4133下通過AIDA64內(nèi)存烤機測試烤機半小時,內(nèi)存散熱片上的工作溫度也不到36℃。
恩杰NZXTKraken海妖273360mm水冷
它是恩杰NIZXT散熱器中定位高端的水冷產(chǎn)品,采用長度在390mm、厚度在28mm左右的大型冷排,可安裝三把內(nèi)置FDB液態(tài)軸承,采用倒角進氣口設(shè)計的高性能Aer P風扇,兼具靜音與散熱性能。更值得一提的是,這款產(chǎn)品還使用了由純銅打造、尺寸為79mmx79mmx52mm,提供六年質(zhì)保的Asetek第七代水泵,讓用戶能安心使用。此外,該水冷的導(dǎo)液橡膠管由細尼龍網(wǎng)套包裹,能讓產(chǎn)品更加耐用。與其他水冷產(chǎn)品最大不同是,該水冷的水冷頭還內(nèi)置了一塊24bit色彩的2.36英寸液晶屏幕,不僅可以顯示處理器的工作溫度,用戶還能加載自己的個人照片、搞笑GIF、標志性Logo,讓您的水冷在外觀上更具個性。
測試平臺
主板:ROG CROSSHAIRⅦDARK HERO主板
處理器:銳龍9 5950X、銳龍9 3950X、酷睿19-10900K
內(nèi)存:美商海盜船復(fù)仇者LPX DDR4 4133 8GBx2
硬盤:三星980 PROITB
顯卡:GeForce RTX 3090
電源:ROG THOR1200W
接下來我們搭配目前性能最強的GeForce RT×3090顯卡對銳龍9 5950X進行了測試。我們還加入了其上代產(chǎn)品,同為16核心、32線程設(shè)計的銳龍9 3950X,以及在游戲性能上表現(xiàn)突出的英特爾酷睿i9-10900K與它進行了對比測試。
大獲全勝處理器性能測試
測試點評:從實際測試來看,銳龍9 5950X的表現(xiàn)顯然令人驚喜。對銳龍9 3950X、酷睿i9-10900K形成了碾壓,其測試結(jié)果完全符合AMD IPC性能提升19%的宣傳——在PerformanceTest10.0 CPU單線程性能測試中,銳龍9 5950X領(lǐng)先銳龍9 3950X達27.4%;在CPU-Z處理器單線程性能測試中,銳龍9 5950X的分數(shù)高達689.5,領(lǐng)先酷睿i9-10900K達12.9%;在Geekbench 5處理器單核心性能測試中,銳龍9 5950X也有15.9%的優(yōu)勢。更讓人值得贊嘆的是,AMD處理器首次在Super Pi-百萬位測試中也戰(zhàn)勝了目前英特爾單線程性能最強的處理器,其運算時間比酷睿i9-10900K少了0.014秒。主要原因除了Zen 3架構(gòu)帶來的技術(shù)升級外,從我們測試觀察來看,銳龍9 5950X的單核加速頻率其實也超越了官方標準,達到了最高約5.04GHz,AMD處理器也終于進入了5GHz時代。當然,酷睿i9-10900K借助TVB加速技術(shù),其最高單核心頻率可以達到5.3GHz,但由于技術(shù)架構(gòu)不敵Zen 3,因此頻率更高的它反而無法戰(zhàn)勝銳龍9 5950X。
大幅領(lǐng)先游戲性能超強的多核心處理器
測試點評:毫無疑問,銳龍9 5950X是我們所測過的1 2核心以上處理器中,游戲性能最強的產(chǎn)品之一。它的游戲性能不僅大幅領(lǐng)先于銳龍9 3950X,更超越了之前的“游戲?qū)S锰幚砥鳌笨犷9-10900K,在1 0項測試中全勝。需要提及的是,我們的測試分辨率為1080p,并使用目前性能最強大的顯卡,可以完全排除顯卡性能瓶頸,充分體現(xiàn)不同處理器在運行游戲時的性能表現(xiàn)。而差異顯然是很大的,在《英雄聯(lián)盟》中,銳龍9 5950X的平均運行幀速比酷睿i9-10900K快了高達91.5fps;在《GS:GO》中,銳龍95950X的游戲運行幀速也比酷睿i9-10900K快了多達69.22fps;在《絕地求生:大逃殺》中的運行速度也比后者快了27.2%。兩款處理器在這三款熱門網(wǎng)游上的性能表現(xiàn)可以說是有質(zhì)的差距。而在其他游戲中,銳龍9 5900X也擁有一定的優(yōu)勢,如在《全面戰(zhàn)爭:特洛伊》中,它的運行幀速也快了多達24fps。
多核心配置優(yōu)勢凸顯處理器應(yīng)用測試
測試點評:在應(yīng)用測試中,憑借Zen 3架構(gòu)、更強的單核心性能,以及1 6核心、32線程的配置,銳龍9 5950X同樣在所有應(yīng)用測試中都獲得了優(yōu)勢明顯的勝利。如與同為1 6核心、32線程配置的銳龍9 3950X相比,它的V-RAY渲染性能、GINIEBENCH R20處理器多核心渲染性能分別提升了8.3%、14,7%,其Handbrake視頻轉(zhuǎn)碼速度提升了12.5%,7-2ip壓縮與解壓縮性能也提升了11.5%。與核心數(shù)只有1 0顆的酷睿i9-10900K舊比,它的優(yōu)勢則是壓倒性的,其V-RAY渲染性能比酷睿i9-10900K領(lǐng)先了60.8%,7-2ip壓縮與解壓縮性能的領(lǐng)先幅度則高達93.1%,甚至在依賴處理器單線程性能的PhotoShop圖片處理中,酷睿i9-10900K的處理速度也慢了近8秒,銳龍9 5950X的速度快了8.8%。
滿載功耗不升反降處理器功耗與溫度測試
測試點評:在功耗與溫度測試上,銳龍9 5950X也為我們帶來了意外的驚喜,該處理器的滿載功耗、滿載溫度均小幅低于上一代1 6核心處理器銳龍9 3950X,體現(xiàn)出更好的能耗比,其在滿載烤機狀態(tài)下的全核心頻率也有約3.9GHz,但處理器的功耗與溫度都控制得比較好。
還可提升全核心性能處理器超頻性能測試
最后我們還使用ROG CROSSHAIR、Ⅷ DARK HERO主板對銳龍9 5950X處理器進行了超頻測試。從測試來看,由于該處理器在默認設(shè)置下的最高單核心加速頻率就可以達到5.OGHz以上,但要在水冷環(huán)境下再提升到5.1GHz左右就比較困難了,所以對于這款處理器在普通散熱環(huán)境下沒必要再進行以提升頻率為主的單核心超頻。不過在全核心超頻上,它還提供了一定的空間。從測試觀察來看,這款處理器在運行CINIEBENCH R20時的全核心頻率也就在3.8GHz左右。而如果將處理器的工作電壓設(shè)置為1.36V左右,我們則可將它穩(wěn)定運行CINEBENCH R20時的全核心頻率提升到最高4.5GHz。在這個頻率下,銳龍9 5950X的CINIEBENCHR20多核心渲染性能提升到了11626pts,《魯大師》處理器性能提升到436925分,SiSoftware Sandra處理器算術(shù)性能達到683.7GOPS,較默認頻率下分別提升19.1%、15.4%、15.1%,提升還是非常顯著的。
兼具游戲性能與多核心性能的完美作品
綜合以上測試來看,得益于單核心性能的大幅提升,在游戲性能方面,銳龍9 5950X能在所有測試游戲中力壓之前的“游戲?qū)S锰幚砥鳌笨犷9-10900K,而且在《英雄聯(lián)盟》《CS:GO》《全面戰(zhàn)爭:特洛伊>等游戲中還具備很大的優(yōu)勢;在實際應(yīng)用、多核心性能上,它也將同為1 6核心、32線程的銳龍9 3950X甩在身后,在基于雙通道內(nèi)存的主流電腦平臺中,其多核心性能無人能敵,且并沒有增加處理器的功耗、溫度。毫無疑問,借助Zen 3架構(gòu)、7nm生產(chǎn)工藝,AMD最新推出的1 6核心旗艦銳龍9 5950×就是兼具游戲性能與多核心性能的完美作品。
全面領(lǐng)先銳龍9 3900XT\酷睿i 9--10900 K
12核心次旗艦銳龍9 5900X處理器首測
銳龍9 5900X+技嘉B550 AORUSMASTER主板展示
接下來我們將要測試的就是本次Zen 3處理器中的次旗艦產(chǎn)品:銳龍9 5900X處理器??紤]到銳龍9 5900×的定位為次旗艦,因此在本次測試中,我們也采用了類似定位的主板來進行測試,它就是來自技嘉的B550主板:B550 AORUS MASTER。
雖然B550芯片組的規(guī)格比X570低一些,但型號上“AORUSMASTER”的出現(xiàn)則意味著這款主板的定位偏中高端,就像銳龍95900X-般,它也是一款僅次于X570 AORUS MASTER的次旗艦。首先從做工用料上來看,B550 AORUS MASTER主板的設(shè)計就遠好于其他B550主板。該主板采用了先進的14+2相直出式供電設(shè)計,我們知道,由于大部分PWM芯片難以直接控制、管理大于1 0相的供電電路,因此主板廠商要么需要增加倍相芯片,要么需要并聯(lián)設(shè)計來實現(xiàn)等效的多相供電電路。但這些方法可能會增加工作的步驟、多余的芯片,會造成一定的損耗。因此技嘉在部分高端主板上采用了直出式數(shù)字供電。所謂直出式就是通過新型PWM芯片直接控制每相供電電路,既不需要增加額外的倍相芯片,也不需要采用并聯(lián)設(shè)計,理論上可以精準地平衡每相供電電路的負載,精確地進行電壓調(diào)節(jié),大幅提高供電效率,降低供電電路的發(fā)熱量。因此技嘉為B550 AORUS MASTER采用了具備直接支持1 6相供電能力的英飛凌XDPE132G5G PWM芯片,目前鮮有PWM芯片具有直接控制16相供電電路的能力,英飛凌XDPE132G5C是為數(shù)不多的產(chǎn)品之一。同時,技嘉還為B550 AORUS MASTER搭配了支持70A電流負載的英飛凌TDA21472-體式MOSFET、服務(wù)器級電感,日系FPCAP黑化版固態(tài)電容,并采用了8+4Pin供電接口。其內(nèi)部由實心結(jié)構(gòu)的GPU供電插針組成,相對普通供電接口內(nèi)部的空心插針,它能有效降低阻抗與發(fā)熱量。整體來說,B550 AORUS MASTER可以輕松支持對TDP為105W的銳龍95900X、銳龍9 5950X的超頻,并保持較低的工作溫度。
在PCB部分,這款主板依然延續(xù)了技嘉傳統(tǒng)的兩倍銅即現(xiàn)在所稱的2盎司純銅電路板設(shè)計,即在印刷電路的電源層與接地層采用2盎司純銅箔材質(zhì)降低PGB阻抗,提升PCB散熱性能與電源轉(zhuǎn)換效率。同時,這款主板在供電部分還搭載了內(nèi)置直觸式熱管,比傳統(tǒng)鋁擠散熱片多三倍散熱面積的Fin-Arrays堆棧式散熱鰭片。該鰭片搭配1.5mm厚的LAIRD 7.5W/mK高導(dǎo)熱系數(shù)導(dǎo)熱墊,在同樣的工作時間下,可提供比傳統(tǒng)導(dǎo)熱墊更好的散熱效果。
存儲接口方面,除了6個SATA 3.0接口外,該主板還提供了三個M.2 SSD插槽。這三個插槽的帶寬都由CPU提供,都能支持PCle 4.0 x4,擁有多達8G B/s帶寬,最高支持長度為110mm的221 10大型M.2 SSD。當然,需要注意的是,其中兩個M.2 SSD插槽的帶寬來自GPU提供給顯卡的帶寬,因此在這兩個插槽上安裝SSD的話,顯卡帶寬會降低到PCle 4.0 x8,也就是相當于PCle3.0 x16。根據(jù)我們的測試來看,這對GeForce RTX 3000系列顯卡來說,幾乎沒有明顯的性能影響。此外,這三個M.2插槽還配備了技嘉特制的M.2合金散熱裝甲,以及幫助SSD與散熱片緊密接觸的導(dǎo)熱墊,可以有效降低SSD工作溫度,避免降速。
隨著近幾年FPS游戲的強勢崛起,玩家們也逐漸意識到游戲音效的重要性,所以越來越多的玩家看重主板在音效方面的表現(xiàn),而B550 AORUS MASTER就是一款擁有出色音效的主板。其音頻系統(tǒng)以瑞昱ALC1220-VB音頻芯片為核心,同時輔以日系高品質(zhì)音頻專用電容、WIMA發(fā)燒級音頻電容。不僅如此,B550AORUS MASTER還支持DTS:X Ultra,并且通過了Hi-ResAudio認證,讓用戶不論是在使用耳機還是音箱進行游戲時,都可以感受真實再現(xiàn)、定位精準的3D音頻體驗。
在網(wǎng)絡(luò)性能方面,B550 AORUS MASTER同樣走在時代前沿。這款主板搭載了瑞昱RTL8125BG有線網(wǎng)卡,其最大理論傳輸速率達到2.5Gbps,相比普通主板的干兆有線網(wǎng)卡,前者可提供比傳統(tǒng)干兆網(wǎng)卡更高的網(wǎng)絡(luò)帶寬,并且為游戲玩家們提供更快的聯(lián)網(wǎng)體驗。隨著Wi+i 6的迅速普及,目前不少高端主板都已支持Wi-Fi 6,B550 AORUS MASTER也不例外。它搭載了英特爾Wi+i6 AX200無線網(wǎng)卡,在5GHz@160MHz頻段下的理論傳輸帶寬可提升到2.4Gbps,相對帶寬1.73Gbps的Wi+i 5有明顯提升。
當然B550 AORUS MASTER主板也不會缺少技嘉傳統(tǒng)的RGB FUSIONI炫彩魔光燈效,主板I/O裝甲處設(shè)計了多顆RGBLED,并提供了12V 5050(GRBW) 4pin、5V 3pin RGB接口,可以連接各類燈帶、RGB發(fā)光設(shè)備,并通過RGB FUSION 2.0燈效控制軟件設(shè)置為相同的模式同步發(fā)光。
接下來我們通過技嘉B550 AORUS MASTER主板,搭配目前性能最強的GeForce RTX 3090顯卡對銳龍9 5900X進行了測試。為了讓大家更直觀地認識銳龍9 5900×的性能,我們還加入了其上代產(chǎn)品,同為1 2核心、24線程設(shè)計的銳龍9 3900XT,以及價格與其接近,目前售價為41 99元的酷睿19-10900K與它進行了對比測試。
技嘉B550 AORUS MASTER主板產(chǎn)品規(guī)格
接口:Socket AM4
板型:ATX
內(nèi)存插槽:DDR4 x4(最高128GB DDR4 5200)
顯卡插槽:PCle 4.0 x16×1
擴展接口:PCle 3.0 x4 x2、PCle 3.0 xl、PCle 4.0 x4
M.2 SSD x3、SATA 6Gbps×6
音頻芯片:瑞昱ALC1220-VB 7.1聲道音頻芯片
網(wǎng)絡(luò)芯片:瑞昱RTL8125BG 2.5G有線網(wǎng)絡(luò)芯片
英特爾Wi-Fi6 AX200+藍牙5無線網(wǎng)絡(luò)模塊
背板接口:USB 3.2 Gen 2 Type-A/C+USB
2.O+RJ45+模擬音頻7.1聲道接口+HDMI+無線天線接口
參考價格:2098元
測試平臺
主板:技嘉B550 AORUS MASTERE主板
處理器:銳龍9 5900X、銳龍9 3900XT、
酷睿i9-10900K
內(nèi)存:海盜船VENGEANCE LPX DDR4 4133 8GBx2
硬盤:三星980 PROITB
顯卡:GeForce RTX 3090
電源:技嘉AORUS 850W全模組金牌電源
優(yōu)勢明顯銳龍9 5900X處理器性能測試
測試點評:從測試結(jié)果可以看到,就像銳龍9 5950X-樣,Zen 3架構(gòu)為銳龍9 5900X的處理器性能同樣帶來了很大的提升。相對于第三代銳龍?zhí)幚砥髦袉魏诵男阅茏顝姷漠a(chǎn)品:銳龍93900XT,它的單核心性能在PerformanceTest 10.0 CPU單線程性能測試中提升了多達23.4%;在CPU-Z 1.94處理器單線程性能測試中提升了19.8%。與英特爾目前單核心性能最強的產(chǎn)品酷睿i9-10900K相比,銳龍9 5900X也毫無懼色,在絕大部分測試中都獲得了勝利,如在Geekbench 5的處理器單核心性能測試中,它的性能領(lǐng)先幅度高達12%,而在多線程性能測試上,憑借更多的核心數(shù),銳龍9 5900X則實現(xiàn)了對對手的徹底碾壓。
唯一告負的是在Super Pi-百萬位測試中,銳龍9 5900X不敵酷睿i9-10900K,也不如之前測試過的銳龍9 5950X,消耗時間要稍多一點。從我們測試觀察來看,可能是為了區(qū)別定位,實測中顯示,銳龍9 5900X在單核心任務(wù)中的最高加速頻率在4.94GHz左右,雖然超出了其官方最高4.8GHz的指標,但仍比銳龍9 5950X在實測中單核最高可加速到5.04GHz,以及酷睿i9-10900K最高5.3GHz的頻率低。
壓到性的優(yōu)勢適合游戲的處理器
測試點評:在游戲玩家最關(guān)心的游戲性能測試,就如銳龍95950X,銳龍9 5900X的優(yōu)勢同樣非常明顯,在總計十款游戲性能測試中也都獲得了全勝。相比銳龍9 3900XT,單核心性能大幅提升的銳龍9 5900X優(yōu)勢很大,畢竟目前能用到處理器全部計算線程的游戲很少,尤其是在《英雄聯(lián)盟》《CS:GO》《絕地求生:大逃殺》這類熱門網(wǎng)絡(luò)游戲上,因此單核心性能就成了保證游戲性能的關(guān)鍵??梢钥吹?,銳龍9 5900X在這兩款游戲上的運行幀速分別比銳龍9 3900XT快了50.3%、41.8%、41.8%。即便與曾經(jīng)的“游戲處理器王者”酷睿i9-10900K相比,銳龍9 5900X的幀速也分別快了40.2%、21.1%、26%,優(yōu)勢非常大。同時在其他游戲中,憑借更強的單核心性能,銳龍9 5900X也有明顯的優(yōu)勢。如在《坦克世界》中,它的平均幀速領(lǐng)先酷睿i9-10900K約16fps;在《全面戰(zhàn)爭:特洛伊》中,它的游戲平均運行幀速速度領(lǐng)先酷睿i9-10900K達21.2%。毫無疑問,優(yōu)秀的單核心性能大幅提升了Zen3處理器的游戲性能,將對比處理器遠遠甩在身后。
多核心性能優(yōu)勢凸顯處理器應(yīng)用性能測試
測試點評:在實際的應(yīng)用測試中,同樣IPC性能更高的銳龍95900X優(yōu)勢明顯,在所有測試中獲得全勝。其中在CINEBENCHR20處理器多核心渲染性能測試中,它分別領(lǐng)先銳龍9 3900XT、酷睿i9-10900K達20.3%、34.5%。在實際的應(yīng)用中,由于目前大部分應(yīng)用都會調(diào)用處理器的多顆核心運算,因此在V-RAY渲染引擎測試中,銳龍9 5900X的渲染性能也大幅領(lǐng)先兩款對比產(chǎn)品,尤其是較核心數(shù)偏少的酷睿i9-10900K,其領(lǐng)先幅度更達到了36%。而在7-2ip壓縮與解壓縮性能測試中,銳龍9 5900X較酷睿i9-10900K的領(lǐng)先幅度更擴大到了驚人的63.6%。同時,在Handbrake 4K視頻轉(zhuǎn)1080p H.264視頻測試中,銳龍9 5900X的轉(zhuǎn)碼速度也比酷睿i9-10900K快了28%。同樣,在執(zhí)行依賴單核心性能,包括色彩轉(zhuǎn)換、“調(diào)色刀”、“海綿”濾鏡等15項工作的PhotoShop應(yīng)用體驗中,酷睿i9-10900K的運行速度也比銳龍95900×慢了7.5%,消耗的時間多了6.5秒。這意味著Zen 3在日常工作中也能幫您節(jié)約時間。
壓力不大功耗與溫度測試
測試點評:在功耗與溫度測試中,由于銳龍9 5900X與銳龍93900XT都采用相同的臺積電7nm工藝生產(chǎn),因此不論是功耗還是溫度,它們的表現(xiàn)都非常接近,頻率更高的銳龍9 5900X的滿載功耗與溫度要稍低一些,體現(xiàn)出更好的能耗比。值得注意的是,在同時將CPU、FPU、CACHE三部分的負載提升到最大的AIDA64處理器滿載測試中,運行1 5分鐘后,技嘉B550 AORUS MASTER主板供電部分的溫度并不高,最高溫度只有60℃左右,顯示出其1 6相直出式供電的優(yōu)異性。
處理器全核心超頻可達4.6GHz內(nèi)存頻率輕松超越DDR4 4500
最后我們還通過技嘉B550 AORUS MASTER主板對銳龍9 5900X進行了超頻測試。從超頻測試來看,在使用恩杰NIZXTKraken海妖273-體式水冷的環(huán)境下,銳龍9 5900X進行全核心超頻所能設(shè)置的最高電壓還是在1.36~1.38V左右,能通過CINEBENGH R20的全核心超頻頻率為4.6GHz。CINEBENCHR20多核心渲染測試成績從默認的8525pts提升到9080pts,SiSoftware Sandra處理器算術(shù)性能從495.33GOPS提升到526.31GOPS,超頻提升幅度分別達6.5%、6.25%。當然你也可以關(guān)閉部分核心,對銳龍9 5900X進行單核或雙核心超頻,我們在只開啟兩顆處理器核心的情況下,也可以將銳龍9 5900X的頻率輕松超頻到5.05GHz左右,令其Super Pi一百萬位運算時間縮短到7.032秒。
此外,借助技嘉B550 AORUS MASTER主板,銳龍95900X也擁有很強的內(nèi)存超頻能力,在1.5V內(nèi)存電壓,20-25-25-45延遲設(shè)置下,最高可將美商海盜船VENIGEANCE LPX DDR44133內(nèi)存超頻到DDR4 4733,在AIDA64 6.30測試中帶來接近70000M B/s的內(nèi)存讀取帶寬。
在中高端市場更具購買價值
綜合以上測試,我們認為借助Zen 3架構(gòu),19%的IPC性能提升,銳龍9 5900X完美地完成了在中高端處理器市場狙擊對手,大幅提升游戲性能的任務(wù)——在所有測試游戲中,它的游戲性能都明顯強過酷睿i9-10900K,在《英雄聯(lián)盟》《CS:GO》《絕地求生:大逃殺》這類網(wǎng)游中還具備很大的優(yōu)勢;同時單核心性能的提升,也讓它的多核心性能最終變得更強,在圖形渲染、視頻轉(zhuǎn)碼、壓縮與解壓縮等應(yīng)用與競爭對手拉開了更大的差距,甚至在依賴單核心性能的PhotoShop中,Zen 3也能獲得優(yōu)勢。價格方面,與售價仍在4199元的酷睿i9-10900K相比,它的售價更合理。對于那些需要同時獲得游戲性能、多核心性能,但預(yù)算不是太多的用戶而言,銳龍9 5900X就是比酷睿i9-10900K更合理的選擇。
不僅能超處理器,還能將Infinity Fabric頻率超上2000MHz!
Zen 3處理器+主流500系主板超頻實戰(zhàn)
七彩虹X570M GAMING FROZWN V14 主板展示
采用Zen 3架構(gòu)的AM D銳龍5000系列處理器不僅大幅提升了單核心性能,還有效提升了處理器的游戲性能、多核心性能,令銳龍5000系列成為一款兼得游戲性能與多核心性能的完美產(chǎn)品。根據(jù)AMD的官方消息,采用500系主板就能支持Zen 3處理器,那么除了功能豐富、供電豪華的中高端500系主板,定價在干元左右的主流的500系主板能否很好地支持Zen 3處理器,是否還能對它進行處理器超頻與內(nèi)存超頻呢?我們特別選用了一款來自七彩虹的X570M GAMING FROZENV14主板進行測試。
該主板采用Micro-ATX小板設(shè)計,售價僅1 099元,與不少僅部分支持PCle 4.0技術(shù)的B550主板差不多,卻板載完全支持PGle 4.0的X570主板芯片組,并提供了一個PGle 4.0 x16顯卡插槽,一個PGle 4.0 x4插槽,以及兩個支持PCle 4.0 x4標準的M.2 SSD接口、6個SATA 6Gbps接口,足以滿足主流用戶的需求。而這款主板之所以在型號上帶有“FROZEN”(寒霜)是因為整塊主板均配備了被稱為“寒霜散熱裝甲”的亮銀色鋁合金散熱模塊。
供電方面,它采用了4+2相供電設(shè)計。其中為處理器核心供電的每相供電包含有兩上兩下四顆MOSFET,兩顆電感,等效為8相供電。上橋MOSFET采用了來自萬國半導(dǎo)體的AON16414A,其內(nèi)阻值在10V電壓下低于8mQ,典型承載電流值為30A,最高可達50A。下橋MOSFET同樣來自萬國半導(dǎo)體,不過型號換為A0N6354。這款MOSFET的性能更為優(yōu)異,在10V電壓下的內(nèi)阻小于3.3mQ,最高可承載電流達80A,在100℃高溫下也能達到52A。電感部分,這款主板采用的是全封閉F.C.G鐵素體電感,可以降低電感線圈對主板其他元器件的電氣干擾。電容上,根據(jù)七彩虹提供的資料,這款主板采用的是10K黑金固態(tài)電容,可以提升主板的工作穩(wěn)定性。
在網(wǎng)絡(luò)部分,其網(wǎng)卡芯片采用了穩(wěn)定、可靠的瑞昱RTL8111H干兆網(wǎng)卡,內(nèi)置LDO低壓差線性穩(wěn)壓器,支持AGPI高級配置和電源管理接口、高級電源管理技術(shù)。同時七彩虹還為這顆網(wǎng)絡(luò)芯片配備了EMI保護罩,可有效提升網(wǎng)絡(luò)穩(wěn)定性,防止周邊電路和電磁波對網(wǎng)絡(luò)的干擾。音頻方面,這款主板則采用了支持7.1聲道輸出的瑞昱ALC 892音頻芯片,同時日系尼吉康專業(yè)音頻電容的采用,則能讓音質(zhì)更加清晰、溫暖、逼真。音頻部分還采用了LED分割線設(shè)計,可以進一步降低主板上的高頻信號噪聲干擾。
七彩虹X570M GAMING FROZEN V14產(chǎn)品規(guī)格
接口:Socket AM4
板型:Micro-ATX
內(nèi)存插槽:DDR4 x4
顯卡插槽:PCle 4.O x16×1
擴展接口:PCle 4.0 x4 xl、PCle 4.Ox4 M.2SSD×2、SATA 6Gbps×6
音頻芯片:瑞昱ALC 892 7.1聲道音頻芯片
網(wǎng)絡(luò)芯片:瑞昱RTL8111H千兆有線網(wǎng)絡(luò)芯片
背板接口:USB 3.2 Gen l Type-A/C+USB 2.O+USB 3.2
Gen 2+RJ45+模擬音頻711聲道接口+HDMI+DP+PS/2
參考價格:1099元
碾壓10900K正常發(fā)揮Zen 3處理器的最大性能
我們首先采用X570M GAMING FROZEN V14主板、GeForce RT×3090顯卡對銳龍9 5900X處理器進行了測試。值得贊嘆的是,作為主要主板廠商,七彩虹也早早為它的500系主板更新了BIOS,將AGESA(AMD通用封裝軟件架構(gòu))升級到1.1.0.0版本,使得主板可以輕松支持最新的Zen 3處理器。從默認頻率下的性能測試來看,X570M GAMING FROZENI V14主板顯然可以充分發(fā)揮出銳龍9 5900X處理器的最大性能,不論是單核心性能還是多線程性能、游戲性能,銳龍9 5900X在各項性能測試中的表現(xiàn)都遠遠超越酷睿i9-10900K,展現(xiàn)出了Zen 3架構(gòu)的技術(shù)實力。如在SiSoftware Sandra處理器算術(shù)性能測試中,銳龍95900X領(lǐng)先酷睿i9-10900K達23.2%,在《英雄聯(lián)盟》游戲性能測試中,銳龍9 5900×的平均運行幀速比酷睿i9-10900K快了高達40.5%。
只需三步主流主板可輕松提升Ze n 3處理器多核心性能
接下來,我們使用X570M GAMING FROZEN V14主板對銳龍9 5900X的超頻性能進行了測試。根據(jù)我們的多次嘗試來看,在普通散熱環(huán)境下,用戶能有效提升的是銳龍9 5900×的多核心性能,但難以大幅提升它的單核心性能。原因很簡單,銳龍95900X在默認設(shè)置下的單核心最高加速頻率就達4.9GHz左右,已經(jīng)接近單核心穩(wěn)定運行的極限(在5.05GHz左右),另外超頻時還需要關(guān)閉其他核心,才能令程序強制使用超頻后的那顆核心,因此這樣的單核心超頻實用意義不是太大,所以能有效提升多核性能的全核心超頻更具實用價值。
而在運行CINEBENGH R20這樣的渲染測試時,銳龍95900×的最高頻率在4.3GHz左右,因此進行全核心超頻的目標是必須高于4.3GHz。而經(jīng)我們的多次測試來看,在使用恩杰NIZXT Kraken海妖273 360mm水冷散熱器的環(huán)境下,X570MGAMING FROZEN V14主板最高可將銳龍9 5900X的所有核心超頻到4.6GHz,帶來明顯的多線程性能提升,其方法也非常簡單:
首先在AMD官方網(wǎng)站下載并啟動最新版本的RYZENMASTER,點擊選中“Profile 1”,再點擊右上角的“手動”,你就可以對處理器進行手動超頻了。
接下來通過RYZEN MASTER你也可以看到Zen 3處理器最大的不同之處——只有—左一右的兩個CCD大方框,也就意味著處理器內(nèi)部只有兩個CCD模塊。此時點擊CCD 0方框左側(cè)的紅色圓形標識,將其變?yōu)榫G色也就意味著你開啟了“將一個核心的頻率鏡像到所有核心”的功能,此時你只要設(shè)置一顆核心的頻率,就能同步對其他核心進行相同的設(shè)置。
最后任意設(shè)置一顆處理器核心頻率為4600即可將處理器的目標頻率設(shè)置為4.6GHz,然后進行最重要的一步,小幅提升處理器的工作電壓。銳龍9 5900X在運行CINIEBENCH R20時的處理器工作電壓在1.34—1.35V左右,要想提高頻率后繼續(xù)穩(wěn)定地運行渲染測試,需要我們將處理器工作電壓調(diào)節(jié)在1.36—1.38V這個區(qū)間。要達到這個電壓,在X570M GAMING FROZEN V14主板上,我們只需要將RYZEN MASTER的“電壓控制”數(shù)值設(shè)定為“1.29375V”即可。可能由于軟件的偵測誤差,也可能是主板處理器核心電壓存在一個小幅加壓,雖然設(shè)置的這個電壓數(shù)值低于1.3V,但處理器運行CINIEBENCH R20的實際電壓數(shù)值在1.376V左右,而這一電壓也可以保證處理器超頻后穩(wěn)定地運行各類多線程軟件,并帶來性能上的提升。如CINEBENGH R20處理器多核心渲染性能從8471pts提升到9120pts,提升幅度達7.6%。
可對lnfinity Fab rIc總線超頻內(nèi)存可輕松超頻到DDR4 4000以上
除了處理器超頻,我們發(fā)現(xiàn)X570M GAMING FROZENV14主板還具備一個非常強勁的能力,可對處理器的Infinity Fabric總線超頻,增強處理器對高頻內(nèi)存的支持能力,并減少延遲。InfinityFabric總線是銳龍?zhí)幚砥鲀?nèi)部芯片之間的互聯(lián)總線,其默認最高工作頻率一般在1800MHz左右,處理器內(nèi)部需要通過它將內(nèi)存數(shù)據(jù)傳送給處理器,因此在默認設(shè)置下,Infinity Fabric的總線時鐘頻率與內(nèi)存時鐘頻率以1:1的方式捆綁在一起。簡單來說,工作在1800MHz下的Infinity Fabric總線的等效數(shù)據(jù)傳輸帶寬與DDR43600內(nèi)存相同,但如果用戶使用頻率更高的內(nèi)存,如DDR44000,而Infinity Fabric總線頻率仍保持為1800MHz的話,那么就必須等待速度慢的Infinity Fabric總線將數(shù)據(jù)傳輸完畢后,才能進行下—次傳輸,造成額外的延遲。
而在Zen 3處理器上,AMD提升了這一代處理器的InfinityFabric總線時鐘頻率的超頻能力,在普通散熱環(huán)境下最高可以達到2000MHz,也就是說能對DDR4 4000內(nèi)存提供完美支持,不過需要主板BIOS進行相應(yīng)的更新。而在Zen 3發(fā)布之初,經(jīng)我們測試,七彩虹X570M GAMING FROZEN V14主板完美地實現(xiàn)了這個目標。超頻方法也很簡單,只需兩步:
首先根據(jù)自己所用的內(nèi)存體質(zhì),在七彩虹X570M GAMINGFROZEN V14主板BIOS中設(shè)置內(nèi)存電壓,在這里我們設(shè)置的電壓為1.5V。
接下來在RYZEN MASTER“Profile 1”選項卡中開啟手動模式的情況下點擊“內(nèi)存控制”,將“耦合模式”設(shè)置為“開”,保證內(nèi)存頻率與Infinity Fabric總線頻率可以同步超頻,接下來將內(nèi)存頻率、Infinity Fabric頻率同時從“1800”設(shè)置為“2000”,并根據(jù)自身所用內(nèi)存體質(zhì)設(shè)置各個延遲參數(shù)后,點擊應(yīng)用重啟即可。
可以看到,在七彩虹X570MGAMING FROZEN V14主板將處理器Infinity Fabric總線時鐘頻率超頻到2000MHz,與DDR4 4000同步后,處理器的內(nèi)存性能有了明顯的提升,與1800MHz下的DDR4 4000內(nèi)存相比,內(nèi)存的讀寫、復(fù)制帶寬都有明顯增長,更值得一提的是,內(nèi)存的訪問延遲從65.3ns大幅降低到55.4ns,減少了接近10ns。
當然如果您只追求內(nèi)存頻率,也可以將Infinity Fabric總線時鐘頻率固定在1800MHz,只提升內(nèi)存頻率。根據(jù)我們的測試,在使用海盜船VENGEANCE LPX DDR4 4133內(nèi)存,1.5V電壓設(shè)置,22-22-22-52延遲設(shè)置下,七彩虹×570M GAMINGFROZEN V14主板最高可將內(nèi)存頻率超頻到DDR4 4400,令內(nèi)存的讀取帶寬接近65000M B/s。
主流500系主板就能玩轉(zhuǎn)Zen 3處理器
綜合來看,采用七彩虹X570M GAMING FROZEN V14這類主流主板,我們就能很好地使用Zen 3處理器,充分發(fā)揮Zen 3處理器優(yōu)秀的單核心性能、游戲性能、多核性能。而借助RYZENMASTER超頻軟件,我們既能簡單、輕松地對Zen 3處理器進行全核心超頻,也可以對Infinity Fabric總線時鐘頻率、內(nèi)存頻率進行超頻,有效提升AMD平臺的內(nèi)存性能。因此對于預(yù)算有限的用戶而言,選擇一款像七彩虹X570M GAMING FROZEN V14這樣做工扎實、BIOS更新快的干元級主流主板就能讓您輕松玩轉(zhuǎn)大部分Zen 3處理器。