張祖強(qiáng)
今年下半年,NVIDIA和AMD在高端顯卡市場(chǎng)相繼發(fā)力,推出RTX30系列和RX6000系列顯卡。性能上的躍遷不僅給游戲玩家們帶來(lái)更流暢的游戲體驗(yàn),同時(shí)也可讓創(chuàng)意人士的工作效率得到大幅提升。此前MC為大家分享了RTX 30系列和RX 6000系列顯卡在游戲性能上的眾多對(duì)比評(píng)測(cè)文章,今天我們就將關(guān)注的焦點(diǎn)集中到它們的內(nèi)容創(chuàng)作效率上,看看對(duì)于創(chuàng)意人士來(lái)說(shuō),什么顯卡才是他們盡情揮灑創(chuàng)意的工作利器。
理論知識(shí)復(fù)習(xí)
理論與實(shí)踐相結(jié)合才是學(xué)習(xí)的正確姿勢(shì),所以在進(jìn)入測(cè)試環(huán)節(jié)之前,我們不妨先來(lái)復(fù)習(xí)一下NVIDIA GeForce RTX 30系列和AMD Radeon RX 6000系列顯卡的一些關(guān)鍵理論知識(shí)??紤]到本文的重點(diǎn)是顯卡的內(nèi)容創(chuàng)作性能,所以復(fù)習(xí)的理論知識(shí)就主要集中在這方面,對(duì)上述兩大系列顯卡的詳細(xì)技術(shù)內(nèi)容感興趣的玩家們不妨參閱MC往期的文章。
NVIDIA GeForce RTX 30系列顯卡重點(diǎn)技術(shù)解析
NVIDIA于2019年提出RTX Studio計(jì)劃,旨在憑借其傳統(tǒng)的GPU加速技術(shù)和效能,以及其基于圖靈架構(gòu)的GPU在光線追蹤和AI計(jì)算方面的優(yōu)勢(shì),為大量創(chuàng)意應(yīng)用提供顯著的性能提升,并幫助創(chuàng)作者盡情揮灑創(chuàng)意。在過(guò)去一年左右的時(shí)間里,NVIDIA傾力打造其RTX Studio生態(tài)圈,不僅推出可加速創(chuàng)作應(yīng)用性能的GPU驅(qū)動(dòng),同時(shí)還與Adobe、Blackmagic Design、CHAOSGROUP等軟件廠商合作,使目前市面上的眾多創(chuàng)作工具能夠充分利用RTX GPU的特性。那么隨著GeForce RTX 30系列顯卡上市,它們?cè)趦?nèi)容創(chuàng)作領(lǐng)域又能帶來(lái)怎樣的技術(shù)革新呢?
從NVIDIA Ampere架構(gòu)的技術(shù)特點(diǎn)來(lái)看,相比上一代顯卡,GeForce RTX 30系列顯卡在多個(gè)方面均有大幅升級(jí)和更新,例如第二代光追核心(RTCore)的性能進(jìn)行了增強(qiáng)。NVIDIA的數(shù)據(jù)表明,在Blender Cycles、Chaos V-Ray和Autodesk Arnold等諸多頂級(jí)渲染器中,第二代光追核心的性能達(dá)到圖靈架構(gòu)的兩倍左右,同時(shí)其運(yùn)動(dòng)模糊渲染效率更是達(dá)到圖靈架構(gòu)的8倍。
升級(jí)DLSS技術(shù)也是GeForce RTX 30系列顯卡在創(chuàng)作性能上的一大亮點(diǎn)。對(duì)于NVIDIA DLSS技術(shù),相信時(shí)常關(guān)注MC評(píng)測(cè)的朋友們應(yīng)該不會(huì)陌生,這種基于AI的超分辨率及游戲加速實(shí)現(xiàn)技術(shù),能夠在很大程度上提高實(shí)時(shí)光線追蹤可視化應(yīng)用程序中的幀速率。具體到應(yīng)用層面,NVIDIA DLSS能在游戲中提供優(yōu)秀畫(huà)質(zhì)表現(xiàn),有效遏制幀率下降,同時(shí)還能在支持實(shí)時(shí)光線追蹤渲染的創(chuàng)意軟件中讓渲染輸出的效率得到極大加強(qiáng)。值得一提的是,除了用于AI超分辨率的NVIDIA DLSS,全新第三代Tensor Core加速AI功能還可以用于AI增強(qiáng)的聲畫(huà)處理技術(shù)NVIDIA Broadcast應(yīng)用。NVIDIA Broadcast是NVIDIA近期推出的一個(gè)非常有趣的應(yīng)用程序,我們?cè)诒疚闹幸矔?huì)和大家分享這款軟件的使用體驗(yàn)。
除了核心方面的升級(jí),GeForce RTX 30系列的部分顯卡還搭載性能更加強(qiáng)勁的GDDR6X顯存。目前得知RTX 30系列GPU最多可提供24GB的GDDR6X顯存(已知的顯卡型號(hào)為GeForceRTX3090),在海量顯存的輔助下,對(duì)于那些需要處理復(fù)雜的3D項(xiàng)目和多應(yīng)用程序的工作流而言,有著巨大的性能提升幅度。支持AV1編解碼器和PCIe4.0也是NVIDIA Ampere架構(gòu)的兩大亮點(diǎn)。GeForce RTX 30系列顯卡搭載首款支持新AV1編解碼器的獨(dú)立GPU核心,它將使創(chuàng)作者能夠以高達(dá)8K HDR的速度播放視頻,同時(shí)使用的帶寬減少50%,并極大地減輕CPU的負(fù)擔(dān)。相比PCIe 3.0,PCIe 4.0的整體帶寬有了跨越式的激增,這使得GPU與PC其余部分之間的通信連接速度呈翻倍式增長(zhǎng),這無(wú)疑對(duì)大型超高分辨率HDR和RAW視頻的剪輯、回放或編碼輸出的GPU加速過(guò)程有著重要的正向意義。
AMD Radeon RX 6000系列顯卡重點(diǎn)技術(shù)解析
AMD Radeon RX 6000系列顯卡采用了全新的RDNA2架構(gòu),它帶來(lái)了三個(gè)方面的技術(shù)優(yōu)勢(shì),一是較其上一代產(chǎn)品更為出色的能耗比和更高的頻率,二是全新設(shè)計(jì)的無(wú)限緩存,三是大量高級(jí)技術(shù)包括硬件光線追蹤技術(shù)的支持。AMD宣稱在RDNA 2上對(duì)CU單元內(nèi)2個(gè)SIMD 32計(jì)算負(fù)荷平衡方面進(jìn)行了優(yōu)化,以提高計(jì)算效能,同時(shí)還為RDNA2架構(gòu)的CU單元加入大量電源管理方面的內(nèi)容,以盡可能提升GPU的性能功耗比。無(wú)限緩存方面,RDNA 2擁有L0、L1、L2和無(wú)限緩存(Infinity Cache)、顯存控制單元5個(gè)層級(jí),其中無(wú)限緩存是全新加入的大容量緩存,容量高達(dá)128MB。其優(yōu)勢(shì)在于可提升GPU的整體能耗比,同時(shí)還可提高GPU的數(shù)據(jù)命中率。硬件光線追蹤技術(shù)方面,RDNA2架構(gòu)的每個(gè)CU單元配備了1個(gè)光線追蹤單元,從而在硬件層面支持光線追蹤技術(shù)。不過(guò)由于AMD在硬件光線追蹤技術(shù)方面的起步較晚,所以從MC的測(cè)試成績(jī)來(lái)看,RadeonRX6000系列顯卡在光線追蹤性能上的表現(xiàn)明顯不及GeForce RTX 30系列顯卡。
性能實(shí)測(cè)
和大家一起復(fù)習(xí)了這么多理論知識(shí),下面我們正式進(jìn)入性能測(cè)試環(huán)節(jié)。本次測(cè)試我們主要想探究來(lái)自NVIDIA的GeForce RTX 3080和GeForce RTX 3070(下文簡(jiǎn)稱RTX 3080和RTX 3070),以及來(lái)自AMD的Radeon RX 6800XT和Radeon RX 6800(下文簡(jiǎn)稱RX6800XT和RX6800)在內(nèi)容創(chuàng)作性能上的表現(xiàn)。測(cè)試軟件方面,我們選擇了BlenderCycles、Blackmagic Design DaVinci Resolve和D5渲染器這三款時(shí)下非常流行的創(chuàng)作設(shè)計(jì)軟件,以及V-Ray5 Benchmark這款基準(zhǔn)測(cè)試軟件進(jìn)行考核。那么4款參測(cè)顯卡的創(chuàng)作性能究竟如何呢?我們一起來(lái)看看。
Blackmagic Design DaVinci Resolve
DaVinci Resolve是目前世界上唯一結(jié)合8KRedcode RAW源視頻生產(chǎn)和編輯創(chuàng)作解決方案的創(chuàng)作軟件工具。在本次測(cè)試中,我們使用的是DaVinci Resolve 16,并選擇了5段不同碼率的4K R3D源視頻進(jìn)行從4KRAW視頻轉(zhuǎn)為1080p網(wǎng)絡(luò)視頻格式的編碼輸出測(cè)試。對(duì)視頻剪輯工作者來(lái)說(shuō),編碼輸出是最耗時(shí)的環(huán)節(jié),誰(shuí)更有效率,誰(shuí)就能占據(jù)先機(jī)。
DaVinci Resolve 16的測(cè)試成績(jī)顯示,RTX 3080完成編碼輸出的耗時(shí)為44秒,而其競(jìng)品RX 6800XT則耗時(shí)53秒完成編碼輸出任務(wù)。此外,在RTX 3070和RX6800這兩款競(jìng)品的對(duì)比上,RTX 3070的渲染效率也明顯更高。
Blender Cycles
Blender Cycles是行業(yè)內(nèi)使用頻率非常高,同時(shí)也是廣受設(shè)計(jì)師青睞的3D渲染器,并且它還能對(duì)RTXGPU提供加速。我們?cè)诒敬螠y(cè)試中首先使用其官網(wǎng)提供的基準(zhǔn)測(cè)試—Blender Open Data,在不同模型場(chǎng)景下考察了參測(cè)顯卡的創(chuàng)作性能,同時(shí)我們還分別在“璀璨星系”“classroom”“pavillon_barcelone_v1.2”這3個(gè)測(cè)試場(chǎng)景中對(duì)比了參測(cè)顯卡的表現(xiàn)。
值得一提的是,在Blender Cycles中,RTX 3080和RTX 3070可以使用“CUDA”和“OptiX”這兩種工作模式來(lái)完成渲染任務(wù)。相信時(shí)常關(guān)注MC顯卡評(píng)測(cè)的朋友已經(jīng)對(duì)CUDA比較熟悉了,那什么是OptiX呢,MC在這里簡(jiǎn)單科普一下。OptiX可同時(shí)調(diào)用CUDA核心、RT Core和TensorCore,從而提供更快且準(zhǔn)確的光線追蹤處理效率,同時(shí)還可以提高渲染模型的質(zhì)量。因此,在Blender Cycles中,我們將在部分測(cè)試中使用“CUDA”和“Opti X”這兩種工作模式,考察RTX 3080和RTX 3070的創(chuàng)作性能。
我們首先來(lái)看看Blender Open Data的測(cè)試成績(jī)。這個(gè)基準(zhǔn)測(cè)試程序中包含多個(gè)渲染場(chǎng)景,我們不妨直接對(duì)比其總耗時(shí)??梢钥吹?,在使用OptiX進(jìn)行渲染之后,RTX 3080和RTX 3070的性能表現(xiàn)非常亮眼,它們完成所有渲染任務(wù)的耗時(shí)均不到各自競(jìng)品的一半。不僅如此,在我們單獨(dú)測(cè)試的3個(gè)場(chǎng)景中,RTX 3080和RTX 3070也分別比它們的競(jìng)品RX 6800X T和RX 6800更快完成渲染任務(wù)。特別是在“璀璨星系”這個(gè)測(cè)試場(chǎng)景中,RTX 3080和RTX 3070的渲染耗時(shí)基本在7分鐘以內(nèi),而RX 6800XT則耗時(shí)17分47秒,RX 6800的渲染耗時(shí)更是多達(dá)22分04秒。從Blender Cycles的測(cè)試成績(jī)來(lái)看,RTX 3080的渲染效率大概是RX 6800X T的3倍以上,而RTX 3070的渲染效率也達(dá)到了RX6800的3倍以上。可以說(shuō),在這一環(huán)節(jié)的測(cè)試中,NVIDIA GeForce RTX 30系顯卡展現(xiàn)出了絕對(duì)領(lǐng)先的姿態(tài)。
D5渲染器
D5是一款國(guó)產(chǎn)3D設(shè)計(jì)渲染器,它使用了大量RTX GPU的核心創(chuàng)作加速技術(shù),包括RTX實(shí)時(shí)光線追蹤、RTX全局光照和NVIDIA DLSS等。我們使用的是一段長(zhǎng)約6秒的CG動(dòng)畫(huà)模型做了渲染輸出耗時(shí)對(duì)比測(cè)試,視頻輸出分辨率為1920×1080,考慮到RTX 3080和RTX 3070支持DLSS技術(shù),該技術(shù)可大幅縮減視頻輸出的耗時(shí),所以我們將會(huì)特別測(cè)試D5渲染器開(kāi)啟DLSS功能之后,RTX 3080和RTX 3070輸出視頻的耗時(shí)。
在D5渲染器中,兩款NVIDIA GeForce RTX 30系列顯卡的優(yōu)勢(shì)仍然非常明顯。在關(guān)閉DLSS時(shí),RTX 3080的視頻輸出耗時(shí)比RX6800XT少5分鐘,RTX 3070完成視頻輸出任務(wù)的耗時(shí)更是比RX 6800少6分24秒。整體來(lái)看,在D5渲染器的渲染輸出測(cè)試中,RTX 3080和RTX 3070的渲染效率分別是RX6800XT和RX 6800的兩倍左右,優(yōu)勢(shì)非常明顯。值得注意的是,相比關(guān)閉DLSS時(shí),RTX 3080和RTX 3070在開(kāi)啟“黑科技”DLSS之后的視頻輸出耗時(shí)直接減半,同時(shí)進(jìn)一步擴(kuò)大對(duì)競(jìng)品的性能優(yōu)勢(shì)。從測(cè)試結(jié)果可以明顯看出,開(kāi)啟DLSS之后,RTX 3080及RTX 3070相對(duì)于RX 6800XT/RX 6800的領(lǐng)先優(yōu)勢(shì)擴(kuò)大到了4倍左右,十分驚人。
V-Ray 5 Benchmark
V-Ray是由CHAOSGROUP開(kāi)發(fā)的一款業(yè)界非常受歡迎的渲染插件軟件,它為建筑、汽車設(shè)計(jì)等多個(gè)領(lǐng)域的3D建模軟件提供了高質(zhì)量的圖片和動(dòng)畫(huà)渲染,同時(shí)V-Ray還提供了單獨(dú)的渲染程序,方便使用者渲染各種圖片。在評(píng)測(cè)的最后,我們使用了CHAOSGROUP推出的一款工具軟件—V-Ray 5 Benchmark想來(lái)測(cè)試四款顯卡在這一渲染插件中的應(yīng)用情況。不過(guò)遺憾的是,RX 6800X T和RX 6800并不支持這款渲染軟件Benchmark的GPU加速,所以這部分測(cè)試中我們將主要對(duì)比參測(cè)CPU(AMD銳龍95950X)、RTX 3080和RTX 3070之間的渲染性能。
為了保證測(cè)試成績(jī)的可對(duì)比性,我們?cè)赩-Ray 5 Benchmark中選擇的測(cè)試場(chǎng)景是“GPU CUDA”。從測(cè)試成績(jī)來(lái)看,RTX 3070的渲染性能是AMD銳龍9 5950X的2.1倍,RTX 3080的性能則更強(qiáng),達(dá)到AMD銳龍95950X的2.5倍之多。由此可見(jiàn),NVIDIA GeForce RTX 30系列顯卡比AMD銳龍95950X處理器更適合在V-Ray中進(jìn)行渲染任務(wù)。而對(duì)于AMD顯卡來(lái)說(shuō),由于目前不被V-Ray5支持,也就意味著與這款應(yīng)用廣泛的渲染插件失之交臂。
直播輔助功能對(duì)比
前文中我們提到,第三代Tensor Core加速AI功能還可以用于AI增強(qiáng)的聲畫(huà)處理技術(shù)NVIDIA Broadcast應(yīng)用。它是一款通用插件,可用于大多數(shù)熱門(mén)直播、語(yǔ)音聊天和視頻會(huì)議應(yīng)用程序。所有NVIDIA GeForce RTX、TITAN RTX或Quadro RTX GPU均支持此插件,并使用其專用AI處理器Tensor Core AI網(wǎng)絡(luò)與玩家的游戲一起實(shí)時(shí)運(yùn)行。目前這款軟件提供了易于使用的音頻和視頻效果,例如“降噪”“虛擬背景”和“自動(dòng)構(gòu)圖”等。NVIDIA Broadcast能讓游戲主播、游戲分享、多人連線、視頻會(huì)議等多種應(yīng)用場(chǎng)景衍生出更強(qiáng)大、更好玩的功能。相比AMD在Radeon Software中的直播輔助功能,NVIDIA Broadcast的功能更加豐富,可玩性和實(shí)用性也更高。
GeForce RTX 30系列顯卡,助你盡情揮灑創(chuàng)意
得益于強(qiáng)大的NVIDIAAmpere架構(gòu)、第二代RTCore、第三代TensorCore等諸多技術(shù)特性的支持,RTX 3080在我們本次的內(nèi)容創(chuàng)作效率測(cè)試中全面碾壓RX6800XT,特別是在V-Ray、D5渲染器和Blender的部分渲染測(cè)試中,RTX 3080的性能甚至高達(dá)RX6800XT的兩倍或更多。不僅如此,我們的測(cè)試成績(jī)也顯示,RTX 3070的綜合表現(xiàn)也領(lǐng)先RX 6800。此外從我們的測(cè)試成績(jī)也可以看到,本次測(cè)試平臺(tái)搭載的AMD銳龍95950X處理器,在V-Ray中的渲染性能也同樣不及RTX 3080和RTX 3070。因此我們認(rèn)為,相比RX6800XT、RX6800和AMD銳龍95950X,來(lái)自NVIDIA的RTX 3080和RTX 3070顯卡明顯更加適合想要提升工作效率的創(chuàng)作創(chuàng)意者們。在創(chuàng)作創(chuàng)意的工作能力上,NVIDIA
GeForce RTX 30系顯卡已經(jīng)遠(yuǎn)遠(yuǎn)地將AMD Radeon RX 6000系列顯卡甩在了身后,它理應(yīng)成為創(chuàng)作創(chuàng)意者的最佳選擇。
與此同時(shí)我們也不難發(fā)現(xiàn),NVIDIAGeForce RTX 30系列顯卡為創(chuàng)作者們提供了更強(qiáng)的CUDA核心配置、更高的光線追蹤性能、進(jìn)化的DLSS功能,再搭配上特別適配的Studio驅(qū)動(dòng)程序,以及越來(lái)越多針對(duì)RTX顯卡適配的創(chuàng)作軟件,NVIDIA Studio生態(tài)圈已經(jīng)日益龐大,這對(duì)于創(chuàng)作者來(lái)說(shuō)無(wú)疑是一個(gè)福音,同時(shí)也將把整個(gè)設(shè)計(jì)創(chuàng)作行業(yè)推向一個(gè)新的高度。而GeForce RTX 30系顯卡的面世,設(shè)計(jì)創(chuàng)作行業(yè)也必然會(huì)迎來(lái)再一次的革新,走向一個(gè)全新、自由、高效的創(chuàng)作時(shí)代。