王誠
規(guī)格方面,RTX 4070采用了和RTX 4070 Ti同樣的AD104核心,只是有些許精簡。它擁有4 組GPC、23組TPC,SM單元為46個,CUDA核心數(shù)量則為5888個。此外,紋理單元、光柵單元、RT Cores、Tensor Cores和二級緩存也對應的有所縮減,因此整體芯片的規(guī)模大約為RTX 4070 Ti 的76.7%。GPU頻率部分,RTX 4070的最高加速頻率也略低于RTX 4070Ti。不過,RTX 4070的顯存系統(tǒng)與RTX 4070 Ti是一樣的,都是12GB/192bit/GDDR6X,帶寬也同為504GB/s。
雖然和上代的兩款“70”相比,RTX 4070的GPC、TPC以及RT Cores 和Tensor Cores 并沒有數(shù)量優(yōu)勢, 但大家不要忘了它是采用的Ada Lovelace 新架構, 不但RT Cores 和Tensor Cores 全都領先一代,還采用了全新的SM 單元設計,效率方面提升非常大,而且GPU 的頻率也高出許多,因此綜合下來性能反而大幅增加。顯存規(guī)格方面也是如此,即便RTX 4070配備的是192bit 顯存位寬,但容量高達8 倍的二級緩存和更高的顯存頻率帶來了更高的數(shù)據(jù)交換效率提升,綜合下來性能反而大幅增長,由此也更加凸顯RTX 40系列高效的特性。官方給RTX4070 的性能定位是2K 分辨率下提供超100fps 的電競級高幀率游戲體驗,從硬件規(guī)格來看,RTX 4070 確實能夠擁有這樣的實力。
RTX 40系列還有一大特色就是高能效。從RTX 40開始,我們并不能簡單地以顯卡功率輸出高低來判定其性能高低,這是因為RTX 40系列大多數(shù)時候在達到功率墻之前,就已經跑在極限頻率上輸出最高性能,所以從實測數(shù)據(jù)來看,RTX 40系列的游戲功率一般都會小于官方標注的整板功率值。
表格中的數(shù)據(jù)已經顯示RTX 4070平均游戲功率只有186W,這只是RTX 3070 Ti的77.5%,因此它對電源、散熱器的要求大大降低,不但降低了玩家的裝機成本,更低的風扇噪聲也提升了使用體驗。由于功率的降低,顯卡廠商在生產RTX 4070時可以選擇使用16pin輔助供電,也可以選擇單8pin 輔助供電,這對于喜歡高性能ITX 小卡的玩家來說是個好消息。
NVIDIA 官方給RTX 4070 的定位是2K 下超過100fps 的游戲體驗,不過我們也加入了4K 下的成績,方便大家參考。綜合來看,純光柵游戲中,RTX 4070 在2K 下相對RTX 3070 Ti 的提升大約為9%~38%,平均提升幅度為19%,4K 下提升14%。和RTX 4070 Ti 相比,2K 和4K 下分別是它的81% 和80%,可以說定位非常精準。
在開啟光追后,RTX 4070 在2K 下相對于RTX 3070 Ti 提升在13%~29% 之間,平均優(yōu)勢為24%;在開啟DLSS 2 后,提升在15%~34%,平均為22%。4K 下相對于RTX 3070 Ti 的平均提升則為19%,也非常符合官方的精準定位。
DLSS 3是RTX 40系列的獨門絕技,我們也單獨進行了對比測試??傮w來看,開啟DLSS 3 后,RTX 4070確實可以實現(xiàn)“2K百幀”光追游戲體驗,可見RTX 40系列獨有的光學多幀生成技術在這里的效果顯著,相對上代RTX 30的DLSS 2優(yōu)勢非常明顯,在《賽博朋克2077》中的幀率甚至是RTX 3070 Ti開DLSS 2的2.23倍。
我們用《瘟疫傳說:安魂曲》對DLSS 3 的畫質也進行了測評。從截圖可以看到,即便是最注重幀率的DLSS 3性能模式,其畫面精度也完全不輸原生4K,而它的幀率則相當于原生4K 的2.63 倍,等于是畫面效果與高幀率兼得,為玩家提供了兩全其美的游戲體驗。當然,我們也可以從FrameView 的幀率顯示看到RTX 4070在DLSS 3的支持下,甚至能在4K 光追設置下達到百幀,可見DLSS 3黑科技的強大。
生產力性能測試
SPECView 包含了大量的工業(yè)軟件測試項目,在2020V3.1版本中,RTX 4070 相對于RTX 3070 Ti 的提升還是很明顯的。其中Energy 能源測試集的提升最大,是RTX 3070 Ti 的1.8 倍。
Blender Benchmark 3.3中,RTX 4070對比RTX 3070 Ti提升也很明顯,其中monster 和classroom 的性能是RTX 3070Ti 的1.6 倍和1.5 倍左右,junkshop 則是有23% 的提升。
RTX 4070 在V-Ray 中無論是使用RTX 還是CUDA相對于RTX 3070 Ti 都能實現(xiàn)20% 以上的渲染效率提升,使用RTX的提升會更大一些。而OC 渲染器中的性能提升則是33%~40%。由于RTX 4070 有12GB 顯存,所以其3D 渲染類生產力表現(xiàn)比8GB 的RTX 3070 Ti 好不少。
視頻剪輯方面,從Premiere Pro 2023來看,RTX 4070 也是強過RTX 3070 Ti 的。而編碼輸出方面,RTX 4070 新版編碼器效率不錯,不但支持AV1,而且H.265編碼速度也相對RTX3070 Ti 有明顯的速度提升。
說到RTX 4070 的AV1 硬件編碼,就不得不提同碼率下AV1相對H.264 的畫質優(yōu)勢。從我們錄制的《賽博朋克2077》游戲視頻截圖對比(都為4K/60fps/10Mbps 碼率)來看,AV1 編碼畫質可以說是好出H.264 幾個檔次,鐵絲網(wǎng)邊緣平滑度和整個畫面的精度差異都非常明顯??梢妼τ谟幸曨l轉碼需求的用戶來講,支持AV1 硬件編碼的RTX 4070 無疑更加值得選擇。
AI應用在今年突然井噴,普及速度之快令人吃驚,未來AI必將成為日常工作必須掌握的技能。我們知道NVIDIA很早就開始布局AI 計算,CUDA的生態(tài)圈在業(yè)界無可匹敵,到了RTX 40 時代,更是成為了AI 應用的必備利器。這里我們就用Stable Diffusion來測試RTX 4070 在AI 出圖方面的性能。出圖的參數(shù)配置如圖,從測試成績可以看到,RTX 4070每分鐘可以出圖9.1 張,速度是RTX 3070 Ti 的1.32倍,是RTX 4070 Ti 的85%。當然,大家也可以看到,CPU 很顯然不適合做這樣的并行計算,就算Core i913900K,出圖速度也只有RTX 4070的0.9% 不到。此外,如果出圖分辨率更高,對顯卡顯存容量的要求也會更高,這方面12GB顯存的RTX 4070 無疑也比8GB 顯存的RTX 3070 Ti更有優(yōu)勢。
前面已經介紹過,RTX 4070的平均游戲功率可以控制在186W的水平。從我們用NVIDIA FrameView 工具監(jiān)測的情況來看,6款游戲大作中RTX 4070的游戲功率最高也沒達到200W,多數(shù)時候都保持在160W~180W之間,可見其能效比確實非常出色。此外,RTX 4070 的GPU 考機溫度最高為68℃,可見在散熱方面也是沒有什么壓力的,這也為玩家也提供了一個不錯的使用環(huán)境。
基于NVIDIA定制4N 工藝打造的新一代NVIDIA AdaLovelace 架構GPU,讓RTX 40系列相對上代RTX 30系有了性能上的飛躍, 而第三代RT Cores和第四代TensorCores 也讓游戲與生產力應用中的光追與AI 加速提升到了一個新的水平。
RTX 40系列全新加入的光流加速器,帶來了DLSS3 技術的AI 光學多幀生成,大幅增加了游戲幀率,最終實現(xiàn)2~4 倍的光追游戲性能提升。同時,DLSS 3 的普及速度是DLSS 2 的7 倍(目前已經有35+ 的游戲支持DLSS 3),83% 的RTX 40 用戶都在游戲中開啟了光追,這也證明了這一代架構確實是史無前例的優(yōu)秀,也是玩家全面進入光追+DLSS 游戲時代的最佳方案。
此外,今年由ChatGPT 引發(fā)的AI 革命式井噴,讓更多的人開始關注并加入到AI 創(chuàng)意設計中來,特別是擁有一款RTX40 GPU 來實現(xiàn)AI 出圖已經成為了新的熱潮。NVIDIA 在AI計算這方面早已布局多年,軟硬件生態(tài)已經無可匹敵,RTX 40系列更是擁有第四代Tensor Cores 和強大的CUDA 算力,為AI 用戶提供了當下效率最高、兼容性最佳的解決方案。
有了以上這些光環(huán)加身,再來看RTX 40 家族第4 位登場的高性能甜品RTX 4070,你就會更加清楚地了解到它的優(yōu)勢了。
游戲性能方面,RTX 4070 相對RTX 3070 Ti 大約有20% 的綜合提升,而在開啟DLSS 3 之后優(yōu)勢甚至可實現(xiàn)翻倍(例如在《賽博朋克2077》中就是RTX 3070 Ti 開DLSS 2的2.23 倍),考慮到DLSS 3 普及的速度是DLSS 2的7倍,買RTX 4070 也就意味著在以后的游戲大作中能獲得翻倍的性能,這也讓RTX 4070的性價比顯得更加爆棚了。
能效比方面,RTX 4070整板功率僅有200W,平均游戲功率更是只有186W,對電源和散熱的要求都更加平易近人,不但降低了玩家的裝機成本,也有效提升了使用體驗,特別適合RTX 2070 Super老用戶升級,也是萬元以下游戲裝機的最佳方案。
生產力部分,無論是3D 渲染類還是視頻剪輯類應用,RTX4070 相對RTX 3070 Ti 都有明顯的效率提升, 同時12GB大顯存也帶來了更多的優(yōu)勢。在眼下火熱的AI 應用中,RTX4070 憑借全新的架構也帶來了更強悍的生產力效率,對于著眼未來AI 應用的玩家來講,也確實是一款必備的甜品級高效利器。
總而言之,不管你需要一款能夠在2K 分辨率下以100fps以上高幀率暢享光追游戲大作的強力GPU,還是一款能夠大幅提升創(chuàng)意設計效率、確保你在AI 時代立于不敗之地的生產力工具,RTX 4070 都是目前這個價位上最好的選擇。