• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      規(guī)格縮水?顯存問題?NVIDIA GTX970風(fēng)波始末

      2015-05-30 10:48:04小戴
      電腦迷 2015年4期
      關(guān)鍵詞:內(nèi)存規(guī)格架構(gòu)

      小戴

      作為NVIDIA革命性第二代Maxwell架構(gòu)的次旗艦產(chǎn)品,GTX970憑借強勁的性能和合理的功耗帶來了非常優(yōu)秀的能耗比,自上市起就成為了大家關(guān)注的焦點,一度被視為極為完美的顯卡。可是好景不長,前不久圍繞GTX970的麻煩可不少,因為很多玩家發(fā)現(xiàn)其4GB顯存只有3.5GB可以被充分利用,剩下的0.5GB似乎被忽略了。這一下在玩家圈中炸開了鍋,玩家們紛紛懷疑,這是遇到了質(zhì)量問題?還是產(chǎn)品設(shè)計缺陷?抑或是驅(qū)動對新顯卡的支持度不夠好呢?下面跟小編一起來看看這起“顯存門”風(fēng)波的始末。

      顯存問題掀起風(fēng)波

      NVIDIA GTX970的風(fēng)波要從年初說起。二代Maxwell架構(gòu)的GTX 980和970牢牢占據(jù)了單芯顯卡性能前兩名的寶座,自然是玩家們最關(guān)注的焦點。而細心的國外玩家在論壇指出,自己購買的GTX970似乎只能使用最多3.5GB的顯存,剩下的0.5GB容量看上去似乎被忽略浪費掉了。并給出了GPU-Z的截圖,圖中顯示該卡的顯存占用一直在3.5GB。而通過overlock開發(fā)的一款測試程序發(fā)現(xiàn),GTX970其實可以完全利用全部的4GB顯存,但是最后0.5GB的性能會出現(xiàn)大幅度下滑。根據(jù)NVIDIA最早給出的技術(shù)文檔,GTX970和GTX980的差別僅在于CUDA流處理器、紋理單元和核心頻率,屏蔽了三組SMM單元以降低功耗,而顯存位寬、顯存大小、顯存頻率、L2緩存等均沒有任何區(qū)別,一切都變得撲朔迷離起來。

      官方回應(yīng) 竟是規(guī)格縮水

      隨著顯卡問題的發(fā)酵,NVIDIA也坐不住了,對此進行了官方回應(yīng),稱:“雖然架構(gòu)上GTX 970和GTX 980是完全一致的,GTX 970配備了4GB獨立顯存,但是它的SM配置與GTX 980不同,交叉開關(guān)(crossbar)資源也更少。為了優(yōu)化此結(jié)構(gòu)下的顯存管理,我們將其分成了3.5GB、0.5GB兩個部分。GPU會優(yōu)先訪問3.5GB部分。如果游戲需要的顯存少于3.5GB,就只會訪問第一部分,所以有些第三方工具顯示顯存占用量的時候就只會給出3.5GB,而在GTX 980上會顯示更多。如果游戲需要的顯存超過3.5GB,我們就會同時使用兩部分。我們知道大家擔(dān)心這0.5GB顯存的性能,而最好的測試就是看看實際游戲性能?!?/p>

      雖然語焉不詳語意模糊,但還是在一定程度上解釋了GTX970出現(xiàn)的顯存問題,但是對喜歡刨根問底的技術(shù)宅同學(xué)來說,這個答案顯然不能讓他們滿意,含糊不清的回應(yīng)并沒有解釋到底哪里出現(xiàn)了問題,因為以前沒遇到過這樣的問題。

      NVIDIA GTX 980/970使用的都是GM204核心,顯存規(guī)格完全一致,都是256bit位寬,4GB GDDR5容量,7GHz頻率,由四組ROP/顯存管理器負責(zé),從這一點來看不會有什么不同。唯一的不同,就是GTX 970屏蔽了三組SMM陣列,但是這會和顯存有關(guān)嗎?以前的顯卡也都是這么做的,并沒有觀察到類似的現(xiàn)象?。?/p>

      要解釋這個問題,就需要徹底的了解GTX970底層構(gòu)架的基本規(guī)格,隨著調(diào)查的進一步深入,NVIDIA很意外的告訴大家:“我們以前宣傳的時候把GTX970的規(guī)格搞錯了!”GTX970的錯誤在于,它的實際ROP單元只有56個,L2緩存也不是最初的和GTX980一樣的2MB,而是1.75MB,減少了1/8,不過顯存控制器沒有變化,的確是256bit位寬,4GB顯存。對于為什么會出現(xiàn)這樣的錯誤,NVIDIA解釋說技術(shù)銷售團隊在制作評測指南時并沒有意識到Maxwell架構(gòu)具備上具備部分禁用ROP/顯存主控的功能,而這是Maxwell架構(gòu)上才有的新功能,他們知道GTX 970是有256bit位寬的,但不知道可以獨立禁止ROP單元及2MB L2緩存,所以他們制作的文檔中的錯誤就在NVIDIA各部門流傳開了,并通過媒體傳播開了。這個問題在過去的4個月中都沒有被發(fā)現(xiàn),直到本月初NVIDIA開始調(diào)查GTX 970顯存尋址的問題時才被注意到。PPT團隊再一次背黑鍋了。

      而由于GPU-Z、AIDA64這樣知名的工具也因為對第二代Maxwell架構(gòu)了解不夠深入,而未能發(fā)現(xiàn)問題,GTX 970檢測中都標注著64個ROP單元。不過其實也有跡象的,比如說NVIDIA自己的DeviceQuery CUDA開發(fā)工具,一直都準確報告了GTX 970只有1.75MB的二級緩存,但是除了相關(guān)軟硬件開發(fā)者,普通玩家和評測人員顯然不會注意到這個問題,或許在不久的將來,大家可以在各大評測內(nèi)容中看到這一項。

      深度解析Maxwell架構(gòu)顯存架構(gòu)限制問題

      NVIDIA的高級VP Jonah Alben對這個問題做了詳細解釋。GTX970有13個SMM,每個SMM有128個SP,總計1664個SP。SMM通過Crossbar與L2連接,然后L2再連接顯存控制器,GTX980有8個L2(共計2048KB)與MC連接(每個連接32bit),但GTX970只有7個L2(共計1792KB)與MC連接,最后2個MC共用一個L2。GTX980 每個L2 ROP模塊有專門對應(yīng)的32bit帶寬的512MB區(qū)域,但GTX970由于少組L2,這樣,最后一部分的512MB顯存和MC就需要和前面一組512MB顯存和MC共用L2,此時最后一組L2的請求數(shù)量就是前面其他L2的兩倍,性能就會減半,這樣就導(dǎo)致最后一組的512MB顯存的利用率和使用效率會出現(xiàn)問題。

      為了解決這個問題,NVIDIA將內(nèi)存分成兩個區(qū)域,前面的七個DRAM 3.5GB一個主區(qū)域,最后第八個DRAM 0.5GB一個區(qū)域。顯存訪問時系統(tǒng)會依照1-2-3-4-5-6-7-1-2-3-4-5-6-7的順序優(yōu)先使用,這樣可以使得帶寬能夠更為均衡地使用。這樣的解決方案在3.5GB以下使用情況完美,但在3.5GB以上就會出現(xiàn)問題。通過Nai benchmark浮點測試表明,最后0.5GB顯存的速度僅有前面3.5GB的1/7,從正常的150GB/s下降到22.35GB/s。OS將顯存分為三個區(qū)域,PCI-E訪問前面的3.5GB主區(qū)域性能是后面的0.5GB的4倍,NVIDIA會讓OS優(yōu)先使用前面的3.5GB,最后的0.5GB到迫不得已不夠用才會不情愿地使用。

      這就是為什么GTX 970顯卡的224GB/s帶寬是技術(shù)上正確的,因為3.5GB部分顯存的帶寬是196GB/s(7GHz×7port×32bit),而0.5GB那部分讀取速度是28GB/s,但這二者不是同時讀取的,這實際上是一個XOR(異或)的情況。進一步來講,由于0.5GB顯存那部分不能跟3.5GB那部分同時讀取,這又進一步導(dǎo)致顯卡的等效帶寬太低了,使用的0.5GB部分顯存越多,3.5GB部分顯存的等效帶寬就會越低。

      最終的結(jié)果就是GTX 970擁有獨一無二的顯存布局,需要操作系統(tǒng)及NVIDIA的驅(qū)動優(yōu)化,因為3.5GB部分的顯存相比另外的0.5GB部分更大、更快、更好。這0.5GB部分的顯存邏輯上來看相當于VRAM與系統(tǒng)內(nèi)存之間的緩存,它的速度比3.5GB部分更慢,不過依然是PCI-E總線到內(nèi)存的帶寬的2倍。

      往大的方面說,取決于你如何定義GTX 970的顯存容量,它可以說是3.5GB顯存的,也可以說是4GB顯存的,其中只有前面的3.5GB是全速的,這也是軟件最想用的那部分。不過512MB那部分分區(qū)也是有意義的,雖然性能比3.5GB部分低,但它依然比PCI-E到主內(nèi)存的帶寬更高,GTX 970依然可以使用完整的4GB顯存。

      寫在最后:GTX 970到底有問題嗎?

      上面分析了這么多,那么GTX970到底有問題嗎?所幸的是,通過多家國內(nèi)外媒體的測試,GTX970確實可以使用全部的4GB顯存,3.5-4GB中間部分的顯存是可以被游戲利用起來的。與GTX 980的性能進行對比,無論是在3.5GB-4GB之間占用還是在4GB顯存占用時,性能下降均處于較為相當?shù)乃?。在測試中,無論顯存占用情況如何,GTX 970和GTX 980的性能差距始終在15%左右,爆顯存的事情并沒有發(fā)生。如果之前的GTX970顯存問題的傳言準確,那應(yīng)該會看到GTX970相對于GTX980性能有較大幅度的下降才對,而這樣的事情并沒有在測試中出現(xiàn)。絕大多數(shù)熱門游戲大作在4K及以下分辨率的時候,即使畫質(zhì)全部手動調(diào)至最高,顯存占用率也不會超過3.5GB。

      小編認為,這次可能真的如NVIDIA說的那樣,他們是疏忽了,而不是故意隱瞞。首先,因為ROP單元、二級緩存的參數(shù)對普通用戶來說確實意義不大,NVIDIA故意夸大它們的規(guī)格撈不到任何好處,被發(fā)現(xiàn)了反而是嚴重的打臉,沒必要這樣冒險。其次,無論之前的傳言如何,以及顯存分配到底是怎樣的,GTX 970的性能都在那擺著的,而且二代Maxwell架構(gòu)優(yōu)秀的功耗比也給大家?guī)砹松羁痰挠∠螅覀冊僭陲@存上糾結(jié)似乎完全沒有必要。

      猜你喜歡
      內(nèi)存規(guī)格架構(gòu)
      基于FPGA的RNN硬件加速架構(gòu)
      近3成苗企難以維持!規(guī)格越大越虧,2022如何讓泥鰍賺錢?
      閉月羞花
      寶藏(2021年6期)2021-07-20 06:12:22
      功能架構(gòu)在電子電氣架構(gòu)開發(fā)中的應(yīng)用和實踐
      汽車工程(2021年12期)2021-03-08 02:34:30
      “春夏秋冬”的內(nèi)存
      當代陜西(2019年13期)2019-08-20 03:54:22
      山鋼日鋼1.2mm極限薄規(guī)格帶鋼的生產(chǎn)實踐
      山東冶金(2019年1期)2019-03-30 01:35:30
      LSN DCI EVPN VxLAN組網(wǎng)架構(gòu)研究及實現(xiàn)
      一種基于FPGA+ARM架構(gòu)的μPMU實現(xiàn)
      基于內(nèi)存的地理信息訪問技術(shù)
      徹底撐握8大關(guān)鍵詞 看懂規(guī)格買液晶
      红安县| 喜德县| 右玉县| 八宿县| 鄄城县| 平山县| 汉川市| 海林市| 柳江县| 高邑县| 海门市| 定日县| 邹城市| 廊坊市| 英吉沙县| 吉水县| 凤山市| 永定县| 兴文县| 日喀则市| 泰兴市| 新津县| 思南县| 水富县| 峨边| 栖霞市| 宿州市| 通城县| 成安县| 乳山市| 商洛市| 太白县| 唐河县| 安西县| 宝兴县| 柳河县| 普定县| 仁布县| 乌拉特前旗| 双柏县| 乌兰察布市|