RTX2080/RTX2080Ti显卡全面评测 RTX20系电脑显卡怎么样?(5)

七、架构解析之三大核心与型号

图灵家族除了架构本身变化巨大,产品体系也和以往明显不同,首发一口气就是三款型号RTX 2080 Ti、RTX 2080、RTX 2070,而且分别对应三个不同核心TU102、TU104、TUF106,而以往的x80、x70都是共享一个核心。

具体原因不详,可能是新一代核心太大,x70直接用大核心阉割成本比较高,还不如再造一个省钱的小核心。

S9bcf6f88-53cd-4243-a809-50a725ce5b44.jpg

 

这就是最顶级的TU102核心,186亿个晶体管、754平方毫米面积确实不是盖的。

内有4608个CUDA核心,分为6组GPC、36组TPC、72组SM阵列(每组SM 64个CUDA核心),同时有72个RT核心、576个Tensor核心、288个纹理单元、96个ROP光栅单元,二级缓存容量6MB,寄存器文件18MB,352-bit位宽。

b8035dab-bf83-42ba-8088-68ef02693f4b.jpg

不过,RTX 2080 Ti并未完全使用整个TU102核心,而是有所精简,仅提供4352个CUDA核心(68组SM阵列),RT核心则减少为68个,Tensor核心544个。

目前只有Quadro RTX 8000用了完整的TUF102,可能是初期良品率不足,优先供给专业市场,也可能是功耗和发热在游戏卡上不好控制,还有可能是留一手……

RTX 2080 Ti的核心频率基础为1350MHz,加速频率FE公版做到了1635MHz,非公版则规定是1545MHz,当然大家可以随意超频。

显存搭配11GB GDDR6,等效频率14GHz,带宽为616GB/s,整卡功耗260W。

S71176e67-6976-4047-bd0c-f76e44f67dfa.jpg

TU104核心,136亿个晶体管,545平方毫米,比帕斯卡家族的大核心GP102都要大一圈。

它集成了3072个CUDA核心,划分为6组GPC、24组TPC、48组SM(每组SM还是64个),同时有192个纹理单元、64个ROP单元、384个Tensor核心、48个RT核心,二级缓存容量4MB,寄存器文件12MB,显存位宽256-bit。

83f9e478-236f-4e5d-8c7a-b16565ebcfdd.jpg

RTX 2080同样没有用满TU104核心,而是精简了两组SM,提供2944个CUDA核心、368个Tensor核心、46个RT核心,完整版还是在专业卡上,Quadro RTX 6000。

RTX 2080核心基础频率1515MHz,加速频率非公版1710MHz,公版直接定在1800MHz,搭配8GB GDDR6显存,等效频率14GHz,带宽448GB/s,功耗225W。

它的渲染性能为60 TRX-OPS,相比于RTX 2080 Ti削弱了23%,光线追踪性能8 GigaRays/s(每秒80亿条光线),削弱了20%。

Sb9c808e3-e08c-4488-ab73-8d046ea76e57.jpg

TU106核心,108亿个晶体管,445平方毫米,相比GP102也只是分别差了10%、6%,更可见图灵家族的庞大。

TU106核心內建2304个CUDA核心,分为3组GPC、18组TPC、36组SM阵列(每组继续64个),同时有144个纹理单元、64个ROP单元、288个Tensor核心、36个RT核心,二级缓存容量4MB,寄存器文件9MB,显存位宽还是256-bit。

26888276-44be-4849-8c9e-5105383d3c82.jpg

RTX 2070终于用了完整的TU106核心,核心频率基础1410MHz,加速公版1710MHz、非公版1620MHz,继续搭配8GB 14GHz GDDR6显存,功耗185W。

渲染性能45 RTX-OPS,相比于RTX 2080 Ti、RTX 2080分别低了25%、42%,光线追踪性能6 GigaRays/s(每秒60亿条光线),分别低了25%、40%。

8870ae41-fd15-41f2-aa17-fe3ad8dfb460.jpg

图灵家族三大核心与帕斯卡家族大核心GP102对比。