GeForce GTX 1080首发评测 缔造性能神话(2)

似是故人的新架构

  GeForceGTX1080采用了两年前就已在GTC上被老黄透漏的全新架构――Pascal,“Pascal”依然取自一位著名物理学家的名字,国际单位制中压力的单位“Pa”即以其姓氏命名。Pascal架构的第一款产品是4月初发布的TeslaP100,其采用GP100大核心,而这次发布的GTX1080则是采用GP104核心,具体型号为GP104-400,次旗舰GTX1070为GP104-200。GP104核心面积约为314平方毫米,得益于16nm的制程优势,核心内集成了72亿晶体管,是GTX980晶体管数量的1.38倍,核心面积却仅为GTX980的78.9%。

缔造性能神话 GeForce GTX 1080首发评测
NVIDIAGP104-400核心

  基于Pascal架构的GM204-400芯片运算资源总量为2560个ALU,TFU数量为160个,后端的ROPs数量为64个,四个带宽为64bit的双通道显存控制器组成了总量为256bit的显存控制单元,大小为8GB。同GTX980相比,其各项参数均有所提升,尤其是显存带宽达到了320GB/s,这是因为其率先采用了GDDR5X显存,GDDR5X显存的改进使得GTX1080在位宽相同的情况下拥有更高的带宽,初期即可达到10-12Gbps,而随着进一步的研发最高能够提升到16Gbps。

显卡规格比较表
显卡型号 GTX1080 R9FuryX

GTX980

GTXTitanX

首发限价 /$599 /$649 /$549 /$999
GPU代号 GP104 FijiXT GM204 GM200
GPU工艺 16nm 28nm 28nm 28nm
GPU晶体管 7.2B 8.9B 5.2B 8B
着色器数量 2560 4096 2048 3072
单精度浮点 9T 8.6T 5T 7T
ROPs数量 64 64 64 96
纹理单元数量 160 256 128 192
核心频率 1607MHz 1050MHz 1126MHz 1000MHz
boost频率 1733MHz 1050MHz 1216MHz 1075MHz
架构 Pascal GCN Maxwell Maxwell
显存频率 2500MHz 500MHz 1753MHz 1753MHz
内存位宽 256bit 4096bit 256bit 384bit
内存带宽 320GB/s 512GB/s 224GB/s 336GB/s
内存类型 GDDR5X HBM GDDR5 GDDR5
内存容量 8GB 4GB 4GB 12GB

注:表中售价均为官方首发限价

  我们可以看到GeForceGTX1080的默认核心频率达到了惊人的1607MHz,Boost频率为1733MHz,显存带宽为320GB/s,这款产品完整支持DirectX12API以及异步运算,在DX12中有着更好的表现。GTX1080的默认PixelFillrate能力达到了102.8Gpiexls/S,默认TextureFillrate能力为277.3Gtexels/S。凭借超高的基础频率和庞大的运算规模,GTX1080拥有9TFLOPS的超高单精度浮点运算能力,照比GTXTitanX提升了28%,甚至超越了R9FuryX的8.6TFLOPS单精度浮点运算能力,成为目前单精度浮点运算性能最高的游戏显卡。

缔造性能神话 GeForce GTX 1080首发评测
GP104架构图

  Pascal架构GP104-400芯片由以下主要的部分组成:

  1、基于TSMC的16nmFinFET工艺。

  2、4单元的宏观并行结构,20组SMs单元被分为4个GPC,每个GPC包含5组SMs。

  3、20组全新设计的,包含了几何引擎、光栅化引擎以及线程仲裁管理机制的SMs单元。每个SMs单元包含一组负责处理几何任务需求的PolyMorphEngine,同时均下辖5组更基本的SM单元,每个SMs单元包含8个负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的TextureArray,四组并行的二级线程管理机制以及对应的shared+UnifiedCache等缓冲体系。

  4、GP104拥有8个32位显存控制器,总计256位,每个32位显存控制器包含8个ROPs单元和256KB二级缓存,共计64个ROPs单元和2M二级缓存。

  5、改进型的4.0版本PolyMorphEngine,包含了为VR设计的TheSimultaneousMulti-ProjectionEngine,在极端情况下,SMP引擎可以减少32倍VR所需的几何渲染工作量。

缔造性能神话 GeForce GTX 1080首发评测
GP104SM单元架构图

  在GeForceGTX1080上,我们看到了其与上代基于Maxwell2.0架构显卡相类似的设计,主要区别就是每个GPC中多了一组SMs单元。这就让这款显卡能够支持所有在GeForceGTX900系列中的特性,以后使用到这款显卡的玩家能够获得与其他采用基于Maxwell2.0架构设计的显卡的体验。