ThreadRipper 2990WX评测 AMD最牛处理器开启逆袭Intel之路(2)
二、技术解析:各种玩法享受32核心
1、架构与工艺
第二代AMD锐龙Threadripper处理器和主流市场上的第二代锐龙一样,都应用了升级后的Zen+架构,以及升级后的GlobalFoundries 12nm(12LP)制造工艺。
在此前对锐龙7 2700X、锐龙5 2600X的首发评测中,我们已经对Zen+架构和GF 12nm做了较为详细的介绍,此处不再赘述。
简单地说,Zen+架构的IPC性能提升了大约3%(可以理解为同频性能提升3%),一二三级缓存分别降低最多13%、34%、16%,内存延迟降低最多11%,内存频率提高到2933MHz。
按照AMD的数据,2990X的一二三级缓存延迟分别为1ns、2.9ns、9.03ns,2950X分别为0.92ns、2.76ns、8.64ns。二者内存延迟为近端64ns、混合86ns、远端105ns。
GF 12nm则是此前14nm的优化版,晶体管性能提升10-15%,对于第二代Threadripper来说最高加速频率提升200MHz,任何频率下核心电压降低80-120mV。
2、更强动态加速
升级后的SenseMI智能技术也得到完整继承,比如第二代精准频率提升(Pricision Boost 2),加速幅度精细到25MHz,更关键的是升级了算法,会在撞到散热或者供电限制之前加速到尽可能高的频率,或者达成预设频率。
直白地说,在多核心多线程运行的时候,第二代Threadripper仍能保持尽可能高的频率,而且线程数量增加与频率降低基本呈线性关系,而不会像之前那样突然遭遇断崖式降频。
根据AMD提供的数据,2950X可以在单线程时加速到最高4.35GHz,之后随着线程增多,频率稳步下降,16线程时仍能保持在3.7GHz的高度,32线程跑满时也能有3.5-3.6GHz。
2990WX身上同样体现的十分明显,单双线程时能接近4.2GHz,32线程时可泡3.6GHz,即便是64线程全开也能稳定在3.4GHz。
其实很多时候,我们经常可以看到某款处理器标称的加速频率很高,但很难坚持很长时间,往往几十秒甚至几秒钟就会掉下来(所谓三秒真男人),而且随着线程数量的增多,加速也会十分困难。
而第二代Threadripper处理器在核心线程数量大增的同时,依然保持了强劲的多线程加速能力,不至于在多线程负载中频率跟不上而造成实际性能低下,这无疑是难能可贵的。
还有第二代自适应动态扩频技术(XFR2)。如果散热器更强大,或者运行温度更低,第二代Threadripper处理器同样可以获得额外的加速空间,而且和第二代精准频率提升一样,它也是在所有核心与线程上工作的。
根据AMD提供的数据,如果把2990WX在180W普通风冷散热器、32℃室温下的性能视为基准,换用新的Wraith Ripper散热器可以额外加速多达11%,室温降至20℃则可以提升13%,而如果换上水冷,则能平白获得16%的额外性能!
至于精准功耗控制、神经网络预测、智能数据预取三项技术,都没有任何变化。
4、游戏模式
2990WX是全球第一颗32核心64线程桌面处理器,其实并不适合打游戏,因为没有任何游戏需要这么多核心,而且游戏引擎开发之初一般也不会考虑如此之多的核心,所以用它跑游戏反而往往会出现兼容性和性能问题。
为此,AMD特别提供了游戏模式(Game Mode),可以在Ryzen Master工具中与创作者模式(Creator Mode)互相切换,打开后2990WX就会只使用8个或者16个核心,此时游戏性能反而会更高。
以上是AMD官方提供的2990WX正常模式、游戏模式的游戏性能对比,可以明显看到在多少游戏中,游戏模式都很有用,尤其是《GTA 5》、《杀出重围:人类分裂》、《全面战争:战锤2》、《占地1》。
AMD也表示,游戏对于多核心的支持也正在完善,去年16核心Threadripper处理器刚出来的时候,不少游戏都不正常,但现在已经几乎不存在这种问题,从上图也可以看出,16核心跑游戏偶有性能下降,但影响并不大。
后边的环节里我们会对游戏模式的具体原理、效果进行详细测试、分析。
5、内存模式
由于锐龙Threadripper处理器核心众多,而且内部分成多个Die,又支持四通道内存,所以在内存支持和应用方面AMD也做了特别设计,使用的时候需要分情况注意。
为了理解第二代Threadripper处理器的内存机制,先来看看结构拓扑图:
2950X还相对简单一些,内部两个Die,每个Die有8个物理核心,同时每个Die对外连接两个内存通道、32条PCI-E 3.0通道(分成两组),两个Die之间通过一条Inifinity Fabric总线互连,DDR4-1600内存的时候IO带宽就有大约50GB/s。
2990WX就比较复杂了,内部共有四个Die,各自还是8个物理核心,但依然只有两个Die分别负责对外连接两个内存通道、32条PCI-E 3.0通道,另外两个Die是没有的,AMD称之为Compute Die,也就是只负责计算。
同时,每两个Die之间都有一条Infinity Fabric,总计六条之多,这样可以保证两个Die之间的物理核心可以直接沟通,从而降低延迟。内存频率1600MHz的时候,每条互连总线带宽约为25GB/s,也就是2950X的一半。
为了提高内存性能,AMD设计了两种内存访问模式,其一称为分布模式(Distributed Mode),整个系统配置为一体化内存访问(UMA),内存访问需求在所有可用通道之间均匀分配,即便是应用在多线程下的表现难以预料也能确保内存性能的一致性。
这也是线程Threadripper平台的默认内存模式,也是Ryzen Master工具中创作者模式(Creator Mode)搭配的内存模式。
其二是本地模式(Local Mode),配置为非一体化内存访问(NUMA),它是2950X的独有模式,整个处理器分为两个节点(node),每个节点包含一个Die和两个内存通道。
操作系统会尽可能将进程和内存需求放在同一个节点内,不够了才会扩展到第二个节点,这能在线程不多时降低内存延迟,非常适合用来玩游戏,因此在Ryzen Master工具中,如果启用游戏模式(Game Mode),2950X就会切换到本地模式内存配置。
自从锐龙发布以来,AMD就在持续研究不同游戏对于处理器配置的敏感度,发现差异相当大,比如《古墓丽影崛起》、《守望先锋》、《奇点灰烬》等喜欢更多核心,《暗影魔多》、《地铁:最后微光》、《热血无赖》在高频率下表现更好,《战争机器终极版》、《辐射4》、《杀手:赦免》对内存延迟很敏感,《使命招魂:现代战争》、《孤岛惊魂4》、《星球大战:前线》则需要核心之间的低延迟。
AMD表示,在16核心上评估了超过75款游戏后发现,本地模式能带来平均约5%的性能提升,《杀手:赦免》最高可超过10%,而非游戏应用在分布模式上表现更佳,证明两种内存模式的设置和切换是有效的。
6、传统兼容模式
Ryzen Master中还提供了一种传统兼容模式(Legacy Compatibility Mode),打开之后2950X会只启用一个Die、8核心16线程、双通道内存,2990X则可以是两个Die、16核心32线程、四通道内存,也可以是一个Die、8核心16线程、双通道内存。
如果有游戏对于多Die、多核心多线程、多内存通道完全不兼容,这就轮到了传统兼容模式表现的时候了。
AMD测试了60多款游戏开关传统兼容模式的性能对比,发现平均会带来4%的性能提升,最好的四分之一游戏更是可以提升12%,主要有《文明6》、《使命召唤:现代战争》、《风暴英雄》、《全面战争:战锤2》、《DOTA2》、《孤岛惊魂5》、《幽灵行动:荒野》、《看门狗1/2》、《神偷》、《杀手:赦免》、《辐射4》、《CSGO》、《生化危机7》、《战锤40K:战争黎明3》。
7、PBO超频
AMD处理器全线开放手动超频,可以轻松获得更高性能,现在第二代Threadripper处理器又提供了一种新的超频模式“Precision Boost Overdrive”(PBO)。
它也可以理解为一种自动加速超频技术,但更多地取决于主板设计,包括处理器插座功耗承受能力、主板热设计电流、主板电气设计电流,这三者尽可能地提高来获取更多性能,官方号称可比默认状态额外带来16%的提升。
官方号称可比默认状态额外带来16%的提升。
PBO相比于手动超频,最大的好处是会保留空闲降频、精准加速能力,而不是固定在一个频率上,从而更加灵活。
但是注意,PBO也属于超频行为,由此造成的损坏将失去质保。
PBO也是通过Ryzen Master工具控制,默认为自动状态,也可以手动调整。