首页 / 行业
AMD 3D堆叠缓存提升不俗,其他厂商为何不效仿?
2022-04-13 01:06:00
3D堆叠、多芯片封装大家想必都不陌生了,这年头制造工艺已经没有太多噱头,有时甚至性能提升也有限,厂商只好从架构上入手。像苹果的UltraFusion拼接、Graphcore的3D WoW,都是在芯片设计厂商与晶圆厂强强联合下的产物,我们今天要讲的3D堆叠缓存也不例外。
96MB的超大3D V-Cache
把3D堆叠缓存先玩出来的不是别人,正是AMD。今年CES2022上公布的这款Ryzen7 5800X3D可以视为5800X的升级版,为原本的32MB 2D L3缓存加上了64MB的3D V-Cache缓存,使得总L3缓存达到了96MB。这种芯片堆叠方式与常见的C4和MicroBump不同,AMD用到了HybridBond3D技术,实现了更高的密度、更好的热管理和更好的连接性。
3D V-Cache示意图 / AMD
不过,AMD对Ryzen7 5800X3D的定义是一款“游戏CPU”,这意味着在一些高性能计算场景下不一定会获得更好的性能,评测软件跑分可能也不比英特尔12代酷睿i9、AMD Ryzen9 5900系列这些旗舰处理器,但游戏表现相当不俗。公布之际,AMD官方给出的FPS性能对比图中,5800X3D与英特尔的i9-12900K在半数项目上持平,而半数项目上高出10%的性能,甚至超过了自家的Ryzen9 5900X。
Ryzen9 5900X与Ryzen7 5800X3D的性能对比 / AMD
近期,终于有抢跑的媒体展示了这块处理器的游戏测试结果,测试对象为游戏《古墓丽影:暗影》。在720p分辨率的最高画质选项下,5800X3D跑出了231FPS的成绩,比英特尔的i9-12900K高出了21.58%。你可能会问为何要用如此低的分辨率来进行测试,这自然是为了消除GPU造成的影响,让对比注重于纯粹的CPU性能差异。
值得一提的是,测试结果中,5800X3D系统用到的是一块3080Ti显卡,而英特尔系统用到的是一块性能更强的3090Ti显卡,前者却依然跑出了领先的层级,如此足见5800X3D在3D V-Cache加持下的实力了。
超算也能因此获利?
除了这类高性能消费级处理器外,HPC也开始看上了3D堆叠缓存的潜力,比如AMD的Milan-X服务器CPU。与游戏场景一样,更大的缓存可以为诸多核心HPC应用破除瓶颈。日本理化研究所(RIKEN)等一众机构和学府的研究人员拿AMD了两块AMD的服务器CPU进行比较,一边是256MB LLC的Milan,一边是768MB LLC的Milan-X。从下图可以看出,虽然随着输入变大优势逐渐变小,但输入规模较小时,大缓存占据了绝对的优势。
Milan与Milan-X的性能对比 / RIKEN
这之后,几位研究人员利用gem5模拟器,打造了两种LARC处理器模型,均以1.5nm工艺打造,且都用到了大容量的3D堆叠缓存。这一处理器的设计参照了当下超级计算机之王富岳中A64FX核心,都是基于Armv8.2架构,只不过在1.5nm这样的先进工艺下,可以看出面积优势非常大,实现了近乎八倍的面积差异,如此一来核心数也从A64FX的12+1核堆上了32核。
A64FX和LARC的核心内存组对比 / RIKEN
A64FX的L2缓存并不算大,只有8MB,而他们设计的LARC处理器模型增加了3D堆叠的L2缓存,足足384MB的L2缓存相较前者有了48倍的提升。不过RIKEN提供的gem5模拟器仅仅支持2X大小L2缓存配置,所以就有了256MB和512MB的版本。为了更精准的对比,研究人员们也设计了32核的A64FX版本。
一半以上的测试应用中,单个512MBLARC处理器的核心内存组,要比A64FX高出两倍以上的性能,而且这些提升中多半都归功于3D堆叠缓存,并非只靠两倍以上的核心数目。再结合面积上的优势,针对这些缓存敏感的应用,单芯片的LARC处理器可以做到近10倍于A64FX的提升。不过这只是理论结果,毕竟现在既没有1.5nm的工艺,也没有基于芯片层级的实际测试对比,但确实为摩尔定律进展缓慢下的性能改进提供了另一个思路。
3D堆叠缓存的局限性
固然,这类3D堆叠的设计已经相当普遍了,但还有一个棘手的问题待设计者们优化,那就是散热。面向堆叠缓存的CPU核心势必会面临着热能蓄积,温度升高而降低效能的情况,而且寻常的散热手段面对这种内部积热效果不佳。以AMD的3D V-Cache为例,虽然AMD巧妙地将堆叠缓存置于非计算核心上,但也只是略有缓解,L3缓存与3D V-Cache很可能也会面临积热的难题。
从最近的消息也可以看出一些端倪,AMD官方确认首个利用3D V-Cache技术的CPU,Ryzen7 5800X3D并不支持核心、缓存超频或核心电压调整,这还是建立在5800X3D本就比5800X频率低上0.4GHz的基础上。更重要的是,AMD技术营销总监Robert Hallock指出,这项技术目前还不算成熟,他们也许会在未来推出可超频的型号,但AMD的重心还是在可超频的非3D堆叠缓存处理器上。
这就很好理解了,目前无论是工艺还是材料都没有办法很好地解决3D堆叠缓存的散热问题,根据几位HPC研究人员的推测,相关的制造工艺或在2028年才能成熟,届时将先进到克服这一限制。不过在此之前,除了游戏外,3D堆叠缓存还不足以成为扭转处理器市场的GameChanger,更像是一项“战未来”的新技术。
最新内容
手机 |
相关内容
重庆东微电子推出高性能抗射频干扰
重庆东微电子推出高性能抗射频干扰MEMS硅麦放大器芯片,芯片,推出,算法,抑制,音频,信号,重庆东微电子有限公司最近推出了一款高性能写flash芯片时为什么需要先擦除?
写flash芯片时为什么需要先擦除?,擦除,芯片,充电,初始状态,存储单元,数据,Flash芯片是一种非易失性存储器技术,用于存储数据并实现固华为公开半导体芯片专利:可提高三维
华为公开半导体芯片专利:可提高三维存储器的存储密度,专利,存储密度,存储器,芯片,存储单元,调整,华为是全球领先的信息与通信技术解新一代8通道脑电采集芯片研制成功,
新一代8通道脑电采集芯片研制成功,铠侠与西部数据已中止合并谈判,合并,芯片,脑电,新一代,通道,产品,近日,一项重要的科技突破在全球范加特兰毫米波雷达SoC芯片赋能室内
加特兰毫米波雷达SoC芯片赋能室内安防新应用,毫米波雷达,芯片,用于,稳定性,目标,感知,室内安防是一个重要的领域,随着技术的进步和人电容式触摸按键屏中应用的高性能触
电容式触摸按键屏中应用的高性能触摸芯片,芯片,位置,触摸屏,能力,响应,用户,电容式触摸按键屏(Capacitive Touch Key Screen)是一种常台积电1.4nm,有了新进展
台积电1.4nm,有了新进展,台积电,行业,需求,竞争力,支持,芯片,近日,台积电(TSMC)宣布将探索1.4纳米技术,这是一项令人振奋的举措,将有望为E低耗能,小安派-LRW-TH1传感器通用板
低耗能,小安派-LRW-TH1传感器通用板,一块板即可连接多种传感器!,传感器,多种,连接,一块,通用,接口,小安派-LRW-TH1传感器通用板是一款