首页 / 行业
Arm Neoverse家族新增V1和N2两大平台,突破高性能计算瓶颈
2021-04-30 16:20:00
Arm 近日公开了Arm® Neoverse V1 和 N2 平台的产品细节,两者满足了基础设施应用的各种需求。这两个平台的设计旨在解决当前正在运行的各种工作负载和应用问题,与上一代N1相比,并分别带来 50%和 40%的性能提升。此外,Arm也同时发布了CMN-700,作为构建基于Neoverse V1和 N2 平台高性能SoC的关键部件。
Neoverse V1:最宽微架构+SVE矢量运算
Neoverse V1平台 / Arm
与上一代N1相比,Neoverse V1带来了50%的性能提升和1.8倍的矢量工作负载优化、以及4倍的机器学习工作负载优化。得益于Arm迄今为止最宽的微架构以及SVE功能,Neoverse V1可以容纳更多运行中的指令,延长了代码存活期,也为芯片设计人员提供了灵活性。Arm 现有的 SIMD 指令集 NEON 难以对某些代码进行矢量化处理,而 SVE 可以直接取用相同的代码,并很好地对其进行自动矢量化,相比于 NEON,SVE可将处理速度提高近3.5倍。
已经用到Neoverse V1的HPC项目 / Arm
目前法国芯片公司SiPearl、印度信息技术部(MEITY)韩国电子通信研究所(ETRI)都在各自的HPC项目中用到了Neoverse V1。
Neoverse N2:首个Armv9+SVE2平台
Neoverse N2提高云端到边缘性能效率 / Arm
Arm在几周前发布了Armv9架构,以满足全球对无所不在的专用处理能力的需求,而新公布的Neoverse N2平台正是第一个基于Armv9架构的平台。
SVE2 / Arm相比于N1,Neoverse N2在保持相同水平的功率和面积效率的基础上,单线程性能提升了40%。不仅如此,Neoverse N2也是第一个具备SVE2功能的平台,作为SVE和Neon的超集,SVE2为云端到边缘的性能效率带来了巨大提升。SVE主要用于加速HPC,而SVE2可广泛运用于机器学习、数字信号处理和5G等应用场景,同时兼具SVE的编程简易性和可移植性等优势。
CMN-700:下一代总线赋能异构SoC
Neoverse CMN-700 / Arm
作为上一代CMN-600的升级,CMN-700支持的最大核心数可达512颗。通过对CCIX 2.0和CXL 2.0的支持,也为客户提供了更多的定制和扩展选项,为紧密耦合的异构计算提供了更大的灵活性。
异构计算的趋势
随着异构计算的逐步发展,我们已经看到了很多CPU和GPU搭配的趋势,比如英伟达近期公布的基于Arm Neoverse的Grace芯片,就是一个用于AI超算的CPU。英伟达在互联技术上采用的是自研的NVLink技术,而非PCIE。Arm基础设施事业部高级副总裁兼总经理 Chris Bergey提到,与多样化的加速器功能进行互联,比如AI加速器,这对未来的市场时相当关键的。比如CMN-700已经支持了CXL和CCIX这样的互联标准,未来Arm期待给市场带来更多的灵活性,并支持更多像Grace这样的系统。
这样的异构趋势也囊括了FPGA,Arm基础设施事业部全球高级总监邹挺补充道,现在已经有合作伙伴将Neoverse N2和FPGA加速卡放在异构计算系统中使用。有的Arm合作伙伴还将FPGA加速器和N2放在一个芯片上做成SoC,通过Chiplet的技术来实现异构计算的灵活性。
公有云的广泛应用
腾讯云加码Arm生态 / Arm 腾讯云
Neoverse的广泛应用在公有云厂商中尤为明显,比如AWS、阿里云和腾讯云等。腾讯专项测试技术中心总监黄闻欣提到腾讯去年和Arm正式签署了一份合作协议,希望通过合作加速Arm Neoverse技术的测评和适配。通过TencentBench测试框架发现,得益于更多可扩展的CPU核心数,Arm服务器比传统的服务器性能表现更强劲,尤其是在AI推理和图片处理领域。
Arm架构为Java性能带来的提升 / Arm 阿里云
阿里巴巴首席工程师周经森(Kingsum Chow)谈道:Arm的CPU资源的话,在我们现有的软件里会有两个考虑的点,一个是我们有些软件是需要重新编译的,另外一种不需要重新编译,只需要我们把Java applications在JVM(Java Virtual Machine)上跑好就可以了。在这方面,一年之前,我们就跟Arm的员工一起合作,把JVM的性能提高。过去一年里,我们从JDK8到JDK11,通过OpenJDK, 通过阿里巴巴 Dragonwell(OpenJDK的一个发行版),就把我们现有一些Java应用的一些性能提高了50%。
Neoverse V1:最宽微架构+SVE矢量运算
Neoverse V1平台 / Arm
与上一代N1相比,Neoverse V1带来了50%的性能提升和1.8倍的矢量工作负载优化、以及4倍的机器学习工作负载优化。得益于Arm迄今为止最宽的微架构以及SVE功能,Neoverse V1可以容纳更多运行中的指令,延长了代码存活期,也为芯片设计人员提供了灵活性。Arm 现有的 SIMD 指令集 NEON 难以对某些代码进行矢量化处理,而 SVE 可以直接取用相同的代码,并很好地对其进行自动矢量化,相比于 NEON,SVE可将处理速度提高近3.5倍。
已经用到Neoverse V1的HPC项目 / Arm
目前法国芯片公司SiPearl、印度信息技术部(MEITY)韩国电子通信研究所(ETRI)都在各自的HPC项目中用到了Neoverse V1。
Neoverse N2:首个Armv9+SVE2平台
Neoverse N2提高云端到边缘性能效率 / Arm
Arm在几周前发布了Armv9架构,以满足全球对无所不在的专用处理能力的需求,而新公布的Neoverse N2平台正是第一个基于Armv9架构的平台。
SVE2 / Arm相比于N1,Neoverse N2在保持相同水平的功率和面积效率的基础上,单线程性能提升了40%。不仅如此,Neoverse N2也是第一个具备SVE2功能的平台,作为SVE和Neon的超集,SVE2为云端到边缘的性能效率带来了巨大提升。SVE主要用于加速HPC,而SVE2可广泛运用于机器学习、数字信号处理和5G等应用场景,同时兼具SVE的编程简易性和可移植性等优势。
CMN-700:下一代总线赋能异构SoC
Neoverse CMN-700 / Arm
作为上一代CMN-600的升级,CMN-700支持的最大核心数可达512颗。通过对CCIX 2.0和CXL 2.0的支持,也为客户提供了更多的定制和扩展选项,为紧密耦合的异构计算提供了更大的灵活性。
异构计算的趋势
随着异构计算的逐步发展,我们已经看到了很多CPU和GPU搭配的趋势,比如英伟达近期公布的基于Arm Neoverse的Grace芯片,就是一个用于AI超算的CPU。英伟达在互联技术上采用的是自研的NVLink技术,而非PCIE。Arm基础设施事业部高级副总裁兼总经理 Chris Bergey提到,与多样化的加速器功能进行互联,比如AI加速器,这对未来的市场时相当关键的。比如CMN-700已经支持了CXL和CCIX这样的互联标准,未来Arm期待给市场带来更多的灵活性,并支持更多像Grace这样的系统。
这样的异构趋势也囊括了FPGA,Arm基础设施事业部全球高级总监邹挺补充道,现在已经有合作伙伴将Neoverse N2和FPGA加速卡放在异构计算系统中使用。有的Arm合作伙伴还将FPGA加速器和N2放在一个芯片上做成SoC,通过Chiplet的技术来实现异构计算的灵活性。
公有云的广泛应用
腾讯云加码Arm生态 / Arm 腾讯云
Neoverse的广泛应用在公有云厂商中尤为明显,比如AWS、阿里云和腾讯云等。腾讯专项测试技术中心总监黄闻欣提到腾讯去年和Arm正式签署了一份合作协议,希望通过合作加速Arm Neoverse技术的测评和适配。通过TencentBench测试框架发现,得益于更多可扩展的CPU核心数,Arm服务器比传统的服务器性能表现更强劲,尤其是在AI推理和图片处理领域。
Arm架构为Java性能带来的提升 / Arm 阿里云
阿里巴巴首席工程师周经森(Kingsum Chow)谈道:Arm的CPU资源的话,在我们现有的软件里会有两个考虑的点,一个是我们有些软件是需要重新编译的,另外一种不需要重新编译,只需要我们把Java applications在JVM(Java Virtual Machine)上跑好就可以了。在这方面,一年之前,我们就跟Arm的员工一起合作,把JVM的性能提高。过去一年里,我们从JDK8到JDK11,通过OpenJDK, 通过阿里巴巴 Dragonwell(OpenJDK的一个发行版),就把我们现有一些Java应用的一些性能提高了50%。
最新内容
手机 |
相关内容
美光低功耗内存解决方案助力高通第
美光低功耗内存解决方案助力高通第二代骁龙XR2平台,解决方案,助力,低功耗,内存,美光,第二代,随着虚拟现实(VR)和增强现实(AR)技术的迅猛所有遥不可及,终因AI触手可及
所有遥不可及,终因AI触手可及,出行,平台,无人驾驶汽车,导致,人工智能,学习,人类历史上,有许多事物曾被认为是遥不可及的,然而随着科技变频器过载保护和过流保护有什么区
变频器过载保护和过流保护有什么区别?,变频器,频率,超过,损害,方法,负载,BCP55变频器过载保护和过流保护是两种不同的保护机制,用于保安森美宣布其Hyperlux 图像传感器
安森美宣布其Hyperlux 图像传感器系列已集成到瑞萨R-Car V4x平台,平台,到瑞,集成,图像,汽车制造商,辅助功能,安森美(ON Semiconducto黑芝麻智能助力亿咖通科技旗下首款
黑芝麻智能助力亿咖通科技旗下首款智能驾驶计算平台成功量产交付,智能驾驶,计算,助力,首款,交付,智能,近年来,智能驾驶技术逐渐成为语音合成芯片与电子血压计的应用探
语音合成芯片与电子血压计的应用探索,芯片,语音合成,健康管理,智能语音,数据,用户,语音合成芯片和电子血压计是现代科技领域的两个工业物联网模块应用之砂芯库桁架机
工业物联网模块应用之砂芯库桁架机器人远程无线控制,模块,物联网,控制,操作,安全性,无线通信,砂芯库桁架机器人是一种用于制造业中PODsys:大模型AI算力平台部署的开源
PODsys:大模型AI算力平台部署的开源“神器”,开源,模型,平台,运行,计算,用户,PODsys(Platform for Open-source Distributed System)是