首页 / 行业
Fungible和英伟达在DPU赛道上的进展
2022-03-08 13:15:00
(文/周凯扬)上回我们提到了SmartNIC,以及这种智能网卡对于数据中心来说究竟起到了何种举足轻重的作用。然而,在英伟达于2020年提出DPU(data processing units)数据处理单元这一概念后,DPU成了数据中心市场竞相追逐的新潮流。英特尔也随即推出了对应的产品,并将其命名为IPU。DPU成了数据中心里除了CPU和GPU之外的第三大处理单元。
通常这些DPU具备高速网络连接性,其作用说起来很简单,那就是优化数据中心里数据的移动,而CPU和GPU则专注于计算,从而腾出性能用于其他价值更高的工作。云原生的应用使得数据中心的网络流量呈现了爆发式增长,与此同时网络攻击的频率和复杂度也在不断提高。早期解决这些问题的思路不少,用FPGA、PCIe交换机或是SmartNIC,然而这些方案其实并没有根绝这些问题,比如SmartNIC主要用于网络卸载,反倒是DPU带来了一线光明,提供了网络、存储和安全栈的全面卸载。
不过DPU这条赛道,除了英伟达和英特尔这样的大厂之外,也有不少初创企业发现了机遇,比如软银投资了两亿美元的Fungible,以及由一众前Cisco工程师们成立的Pensando。
Fungible:800Gbps的含金量
要论DPU最关键的性能,自然还是网络连接的速度,而最快的速度还得看Fungible的F1 DPU。Fungible的F1 DPU是业内第一个800Gbps的DPU,也是Fungible DPU系列的旗舰产品,足以应对目前最严苛的数据中心环境。
在架构上,F1 DPU集成了大量的多核处理器,52个核心均为最新一代的MIPS64 R6内核,不仅支持硬件虚拟化也将其分为独立的控制单元。F1 DPU采用了双发射流水线设计,配有64KB的L1 I-cache和80KB的L1 D-Cache,且L1缓存支持缓存之间的数据传输,总计片上L2缓存达到32MB。内存方面,F1 DPU除了集成8GB的HBM外,还支持双通道每通道最高512GB的DDR4内存。
利用了独特的硬件与软件结合设计,在不影响数据中心计算能效的前提下,F1 DPU提供了最大的功能灵活性。这使得F1 DPU可以用于高性能密度和低时延的环境,比如存储(NVMe/TCP存储卸载)、安全、AI/ML(GPU解耦)和数据分析服务器(OLAP、OLTP大数据分析引擎)。以存储为例,在无需x86 CPU和AFA的存储系统中,F1 DPU可以做到15M IOPS的表现,而这里的带宽限制完全是来自于PCIe本身的带宽限制。
英伟达:灵活的命名人
接着我们来看看“命名人”自己的DPU产品。英伟达的BlueField 2同样是排名前列的DPU之一,而且在收购了Mellanox之后,英伟达在连接性上的开发实力更强了。BlueField 2结合了ConnectX-6网络适配器和8个64位的Armv8 A72核心,板载16GB/32GB的DDR4内存。在连接性上,BlueField 2支持双端口的10/25/50/100 Gb/s,或是单端口的200Gb/s。接口方面,BlueField 2既支持16lane PCIe 4.0也支持自家的InfiniBand。
单从参数上来看,BlueField 2不比Fungible的F1 DPU,但BlueField 2并非英伟达的杀手锏,真正的杀手锏是第三代BlueField 3。
与第二代产品相比,BlueField 3可以说经历了彻头彻尾的升级。1/2/4端口的配置支持到400Gb/s的连接性,这400Gb/s的连接性既可以通过以太网实现,也可以通过NDR Infiniband实现。此外,在计算规模上,BlueField 3也终于下了大手笔,换成了16核Armv8.2+的A78核心,配以8MB的L2缓存和16MB的LLC系统缓存。
BlueField 3的内存更是紧跟最新的技术,直接用到了32 lane的PCIe 5.0,集成了两个DDR5 5600MT/s的DRAM控制器和16GB的板载DDR5内存。尽管在连接性上还是比Fungible的F1 DPU要差一筹,但BlueField 3提供了更多的尺寸选项既有HHHL半高半长也有FHHL全高半长,英伟达也提供了M.2和U.2的连接器用于直接连接存储,这对于既追求高性能又追求机房部署灵活性的数据中心来说,明显更有吸引力。
小结
从Fungible和英伟达在各自DPU产品的对比上来看,初创企业与传统大厂相比未必没有一战之力,这样后来者居上的趋势在数据中心处理器、AI芯片等新产品形态上屡见不鲜。但追求极致依然在这个市场站稳脚跟的最佳方式,毕竟对于云服务厂商的数据中心来说,虽然他们提供了各种等级的云服务,但那些企业级的服务才是最大的利润增长点。即便他们没有实力自研DPU,在第三方DPU的选择上也不会吝啬的。下一回我们再来谈谈国产DPU厂商在这个赛道上的进展。
原文标题:DPU赛道火热,初创公司赢面更大?
文章出处:【微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。
审核编辑:汤梓红
最新内容
手机 |
相关内容
写flash芯片时为什么需要先擦除?
写flash芯片时为什么需要先擦除?,擦除,芯片,充电,初始状态,存储单元,数据,Flash芯片是一种非易失性存储器技术,用于存储数据并实现固半导体主控技术:驱动自动驾驶革命的
半导体主控技术:驱动自动驾驶革命的引擎,自动驾驶,交通,自动驾驶系统,数据,车辆,自动,随着科技的不断进步,自动驾驶技术已经成为现实Arbe 4D成像雷达以高分辨率雷达技
Arbe 4D成像雷达以高分辨率雷达技术和先进处理技术消除“幽灵刹车”问题,刹车,成像,分辨率,系统,目标,数据,Arbe 4D成像雷达是一种清华大学研发光电融合芯片,算力超商
清华大学研发光电融合芯片,算力超商用芯片三千余倍,芯片,研发,商用,测试,计算,科学研究,近日,清华大学发布了一项重要科研成果,他们成英伟达芯片开发过程引入聊天机器人
英伟达芯片开发过程引入聊天机器人,扩展更多AI应用,聊天机器人,扩展,芯片,英伟达,开发过程,调试,英伟达是一家全球领先的半导体公司,英特尔不应该担心英伟达Arm架构的P
英特尔不应该担心英伟达Arm架构的PC芯片?恰恰相反,芯片,英伟达,英特尔,调整,研发,推出,英特尔目前是全球最大的半导体公司之一,主要以工业物联网数据采集:从Modbus到MQTT
工业物联网数据采集:从Modbus到MQTT,数据采集,物联网,模式,网关,协议,数据,工业物联网(Industrial Internet of Things,IIoT)的核心任务射频前端芯片GC1103在智能家居无线
射频前端芯片GC1103在智能家居无线通信IoT模块中应用,模块,芯片,无线通信,智能家居,支持,数据交换,射频前端芯片GC1103是一种低功耗