首页 / 行业
数据中心芯片中人工智能加速器的五个设计注意事项
2022-08-17 15:18:00
数据中心对高性能硬件加速器的需求不断增长,这些芯片在深度学习、图像分类、对象检测和识别以及自然语言处理等应用中采用人工智能技术。这些基于硬件加速器的芯片正在迅速取代传统的 CPU 和 GPU,因为它们能够以更低的功耗更快地处理 AI 任务。
硬件加速器——执行基于云的训练、数据分析、基因组学和搜索排名等特定任务的专用设备——被嵌入到 CPU、GPU、FPGA 和 ASIC 中,以服务于大规模并行的 AI 工作负载。还有 AI 加速卡,例如 Xilinx 的 Alveo U50和 Intel 的 D5005,可以处理更专业和计算密集型的工作负载。
FPGA 为数据中心服务器设计中的 CPU 提供工作负载加速。(图片:英特尔)
那么对于从事以人工智能为中心的数据中心和云计算环境的工程师来说,与硬件加速器相关的基本设计考虑是什么?本文深入探讨了一些值得关注的关键问题。
电源效率AI 芯片和加速器卡的设计和构建优先考虑数据中心中的两个关键现实世界考虑因素:尽可能快地执行训练和推理任务,并在给定的功率预算内完成。AI 芯片为视频内容流和大规模模拟等数据中心应用程序提供高耗电工作负载,因此这些 AI 芯片中的硬件加速器必须在处理复杂工作负载时确保能源效率。
当总部位于中国上海的燎原科技宣布与 GlobalFoundries (GF) 合作推出用于数据中心培训的深度学习解决方案时,基于云的 AI 培训平台的高能效数据处理被提及为关键价值主张。该公司的 深度思考单元 (DTU)加速器芯片基于格芯的 12LP FinFET 平台,采用 2.5D 封装。
数据中心正在膨胀,运营商正在寻找新的方法来加速从深度学习到自然语言处理等一系列数据驱动的工作负载。我们在即将到来的数据中心特别项目中深入研究了加速模型训练和推理、数据分析和其他分布式应用程序的敏捷和超融合数据中心架构。
硬件加速器架构除了能效这一数据中心环境中的主要问题之外,AI 芯片设计人员还必须确定要加速什么、如何加速以及如何在各种神经网络(CNN、DNN 和 RNN)上运行加速器,以及广泛的数据类型。这反过来又强调了如何在 AI 芯片上构建多个硬件加速器的重要性。
AI 设计人员正在对算法进行越来越精细的切片,同时添加更多硬件加速器,以满足现代数据中心工作负载处理和分析庞大数据集的不断变化的需求。这使得硬件架构对于处理机器视觉、深度学习和其他 AI 工作负载至关重要。
英伟达收购 Mellanox就是一个很好的例子。Mellanox 的互连技术可以帮助领先的 AI 芯片制造商创建更全面的架构,并支持包含数万个计算节点的数据中心规模的工作负载。高效的互连技术提高了神经网络训练的速度和准确性,并降低了数据中心的功耗。
可编程加速器另一项收购指出了对 AI 加速器的另一个关键要求:可编程性。当英特尔 以大约 20 亿美元的价格收购总部位于以色列的深度学习加速器开发商Habana Labs时,主要是 Habana 数据中心加速器的可编程性成为头条新闻。随后,英特尔停止了其内部 Nervana 神经网络处理器系列的开发。
可编程性功能使 AI 设计人员能够满足各种工作负载和神经网络拓扑的需求。当软件算法的变化速度超过人工智能芯片的开发速度时,这一点尤其重要,这使得硬件加速器成为固定功能的设备。
在这里,可编程性使 AI 加速器能够适应不断变化的数据中心设计需求。例如,具有可编程功能的灵活架构可以帮助 AI 设计人员管理不断变化的工作负载、新标准和更新的算法。
人工智能设计生态系统上述两项收购也表明人工智能芯片制造商正在努力拼凑包括硬件和软件在内的广泛技术组合。英特尔和英伟达等公司的目标是提供从人工智能处理器到人工智能软件工具包的产品。
因此,人工智能设计人员必须仔细审查用于模型创建、芯片评估和概念验证设计的开发工具的可用性。检查硬件加速器支持哪些 AI 框架(Caffe、PyTorch、TensorFlow 等)也是值得的。
然后是软件开发工具包,将 TensorFlow 等 AI 框架作为学习环境,并提供迎合学习模型和推理处理的数据转换工具。
开发套件如何促进数据中心工作负载的 AI 加速(图片:Xilinx)
硬件加速器 IP集成到芯片中的 AI 加速器也可用作硬件 IP。几家半导体公司通过 IP 许可模式提供用于定制芯片的 AI 加速器。
以加州米尔皮塔斯的 Gyrfalcon Technology Inc. (GTI) 为例,该公司为数据中心设计 AI 芯片,并为数据中心芯片提供 Lightspeeur 2803加速器 IP。Gyrfalcon 为被许可方提供 USB 3.0 加密狗,人工智能芯片设计人员可以在 Windows 和 Linux PC 以及 Raspberry Pi 等硬件开发套件上使用这些加密狗。
审核编辑:彭静最新内容
手机 |
相关内容
重庆东微电子推出高性能抗射频干扰
重庆东微电子推出高性能抗射频干扰MEMS硅麦放大器芯片,芯片,推出,算法,抑制,音频,信号,重庆东微电子有限公司最近推出了一款高性能写flash芯片时为什么需要先擦除?
写flash芯片时为什么需要先擦除?,擦除,芯片,充电,初始状态,存储单元,数据,Flash芯片是一种非易失性存储器技术,用于存储数据并实现固华为公开半导体芯片专利:可提高三维
华为公开半导体芯片专利:可提高三维存储器的存储密度,专利,存储密度,存储器,芯片,存储单元,调整,华为是全球领先的信息与通信技术解新一代8通道脑电采集芯片研制成功,
新一代8通道脑电采集芯片研制成功,铠侠与西部数据已中止合并谈判,合并,芯片,脑电,新一代,通道,产品,近日,一项重要的科技突破在全球范加特兰毫米波雷达SoC芯片赋能室内
加特兰毫米波雷达SoC芯片赋能室内安防新应用,毫米波雷达,芯片,用于,稳定性,目标,感知,室内安防是一个重要的领域,随着技术的进步和人电容式触摸按键屏中应用的高性能触
电容式触摸按键屏中应用的高性能触摸芯片,芯片,位置,触摸屏,能力,响应,用户,电容式触摸按键屏(Capacitive Touch Key Screen)是一种常台积电1.4nm,有了新进展
台积电1.4nm,有了新进展,台积电,行业,需求,竞争力,支持,芯片,近日,台积电(TSMC)宣布将探索1.4纳米技术,这是一项令人振奋的举措,将有望为E苹果即将推出Mac系列新品,或搭载3nm
苹果即将推出Mac系列新品,或搭载3nm M3芯片,芯片,搭载,推出,全新,市场,研发,近日,有关苹果即将推出新一代Mac系列产品的消息引起了广