首页 / 行业
英特尔推出采用开源软件的行业领先数据中心GPU
2022-05-14 11:58:00
英特尔 至强 可扩展处理器是面向云游戏、多媒体处理与传输、虚拟桌面基础架构和推理运算的处理器标杆,致力于为当今的媒介消费提供鼎力支持。随着当前工作负载密度和复杂程度的快速增长,以上每个细分领域都将提出不同的工作负载需求,包括从处理像素、推理和分析、到渲染新的画面内容,再到将这些像素输出至客户端设备进行查看或进一步分析。然而,目前这些工作都是通过在云端的各个独立产品来完成的。
在本届英特尔On产业创新峰会(Intel Vision)上,英特尔分享了其代号为Arctic Sound-M(ATS-M)的数据中心GPU的更多细节。ATS-M是一颗支持高质量转码和高性能的强大GPU,能够提供每秒150万亿次运算(150 TOPS),共拥有两种配置。ATS-M能够通过单一解决方案灵活地处理广泛的工作负载,并在不牺牲性能或者质量的同时,优化总体拥有成本(TCO)。
面向数据中心工作负载的多用途GPU
该英特尔数据中心GPU将包含两种不同的配置。150W功率版本在一个3/4长、全高尺寸的PCIe 4.0加速卡中封装了32个Xe 内核。75W功率版本则在半高尺寸的PCIe 4.0加速卡中封装了两颗具有8个Xe 内核的GPU,共16个Xe 内核。这两种配置均配备了4个Xe 媒体引擎、英特尔首款面向数据中心的AV1硬件编码器和加速器、GDDR6内存、光线追踪单元和内置XMX AI加速。
采用开源软件的行业领先数据中心GPU
该英特尔数据中心GPU由完整的解决方案堆栈支持,为开发者提供了面向流媒体、云游戏和云端推理的开源软件堆栈,并广泛支持AVC、HEVC、VP9,以及更多API、框架和最新的编解码器。
oneAPI为加速计算提供了高效、智能的路径,让开发者免受专有编程模型所带来的经济和技术负担。它为专用硬件的封闭编程语言供了开放的选择,即通过一套完整、可靠的工具包来完善现有编程语言和并行计算模型,从而释放硬件的全部性能,并且能够让开发者设计出开放、可移植的代码,更大限度地利用多种CPU和GPU的组合。
云游戏
全球云游戏市场呈现持续快速增长趋势,预计到2026年,其复合年增长率(CAGR)将达到43.2%,市值将近32亿美元①。英特尔可为Windows和Android云游戏平台提供支持,为广大玩家带来高品质的游戏体验。ATS-M拥有两种不同的产品外形设计,用户可灵活地选择符合他们特定工作负载的产品配置。无论用户对峰值性能、高密度提出需求,还是期待通过一个平台满足跨智能手机和PC游戏的融合云游戏解决方案,这款GPU均可以提供出色的游戏串流体验。
全堆栈媒体流支持
该GPU配备了英特尔首款基于硬件加速的AV1编码器,可在不牺牲质量的同时,带来30%②比特率的提升。③作为引领新一代媒体串流的GPU,它可实现一卡同时处理多达8路4K视频流或超过30路1080p视频流。在一台4卡服务器中,可以实现每节点处理120路视频流以及每机架处理13,000路视频流。
利用Intel oneVPL,媒体串流和传输软件堆栈可以面向包括AV1在内的所有主流编解码器进行解码和编码加速。流媒体发行商可以在FFmpeg或GStreamer这两大领先多媒体处理框架中进行选择,它们均可通过oneVPL针对英特尔CPU和GPU进行加速。英特尔还提供了开放视觉云(Open Visual Cloud),这是一套用于媒体、分析、图形和沉浸式媒体的开源软件堆栈,它针对云原生部署进行了优化,使其能够在FFmpeg和GStreamer框架内运行。
全堆栈虚拟桌面基础架构支持(VDI)
过去两年,随着远程办公需求的增加,虚拟桌面基础架构(VDI)和设备即服务(DaaS)迎来了快速增长(最近一项研究表明增长超过11%④)。现代操作系统和应用程序对图形处理的要求越来越高,显示器的分辨率也随之提高;GPU可以通过承载渲染和编码功能,以更短的响应时间和更高的帧率来改善用户体验。由此释放出来的CPU处理能力可以带来应用程序工作负载的性能提升。
英特尔的这款数据中心GPU还提供了灵活的虚拟GPU(vGPU)调度策略(固定的、灵活的以及硬件利用率优化过的时间片任务调度器),让管理员能够单独微调GPU上每个虚拟机的运行指令。目前,其他厂商的产品仅允许在所有虚拟机的全局设置中进行相关调整。
与目前市面上其他产品不同的是,英特尔不会针对基于硬件的可扩展I/O虚拟化(SIOV)额外收取任何软件授权费,这将有助于相关提供商降低虚拟化部署的总成本。
全堆栈媒体分析支持
每个在视觉媒体场景执行的推理都需先经过视频解码和预处理,然后才能交给AI模型进行下一步操作。集成两颗GPU的75W功率版本ATS-M能够在计算和解码能力上实现很好的平衡,且不受媒体限制。因此,它能够针对媒体分析类的工作负载提供良好的扩展性,为客户提供更高的流密度和更低的成本。
在使用oneVPL对于视频流的解码和编码进行加速的同时,oneDNN(oneAPI深度神经网络库)可针对内核进行AI优化,加速面向TensorFlow或PyTorch框架的推理模型;也可通过OpenVINO的模型优化器和推理引擎,进一步加速推理以及客户工作负载的部署。上述AI和媒体软件以及堆栈的组合可以在至强处理器和英特尔数据中心GPU之间无缝运行。
代号为Arctic Sound-M的英特尔数据中心GPU已经获得超过15款来自业界领先合作伙伴的设计,并将于2022年第三季度发布。
原文标题:英特尔公布代号Arctic Sound-M数据中心GPU的更多细节
文章出处:【微信公众号:英特尔中国】欢迎添加关注!文章转载请注明出处。
审核编辑:汤梓红
最新内容
手机 |
相关内容
豪威发布新款 4K 分辨率图像传感器
豪威发布新款 4K 分辨率图像传感器,适用于安防摄像头,分辨率,新款,区域,像素,运行,图像,豪威科技最近发布了一款全新的4K分辨率BAS70低耗能,小安派-LRW-TH1传感器通用板
低耗能,小安派-LRW-TH1传感器通用板,一块板即可连接多种传感器!,传感器,多种,连接,一块,通用,接口,小安派-LRW-TH1传感器通用板是一款英特尔不应该担心英伟达Arm架构的P
英特尔不应该担心英伟达Arm架构的PC芯片?恰恰相反,芯片,英伟达,英特尔,调整,研发,推出,英特尔目前是全球最大的半导体公司之一,主要以变频器过载保护和过流保护有什么区
变频器过载保护和过流保护有什么区别?,变频器,频率,超过,损害,方法,负载,BCP55变频器过载保护和过流保护是两种不同的保护机制,用于保平头哥首颗SSD主控芯片镇岳510问世
平头哥首颗SSD主控芯片镇岳510问世,将率先在阿里云数据中心部署,数据中心,芯片,平头,需求,可靠性,稳定性,近日,平头哥首颗SSD主控芯片新思科技与Arm持续加速先进节点定
新思科技与Arm持续加速先进节点定制芯片设计,芯片,节点,核心,解决方案,功耗,工具,新思科技(Synopsys)是一家全球领先的电子设计自动化高通骁龙8 Gen4曝光:升级台积电3nm
高通骁龙8 Gen4曝光:升级台积电3nm CPU回归自研架构,升级,台积电,优化,能和,功耗,处理器,高通骁龙8 Gen4是高通公司即将推出的一款NEMTK天玑9300重磅发布:全大核时代到
MTK天玑9300重磅发布:全大核时代到来,330亿参数AI大模型装入手机,装入,模型,参数,时代,支持,处理器,近日,联发科技(MediaTek)正式发布了