首页 / 行业
NVIDIA携手腾讯云共同打造高性能的音视频解决方案
2022-09-01 09:39:00
腾讯云音视频 PaaS 平台与 NVIDIA 团队合作,利用 NVIDIA TensorRT 加速视频直播和点播业务中视频增强 AI 模型的推理效率;借助 NVIDIA Maxine Video Effects SDK 的 AI 绿幕功能实现高性能高精度的人像分割,提升云导播台服务的用户体验。
腾讯云音视频 PaaS 平台专注技术产品,构建了行业中极速高清智能转码、超低时延快直播的音视频解决方案,连续四年居于市场份额和解决方案首位[1],覆盖国内 90% 音视频客户。团队通过不断的技术创新和产品优化引领行业发展,其中,腾讯云-媒体处理融合视频 AI 技术持续突破核心编解码技术,2021/2022 MSU 世界云端视频转码比赛综合最佳,且在最新的 SLC 评测中,也取得多项最佳的成绩,另外腾讯云-媒体处理服务支撑全网 40%+ 实时媒体处理量[2]。"低延时、低码率、高画质",腾讯云音视频为全真互联时代,提供坚实的数字化助力。
在构建高品质高性能的音视频解决方案的过程中,往往会面临许多挑战。
首先,由于网络传输或采集设备不佳的原因,直播或点播的画质可能出现不清晰的问题,此时需要应用视频增强算法,如视频超分辨率。为了不影响用户的观看体验,视频增强算法需要以足够低的延时运行。此外,音视频 PaaS 平台还需要对视频进行高效的视频标签识别、视频分类、视频剪辑等,这都必须藉由 AI 模型的推理速度,达到最佳程度的优化和加速。
另外,在直播场景中,用户希望对主播直播的画面应用虚拟背景,这要求将人像从直播画面中精准地分割出,并应用预设的背景。如何获得实时性高、准确性强的人像分割也是一个难点。
腾讯云音视频 PaaS 平台与 NVIDIA 在诸多产品和业务中开展了深入合作,共同打造高性能的音视频解决方案。
在云直播 CSS 服务以及媒体处理 MPS 服务中,腾讯云推出视频增强功能。为了加速视频增强模型的推理速度,腾讯云使用了 NVIDIA TensorRT 对模型进行高性能优化。TensorRT 是构建在 NVIDIA 的并行编程模型 CUDA 基础之上的,结合最新一代 NVIDIA Ampere 架构 GPU,TensorRT 还可以利用 Tensor Core 实现稀疏性加速的特点。对于深度学习推理应用的生产环境部署方面,TensorRT 提供了 INT8 和 FP16 的优化,低精度推理能够极大的降低应用的延迟,有益于实现实时视频增强服务。
在云直播 CSS 云导播台业务的 AI 智能人像抠图功能中,腾讯云采用了 NVIDIA Maxine Video Effects SDK 中提供的 AI Green Screen(简称 AIGS)功能,对直播画面进行实时而准确的人像分割。Maxine AIGS 对视频流抠图的精度和稳定性做了专门的优化,并且加入了 CUDA Graph 优化技术,及时在 GPU 负载高的时候也能降低整体的延时,使得云导播台的人像分割模块能实现多路并发、远超实时的处理高效率。Maxine AIGS 提供了简单易用的 API 接口,腾讯云音视频 PaaS 平台可直接在 FFmpeg filter 中通过 API 调用该功能,并可与其他多媒体处理 filter 联动对视频流进行处理。
最后,在媒体处理 MPS 业务中的视频 AI 功能,涉及到了多个深度学习模型的推理,腾讯云同样采用 NVIDIA T4 GPU 进行高性能推理。这得益于几乎所有主流的深度学习框架均能在 NVIDIA GPU 上执行高效计算。
NVIDIA TensorRT 在腾讯云音视频 PaaS 平台的提供的视频增强和视频 AI 功能中,使得推理阶段的应用在 NVIDIA T4 GPU 上可以实现同比单一 CPU 平台高达 40 倍的加速效果。TensorRT 可以从所有主流的深度学习框架中导入训练好的模型并进行优化,同时提供相应的 API 和解析器,生成经过优化的运行时引擎可以部署到画质增强服务中。
未来,腾讯云音视频 PaaS 平台与 NVIDIA 将持续合作,进一步提升音视频产品和服务中 AI 算法的性能。双方将基于 NVIDIA TensorRT 最新的特性,利用低精度和稀疏化模型压缩技术,对云直播和云点播业务中涉及到的视频增强与视频 AI 功能模型的推理进行大幅加速。此外,NVIDIA Maxine 在视频特效和音频特效方面持续发布新特性,包括音频超分技术、立体环绕声增强技术等,也将助力腾讯云音视频 PaaS 平台提供更丰富的音视频服务和功能。双方在未来也将不断探索打造编解码、AI、图形渲染全流程 GPU 加速的视频处理方案。
审核编辑:汤梓红
最新内容
手机 |
相关内容
华为公开半导体芯片专利:可提高三维
华为公开半导体芯片专利:可提高三维存储器的存储密度,专利,存储密度,存储器,芯片,存储单元,调整,华为是全球领先的信息与通信技术解电容式触摸按键屏中应用的高性能触
电容式触摸按键屏中应用的高性能触摸芯片,芯片,位置,触摸屏,能力,响应,用户,电容式触摸按键屏(Capacitive Touch Key Screen)是一种常苹果即将推出Mac系列新品,或搭载3nm
苹果即将推出Mac系列新品,或搭载3nm M3芯片,芯片,搭载,推出,全新,市场,研发,近日,有关苹果即将推出新一代Mac系列产品的消息引起了广美光低功耗内存解决方案助力高通第
美光低功耗内存解决方案助力高通第二代骁龙XR2平台,解决方案,助力,低功耗,内存,美光,第二代,随着虚拟现实(VR)和增强现实(AR)技术的迅猛苹果发布M3系列新款MacBook Pro/iM
苹果发布M3系列新款MacBook Pro/iMac:业界首批PC 3nm芯片,新款,芯片,业界,核心,用户,性能,近日,苹果公司发布了M3系列新款MacBook Pro消除“间隙”:力敏传感器如何推动新
消除“间隙”:力敏传感器如何推动新颖的HMI设计,传感器,智能手机,交互,交互方式,操作,用户,随着科技的不断发展,人机交互界面(HMI)的设新思科技与Arm持续加速先进节点定
新思科技与Arm持续加速先进节点定制芯片设计,芯片,节点,核心,解决方案,功耗,工具,新思科技(Synopsys)是一家全球领先的电子设计自动化阅流智作:一种全新的生成式AI视频制
阅流智作:一种全新的生成式AI视频制作方式,或将颠覆专业视频生产,生成式,全新,视频制作,数据,学习,用户,阅流智作是一种全新的生成式A