首页 / 行业
NVIDIA Riva用于构建和部署语音AI应用
2022-09-26 09:17:00
无论是用于虚拟助手、转录还是联络中心,语音 AI 服务都会将言语和对话转化为可创造业务奇迹的不同数据。
在本周举行的 GTC 大会上,NVIDIA 宣布NVIDIA Riva增加了新功能 – Riva 是 GPU 加速的软件开发套件,用于构建和部署语音 AI 应用。
Riva 的预训练模型现在提供七种语言版本,其中包括法语和印地语。未来将会提供更多语言版本:阿拉伯语、意大利语、日语、韩语和葡萄牙语。Riva 还提高了英语、德语、普通话、俄语和西班牙语版本的准确性。此外,它还增加了字词级置信度评分和说话人分辨(即在音频流中识别说话人的过程)等功能。
Riva 设计为允许在语音 AI 工作流的每个阶段进行完全可定制,以帮助高效解决独特问题。开发者也可以将其部署到他们希望数据出现在的地方:本地、混合多云、边缘或嵌入式设备。企业可以使用 Riva 改进服务,以及提升效率和竞争优势。
虽然对语音服务 AI 的需求一直很大,但开发工具却未能跟上需求。越来越多的人在家工作和学习、上网购物以及寻求远程客户支持,这给呼叫中心带来巨大压力,并使语音应用极限承压。根据 2022 年的一份彭博社报告[1],由于人手短缺给呼叫中心造成沉重打击,客户服务等待时间最近增加了两倍。
语音 AI 的进步提供了前进的道路。NVIDIA Riva 使企业能够探索更大的深度学习模型,并开发更为细致入微的语音系统。基于 Riva 构建的语音 AI 应用提供了更快改进服务的途径,同时有望改善客户体验和互动。
对语音 AI 应用的需求日益增长
Fortune Business Insights 这家机构指出,2021 年全球联络中心软件市场的价值约为 270 亿美元,预计到 2029 年,这一数字将增长接近三倍,达到 790 亿美元。
出现此大幅增长的原因是,自定义语音应用能够惠及几乎所有行业中各种规模的企业 – 从全球性企业,到提供基于语音 AI 的系统和云服务的原始设备制造商,再到系统集成商和独立软件供应商。
Riva SDK 加速 AI 工作流
NVIDIA Riva 包含预训练语言模型,客户可按照原样使用这些模型,也可使用NVIDIA TAO 工具套件(允许在无代码环境中使用自定义数据集)中的迁移学习工具来微调这些模型。客户可以优化和导出 Riva 自动语音识别 (ASR) 和文本转语音 (TTS) 模型,然后将其作为语音服务进行部署。
语音 AI 正在深入到越来越多类型的应用中,例如客户支持虚拟助手和聊天机器人、视频会议系统、汽车餐厅快餐订单、电话零售、媒体和娱乐等。全球许多公司都采用了 Riva 来推动语音 AI 开发工作,这些公司包括 T-Mobile、德勤、HPE、Interactions、1-800-Flowers.com、Quantiphi 和 Kore.ai。
T-Mobile在其 T-Mobile Expert Assist(一款定制的呼叫中心应用,使用 AI 来转录实时客户对话和推荐解决方案)中采用了 Riva,以协助 17000 位客户服务坐席完成工作。T-Mobile 计划不久后在全球部署 Riva。
慧与提供 HPE ProLiant 服务器系统,这些系统皆由 NVIDIA GPU 和 NVIDIA Riva 软件提供支持,能够开发和运行极具挑战性的语音 AI 和自然语言处理工作负载,从而轻松将音频转化为洞见。HPE ProLiant 系统和 NVIDIA Riva组成先进的全栈解决方案,可运行金融服务和其他行业应用。
HPE 的 HPE GreenLake 解决方案副总裁 Scott Ramsay 表示:“为了充分发挥 NVIDIA Riva 的功能,HPE 在 HPE Ezmeral 软件的基础上提供了基于 Kubernetes 的 NLP 参考架构。此系统通过 HPE GreenLake 云平台提供,使开发者能够加速开发和部署新一代语音 AI 应用。”
德勤为希望部署 ASR 和 TTS 用例(例如全球多家大型快速下单餐厅的接单系统)的客户提供有力支持。它还为医疗健康服务提供商开发聊天机器人服务,以便准确高效地转录患者问题和聊天要点。
美国德勤负责人 Christine Ahn 表示:“自然语言处理技术的进步使得设计经济高效的体验成为可能,从而能与客户进行有针对性、简单和自然的对话。我们的客户正在寻找简化的对话式 AI 部署路径,而 NVIDIA Riva 有效支持该路径。
Interactions已将 Riva 与其 Curo 软件平台集成在一起,为电信等众多行业的客户以及1-800-Flowers.com等已部署语音 AI 接单系统的公司打造无缝的个性化互动过程。
Kore.ai正将 Riva 与其 SmartAssist 语音 AI 联络中心即服务进行集成,此服务为该公司的 BankAssist、HealthAssist、AgentAssist、HR Assist 和 IT Assist 产品提供支持。该公司正在利用 NVIDIA Riva 开展概念验证工作。
Quantiphi是一家解决方案交付合作伙伴,正使用 Riva 为媒体和娱乐业客户(包括福克斯新闻)开发隐藏式字幕解决方案。它还使用 Riva 为电信和其他行业开发数字虚拟形象。
复杂的语音 AI 工作流,更轻松的解决方案
语音 AI 工作流可能很复杂,而且要跨多项服务进行协调。需要大规模运行微服务,同时要运行 ASR 模型、自然语言理解、TTS 和特定领域的应用。NVIDIA GPU 很适合用于加速此类专业任务。
Riva 提供用于构建语音 AI 应用的软件库,并且包含适用于 ASR 和 TTS 的 GPU 优化服务(使用了新的深度学习模型)。开发者可以将这几项语音 AI 技能融合到他们的应用中。
作为汇集各种 GPU 优化的 AI 软件、模型和 Jupyter Notebook 示例的中心,NVIDIA NGC可让开发者轻松访问 Riva 和预训练模型。
NVIDIA AI Enterprise是云原生的 AI 和数据分析软件套件,经过优化可助力各种组织使用 AI,而且还提供对 Riva 的支持。该套件经过认证,可随时随地(包括在企业数据中心和公有云等)进行部署,并包含全球企业支持,可保证 AI 项目按计划顺利进行。
在 NVIDIA LaunchPad 中的即用型基础架构上,通过分步引导式实验室试用 NVIDIA Riva。
审核编辑:汤梓红
最新内容
手机 |
相关内容
位移传感器结构类型及工作原理与应
位移传感器结构类型及工作原理与应用,工作原理,类型,结构,位移传感器,常见,效应,FDV302P位移传感器是一种用于测量物体位移或位置的加特兰毫米波雷达SoC芯片赋能室内
加特兰毫米波雷达SoC芯片赋能室内安防新应用,毫米波雷达,芯片,用于,稳定性,目标,感知,室内安防是一个重要的领域,随着技术的进步和人单相滤波器:从基础到应用的全面解读
单相滤波器:从基础到应用的全面解读,滤波器,能和,噪声,选择,信号,工作原理,TVP5146PFP单相滤波器是一种用于去除电源信号中的杂波和聊聊芯片中的负压产生机理及其应用
聊聊芯片中的负压产生机理及其应用,芯片,细胞,用于,测量,生物,结构,芯片中的负压是指在芯片内部产生的负压环境。在某些应用中,负压不只是芯片 看看传感器技术我们离
不只是芯片 看看传感器技术我们离世界顶级有多远,传感器,芯片,位置,测量,交通,用于,传感器技术是现代科技中至关重要的一部分,它们被小到一个分子!研究人员开发一种微小
小到一个分子!研究人员开发一种微小的压电电阻器,优化,位置,结构,用于,传感器,压电效应,近年来,随着电子技术的快速发展,对微小尺寸电Efuse是什么?聊聊芯片级的eFuse
Efuse是什么?聊聊芯片级的eFuse,状态,编码器,故障,加密,芯片,配置信息,Efuse是一种可编程的电子熔断器,用于在芯片级别实现非易失性存平头哥首颗SSD主控芯片镇岳510问世
平头哥首颗SSD主控芯片镇岳510问世,将率先在阿里云数据中心部署,数据中心,芯片,平头,需求,可靠性,稳定性,近日,平头哥首颗SSD主控芯片