首页 / 行业
Google以丰富的对话情境资讯改进客服中心AI的语音识别能力
2019-07-30 15:57:00

2018年Next大会上推出的人工智能预包装服务客服中心AI(Contact Center AI),现在Google透过增加人工智能理解对话情境的方法,进一步强化虚拟代理人语音识别的能力,用户现在还可以更灵活地自订定义Speech Context类别,减少人工智能对于文字概念混淆的问题。
Google提到,即便客服中心虚拟代理人的语音识别精准度达90%,但是比起实验室,实际使用环境以及杂讯的影响,在部分情况下,仍然会使得自动语音识别的结果变得很糟,因此现在Google进一步更新客服中心AI所使用的技术,特别是在Dialogflow以及云端语音转文字两服务,以提升辨识品质。
Dialogflow让用户能够在网页、行动应用程式或是热门的传讯平台,建构对话服务,而这次更新,Google为Dialogflow加入了自动语音调适能力(Auto Speech Adaptation),以对话情境资讯,解决虚拟代理人混淆单字发音的问题。
由于许多单字的读音很相似,在电话中可能无法很清楚传递,像是cheese和these的发音,还有可能把mail误翻成male或nail,但是当虚拟代理人知道这些对话背景,发生在速食餐厅或是商品退货时,便不容易混淆这些字。用户只要在Dialogflow控制台中,将自动语音调适功能打开,就能让语音识别准确度上升40%以上。
Google也改进了互动式语音应答(IVR)以及电话虚拟代理人,所使用的云端语音转文字基线模型,而这将会使语音转录的结果更好,Google以电话用语的常用短句最佳化了该模型,使得新模型的表现,在美国英文上的辨识准确度提高15%,再加上自动语音调适功能,还能进一步提升辨识的品质。
开发人员在使用云端语音转文字服务时,能使用SpeechContext参数来控制情境资讯,让语音转录更加精确,以让虚拟代理人更精准地辨识企业产品等特定名词。
而现在Google在SpeechContext中新增类别,而预定义的类别则对应到流行或是通用的概念上,使用情境像是在数字沟通时,4个数字的组合可能代表年、时间或是金钱,而开发者可以在SpeechContext类别,调校整个自动语音识别的单字列表,改善输入语音的转录结果。
不过,Google也提到,使用SpeechContext这样的工具,会增加部分短句被撷取的机率,这可能降低了语音有提及却没出现在转录文字上的错误,但同时也会增加语音未提及却出现在转录文字的情形,自动语音调适的强度需要权衡结果进行调整,而SpeechContext的Boost功能解决了开发者这样的烦恼,可以自动为使用案例调整语音调适的最佳强度。
过去云端语音转语音服务,处理语音只能以1分钟为单位,而这对于需要较长时间转录文字的使用案例,像是会议、即时影片或是电话等是个大问题,现在Google将处理语音时间上限提高至5分钟,而且API也允许开发人员开启新的串流对话,来接续前一个串流对话,以做到无限时间的串流语音转录文字。
最新内容
手机 |
相关内容
电容式触摸按键屏中应用的高性能触
电容式触摸按键屏中应用的高性能触摸芯片,芯片,位置,触摸屏,能力,响应,用户,电容式触摸按键屏(Capacitive Touch Key Screen)是一种常晶振在激光雷达系统中的作用
晶振在激光雷达系统中的作用,作用,系统,激光雷达,晶振,可靠性,选择,激光雷达(Lidar)是一种利用激光进行测距的技术,广泛应用于自动驾驶智能传感器助力打造数字经济数字世
智能传感器助力打造数字经济数字世界,数字,经济,传感器,助力,智能,及时发现,PCM1801U智能传感器是一种能够感知环境并将感知结果转苹果即将推出Mac系列新品,或搭载3nm
苹果即将推出Mac系列新品,或搭载3nm M3芯片,芯片,搭载,推出,全新,市场,研发,近日,有关苹果即将推出新一代Mac系列产品的消息引起了广有史以来最快的半导体“超原子”能
有史以来最快的半导体“超原子”能将芯片速度提升千倍,芯片,提升,可靠性,运动,结构,集成度,在半导体技术的发展历程中,有一项被称为穿心电容与普通电容的区别?穿心电容
穿心电容与普通电容的区别?穿心电容为何能有效地滤除高频噪声?,噪声,高频,噪声抑制,较好,心电,结构,穿心电容与普通电容的区别主要体平头哥首颗SSD主控芯片镇岳510问世
平头哥首颗SSD主控芯片镇岳510问世,将率先在阿里云数据中心部署,数据中心,芯片,平头,需求,可靠性,稳定性,近日,平头哥首颗SSD主控芯片电路板技术水平和质量水平,影响着机
电路板技术水平和质量水平,影响着机器人赛道的发展前景,赛道,精度,支持,竞争力,可靠性,能和,电路板技术水平和质量水平对机器人赛道