首页 / 行业
智能语音创投趋缓 核心技术仍需升级
2020-01-05 00:01:00
在人类的感官通道中,视觉占据最主要的位置,听觉次之,但在信息传递中,听觉语言的综合利用率要远高于视觉符号。因此,更接近于人类本能的交互方式--语音交互受到广泛关注。目前,随着智能语音技术的发展和应用场景的不断丰富,人机交互方式已经开始从键盘、鼠标以及触摸式的图形交互,向语音模式转变,并且随着搭载量和使用率的提升,未来有望成为人机交互最主要的入口。
底层技术持续增强
智能语音包含语音识别、语义理解、自然语言生成以及语音合成等环节。其中,语音识别是率先商业化、应用最成熟的人工智能技术之一。根据信通院数据,全球智能语音识别错误率连续降低,从2008年的23.6%降低到2017年的5.5%。与此同时,国内厂商也在不断刷新准确率的上限。2018年6月,阿里巴巴推出语音识别模型DFSMN,准确率高达96.04%;科大讯飞也在同期宣布讯飞语音识别率提升至98%;2017年11月,百度大脑推出新款语音识别模型--“基于复数CNN网络的语音增强和声学建模一体化的端到端语音识别模型”,打破了传统远场语音识别技术的流程,将语音识别准确率提高30%以上。此外,大数据、深度学习、云计算等技术的迅速发展,也为智能语音提供了底层技术支持。应用场景丰富多元
在国家大力发展人工智能产业的战略引导下,以及企业技术能力提升和市场需求不断扩张的驱动下,智能语音技术在智能家居、车载环境、在线教育、医疗、呼叫中心等各个场景均有落地化应用。据中国电子信息产业发展研究院预测,未来三年智能语音市场将保持25%以上的增速,到2021年预计达到194.8亿元。例如,在智能家居方面,语音声控的应用增强了终端设备控制家居的简便性、易用性、互动性和娱乐性。目前,众多参与者以智能音箱作为智能家居语音交互的切入口。例如接入阿里智能家居平台的天猫精灵、提供智能家居控制入口的小度音箱、连接小米智能家居生态的小爱智能音箱等等。再如,在智能车载方面,从安全因素考虑,车载智能语音应用将是未来市场的刚需场景,如媒体娱乐、行车导航、信息查询、即时通讯等等。2016年11月,科大讯飞发布智能车载系统飞鱼助理,并于2017年11月发布2.0版本,该系统通过对语音引擎、生态引擎、云+端服务进行深度整合,并赋予智能人机交互方式,来为用户提供人脸识别、AI虚拟助手、声源定位、非全时免唤醒+上下文理解、自定义唤醒词、XTTS等功能。另外,在随身设备方面,随着设备功能的多元化,人们迫切需求摆脱传统输入设备的束缚,以智能手机为例,有关数据显示,到2023年智能手机配备语音交互功能的比例将达到90%以上。并且据IDC预测,到2020年随身设备的智能语音渗透率将达到68%。可见,智能语音拥有丰富的应用场景,渗透率也会不断提高。图:2020年智能语音渗透率预测数据来源:IDC创业及资本渐趋理性
智能语音市场参与者主要为科技巨头及传统智能语音企业,行业集中度较高。科技巨头在语音行业的布局多为对外开放语音生态系统,对内则在自身产品中实现AI First。例如,百度Dueros开放平台、阿里AliGenie开发者平台、腾讯的智能语音平台腾讯云小微等等。传统智能语音企业已在语音行业深耕多年,1999年成立的科大讯飞市场占有率已然位列第一,除了面向教育、司法、医疗、城市等领域推出智能语音解决方案以外,还向硬件方面拓展,推出了翻译机、学习机、录音笔等相关产品。此外,科技巨头和传统智能语音企业出于构建生态、积累数据等方面的考虑,大都提供开放平台,而初创企业则可以借此发挥后发优势。虽然头部企业已经处于绝对优势,但随着应用场景的丰富,行业机会仍不断涌现,智能语音初创企业也吸引了资本市场的关注。据<华秋创服>不完全统计,2000-2019年,共有55家智能语音方案企业获得融资,共计157笔,平均成立1.7年后获得第一笔融资,获投企业主要分布在北京、广东、上海等地;从时间分布来看,2015年开始进入融资高峰期,2019年有所下降,一定程度上反映了智能语音企业的创业热潮正逐渐趋于理性,市场也越来越重视企业的核心技术和落地能力。图:2000-2019年智能语音方案企业获投笔数数据来源:华秋创服图:2000-2019年获投智能语音方案企业地区分布数据来源:华秋创服市场前景广阔 技术仍待突破
IDC数据显示,智能语音在我国人工智能市场中的份额占有22%的比重。场景应用的普遍化,促使整个行业开始从发展初期向成熟期迈进。虽然科大讯飞、百度等占据了市场近七成的份额,但是,随着应用场景的拓宽,整个市场规模仍会不断扩大。不可否认的是,虽然智能语音技术飞速发展,但在实际应用环境中,语音信号往往伴随着环境噪声和混响,使得语音识别的性能急剧下降。例如,讯飞中英文语音识别准确率分别达到98%和95%,但在有方言、噪音、口音和远场情况下,提高语音识别准确率仍有较大的提升空间。再如机器翻译,虽然实时高效,但距离会议同传以及高水平翻译所讲究的“信、达、雅”仍存在较大差距。可见,虽然语音识别等某一技术环节已经取得较大发展,但面对应用场景的复杂性,智能语音技术仍有待突破。最新内容
手机 |
相关内容
位移传感器结构类型及工作原理与应
位移传感器结构类型及工作原理与应用,工作原理,类型,结构,位移传感器,常见,效应,FDV302P位移传感器是一种用于测量物体位移或位置的电容式触摸按键屏中应用的高性能触
电容式触摸按键屏中应用的高性能触摸芯片,芯片,位置,触摸屏,能力,响应,用户,电容式触摸按键屏(Capacitive Touch Key Screen)是一种常不只是芯片 看看传感器技术我们离
不只是芯片 看看传感器技术我们离世界顶级有多远,传感器,芯片,位置,测量,交通,用于,传感器技术是现代科技中至关重要的一部分,它们被小到一个分子!研究人员开发一种微小
小到一个分子!研究人员开发一种微小的压电电阻器,优化,位置,结构,用于,传感器,压电效应,近年来,随着电子技术的快速发展,对微小尺寸电高精度3D视觉技术,助力工业机器人实
高精度3D视觉技术,助力工业机器人实现汽车零部件高效上下料,工业机器人,助力,视觉,高精度,3D,算法,高精度3D视觉技术在工业机器人上工信部:聚焦人形机器人专用传感器
工信部:聚焦人形机器人专用传感器 突破视、听、力、嗅等高精度传感关键技术,传感器,突破,人形机器人,专用,精度,工信部,人形机器人是全极性霍尔芯片LM224DR2G可实现共
全极性霍尔芯片LM224DR2G可实现共享充电宝中位置检测功能,位置,检测,充电,宝中,芯片,输出,全极性霍尔芯片LM224DR2G是一种用于位置语音合成芯片与电子血压计的应用探
语音合成芯片与电子血压计的应用探索,芯片,语音合成,健康管理,智能语音,数据,用户,语音合成芯片和电子血压计是现代科技领域的两个