首页 / 行业
科大讯飞多模语音增强技术打造地铁智慧交通应用
2023-01-16 14:15:00
在2022年11月28日,深圳地铁12号线正式开通!此次项目中,科大讯飞携手达实智能与深圳地铁深度合作,打造了一系列智慧化的应用场景。
多模语音增强技术率先用于深圳地铁语音购票
该项目智慧客服中心采用AI数字客服为乘客提供语音交互服务,可让乘客通过语音交互自助完成信息查询、车票购买。在过去因为地铁站点太多,乘客在售票机买票时很难快速找到要去的站点,而这对于不太会操作设备的老年人来说更是难上加难,一堆站点看花了眼。这些问题在加上语音购票的功能后迎刃而解,乘客只要说出想去哪里即可买票,大幅提升了乘客的购票体验。
在地铁站人声嘈杂的场景下,使用语音进行购票理论上交互体验并不好。以往常规方案受周边杂声影响较大,语音识别准确率相对较低,经常出现“答非所问”的情况。而在深圳地铁12号线智能售票机及智慧客服终端上,率先采用了科大讯飞最新发布的多模语音增强技术,该技术通过人脸唇形等多模信息的使用,能有效抑制地铁环境噪音和后排说话人声,让嘈杂环境下机器的语音识别准确率大大提高,避免了语音交互时被旁边人说话带“跑偏”的尴尬,有效提升了嘈杂环境下的语音交互体验。在科大讯飞多模态语音识别技术的加持下,12号线地铁购票的体验提升显著,受到了很多乘客的好评。
从单模态到多模态,科大讯飞持续向新
人类通过眼、耳、鼻、舌等多个器官同时感知世界,而机器若想更自然与人类交流,当然也需要通过多模态感知。多模语音增强技术,作为科大讯飞新推出的解决公共场景下语音交互难题的最新技术,打破以往纯声学降噪的方式,将机器视觉也融合到环境降噪技术中,使其能够在多人同时说话的嘈杂场景中,将其他人声和环境噪声进行过滤,准确地把目标说话人的声音分离出来进行识别。通过这种单模到多模的技术创新,使得在同方向有人说话干扰的场景下,多模语音增强技术的识别准确率对比传统语音识别技术相对提升70%以上。它不仅让设备能听见,还能看见你说话,就像武侠小说中的“读唇术”一样,知道你在说什么。
讯飞AIUI开放平台,致力AI技术落地更多场景
事实上,地铁智能售票机及智慧客服终端仅是科大讯飞AIUI开放平台支持合作伙伴打造的项目之一,平台开放的多模语音增强技术在医疗自助机、银行柜员机、取款机以及商用服务机器人等项目上也有相似的应用场景。在人声嘈杂的公共场所,通过多模态语音技术均可有效降低环境噪音的干扰,提高语音识别准确率,保障用户的对话交互体验。
目前,讯飞开放平台已经开放542项AI能力和解决方案,聚集375万开发者团队,总应用数达158万,是首批国家新一代人工智能开放创新平台。未来AIUI作为讯飞人机交互的开放平台,将通过更多AI技术赋能合作伙伴,在更多的场景落地多模态语音增强技术,为客户创造价值,也为用户带来更多新的体验。
最新内容
手机 |
相关内容
重庆东微电子推出高性能抗射频干扰
重庆东微电子推出高性能抗射频干扰MEMS硅麦放大器芯片,芯片,推出,算法,抑制,音频,信号,重庆东微电子有限公司最近推出了一款高性能DigiKey 推出《超越医疗科技》视频
DigiKey 推出《超越医疗科技》视频系列的第一季,推出,医疗科技,健康,需求,产品,诊断,全球供应品类丰富、发货快速的现货技术元器件苹果即将推出Mac系列新品,或搭载3nm
苹果即将推出Mac系列新品,或搭载3nm M3芯片,芯片,搭载,推出,全新,市场,研发,近日,有关苹果即将推出新一代Mac系列产品的消息引起了广英特尔不应该担心英伟达Arm架构的P
英特尔不应该担心英伟达Arm架构的PC芯片?恰恰相反,芯片,英伟达,英特尔,调整,研发,推出,英特尔目前是全球最大的半导体公司之一,主要以消除“间隙”:力敏传感器如何推动新
消除“间隙”:力敏传感器如何推动新颖的HMI设计,传感器,智能手机,交互,交互方式,操作,用户,随着科技的不断发展,人机交互界面(HMI)的设英飞凌推出XENSIV胎压传感器,满足智
英飞凌推出XENSIV胎压传感器,满足智能胎压监测系统的需求,智能,胎压传感器,推出,胎压监测系统,英飞凌,需求,英飞凌(Infineon)是一家全接近+触摸+按压:AI技术赋能,这个三合
接近+触摸+按压:AI技术赋能,这个三合一人机交互方案,太酷了!,方案,人机交互,三合,按压,智能,识别,近年来,随着人工智能(AI)技术的迅猛发展,工信部:聚焦人形机器人专用传感器
工信部:聚焦人形机器人专用传感器 突破视、听、力、嗅等高精度传感关键技术,传感器,突破,人形机器人,专用,精度,工信部,人形机器人是