首页 / 行业
英特尔推动人工智能走向新阶段
2022-01-18 15:36:00
很多时候,机器学习和人工智能像是在远程、复杂的超级计算机上运行的高端技术,以解决棘手的问题。然而最近,我有幸与一群了不起的工程师和科学家合作,共同开展了一个将人工智能融入日常生活的重大项目。
从2019年开始,在ML Commons的支持下成立了一个工作组,旨在通过创建大规模、多样化和公开许可的语音数据集来增强并普及语音识别技术。迄今为止,该项目已经产生了两个顶级数据集,涵盖了全球数十个语种。该小组的成员来自英特尔、哈佛大学、阿里巴巴、甲骨文、Landing AI、密歇根大学、谷歌、百度等。
介绍这些口语数据集的两份白皮书——《人的语言》和《多语种口语语料库》,已于12月7日举办的NeurIPS大会上发布。其中,《人的语言》主要针对“自动语音识别”任务;《多语种口语语料库》则包含“关键词识别”。这两个项目的数据集都贡献了大量丰富的音频数据,且每个数据集在同类中都拥有最大的可用体量。
这将会对人们的日常生活产生哪些影响?通过对这些数据集的训练,计算机或其他设备可以“听到”口头语言并采取适当的行动,例如响应用户的查询或生成自动转录文本。在当今多元化、国际化、多语言的工作环境中,准确转录和翻译的能力愈发重要。
这两个项目都运用了“多样化语音”,这意味着它们更好地展现自然环境音,如背景噪音、非正式语言模式、录音设备混音以及其他声学环境等。这与诸如有声读物之类的高度受控的内容不同,后者产生的声音更加“纯净”。然而,在实际应用中,多样化语音训练有助于提高识别的准确性。
“人的语言”项目内含数万小时的对话音频。如今,它是世界上最大的、可免费下载的、用于学术和商用的英语语音识别数据集之一。
“多语种口语语料库”是一个音频语音数据集,不仅拥有超过30万个关键字的数十种语言,能够通过智能设备访问,还涵盖了50多亿用户的日常对话,有助于推动全球范围内受众语音应用的研发。
开发这些数据集的研究人员来自于一个跨越多个大洲的国际小组。多年来,我们每周通过电话会议会面,每个人都为项目贡献特定专业知识。
这两个数据集都将被研究人员和开发者广泛使用,而且它们包括商用在内的授权许可条款都相对较为宽松。适当开放授权的重要性被无意识地低估了,导致许多有应用前景的数据集在可用性和适用规模方面受到限制。
这两个数据集将由MLCommons进行长期维护。MLCommons是一个由全球技术提供商、学者和研究人员组成的联盟,而英特尔是联盟的创始成员之一。
在语言的人工智能领域,这个项目是一个飞跃,同时它也为未来开启了诸多可能性。未来,我期待与同事们继续合作,将其推向新的阶段。
原文标题:倾听世界:人工智能的突破
文章出处:【微信公众号:英特尔中国】欢迎添加关注!文章转载请注明出处。
审核编辑:汤梓红
最新内容
手机 |
相关内容
豪威发布新款 4K 分辨率图像传感器
豪威发布新款 4K 分辨率图像传感器,适用于安防摄像头,分辨率,新款,区域,像素,运行,图像,豪威科技最近发布了一款全新的4K分辨率BAS70英特尔不应该担心英伟达Arm架构的P
英特尔不应该担心英伟达Arm架构的PC芯片?恰恰相反,芯片,英伟达,英特尔,调整,研发,推出,英特尔目前是全球最大的半导体公司之一,主要以所有遥不可及,终因AI触手可及
所有遥不可及,终因AI触手可及,出行,平台,无人驾驶汽车,导致,人工智能,学习,人类历史上,有许多事物曾被认为是遥不可及的,然而随着科技面向6G+AI,鹏城云脑的演进
面向6G+AI,鹏城云脑的演进,鹏城,人工智能,数据存储,脑可,智能终端,智能,随着科技的不断进步,人们的生活方式也在不断改变。6G+AI(人工黑芝麻智能助力亿咖通科技旗下首款
黑芝麻智能助力亿咖通科技旗下首款智能驾驶计算平台成功量产交付,智能驾驶,计算,助力,首款,交付,智能,近年来,智能驾驶技术逐渐成为森萨塔推出首款经UL认证的A2L制冷
森萨塔推出首款经UL认证的A2L制冷剂泄漏检测传感器,检测,首款,认证,森萨塔,推出,传感器,森萨塔是一家专注于制冷和空调技术的领先公Transphorm推出TOLL封装FET,将氮化
Transphorm推出TOLL封装FET,将氮化镓定位为支持高功率能耗人工智能应用的最佳器件,支持,定位,推出,高功率,封装,器件,加利福尼亚州戈PODsys:大模型AI算力平台部署的开源
PODsys:大模型AI算力平台部署的开源“神器”,开源,模型,平台,运行,计算,用户,PODsys(Platform for Open-source Distributed System)是