首页 / 行业
AI+语音创造新价值
2019-04-28 10:28:00
到目前为止,您可能已经为Enterprise Connect 2019填写了评论,并且考虑到会议令人印象深刻,广泛的报道随处可见。EC19已经结束了,但我在这里有一篇观点文章,你不会在其他任何地方看到它,而且它只是松散地与该事件有关。
语音技术是EC19更有趣的主题之一--而不仅仅是因为我谈到了它--如果你想知道都谈到了什么,我有两个不同的例子可以分享,那是我为我的演讲所做的研究。
像其他任何事情一样,这个主题只有在以某种方式思考它时才有意义。我通过解释人工智能(AI)和语音是如何在非常不同的轨迹上的两个不同主题来开启我的演讲。人工智能是超级大肆宣传的,最热的话题,并且同时是面向各个方向的。没有重心,每个供应商都在尝试加入人工智能元素或人工智能赋能--无论销售什么。其中一些努力将取得成果,一些将悄然消失--语音是人工智能轨道的合理应用之一。
另一方面,语音技术非常成熟,迄今为止主要是功能性的,与音频转录和语言翻译有关的用例。现在,想象一下维恩图(Venn Diagram)和两者之间的重叠空间,这就是我看到新价值具有潜力的地方。AI是语音识别的新转折,由于各种原因,它将事物提升到一个全新的水平。
除了在语音准确性方面做出渐进但非常明显的改进之外,AI还将语境,意图,情感等带入等式,并提升语音的价值,实际上是用于协作等用例。这是一个单独的主题,对于这篇文章而言,我只想用我在演讲中提到的具体例子来说明发生了什么。
Otter.ai--Seeing is Believing-实时转录
我之前已经引用过这个例子,但它也适用于这篇文章。Otter.ai是AI Sense的独立产品,是实时转录产品的领先示例,我认为它很快将成为协作平台的标准功能。经常转录是在事实发生之后,但实时是在当下,并且正在成为使会议更具包容性的一种方式。
除了不必记笔记--因此在会议期间有更多的参与--这还有助于听力受损或无法跟随英语演讲的参与者与其他人保持同步。考虑与多文化参与者会面,其中英语不是母语,但也要考虑具有强烈口音的发言者,即使是讲英语的参与者也很难跟随。
我很厚颜无耻,但是在这里我想到的是Austin Powers的这个场景,当时他正在和他的爸爸一起玩耍。不仅是英语口音很大,甚至说英语的人都需要字幕,但是还有一层俚语解码--而这是另一个AI问题,我确信Otter的人们都在努力工作加以实现。
回到协作环境,实时转录和实时翻译的结合创造了另一个引人注目的用例。这种情况的变化已经存在了一段时间,我们在微软的EC19主题演讲中看到了一个很好的例子。单独地,这些功能中的每一个都令人印象深刻,但是当你展示它们一起工作时--正如微软所做的将一位中国演讲者的演讲翻译成英语一样--这是非常神奇的。
然后是AI部分,这是很多新价值的来源。Otter's Teams应用程序允许使用扬声器标记,并且所有文本都可搜索,很容易找到一个人说话的所有地点,甚至是两个特定人互相交谈的地方,或添加搜索词以便随时查找正在讨论转录中出现的这个词。搜索的可能性是无穷无尽的,这使得转录成为会议的有力增值项。
其他重要功能包括自定义语言参考,以便转录引擎能够准确地跟踪您的行业或特定项目的特定术语或缩略词。Otter。ai与大多数主要协作平台集成,因此它是您已经使用的增值服务。还有双因素身份验证可确保您的工作空间的安全性,特别是对于那些远程加入会议的人来说,他们的身份难以确定。
这些功能非常酷,但除非转录准确性很高,否则它们都不重要--不仅仅是为了阅读,还有实际上当你真正付出最多的注意力时。对于Otter.ai而言,准确性是一种自豪感--就像我一直在谈论的每个语音文本播放器一样--如果你看看该团队的背景,那么你一定相信血统论的正确存在。
最新内容
手机 |
相关内容
微软Ignite 2023技术大会:人工智能
微软Ignite 2023技术大会:人工智能转型,技术驱动变革,人工智能,趋势,智能,数据隐私,企业,解决方案,人工智能(Artificial Intelligence,A所有遥不可及,终因AI触手可及
所有遥不可及,终因AI触手可及,出行,平台,无人驾驶汽车,导致,人工智能,学习,人类历史上,有许多事物曾被认为是遥不可及的,然而随着科技面向6G+AI,鹏城云脑的演进
面向6G+AI,鹏城云脑的演进,鹏城,人工智能,数据存储,脑可,智能终端,智能,随着科技的不断进步,人们的生活方式也在不断改变。6G+AI(人工创造多样信号的万能工具:函数/任意
创造多样信号的万能工具:函数/任意波形发生器,函数,波形,信号,工具,创造,时钟,函数/任意波形发生器是一种用于产生各种形状和频率的工信部:聚焦人形机器人专用传感器
工信部:聚焦人形机器人专用传感器 突破视、听、力、嗅等高精度传感关键技术,传感器,突破,人形机器人,专用,精度,工信部,人形机器人是语音合成芯片与电子血压计的应用探
语音合成芯片与电子血压计的应用探索,芯片,语音合成,健康管理,智能语音,数据,用户,语音合成芯片和电子血压计是现代科技领域的两个语音芯片故障的原因简述
语音芯片故障的原因简述,原因,故障,芯片,语音,温度,确保,TS5A3157DCKR语音芯片是一种集成电路,用于处理和识别语音信号。通常由数字Transphorm推出TOLL封装FET,将氮化
Transphorm推出TOLL封装FET,将氮化镓定位为支持高功率能耗人工智能应用的最佳器件,支持,定位,推出,高功率,封装,器件,加利福尼亚州戈