首页 / 行业
人工智能实现“闻声识人”但远未达到完美
2019-06-13 16:21:00
美媒称,人工智能(AI)现在可以做到只参考一小段音频,就能生成一个人面部的数字图像。
据美国趣味科学网站6月11日报道,科学家用网上数百万段教学视频,对这种名为“讲话到面孔”的神经网络——以类似人脑方式“思考”的计算机——进行了训练,视频内容是10万多个不同面孔讲话的场景。
研究人员在一项新的研究结果中写道,通过这些数据集,“讲话到面孔”掌握了声音信息与人脸某些特征之间存在的关联。然后,人工智能会利用一段音频来塑造与语音匹配的拟真面孔。
这一研究结果5月23日发表在阿奇夫论文预印本网站上,尚未接受同行评议。
报道称,值得庆幸的是,人工智能(尚)不能仅凭一个人的声音就知道他到底长什么样。研究报告的撰写者说,该神经网络会识别讲话中指向性别、年龄和种族的一些标记,这些特征是许多人共有的。
科学家在研究报告中写道:“如此一来,该模型只会形成普通长相的面孔。它不会形成特定个人的形象。”
人工智能已经证明,它可以生成准确度高得惊人的人脸,不过坦率地讲,它所塑造的猫脸有点恐怖。
报道称,“讲话到面孔”生成的人脸——都是面朝前方,没什么表情——与声音背后的人并不严格匹配。不过研究结果表明,它生成的形象确实经常捕捉到了讲话者正确的年龄段、种族和性别。
然而,这种算法对声音信息的解读还远未达到完美。在面对不同的语言时,“讲话到面孔”表现得好坏参半。例如,人工智能在听了一段亚洲人讲中文的音频后,相关程序形成了一个亚洲人的面孔。然而,据科学家说,当同一个人在另一段音频中用英语说话时,人工智能生成了一个白人的面孔。
该算法还显示出性别上的偏见,将低沉的声音与男性面孔联系起来,将尖细的嗓音与女性面孔联系起来。研究人员在报告中写道,由于用来训练人工智能的数据集只是YouTube网站上的教学视频,因此“不能代表全世界的人口”。
最新内容
手机 |
相关内容
微软Ignite 2023技术大会:人工智能
微软Ignite 2023技术大会:人工智能转型,技术驱动变革,人工智能,趋势,智能,数据隐私,企业,解决方案,人工智能(Artificial Intelligence,A重庆东微电子推出高性能抗射频干扰
重庆东微电子推出高性能抗射频干扰MEMS硅麦放大器芯片,芯片,推出,算法,抑制,音频,信号,重庆东微电子有限公司最近推出了一款高性能所有遥不可及,终因AI触手可及
所有遥不可及,终因AI触手可及,出行,平台,无人驾驶汽车,导致,人工智能,学习,人类历史上,有许多事物曾被认为是遥不可及的,然而随着科技面向6G+AI,鹏城云脑的演进
面向6G+AI,鹏城云脑的演进,鹏城,人工智能,数据存储,脑可,智能终端,智能,随着科技的不断进步,人们的生活方式也在不断改变。6G+AI(人工阅流智作:一种全新的生成式AI视频制
阅流智作:一种全新的生成式AI视频制作方式,或将颠覆专业视频生产,生成式,全新,视频制作,数据,学习,用户,阅流智作是一种全新的生成式ATransphorm推出TOLL封装FET,将氮化
Transphorm推出TOLL封装FET,将氮化镓定位为支持高功率能耗人工智能应用的最佳器件,支持,定位,推出,高功率,封装,器件,加利福尼亚州戈超小封装功放芯片NTA4153NT1G介绍
超小封装功放芯片NTA4153NT1G介绍,芯片,封装,支持,高性,音频,清晰,NTA4153NT1G是一款超小封装功放芯片,它具有高性能和低功耗的特点芯朋微:服务器配套系列芯片已通过客
芯朋微:服务器配套系列芯片已通过客户验证 可应用于AI服务器,服务器,客户,芯片,验证,人工智能,公司,芯朋微是一家专注于人工智能芯片