首页 / 行业
在某些事情上机器人可能比你更懂
2019-06-17 15:20:00
在美剧《硅谷》中,曾出现一个基于深度学习来识别热狗的 app : Not Hotdog ,可过去 AI 要识别一种食物已经不容易,但在未来你每一个细微的动作可能都逃不过 AI 的眼睛。
最近 Netflix 的高级数据科技学家 Amir Ziai 发布了一项新的研究,用 AI 识别电影中接吻场景,这项技术看似无聊,但对于视频行业却有着重要的意义。一般来说接吻场景会出现在影视作品高潮和关键节点,有了这项技术,视频网站可以直接在视频中标记,方便用户检索和查看,甚至可以自动剪辑成视频集锦推送给用户。
此外如果你是个恋爱新手,或许还能通过这个工具快速学习一下电影中的那些接吻技巧,速成接吻十八式(误)。但是要让机器看懂人是怎么接吻并容易,Amir Ziai 建立了一个 2.3TB 的数据库,包含了从 1915 年到 2016 年的 600 部好莱坞电影,包括不同的类型,每部大小在 200MB 到 12 GB 之间。
Amir Ziai 选取了其中 100 部电影进行手动标记,总共标记 263 个接吻片段和 363 个非接吻片段,时长从 10 秒到 120 秒不等,而且每个标记片段都会提取图像特征和音频特征。也就是说,AI 鉴定电影中的角色是否接吻,除了「看画面」,还会「听声音」,这有助于提高识别的准确率。经过测试,Amir Ziai 发现这套系统的识别接吻的准确率达到 95%。
正如 Amir Ziai 在研究中采取的方法,目前训练 AI 还离不开人工。类似的技术其实在优酷等视频网站已经开始应用,甚至还出现一种叫做「吻戏鉴定师」的新职业。去年优酷一个 29 岁的「吻戏鉴定师」吉恒杉就曾登上热搜,据吉恒杉介绍,为了教会计算机识别接吻等场景,需要从图片库和视频中截取数千幅照片,一张一张标记「接吻」的画面。
光接吻场景就需要标注 2000 多张照片,目前已经为「接吻」这个标签做了两万多张图像的标注。据称以目前阿里巴巴的视频识别技术,可以在 10 秒对 5 分钟的视频进行识别标记。以电视剧《三生三世十里桃花》,机器会将单集 50 分钟的视频切割成 3000 帧图片,只要 5 秒钟就能挑出杨幂和赵又廷的吻戏。
目前类似的技术正在向更多场景拓展,比如识别体育赛事中进球、投篮、庆祝等动作,甚至应用在视频之外的更多场景。据《华尔街日报》报道,中国平安正在使用面部识别系统识别客户脸上的微表情,以决定是否接受他们的投保,从 2016 年开始中国平安已经将这项技术应用于消费金融部门,作为发放贷款时风险评估的一部分。
有意思的是,根据国际权威人脸识别数据库 LFW 2107 年的一份测试结果,中国平安旗下平安科技的人脸识别技术以 99.8% 的识别精度和最低的波动幅度领先苹果、Google 等科技巨头,位居世界第一。而日本一家人工智能公司 Vaak 开发出的一款 AI 软件,能通过分析顾客的神情和肢体动作,从而找出潜在的扒手,并提醒店员注意,去年还在一家便利店就成功识别出一名可疑的顾客。
这种 AI 分析技术除了可用于零售商,未来还能在火车站台等公众场所预防自杀 ,将有自杀倾向的人检测出来,提前阻止跳轨自杀等悲剧发生。
从静态的图片到动态的画面,AI 识别的能力越来越强,但这也引发了一些人的担忧。美国公民自由联盟(ACLU)最近在一份报告中指出,人工智能技术的进步使得摄像头更加聪明,可能会让我们的每个动作都被识别,如果不加以控制,可能会引发不少隐私问题。
上周微软主动删除了其最大的公共人脸识别数据库 MS Celeb,可能就是担心这些数据和相关技术被滥用,但这不会影响 AI 技术不断进步,在不久的将来还可能引发更多的争议。
最新内容
手机 |
相关内容
AI换脸换声太逼真!遇到AI视频诈骗如
AI换脸换声太逼真!遇到AI视频诈骗如何识别?,活动,社交媒体,确认,账户,验证,真实照片,随着DCP010505BP-U人工智能技术的不断发展,AI换脸高精度3D视觉技术,助力工业机器人实
高精度3D视觉技术,助力工业机器人实现汽车零部件高效上下料,工业机器人,助力,视觉,高精度,3D,算法,高精度3D视觉技术在工业机器人上硅谷:设计师利用生成式 AI 辅助芯片
硅谷:设计师利用生成式 AI 辅助芯片设计,芯片,生成式,硅谷,优化,修改,方法,在硅谷,设计师们正在利用生成式人工智能(AI)来辅助芯片设计接近+触摸+按压:AI技术赋能,这个三合
接近+触摸+按压:AI技术赋能,这个三合一人机交互方案,太酷了!,方案,人机交互,三合,按压,智能,识别,近年来,随着人工智能(AI)技术的迅猛发展,什么是硅光电三极管,硅光电三极管的
什么是硅光电三极管,硅光电三极管的基本结构、优缺点、工作原理、应用、识别方法、检测、如何选用及发展历程,三极管,识别,工作原理从零基础开始,掌握低代码+ Al 的应
从零基础开始,掌握低代码+ Al 的应用技巧,零基础,方法,框架,工具,深度学习,学习,低代码(Low-Code)是一种通过可视化开发工具和少量手写智能振弦传感器:参数智能识别技术的
智能振弦传感器:参数智能识别技术的重要科技创新,智能,识别,参数,传感器,技术方面,用于,TPA3123D2PWPR智能振弦传感器是一种能够智能语音识别技术在智能客服领域的应用
语音识别技术在智能客服领域的应用与挑战,客服,智能,语音识别,模型,文本,系统,随着人工智能技术的不断发展,智能客服系统在许多企业