首页 / 行业
OpenAI研究人员开发出新的机械臂
2021-02-23 10:40:00
近日,两个由 OpenAI 的研究人员开发的一模一样的机械臂爱丽丝和鲍勃,可以在模拟情景中通过对弈互相学习,而不需要人为输入文本。
其中一个虚拟机械臂已经学会解决各种不同的难题堆积木、摆放桌子、排列国际象棋棋子,并且每项任务不需要进行再训练。这一切通过与另一个机械臂对弈得以实现。据了解,另一个机械臂经过训练后,会给原本的机械臂臂带来越来越难的挑战。
这些机器人采用的是强化学习算法,即在不同情况下,通过试错来训练人工智能,并采取不同行动来实现目标。游戏包括在虚拟桌面上移动物体。例如,通过以特定的方式排列物体,爱丽丝试图设置对鲍勃来说很难解决的谜题,而鲍勃会试图解决爱丽丝的谜题。随着它们的学习,爱丽丝会设置更复杂的谜题,而鲍勃也会越来越会解谜。
经过爱丽丝设置的积木谜题的训练后,鲍勃便可以通用于一系列任务,包括摆放桌子和排列象棋棋子。
通常在多重任务处理中,深度学习模型必须在任务间进行再训练。例如,AlphaZero (一款棋类 AI,可以通过自我博弈来学习)会使用单一算法教自己下国际象棋、将棋和围棋但每次只能下一盘棋。例如,下国际象棋的时 AlphaZero 不能下围棋,下围棋时的 AlphaZero 不能下将棋。因此,造出真正能同时处理多任务的机器,是走向更通用的人工智能道路上的一大未解难题。
训练 AI 同时执行多重任务时会遇到一个问题,即需要大量的例子。OpenAI 则通过训练爱丽丝为鲍勃生成例子,用一个 AI 训练另一个 AI 来避免这个问题。经过训练,爱丽丝学会了设定目标,比如建造一座积木塔,然后把它捡起来并加以平衡。鲍勃学会了利用虚拟环境的属性,如通过摩擦力来抓取和旋转物体。
截至目前,虚拟现实的训练只在虚拟环境中进行,但 OpenAI 和其他机构的研究人员正在将虚拟环境中训练的模型转移到物理环境中,且越来越有起色。据悉,模拟环境可以让 AI 在短时间内处理大型数据集,然后研究人员会根据现实世界的环境再对其进行微调。
该团队的研究人员表示,他们的最终目标是训练这些机械臂去解决人类可能要求它做的任何任务。与 GPT-3 一样(GPT-3 是一个能以各种不同方式使用语言的语言模型),这些机器人手臂是 OpenAI 打造多任务人工智能整体目标的一部分,而使用一个 AI 来训练另一个 AI 也许是其中的关键所在。
责任编辑:YYX
最新内容
手机 |
相关内容
什么是互感器,互感器的组成、特点、
什么是互感器,互感器的组成、特点、原理、分类、操作规程及发展趋势,发展趋势,分类,输入,计量,用于,信号,AD574AKD互感器是一种用于STC15W芯片A/D、D/A转换的简单使用
STC15W芯片A/D、D/A转换的简单使用,简单使用,转换,芯片,模拟,输入,输出,STC15W系列芯片是一种高性能的单片机芯片,具有丰富的外设资所有遥不可及,终因AI触手可及
所有遥不可及,终因AI触手可及,出行,平台,无人驾驶汽车,导致,人工智能,学习,人类历史上,有许多事物曾被认为是遥不可及的,然而随着科技黑芝麻智能助力亿咖通科技旗下首款
黑芝麻智能助力亿咖通科技旗下首款智能驾驶计算平台成功量产交付,智能驾驶,计算,助力,首款,交付,智能,近年来,智能驾驶技术逐渐成为硅谷:设计师利用生成式 AI 辅助芯片
硅谷:设计师利用生成式 AI 辅助芯片设计,芯片,生成式,硅谷,优化,修改,方法,在硅谷,设计师们正在利用生成式人工智能(AI)来辅助芯片设计阅流智作:一种全新的生成式AI视频制
阅流智作:一种全新的生成式AI视频制作方式,或将颠覆专业视频生产,生成式,全新,视频制作,数据,学习,用户,阅流智作是一种全新的生成式A清华研制出首个全模拟光电智能计算
清华研制出首个全模拟光电智能计算芯片ACCEL,芯片,智能计算,模拟,清华,混合,研发,清华大学最近成功研制出了一款全模拟光电智能计算如何利用示波器快速测量幅频特性?有
如何利用示波器快速测量幅频特性?有何注意事项?,测量,示波器,连接,输入,信号,频率,利用示波器快速测量幅频特性是一种常用的方法,可以