首页 / 行业
如何让3D人形机器人学会行走
2019-06-15 11:20:00
来自英特尔AI实验室和俄勒冈州立大学工程学院协作机器人和智能系统研究所的研究人员结合了多种方法,制作了性能更好的强化学习系统,可应用于机器人控制,控制自主车辆功能的系统和其他复杂系统。
协同进化强化学习(CERL)可以在类人、Hopper、Swimmer、HalfCheetah和Walker2D等基准测试中获得更好的性能。使用CERL方法,研究人员能够基于OpenAI的Humanoid基准测试使3D人形机器人直立行走。
这些成果在一定程度上是通过训练系统实现的,该系统探索了更多的强化学习训练环境,以寻求奖励并完成特定的任务。
环境探索对于确保记录各种经验并考虑行动方案非常重要。研究人员在一篇解释CERL工作原理的论文中说,与环境探索相关的问题已经出现,特别是在使用深度强化学习来完成具有挑战性的现实任务越来越普及的情况下。该论文写道,“神经进化将整个过程结合在一起,产生了一个超越任何个体学习者能力的学习者。”
CERL将基于策略梯度的强化学习和进化算法相结合,然后在每批或每一代训练系统中选择表现最佳的神经网络。这样,研究人员可以就可以使用最强大的神经网络来创建新一代的系统,并且可以将计算资源分配给实现最佳性能的算法。
CERL还结合了重放缓冲区,用于存储学习者在环境中的体验,以便创建单个重放缓冲区并在系统之间共享体验,从而实现比以前方法更高的样本效率。
当前,人工智能正在从多个方面赋予机器人越来越多的能力,相信随着相关技术的不断增强,人形机器人的应用场景也将会大大拓展。
最新内容
手机 |
相关内容
逆变器技术对新能源汽车市场增长的
逆变器技术对新能源汽车市场增长的重要性,市场,新能源汽车,逆变器,控制,高效率,能和,随着全球对环境保护和可持续发展的关注不断增梦芯科技独立北斗芯片模块MXT2721
梦芯科技独立北斗芯片模块MXT2721隆重发布,芯片,北斗,模块,能力,导航,支持,梦芯科技是一家致力于研发和生产半导体产品的高科技公司什么是高压接触器,高压接触器的组成
什么是高压接触器,高压接触器的组成、特点、原理、分类、常见故障及预防措施,高压,分类,闭合,用于,操作,损坏,AD694ARZ高压接触器是什么是射流继电器,射流继电器的基本
什么是射流继电器,射流继电器的基本结构、技术参数、工作原理、负载分类、如何选用、操作规程及发展历程,继电器,工作原理,分类,负2023 年 3 季度了 DigiKey 新增 4
2023 年 3 季度了 DigiKey 新增 4 万多种现货零件,多种,零件,现货,季度,产品,原厂,全球领先的供应品类丰富、发货快速的商业现货技什么是NFC控制器,NFC控制器的组成、
什么是NFC控制器,NFC控制器的组成、特点、原理、分类、常见故障及预防措施,控制器,分类,模式,移动支付,数据,信号,NFC(Near Field Com什么是电机启动器,电机启动器的基本
什么是电机启动器,电机启动器的基本结构、优缺点、工作原理、类型、检测、操作规程及发展历程,工作原理,类型,检测,结构,启动,断开,电流互感器作用 电流互感器为什么
电流互感器作用 电流互感器为什么一端要接地?,作用,误差,原因,连接,测量,短路故障,电流互感器(Current Transformer,简称CT)是一种用于