如何让3D人形机器人学会行走-电子发烧友网
发布时间:2022-04-25 15:52:42
阅读:次
来源:起动器厂家
来自英特尔AI实验室和俄勒冈州立大学工程学院协作机器人和智能系统研究所的研究人员结合了多种方法,制作了性能更好的强化学习系统,可应用于机器人控制,控制自主车辆功能的系统和其他复杂系统。
协同进化强化学习(CERL)可以在类人、Hopper、Swimmer、HalfCheetah和Walker2D等基准测试中获得更好的性能。使用CERL方法,研究人员能够基于OpenAI的Humanoid基准测试使3D人形机器人直立行走。
这些成果在一定程度上是通过训练系统实现的,该系统探索了更多的强化学习训练环境,以寻求奖励并完成特定的任务。
环境探索对于确保记录各种经验并考虑行动方案非常重要。研究人员在一篇解释CERL工作原理的论文中说,与环境探索相关的问题已经出现,特别是在使用深度强化学习来完成具有挑战性的现实任务越来越普及的情况下。该论文写道,“神经进化将整个过程结合在一起,产生了一个超越任何个体学习者能力的学习者。”
简约长页
em;"> CERL将基于策略梯度的强化学习和进化算法相结合,然后在每批或每一代训练系统中选择表现最佳的神经网络。这样,研究人员可以就可以使用最强大的神经网络来创建新一代的系统,并且可以将计算资源分配给实现最佳性能的算法。
CERL还结合了重放缓冲区,用于存储学习者在环境中的体验,以便创建单个重放缓冲区并在系统之间共享体验,从而实现比以前方法更高的样本效率。
当前,人工智能正在从多个方面赋予机器人越来越多的能力,相信随着相关技术的不断增强,人形机器人的应用场景也将会大大拓展。
相关阅读
- 浙江杭州市从六方面发展太阳能光伏产业二手烘箱交通涂料保护元件面皮机捆钞机Frc
- 用优化方法确定覆盖件的最佳冲压方向宁国坐垫滚轧机电子药盒编带机Frc
- 财政补贴可再生能源建筑应用太阳能有望铺开手机绳荆州钒铁游戏机包主板Frc
- 包装机械应精益求精勿求大求全铜叶轮压力仪表驳船早强剂横切机Frc
- 比出口增长乏力更可怕的是产业转移烘烤炉录音电话室内光缆阻燃电缆婚宴酒店Frc
- 无刷同步电动机的变频运行方式研究合肥热压机销钉振动筛汽缸Frc
- 夜光纤维时尚深圳祥浩先行混凝剂电镀银按钮开关跑步鞋封口机Frc
- 中国重汽召开2010年财务工作暨决算会议滚珠轴承电熨斗废不锈钢防雷设备雪花机Frc
- 09年8月10日地板漆网上行情最新快报型材勾头瓦瘦客户机美容服塑料管Frc
- 专家提出中国面对入世挑战的对策碳毡额尔古纳玩具乐器殡葬汽车弹簧Frc