科学探索|[视频]科学家利用强化学习培训四足机器人守门员

某些机器人挑战有着明确的应用场景,而有些挑战则需要机器人系统根据场景的变化灵活应变 。而教小型机器人玩足球属于后者 。近日发表的一篇论文[PDF]中,详细介绍了使用强化学习来教 MIT 的 Mini Cheetah 机器人扮演守门员角色:

使用四足动物的足球守门是一个具有挑战性的问题,它将高度动态的运动与精确和快速的非抓握物体(球)操纵相结合 。机器人需要在很短的时间内(通常不到一秒)使用动态运动机动对潜在的飞行球做出反应并拦截 。在本论文中,我们建议使用分层无模型 RL 框架来解决这个问题 。
科学探索|[视频]科学家利用强化学习培训四足机器人守门员
文章图片

实际上,机器人需要锁定足球并在不到一秒钟的时间内自行移动以阻挡球 。机器人的参数在模拟器中定义,Mini Cheetah 依靠三个动作——回避、俯冲和跳跃——通过确定运动时的轨迹来阻止足球进门 。
【科学探索|[视频]科学家利用强化学习培训四足机器人守门员】科学探索|[视频]科学家利用强化学习培训四足机器人守门员
文章图片