鱼阅

Fish AI 速读

原文 8674 字,FishAI速读将为你节省 44 分钟

全文总结

CoRL 2024 是机器人学习领域的顶级学术会议,清华大学助理教授赵行、高阳、陈建宇、许华哲各研究组共计发布 9 项最新科研成果。这些成果涵盖人形机器人跑酷、带有基础先验的强化学习框架、通过层次化的机器人变压器模型增强机器人操作控制、跨多种视觉干扰类型进行泛化的通用框架等,为机器人操作和人机协作等领域研究提供了新思路。

关键要点

  • 🤖 人形机器人跑酷:赵行研究组提出了一种全新的人形机器人 Parkour 学习框架,通过端到端的基于视觉的全身控制策略,实现了无需运动先验的多技能 Parkour,如跳高、跃障、爬低等。该框架创新性地使用了分形噪声来训练机器人,简化了奖励函数设计,并采用了两阶段强化学习方法和多 GPU 加速策略,实现了从模拟到真实世界的零样本迁移。

  • 🧠 基于大模型先验知识的强化学习:高阳研究组提出“基于大模型先验知识的强化学习”框架 (Reinforcement Learning with Foundation Priors) 来促进具身智能体在操作任务中的学习效率和自主探索能力。该框架通过利用策略、价值和成功奖励等基础模型为智能体提供指导和反馈,成功地使机器人能够在真实环境和仿真环境中更高效地完成复杂的操作任务。

  • 🚀 通用流作为可扩展机器人学习的基础可供性表征:高阳研究组提出使用“通用流”(General Flow) 来作为机器人学习的一种基础可供性表征 (Affordance)。该表征通过描述空间中被操作物体上若干 3D 点的未来走向,将操作者本体与操作技能进行解耦,从而建立起人类技能向机器人技能进行转移的桥梁。

  • 🦾 DexCatch:使用灵巧手学习抛接任意物体:高阳研究组提出应用于灵巧手动态抛接物体的高效学习训练框架 DexCatch。该方法在 45 个场景中(多样的手部姿势和物体)实现了 73% 的成功率,且所学习的策略在未见过的物体上展示了强大的零样本迁移性能。

  • 💪 利用局部性提升机器人操作任务中的样本效率:高阳研究组提出“SGRv2 框架”(Semantic-Geometric Representation V2),通过改进视觉和动作表征来提升机器人操作任务中的样本效率。研究组引入了关键的归纳偏置——动作局部性,即机器人的动作主要由目标物体及其与局部环境的关系决定。基于此,研究组提出了一种编码器-解码器架构,并采用逐点预测和加权平均等策略来生成动作预测。