PDF Paper ArXiv arXiv Youtube Video Code(coming soon)

离散时间混合自动机学习 (Discrete-Time Hybrid Automata Learning, DHAL):

腿部运动与滑板的结合

Hang Liu Sangli Teng Ben Liu Wei Zhang Maani Ghaffari

密歇根大学安娜堡分校

南方科技大学

演示视频

摘要

本文介绍了一种名为离散时间混合自动机学习 (Discrete-time Hybrid Automata Learning, DHAL) 的框架,该框架使用 on-policy 强化学习来识别和执行模式切换,而无需轨迹分割或事件函数学习。混合动力系统(包括连续流和离散模式切换)可以对腿式机器人运动等机器人任务进行建模。基于模型的方法依赖于预定义的步态,而无模型方法缺乏明确的模式切换知识。目前的方法是在回归连续流之前通过分割来识别离散模式,但学习没有轨迹标签或分割的高维复杂刚体动力学是一个具有挑战性的开放问题。我们的方法结合了 beta 策略分布和多评论家架构来模拟接触引导的运动,例如具有挑战性的四足机器人滑板任务。我们通过模拟和真实世界的测试验证了我们的方法,证明了其在混合动力系统中的稳健性能。

滑板公园

野外

室内

学习混合自动机

我们使用不同的 LED 灯来指示自动机中动态模式之间的转换。与计算机视觉中的分割技术类似,学习到的混合模式可以帮助我们更系统地分析运动模式,提高决策的可解释性,并改进控制策略以增强适应性。

失败案例

致谢

我们感谢 Yulun ZhuangYi Cheng 提供的宝贵讨论、硬件指导和建设性反馈。 我们还要感谢 Linqi Ye 的最初头脑风暴和富有洞察力的建议,这些建议的灵感来自于我在 SHU 度过的宝贵时光。 网站模板修改自 AnyCar UMI-On-Legs, NeRFies, 和 Scaling Up Distilling Down. 本网站根据 Creative Commons Attribution-ShareAlike 4.0 International License 获得许可。 这意味着您可以自由借用和修改本网站的源代码,只要您在页脚中链接回 NeRFies 页面即可。请记住删除网站标题中包含的您不希望出现在您网站上的分析代码。