Survey_D1_轮足机器人
第一篇:复合机器人规划与控制全景综述¶
复合机器人规划与控制:面向25章续篇课程的领域综述¶
本报告梳理了复合机器人三个子方向——D1 轮腿式、 D2 移动操作(轮式底盘 + 机械臂),以及 D3 行走操作(腿式底盘 + 机械臂,含类人机器人)。本综述采用广度优先策略;数据陈述基于公开记录的支持程度,并标注了剩余的不确定性。
核心发现是该领域正处于**三路融合**之中: 经典的MPC+WBC架构(OCS2/Crocoddyl/TSID系列)、Isaac Lab中的GPU级强化学习,以及VLA/基础模型策略(π0.5、GR00T N1.5、Helix 02)正融合为RAMBO、ASAP和UMI-on-Legs等混合架构。 类人机器人——特别是**Unitree G1(起价1.35-1.79万美元,23-43个自由度)和H1——已成为学术界全身学习的默认平台,而Figure公司的**Helix 02 (2026年2月)则成为首个完全基于像素数据,实现4分钟长时效自主行走-操作的VLA。这三个子方向共享数学基础(浮动底盘+手臂、分层QP、接触集管理),但在*高阶数学增量*上有所差异:D1增加了非全向滚动+闭链;D2增加了SE(2)规划+TAMP+VLA令牌化; D3 则增加了角动量调节与动态接触调度。因此,一套设计精良的 25 章课程体系应将 5 章共同数学知识置于课程前端,随后将 6/4/10 章内容分别分配给 D1/D2/D3,最后以 3 章的 VLA+SLAM 顶点课程收尾。
D1 轮足机器人:成熟的MPC谱系与跑酷RL的结合¶
开源生态系统(2024-2026)¶
轮足机器人的开源生态规模小于D2/D3,主要由少数几个活跃的代码库主导。 clearlab-sustech/Wheel-Legged-Gym(SUSTech / Clear Lab)是事实上的强化学习研究基地,它是 leggedrobotics/legged_gym 的分支,增加了虚拟模型控制(VMC)、崎岖地形以及双足轮腿配置;采用 MIT 许可证,活跃提交将持续至 2025 年。 XinLang2019/awesome-wheeled-legged 整合了约20个相关代码发布,是一个有用的资源聚合中心。 在多体控制(MPC)领域,ETH RSL 已通过通用单仓库 leggedrobotics/ocs2(BSD-3 许可)发布了其 ANYmal-on-wheels 和 Swiss-Mile 管道的部分内容;该仓库包含 Bjelonic 论文中用于轮式底盘变体的通用 ocs2_legged_robot 模块;但并非所有轮式底盘专用脚本均已公开。 Unitree 的 B2W_example 和 unitree_sdk2 仓库为 Go2-W 和 B2-W 提供了低级 CAN/EtherCAT 驱动程序(Apache-2.0),但不包含高级控制器。tasbolat1/Tron1-IsaacGym(LimX)涵盖了 Tron1 双足轮式机器人及其强化学习基线。 upkie/upkie(Stéphane Caron)是经典的开源 DIY 平衡轮腿系统,具备 Python/C++ 双栈、MPC/LQR 基线,且拥有活跃的社区;采用 Apache-2.0 许可,正在积极维护。 **DDT的DIABLO**提供了一个功能有限的SDK,但未包含研究级控制器。生产级软件栈仍由ETH/Swiss-Mile和Unitree内部保留。
代表性硬件平台¶
| 平台 | 轮子 × 腿部自由度 | 质量 / 载荷 | 最高时速 | 开源程度 |
|---|---|---|---|---|
| ANYmal-wheels (ETH/ANYbotics) | 4个轮子 + 12个腿部自由度 | ~50 kg / 15-20 kg | ~6 m/s (轮式) | 通过ANYbotics研究获取URDF |
| Swiss-Mile (ETH衍生公司) | 4轮 + 12自由度四足/双足 | ~50 kg | ~22 km/h | 通过RSL论文部分开源 |
| Unitree B2-W | 4轮 + 12自由度 | ~60 kg / 静态40 kg | 6 m/s | SDK开源,URDF公开 |
| Unitree Go2-W | 4轮 + 12自由度 | ~15 kg / 8 kg | ~3.7 m/s | SDK开源,适合业余爱好者 |
| IIT CENTAURO | 4个轮腿 + 人形躯干 | ~93 kg / 100 kg | ~2 m/s | XBotControl 部分开源 |
| Ascento 2 (ETH衍生项目) | 2个轮子 + 2自由度腿部 | ~10 kg | 8 km/h | 论文 + 有限代码 |
| DIABLO (DDT) | 2轮+2腿 | ~16 kg | 3.5 m/s | SDK部分开源 |
| Upkie (社区项目) | 2轮+2腿 | ~5 kg | ~1.5 m/s | 软硬件完全开源 |
| LimX W1 / Tron1 | 2个轮足 + 双足 | ~20 kg | ~3 m/s | Isaac Gym环境公开 |
| 腾讯Ollie | 2轮 + 腿部 | ~30 kg | ~2.5 m/s | 闭源,仅论文 |
| Booster T1-W | 2轮足双足行走 | ~30 kg | ~2 m/s | 新兴;SDK有限 |
经典基础论文(2022年前)¶
经典阅读书目主要由ETH RSL的Bjelonic系列论文主导,这些论文至今仍是轮足机器人全身运动规划控制(MPC)领域的权威参考。 Bjelonic等人,《Rolling in the Deep——基于在线轨迹优化的轮足机器人混合运动》(RA-L 2020,约170次引用)建立了采用混合轮足接触时序的在线轨迹优化(TO)方法。 Bjelonic等人,《在复杂地形中行驶的轮足四足机器人轨迹优化》(RA-L 2020,约90次引用)展示了具有地形感知能力的非线性轨迹优化。 Bjelonic等人,《轮足机器人的全身MPC与在线步态序列生成》(IROS 2021,约150次引用)是被引用次数最多的论文,也是此后所有轮足MPC研究的模板。 Medeiros等人,《基于线性化ZMP约束的轮足四足机器人轨迹优化》(RA-L 2020)是ZMP建模方法的变体。 Klemm等人,《Ascento:一种双轮跳跃机器人》(ICRA 2019)及其2020年的后续研究,开创了采用线性化四自由度(LQR)控制与混合跳跃技术的轮足双足机器人。 Grand、Benamar、Plumet 的《混合轮足机器人的姿态与轨迹解耦控制》(ICRA 2004)至今仍是解耦控制领域的经典参考。 Kashiri、Tsagarakis等人发表的《CENTAURO:一种混合式行走与高功率弹性操作平台》(RA-L 2019)详细阐述了IIT半人马(Centaur)的设计。 Laney 与 Hong 的《基于顺应性的双足滑雪》**以及 **Jenelten 等人的 TAMOLS(RA-L 2022)足点规划研究也延续了这一方向。
近期前沿论文(2023-2026)¶
Lee等人发表的《为轮足机器人学习鲁棒自主导航与行走》(Science Robotics 2024)**是ETH Swiss-Mile大会的重磅论文,该研究将强化学习导航与轮足行走技术相结合,应用于城市配送领域。 **《基于腿足及轮足机器人的盲爬楼梯强化学习》(ICRA 2024,Swiss-Mile)展示了在轮足机器人ANYmal上从模拟到实机的强化学习。 Medeiros等人,《带接触开关与碰撞的轮式平衡机器人非光滑轨迹优化》(T-RO 2025)为双足轮式机器人形式化了具有碰撞感知能力的轨迹优化。 Cui等人,《粗糙地形上轮腿类人形机器人的柔性运动控制》(T-Mech 2024)将轮式双足机器人视为柔性系统。后续强化学习研究包括**DreamWaQ-wheel变体、HIMLoco-wheel分支**以及**Dribblebot-on-wheels**演示。 通过**Tron1 IsaacGym基线**和清华大学研究组,轮腿跑酷正逐渐兴起;目前尚无达到2023年腿式跑酷研究水平的经同行评审的“轮式跑酷”论文。 **"Untree-B2W" 移动操控**代码库指向 B2W 结合机械臂的趋势,架起了 D1 和 D3 之间的桥梁。在 2025 年,若干 arXiv 预印本(例如“START:穿越稀疏立足点”、“LEVA:配备腿部悬挂系统的高机动性物流车辆”)将轮足混合技术扩展至物流领域。 2024年发表于《Science Robotics》的论文是迄今最重要的引文;预计2025-2026年将出现一波Swiss-Mile和LimX的后续研究。
方向特异性 C++ 库¶
除了腿式机器人课程的核心内容外,D1 还要求:Pinocchio 3.x 约束关节,用于闭环车轮连杆和环路约束(3.x 系列增加了原生支持);Drake MultibodyPlant,当必须严格处理运动学环路时作为替代方案; Pacejka / Dugoff 轮胎模型(通常自行实现)用于处理车轮打滑;MuJoCo 3.x 和 Isaac Sim PhysX 用于车轮-地面接触(MuJoCo 的圆柱-平面接触与 Isaac 的车轮物理引擎具有不同的失效模式——MuJoCo 更适合控制闭环,Isaac 则适用于大规模并行强化学习); grid_map 和 elevation_mapping_cupy 已扩展为支持车轮友好的可通达性成本。目前尚无专用的非全向库;约束通常直接编码在 OCS2 的成本/约束项中,或在强化学习中作为软成本。
超越腿式课程的数学拓展¶
D1 引入:帕夫(Pfaffian)滚动约束(纯滚动 A(q)q̇=0 作为 MPC 中的等式约束)、带运动学环路的闭链动力学(受约束的 ABA 或拉格朗日乘子)、依赖滑移的轮胎摩擦 (Pacejka,线性滑移),作为接触模式MPC问题的**轮滑与步行的混合模式切换**,以及**统一的轮+足接触调度**——在同一OCS2公式中,“接触”既可以是滚动的车轮,也可以是静止的脚。
博士研究开放问题(2025-2026)¶
正在研究但尚未解决的问题:(1) 具有形式化稳定性保证的端到端**模式切换策略**(何时滚动与何时步态);(2) 可变形/软质地形(泥地、砾石)下的轮足动力学; (3) 基于轮足底盘的带手臂全身MPC(D1∩D3);(4) 牵引力损失恢复**与滑移感知重规划;(5) 跨越路缘石/台阶的高速**轮式跑酷;(6) 长时效配送的**能量最优模式选择**。