跳转至

Survey_D1_轮足机器人

第一篇:复合机器人规划与控制全景综述

复合机器人规划与控制:面向25章续篇课程的领域综述

本报告梳理了复合机器人三个子方向——D1 轮腿式D2 移动操作(轮式底盘 + 机械臂),以及 D3 行走操作(腿式底盘 + 机械臂,含类人机器人)。本综述采用广度优先策略;数据陈述基于公开记录的支持程度,并标注了剩余的不确定性。

核心发现是该领域正处于**三路融合**之中: 经典的MPC+WBC架构(OCS2/Crocoddyl/TSID系列)、Isaac Lab中的GPU级强化学习,以及VLA/基础模型策略(π0.5、GR00T N1.5、Helix 02)正融合为RAMBO、ASAP和UMI-on-Legs等混合架构。 类人机器人——特别是**Unitree G1(起价1.35-1.79万美元,23-43个自由度)和H1——已成为学术界全身学习的默认平台,而Figure公司的**Helix 02 (2026年2月)则成为首个完全基于像素数据,实现4分钟长时效自主行走-操作的VLA。这三个子方向共享数学基础(浮动底盘+手臂、分层QP、接触集管理),但在*高阶数学增量*上有所差异:D1增加了非全向滚动+闭链;D2增加了SE(2)规划+TAMP+VLA令牌化; D3 则增加了角动量调节与动态接触调度。因此,一套设计精良的 25 章课程体系应将 5 章共同数学知识置于课程前端,随后将 6/4/10 章内容分别分配给 D1/D2/D3,最后以 3 章的 VLA+SLAM 顶点课程收尾。

D1 轮足机器人:成熟的MPC谱系与跑酷RL的结合

开源生态系统(2024-2026)

轮足机器人的开源生态规模小于D2/D3,主要由少数几个活跃的代码库主导。 clearlab-sustech/Wheel-Legged-Gym(SUSTech / Clear Lab)是事实上的强化学习研究基地,它是 leggedrobotics/legged_gym 的分支,增加了虚拟模型控制(VMC)、崎岖地形以及双足轮腿配置;采用 MIT 许可证,活跃提交将持续至 2025 年。 XinLang2019/awesome-wheeled-legged 整合了约20个相关代码发布,是一个有用的资源聚合中心。 在多体控制(MPC)领域,ETH RSL 已通过通用单仓库 leggedrobotics/ocs2(BSD-3 许可)发布了其 ANYmal-on-wheels 和 Swiss-Mile 管道的部分内容;该仓库包含 Bjelonic 论文中用于轮式底盘变体的通用 ocs2_legged_robot 模块;但并非所有轮式底盘专用脚本均已公开。 Unitree 的 B2W_exampleunitree_sdk2 仓库为 Go2-W 和 B2-W 提供了低级 CAN/EtherCAT 驱动程序(Apache-2.0),但不包含高级控制器。tasbolat1/Tron1-IsaacGym(LimX)涵盖了 Tron1 双足轮式机器人及其强化学习基线。 upkie/upkie(Stéphane Caron)是经典的开源 DIY 平衡轮腿系统,具备 Python/C++ 双栈、MPC/LQR 基线,且拥有活跃的社区;采用 Apache-2.0 许可,正在积极维护。 **DDT的DIABLO**提供了一个功能有限的SDK,但未包含研究级控制器。生产级软件栈仍由ETH/Swiss-Mile和Unitree内部保留。

代表性硬件平台

平台 轮子 × 腿部自由度 质量 / 载荷 最高时速 开源程度
ANYmal-wheels (ETH/ANYbotics) 4个轮子 + 12个腿部自由度 ~50 kg / 15-20 kg ~6 m/s (轮式) 通过ANYbotics研究获取URDF
Swiss-Mile (ETH衍生公司) 4轮 + 12自由度四足/双足 ~50 kg ~22 km/h 通过RSL论文部分开源
Unitree B2-W 4轮 + 12自由度 ~60 kg / 静态40 kg 6 m/s SDK开源,URDF公开
Unitree Go2-W 4轮 + 12自由度 ~15 kg / 8 kg ~3.7 m/s SDK开源,适合业余爱好者
IIT CENTAURO 4个轮腿 + 人形躯干 ~93 kg / 100 kg ~2 m/s XBotControl 部分开源
Ascento 2 (ETH衍生项目) 2个轮子 + 2自由度腿部 ~10 kg 8 km/h 论文 + 有限代码
DIABLO (DDT) 2轮+2腿 ~16 kg 3.5 m/s SDK部分开源
Upkie (社区项目) 2轮+2腿 ~5 kg ~1.5 m/s 软硬件完全开源
LimX W1 / Tron1 2个轮足 + 双足 ~20 kg ~3 m/s Isaac Gym环境公开
腾讯Ollie 2轮 + 腿部 ~30 kg ~2.5 m/s 闭源,仅论文
Booster T1-W 2轮足双足行走 ~30 kg ~2 m/s 新兴;SDK有限

经典基础论文(2022年前)

经典阅读书目主要由ETH RSL的Bjelonic系列论文主导,这些论文至今仍是轮足机器人全身运动规划控制(MPC)领域的权威参考。 Bjelonic等人,《Rolling in the Deep——基于在线轨迹优化的轮足机器人混合运动》(RA-L 2020,约170次引用)建立了采用混合轮足接触时序的在线轨迹优化(TO)方法。 Bjelonic等人,《在复杂地形中行驶的轮足四足机器人轨迹优化》(RA-L 2020,约90次引用)展示了具有地形感知能力的非线性轨迹优化。 Bjelonic等人,《轮足机器人的全身MPC与在线步态序列生成》(IROS 2021,约150次引用)是被引用次数最多的论文,也是此后所有轮足MPC研究的模板。 Medeiros等人,《基于线性化ZMP约束的轮足四足机器人轨迹优化》(RA-L 2020)是ZMP建模方法的变体。 Klemm等人,《Ascento:一种双轮跳跃机器人》(ICRA 2019)及其2020年的后续研究,开创了采用线性化四自由度(LQR)控制与混合跳跃技术的轮足双足机器人。 Grand、Benamar、Plumet 的《混合轮足机器人的姿态与轨迹解耦控制》(ICRA 2004)至今仍是解耦控制领域的经典参考。 Kashiri、Tsagarakis等人发表的《CENTAURO:一种混合式行走与高功率弹性操作平台》(RA-L 2019)详细阐述了IIT半人马(Centaur)的设计。 Laney 与 Hong 的《基于顺应性的双足滑雪》**以及 **Jenelten 等人的 TAMOLS(RA-L 2022)足点规划研究也延续了这一方向。

近期前沿论文(2023-2026)

Lee等人发表的《为轮足机器人学习鲁棒自主导航与行走》(Science Robotics 2024)**是ETH Swiss-Mile大会的重磅论文,该研究将强化学习导航与轮足行走技术相结合,应用于城市配送领域。 **《基于腿足及轮足机器人的盲爬楼梯强化学习》(ICRA 2024,Swiss-Mile)展示了在轮足机器人ANYmal上从模拟到实机的强化学习。 Medeiros等人,《带接触开关与碰撞的轮式平衡机器人非光滑轨迹优化》(T-RO 2025)为双足轮式机器人形式化了具有碰撞感知能力的轨迹优化。 Cui等人,《粗糙地形上轮腿类人形机器人的柔性运动控制》(T-Mech 2024)将轮式双足机器人视为柔性系统。后续强化学习研究包括**DreamWaQ-wheel变体、HIMLoco-wheel分支**以及**Dribblebot-on-wheels**演示。 通过**Tron1 IsaacGym基线**和清华大学研究组,轮腿跑酷正逐渐兴起;目前尚无达到2023年腿式跑酷研究水平的经同行评审的“轮式跑酷”论文。 **"Untree-B2W" 移动操控**代码库指向 B2W 结合机械臂的趋势,架起了 D1 和 D3 之间的桥梁。在 2025 年,若干 arXiv 预印本(例如“START:穿越稀疏立足点”、“LEVA:配备腿部悬挂系统的高机动性物流车辆”)将轮足混合技术扩展至物流领域。 2024年发表于《Science Robotics》的论文是迄今最重要的引文;预计2025-2026年将出现一波Swiss-Mile和LimX的后续研究。

方向特异性 C++ 库

除了腿式机器人课程的核心内容外,D1 还要求:Pinocchio 3.x 约束关节,用于闭环车轮连杆和环路约束(3.x 系列增加了原生支持);Drake MultibodyPlant,当必须严格处理运动学环路时作为替代方案; Pacejka / Dugoff 轮胎模型(通常自行实现)用于处理车轮打滑;MuJoCo 3.xIsaac Sim PhysX 用于车轮-地面接触(MuJoCo 的圆柱-平面接触与 Isaac 的车轮物理引擎具有不同的失效模式——MuJoCo 更适合控制闭环,Isaac 则适用于大规模并行强化学习); grid_mapelevation_mapping_cupy 已扩展为支持车轮友好的可通达性成本。目前尚无专用的非全向库;约束通常直接编码在 OCS2 的成本/约束项中,或在强化学习中作为软成本。

超越腿式课程的数学拓展

D1 引入:帕夫(Pfaffian)滚动约束(纯滚动 A(q)q̇=0 作为 MPC 中的等式约束)、带运动学环路的闭链动力学(受约束的 ABA 或拉格朗日乘子)、依赖滑移的轮胎摩擦 (Pacejka,线性滑移),作为接触模式MPC问题的**轮滑与步行的混合模式切换**,以及**统一的轮+足接触调度**——在同一OCS2公式中,“接触”既可以是滚动的车轮,也可以是静止的脚。

博士研究开放问题(2025-2026)

正在研究但尚未解决的问题:(1) 具有形式化稳定性保证的端到端**模式切换策略**(何时滚动与何时步态);(2) 可变形/软质地形(泥地、砾石)下的轮足动力学; (3) 基于轮足底盘的带手臂全身MPC(D1∩D3);(4) 牵引力损失恢复**与滑移感知重规划;(5) 跨越路缘石/台阶的高速**轮式跑酷;(6) 长时效配送的**能量最优模式选择**。