Survey_D1_轮足机器人

第一篇：复合机器人规划与控制全景综述¶

复合机器人规划与控制：面向25章续篇课程的领域综述¶

本报告梳理了复合机器人三个子方向——D1 轮腿式、 D2 移动操作（轮式底盘 + 机械臂），以及 D3 行走操作（腿式底盘 + 机械臂，含类人机器人）。本综述采用广度优先策略；数据陈述基于公开记录的支持程度，并标注了剩余的不确定性。

核心发现是该领域正处于**三路融合**之中：经典的MPC+WBC架构（OCS2/Crocoddyl/TSID系列）、Isaac Lab中的GPU级强化学习，以及VLA/基础模型策略（π0.5、GR00T N1.5、Helix 02）正融合为RAMBO、ASAP和UMI-on-Legs等混合架构。类人机器人——特别是**Unitree G1（起价1.35-1.79万美元，23-43个自由度）和H1——已成为学术界全身学习的默认平台，而Figure公司的**Helix 02 （2026年2月）则成为首个完全基于像素数据，实现4分钟长时效自主行走-操作的VLA。这三个子方向共享数学基础（浮动底盘+手臂、分层QP、接触集管理），但在*高阶数学增量*上有所差异：D1增加了非全向滚动+闭链；D2增加了SE(2)规划+TAMP+VLA令牌化； D3 则增加了角动量调节与动态接触调度。因此，一套设计精良的 25 章课程体系应将 5 章共同数学知识置于课程前端，随后将 6/4/10 章内容分别分配给 D1/D2/D3，最后以 3 章的 VLA+SLAM 顶点课程收尾。

D1 轮足机器人：成熟的MPC谱系与跑酷RL的结合¶

开源生态系统（2024-2026）¶

轮足机器人的开源生态规模小于D2/D3，主要由少数几个活跃的代码库主导。 clearlab-sustech/Wheel-Legged-Gym（SUSTech / Clear Lab）是事实上的强化学习研究基地，它是 leggedrobotics/legged_gym 的分支，增加了虚拟模型控制（VMC）、崎岖地形以及双足轮腿配置；采用 MIT 许可证，活跃提交将持续至 2025 年。 XinLang2019/awesome-wheeled-legged 整合了约20个相关代码发布，是一个有用的资源聚合中心。在多体控制（MPC）领域，ETH RSL 已通过通用单仓库 leggedrobotics/ocs2（BSD-3 许可）发布了其 ANYmal-on-wheels 和 Swiss-Mile 管道的部分内容；该仓库包含 Bjelonic 论文中用于轮式底盘变体的通用 ocs2_legged_robot 模块；但并非所有轮式底盘专用脚本均已公开。 Unitree 的 B2W_example 和 unitree_sdk2 仓库为 Go2-W 和 B2-W 提供了低级 CAN/EtherCAT 驱动程序（Apache-2.0），但不包含高级控制器。tasbolat1/Tron1-IsaacGym（LimX）涵盖了 Tron1 双足轮式机器人及其强化学习基线。 upkie/upkie（Stéphane Caron）是经典的开源 DIY 平衡轮腿系统，具备 Python/C++ 双栈、MPC/LQR 基线，且拥有活跃的社区；采用 Apache-2.0 许可，正在积极维护。 **DDT的DIABLO**提供了一个功能有限的SDK，但未包含研究级控制器。生产级软件栈仍由ETH/Swiss-Mile和Unitree内部保留。

代表性硬件平台¶

平台	轮子 × 腿部自由度	质量 / 载荷	最高时速	开源程度
ANYmal-wheels (ETH/ANYbotics)	4个轮子 + 12个腿部自由度	~50 kg / 15-20 kg	~6 m/s (轮式)	通过ANYbotics研究获取URDF
Swiss-Mile (ETH衍生公司)	4轮 + 12自由度四足/双足	~50 kg	~22 km/h	通过RSL论文部分开源
Unitree B2-W	4轮 + 12自由度	~60 kg / 静态40 kg	6 m/s	SDK开源，URDF公开
Unitree Go2-W	4轮 + 12自由度	~15 kg / 8 kg	~3.7 m/s	SDK开源，适合业余爱好者
IIT CENTAURO	4个轮腿 + 人形躯干	~93 kg / 100 kg	~2 m/s	XBotControl 部分开源
Ascento 2 (ETH衍生项目)	2个轮子 + 2自由度腿部	~10 kg	8 km/h	论文 + 有限代码
DIABLO (DDT)	2轮+2腿	~16 kg	3.5 m/s	SDK部分开源
Upkie (社区项目)	2轮+2腿	~5 kg	~1.5 m/s	软硬件完全开源
LimX W1 / Tron1	2个轮足 + 双足	~20 kg	~3 m/s	Isaac Gym环境公开
腾讯Ollie	2轮 + 腿部	~30 kg	~2.5 m/s	闭源，仅论文
Booster T1-W	2轮足双足行走	~30 kg	~2 m/s	新兴；SDK有限

经典基础论文（2022年前）¶

经典阅读书目主要由ETH RSL的Bjelonic系列论文主导，这些论文至今仍是轮足机器人全身运动规划控制（MPC）领域的权威参考。 Bjelonic等人，《Rolling in the Deep——基于在线轨迹优化的轮足机器人混合运动》（RA-L 2020，约170次引用）建立了采用混合轮足接触时序的在线轨迹优化（TO）方法。 Bjelonic等人，《在复杂地形中行驶的轮足四足机器人轨迹优化》（RA-L 2020，约90次引用）展示了具有地形感知能力的非线性轨迹优化。 Bjelonic等人，《轮足机器人的全身MPC与在线步态序列生成》（IROS 2021，约150次引用）是被引用次数最多的论文，也是此后所有轮足MPC研究的模板。 Medeiros等人，《基于线性化ZMP约束的轮足四足机器人轨迹优化》（RA-L 2020）是ZMP建模方法的变体。 Klemm等人，《Ascento：一种双轮跳跃机器人》（ICRA 2019）及其2020年的后续研究，开创了采用线性化四自由度（LQR）控制与混合跳跃技术的轮足双足机器人。 Grand、Benamar、Plumet 的《混合轮足机器人的姿态与轨迹解耦控制》（ICRA 2004）至今仍是解耦控制领域的经典参考。 Kashiri、Tsagarakis等人发表的《CENTAURO：一种混合式行走与高功率弹性操作平台》（RA-L 2019）详细阐述了IIT半人马（Centaur）的设计。 Laney 与 Hong 的《基于顺应性的双足滑雪》**以及 **Jenelten 等人的 TAMOLS（RA-L 2022）足点规划研究也延续了这一方向。

近期前沿论文（2023-2026）¶

Lee等人发表的《为轮足机器人学习鲁棒自主导航与行走》（Science Robotics 2024）**是ETH Swiss-Mile大会的重磅论文，该研究将强化学习导航与轮足行走技术相结合，应用于城市配送领域。 **《基于腿足及轮足机器人的盲爬楼梯强化学习》（ICRA 2024，Swiss-Mile）展示了在轮足机器人ANYmal上从模拟到实机的强化学习。 Medeiros等人，《带接触开关与碰撞的轮式平衡机器人非光滑轨迹优化》（T-RO 2025）为双足轮式机器人形式化了具有碰撞感知能力的轨迹优化。 Cui等人，《粗糙地形上轮腿类人形机器人的柔性运动控制》（T-Mech 2024）将轮式双足机器人视为柔性系统。后续强化学习研究包括**DreamWaQ-wheel变体、HIMLoco-wheel分支**以及**Dribblebot-on-wheels**演示。通过**Tron1 IsaacGym基线**和清华大学研究组，轮腿跑酷正逐渐兴起；目前尚无达到2023年腿式跑酷研究水平的经同行评审的“轮式跑酷”论文。 **"Untree-B2W" 移动操控**代码库指向 B2W 结合机械臂的趋势，架起了 D1 和 D3 之间的桥梁。在 2025 年，若干 arXiv 预印本（例如“START：穿越稀疏立足点”、“LEVA：配备腿部悬挂系统的高机动性物流车辆”）将轮足混合技术扩展至物流领域。 2024年发表于《Science Robotics》的论文是迄今最重要的引文；预计2025-2026年将出现一波Swiss-Mile和LimX的后续研究。

方向特异性 C++ 库¶

除了腿式机器人课程的核心内容外，D1 还要求：Pinocchio 3.x 约束关节，用于闭环车轮连杆和环路约束（3.x 系列增加了原生支持）；Drake MultibodyPlant，当必须严格处理运动学环路时作为替代方案； Pacejka / Dugoff 轮胎模型（通常自行实现）用于处理车轮打滑；MuJoCo 3.x 和 Isaac Sim PhysX 用于车轮-地面接触（MuJoCo 的圆柱-平面接触与 Isaac 的车轮物理引擎具有不同的失效模式——MuJoCo 更适合控制闭环，Isaac 则适用于大规模并行强化学习）； grid_map 和 elevation_mapping_cupy 已扩展为支持车轮友好的可通达性成本。目前尚无专用的非全向库；约束通常直接编码在 OCS2 的成本/约束项中，或在强化学习中作为软成本。

超越腿式课程的数学拓展¶

D1 引入：帕夫（Pfaffian）滚动约束（纯滚动 A(q)q̇=0 作为 MPC 中的等式约束）、带运动学环路的闭链动力学（受约束的 ABA 或拉格朗日乘子）、依赖滑移的轮胎摩擦 （Pacejka，线性滑移），作为接触模式MPC问题的**轮滑与步行的混合模式切换**，以及**统一的轮+足接触调度**——在同一OCS2公式中，“接触”既可以是滚动的车轮，也可以是静止的脚。

博士研究开放问题（2025-2026）¶

正在研究但尚未解决的问题：(1) 具有形式化稳定性保证的端到端**模式切换策略**（何时滚动与何时步态）；(2) 可变形/软质地形（泥地、砾石）下的轮足动力学； (3) 基于轮足底盘的带手臂全身MPC（D1∩D3）；(4) 牵引力损失恢复**与滑移感知重规划；(5) 跨越路缘石/台阶的高速**轮式跑酷；(6) 长时效配送的**能量最优模式选择**。