本文档属于 Robotics Tutorial 项目,作者:Pengfei Guo,达妙科技。采用 CC BY 4.0 协议,转载请注明出处。
移动机器人规控方向综合教学大纲¶
版本: v2.0 | 日期: 2026-05-14
定位: 面向完成 SLAM 主线 v8(Ch1-46, 48周)的工程师,系统掌握移动机器人规划控制的**方法论工具箱**与**应用实例**。
数据基础: 76 个章节文件, 约 17,000 行教学内容; 横切 6 大方法论专题(10-60)+ 无人机 16 章应用实例(70)+ 5 篇综述(80),基于 100+ 开源项目源码级分析与 200+ 篇顶会/顶刊论文脉络。课程主线按 2026-05 前后版本锁定 acados v0.4+ / PX4 v1.15+ / ROS 2 Kilted,具体 API 与版本特性以各项目当前官方文档和 release notes 为准。
总投入: 横切专题 6 条线 ~81.5 周(T16 + U12 + G10 + MPPI18 + Multi21.5 + TAMP4)+ 无人机 16 章 ~22 周 + 综述 5 篇 ~3 周 = 合计 ~106.5 周;可按专题独立选修。
架构思想: 横切专题(10-60)= 通用方法论工具箱,无人机(70)= 完整应用实例,综述(80)= 贯穿连接线。学方法时跳入无人机看实际效果;学无人机应用时回溯横切专题理解底层原理。
本大纲不覆盖的内容¶
- 底层电机/传感器驱动 -- 见
05_运动控制/M11-M12 - SLAM/感知 -- 见
03_SLAM/ - 机械臂/足式/人形控制 -- 见
05_运动控制/各子方向 - 具身智能/VLA -- 见
06_具身智能/ - 数学基础(优化/李群) -- 见
01_数学/
目录¶
- 角色快速路径
- 计算与硬件需求表
- 工业 vs 研究标记
- 总览路线图(方法-应用双导航)
- 前置知识依赖矩阵
- 生态速览 (2026-05)
- Part-T: 时空联合规划
- Part-U: 不确定性规划
- Part-G: 博弈规划
- Part-MPPI: 采样式 MPC
- Part-Multi: 多机器人协作
- Part-TAMP: 任务与运动规划
- Part-D: 无人机
- Part-S: 综述
- 交叉引用地图
- 学习路径建议
- 文件索引
- 版本历史
角色快速路径¶
本大纲体量庞大(~106.5 周),但并非所有章节都需线性通关。以下三条角色路径各聚焦一项核心职业能力,适合希望在 2-4 个月内建立可运行系统的工程师。完成快速路径后,再按兴趣回填横切专题。
路径一:自动驾驶规划工程师 (14 周)¶
从时空联合规划出发,经 Apollo/Autoware 工业架构,到不确定性处理与博弈交互,建立自动驾驶规划全栈能力。
T0(总论,1周) → T1(Frenet/ST,2周) → T2(走廊,2周) → T3(轨迹优化,3周)
→ T4(Apollo/Autoware,3周) → U0(不确定总论,1周) → U1(分支场景,2周)
总计 ~14 周
| 周次 | 章节 | 核心能力 | 产出 |
|---|---|---|---|
| 1 | T0 总论 | 时空规划全貌与方法谱系 | 文献地图与学习路线 |
| 2-3 | T1 Frenet/ST 图 | Frenet 变换、ST 搜索、DP+QP | Frenet 变换库 + ST 搜索器 |
| 4-5 | T2 走廊构建 | SFC/IRIS 生成、动态障碍建模 | 时空走廊生成器 |
| 6-8 | T3 轨迹优化 | CILQR/TEB/OBCA/MINCO | MINCO 优化器 |
| 9-11 | T4 Apollo/Autoware | EM Planner/Lattice 源码精读 | 规划模块部署调参报告 |
| 12 | U0 不确定性总论 | 不确定性分类与建模 | 失效场景蒙特卡洛分析 |
| 13-14 | U1 分支场景 | MPDM 场景决策 | 分支 NMPC 变道规划器 |
前置要求: SLAM v8 Ch24(优化基础)、ROS2 基础、凸优化入门。 退出能力: 能独立读懂 Apollo/Autoware 规划模块源码,设计时空联合轨迹优化器,处理动态障碍场景。 后续扩展: G2(博弈交互) -> G3(意图推断) -> MPPI_08(自驾采样MPC) -> S1-S4(综述回顾)。
路径二:无人机全栈工程师 (12 周)¶
从仿真环境搭建出发,经微分平坦建模、轨迹优化、感知引导,一路推进到综合实战。跳过偏理论章节(D6 环境表示细节、D10 集群),聚焦单机从仿真到实飞的完整链路。
D0(仿真,1周) → D1(微分平坦,2周) → D3(多项式,1周) → D5(MINCO,2周)
→ D7(感知引导,2周) → D9(RL飞控,2周) → D12(综合实战,2周)
总计 ~12 周
| 周次 | 章节 | 核心能力 | 产出 |
|---|---|---|---|
| 1 | D0 仿真环境 | Gazebo/PX4 SITL/OmniDrones | 仿真悬停 + PPO 训练管线 |
| 2-3 | D1 微分平坦 | 四旋翼建模、平坦映射、SE(3) 控制 | SE(3) 控制器仿真跟踪 |
| 4 | D3 多项式轨迹 | Min-Snap QP、时间分配 | 可飞行走廊轨迹 |
| 5-6 | D5 MINCO | MINCO 参数化、梯度优化、SFC | GCOPTER 走廊约束轨迹 |
| 7-8 | D7 感知引导 | ESDF/感知约束在线重规划 | FUEL 自主探索演示 |
| 9-10 | D9 RL 飞控 | PPO/SAC + CTBR + sim-to-real | RL 策略门穿越 |
| 11-12 | D12 综合实战 | 端到端集成 | 仿真或实机完整演示 |
前置要求: SLAM v8(相机模型与点云处理)、ROS2 基础、Eigen。 退出能力: 能独立完成单架无人机从仿真到实飞的规划控制全链路。 后续扩展: D2(MPC) -> D8(敏捷飞行) -> D10(集群) -> MPPI(采样MPC深化)。
路径三:多机器人协作研究员 (10 周)¶
聚焦分布式协调与 MARL 协作规控,从共识理论到多机系统实战。
Multi_01(全景,1周) → Multi_02(共识/ADMM,1.5周) → Multi_03(MAPF,1.5周)
→ Multi_04(分布式MPC,2周) → Multi_10(MARL,2周) → Multi_13(实战,2周)
总计 ~10 周
| 周次 | 章节 | 核心能力 | 产出 |
|---|---|---|---|
| 1 | Multi_01 全景 | 多机架构分类、通信拓扑 | 架构决策树 |
| 2-3 | Multi_02 共识/ADMM | 线性共识、ADMM 分布式优化 | 10-agent 共识仿真 |
| 3.5-4.5 | Multi_03 MAPF | CBS/LaCAM、任务分配 | CBS 仓库 MAPF |
| 5-6 | Multi_04 分布式 MPC | ADMM 多足编队、WBC | 双 Go2 编队行走 |
| 7-8 | Multi_10 MARL 基础 | CTDE/MAPPO/QMIX | MAPPO 多机导航 |
| 9-10 | Multi_13 综合实战 | 端到端多机系统 | Mini-MultiBot 交付 |
前置要求: OCS2/Crocoddyl 单体 MPC、PPO/SAC、ROS2 多节点。 退出能力: 能设计分布式 MPC + MARL 混合的多机协同系统。 后续扩展: Multi_05-09(协同操作) -> G4(博弈MARL) -> D10(无人机集群)。
计算与硬件需求表¶
不同章节对计算资源的需求差异显著。下表帮助学习者提前规划硬件采购与云资源预算。
横切专题资源需求¶
| 章节范围 | CPU | GPU | 真机 | 备注 |
|---|---|---|---|---|
| T0-T3 (时空基础) | 足够 | 不需要 | 不需要 | 优化规模小,笔记本即可 |
| T4 (Apollo/Autoware) | 多核推荐 | 不需要 | 不需要 | 可选 Autoware 仿真(16GB+ RAM) |
| T5 (多智能体时空) | 多核推荐 | 不需要 | 不需要 | CBS/LaCAM 对 CPU 敏感 |
| T6 (扩散规划) | 多核 | 需要 (RTX 3060+) | 不需要 | 扩散模型训练需显存 |
| U0-U3 (不确定性基础) | 足够 | U3 可选 GPU | 不需要 | 粒子滤波对单核敏感 |
| U4 (POMDP) | 多核推荐 | 可选 GPU | 不需要 | POMCP 树搜索计算密集 |
| U5 (CVaR) | 足够 | 可选 GPU | 不需要 | 数值实验规模不大 |
| G0-G2 (博弈基础) | 多核推荐 | 不需要 | 不需要 | Nash 均衡求解计算密集 |
| G3 (逆博弈) | 多核 | 可选 GPU | 不需要 | 在线参数辨识可选 GPU 加速 |
| G4 (安全/MARL) | 多核 | 推荐 GPU | 不需要 | MARL 训练受益于 GPU |
| MPPI_01-02 (核心理论) | 足够 | MPPI_02 起强烈推荐 | 不需要 | CUDA 并行是核心内容 |
| MPPI_03-04 (变体) | 多核 | 推荐 (RTX 3060+) | 不需要 | 对比 benchmark 需 GPU |
| MPPI_05-06 (前沿融合) | 多核 | 必需 (RTX 3060+) | 不需要 | 扩散/世界模型训练需显存 |
| MPPI_07-08 (领域应用) | 多核 | 推荐 GPU | MPPI_08 可选 | MuJoCo GPU rollout |
| MPPI_09-10 (对比+实战) | 多核 | 必需 (RTX 3060+) | MPPI_10 推荐 | Mini-MPPI 完整工程 |
| Multi_01-03 (多机基础) | 多核推荐 | 不需要 | 不需要 | 多智能体仿真吃 CPU |
| Multi_04-06 (协同控制) | 多核 | 可选 GPU | 不需要 | IsaacLab 仿真推荐 GPU |
| Multi_07-09 (协同操作) | 多核 | 推荐 GPU | 不需要 | 闭链动力学计算密集 |
| Multi_10-12 (MARL) | 多核 | 必需 (RTX 3060+) | 不需要 | MARL 训练需 GPU |
| Multi_13 (综合实战) | 多核 | 必需 | 不需要 | 推荐多机仿真集群 |
| TAMP_T1 (任务运动) | 足够 | 不需要 | 不需要 | 符号推理为主 |
无人机章节资源需求¶
| 章节 | CPU | GPU | 真机 | 备注 |
|---|---|---|---|---|
| D0 仿真环境 | 足够 | 不需要 | 不需要 | PX4 SITL + Gazebo |
| D1 微分平坦 | 足够 | 不需要 | 不需要 | 刚体力学推导为主 |
| D2 MPC 控制 | 足够 | 不需要 | 不需要 | acados 数值计算 |
| D3-D5 轨迹优化 | 足够 | 不需要 | 不需要 | 数值优化为主 |
| D6-D7 环境感知 | 多核推荐 | 可选(加速 ESDF) | 不需要 | 点云处理有一定计算量 |
| D8 敏捷飞行 | 多核 | 可选 | PX4 推荐 | 实机效果显著优于仿真 |
| D9 RL 飞控 | 多核 | 必需 (RTX 3060+) | 不需要 | PPO/SAC 训练需 GPU |
| D10 集群 | 多核 | MARL 训练需 GPU | 不需要 | 多机仿真资源需求高 |
| D11 前沿 | 视内容 | 视内容 | 不需要 | 跟踪最新论文 |
| D12 综合实战 | 多核 | 推荐 | 强烈推荐 PX4 真机 | 端到端项目 |
推荐配置总结¶
| 配置层级 | 硬件规格 | 覆盖范围 |
|---|---|---|
| 最低入门 | 8 核 CPU / 16GB RAM / 无独显 | 横切 T/U/G 基础 + 无人机 D0-D5 |
| 推荐标准 | 12 核 CPU / 32GB RAM / RTX 3060 12GB | 全部章节仿真部分 |
| 完整配置 | 上述 + RTX 4090 24GB | 全部章节 + 大规模 MARL 训练 |
| 实机配置 | 推荐标准 + PX4 开发套件 (Holybro X500/Pixhawk 6C) | D8/D12 实机实战 |
工业 vs 研究标记¶
每个章节按内容侧重标记为工业导向、研究导向或两者兼具,帮助不同目标的学习者快速筛选。
工业导向章节 (🏭)¶
以工程落地和系统集成为核心,代码可直接复用于产品级系统。
| 章节 | 关键词 | 目标岗位 |
|---|---|---|
| T4 Apollo/Autoware 架构 | EM-Planner, Autoware.Universe, 量产方案 | 自动驾驶规划工程师 |
| MPPI_10 Mini-MPPI 实战 | ROS2 节点封装, 延迟补偿, 实车测试 | 控制算法工程师 |
| Multi_04 分布式 MPC 编队 | ADMM, 多足编队, WBC | 多机系统工程师 |
| D0 仿真环境搭建 | Gazebo, PX4 SITL, OmniDrones | 无人机系统工程师 |
| D8 敏捷飞行集成 | PX4 offboard, uXRCE-DDS | 飞控工程师 |
| D12 综合实战 | 全链路集成, 飞行日志分析 | 无人机全栈工程师 |
研究导向章节 (🔬)¶
聚焦前沿方法论与开放问题,适合追求论文发表或方法创新的学习者。
| 章节 | 关键词 | 研究方向 |
|---|---|---|
| T6 扩散式时空规划 | Diffusion Policy, 条件生成 | 生成式规划 |
| U4 POMDP/Belief 空间 | 部分可观测, 在线决策 | 信息论规划 |
| U5 CVaR 风险规划 | 条件风险值, DRO | 风险敏感控制 |
| G3 逆博弈/Level-k | 意图推断, 有界理性 | 预测-规划一体 |
| G4 安全证书/MARL | GCBF+, Stackelberg | 安全多智能体 |
| MPPI_05 扩散增强 MPC | MBD, DIAL-MPC | 采样-扩散融合 |
| MPPI_06 TD-MPC | 世界模型, latent 规划 | 模型基 RL |
| Multi_12 MARL+规控混合 | 残差策略, Safe MARL | 学习型协调 |
| D9 RL 敏捷飞控 | sim-to-real, 策略蒸馏 | 端到端飞行 |
| D11 前沿追踪 | 3DGS 导航, VLM 无人机 | 新兴交叉 |
工业-研究兼具章节 (🏭🔬)¶
方法本身已有工业应用但仍在快速演进,论文与产品并重。
| 章节 | 关键词 | 应用场景 |
|---|---|---|
| T3 时空轨迹优化 | CILQR/TEB/OBCA/MINCO | 动态环境规划 |
| U2 鲁棒规划/CBF 安全滤波 | Tube MPC, CBF-QP | 安全关键系统 |
| G2 实时博弈求解 | iLQGames, ALGAMES | 多车交互 |
| MPPI_07 腿足全身 MPPI | 全身力矩, MuJoCo GPU | 足式敏捷控制 |
| MPPI_08 导航/自驾采样 MPC | Nav2 MPPI, AutoRally | ROS2 导航 |
| Multi_08 多足协同 Loco-Manipulation | 相位耦合, 协同 WBC | 多足搬运 |
| D2 MPC 控制 | acados NMPC, L1 自适应 | 从仿真到实机 |
| D5 MINCO/安全走廊 | GCOPTER, FIRI, SUPER | 高速安全飞行 |
总览路线图¶
方法论层与应用层的双导航架构¶
本大纲的核心设计:横切专题(10-60)提供通用方法论工具箱,无人机(70)提供完整应用实例,综述(80)提供连接线。三层之间存在大量交叉引用。
┌─────────────────────────────────────────────────────────────────────────────┐
│ 横切方法论层(通用工具箱,~81.5 周) │
│ │
│ 10_时空规划 (T0-T6+附录, 8章, 16周) │
│ ├── T0 总论 → T1 Frenet/ST → T2 走廊 → T3 轨迹优化 │
│ ├── T4 Apollo/Autoware 🏭 → T5 多智能体 → T6 扩散规划 🔬 │
│ └── ←→ 无人机 D3-D5 轨迹优化 / D2 MPC │
│ │
│ 20_采样式MPC (MPPI Ch1-10+附录, 12章, 18周) │
│ ├── MPPI_01 路径积分 → MPPI_02 CUDA → MPPI_03 六大变体 → MPPI_04 CEM │
│ ├── MPPI_05 扩散MPC 🔬 → MPPI_06 TD-MPC → MPPI_07 腿足 → MPPI_08 导航 │
│ ├── MPPI_09 选型决策 → MPPI_10 Mini-MPPI 🏭 │
│ └── ←→ 无人机 D2 MPC / 足式 05_运动控制 │
│ │
│ 30_不确定性 (U0-U5+附录, 8章, 12周) │
│ ├── U0 总论 → U1 分支场景 → U2 鲁棒/CBF 🏭🔬 → U3 机会约束 │
│ ├── U4 POMDP 🔬 → U5 CVaR 🔬 │
│ └── ←→ 无人机 D7 感知引导 / Safe RL │
│ │
│ 40_博弈规划 (G0-G4+附录, 7章, 10周) │
│ ├── G0 总论 → G1 HJI → G2 实时博弈 🏭🔬 → G3 逆博弈 🔬 → G4 安全/MARL 🔬 │
│ └── ←→ 无人机 D10 集群对抗 / 自动驾驶交互 │
│ │
│ 50_多机器人 (Multi Ch1-13+附录, 16章, 21.5周) │
│ ├── Multi_01 全景 → Multi_02 共识 → Multi_03 MAPF → Multi_04 分布MPC 🏭🔬 │
│ ├── Multi_05 协同搬运 → Multi_06 异构 → Multi_07 双臂 → Multi_08 多足 🏭🔬│
│ ├── Multi_09 人形协同 → Multi_10 MARL → Multi_11 协调 → Multi_12 混合 🔬 │
│ ├── Multi_13 Mini-MultiBot 🏭 │
│ └── ←→ 无人机 D10 集群 / 05_运动控制 双臂+足式 │
│ │
│ 60_TAMP (1章, 4周) │
│ ├── TAMP_T1 符号+连续规划接口 │
│ └── ←→ 06_具身智能 SayCan/VoxPoser │
│ │
└─────────────────────────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────────────────────────┐
│ 无人机应用层(完整实例,~22 周) │
│ │
│ Part 0: 仿真 D0 (1周) ─── PX4 SITL + Gazebo + IsaacLab │
│ Part 1: 动力学 D1 (2周) + D2 (2周) ─── 微分平坦 + MPC │
│ Part 2: 轨迹 D3 (1周) + D4 (1.5周) + D5 (2周) ─── Min-Snap→MINCO │
│ Part 3: 感知 D6 (2周) + D7 (2周) ─── 环境表示 + 自主探索 │
│ Part 4: 敏捷 D8 (2周) + D9 (2周) ─── 敏捷飞行 + RL │
│ Part 5: 集群 D10 (1.5周) + D11 (1.5周) ─── 协同 + 前沿 │
│ Part 6: 实战 D12 (2周) ─── 端到端综合项目 │
│ 附录 (6篇) 轨迹深度/感知深度/MPC深度/RL深度/配套/调研 │
│ │
└─────────────────────────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────────────────────────┐
│ 综述连接层(贯穿线,~3 周) │
│ │
│ S1 总览与时空联合 ─── 连接 T线 + D3-D5 │
│ S2 不确定性规划 ─── 连接 U线 + D7 │
│ S3 博弈规划 ─── 连接 G线 + D10 │
│ S4 交互意图预测 ─── 连接 G3 + 自动驾驶 │
│ S5 RL与经典规控 ─── 全线贯穿视角 │
│ │
└─────────────────────────────────────────────────────────────────────────────┘
横切专题之间的依赖关系¶
T (时空联合)
/ | \
v v v
T5(多智能体) TAMP T6(扩散)
| |
v v
MPPI (采样式MPC) ─→ Multi (多机) ←──── G (博弈)
│ |
├──→ U (不确定性) |
├──→ G (博弈) v
└──→ Multi 综述(80)
核心路径:
MPPI → U: MPPI 天然处理随机性,U 专题深化理论
MPPI → G: 多智能体 MPPI → 博弈 MPPI
MPPI → Multi: 多智能体 MPPI → 分布式采样
T → TAMP: 连续轨迹优化嵌入符号任务规划
Multi → G: 非合作多机 → 博弈论框架
前置知识依赖矩阵¶
本大纲假设学习者已完成 SLAM v8 主线课程。下表列出各专题对 v8 具体章节的依赖,以及额外需要的数学与编程基础。
横切专题前置依赖¶
| 横切专题 | SLAM v8 前置 | 额外数学基础 | 额外编程基础 | 最低可启动 |
|---|---|---|---|---|
| T: 时空规划 | 点云处理、占据栅格 | 凸优化(对偶)、多项式插值 | C++ 数值优化库(Eigen, OSQP) | Ch11+Ch24 |
| U: 不确定性 | 贝叶斯滤波、EKF/UKF | 随机过程、CVaR 风险度量 | Python 概率编程 | Ch11+Ch18+Ch20 |
| G: 博弈规划 | 多目标跟踪(MOT)基础 | 博弈论(Nash 均衡)、微分博弈 | 自动微分(JAX/Julia) | Ch24+Ch22 |
| MPPI: 采样MPC | 无直接依赖 | 最优控制(LQR/iLQR)、信息论 | CUDA C++、PyTorch | Ch11 |
| Multi: 多机 | 分布式 SLAM(如有) | 图论、共识算法、ADMM | ROS2 多节点、DDS | Ch31+Ch19 |
| TAMP: 任务运动 | 语义 SLAM(如有) | 符号 AI(PDDL)、混合系统 | PDDL 求解器接口 | Ch6+Ch31 |
无人机章节前置依赖¶
| 无人机章节 | SLAM v8 前置 | 横切专题前置 | 备注 |
|---|---|---|---|
| D0 仿真环境 | ROS2 基础通信 | 无 | 独立入口 |
| D1 微分平坦 | Eigen(Ch11)、SO(3)/SE(3)(Ch23) | 无 | 需刚体动力学基础 |
| D2 MPC | 非线性优化(Ch17-18) | MPPI_01(推荐) | 与 MPPI 互补 |
| D3 多项式轨迹 | Eigen(Ch11) | T0-T1(推荐) | 走廊概念来自 T 专题 |
| D4 B 样条 | 无直接依赖 | D3(必须) | B 样条是 D3 延伸 |
| D5 MINCO | Eigen(Ch11) | D3+D4(必须) | MINCO 统一前两者 |
| D6 环境表示 | 占据栅格、ESDF、点云 | 无 | 直接复用 SLAM 知识 |
| D7 感知引导 | 视觉 SLAM、点云 | D6(必须), U0(推荐) | 感知不确定性连 U 专题 |
| D8 敏捷飞行 | 无直接依赖 | D1+D5(必须) | 高速场景轨迹跟踪 |
| D9 RL 飞控 | 无直接依赖 | D1(必须) | 需 RL 基础(PPO/SAC) |
| D10 集群 | 分布式系统概念 | Multi_01-03(推荐) | 连接 Multi 专题 |
| D11 前沿 | NeRF/3DGS(如有) | 视具体论文 | 跟踪最新进展 |
| D12 综合实战 | 全部相关章节 | D0-D8(必须) | 集成性项目 |
v8 前置三层口径¶
- 最低可启动: Ch11(Eigen)、Ch17-18(优化)、Ch24(轨迹)。可支撑任一角色快速路径启动。
- 推荐补齐: Ch11、Ch14、Ch17-20、Ch23(李群)、Ch24、Ch31(ROS2)。适合完整学习任一 Part。
- 完整前置: 完成 v8 Ch1-Ch46 全部内容,进入全部横切专题+无人机无障碍。
生态速览 (2026-05)¶
本方向涉及多个活跃开源生态,各有核心维护团队和技术路线。了解生态格局有助于选择代码基础和社区资源。
浙大规划学派 (ZJU FAST Lab / 高飞团队)¶
围绕多项式/B 样条/MINCO 轨迹优化构建了完整的无人机规划栈。
| 项目 | 定位 | 状态 | 星标 |
|---|---|---|---|
| GCOPTER | 通用走廊约束轨迹优化器 | 稳定,学术基准 | ~400 |
| EGO-Planner | ESDF-free 梯度在线规划 | 广泛使用 | ~600 |
| EGO-Swarm | 多机去中心化扩展 | D10 核心参考 | ~1.9k |
| MIGHTY (2025) | 大规模异构集群 | 最新,百级无人机 | -- |
特点: 理论严谨、header-only 风格、论文与代码一一对应。偏学术,工业移植需额外工程化。
MPPI/采样 MPC 生态¶
MPPI 从机器人领域扩展到自动驾驶和敏捷飞行,形成活跃社区。
| 项目 | 语言 | 定位 | 状态 |
|---|---|---|---|
| MPPI-Generic (ACDSLab) | C++/CUDA | Header-only 模板库 | 活跃维护 |
| pytorch_mppi (UM-ARM-Lab) | Python/PyTorch | 可微分 MPPI | 研究友好 |
| Tube-MPPI | C++ | 鲁棒管道约束 | MPPI_03 参考 |
| Diffusion-MPPI (2025) | PyTorch | 扩散先验 MPPI | 前沿 |
| DIAL-MPC (2025) | Python | 扩散退火+全身力矩 | ICRA Best Paper Finalist |
特点: GPU 加速是核心竞争力,C++ 和 Python 两条路线并行。
PX4 + ROS2 无人机工具链¶
PX4 飞控与 ROS2 的集成在 2024-2025 年间趋于成熟。
| 组件 | 定位 | 状态 |
|---|---|---|
| PX4 Autopilot v1.15+ | 开源飞控固件 | 持续活跃 |
| uXRCE-DDS Agent | PX4-ROS2 通信桥 | 官方推荐,替代 mavros |
| Gazebo Harmonic | 仿真环境 | ROS2 原生集成 |
| OmniDrones/Aerial Gym | RL 训练仿真 | IsaacLab 生态 |
最新动态: ROSCon 2025 专题讨论 PX4+ROS2 生产级部署; uXRCE-DDS 带宽优化持续推进; PX4 社区探索 VLM/LLM 集成接口。
多智能体 RL 生态¶
| 项目 | 定位 | 状态 |
|---|---|---|
| MARLlib | 18 算法,全任务模式 | 统一 MARL 框架 |
| EPyMARL | 扩展 PyMARL,异构支持 | 标准化评估 |
| HARL | HAPPO/HATRPO 统一库 | 协作强基线 |
| MASH (2025) | 异构人形 MARL | 前沿 |
扩散式规划生态 (2023-2026 最热方向)¶
| 工作 | 会议/年份 | 核心贡献 | 对应章节 |
|---|---|---|---|
| Diffuser | ICML 2022 | 轨迹优化折进扩散模型 | T6, MPPI_05 |
| Diffusion Policy | RSS 2023 | 视觉运动 BC, 条件 DDPM | T6, 06_具身 |
| Diffusion-Planner | ICLR 2025 | 自动驾驶联合规划 | T6, MPPI_05 |
| TD-MPC2 | ICLR 2024 | Latent MPPI + world model | MPPI_06 |
| DIAL-MPC | ICRA 2025 | 扩散退火全身力矩 | MPPI_05, MPPI_07 |
自动驾驶规划生态¶
| 项目 | 定位 | 状态 |
|---|---|---|
| Apollo Planning | L4 量产规划栈 | T4 核心参考 |
| Autoware.Universe | 开源全栈自动驾驶 | T4 核心参考 |
| CARLA/Highway-env | 仿真 Benchmark | G/T 线通用 |
| iLQGames (Fridovich-Keil) | 实时博弈求解 | G2 核心 |
| hj_reachability | HJI 安全验证 | G1 核心 |
各 Part 详细大纲¶
Part-T: 时空联合规划 (T0-T6 + 附录, ~16 周)¶
线路定位: 从经典路径-速度解耦到端到端时空轨迹优化,贯穿自动驾驶与机器人导航两大应用域 里程碑: 完成本线后,学习者**能设计时空联合轨迹优化器,理解 Apollo/Autoware 规划架构** 文件目录:
10_时空规划/文件清单: 8 个 .md 文件
T0 时空联合规划总论 (1 周)¶
前置: 无 (本线入口) 核心主题: 时空耦合动机与三核心洞察 . 路径-速度解耦范式的局限性 . 时空联合规划谱系总览 . 6 章路线图与学习依赖 . 评价指标体系(安全/效率/舒适) . 典型失败案例分析 文件:
10_时空规划/10_时空联合规划总论.md共享标记: 导论章节
T1 Frenet 坐标系与 ST 图 (2 周) ⭐⭐¶
前置: v8 Ch24(优化基础), 微分几何初步 核心主题: Frenet-Serret 坐标系变换 . 曲率/挠率与路径参数化 . ST 图构建与搜索策略 . DP+QP 两阶段求解 . 纵横向耦合场景分析 . 坐标奇异性处理 . 参考线平滑 关键论文: Werling et al. (2010) ICRA -- Frenet Frame Planner 文件:
10_时空规划/20_Frenet坐标系与ST图.md共享标记: 🏭🔬 自动驾驶+导航通用
T2 时空走廊构建 (2 周) ⭐⭐¶
前置: T1(Frenet/ST), 凸优化基础 核心主题: 时空 A*/Hybrid A* 搜索 . SFC 生成算法(DecompUtil/FIRI/CIRI) . 凸分解与 IRIS 方法 . 动态障碍物时空建模 . 走廊连续性与可行性保证 关键论文: Liu et al. (2017) -- Safe flight corridors 文件:
10_时空规划/30_时空走廊与搜索.md共享标记: 🔬 无人机/自动驾驶走廊通用
T3 时空轨迹优化方法 (3 周) ⭐⭐⭐¶
前置: T2(走廊), 最优控制基础 核心主题: CILQR(约束迭代 LQR) . TEB(Timed Elastic Band) . OBCA(Optimization-Based Collision Avoidance) . MINCO 轨迹表示 . 求解器选型(OSQP/IPOPT/CasADi) . 实时性对比 关键论文: Zhang et al. (2020) -- EGO-Planner/MINCO, Wang (2022) -- GCOPTER 文件:
10_时空规划/40_时空轨迹优化.md共享标记: 🏭🔬 核心算法章,理论密度最高
T4 Apollo 与 Autoware 规划架构剖析 (3 周) ⭐⭐⭐ 🏭¶
前置: T1-T3(理论基础) 核心主题: Apollo Planning 模块架构(Scenario/Stage/Task) . EM Planner 解耦流程 . Lattice Planner 实现 . Autoware.Universe Planning 栈 . 工业级代码质量分析 关键论文: Fan et al. (2018) -- Apollo EM motion planner 文件:
10_时空规划/50_Apollo_Autoware框架.md共享标记: 🏭 工业框架深度剖析
T5 多智能体时空规划 (3 周) ⭐⭐⭐¶
前置: T3(轨迹优化), 图搜索算法 核心主题: CBS 冲突搜索 . LaCAM 大规模 MAPF . ORCA 互惠避碰 . EGO-Swarm 去中心化 . MADER 时空安全 . 规模可扩展性分析 关键论文: Sharon (2015) CBS, Zhou (2021) EGO-Swarm, Tordesillas (2022) MADER 文件:
10_时空规划/60_多智能体时空协调.md共享标记: 🔬 多机/集群核心
T6 端到端与扩散式时空规划 (1.5 周) ⭐⭐ 🔬¶
前置: T3(轨迹优化), 深度学习基础 核心主题: 扩散模型基础(DDPM/Score Matching) . Diffusion Policy 时空轨迹生成 . CTG 条件引导 . 端到端范式(UniAD/VAD) . 安全性挑战 关键论文: Chi (2023) Diffusion Policy, Janner (2022) Diffuser 文件:
10_时空规划/70_端到端与扩散式规划.md共享标记: 🔬 前沿研究方向
T 附录 综合对比 (0.5 周)¶
前置: T0-T6 全线 核心主题: 方法分类矩阵 . 计算复杂度横评 . 安全性保证层级 . 开源实现索引 . 面试/选题建议 文件:
10_时空规划/80_综合对比与附录.md
T 线依赖 DAG¶
T0(总论) ──> T1(Frenet/ST) ──> T2(走廊) ──> T3(轨迹优化) ──┬──> T4(Apollo/Autoware)
├──> T5(多智能体)
└──> T6(扩散规划)
T0-T6 ──> T附录
T 线周历 (16 周)¶
| 周次 | 章节 | 核心产出 |
|---|---|---|
| W1 | T0 总论 | 文献地图,学习路线 |
| W2-W3 | T1 Frenet/ST | Frenet 变换库 + ST 搜索器 |
| W4-W5 | T2 走廊 | 走廊生成器,动态障碍 Demo |
| W6-W8 | T3 轨迹优化 | MINCO 优化器,TEB/OBCA 对比 |
| W9-W11 | T4 Apollo/Autoware | 源码走读报告,部署调参 |
| W12-W14 | T5 多智能体 | CBS 求解器,EGO-Swarm 仿真 |
| W15 | T6 扩散规划 | Diffusion Policy 实验 |
| W15.5-W16 | T 附录 | 综合 Benchmark + 对比报告 |
T 线核心参考论文¶
- Werling et al. (2010) -- Optimal trajectory generation in a Frenet frame
- Liu et al. (2017) -- Safe flight corridors for quadrotor planning
- Wang (2022) -- GCOPTER/MINCO trajectory optimization (TRO)
- Fan et al. (2018) -- Baidu Apollo EM motion planner
- Zhou et al. (2021) -- EGO-Swarm decentralized planning (ICRA)
T 线里程碑检验: 1. 工程能力: 能设计时空联合轨迹优化器,理解 Apollo/Autoware 规划架构 2. 系统能力: 能独立完成 Frenet 坐标变换到走廊约束优化的完整 Pipeline 3. 验收标准: 动态障碍物场景时空轨迹规划,满足安全/平滑/实时三约束
Part-U: 不确定性规划 (U0-U5 + 附录, ~12 周)¶
线路定位: 从确定性规划扩展到真实世界的感知噪声、模型不确定与环境随机性 里程碑: 完成本线后,学习者**能实现 Tube MPC/CBF 安全约束,理解 POMDP 决策框架** 文件目录:
30_不确定性规划/文件清单: 7 个 .md 文件
U0 不确定性规划总论 (1 周)¶
前置: 概率论基础, MPC 入门 核心主题: 不确定性来源分类(认知/偶然/模型/环境) . 鲁棒 vs 随机 vs 分布式鲁棒谱系 . 安全性定义层级 . 确定性规划的失效场景分析 文件:
30_不确定性规划/10_不确定性规划总论.md共享标记: 导论章节
U1 分支场景与应急规划 (2 周) ⭐⭐¶
前置: U0(总论), 决策树/MDP 基础 核心主题: Contingency Planning 条件分支 . MPDM 多策略决策 . 场景树构建与概率赋权 . Multi-stage NMPC . 自动驾驶变道案例 关键论文: Cunningham (2015) MPDM 文件:
30_不确定性规划/20_分支场景规划.md共享标记: 🏭 自动驾驶决策核心
U2 鲁棒规划与安全滤波 (2.5 周) ⭐⭐⭐¶
前置: U1(分支), 李雅普诺夫稳定性 核心主题: Tube MPC 鲁棒管道 . CBF 安全屏障函数 . CLF-CBF-QP 安全滤波器 . GP-MPC 高斯过程增强 . CBF 高阶相对度处理 关键论文: Mayne (2005) Tube MPC, Ames (2017) CBF-QP 文件:
30_不确定性规划/30_鲁棒规划与安全滤波.md共享标记: 🏭🔬 安全关键系统核心
U3 机会约束规划 (2 周) ⭐⭐¶
前置: U2(鲁棒), 随机优化 核心主题: CC-MPC 机会约束 . IRA 迭代风险分配 . CC-RRT 概率约束采样 . 约束紧缩技术 关键论文: Blackmore (2011) Chance-constrained path planning 文件:
30_不确定性规划/40_机会约束规划.md共享标记: 🔬 概率安全保证
U4 POMDP 与 Belief 空间规划 (2.5 周) ⭐⭐⭐ 🔬¶
前置: U3(机会约束), MDP/贝叶斯推理 核心主题: POMDP 框架 . Belief 空间表示 . 信息收集型规划 . POMCP/DESPOT 在线求解 . 探索-利用权衡 关键论文: Silver & Veness (2010) POMCP 文件:
30_不确定性规划/50_POMDP与Belief规划.md共享标记: 🔬 理论深度最高
U5 风险敏感与 CVaR 规划 (1.5 周) ⭐⭐ 🔬¶
前置: U3(机会约束), 风险度量基础 核心主题: CVaR 条件风险值 . 分布式鲁棒优化(DRO) . Distributional RL . 一致性风险度量 关键论文: Majumdar & Pavone (2020) -- CVaR planning 文件:
30_不确定性规划/60_风险敏感规划CVaR.md共享标记: 🔬 交叉学科(金融+机器人)
U 附录 综合对比 (0.5 周)¶
前置: U0-U5 全线 核心主题: 方法分类矩阵 . 保守性-计算量权衡 . 安全保证强度排序 . 求解器索引 文件:
30_不确定性规划/70_综合对比与附录.md
U 线依赖 DAG¶
U 线周历 (12 周)¶
| 周次 | 章节 | 核心产出 |
|---|---|---|
| W1 | U0 总论 | 不确定性分类 Notebook |
| W2-W3 | U1 分支场景 | MPDM 决策器 |
| W4-W5.5 | U2 鲁棒/CBF | Tube MPC 控制器, CBF 滤波器 |
| W6-W7 | U3 机会约束 | CC-MPC 规划器 |
| W8-W9.5 | U4 POMDP | POMCP 求解器 |
| W10-W11 | U5 CVaR | CVaR 轨迹优化器 |
| W11.5-W12 | U 附录 | 统一 Benchmark + 选型决策树 |
U 线里程碑检验: 1. 安全能力: 能实现 Tube MPC/CBF 安全约束 2. 决策能力: 理解 POMDP 框架,能设计信息收集策略 3. 验收标准: CBF 滤波器零碰撞; POMDP 决策优于 greedy 基线 20%+
Part-G: 博弈规划 (G0-G4 + 附录, ~10 周)¶
线路定位: 将规划从单智能体扩展到多智能体交互博弈 里程碑: 完成本线后,学习者**能建模多智能体博弈,实现 iLQGames 求解器** 文件目录:
40_博弈规划/文件清单: 6 个 .md 文件
G0 博弈规划总论 (1 周)¶
前置: 博弈论入门, 最优控制基础 核心主题: 博弈论在规划中的动机 . Nash/Stackelberg 均衡 . 静态 vs 微分博弈 . 交互建模缺陷分析 文件:
40_博弈规划/10_博弈规划总论.md共享标记: 导论章节
G1 微分博弈与 HJI 可达性 (2 周) ⭐⭐⭐¶
前置: G0(总论), 偏微分方程基础 核心主题: 微分博弈形式化 . HJI 方程 . 可达性分析 . Level Set 方法 . DeepReach 神经网络近似 关键论文: Bansal (2017) -- HJ reachability overview 文件:
40_博弈规划/20_微分博弈与HJI.md共享标记: 🔬 安全验证基础
G2 实时博弈求解 (2.5 周) ⭐⭐⭐¶
前置: G1(微分博弈), iLQR 算法 核心主题: iLQGames 迭代线性二次博弈 . ALGAMES 增广拉格朗日 . 开环 vs 反馈 Nash . 收敛性与多均衡 . 实时性优化 关键论文: Fridovich-Keil (2020) iLQGames, Le Cleac'h (2022) ALGAMES 文件:
40_博弈规划/30_实时博弈求解器.md共享标记: 🏭🔬 核心算法章
G3 逆博弈与 Level-k 推理 (2 周) ⭐⭐ 🔬¶
前置: G2(实时博弈), 逆最优控制 核心主题: 逆博弈问题定义 . 从观测推断对手目标 . Level-k 认知层级 . 预测-规划一体化 关键论文: Peters (2021) -- Inverse Games 文件:
40_博弈规划/40_逆博弈与预测规划.md共享标记: 🔬 预测规划交叉
G4 安全证书与 MARL 交界 (2 周) ⭐⭐ 🔬¶
前置: G2(实时博弈), RL 基础 核心主题: 安全证书 . Stackelberg 博弈 . 博弈+CBF 融合 . MARL 基础(MAPPO/QMIX) . 博弈均衡与 MARL 收敛 关键论文: GCBF+ (MIT REALM), PSRO (Lanctot 2017) 文件:
40_博弈规划/50_安全证书与MARL.md共享标记: 🔬 博弈+学习交界
G 附录 综合对比 (0.5 周)¶
前置: G0-G4 全线 核心主题: 方法分类矩阵 . 均衡概念选择指南 . 信息结构影响 . 开源索引 文件:
40_博弈规划/60_综合对比与附录.md
G 线依赖 DAG¶
G 线周历 (10 周)¶
| 周次 | 章节 | 核心产出 |
|---|---|---|
| W1 | G0 总论 | 博弈分类 Notebook |
| W2-W3 | G1 HJI | HJI 求解器(2D/3D) |
| W4-W5.5 | G2 实时博弈 | iLQGames 求解器 |
| W6-W7 | G3 逆博弈 | 意图推断器 |
| W8-W9 | G4 安全/MARL | 博弈 CBF 系统 |
| W9.5-W10 | G 附录 | 统一评测 + 选型报告 |
G 线里程碑检验: 1. 建模能力: 能定义玩家/策略空间/代价函数 2. 求解能力: iLQGames 双车交互 10Hz+ 实时求解 3. 验收标准: 逆博弈意图推断 ADE < 基线 50%
Part-MPPI: 采样式 MPC (Ch1-10 + 附录, ~18 周)¶
线路定位: 从梯度式 MPC 扩展到采样式/路径积分控制范式,天然兼容不连续代价、黑箱仿真器、神经网络动力学 里程碑: 完成本线后,学习者**能设计、调优并部署基于 MPPI 的实时控制器** 文件目录:
20_采样式MPC/文件清单: 12 个 .md 文件 核心谱系: Kappen (Radboud) -> Todorov (UCSD) -> Theodorou (Georgia Tech) -> Williams (ACDS)
Part 1: 理论与核心实现 (Ch1-Ch2, 4 周)¶
里程碑:路径积分数学推导 + 可运行 CUDA MPPI 控制器
MPPI_01 | 路径积分控制理论 | ⭐⭐⭐ | 2 周
核心主题: Kappen 指数变换 -> HJB 线性化 . Feynman-Kac 路径积分 . 自由能-KL 散度对偶 . MPPI 权重公式 . 温度 lambda 的物理意义 . MPPI 与 REINFORCE 同构 关键论文: Kappen 2005, Todorov 2009 (PNAS), Williams 2017 (JGCD), Williams 2018 (T-RO) 文件:
20_采样式MPC/20_路径积分控制理论.md
MPPI_02 | 核心算法与 GPU 并行实现 | ⭐⭐⭐ | 2 周
核心主题: MPPI 伪代码 . CUDA kernel 设计 . 协方差调度 . MPPI-Generic 精读 . pytorch_mppi 快速原型 . MuJoCo GPU rollout 关键论文: Williams 2017 (JGCD), Vlahov 2024 (MPPI-Generic, RA-L) 文件:
20_采样式MPC/30_MPPI核心算法与GPU.md
Part 2: 变体与统一视角 (Ch3-Ch4, 3.5 周)¶
里程碑:6 大变体适用场景 + CEM/Stein 统一理论
MPPI_03 | MPPI 六大变体 | ⭐⭐⭐⭐ | 2 周
核心主题: Smooth-MPPI . Tube-MPPI(鲁棒) . Robust-MPPI(min-max) . Log-MPPI(权重坍缩) . CoVO-MPC(协方差优化) . SVG-MPPI(Stein 引导) 关键论文: Williams 2018 Tube-MPPI, Pan 2023 CoVO-MPC, Honda 2024 SVG-MPPI 文件:
20_采样式MPC/40_MPPI六大变体.md
MPPI_04 | CEM 家族与采样 MPC 统一视角 | ⭐⭐⭐ | 1.5 周
核心主题: CEM -> iCEM -> Predictive Sampling . Tsallis MPPI . 统一框架: "采样分布 x 代价评估 x 更新规则" 关键论文: Pinneri 2021 iCEM (NeurIPS), Howell 2022 Predictive Sampling 文件:
20_采样式MPC/50_CEM家族与统一视角.md
Part 3: 前沿融合 (Ch5-Ch6, 4 周)¶
里程碑:MPPI 与扩散模型/世界模型的交叉前沿
MPPI_05 | 扩散启发采样 MPC | ⭐⭐⭐⭐ | 2 周 🔬
核心主题: DDPM 去噪 <-> MPPI 加权更新数学同构 . MBD(Model-Based Diffusion) . DIAL-MPC 扩散退火全身力矩 . Go1/H1 实验 关键论文: Pan 2024 MBD (NeurIPS), Xue 2025 DIAL-MPC (ICRA Best Paper Finalist) 文件:
20_采样式MPC/60_扩散启发采样MPC.md
MPPI_06 | 学习世界模型 + 采样规划 (TD-MPC) | ⭐⭐⭐⭐ | 2 周 🔬
核心主题: TD-MPC 三组件 . MPPI 在 latent 空间规划 . TD-MPC2 规模化(317M 参数, 104 任务) . Transformer-MPPI 关键论文: Hansen 2022 TD-MPC (ICML), Hansen 2024 TD-MPC2 (ICLR) 文件:
20_采样式MPC/70_学习世界模型TD-MPC.md
Part 4: 领域应用 (Ch7-Ch8, 3.5 周)¶
里程碑:采样 MPC 部署到真实机器人领域
MPPI_07 | 腿足全身 MPPI 与接触操作 | ⭐⭐⭐⭐ | 2 周 🏭🔬
核心主题: 接触不连续 -> 梯度 MPC 失效 -> 采样天然兼容 . 全身力矩空间 MPPI . 与 RL 混合架构 关键论文: Howell 2022 MuJoCo MPC, Xue 2025 DIAL-MPC 文件:
20_采样式MPC/80_腿足全身MPPI.md
MPPI_08 | 导航、自驾与无人机采样 MPC | ⭐⭐⭐ | 1.5 周 🏭🔬
核心主题: ROS2 Nav2 MPPI Controller . AutoRally 实车 . 自动驾驶 MPPI . 无人机 SE(3) MPPI 关键论文: Williams 2018 AutoRally, Macenski 2023 Nav2 MPPI 文件:
20_采样式MPC/90_导航自驾无人机采样.md
Part 5: 对比与综合实战 (Ch9-Ch10, 3 周)¶
里程碑:选型决策能力 + 完整项目交付
MPPI_09 | MPPI vs 梯度式 MPC 选型 | ⭐⭐⭐ | 1 周
核心主题: 五维对比 . 决策树 . 混合架构 . 计算预算 Pareto 前沿 文件:
20_采样式MPC/100_MPPI与梯度式对比.md
MPPI_10 | Mini-MPPI 综合实战 | ⭐⭐⭐⭐⭐ | 2 周 🏭
核心主题: 完整 CUDA MPPI 控制器 . 至少两任务验证 . K/T 扫参 . ROS2 节点封装 文件:
20_采样式MPC/110_Mini-MPPI实战.md
MPPI 附录: 20_采样式MPC/120_附录.md
MPPI 线里程碑检验: 1. 理论能力: 能推导路径积分 -> MPPI 权重公式全链 2. 工程能力: CUDA CartPole MPPI K=4096 >1kHz 3. 部署能力: ROS2 封装可运行 MPPI 控制器
Part-Multi: 多机器人协作 (Ch1-13 + 附录, ~21.5 周)¶
线路定位: 从单体规控扩展到多机协作规控 里程碑: 完成本线后,学习者**能设计分布式 MPC + MARL 混合多机系统** 文件目录:
50_多机器人协作/文件清单: 16 个 .md 文件
Part 1: 多机基础 (Ch1-Ch3, 4 周)¶
Multi_01 | 多机系统全景 | ⭐⭐ | 1 周
核心主题: 三维分类(架构 x 交互 x 信息) . 通信拓扑(Laplacian, 代数连通性 lambda_2) . 架构决策树 文件:
50_多机器人协作/20_多机系统全景.md
Multi_02 | 共识算法与分布式优化 | ⭐⭐⭐ | 1.5 周
核心主题: 线性共识协议 . 切换拓扑 . ADMM 分布式优化 . ADMM 用于多机 MPC 解耦 关键论文: Olfati-Saber 2004, Boyd 2011 ADMM 文件:
50_多机器人协作/30_共识算法与分布式优化.md
Multi_03 | 任务分配与路径规划 (MAPF) | ⭐⭐⭐ | 1.5 周
核心主题: CBBA 分布式拍卖 . CBS 两层搜索 . LaCAM 加速 . 仓库 MAPF vs 编队 关键论文: Choi 2009 CBBA, Sharon 2015 CBS 文件:
50_多机器人协作/40_任务分配与路径规划.md
Part 2: 协同运动控制 (Ch4-Ch6, 4 周)¶
Multi_04 | 分布式 MPC 多足编队 | ⭐⭐⭐⭐ | 2 周 🏭🔬
核心主题: 集中 vs 分布式 MPC . ADMM 解耦 . 编队约束 . 双 Go2 编队 关键论文: Kim 2023 (T-RO) 双四足, Keviczky 2008 分布式 MPC 文件:
50_多机器人协作/50_分布式MPC多足编队.md
Multi_05 | 协同搬运与力控 | ⭐⭐⭐⭐ | 2 周
核心主题: Grasp Matrix . 内力子空间 . 阻抗协调 . 负载估计与自适应 文件:
50_多机器人协作/60_协同搬运与力控.md
Multi_06 | 异构多机协同 | ⭐⭐⭐ | 1 周
核心主题: 地空联合(四足+无人机) . 异构通信 . 联合状态估计 文件:
50_多机器人协作/70_异构多机协同.md
Part 3: 协同操作 (Ch7-Ch9, 5 周)¶
Multi_07 | 双臂与多臂协同操作 | ⭐⭐⭐⭐ | 2 周
核心主题: 闭链运动学 . 力分配 . 双臂 impedance 协调 文件:
50_多机器人协作/80_双臂多臂协同操作.md
Multi_08 | 多足协同 Loco-Manipulation | ⭐⭐⭐⭐ | 1.5 周 🏭🔬
核心主题: 协同步态同步 . 负载动态分配 . 协同 WBC 关键论文: De Vincenti/Coros 2024 (ETH CRL) 文件:
50_多机器人协作/90_多足协同Loco-Manipulation.md
Multi_09 | 人形/四足+臂协同控制 | ⭐⭐⭐⭐ | 1.5 周
核心主题: 层次化全身协同 . 异构团队 . MASH(2025) 异构 MARL 文件:
50_多机器人协作/100_人形四足臂协同控制.md
Part 4: MARL 多智能体强化学习 (Ch10-Ch12, 5.5 周)¶
Multi_10 | MARL 基础 | ⭐⭐⭐ | 2 周
核心主题: CTDE 范式 . MADDPG . VDN/QMIX . MAPPO . HAPPO/HATRPO . HARL 库 关键论文: Lowe 2017 MADDPG, Rashid 2018 QMIX, Yu 2022 MAPPO 文件:
50_多机器人协作/110_MARL基础.md
Multi_11 | MARL 多机运动协调 | ⭐⭐⭐⭐ | 1.5 周
核心主题: 编队 MARL . 通信学习(CommNet/TarMAC) . 涌现协调 . sim-to-real 文件:
50_多机器人协作/120_MARL多机运动协调.md
Multi_12 | MARL + 传统规控混合 | ⭐⭐⭐⭐ | 2 周 🔬
核心主题: RL 高层 + MPC 底层 . Safe MARL(GCBF+) . 约束 MARL . 残差策略 . MASH 关键论文: MIT REALM GCBF+, PKU HARL 文件:
50_多机器人协作/130_MARL与传统规控混合.md
Part 5: 综合实战 (Ch13, 2 周)¶
Multi_13 | Mini-MultiBot 综合实战 | ⭐⭐⭐⭐⭐ | 2 周 🏭
核心主题: 端到端多机系统 . 分布式 MPC + MARL 双范式 . 系统级评估 文件:
50_多机器人协作/140_Mini-MultiBot综合实战.md
Multi 附录: 50_多机器人协作/150_附录.md
Multi 线里程碑检验: 1. 协调能力: 双 Go2 ADMM 编队行走 2. 学习能力: MAPPO 多机协作导航训练 3. 验收标准: Mini-MultiBot 双任务系统级交付
Part-TAMP: 任务与运动规划 (1 章, ~4 周)¶
线路定位: 符号 AI(任务规划)与几何 AI(运动规划)的交叉 文件目录:
60_任务运动规划/文件清单: 1 个 .md 文件 (3177 行,内部渐进)
TAMP_T1 | 任务与运动规划基础 | ⭐ ~ ⭐⭐⭐⭐ | 4 周 | 3177 行
前置: A* 搜索、一阶逻辑、RRT/PRM 核心参考: Garrett et al. (2021) Annual Review 内部结构 (9 大节): 1. 为什么需要 TAMP -- 符号 vs 几何 gap 2. 经典任务规划 -- STRIPS -> PDDL -> FF; ADL 扩展 3. 采样运动规划回顾 -- C-space -> RRT/PRM 4. TAMP 核心范式 -- skeleton search + PDDLStream 5. LGP 逻辑-几何规划 -- Toussaint KOMO 联合优化 6. Learning-based TAMP -- GNN/LLM/扩散引导搜索 7. 工程实践 -- PDDLStream + MoveIt2 8. 前沿方向 -- SayCan / Code-as-Policies / VoxPoser 9. 综合练习 -- 桌面整理全流程 文件:
60_任务运动规划/10_任务与运动规划基础.md
Part-D: 无人机 (D0-D12 + 附录, ~22 周)¶
线路定位: 完整的无人机规控应用实例,从仿真到实飞 文件目录:
70_无人机/文件清单: 14 章 + 6 篇附录 核心技术栈: Eigen / GCOPTER / Fast-Planner / PX4 / acados / IsaacLab 核心实验室: ZJU FAST Lab / HKUST Aerial / UZH RPG / HKU MaRS / MIT ACL
三大认知跨越 (从 SLAM 到无人机规控)¶
跨越一: 从"估计过去"到"规划未来"。 SLAM 是后验推断; 规控是前瞻规划。数学从最小二乘转向约束优化(QP/NLP/L-BFGS)。
跨越二: 从"软实时 10Hz"到"硬实时 1ms"。 SLAM 丢一帧精度下降; 控制丢一帧姿态失稳。热路径零堆分配/零异常/零阻塞。
跨越三: 从"传感器前端"到"执行器后端"。 SLAM 擅长点云/图像/IMU; 规控要求理解电机/ESC/电池/桨涡。
SLAM 技能迁移速查¶
| SLAM 技能 | 无人机规控对应 | 迁移难度 |
|---|---|---|
| Eigen 矩阵运算 | MINCO 带状矩阵, Jacobian 组装 | 零 |
| Sophus SE(3)/manif | Lee 几何控制 SO(3) 误差 | 低 |
| GTSAM 因子图 | MPC KKT 块三对角 (数学同构) | 低 |
| PCL 点云 | ikd-Tree/voxblox/ROG-Map | 零 |
| FAST-LIO2 | 无人机感知管线默认后端 | 零 |
| FCL 碰撞检测 | 不用 FCL -- 用 ESDF/凸包/走廊 | 高 |
| OMPL 采样规划 | 不用 OMPL -- 用 kinodynamic A*+轨迹优化 | 高 |
章间依赖 DAG¶
D0(仿真) ──→ D1(微分平坦/SE(3)) ──→ D2(MPC) ──→ D8(敏捷飞行)
| | |
v v v
D3(Min-Snap) ──→ D4(B样条) ──→ D5(MINCO) ──→ D9(RL)
| |
v v
D6(环境表示) → D7(探索) → D10(集群) → D11(前沿)
|
v
D12(综合实战)
Part 0: 仿真环境 (1 周)¶
D0 无人机仿真环境与资产管道 ⭐⭐ (1 周)
前置: v8 Ch36(CUDA), Ch31(ROS2), P02(sim-to-real) 核心主题: 四代仿真器演进 . CTBR/SRT/RPM 控制接口 . Agilicious 安全架构 . IsaacLab/OmniDrones PPO 管线 关键项目: gym-pybullet-drones, Aerial Gym, OmniDrones, Flightmare, FiGS 文件:
70_无人机/140_无人机仿真环境.md
Part 1: 动力学与控制 (4 周)¶
D1 微分平坦与 SE(3) 几何控制 ⭐⭐⭐ (2 周)
前置: Eigen(Ch11), SO(3)/SE(3)(Ch23) 核心主题: 微分平坦性 sigma=(x,y,z,psi) . 平坦映射全链 . Lee-Leok-McClamroch SE(3) 控制 . Bhat-Bernstein 拓扑障碍 . PX4 级联 PID vs 几何控制 关键论文: Lee 2010 (CDC, ~3800 引), Mellinger 2011 (ICRA Best Paper, ~4500 引) 文件:
70_无人机/20_微分平坦与几何控制.md
D2 MPC 与自适应控制 ⭐⭐⭐ (2 周) 🏭🔬
前置: D1, 非线性优化(Ch17-18) 核心主题: 四旋翼 MPC 标准问题结构 . SQP-RTI . acados+HPIPM . L1 自适应叠加 . GP-MPC . Neural-MPC . IPC 统一规控 关键论文: Hanover 2022 L1-NMPC, Torrente 2021 GP-MPC, O'Connell 2022 Neural-Fly 文件:
70_无人机/30_MPC与自适应控制.md
Part 2: 轨迹生成与优化 (5 周)¶
D3 多项式轨迹生成 ⭐⭐⭐ (1 周)
核心主题: Min-Snap QP . Richter 端点导数参数化 . Bernstein 基凸包 . mav_trajectory_generation 关键论文: Mellinger 2011, Richter 2016 (IJRR) 文件:
70_无人机/40_多项式轨迹生成.md
D4 B 样条轨迹优化 ⭐⭐⭐ (1.5 周)
核心主题: 均匀 B 样条五大性质 . Fast-Planner/EGO-Planner 管线 . LBFGS-Lite 关键论文: Zhou 2019 Fast-Planner, Zhou 2021 EGO-Planner 文件:
70_无人机/50_B样条轨迹优化.md
D5 MINCO 轨迹表示与安全走廊 ⭐⭐⭐ (2 周) 🏭🔬
核心主题: MINCO 数学本质 . GCOPTER header-only . SFC 三代演进 . SUPER 双轨迹 . ROG-Map 关键论文: Wang 2022 GCOPTER/MINCO (TRO), Ren 2025 SUPER (Science Robotics) 文件:
70_无人机/60_MINCO轨迹表示与安全走廊.md
Part 3: 环境感知与探索 (4 周)¶
D6 环境表示 ⭐⭐ (2 周)
核心主题: 六种表示(八叉树/体素哈希/环形缓冲/栅格/kd树/高斯椭球) . ESDF 梯度 . 3DGS 碰撞原语 . nvblox GPU 177x 关键项目: voxblox, ikd-Tree, nvblox, ROG-Map, OctoMap 文件:
70_无人机/70_无人机环境表示.md
D7 感知引导规划与自主探索 ⭐⭐⭐ (2 周)
核心主题: 探索三代(NBV -> TSP/ATSP -> 覆盖引导) . FUEL/TARE/RACER/FALCON . yaw 一等决策变量 关键论文: Zhou 2021 FUEL, Cao 2021 TARE (RSS Best Paper), Zhou 2023 RACER (TRO Best Paper) 文件:
70_无人机/80_感知引导规划与自主探索.md
Part 4: 敏捷飞行与 RL (4 周)¶
D8 敏捷飞行平台与集成规控 ⭐⭐⭐ (2 周) 🏭
核心主题: Agilicious 全栈 . CPC/IPC/MPCC/DFBC 四范式 . Actor-Critic MPC 关键论文: Foehn 2021 CPC (Science Robotics), Romero 2025 Actor-Critic MPC 文件:
70_无人机/90_敏捷飞行平台与集成规控.md
D9 RL 敏捷飞行与 sim-to-real ⭐⭐⭐ (2 周) 🔬
核心主题: Swift 完整管线 . SimpleFlight 五因子 . RLtools C++17 头文件 RL . RAPTOR 2084 参数跨形态 关键论文: Kaufmann 2023 Swift (Nature), Song 2023 RL 超越 MPC (Science Robotics) 文件:
70_无人机/100_RL敏捷飞行与sim-to-real.md
Part 5: 集群与前沿 (3 周)¶
D10 集群协同规划 ⭐⭐ (1.5 周)
核心主题: ZJU 路线(软惩罚: EGO-Swarm) vs MIT 路线(硬约束: MADER/RMADER) . Primitive-Swarm 1000 机 . 多机任务分配 关键论文: Zhou 2021 EGO-Swarm, Tordesillas 2022 MADER, Hou 2025 1000 机 文件:
70_无人机/110_集群协同规划.md
D11 前沿方向 ⭐⭐ (1.5 周) 🔬
核心主题: 五大前沿 -- (A) VLM/LLM 任务层 . (B) 3DGS 规划 . (C) 非标构型 . (D) 安全与形式验证 . (E) 端到端视觉 RL 关键论文: DroneSplat CVPR 2025, DroneVLA 2025, Dream to Fly ICRA 2026 文件:
70_无人机/120_前沿方向.md
Part 6: 综合实战 (2 周)¶
D12 Mini-Drone 综合实战 ⭐⭐⭐ (2 周) 🏭
核心主题: 端到端系统集成 . 三级验收: Bronze(悬停)/Silver(单房间 >70%)/Gold(多房间 >85%+返航) 文件:
70_无人机/130_综合实战.md
附录 (6 篇)¶
| 附录 | 覆盖 | 文件 |
|---|---|---|
| 附录 A: 轨迹生成深度叙述 | D3-D5 十年演进 | 附录A_轨迹生成深度叙述.md |
| 附录 B: 感知规划一体深度叙述 | D6-D7 演进 | 附录B_感知规划一体深度叙述.md |
| 附录 C: MPC 与几何控制深度叙述 | D1-D2 演进 | 附录C_MPC与几何控制深度叙述.md |
| 附录 D: RL 敏捷飞行深度叙述 | D8-D9 演进 | 附录D_RL敏捷飞行深度叙述.md |
| 附录: 教学大纲配套 | 周次/依赖/速成 | 附录_教学大纲配套.md |
| 附录: 项目全景调研 | 85+ 项目 | 附录_项目全景调研.md |
无人机里程碑验收汇总¶
| Part | 周次 | 核心验收标准 |
|---|---|---|
| Part 0 | W49 | gym-pybullet-drones 悬停 + OmniDrones PPO 训练 |
| Part 1 | W50-53 | 手推平坦映射全链; SE(3) 仿真跟踪; acados MPC 100Hz |
| Part 2 | W54-58 | Min-Snap QP 推导; GCOPTER 走廊修改 |
| Part 3 | W59-62 | 环境表示选型; FUEL/TARE 代码追踪 |
| Part 4 | W63-66 | 四种敏捷范式; CTBR 门穿越训练 |
| Part 5 | W67-69 | ZJU vs MIT 路线权衡; 五大前沿雷达 |
| Part 6 | W70-71 | 端到端系统; Bronze/Silver/Gold 交付 |
Part-S: 综述 (~3 周)¶
线路定位: 贯穿连接线,将横切方法论与应用实例缝合为统一知识体系 文件目录:
80_综述/文件清单: 5 个 .md 文件
S1 | 总览与时空联合规划 (0.5 周)
覆盖: T 线全貌 + D3-D5 轨迹优化连接 定位: 从时空规划发展脉络理解方法演进逻辑 文件:
80_综述/10_总览与时空联合规划.md
S2 | 不确定性规划 (0.5 周)
覆盖: U 线 + 五条子路线(鲁棒/机会/POMDP/CVaR/分布鲁棒) 定位: 五种不确定性处理范式的 C++ 教学可操作性评估 文件:
80_综述/20_不确定性规划.md
S3 | 博弈规划 (0.5 周)
覆盖: G 线 + HJI/iLQGames/逆博弈 定位: C++ 抓手仅 ilqgames + hj_reachability,ALGAMES 等已迁 Julia 文件:
80_综述/30_博弈规划.md
S4 | 交互意图预测 (0.5 周)
覆盖: G3 逆博弈 + 自动驾驶行为预测 定位: 预测-规划一体化的 C++ 锚点(Apollo prediction) 文件:
80_综述/40_交互意图预测.md
S5 | RL 与经典规控贯穿关系 (1 周)
覆盖: 全线贯穿视角 -- POMDP/Safe RL/MCTS/MARL/Diffusion/TD-MPC/VLA 核心判断: 2023-2026 "规划层 RL + 经典融合"成熟方向 = Diffusion Planner + TD-MPC2 + 可微 MPC + VLA 定位: 教学收官视角,将四个经典范式映射到四类 RL 连接 文件:
80_综述/50_RL与经典规控贯穿关系与结论.md
交叉引用地图¶
04_移动机器人规控 内部交叉¶
三线交叉节点速查表 (T/U/G)¶
| 交叉点 | T 线章节 | U 线章节 | G 线章节 | 说明 |
|---|---|---|---|---|
| 安全约束优化 | T3(OBCA) | U2(CBF/Tube MPC) | G4(安全证书) | 约束形式化互通 |
| 多智能体协调 | T5(CBS/ORCA) | U4(多机 POMDP) | G2-G4(博弈) | 协作到竞争的完整谱系 |
| 学习型方法 | T6(扩散规划) | U5(Distributional RL) | G4(MARL) | 数据驱动+模型融合 |
| 工业部署 | T4(Apollo) | U1(MPDM) | G3(行为预测) | 自动驾驶全栈 |
MPPI/Multi/TAMP 三线交叉¶
| 上游 | 下游 | 依赖内容 |
|---|---|---|
| MPPI_01-02 | Multi_04 | 分布式 MPC 可选 MPPI 作为 local solver |
| MPPI_07 | Multi_08 | 腿足全身 MPPI -> 多足协同 loco-manipulation |
| Multi_10-12 | MPPI_06 | TD-MPC 的 MARL 对比视角 |
| Multi_04-05 | TAMP_T1 | 多机协同搬运 -> TAMP 长时域需求 |
| MPPI_05 | TAMP_T1 | Learning-based TAMP 中扩散采样 |
横切方法论与无人机应用交叉¶
| 横切方法 | 无人机章节 | 交叉内容 |
|---|---|---|
| T: 时空联合规划 | D3-D5 轨迹优化 | 走廊生成、MINCO 时间参数化 |
| U: 不确定性规划 | D7 感知引导 | 感知不确定性 -> 鲁棒重规划 |
| G: 博弈规划 | D10 集群对抗 | 非合作多机 -> 博弈论框架 |
| MPPI: 采样 MPC | D2 MPC 基础 | 梯度式 vs 采样式互补 |
| Multi: 多机协作 | D10 集群协同 | EGO-Swarm/MADER 分布式规划 |
| TAMP: 任务运动 | D11 前沿(VLM) | VLM 任务层 -> 连续控制 |
04_移动机器人规控 与其他方向交叉¶
与 03_SLAM¶
| 04 规控章节 | 03 SLAM 章节 | 交叉内容 |
|---|---|---|
| D6 环境表示 | 占据栅格/ESDF/体素 | SLAM 建图输出即规划输入 |
| D7 感知引导 | 视觉 SLAM 前端 | 主动感知: 规划驱动相机视角 |
| U0-U2 不确定性 | EKF/UKF 滤波 | 定位不确定性传播到规划层 |
| D11 前沿 | NeRF/3DGS | 隐式表示同时服务 SLAM 与规划 |
典型闭环流程:
SLAM定位+建图 → 生成ESDF/走廊 → 轨迹优化(D3-D5/T专题) → 控制执行(D2/MPPI)
^ |
└──────────────── 里程计反馈 ←──────────────────────────────────┘
与 05_运动控制¶
| 04 规控方法 | 05 运动控制应用 | 说明 |
|---|---|---|
| MPPI (采样 MPC) | 足式实时步态规划 | 采样并行化适合高频控制 |
| MPC (D2/MPPI) | 全身运动控制 WBC | MPC+WBC 是足式主流架构 |
| Multi (多机协作) | 多足协调、双臂协调 | 分布式优化通用 |
| TAMP (任务运动) | 具身智能任务规划层 | 符号到连续接口 |
| G (博弈规划) | 人机交互意图推理 | 逆博弈推断人类意图 |
与 06_具身智能¶
| 04 规控方法 | 06 具身智能应用 | 说明 |
|---|---|---|
| TAMP (任务运动) | SayCan/VoxPoser | Foundation Model + TAMP |
| T6 扩散规划 | Diffusion Policy | 条件生成式操作 |
| MPPI_06 TD-MPC | VLA 中的规划模块 | 世界模型 + MPPI latent 规划 |
| D11 VLM 无人机 | DroneVLA | VLA -> 无人机操纵 |
学习路径建议¶
按目标角色的推荐顺序¶
路径 A -- 自动驾驶方向: T0 -> T1 -> T2 -> T3 -> T4 -> U0 -> U1 -> U2 -> G0 -> G2 -> G3 -> S1 -> S4
路径 B -- 无人机全栈方向: D0 -> D1 -> D2 -> D3 -> D4 -> D5 -> D6 -> D7 -> D8 -> D9 -> D12 -> MPPI_01 -> MPPI_02
路径 C -- 多机器人方向: Multi_01 -> Multi_02 -> Multi_03 -> Multi_04 -> Multi_10 -> Multi_12 -> Multi_13 -> D10 -> G4
路径 D -- 理论研究方向: T0 -> T1 -> T3 -> U0 -> U2 -> U3 -> U4 -> U5 -> G0 -> G1 -> G3 -> MPPI_01 -> MPPI_05 -> S5
路径 E -- MPPI 专精方向 (8 周): MPPI_01 -> MPPI_02 -> MPPI_03 -> MPPI_05 -> MPPI_07 -> MPPI_10
并行推进建议¶
三大横切线(T/U/G)可并行推进,但建议 T 线先行至 T3 后再启动 U/G 线,以建立足够的优化基础。MPPI 线与 Multi 线相对独立,可任意顺序。TAMP 建议在至少完成一条横切线后学习。综述(S 线)建议在对应横切线完成后阅读,作为复习与贯穿。
文件索引¶
10_时空规划 (8 文件)¶
| 编号 | 文件名 | 对应章节 | 周 |
|---|---|---|---|
| 10 | 10_时空联合规划总论.md |
T0 | 1 |
| 20 | 20_Frenet坐标系与ST图.md |
T1 | 2 |
| 30 | 30_时空走廊与搜索.md |
T2 | 2 |
| 40 | 40_时空轨迹优化.md |
T3 | 3 |
| 50 | 50_Apollo_Autoware框架.md |
T4 | 3 |
| 60 | 60_多智能体时空协调.md |
T5 | 3 |
| 70 | 70_端到端与扩散式规划.md |
T6 | 1.5 |
| 80 | 80_综合对比与附录.md |
T 附录 | 0.5 |
20_采样式MPC (12 文件)¶
| 编号 | 文件名 | 对应章节 | 周 |
|---|---|---|---|
| 10 | 10_采样式MPC总论.md |
MPPI_00 | - |
| 20 | 20_路径积分控制理论.md |
MPPI_01 | 2 |
| 30 | 30_MPPI核心算法与GPU.md |
MPPI_02 | 2 |
| 40 | 40_MPPI六大变体.md |
MPPI_03 | 2 |
| 50 | 50_CEM家族与统一视角.md |
MPPI_04 | 1.5 |
| 60 | 60_扩散启发采样MPC.md |
MPPI_05 | 2 |
| 70 | 70_学习世界模型TD-MPC.md |
MPPI_06 | 2 |
| 80 | 80_腿足全身MPPI.md |
MPPI_07 | 2 |
| 90 | 90_导航自驾无人机采样.md |
MPPI_08 | 1.5 |
| 100 | 100_MPPI与梯度式对比.md |
MPPI_09 | 1 |
| 110 | 110_Mini-MPPI实战.md |
MPPI_10 | 2 |
| 120 | 120_附录.md |
MPPI 附录 | - |
30_不确定性规划 (7 文件)¶
| 编号 | 文件名 | 对应章节 | 周 |
|---|---|---|---|
| 10 | 10_不确定性规划总论.md |
U0 | 1 |
| 20 | 20_分支场景规划.md |
U1 | 2 |
| 30 | 30_鲁棒规划与安全滤波.md |
U2 | 2.5 |
| 40 | 40_机会约束规划.md |
U3 | 2 |
| 50 | 50_POMDP与Belief规划.md |
U4 | 2.5 |
| 60 | 60_风险敏感规划CVaR.md |
U5 | 1.5 |
| 70 | 70_综合对比与附录.md |
U 附录 | 0.5 |
40_博弈规划 (6 文件)¶
| 编号 | 文件名 | 对应章节 | 周 |
|---|---|---|---|
| 10 | 10_博弈规划总论.md |
G0 | 1 |
| 20 | 20_微分博弈与HJI.md |
G1 | 2 |
| 30 | 30_实时博弈求解器.md |
G2 | 2.5 |
| 40 | 40_逆博弈与预测规划.md |
G3 | 2 |
| 50 | 50_安全证书与MARL.md |
G4 | 2 |
| 60 | 60_综合对比与附录.md |
G 附录 | 0.5 |
50_多机器人协作 (16 文件)¶
| 编号 | 文件名 | 对应章节 | 周 |
|---|---|---|---|
| 10 | 10_多机器人协作总论.md |
Multi_00 | - |
| 20 | 20_多机系统全景.md |
Multi_01 | 1 |
| 30 | 30_共识算法与分布式优化.md |
Multi_02 | 1.5 |
| 40 | 40_任务分配与路径规划.md |
Multi_03 | 1.5 |
| 50 | 50_分布式MPC多足编队.md |
Multi_04 | 2 |
| 60 | 60_协同搬运与力控.md |
Multi_05 | 2 |
| 70 | 70_异构多机协同.md |
Multi_06 | 1 |
| 80 | 80_双臂多臂协同操作.md |
Multi_07 | 2 |
| 90 | 90_多足协同Loco-Manipulation.md |
Multi_08 | 1.5 |
| 100 | 100_人形四足臂协同控制.md |
Multi_09 | 1.5 |
| 110 | 110_MARL基础.md |
Multi_10 | 2 |
| 120 | 120_MARL多机运动协调.md |
Multi_11 | 1.5 |
| 130 | 130_MARL与传统规控混合.md |
Multi_12 | 2 |
| 140 | 140_Mini-MultiBot综合实战.md |
Multi_13 | 2 |
| 150 | 150_附录.md |
Multi 附录 | - |
60_任务运动规划 (1 文件)¶
| 编号 | 文件名 | 对应章节 | 周 |
|---|---|---|---|
| 10 | 10_任务与运动规划基础.md |
TAMP_T1 | 4 |
70_无人机 (14 章 + 6 附录)¶
| 编号 | 文件名 | 对应章节 | 周 |
|---|---|---|---|
| 10 | 10_导读与路线图.md |
导读 | - |
| 20 | 20_微分平坦与几何控制.md |
D1 | 2 |
| 30 | 30_MPC与自适应控制.md |
D2 | 2 |
| 40 | 40_多项式轨迹生成.md |
D3 | 1 |
| 50 | 50_B样条轨迹优化.md |
D4 | 1.5 |
| 60 | 60_MINCO轨迹表示与安全走廊.md |
D5 | 2 |
| 70 | 70_无人机环境表示.md |
D6 | 2 |
| 80 | 80_感知引导规划与自主探索.md |
D7 | 2 |
| 90 | 90_敏捷飞行平台与集成规控.md |
D8 | 2 |
| 100 | 100_RL敏捷飞行与sim-to-real.md |
D9 | 2 |
| 110 | 110_集群协同规划.md |
D10 | 1.5 |
| 120 | 120_前沿方向.md |
D11 | 1.5 |
| 130 | 130_综合实战.md |
D12 | 2 |
| 140 | 140_无人机仿真环境.md |
D0 | 1 |
| -- | 附录A_轨迹生成深度叙述.md |
附录 | - |
| -- | 附录B_感知规划一体深度叙述.md |
附录 | - |
| -- | 附录C_MPC与几何控制深度叙述.md |
附录 | - |
| -- | 附录D_RL敏捷飞行深度叙述.md |
附录 | - |
| -- | 附录_教学大纲配套.md |
附录 | - |
| -- | 附录_项目全景调研.md |
附录 | - |
80_综述 (5 文件)¶
| 编号 | 文件名 | 对应章节 | 周 |
|---|---|---|---|
| 10 | 10_总览与时空联合规划.md |
S1 | 0.5 |
| 20 | 20_不确定性规划.md |
S2 | 0.5 |
| 30 | 30_博弈规划.md |
S3 | 0.5 |
| 40 | 40_交互意图预测.md |
S4 | 0.5 |
| 50 | 50_RL与经典规控贯穿关系与结论.md |
S5 | 1 |
统计总览¶
八大 Part 统计¶
| Part | 章节数 | 周数 | 理论密度峰 | 工程密度峰 | 前沿研究峰 |
|---|---|---|---|---|---|
| T: 时空规划 | 8 | 16 | T3(轨迹优化) | T4(Apollo) | T6(扩散) |
| MPPI: 采样MPC | 12 | 18 | MPPI_01(路径积分) | MPPI_10(实战) | MPPI_05(扩散) |
| U: 不确定性 | 8 | 12 | U4(POMDP) | U2(Tube/CBF) | U5(CVaR) |
| G: 博弈 | 7 | 10 | G1(HJI) | G2(iLQGames) | G3(逆博弈) |
| Multi: 多机 | 16 | 21.5 | Multi_02(共识) | Multi_04(分布MPC) | Multi_12(混合) |
| TAMP | 1 | 4 | 全渐进 | PDDLStream | LGP/VLM |
| D: 无人机 | 14+6附录 | 22 | D5(MINCO) | D8(Agilicious) | D9(Swift) |
| S: 综述 | 5 | 3 | S5(RL贯穿) | -- | S5(Diffusion) |
关键求解器与工具链¶
| 专题 | 核心求解器 | 主要仿真平台 |
|---|---|---|
| T: 时空 | OSQP/IPOPT/CasADi | Apollo Dreamview, CARLA |
| MPPI: 采样 | MPPI-Generic (CUDA) | MuJoCo, IsaacLab |
| U: 不确定 | MOSEK/CVXPY/GPML | Gazebo, Isaac Gym |
| G: 博弈 | iLQGames/hj_reachability | CARLA, Highway-env |
| Multi: 多机 | MARLlib/HARL/OCS2 | IsaacLab, MuJoCo |
| TAMP | PDDLStream/rai | MuJoCo, MoveIt2 |
| D: 无人机 | acados/GCOPTER/PX4 | Gazebo, OmniDrones |
跨线能力矩阵¶
完成多线学习后,学习者应具备以下复合能力:
| 复合能力 | 涉及章节 | 说明 |
|---|---|---|
| 安全自动驾驶全栈 | T4 + U2 + G2 | Apollo 架构 + CBF + 博弈交互 |
| 多机器人安全协调 | T5 + U2 + G4 | MAPF + 鲁棒约束 + 竞合博弈 |
| 不确定交互决策 | T1 + U1 + G3 | 场景表示 + 分支决策 + 意图推断 |
| 学习型规划前沿 | T6 + U5 + G4 + MPPI_05 | 扩散 + CVaR + MARL + 采样 |
| 无人机全栈端到端 | D0-D12 + MPPI_08 | 仿真到实飞 + 采样 MPC |
| 多机无人机集群 | D10 + Multi_04-06 + T5 | 集群协同 + 分布 MPC + MAPF |
前沿补充 (截至 2026-05-14)¶
以下为最近重要进展,与本大纲多个章节直接相关。
感知与表示前沿¶
| 工作 | 会议/年份 | 核心贡献 | 对应章节 |
|---|---|---|---|
| DroneSplat | CVPR 2025 | 无人机图像 3DGS 重建+规划 | D6, D11 |
| Splat-Nav | TRO 2025 | 3DGS 椭球碰撞取代 ESDF | D6 |
| nvblox GPU | NVIDIA 2025 | GPU 加速 TSDF/ESDF 177x | D6 |
基于大模型的无人机智能¶
| 工作 | 年份 | 核心贡献 | 对应章节 |
|---|---|---|---|
| DroneVLA | 2025 | VLA 直接输出无人机控制 | D11 |
| CognitiveDrone | 2025 | VLM 认知导航 | D11 |
| AeroAgent | 2025 | LLM 任务规划器 | D11, TAMP |
规划方法论前沿¶
| 工作 | 会议/年份 | 核心贡献 | 对应章节 |
|---|---|---|---|
| Diffusion-Planner | ICLR 2025 | 扩散自动驾驶联合规划 | T6, MPPI_05 |
| DIAL-MPC | ICRA 2025 | 扩散退火全身力矩 MPPI | MPPI_05, MPPI_07 |
| Stein Variational MPC | 2025 | SVGD 多模态轨迹 | MPPI_05 |
| Dream to Fly | ICRA 2026 | DreamerV3 纯想象敏捷飞行 | D9 |
多智能体前沿¶
| 工作 | 年份 | 核心贡献 | 对应章节 |
|---|---|---|---|
| MASH | 2025 | 异构人形 MARL | Multi_12, 05_运动控制 |
| GCBF+ | 2025 | 分布式 CBF 安全 MARL | Multi_12, U2 |
| MIGHTY | 2025 | 百级异构集群规划 | D10, T5 |
与机械臂方向对照¶
| 维度 | 移动机器人规控 (本大纲) | 机械臂 (v1.2) |
|---|---|---|
| 章数 | 76 章 (横切 52 + 无人机 20 + 综述 5) | 37 章 (P/M/F/D) |
| 周数 | ~106.5 周 | ~76 周 |
| C++ 风格 | header-only, 编译期固定维度, C++11/14 | pluginlib 运行时多态, C++17/20 |
| 核心数学 | 微分平坦, MINCO, L-BFGS, 博弈均衡 | 空间向量代数, RNEA/ABA, QP/NLP |
| 规划范式 | 工作空间连续轨迹优化(平坦+走廊) | 配置空间采样(OMPL)+轨迹优化 |
| 控制范式 | SE(3) 几何 / NMPC / RL CTBR | ros2_control + JTC |
| 实时约束 | 1-10ms 重规划 + 200-500Hz 控制 | 1kHz 伺服(PREEMPT_RT) |
| RL 成熟度 | 极高(Swift/Nature 2023) | 中(RL->ros2_control 刚起步) |
| SLAM 重叠 | 极高(VIO/LiDAR 是感知核心) | 中(共享 Eigen/ROS2) |
| 代表项目 | GCOPTER, Fast-Planner, Agilicious | Pinocchio, MoveIt2, BT.CPP |
版本历史¶
| 版本 | 日期 | 变更 |
|---|---|---|
| v1.0 | 2026-05-04 | 初版:统一 75 个章节文件为总大纲,含横切 6 条线+无人机 13 章 |
| v2.0 | 2026-05-14 | 重写:增加角色快速路径(自驾/无人机/多机)、计算与硬件需求表、工业 vs 研究标记系统化、方法-应用双导航路线图、前置知识依赖矩阵细化、生态速览扩展(MPPI/扩散/MARL/PX4/自驾)、Per-Part 全 8 子方向详细大纲、综述层(Part-S)独立列出、交叉引用地图(内部+跨方向+跨模块)、统计总览与能力矩阵、前沿补充(2026-05-14)、文件索引完整化 |