跳转至

本文档属于 Robotics Tutorial 项目,作者:Pengfei Guo,达妙科技。采用 CC BY 4.0 协议,转载请注明出处。

移动机器人规控方向综合教学大纲

版本: v2.0 | 日期: 2026-05-14

定位: 面向完成 SLAM 主线 v8(Ch1-46, 48周)的工程师,系统掌握移动机器人规划控制的**方法论工具箱**与**应用实例**。

数据基础: 76 个章节文件, 约 17,000 行教学内容; 横切 6 大方法论专题(10-60)+ 无人机 16 章应用实例(70)+ 5 篇综述(80),基于 100+ 开源项目源码级分析与 200+ 篇顶会/顶刊论文脉络。课程主线按 2026-05 前后版本锁定 acados v0.4+ / PX4 v1.15+ / ROS 2 Kilted,具体 API 与版本特性以各项目当前官方文档和 release notes 为准。

总投入: 横切专题 6 条线 ~81.5 周(T16 + U12 + G10 + MPPI18 + Multi21.5 + TAMP4)+ 无人机 16 章 ~22 周 + 综述 5 篇 ~3 周 = 合计 ~106.5 周;可按专题独立选修。

架构思想: 横切专题(10-60)= 通用方法论工具箱,无人机(70)= 完整应用实例,综述(80)= 贯穿连接线。学方法时跳入无人机看实际效果;学无人机应用时回溯横切专题理解底层原理。

本大纲不覆盖的内容

  • 底层电机/传感器驱动 -- 见 05_运动控制/ M11-M12
  • SLAM/感知 -- 见 03_SLAM/
  • 机械臂/足式/人形控制 -- 见 05_运动控制/ 各子方向
  • 具身智能/VLA -- 见 06_具身智能/
  • 数学基础(优化/李群) -- 见 01_数学/

目录

  1. 角色快速路径
  2. 计算与硬件需求表
  3. 工业 vs 研究标记
  4. 总览路线图(方法-应用双导航)
  5. 前置知识依赖矩阵
  6. 生态速览 (2026-05)
  7. Part-T: 时空联合规划
  8. Part-U: 不确定性规划
  9. Part-G: 博弈规划
  10. Part-MPPI: 采样式 MPC
  11. Part-Multi: 多机器人协作
  12. Part-TAMP: 任务与运动规划
  13. Part-D: 无人机
  14. Part-S: 综述
  15. 交叉引用地图
  16. 学习路径建议
  17. 文件索引
  18. 版本历史

角色快速路径

本大纲体量庞大(~106.5 周),但并非所有章节都需线性通关。以下三条角色路径各聚焦一项核心职业能力,适合希望在 2-4 个月内建立可运行系统的工程师。完成快速路径后,再按兴趣回填横切专题。

路径一:自动驾驶规划工程师 (14 周)

从时空联合规划出发,经 Apollo/Autoware 工业架构,到不确定性处理与博弈交互,建立自动驾驶规划全栈能力。

T0(总论,1周) → T1(Frenet/ST,2周) → T2(走廊,2周) → T3(轨迹优化,3周)
  → T4(Apollo/Autoware,3周) → U0(不确定总论,1周) → U1(分支场景,2周)
  总计 ~14 周
周次 章节 核心能力 产出
1 T0 总论 时空规划全貌与方法谱系 文献地图与学习路线
2-3 T1 Frenet/ST 图 Frenet 变换、ST 搜索、DP+QP Frenet 变换库 + ST 搜索器
4-5 T2 走廊构建 SFC/IRIS 生成、动态障碍建模 时空走廊生成器
6-8 T3 轨迹优化 CILQR/TEB/OBCA/MINCO MINCO 优化器
9-11 T4 Apollo/Autoware EM Planner/Lattice 源码精读 规划模块部署调参报告
12 U0 不确定性总论 不确定性分类与建模 失效场景蒙特卡洛分析
13-14 U1 分支场景 MPDM 场景决策 分支 NMPC 变道规划器

前置要求: SLAM v8 Ch24(优化基础)、ROS2 基础、凸优化入门。 退出能力: 能独立读懂 Apollo/Autoware 规划模块源码,设计时空联合轨迹优化器,处理动态障碍场景。 后续扩展: G2(博弈交互) -> G3(意图推断) -> MPPI_08(自驾采样MPC) -> S1-S4(综述回顾)。

路径二:无人机全栈工程师 (12 周)

从仿真环境搭建出发,经微分平坦建模、轨迹优化、感知引导,一路推进到综合实战。跳过偏理论章节(D6 环境表示细节、D10 集群),聚焦单机从仿真到实飞的完整链路。

D0(仿真,1周) → D1(微分平坦,2周) → D3(多项式,1周) → D5(MINCO,2周)
  → D7(感知引导,2周) → D9(RL飞控,2周) → D12(综合实战,2周)
  总计 ~12 周
周次 章节 核心能力 产出
1 D0 仿真环境 Gazebo/PX4 SITL/OmniDrones 仿真悬停 + PPO 训练管线
2-3 D1 微分平坦 四旋翼建模、平坦映射、SE(3) 控制 SE(3) 控制器仿真跟踪
4 D3 多项式轨迹 Min-Snap QP、时间分配 可飞行走廊轨迹
5-6 D5 MINCO MINCO 参数化、梯度优化、SFC GCOPTER 走廊约束轨迹
7-8 D7 感知引导 ESDF/感知约束在线重规划 FUEL 自主探索演示
9-10 D9 RL 飞控 PPO/SAC + CTBR + sim-to-real RL 策略门穿越
11-12 D12 综合实战 端到端集成 仿真或实机完整演示

前置要求: SLAM v8(相机模型与点云处理)、ROS2 基础、Eigen。 退出能力: 能独立完成单架无人机从仿真到实飞的规划控制全链路。 后续扩展: D2(MPC) -> D8(敏捷飞行) -> D10(集群) -> MPPI(采样MPC深化)。

路径三:多机器人协作研究员 (10 周)

聚焦分布式协调与 MARL 协作规控,从共识理论到多机系统实战。

Multi_01(全景,1周) → Multi_02(共识/ADMM,1.5周) → Multi_03(MAPF,1.5周)
  → Multi_04(分布式MPC,2周) → Multi_10(MARL,2周) → Multi_13(实战,2周)
  总计 ~10 周
周次 章节 核心能力 产出
1 Multi_01 全景 多机架构分类、通信拓扑 架构决策树
2-3 Multi_02 共识/ADMM 线性共识、ADMM 分布式优化 10-agent 共识仿真
3.5-4.5 Multi_03 MAPF CBS/LaCAM、任务分配 CBS 仓库 MAPF
5-6 Multi_04 分布式 MPC ADMM 多足编队、WBC 双 Go2 编队行走
7-8 Multi_10 MARL 基础 CTDE/MAPPO/QMIX MAPPO 多机导航
9-10 Multi_13 综合实战 端到端多机系统 Mini-MultiBot 交付

前置要求: OCS2/Crocoddyl 单体 MPC、PPO/SAC、ROS2 多节点。 退出能力: 能设计分布式 MPC + MARL 混合的多机协同系统。 后续扩展: Multi_05-09(协同操作) -> G4(博弈MARL) -> D10(无人机集群)。


计算与硬件需求表

不同章节对计算资源的需求差异显著。下表帮助学习者提前规划硬件采购与云资源预算。

横切专题资源需求

章节范围 CPU GPU 真机 备注
T0-T3 (时空基础) 足够 不需要 不需要 优化规模小,笔记本即可
T4 (Apollo/Autoware) 多核推荐 不需要 不需要 可选 Autoware 仿真(16GB+ RAM)
T5 (多智能体时空) 多核推荐 不需要 不需要 CBS/LaCAM 对 CPU 敏感
T6 (扩散规划) 多核 需要 (RTX 3060+) 不需要 扩散模型训练需显存
U0-U3 (不确定性基础) 足够 U3 可选 GPU 不需要 粒子滤波对单核敏感
U4 (POMDP) 多核推荐 可选 GPU 不需要 POMCP 树搜索计算密集
U5 (CVaR) 足够 可选 GPU 不需要 数值实验规模不大
G0-G2 (博弈基础) 多核推荐 不需要 不需要 Nash 均衡求解计算密集
G3 (逆博弈) 多核 可选 GPU 不需要 在线参数辨识可选 GPU 加速
G4 (安全/MARL) 多核 推荐 GPU 不需要 MARL 训练受益于 GPU
MPPI_01-02 (核心理论) 足够 MPPI_02 起强烈推荐 不需要 CUDA 并行是核心内容
MPPI_03-04 (变体) 多核 推荐 (RTX 3060+) 不需要 对比 benchmark 需 GPU
MPPI_05-06 (前沿融合) 多核 必需 (RTX 3060+) 不需要 扩散/世界模型训练需显存
MPPI_07-08 (领域应用) 多核 推荐 GPU MPPI_08 可选 MuJoCo GPU rollout
MPPI_09-10 (对比+实战) 多核 必需 (RTX 3060+) MPPI_10 推荐 Mini-MPPI 完整工程
Multi_01-03 (多机基础) 多核推荐 不需要 不需要 多智能体仿真吃 CPU
Multi_04-06 (协同控制) 多核 可选 GPU 不需要 IsaacLab 仿真推荐 GPU
Multi_07-09 (协同操作) 多核 推荐 GPU 不需要 闭链动力学计算密集
Multi_10-12 (MARL) 多核 必需 (RTX 3060+) 不需要 MARL 训练需 GPU
Multi_13 (综合实战) 多核 必需 不需要 推荐多机仿真集群
TAMP_T1 (任务运动) 足够 不需要 不需要 符号推理为主

无人机章节资源需求

章节 CPU GPU 真机 备注
D0 仿真环境 足够 不需要 不需要 PX4 SITL + Gazebo
D1 微分平坦 足够 不需要 不需要 刚体力学推导为主
D2 MPC 控制 足够 不需要 不需要 acados 数值计算
D3-D5 轨迹优化 足够 不需要 不需要 数值优化为主
D6-D7 环境感知 多核推荐 可选(加速 ESDF) 不需要 点云处理有一定计算量
D8 敏捷飞行 多核 可选 PX4 推荐 实机效果显著优于仿真
D9 RL 飞控 多核 必需 (RTX 3060+) 不需要 PPO/SAC 训练需 GPU
D10 集群 多核 MARL 训练需 GPU 不需要 多机仿真资源需求高
D11 前沿 视内容 视内容 不需要 跟踪最新论文
D12 综合实战 多核 推荐 强烈推荐 PX4 真机 端到端项目

推荐配置总结

配置层级 硬件规格 覆盖范围
最低入门 8 核 CPU / 16GB RAM / 无独显 横切 T/U/G 基础 + 无人机 D0-D5
推荐标准 12 核 CPU / 32GB RAM / RTX 3060 12GB 全部章节仿真部分
完整配置 上述 + RTX 4090 24GB 全部章节 + 大规模 MARL 训练
实机配置 推荐标准 + PX4 开发套件 (Holybro X500/Pixhawk 6C) D8/D12 实机实战

工业 vs 研究标记

每个章节按内容侧重标记为工业导向、研究导向或两者兼具,帮助不同目标的学习者快速筛选。

工业导向章节 (🏭)

以工程落地和系统集成为核心,代码可直接复用于产品级系统。

章节 关键词 目标岗位
T4 Apollo/Autoware 架构 EM-Planner, Autoware.Universe, 量产方案 自动驾驶规划工程师
MPPI_10 Mini-MPPI 实战 ROS2 节点封装, 延迟补偿, 实车测试 控制算法工程师
Multi_04 分布式 MPC 编队 ADMM, 多足编队, WBC 多机系统工程师
D0 仿真环境搭建 Gazebo, PX4 SITL, OmniDrones 无人机系统工程师
D8 敏捷飞行集成 PX4 offboard, uXRCE-DDS 飞控工程师
D12 综合实战 全链路集成, 飞行日志分析 无人机全栈工程师

研究导向章节 (🔬)

聚焦前沿方法论与开放问题,适合追求论文发表或方法创新的学习者。

章节 关键词 研究方向
T6 扩散式时空规划 Diffusion Policy, 条件生成 生成式规划
U4 POMDP/Belief 空间 部分可观测, 在线决策 信息论规划
U5 CVaR 风险规划 条件风险值, DRO 风险敏感控制
G3 逆博弈/Level-k 意图推断, 有界理性 预测-规划一体
G4 安全证书/MARL GCBF+, Stackelberg 安全多智能体
MPPI_05 扩散增强 MPC MBD, DIAL-MPC 采样-扩散融合
MPPI_06 TD-MPC 世界模型, latent 规划 模型基 RL
Multi_12 MARL+规控混合 残差策略, Safe MARL 学习型协调
D9 RL 敏捷飞控 sim-to-real, 策略蒸馏 端到端飞行
D11 前沿追踪 3DGS 导航, VLM 无人机 新兴交叉

工业-研究兼具章节 (🏭🔬)

方法本身已有工业应用但仍在快速演进,论文与产品并重。

章节 关键词 应用场景
T3 时空轨迹优化 CILQR/TEB/OBCA/MINCO 动态环境规划
U2 鲁棒规划/CBF 安全滤波 Tube MPC, CBF-QP 安全关键系统
G2 实时博弈求解 iLQGames, ALGAMES 多车交互
MPPI_07 腿足全身 MPPI 全身力矩, MuJoCo GPU 足式敏捷控制
MPPI_08 导航/自驾采样 MPC Nav2 MPPI, AutoRally ROS2 导航
Multi_08 多足协同 Loco-Manipulation 相位耦合, 协同 WBC 多足搬运
D2 MPC 控制 acados NMPC, L1 自适应 从仿真到实机
D5 MINCO/安全走廊 GCOPTER, FIRI, SUPER 高速安全飞行

总览路线图

方法论层与应用层的双导航架构

本大纲的核心设计:横切专题(10-60)提供通用方法论工具箱,无人机(70)提供完整应用实例,综述(80)提供连接线。三层之间存在大量交叉引用。

┌─────────────────────────────────────────────────────────────────────────────┐
│                    横切方法论层(通用工具箱,~81.5 周)                       │
│                                                                             │
│  10_时空规划 (T0-T6+附录, 8章, 16周)                                        │
│  ├── T0 总论 → T1 Frenet/ST → T2 走廊 → T3 轨迹优化                        │
│  ├── T4 Apollo/Autoware 🏭 → T5 多智能体 → T6 扩散规划 🔬                   │
│  └── ←→ 无人机 D3-D5 轨迹优化 / D2 MPC                                     │
│                                                                             │
│  20_采样式MPC (MPPI Ch1-10+附录, 12章, 18周)                                │
│  ├── MPPI_01 路径积分 → MPPI_02 CUDA → MPPI_03 六大变体 → MPPI_04 CEM      │
│  ├── MPPI_05 扩散MPC 🔬 → MPPI_06 TD-MPC → MPPI_07 腿足 → MPPI_08 导航    │
│  ├── MPPI_09 选型决策 → MPPI_10 Mini-MPPI 🏭                                │
│  └── ←→ 无人机 D2 MPC / 足式 05_运动控制                                    │
│                                                                             │
│  30_不确定性 (U0-U5+附录, 8章, 12周)                                        │
│  ├── U0 总论 → U1 分支场景 → U2 鲁棒/CBF 🏭🔬 → U3 机会约束                │
│  ├── U4 POMDP 🔬 → U5 CVaR 🔬                                              │
│  └── ←→ 无人机 D7 感知引导 / Safe RL                                        │
│                                                                             │
│  40_博弈规划 (G0-G4+附录, 7章, 10周)                                        │
│  ├── G0 总论 → G1 HJI → G2 实时博弈 🏭🔬 → G3 逆博弈 🔬 → G4 安全/MARL 🔬 │
│  └── ←→ 无人机 D10 集群对抗 / 自动驾驶交互                                  │
│                                                                             │
│  50_多机器人 (Multi Ch1-13+附录, 16章, 21.5周)                              │
│  ├── Multi_01 全景 → Multi_02 共识 → Multi_03 MAPF → Multi_04 分布MPC 🏭🔬 │
│  ├── Multi_05 协同搬运 → Multi_06 异构 → Multi_07 双臂 → Multi_08 多足 🏭🔬│
│  ├── Multi_09 人形协同 → Multi_10 MARL → Multi_11 协调 → Multi_12 混合 🔬   │
│  ├── Multi_13 Mini-MultiBot 🏭                                              │
│  └── ←→ 无人机 D10 集群 / 05_运动控制 双臂+足式                             │
│                                                                             │
│  60_TAMP (1章, 4周)                                                         │
│  ├── TAMP_T1 符号+连续规划接口                                              │
│  └── ←→ 06_具身智能 SayCan/VoxPoser                                         │
│                                                                             │
└─────────────────────────────────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────────────────────────────────┐
│                    无人机应用层(完整实例,~22 周)                           │
│                                                                             │
│  Part 0: 仿真       D0 (1周) ─── PX4 SITL + Gazebo + IsaacLab              │
│  Part 1: 动力学     D1 (2周) + D2 (2周) ─── 微分平坦 + MPC                  │
│  Part 2: 轨迹       D3 (1周) + D4 (1.5周) + D5 (2周) ─── Min-Snap→MINCO    │
│  Part 3: 感知       D6 (2周) + D7 (2周) ─── 环境表示 + 自主探索             │
│  Part 4: 敏捷       D8 (2周) + D9 (2周) ─── 敏捷飞行 + RL                   │
│  Part 5: 集群       D10 (1.5周) + D11 (1.5周) ─── 协同 + 前沿              │
│  Part 6: 实战       D12 (2周) ─── 端到端综合项目                            │
│  附录 (6篇)         轨迹深度/感知深度/MPC深度/RL深度/配套/调研               │
│                                                                             │
└─────────────────────────────────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────────────────────────────────┐
│                    综述连接层(贯穿线,~3 周)                               │
│                                                                             │
│  S1 总览与时空联合   ─── 连接 T线 + D3-D5                                   │
│  S2 不确定性规划     ─── 连接 U线 + D7                                      │
│  S3 博弈规划         ─── 连接 G线 + D10                                     │
│  S4 交互意图预测     ─── 连接 G3 + 自动驾驶                                 │
│  S5 RL与经典规控     ─── 全线贯穿视角                                       │
│                                                                             │
└─────────────────────────────────────────────────────────────────────────────┘

横切专题之间的依赖关系

                         T (时空联合)
                        /     |      \
                       v      v       v
                   T5(多智能体)  TAMP    T6(扩散)
                       |                  |
                       v                  v
MPPI (采样式MPC) ─→ Multi (多机) ←──── G (博弈)
  │                    |
  ├──→ U (不确定性)    |
  ├──→ G (博弈)        v
  └──→ Multi         综述(80)

核心路径:
  MPPI → U: MPPI 天然处理随机性,U 专题深化理论
  MPPI → G: 多智能体 MPPI → 博弈 MPPI
  MPPI → Multi: 多智能体 MPPI → 分布式采样
  T → TAMP: 连续轨迹优化嵌入符号任务规划
  Multi → G: 非合作多机 → 博弈论框架

前置知识依赖矩阵

本大纲假设学习者已完成 SLAM v8 主线课程。下表列出各专题对 v8 具体章节的依赖,以及额外需要的数学与编程基础。

横切专题前置依赖

横切专题 SLAM v8 前置 额外数学基础 额外编程基础 最低可启动
T: 时空规划 点云处理、占据栅格 凸优化(对偶)、多项式插值 C++ 数值优化库(Eigen, OSQP) Ch11+Ch24
U: 不确定性 贝叶斯滤波、EKF/UKF 随机过程、CVaR 风险度量 Python 概率编程 Ch11+Ch18+Ch20
G: 博弈规划 多目标跟踪(MOT)基础 博弈论(Nash 均衡)、微分博弈 自动微分(JAX/Julia) Ch24+Ch22
MPPI: 采样MPC 无直接依赖 最优控制(LQR/iLQR)、信息论 CUDA C++、PyTorch Ch11
Multi: 多机 分布式 SLAM(如有) 图论、共识算法、ADMM ROS2 多节点、DDS Ch31+Ch19
TAMP: 任务运动 语义 SLAM(如有) 符号 AI(PDDL)、混合系统 PDDL 求解器接口 Ch6+Ch31

无人机章节前置依赖

无人机章节 SLAM v8 前置 横切专题前置 备注
D0 仿真环境 ROS2 基础通信 独立入口
D1 微分平坦 Eigen(Ch11)、SO(3)/SE(3)(Ch23) 需刚体动力学基础
D2 MPC 非线性优化(Ch17-18) MPPI_01(推荐) 与 MPPI 互补
D3 多项式轨迹 Eigen(Ch11) T0-T1(推荐) 走廊概念来自 T 专题
D4 B 样条 无直接依赖 D3(必须) B 样条是 D3 延伸
D5 MINCO Eigen(Ch11) D3+D4(必须) MINCO 统一前两者
D6 环境表示 占据栅格、ESDF、点云 直接复用 SLAM 知识
D7 感知引导 视觉 SLAM、点云 D6(必须), U0(推荐) 感知不确定性连 U 专题
D8 敏捷飞行 无直接依赖 D1+D5(必须) 高速场景轨迹跟踪
D9 RL 飞控 无直接依赖 D1(必须) 需 RL 基础(PPO/SAC)
D10 集群 分布式系统概念 Multi_01-03(推荐) 连接 Multi 专题
D11 前沿 NeRF/3DGS(如有) 视具体论文 跟踪最新进展
D12 综合实战 全部相关章节 D0-D8(必须) 集成性项目

v8 前置三层口径

  • 最低可启动: Ch11(Eigen)、Ch17-18(优化)、Ch24(轨迹)。可支撑任一角色快速路径启动。
  • 推荐补齐: Ch11、Ch14、Ch17-20、Ch23(李群)、Ch24、Ch31(ROS2)。适合完整学习任一 Part。
  • 完整前置: 完成 v8 Ch1-Ch46 全部内容,进入全部横切专题+无人机无障碍。

生态速览 (2026-05)

本方向涉及多个活跃开源生态,各有核心维护团队和技术路线。了解生态格局有助于选择代码基础和社区资源。

浙大规划学派 (ZJU FAST Lab / 高飞团队)

围绕多项式/B 样条/MINCO 轨迹优化构建了完整的无人机规划栈。

项目 定位 状态 星标
GCOPTER 通用走廊约束轨迹优化器 稳定,学术基准 ~400
EGO-Planner ESDF-free 梯度在线规划 广泛使用 ~600
EGO-Swarm 多机去中心化扩展 D10 核心参考 ~1.9k
MIGHTY (2025) 大规模异构集群 最新,百级无人机 --

特点: 理论严谨、header-only 风格、论文与代码一一对应。偏学术,工业移植需额外工程化。

MPPI/采样 MPC 生态

MPPI 从机器人领域扩展到自动驾驶和敏捷飞行,形成活跃社区。

项目 语言 定位 状态
MPPI-Generic (ACDSLab) C++/CUDA Header-only 模板库 活跃维护
pytorch_mppi (UM-ARM-Lab) Python/PyTorch 可微分 MPPI 研究友好
Tube-MPPI C++ 鲁棒管道约束 MPPI_03 参考
Diffusion-MPPI (2025) PyTorch 扩散先验 MPPI 前沿
DIAL-MPC (2025) Python 扩散退火+全身力矩 ICRA Best Paper Finalist

特点: GPU 加速是核心竞争力,C++ 和 Python 两条路线并行。

PX4 + ROS2 无人机工具链

PX4 飞控与 ROS2 的集成在 2024-2025 年间趋于成熟。

组件 定位 状态
PX4 Autopilot v1.15+ 开源飞控固件 持续活跃
uXRCE-DDS Agent PX4-ROS2 通信桥 官方推荐,替代 mavros
Gazebo Harmonic 仿真环境 ROS2 原生集成
OmniDrones/Aerial Gym RL 训练仿真 IsaacLab 生态

最新动态: ROSCon 2025 专题讨论 PX4+ROS2 生产级部署; uXRCE-DDS 带宽优化持续推进; PX4 社区探索 VLM/LLM 集成接口。

多智能体 RL 生态

项目 定位 状态
MARLlib 18 算法,全任务模式 统一 MARL 框架
EPyMARL 扩展 PyMARL,异构支持 标准化评估
HARL HAPPO/HATRPO 统一库 协作强基线
MASH (2025) 异构人形 MARL 前沿

扩散式规划生态 (2023-2026 最热方向)

工作 会议/年份 核心贡献 对应章节
Diffuser ICML 2022 轨迹优化折进扩散模型 T6, MPPI_05
Diffusion Policy RSS 2023 视觉运动 BC, 条件 DDPM T6, 06_具身
Diffusion-Planner ICLR 2025 自动驾驶联合规划 T6, MPPI_05
TD-MPC2 ICLR 2024 Latent MPPI + world model MPPI_06
DIAL-MPC ICRA 2025 扩散退火全身力矩 MPPI_05, MPPI_07

自动驾驶规划生态

项目 定位 状态
Apollo Planning L4 量产规划栈 T4 核心参考
Autoware.Universe 开源全栈自动驾驶 T4 核心参考
CARLA/Highway-env 仿真 Benchmark G/T 线通用
iLQGames (Fridovich-Keil) 实时博弈求解 G2 核心
hj_reachability HJI 安全验证 G1 核心

各 Part 详细大纲


Part-T: 时空联合规划 (T0-T6 + 附录, ~16 周)

线路定位: 从经典路径-速度解耦到端到端时空轨迹优化,贯穿自动驾驶与机器人导航两大应用域 里程碑: 完成本线后,学习者**能设计时空联合轨迹优化器,理解 Apollo/Autoware 规划架构** 文件目录: 10_时空规划/ 文件清单: 8 个 .md 文件


T0 时空联合规划总论 (1 周)

前置: 无 (本线入口) 核心主题: 时空耦合动机与三核心洞察 . 路径-速度解耦范式的局限性 . 时空联合规划谱系总览 . 6 章路线图与学习依赖 . 评价指标体系(安全/效率/舒适) . 典型失败案例分析 文件: 10_时空规划/10_时空联合规划总论.md 共享标记: 导论章节

T1 Frenet 坐标系与 ST 图 (2 周) ⭐⭐

前置: v8 Ch24(优化基础), 微分几何初步 核心主题: Frenet-Serret 坐标系变换 . 曲率/挠率与路径参数化 . ST 图构建与搜索策略 . DP+QP 两阶段求解 . 纵横向耦合场景分析 . 坐标奇异性处理 . 参考线平滑 关键论文: Werling et al. (2010) ICRA -- Frenet Frame Planner 文件: 10_时空规划/20_Frenet坐标系与ST图.md 共享标记: 🏭🔬 自动驾驶+导航通用

T2 时空走廊构建 (2 周) ⭐⭐

前置: T1(Frenet/ST), 凸优化基础 核心主题: 时空 A*/Hybrid A* 搜索 . SFC 生成算法(DecompUtil/FIRI/CIRI) . 凸分解与 IRIS 方法 . 动态障碍物时空建模 . 走廊连续性与可行性保证 关键论文: Liu et al. (2017) -- Safe flight corridors 文件: 10_时空规划/30_时空走廊与搜索.md 共享标记: 🔬 无人机/自动驾驶走廊通用

T3 时空轨迹优化方法 (3 周) ⭐⭐⭐

前置: T2(走廊), 最优控制基础 核心主题: CILQR(约束迭代 LQR) . TEB(Timed Elastic Band) . OBCA(Optimization-Based Collision Avoidance) . MINCO 轨迹表示 . 求解器选型(OSQP/IPOPT/CasADi) . 实时性对比 关键论文: Zhang et al. (2020) -- EGO-Planner/MINCO, Wang (2022) -- GCOPTER 文件: 10_时空规划/40_时空轨迹优化.md 共享标记: 🏭🔬 核心算法章,理论密度最高

T4 Apollo 与 Autoware 规划架构剖析 (3 周) ⭐⭐⭐ 🏭

前置: T1-T3(理论基础) 核心主题: Apollo Planning 模块架构(Scenario/Stage/Task) . EM Planner 解耦流程 . Lattice Planner 实现 . Autoware.Universe Planning 栈 . 工业级代码质量分析 关键论文: Fan et al. (2018) -- Apollo EM motion planner 文件: 10_时空规划/50_Apollo_Autoware框架.md 共享标记: 🏭 工业框架深度剖析

T5 多智能体时空规划 (3 周) ⭐⭐⭐

前置: T3(轨迹优化), 图搜索算法 核心主题: CBS 冲突搜索 . LaCAM 大规模 MAPF . ORCA 互惠避碰 . EGO-Swarm 去中心化 . MADER 时空安全 . 规模可扩展性分析 关键论文: Sharon (2015) CBS, Zhou (2021) EGO-Swarm, Tordesillas (2022) MADER 文件: 10_时空规划/60_多智能体时空协调.md 共享标记: 🔬 多机/集群核心

T6 端到端与扩散式时空规划 (1.5 周) ⭐⭐ 🔬

前置: T3(轨迹优化), 深度学习基础 核心主题: 扩散模型基础(DDPM/Score Matching) . Diffusion Policy 时空轨迹生成 . CTG 条件引导 . 端到端范式(UniAD/VAD) . 安全性挑战 关键论文: Chi (2023) Diffusion Policy, Janner (2022) Diffuser 文件: 10_时空规划/70_端到端与扩散式规划.md 共享标记: 🔬 前沿研究方向

T 附录 综合对比 (0.5 周)

前置: T0-T6 全线 核心主题: 方法分类矩阵 . 计算复杂度横评 . 安全性保证层级 . 开源实现索引 . 面试/选题建议 文件: 10_时空规划/80_综合对比与附录.md


T 线依赖 DAG

T0(总论) ──> T1(Frenet/ST) ──> T2(走廊) ──> T3(轨迹优化) ──┬──> T4(Apollo/Autoware)
                                                            ├──> T5(多智能体)
                                                            └──> T6(扩散规划)
                                                   T0-T6 ──> T附录

T 线周历 (16 周)

周次 章节 核心产出
W1 T0 总论 文献地图,学习路线
W2-W3 T1 Frenet/ST Frenet 变换库 + ST 搜索器
W4-W5 T2 走廊 走廊生成器,动态障碍 Demo
W6-W8 T3 轨迹优化 MINCO 优化器,TEB/OBCA 对比
W9-W11 T4 Apollo/Autoware 源码走读报告,部署调参
W12-W14 T5 多智能体 CBS 求解器,EGO-Swarm 仿真
W15 T6 扩散规划 Diffusion Policy 实验
W15.5-W16 T 附录 综合 Benchmark + 对比报告

T 线核心参考论文

  • Werling et al. (2010) -- Optimal trajectory generation in a Frenet frame
  • Liu et al. (2017) -- Safe flight corridors for quadrotor planning
  • Wang (2022) -- GCOPTER/MINCO trajectory optimization (TRO)
  • Fan et al. (2018) -- Baidu Apollo EM motion planner
  • Zhou et al. (2021) -- EGO-Swarm decentralized planning (ICRA)

T 线里程碑检验: 1. 工程能力: 能设计时空联合轨迹优化器,理解 Apollo/Autoware 规划架构 2. 系统能力: 能独立完成 Frenet 坐标变换到走廊约束优化的完整 Pipeline 3. 验收标准: 动态障碍物场景时空轨迹规划,满足安全/平滑/实时三约束


Part-U: 不确定性规划 (U0-U5 + 附录, ~12 周)

线路定位: 从确定性规划扩展到真实世界的感知噪声、模型不确定与环境随机性 里程碑: 完成本线后,学习者**能实现 Tube MPC/CBF 安全约束,理解 POMDP 决策框架** 文件目录: 30_不确定性规划/ 文件清单: 7 个 .md 文件


U0 不确定性规划总论 (1 周)

前置: 概率论基础, MPC 入门 核心主题: 不确定性来源分类(认知/偶然/模型/环境) . 鲁棒 vs 随机 vs 分布式鲁棒谱系 . 安全性定义层级 . 确定性规划的失效场景分析 文件: 30_不确定性规划/10_不确定性规划总论.md 共享标记: 导论章节

U1 分支场景与应急规划 (2 周) ⭐⭐

前置: U0(总论), 决策树/MDP 基础 核心主题: Contingency Planning 条件分支 . MPDM 多策略决策 . 场景树构建与概率赋权 . Multi-stage NMPC . 自动驾驶变道案例 关键论文: Cunningham (2015) MPDM 文件: 30_不确定性规划/20_分支场景规划.md 共享标记: 🏭 自动驾驶决策核心

U2 鲁棒规划与安全滤波 (2.5 周) ⭐⭐⭐

前置: U1(分支), 李雅普诺夫稳定性 核心主题: Tube MPC 鲁棒管道 . CBF 安全屏障函数 . CLF-CBF-QP 安全滤波器 . GP-MPC 高斯过程增强 . CBF 高阶相对度处理 关键论文: Mayne (2005) Tube MPC, Ames (2017) CBF-QP 文件: 30_不确定性规划/30_鲁棒规划与安全滤波.md 共享标记: 🏭🔬 安全关键系统核心

U3 机会约束规划 (2 周) ⭐⭐

前置: U2(鲁棒), 随机优化 核心主题: CC-MPC 机会约束 . IRA 迭代风险分配 . CC-RRT 概率约束采样 . 约束紧缩技术 关键论文: Blackmore (2011) Chance-constrained path planning 文件: 30_不确定性规划/40_机会约束规划.md 共享标记: 🔬 概率安全保证

U4 POMDP 与 Belief 空间规划 (2.5 周) ⭐⭐⭐ 🔬

前置: U3(机会约束), MDP/贝叶斯推理 核心主题: POMDP 框架 . Belief 空间表示 . 信息收集型规划 . POMCP/DESPOT 在线求解 . 探索-利用权衡 关键论文: Silver & Veness (2010) POMCP 文件: 30_不确定性规划/50_POMDP与Belief规划.md 共享标记: 🔬 理论深度最高

U5 风险敏感与 CVaR 规划 (1.5 周) ⭐⭐ 🔬

前置: U3(机会约束), 风险度量基础 核心主题: CVaR 条件风险值 . 分布式鲁棒优化(DRO) . Distributional RL . 一致性风险度量 关键论文: Majumdar & Pavone (2020) -- CVaR planning 文件: 30_不确定性规划/60_风险敏感规划CVaR.md 共享标记: 🔬 交叉学科(金融+机器人)

U 附录 综合对比 (0.5 周)

前置: U0-U5 全线 核心主题: 方法分类矩阵 . 保守性-计算量权衡 . 安全保证强度排序 . 求解器索引 文件: 30_不确定性规划/70_综合对比与附录.md


U 线依赖 DAG

U0(总论) ──> U1(分支) ──> U2(鲁棒/CBF) ──> U3(机会约束) ──┬──> U4(POMDP)
                                                           └──> U5(CVaR)
                                                  U0-U5 ──> U附录

U 线周历 (12 周)

周次 章节 核心产出
W1 U0 总论 不确定性分类 Notebook
W2-W3 U1 分支场景 MPDM 决策器
W4-W5.5 U2 鲁棒/CBF Tube MPC 控制器, CBF 滤波器
W6-W7 U3 机会约束 CC-MPC 规划器
W8-W9.5 U4 POMDP POMCP 求解器
W10-W11 U5 CVaR CVaR 轨迹优化器
W11.5-W12 U 附录 统一 Benchmark + 选型决策树

U 线里程碑检验: 1. 安全能力: 能实现 Tube MPC/CBF 安全约束 2. 决策能力: 理解 POMDP 框架,能设计信息收集策略 3. 验收标准: CBF 滤波器零碰撞; POMDP 决策优于 greedy 基线 20%+


Part-G: 博弈规划 (G0-G4 + 附录, ~10 周)

线路定位: 将规划从单智能体扩展到多智能体交互博弈 里程碑: 完成本线后,学习者**能建模多智能体博弈,实现 iLQGames 求解器** 文件目录: 40_博弈规划/ 文件清单: 6 个 .md 文件


G0 博弈规划总论 (1 周)

前置: 博弈论入门, 最优控制基础 核心主题: 博弈论在规划中的动机 . Nash/Stackelberg 均衡 . 静态 vs 微分博弈 . 交互建模缺陷分析 文件: 40_博弈规划/10_博弈规划总论.md 共享标记: 导论章节

G1 微分博弈与 HJI 可达性 (2 周) ⭐⭐⭐

前置: G0(总论), 偏微分方程基础 核心主题: 微分博弈形式化 . HJI 方程 . 可达性分析 . Level Set 方法 . DeepReach 神经网络近似 关键论文: Bansal (2017) -- HJ reachability overview 文件: 40_博弈规划/20_微分博弈与HJI.md 共享标记: 🔬 安全验证基础

G2 实时博弈求解 (2.5 周) ⭐⭐⭐

前置: G1(微分博弈), iLQR 算法 核心主题: iLQGames 迭代线性二次博弈 . ALGAMES 增广拉格朗日 . 开环 vs 反馈 Nash . 收敛性与多均衡 . 实时性优化 关键论文: Fridovich-Keil (2020) iLQGames, Le Cleac'h (2022) ALGAMES 文件: 40_博弈规划/30_实时博弈求解器.md 共享标记: 🏭🔬 核心算法章

G3 逆博弈与 Level-k 推理 (2 周) ⭐⭐ 🔬

前置: G2(实时博弈), 逆最优控制 核心主题: 逆博弈问题定义 . 从观测推断对手目标 . Level-k 认知层级 . 预测-规划一体化 关键论文: Peters (2021) -- Inverse Games 文件: 40_博弈规划/40_逆博弈与预测规划.md 共享标记: 🔬 预测规划交叉

G4 安全证书与 MARL 交界 (2 周) ⭐⭐ 🔬

前置: G2(实时博弈), RL 基础 核心主题: 安全证书 . Stackelberg 博弈 . 博弈+CBF 融合 . MARL 基础(MAPPO/QMIX) . 博弈均衡与 MARL 收敛 关键论文: GCBF+ (MIT REALM), PSRO (Lanctot 2017) 文件: 40_博弈规划/50_安全证书与MARL.md 共享标记: 🔬 博弈+学习交界

G 附录 综合对比 (0.5 周)

前置: G0-G4 全线 核心主题: 方法分类矩阵 . 均衡概念选择指南 . 信息结构影响 . 开源索引 文件: 40_博弈规划/60_综合对比与附录.md


G 线依赖 DAG

G0(总论) ──> G1(HJI) ──> G2(实时博弈) ──┬──> G3(逆博弈/Level-k)
                                         └──> G4(安全/MARL)
                                G0-G4 ──> G附录

G 线周历 (10 周)

周次 章节 核心产出
W1 G0 总论 博弈分类 Notebook
W2-W3 G1 HJI HJI 求解器(2D/3D)
W4-W5.5 G2 实时博弈 iLQGames 求解器
W6-W7 G3 逆博弈 意图推断器
W8-W9 G4 安全/MARL 博弈 CBF 系统
W9.5-W10 G 附录 统一评测 + 选型报告

G 线里程碑检验: 1. 建模能力: 能定义玩家/策略空间/代价函数 2. 求解能力: iLQGames 双车交互 10Hz+ 实时求解 3. 验收标准: 逆博弈意图推断 ADE < 基线 50%


Part-MPPI: 采样式 MPC (Ch1-10 + 附录, ~18 周)

线路定位: 从梯度式 MPC 扩展到采样式/路径积分控制范式,天然兼容不连续代价、黑箱仿真器、神经网络动力学 里程碑: 完成本线后,学习者**能设计、调优并部署基于 MPPI 的实时控制器** 文件目录: 20_采样式MPC/ 文件清单: 12 个 .md 文件 核心谱系: Kappen (Radboud) -> Todorov (UCSD) -> Theodorou (Georgia Tech) -> Williams (ACDS)


Part 1: 理论与核心实现 (Ch1-Ch2, 4 周)

里程碑:路径积分数学推导 + 可运行 CUDA MPPI 控制器

MPPI_01 | 路径积分控制理论 | ⭐⭐⭐ | 2 周

核心主题: Kappen 指数变换 -> HJB 线性化 . Feynman-Kac 路径积分 . 自由能-KL 散度对偶 . MPPI 权重公式 . 温度 lambda 的物理意义 . MPPI 与 REINFORCE 同构 关键论文: Kappen 2005, Todorov 2009 (PNAS), Williams 2017 (JGCD), Williams 2018 (T-RO) 文件: 20_采样式MPC/20_路径积分控制理论.md

MPPI_02 | 核心算法与 GPU 并行实现 | ⭐⭐⭐ | 2 周

核心主题: MPPI 伪代码 . CUDA kernel 设计 . 协方差调度 . MPPI-Generic 精读 . pytorch_mppi 快速原型 . MuJoCo GPU rollout 关键论文: Williams 2017 (JGCD), Vlahov 2024 (MPPI-Generic, RA-L) 文件: 20_采样式MPC/30_MPPI核心算法与GPU.md

Part 2: 变体与统一视角 (Ch3-Ch4, 3.5 周)

里程碑:6 大变体适用场景 + CEM/Stein 统一理论

MPPI_03 | MPPI 六大变体 | ⭐⭐⭐⭐ | 2 周

核心主题: Smooth-MPPI . Tube-MPPI(鲁棒) . Robust-MPPI(min-max) . Log-MPPI(权重坍缩) . CoVO-MPC(协方差优化) . SVG-MPPI(Stein 引导) 关键论文: Williams 2018 Tube-MPPI, Pan 2023 CoVO-MPC, Honda 2024 SVG-MPPI 文件: 20_采样式MPC/40_MPPI六大变体.md

MPPI_04 | CEM 家族与采样 MPC 统一视角 | ⭐⭐⭐ | 1.5 周

核心主题: CEM -> iCEM -> Predictive Sampling . Tsallis MPPI . 统一框架: "采样分布 x 代价评估 x 更新规则" 关键论文: Pinneri 2021 iCEM (NeurIPS), Howell 2022 Predictive Sampling 文件: 20_采样式MPC/50_CEM家族与统一视角.md

Part 3: 前沿融合 (Ch5-Ch6, 4 周)

里程碑:MPPI 与扩散模型/世界模型的交叉前沿

MPPI_05 | 扩散启发采样 MPC | ⭐⭐⭐⭐ | 2 周 🔬

核心主题: DDPM 去噪 <-> MPPI 加权更新数学同构 . MBD(Model-Based Diffusion) . DIAL-MPC 扩散退火全身力矩 . Go1/H1 实验 关键论文: Pan 2024 MBD (NeurIPS), Xue 2025 DIAL-MPC (ICRA Best Paper Finalist) 文件: 20_采样式MPC/60_扩散启发采样MPC.md

MPPI_06 | 学习世界模型 + 采样规划 (TD-MPC) | ⭐⭐⭐⭐ | 2 周 🔬

核心主题: TD-MPC 三组件 . MPPI 在 latent 空间规划 . TD-MPC2 规模化(317M 参数, 104 任务) . Transformer-MPPI 关键论文: Hansen 2022 TD-MPC (ICML), Hansen 2024 TD-MPC2 (ICLR) 文件: 20_采样式MPC/70_学习世界模型TD-MPC.md

Part 4: 领域应用 (Ch7-Ch8, 3.5 周)

里程碑:采样 MPC 部署到真实机器人领域

MPPI_07 | 腿足全身 MPPI 与接触操作 | ⭐⭐⭐⭐ | 2 周 🏭🔬

核心主题: 接触不连续 -> 梯度 MPC 失效 -> 采样天然兼容 . 全身力矩空间 MPPI . 与 RL 混合架构 关键论文: Howell 2022 MuJoCo MPC, Xue 2025 DIAL-MPC 文件: 20_采样式MPC/80_腿足全身MPPI.md

MPPI_08 | 导航、自驾与无人机采样 MPC | ⭐⭐⭐ | 1.5 周 🏭🔬

核心主题: ROS2 Nav2 MPPI Controller . AutoRally 实车 . 自动驾驶 MPPI . 无人机 SE(3) MPPI 关键论文: Williams 2018 AutoRally, Macenski 2023 Nav2 MPPI 文件: 20_采样式MPC/90_导航自驾无人机采样.md

Part 5: 对比与综合实战 (Ch9-Ch10, 3 周)

里程碑:选型决策能力 + 完整项目交付

MPPI_09 | MPPI vs 梯度式 MPC 选型 | ⭐⭐⭐ | 1 周

核心主题: 五维对比 . 决策树 . 混合架构 . 计算预算 Pareto 前沿 文件: 20_采样式MPC/100_MPPI与梯度式对比.md

MPPI_10 | Mini-MPPI 综合实战 | ⭐⭐⭐⭐⭐ | 2 周 🏭

核心主题: 完整 CUDA MPPI 控制器 . 至少两任务验证 . K/T 扫参 . ROS2 节点封装 文件: 20_采样式MPC/110_Mini-MPPI实战.md

MPPI 附录: 20_采样式MPC/120_附录.md

MPPI 线里程碑检验: 1. 理论能力: 能推导路径积分 -> MPPI 权重公式全链 2. 工程能力: CUDA CartPole MPPI K=4096 >1kHz 3. 部署能力: ROS2 封装可运行 MPPI 控制器


Part-Multi: 多机器人协作 (Ch1-13 + 附录, ~21.5 周)

线路定位: 从单体规控扩展到多机协作规控 里程碑: 完成本线后,学习者**能设计分布式 MPC + MARL 混合多机系统** 文件目录: 50_多机器人协作/ 文件清单: 16 个 .md 文件


Part 1: 多机基础 (Ch1-Ch3, 4 周)

Multi_01 | 多机系统全景 | ⭐⭐ | 1 周

核心主题: 三维分类(架构 x 交互 x 信息) . 通信拓扑(Laplacian, 代数连通性 lambda_2) . 架构决策树 文件: 50_多机器人协作/20_多机系统全景.md

Multi_02 | 共识算法与分布式优化 | ⭐⭐⭐ | 1.5 周

核心主题: 线性共识协议 . 切换拓扑 . ADMM 分布式优化 . ADMM 用于多机 MPC 解耦 关键论文: Olfati-Saber 2004, Boyd 2011 ADMM 文件: 50_多机器人协作/30_共识算法与分布式优化.md

Multi_03 | 任务分配与路径规划 (MAPF) | ⭐⭐⭐ | 1.5 周

核心主题: CBBA 分布式拍卖 . CBS 两层搜索 . LaCAM 加速 . 仓库 MAPF vs 编队 关键论文: Choi 2009 CBBA, Sharon 2015 CBS 文件: 50_多机器人协作/40_任务分配与路径规划.md

Part 2: 协同运动控制 (Ch4-Ch6, 4 周)

Multi_04 | 分布式 MPC 多足编队 | ⭐⭐⭐⭐ | 2 周 🏭🔬

核心主题: 集中 vs 分布式 MPC . ADMM 解耦 . 编队约束 . 双 Go2 编队 关键论文: Kim 2023 (T-RO) 双四足, Keviczky 2008 分布式 MPC 文件: 50_多机器人协作/50_分布式MPC多足编队.md

Multi_05 | 协同搬运与力控 | ⭐⭐⭐⭐ | 2 周

核心主题: Grasp Matrix . 内力子空间 . 阻抗协调 . 负载估计与自适应 文件: 50_多机器人协作/60_协同搬运与力控.md

Multi_06 | 异构多机协同 | ⭐⭐⭐ | 1 周

核心主题: 地空联合(四足+无人机) . 异构通信 . 联合状态估计 文件: 50_多机器人协作/70_异构多机协同.md

Part 3: 协同操作 (Ch7-Ch9, 5 周)

Multi_07 | 双臂与多臂协同操作 | ⭐⭐⭐⭐ | 2 周

核心主题: 闭链运动学 . 力分配 . 双臂 impedance 协调 文件: 50_多机器人协作/80_双臂多臂协同操作.md

Multi_08 | 多足协同 Loco-Manipulation | ⭐⭐⭐⭐ | 1.5 周 🏭🔬

核心主题: 协同步态同步 . 负载动态分配 . 协同 WBC 关键论文: De Vincenti/Coros 2024 (ETH CRL) 文件: 50_多机器人协作/90_多足协同Loco-Manipulation.md

Multi_09 | 人形/四足+臂协同控制 | ⭐⭐⭐⭐ | 1.5 周

核心主题: 层次化全身协同 . 异构团队 . MASH(2025) 异构 MARL 文件: 50_多机器人协作/100_人形四足臂协同控制.md

Part 4: MARL 多智能体强化学习 (Ch10-Ch12, 5.5 周)

Multi_10 | MARL 基础 | ⭐⭐⭐ | 2 周

核心主题: CTDE 范式 . MADDPG . VDN/QMIX . MAPPO . HAPPO/HATRPO . HARL 库 关键论文: Lowe 2017 MADDPG, Rashid 2018 QMIX, Yu 2022 MAPPO 文件: 50_多机器人协作/110_MARL基础.md

Multi_11 | MARL 多机运动协调 | ⭐⭐⭐⭐ | 1.5 周

核心主题: 编队 MARL . 通信学习(CommNet/TarMAC) . 涌现协调 . sim-to-real 文件: 50_多机器人协作/120_MARL多机运动协调.md

Multi_12 | MARL + 传统规控混合 | ⭐⭐⭐⭐ | 2 周 🔬

核心主题: RL 高层 + MPC 底层 . Safe MARL(GCBF+) . 约束 MARL . 残差策略 . MASH 关键论文: MIT REALM GCBF+, PKU HARL 文件: 50_多机器人协作/130_MARL与传统规控混合.md

Part 5: 综合实战 (Ch13, 2 周)

Multi_13 | Mini-MultiBot 综合实战 | ⭐⭐⭐⭐⭐ | 2 周 🏭

核心主题: 端到端多机系统 . 分布式 MPC + MARL 双范式 . 系统级评估 文件: 50_多机器人协作/140_Mini-MultiBot综合实战.md

Multi 附录: 50_多机器人协作/150_附录.md

Multi 线里程碑检验: 1. 协调能力: 双 Go2 ADMM 编队行走 2. 学习能力: MAPPO 多机协作导航训练 3. 验收标准: Mini-MultiBot 双任务系统级交付


Part-TAMP: 任务与运动规划 (1 章, ~4 周)

线路定位: 符号 AI(任务规划)与几何 AI(运动规划)的交叉 文件目录: 60_任务运动规划/ 文件清单: 1 个 .md 文件 (3177 行,内部渐进)


TAMP_T1 | 任务与运动规划基础 | ⭐ ~ ⭐⭐⭐⭐ | 4 周 | 3177 行

前置: A* 搜索、一阶逻辑、RRT/PRM 核心参考: Garrett et al. (2021) Annual Review 内部结构 (9 大节): 1. 为什么需要 TAMP -- 符号 vs 几何 gap 2. 经典任务规划 -- STRIPS -> PDDL -> FF; ADL 扩展 3. 采样运动规划回顾 -- C-space -> RRT/PRM 4. TAMP 核心范式 -- skeleton search + PDDLStream 5. LGP 逻辑-几何规划 -- Toussaint KOMO 联合优化 6. Learning-based TAMP -- GNN/LLM/扩散引导搜索 7. 工程实践 -- PDDLStream + MoveIt2 8. 前沿方向 -- SayCan / Code-as-Policies / VoxPoser 9. 综合练习 -- 桌面整理全流程 文件: 60_任务运动规划/10_任务与运动规划基础.md


Part-D: 无人机 (D0-D12 + 附录, ~22 周)

线路定位: 完整的无人机规控应用实例,从仿真到实飞 文件目录: 70_无人机/ 文件清单: 14 章 + 6 篇附录 核心技术栈: Eigen / GCOPTER / Fast-Planner / PX4 / acados / IsaacLab 核心实验室: ZJU FAST Lab / HKUST Aerial / UZH RPG / HKU MaRS / MIT ACL


三大认知跨越 (从 SLAM 到无人机规控)

跨越一: 从"估计过去"到"规划未来"。 SLAM 是后验推断; 规控是前瞻规划。数学从最小二乘转向约束优化(QP/NLP/L-BFGS)。

跨越二: 从"软实时 10Hz"到"硬实时 1ms"。 SLAM 丢一帧精度下降; 控制丢一帧姿态失稳。热路径零堆分配/零异常/零阻塞。

跨越三: 从"传感器前端"到"执行器后端"。 SLAM 擅长点云/图像/IMU; 规控要求理解电机/ESC/电池/桨涡。

SLAM 技能迁移速查

SLAM 技能 无人机规控对应 迁移难度
Eigen 矩阵运算 MINCO 带状矩阵, Jacobian 组装
Sophus SE(3)/manif Lee 几何控制 SO(3) 误差
GTSAM 因子图 MPC KKT 块三对角 (数学同构)
PCL 点云 ikd-Tree/voxblox/ROG-Map
FAST-LIO2 无人机感知管线默认后端
FCL 碰撞检测 不用 FCL -- 用 ESDF/凸包/走廊
OMPL 采样规划 不用 OMPL -- 用 kinodynamic A*+轨迹优化

章间依赖 DAG

D0(仿真) ──→ D1(微分平坦/SE(3)) ──→ D2(MPC) ──→ D8(敏捷飞行)
                    |                     |               |
                    v                     v               v
               D3(Min-Snap) ──→ D4(B样条) ──→ D5(MINCO) ──→ D9(RL)
                                     |           |
                                     v           v
                                D6(环境表示) → D7(探索) → D10(集群) → D11(前沿)
                                                                          |
                                                                          v
                                                                     D12(综合实战)

Part 0: 仿真环境 (1 周)

D0 无人机仿真环境与资产管道 ⭐⭐ (1 周)

前置: v8 Ch36(CUDA), Ch31(ROS2), P02(sim-to-real) 核心主题: 四代仿真器演进 . CTBR/SRT/RPM 控制接口 . Agilicious 安全架构 . IsaacLab/OmniDrones PPO 管线 关键项目: gym-pybullet-drones, Aerial Gym, OmniDrones, Flightmare, FiGS 文件: 70_无人机/140_无人机仿真环境.md

Part 1: 动力学与控制 (4 周)

D1 微分平坦与 SE(3) 几何控制 ⭐⭐⭐ (2 周)

前置: Eigen(Ch11), SO(3)/SE(3)(Ch23) 核心主题: 微分平坦性 sigma=(x,y,z,psi) . 平坦映射全链 . Lee-Leok-McClamroch SE(3) 控制 . Bhat-Bernstein 拓扑障碍 . PX4 级联 PID vs 几何控制 关键论文: Lee 2010 (CDC, ~3800 引), Mellinger 2011 (ICRA Best Paper, ~4500 引) 文件: 70_无人机/20_微分平坦与几何控制.md

D2 MPC 与自适应控制 ⭐⭐⭐ (2 周) 🏭🔬

前置: D1, 非线性优化(Ch17-18) 核心主题: 四旋翼 MPC 标准问题结构 . SQP-RTI . acados+HPIPM . L1 自适应叠加 . GP-MPC . Neural-MPC . IPC 统一规控 关键论文: Hanover 2022 L1-NMPC, Torrente 2021 GP-MPC, O'Connell 2022 Neural-Fly 文件: 70_无人机/30_MPC与自适应控制.md

Part 2: 轨迹生成与优化 (5 周)

D3 多项式轨迹生成 ⭐⭐⭐ (1 周)

核心主题: Min-Snap QP . Richter 端点导数参数化 . Bernstein 基凸包 . mav_trajectory_generation 关键论文: Mellinger 2011, Richter 2016 (IJRR) 文件: 70_无人机/40_多项式轨迹生成.md

D4 B 样条轨迹优化 ⭐⭐⭐ (1.5 周)

核心主题: 均匀 B 样条五大性质 . Fast-Planner/EGO-Planner 管线 . LBFGS-Lite 关键论文: Zhou 2019 Fast-Planner, Zhou 2021 EGO-Planner 文件: 70_无人机/50_B样条轨迹优化.md

D5 MINCO 轨迹表示与安全走廊 ⭐⭐⭐ (2 周) 🏭🔬

核心主题: MINCO 数学本质 . GCOPTER header-only . SFC 三代演进 . SUPER 双轨迹 . ROG-Map 关键论文: Wang 2022 GCOPTER/MINCO (TRO), Ren 2025 SUPER (Science Robotics) 文件: 70_无人机/60_MINCO轨迹表示与安全走廊.md

Part 3: 环境感知与探索 (4 周)

D6 环境表示 ⭐⭐ (2 周)

核心主题: 六种表示(八叉树/体素哈希/环形缓冲/栅格/kd树/高斯椭球) . ESDF 梯度 . 3DGS 碰撞原语 . nvblox GPU 177x 关键项目: voxblox, ikd-Tree, nvblox, ROG-Map, OctoMap 文件: 70_无人机/70_无人机环境表示.md

D7 感知引导规划与自主探索 ⭐⭐⭐ (2 周)

核心主题: 探索三代(NBV -> TSP/ATSP -> 覆盖引导) . FUEL/TARE/RACER/FALCON . yaw 一等决策变量 关键论文: Zhou 2021 FUEL, Cao 2021 TARE (RSS Best Paper), Zhou 2023 RACER (TRO Best Paper) 文件: 70_无人机/80_感知引导规划与自主探索.md

Part 4: 敏捷飞行与 RL (4 周)

D8 敏捷飞行平台与集成规控 ⭐⭐⭐ (2 周) 🏭

核心主题: Agilicious 全栈 . CPC/IPC/MPCC/DFBC 四范式 . Actor-Critic MPC 关键论文: Foehn 2021 CPC (Science Robotics), Romero 2025 Actor-Critic MPC 文件: 70_无人机/90_敏捷飞行平台与集成规控.md

D9 RL 敏捷飞行与 sim-to-real ⭐⭐⭐ (2 周) 🔬

核心主题: Swift 完整管线 . SimpleFlight 五因子 . RLtools C++17 头文件 RL . RAPTOR 2084 参数跨形态 关键论文: Kaufmann 2023 Swift (Nature), Song 2023 RL 超越 MPC (Science Robotics) 文件: 70_无人机/100_RL敏捷飞行与sim-to-real.md

Part 5: 集群与前沿 (3 周)

D10 集群协同规划 ⭐⭐ (1.5 周)

核心主题: ZJU 路线(软惩罚: EGO-Swarm) vs MIT 路线(硬约束: MADER/RMADER) . Primitive-Swarm 1000 机 . 多机任务分配 关键论文: Zhou 2021 EGO-Swarm, Tordesillas 2022 MADER, Hou 2025 1000 机 文件: 70_无人机/110_集群协同规划.md

D11 前沿方向 ⭐⭐ (1.5 周) 🔬

核心主题: 五大前沿 -- (A) VLM/LLM 任务层 . (B) 3DGS 规划 . (C) 非标构型 . (D) 安全与形式验证 . (E) 端到端视觉 RL 关键论文: DroneSplat CVPR 2025, DroneVLA 2025, Dream to Fly ICRA 2026 文件: 70_无人机/120_前沿方向.md

Part 6: 综合实战 (2 周)

D12 Mini-Drone 综合实战 ⭐⭐⭐ (2 周) 🏭

核心主题: 端到端系统集成 . 三级验收: Bronze(悬停)/Silver(单房间 >70%)/Gold(多房间 >85%+返航) 文件: 70_无人机/130_综合实战.md

附录 (6 篇)

附录 覆盖 文件
附录 A: 轨迹生成深度叙述 D3-D5 十年演进 附录A_轨迹生成深度叙述.md
附录 B: 感知规划一体深度叙述 D6-D7 演进 附录B_感知规划一体深度叙述.md
附录 C: MPC 与几何控制深度叙述 D1-D2 演进 附录C_MPC与几何控制深度叙述.md
附录 D: RL 敏捷飞行深度叙述 D8-D9 演进 附录D_RL敏捷飞行深度叙述.md
附录: 教学大纲配套 周次/依赖/速成 附录_教学大纲配套.md
附录: 项目全景调研 85+ 项目 附录_项目全景调研.md

无人机里程碑验收汇总

Part 周次 核心验收标准
Part 0 W49 gym-pybullet-drones 悬停 + OmniDrones PPO 训练
Part 1 W50-53 手推平坦映射全链; SE(3) 仿真跟踪; acados MPC 100Hz
Part 2 W54-58 Min-Snap QP 推导; GCOPTER 走廊修改
Part 3 W59-62 环境表示选型; FUEL/TARE 代码追踪
Part 4 W63-66 四种敏捷范式; CTBR 门穿越训练
Part 5 W67-69 ZJU vs MIT 路线权衡; 五大前沿雷达
Part 6 W70-71 端到端系统; Bronze/Silver/Gold 交付

Part-S: 综述 (~3 周)

线路定位: 贯穿连接线,将横切方法论与应用实例缝合为统一知识体系 文件目录: 80_综述/ 文件清单: 5 个 .md 文件


S1 | 总览与时空联合规划 (0.5 周)

覆盖: T 线全貌 + D3-D5 轨迹优化连接 定位: 从时空规划发展脉络理解方法演进逻辑 文件: 80_综述/10_总览与时空联合规划.md

S2 | 不确定性规划 (0.5 周)

覆盖: U 线 + 五条子路线(鲁棒/机会/POMDP/CVaR/分布鲁棒) 定位: 五种不确定性处理范式的 C++ 教学可操作性评估 文件: 80_综述/20_不确定性规划.md

S3 | 博弈规划 (0.5 周)

覆盖: G 线 + HJI/iLQGames/逆博弈 定位: C++ 抓手仅 ilqgames + hj_reachability,ALGAMES 等已迁 Julia 文件: 80_综述/30_博弈规划.md

S4 | 交互意图预测 (0.5 周)

覆盖: G3 逆博弈 + 自动驾驶行为预测 定位: 预测-规划一体化的 C++ 锚点(Apollo prediction) 文件: 80_综述/40_交互意图预测.md

S5 | RL 与经典规控贯穿关系 (1 周)

覆盖: 全线贯穿视角 -- POMDP/Safe RL/MCTS/MARL/Diffusion/TD-MPC/VLA 核心判断: 2023-2026 "规划层 RL + 经典融合"成熟方向 = Diffusion Planner + TD-MPC2 + 可微 MPC + VLA 定位: 教学收官视角,将四个经典范式映射到四类 RL 连接 文件: 80_综述/50_RL与经典规控贯穿关系与结论.md


交叉引用地图

04_移动机器人规控 内部交叉

三线交叉节点速查表 (T/U/G)

交叉点 T 线章节 U 线章节 G 线章节 说明
安全约束优化 T3(OBCA) U2(CBF/Tube MPC) G4(安全证书) 约束形式化互通
多智能体协调 T5(CBS/ORCA) U4(多机 POMDP) G2-G4(博弈) 协作到竞争的完整谱系
学习型方法 T6(扩散规划) U5(Distributional RL) G4(MARL) 数据驱动+模型融合
工业部署 T4(Apollo) U1(MPDM) G3(行为预测) 自动驾驶全栈

MPPI/Multi/TAMP 三线交叉

上游 下游 依赖内容
MPPI_01-02 Multi_04 分布式 MPC 可选 MPPI 作为 local solver
MPPI_07 Multi_08 腿足全身 MPPI -> 多足协同 loco-manipulation
Multi_10-12 MPPI_06 TD-MPC 的 MARL 对比视角
Multi_04-05 TAMP_T1 多机协同搬运 -> TAMP 长时域需求
MPPI_05 TAMP_T1 Learning-based TAMP 中扩散采样

横切方法论与无人机应用交叉

横切方法 无人机章节 交叉内容
T: 时空联合规划 D3-D5 轨迹优化 走廊生成、MINCO 时间参数化
U: 不确定性规划 D7 感知引导 感知不确定性 -> 鲁棒重规划
G: 博弈规划 D10 集群对抗 非合作多机 -> 博弈论框架
MPPI: 采样 MPC D2 MPC 基础 梯度式 vs 采样式互补
Multi: 多机协作 D10 集群协同 EGO-Swarm/MADER 分布式规划
TAMP: 任务运动 D11 前沿(VLM) VLM 任务层 -> 连续控制

04_移动机器人规控 与其他方向交叉

与 03_SLAM

04 规控章节 03 SLAM 章节 交叉内容
D6 环境表示 占据栅格/ESDF/体素 SLAM 建图输出即规划输入
D7 感知引导 视觉 SLAM 前端 主动感知: 规划驱动相机视角
U0-U2 不确定性 EKF/UKF 滤波 定位不确定性传播到规划层
D11 前沿 NeRF/3DGS 隐式表示同时服务 SLAM 与规划

典型闭环流程:

SLAM定位+建图 → 生成ESDF/走廊 → 轨迹优化(D3-D5/T专题) → 控制执行(D2/MPPI)
     ^                                                              |
     └──────────────── 里程计反馈 ←──────────────────────────────────┘

与 05_运动控制

04 规控方法 05 运动控制应用 说明
MPPI (采样 MPC) 足式实时步态规划 采样并行化适合高频控制
MPC (D2/MPPI) 全身运动控制 WBC MPC+WBC 是足式主流架构
Multi (多机协作) 多足协调、双臂协调 分布式优化通用
TAMP (任务运动) 具身智能任务规划层 符号到连续接口
G (博弈规划) 人机交互意图推理 逆博弈推断人类意图

与 06_具身智能

04 规控方法 06 具身智能应用 说明
TAMP (任务运动) SayCan/VoxPoser Foundation Model + TAMP
T6 扩散规划 Diffusion Policy 条件生成式操作
MPPI_06 TD-MPC VLA 中的规划模块 世界模型 + MPPI latent 规划
D11 VLM 无人机 DroneVLA VLA -> 无人机操纵

学习路径建议

按目标角色的推荐顺序

路径 A -- 自动驾驶方向: T0 -> T1 -> T2 -> T3 -> T4 -> U0 -> U1 -> U2 -> G0 -> G2 -> G3 -> S1 -> S4

路径 B -- 无人机全栈方向: D0 -> D1 -> D2 -> D3 -> D4 -> D5 -> D6 -> D7 -> D8 -> D9 -> D12 -> MPPI_01 -> MPPI_02

路径 C -- 多机器人方向: Multi_01 -> Multi_02 -> Multi_03 -> Multi_04 -> Multi_10 -> Multi_12 -> Multi_13 -> D10 -> G4

路径 D -- 理论研究方向: T0 -> T1 -> T3 -> U0 -> U2 -> U3 -> U4 -> U5 -> G0 -> G1 -> G3 -> MPPI_01 -> MPPI_05 -> S5

路径 E -- MPPI 专精方向 (8 周): MPPI_01 -> MPPI_02 -> MPPI_03 -> MPPI_05 -> MPPI_07 -> MPPI_10

并行推进建议

三大横切线(T/U/G)可并行推进,但建议 T 线先行至 T3 后再启动 U/G 线,以建立足够的优化基础。MPPI 线与 Multi 线相对独立,可任意顺序。TAMP 建议在至少完成一条横切线后学习。综述(S 线)建议在对应横切线完成后阅读,作为复习与贯穿。


文件索引

10_时空规划 (8 文件)

编号 文件名 对应章节
10 10_时空联合规划总论.md T0 1
20 20_Frenet坐标系与ST图.md T1 2
30 30_时空走廊与搜索.md T2 2
40 40_时空轨迹优化.md T3 3
50 50_Apollo_Autoware框架.md T4 3
60 60_多智能体时空协调.md T5 3
70 70_端到端与扩散式规划.md T6 1.5
80 80_综合对比与附录.md T 附录 0.5

20_采样式MPC (12 文件)

编号 文件名 对应章节
10 10_采样式MPC总论.md MPPI_00 -
20 20_路径积分控制理论.md MPPI_01 2
30 30_MPPI核心算法与GPU.md MPPI_02 2
40 40_MPPI六大变体.md MPPI_03 2
50 50_CEM家族与统一视角.md MPPI_04 1.5
60 60_扩散启发采样MPC.md MPPI_05 2
70 70_学习世界模型TD-MPC.md MPPI_06 2
80 80_腿足全身MPPI.md MPPI_07 2
90 90_导航自驾无人机采样.md MPPI_08 1.5
100 100_MPPI与梯度式对比.md MPPI_09 1
110 110_Mini-MPPI实战.md MPPI_10 2
120 120_附录.md MPPI 附录 -

30_不确定性规划 (7 文件)

编号 文件名 对应章节
10 10_不确定性规划总论.md U0 1
20 20_分支场景规划.md U1 2
30 30_鲁棒规划与安全滤波.md U2 2.5
40 40_机会约束规划.md U3 2
50 50_POMDP与Belief规划.md U4 2.5
60 60_风险敏感规划CVaR.md U5 1.5
70 70_综合对比与附录.md U 附录 0.5

40_博弈规划 (6 文件)

编号 文件名 对应章节
10 10_博弈规划总论.md G0 1
20 20_微分博弈与HJI.md G1 2
30 30_实时博弈求解器.md G2 2.5
40 40_逆博弈与预测规划.md G3 2
50 50_安全证书与MARL.md G4 2
60 60_综合对比与附录.md G 附录 0.5

50_多机器人协作 (16 文件)

编号 文件名 对应章节
10 10_多机器人协作总论.md Multi_00 -
20 20_多机系统全景.md Multi_01 1
30 30_共识算法与分布式优化.md Multi_02 1.5
40 40_任务分配与路径规划.md Multi_03 1.5
50 50_分布式MPC多足编队.md Multi_04 2
60 60_协同搬运与力控.md Multi_05 2
70 70_异构多机协同.md Multi_06 1
80 80_双臂多臂协同操作.md Multi_07 2
90 90_多足协同Loco-Manipulation.md Multi_08 1.5
100 100_人形四足臂协同控制.md Multi_09 1.5
110 110_MARL基础.md Multi_10 2
120 120_MARL多机运动协调.md Multi_11 1.5
130 130_MARL与传统规控混合.md Multi_12 2
140 140_Mini-MultiBot综合实战.md Multi_13 2
150 150_附录.md Multi 附录 -

60_任务运动规划 (1 文件)

编号 文件名 对应章节
10 10_任务与运动规划基础.md TAMP_T1 4

70_无人机 (14 章 + 6 附录)

编号 文件名 对应章节
10 10_导读与路线图.md 导读 -
20 20_微分平坦与几何控制.md D1 2
30 30_MPC与自适应控制.md D2 2
40 40_多项式轨迹生成.md D3 1
50 50_B样条轨迹优化.md D4 1.5
60 60_MINCO轨迹表示与安全走廊.md D5 2
70 70_无人机环境表示.md D6 2
80 80_感知引导规划与自主探索.md D7 2
90 90_敏捷飞行平台与集成规控.md D8 2
100 100_RL敏捷飞行与sim-to-real.md D9 2
110 110_集群协同规划.md D10 1.5
120 120_前沿方向.md D11 1.5
130 130_综合实战.md D12 2
140 140_无人机仿真环境.md D0 1
-- 附录A_轨迹生成深度叙述.md 附录 -
-- 附录B_感知规划一体深度叙述.md 附录 -
-- 附录C_MPC与几何控制深度叙述.md 附录 -
-- 附录D_RL敏捷飞行深度叙述.md 附录 -
-- 附录_教学大纲配套.md 附录 -
-- 附录_项目全景调研.md 附录 -

80_综述 (5 文件)

编号 文件名 对应章节
10 10_总览与时空联合规划.md S1 0.5
20 20_不确定性规划.md S2 0.5
30 30_博弈规划.md S3 0.5
40 40_交互意图预测.md S4 0.5
50 50_RL与经典规控贯穿关系与结论.md S5 1

统计总览

八大 Part 统计

Part 章节数 周数 理论密度峰 工程密度峰 前沿研究峰
T: 时空规划 8 16 T3(轨迹优化) T4(Apollo) T6(扩散)
MPPI: 采样MPC 12 18 MPPI_01(路径积分) MPPI_10(实战) MPPI_05(扩散)
U: 不确定性 8 12 U4(POMDP) U2(Tube/CBF) U5(CVaR)
G: 博弈 7 10 G1(HJI) G2(iLQGames) G3(逆博弈)
Multi: 多机 16 21.5 Multi_02(共识) Multi_04(分布MPC) Multi_12(混合)
TAMP 1 4 全渐进 PDDLStream LGP/VLM
D: 无人机 14+6附录 22 D5(MINCO) D8(Agilicious) D9(Swift)
S: 综述 5 3 S5(RL贯穿) -- S5(Diffusion)

关键求解器与工具链

专题 核心求解器 主要仿真平台
T: 时空 OSQP/IPOPT/CasADi Apollo Dreamview, CARLA
MPPI: 采样 MPPI-Generic (CUDA) MuJoCo, IsaacLab
U: 不确定 MOSEK/CVXPY/GPML Gazebo, Isaac Gym
G: 博弈 iLQGames/hj_reachability CARLA, Highway-env
Multi: 多机 MARLlib/HARL/OCS2 IsaacLab, MuJoCo
TAMP PDDLStream/rai MuJoCo, MoveIt2
D: 无人机 acados/GCOPTER/PX4 Gazebo, OmniDrones

跨线能力矩阵

完成多线学习后,学习者应具备以下复合能力:

复合能力 涉及章节 说明
安全自动驾驶全栈 T4 + U2 + G2 Apollo 架构 + CBF + 博弈交互
多机器人安全协调 T5 + U2 + G4 MAPF + 鲁棒约束 + 竞合博弈
不确定交互决策 T1 + U1 + G3 场景表示 + 分支决策 + 意图推断
学习型规划前沿 T6 + U5 + G4 + MPPI_05 扩散 + CVaR + MARL + 采样
无人机全栈端到端 D0-D12 + MPPI_08 仿真到实飞 + 采样 MPC
多机无人机集群 D10 + Multi_04-06 + T5 集群协同 + 分布 MPC + MAPF

前沿补充 (截至 2026-05-14)

以下为最近重要进展,与本大纲多个章节直接相关。

感知与表示前沿

工作 会议/年份 核心贡献 对应章节
DroneSplat CVPR 2025 无人机图像 3DGS 重建+规划 D6, D11
Splat-Nav TRO 2025 3DGS 椭球碰撞取代 ESDF D6
nvblox GPU NVIDIA 2025 GPU 加速 TSDF/ESDF 177x D6

基于大模型的无人机智能

工作 年份 核心贡献 对应章节
DroneVLA 2025 VLA 直接输出无人机控制 D11
CognitiveDrone 2025 VLM 认知导航 D11
AeroAgent 2025 LLM 任务规划器 D11, TAMP

规划方法论前沿

工作 会议/年份 核心贡献 对应章节
Diffusion-Planner ICLR 2025 扩散自动驾驶联合规划 T6, MPPI_05
DIAL-MPC ICRA 2025 扩散退火全身力矩 MPPI MPPI_05, MPPI_07
Stein Variational MPC 2025 SVGD 多模态轨迹 MPPI_05
Dream to Fly ICRA 2026 DreamerV3 纯想象敏捷飞行 D9

多智能体前沿

工作 年份 核心贡献 对应章节
MASH 2025 异构人形 MARL Multi_12, 05_运动控制
GCBF+ 2025 分布式 CBF 安全 MARL Multi_12, U2
MIGHTY 2025 百级异构集群规划 D10, T5

与机械臂方向对照

维度 移动机器人规控 (本大纲) 机械臂 (v1.2)
章数 76 章 (横切 52 + 无人机 20 + 综述 5) 37 章 (P/M/F/D)
周数 ~106.5 周 ~76 周
C++ 风格 header-only, 编译期固定维度, C++11/14 pluginlib 运行时多态, C++17/20
核心数学 微分平坦, MINCO, L-BFGS, 博弈均衡 空间向量代数, RNEA/ABA, QP/NLP
规划范式 工作空间连续轨迹优化(平坦+走廊) 配置空间采样(OMPL)+轨迹优化
控制范式 SE(3) 几何 / NMPC / RL CTBR ros2_control + JTC
实时约束 1-10ms 重规划 + 200-500Hz 控制 1kHz 伺服(PREEMPT_RT)
RL 成熟度 极高(Swift/Nature 2023) 中(RL->ros2_control 刚起步)
SLAM 重叠 极高(VIO/LiDAR 是感知核心) 中(共享 Eigen/ROS2)
代表项目 GCOPTER, Fast-Planner, Agilicious Pinocchio, MoveIt2, BT.CPP

版本历史

版本 日期 变更
v1.0 2026-05-04 初版:统一 75 个章节文件为总大纲,含横切 6 条线+无人机 13 章
v2.0 2026-05-14 重写:增加角色快速路径(自驾/无人机/多机)、计算与硬件需求表、工业 vs 研究标记系统化、方法-应用双导航路线图、前置知识依赖矩阵细化、生态速览扩展(MPPI/扩散/MARL/PX4/自驾)、Per-Part 全 8 子方向详细大纲、综述层(Part-S)独立列出、交叉引用地图(内部+跨方向+跨模块)、统计总览与能力矩阵、前沿补充(2026-05-14)、文件索引完整化