本文档属于 Robotics Tutorial 项目，作者：Pengfei Guo，达妙科技。采用 CC BY 4.0 协议，转载请注明出处。

移动机器人规控方向综合教学大纲¶

版本: v2.0 | 日期: 2026-05-14

定位: 面向完成 SLAM 主线 v8（Ch1-46, 48周）的工程师，系统掌握移动机器人规划控制的**方法论工具箱**与**应用实例**。

数据基础: 76 个章节文件, 约 17,000 行教学内容; 横切 6 大方法论专题（10-60）+ 无人机 16 章应用实例（70）+ 5 篇综述（80），基于 100+ 开源项目源码级分析与 200+ 篇顶会/顶刊论文脉络。课程主线按 2026-05 前后版本锁定 acados v0.4+ / PX4 v1.15+ / ROS 2 Kilted，具体 API 与版本特性以各项目当前官方文档和 release notes 为准。

总投入: 横切专题 6 条线 ~81.5 周（T16 + U12 + G10 + MPPI18 + Multi21.5 + TAMP4）+ 无人机 16 章 ~22 周 + 综述 5 篇 ~3 周 = 合计 ~106.5 周；可按专题独立选修。

架构思想: 横切专题（10-60）= 通用方法论工具箱，无人机（70）= 完整应用实例，综述（80）= 贯穿连接线。学方法时跳入无人机看实际效果；学无人机应用时回溯横切专题理解底层原理。

本大纲不覆盖的内容¶

底层电机/传感器驱动 -- 见 05_运动控制/ M11-M12
SLAM/感知 -- 见 03_SLAM/
机械臂/足式/人形控制 -- 见 05_运动控制/ 各子方向
具身智能/VLA -- 见 06_具身智能/
数学基础（优化/李群） -- 见 01_数学/

目录¶

角色快速路径
计算与硬件需求表
工业 vs 研究标记
总览路线图（方法-应用双导航）
前置知识依赖矩阵
生态速览 (2026-05)
Part-T: 时空联合规划
Part-U: 不确定性规划
Part-G: 博弈规划
Part-MPPI: 采样式 MPC
Part-Multi: 多机器人协作
Part-TAMP: 任务与运动规划
Part-D: 无人机
Part-S: 综述
交叉引用地图
学习路径建议
文件索引
版本历史

角色快速路径¶

本大纲体量庞大（~106.5 周），但并非所有章节都需线性通关。以下三条角色路径各聚焦一项核心职业能力，适合希望在 2-4 个月内建立可运行系统的工程师。完成快速路径后，再按兴趣回填横切专题。

路径一：自动驾驶规划工程师 (14 周)¶

从时空联合规划出发，经 Apollo/Autoware 工业架构，到不确定性处理与博弈交互，建立自动驾驶规划全栈能力。

T0(总论,1周) → T1(Frenet/ST,2周) → T2(走廊,2周) → T3(轨迹优化,3周)
  → T4(Apollo/Autoware,3周) → U0(不确定总论,1周) → U1(分支场景,2周)
  总计 ~14 周

周次	章节	核心能力	产出
1	T0 总论	时空规划全貌与方法谱系	文献地图与学习路线
2-3	T1 Frenet/ST 图	Frenet 变换、ST 搜索、DP+QP	Frenet 变换库 + ST 搜索器
4-5	T2 走廊构建	SFC/IRIS 生成、动态障碍建模	时空走廊生成器
6-8	T3 轨迹优化	CILQR/TEB/OBCA/MINCO	MINCO 优化器
9-11	T4 Apollo/Autoware	EM Planner/Lattice 源码精读	规划模块部署调参报告
12	U0 不确定性总论	不确定性分类与建模	失效场景蒙特卡洛分析
13-14	U1 分支场景	MPDM 场景决策	分支 NMPC 变道规划器

前置要求: SLAM v8 Ch24（优化基础）、ROS2 基础、凸优化入门。 退出能力: 能独立读懂 Apollo/Autoware 规划模块源码，设计时空联合轨迹优化器，处理动态障碍场景。 后续扩展: G2(博弈交互) -> G3(意图推断) -> MPPI_08(自驾采样MPC) -> S1-S4(综述回顾)。

路径二：无人机全栈工程师 (12 周)¶

从仿真环境搭建出发，经微分平坦建模、轨迹优化、感知引导，一路推进到综合实战。跳过偏理论章节（D6 环境表示细节、D10 集群），聚焦单机从仿真到实飞的完整链路。

D0(仿真,1周) → D1(微分平坦,2周) → D3(多项式,1周) → D5(MINCO,2周)
  → D7(感知引导,2周) → D9(RL飞控,2周) → D12(综合实战,2周)
  总计 ~12 周

周次	章节	核心能力	产出
1	D0 仿真环境	Gazebo/PX4 SITL/OmniDrones	仿真悬停 + PPO 训练管线
2-3	D1 微分平坦	四旋翼建模、平坦映射、SE(3) 控制	SE(3) 控制器仿真跟踪
4	D3 多项式轨迹	Min-Snap QP、时间分配	可飞行走廊轨迹
5-6	D5 MINCO	MINCO 参数化、梯度优化、SFC	GCOPTER 走廊约束轨迹
7-8	D7 感知引导	ESDF/感知约束在线重规划	FUEL 自主探索演示
9-10	D9 RL 飞控	PPO/SAC + CTBR + sim-to-real	RL 策略门穿越
11-12	D12 综合实战	端到端集成	仿真或实机完整演示

前置要求: SLAM v8（相机模型与点云处理）、ROS2 基础、Eigen。 退出能力: 能独立完成单架无人机从仿真到实飞的规划控制全链路。 后续扩展: D2(MPC) -> D8(敏捷飞行) -> D10(集群) -> MPPI(采样MPC深化)。

路径三：多机器人协作研究员 (10 周)¶

聚焦分布式协调与 MARL 协作规控，从共识理论到多机系统实战。

Multi_01(全景,1周) → Multi_02(共识/ADMM,1.5周) → Multi_03(MAPF,1.5周)
  → Multi_04(分布式MPC,2周) → Multi_10(MARL,2周) → Multi_13(实战,2周)
  总计 ~10 周

周次	章节	核心能力	产出
1	Multi_01 全景	多机架构分类、通信拓扑	架构决策树
2-3	Multi_02 共识/ADMM	线性共识、ADMM 分布式优化	10-agent 共识仿真
3.5-4.5	Multi_03 MAPF	CBS/LaCAM、任务分配	CBS 仓库 MAPF
5-6	Multi_04 分布式 MPC	ADMM 多足编队、WBC	双 Go2 编队行走
7-8	Multi_10 MARL 基础	CTDE/MAPPO/QMIX	MAPPO 多机导航
9-10	Multi_13 综合实战	端到端多机系统	Mini-MultiBot 交付

前置要求: OCS2/Crocoddyl 单体 MPC、PPO/SAC、ROS2 多节点。 退出能力: 能设计分布式 MPC + MARL 混合的多机协同系统。 后续扩展: Multi_05-09(协同操作) -> G4(博弈MARL) -> D10(无人机集群)。

计算与硬件需求表¶

不同章节对计算资源的需求差异显著。下表帮助学习者提前规划硬件采购与云资源预算。

横切专题资源需求¶

章节范围	CPU	GPU	真机	备注
T0-T3 (时空基础)	足够	不需要	不需要	优化规模小，笔记本即可
T4 (Apollo/Autoware)	多核推荐	不需要	不需要	可选 Autoware 仿真（16GB+ RAM）
T5 (多智能体时空)	多核推荐	不需要	不需要	CBS/LaCAM 对 CPU 敏感
T6 (扩散规划)	多核	需要 (RTX 3060+)	不需要	扩散模型训练需显存
U0-U3 (不确定性基础)	足够	U3 可选 GPU	不需要	粒子滤波对单核敏感
U4 (POMDP)	多核推荐	可选 GPU	不需要	POMCP 树搜索计算密集
U5 (CVaR)	足够	可选 GPU	不需要	数值实验规模不大
G0-G2 (博弈基础)	多核推荐	不需要	不需要	Nash 均衡求解计算密集
G3 (逆博弈)	多核	可选 GPU	不需要	在线参数辨识可选 GPU 加速
G4 (安全/MARL)	多核	推荐 GPU	不需要	MARL 训练受益于 GPU
MPPI_01-02 (核心理论)	足够	MPPI_02 起强烈推荐	不需要	CUDA 并行是核心内容
MPPI_03-04 (变体)	多核	推荐 (RTX 3060+)	不需要	对比 benchmark 需 GPU
MPPI_05-06 (前沿融合)	多核	必需 (RTX 3060+)	不需要	扩散/世界模型训练需显存
MPPI_07-08 (领域应用)	多核	推荐 GPU	MPPI_08 可选	MuJoCo GPU rollout
MPPI_09-10 (对比+实战)	多核	必需 (RTX 3060+)	MPPI_10 推荐	Mini-MPPI 完整工程
Multi_01-03 (多机基础)	多核推荐	不需要	不需要	多智能体仿真吃 CPU
Multi_04-06 (协同控制)	多核	可选 GPU	不需要	IsaacLab 仿真推荐 GPU
Multi_07-09 (协同操作)	多核	推荐 GPU	不需要	闭链动力学计算密集
Multi_10-12 (MARL)	多核	必需 (RTX 3060+)	不需要	MARL 训练需 GPU
Multi_13 (综合实战)	多核	必需	不需要	推荐多机仿真集群
TAMP_T1 (任务运动)	足够	不需要	不需要	符号推理为主

无人机章节资源需求¶

章节	CPU	GPU	真机	备注
D0 仿真环境	足够	不需要	不需要	PX4 SITL + Gazebo
D1 微分平坦	足够	不需要	不需要	刚体力学推导为主
D2 MPC 控制	足够	不需要	不需要	acados 数值计算
D3-D5 轨迹优化	足够	不需要	不需要	数值优化为主
D6-D7 环境感知	多核推荐	可选（加速 ESDF）	不需要	点云处理有一定计算量
D8 敏捷飞行	多核	可选	PX4 推荐	实机效果显著优于仿真
D9 RL 飞控	多核	必需 (RTX 3060+)	不需要	PPO/SAC 训练需 GPU
D10 集群	多核	MARL 训练需 GPU	不需要	多机仿真资源需求高
D11 前沿	视内容	视内容	不需要	跟踪最新论文
D12 综合实战	多核	推荐	强烈推荐 PX4 真机	端到端项目

工业 vs 研究标记¶

每个章节按内容侧重标记为工业导向、研究导向或两者兼具，帮助不同目标的学习者快速筛选。

工业导向章节 (🏭)¶

以工程落地和系统集成为核心，代码可直接复用于产品级系统。

章节	关键词	目标岗位
T4 Apollo/Autoware 架构	EM-Planner, Autoware.Universe, 量产方案	自动驾驶规划工程师
MPPI_10 Mini-MPPI 实战	ROS2 节点封装, 延迟补偿, 实车测试	控制算法工程师
Multi_04 分布式 MPC 编队	ADMM, 多足编队, WBC	多机系统工程师
D0 仿真环境搭建	Gazebo, PX4 SITL, OmniDrones	无人机系统工程师
D8 敏捷飞行集成	PX4 offboard, uXRCE-DDS	飞控工程师
D12 综合实战	全链路集成, 飞行日志分析	无人机全栈工程师

研究导向章节 (🔬)¶

聚焦前沿方法论与开放问题，适合追求论文发表或方法创新的学习者。

章节	关键词	研究方向
T6 扩散式时空规划	Diffusion Policy, 条件生成	生成式规划
U4 POMDP/Belief 空间	部分可观测, 在线决策	信息论规划
U5 CVaR 风险规划	条件风险值, DRO	风险敏感控制
G3 逆博弈/Level-k	意图推断, 有界理性	预测-规划一体
G4 安全证书/MARL	GCBF+, Stackelberg	安全多智能体
MPPI_05 扩散增强 MPC	MBD, DIAL-MPC	采样-扩散融合
MPPI_06 TD-MPC	世界模型, latent 规划	模型基 RL
Multi_12 MARL+规控混合	残差策略, Safe MARL	学习型协调
D9 RL 敏捷飞控	sim-to-real, 策略蒸馏	端到端飞行
D11 前沿追踪	3DGS 导航, VLM 无人机	新兴交叉

工业-研究兼具章节 (🏭🔬)¶

方法本身已有工业应用但仍在快速演进，论文与产品并重。

章节	关键词	应用场景
T3 时空轨迹优化	CILQR/TEB/OBCA/MINCO	动态环境规划
U2 鲁棒规划/CBF 安全滤波	Tube MPC, CBF-QP	安全关键系统
G2 实时博弈求解	iLQGames, ALGAMES	多车交互
MPPI_07 腿足全身 MPPI	全身力矩, MuJoCo GPU	足式敏捷控制
MPPI_08 导航/自驾采样 MPC	Nav2 MPPI, AutoRally	ROS2 导航
Multi_08 多足协同 Loco-Manipulation	相位耦合, 协同 WBC	多足搬运
D2 MPC 控制	acados NMPC, L1 自适应	从仿真到实机
D5 MINCO/安全走廊	GCOPTER, FIRI, SUPER	高速安全飞行

总览路线图¶

方法论层与应用层的双导航架构¶

本大纲的核心设计：横切专题（10-60）提供通用方法论工具箱，无人机（70）提供完整应用实例，综述（80）提供连接线。三层之间存在大量交叉引用。

┌─────────────────────────────────────────────────────────────────────────────┐
│                    横切方法论层（通用工具箱，~81.5 周）                       │
│                                                                             │
│  10_时空规划 (T0-T6+附录, 8章, 16周)                                        │
│  ├── T0 总论 → T1 Frenet/ST → T2 走廊 → T3 轨迹优化                        │
│  ├── T4 Apollo/Autoware 🏭 → T5 多智能体 → T6 扩散规划 🔬                   │
│  └── ←→ 无人机 D3-D5 轨迹优化 / D2 MPC                                     │
│                                                                             │
│  20_采样式MPC (MPPI Ch1-10+附录, 12章, 18周)                                │
│  ├── MPPI_01 路径积分 → MPPI_02 CUDA → MPPI_03 六大变体 → MPPI_04 CEM      │
│  ├── MPPI_05 扩散MPC 🔬 → MPPI_06 TD-MPC → MPPI_07 腿足 → MPPI_08 导航    │
│  ├── MPPI_09 选型决策 → MPPI_10 Mini-MPPI 🏭                                │
│  └── ←→ 无人机 D2 MPC / 足式 05_运动控制                                    │
│                                                                             │
│  30_不确定性 (U0-U5+附录, 8章, 12周)                                        │
│  ├── U0 总论 → U1 分支场景 → U2 鲁棒/CBF 🏭🔬 → U3 机会约束                │
│  ├── U4 POMDP 🔬 → U5 CVaR 🔬                                              │
│  └── ←→ 无人机 D7 感知引导 / Safe RL                                        │
│                                                                             │
│  40_博弈规划 (G0-G4+附录, 7章, 10周)                                        │
│  ├── G0 总论 → G1 HJI → G2 实时博弈 🏭🔬 → G3 逆博弈 🔬 → G4 安全/MARL 🔬 │
│  └── ←→ 无人机 D10 集群对抗 / 自动驾驶交互                                  │
│                                                                             │
│  50_多机器人 (Multi Ch1-13+附录, 16章, 21.5周)                              │
│  ├── Multi_01 全景 → Multi_02 共识 → Multi_03 MAPF → Multi_04 分布MPC 🏭🔬 │
│  ├── Multi_05 协同搬运 → Multi_06 异构 → Multi_07 双臂 → Multi_08 多足 🏭🔬│
│  ├── Multi_09 人形协同 → Multi_10 MARL → Multi_11 协调 → Multi_12 混合 🔬   │
│  ├── Multi_13 Mini-MultiBot 🏭                                              │
│  └── ←→ 无人机 D10 集群 / 05_运动控制 双臂+足式                             │
│                                                                             │
│  60_TAMP (1章, 4周)                                                         │
│  ├── TAMP_T1 符号+连续规划接口                                              │
│  └── ←→ 06_具身智能 SayCan/VoxPoser                                         │
│                                                                             │
└─────────────────────────────────────────────────────────────────────────────┘
                                    │
                                    ▼
┌─────────────────────────────────────────────────────────────────────────────┐
│                    无人机应用层（完整实例，~22 周）                           │
│                                                                             │
│  Part 0: 仿真       D0 (1周) ─── PX4 SITL + Gazebo + IsaacLab              │
│  Part 1: 动力学     D1 (2周) + D2 (2周) ─── 微分平坦 + MPC                  │
│  Part 2: 轨迹       D3 (1周) + D4 (1.5周) + D5 (2周) ─── Min-Snap→MINCO    │
│  Part 3: 感知       D6 (2周) + D7 (2周) ─── 环境表示 + 自主探索             │
│  Part 4: 敏捷       D8 (2周) + D9 (2周) ─── 敏捷飞行 + RL                   │
│  Part 5: 集群       D10 (1.5周) + D11 (1.5周) ─── 协同 + 前沿              │
│  Part 6: 实战       D12 (2周) ─── 端到端综合项目                            │
│  附录 (6篇)         轨迹深度/感知深度/MPC深度/RL深度/配套/调研               │
│                                                                             │
└─────────────────────────────────────────────────────────────────────────────┘
                                    │
                                    ▼
┌─────────────────────────────────────────────────────────────────────────────┐
│                    综述连接层（贯穿线，~3 周）                               │
│                                                                             │
│  S1 总览与时空联合   ─── 连接 T线 + D3-D5                                   │
│  S2 不确定性规划     ─── 连接 U线 + D7                                      │
│  S3 博弈规划         ─── 连接 G线 + D10                                     │
│  S4 交互意图预测     ─── 连接 G3 + 自动驾驶                                 │
│  S5 RL与经典规控     ─── 全线贯穿视角                                       │
│                                                                             │
└─────────────────────────────────────────────────────────────────────────────┘

横切专题之间的依赖关系¶

                         T (时空联合)
                        /     |      \
                       v      v       v
                   T5(多智能体)  TAMP    T6(扩散)
                       |                  |
                       v                  v
MPPI (采样式MPC) ─→ Multi (多机) ←──── G (博弈)
  │                    |
  ├──→ U (不确定性)    |
  ├──→ G (博弈)        v
  └──→ Multi         综述(80)

核心路径：
  MPPI → U: MPPI 天然处理随机性，U 专题深化理论
  MPPI → G: 多智能体 MPPI → 博弈 MPPI
  MPPI → Multi: 多智能体 MPPI → 分布式采样
  T → TAMP: 连续轨迹优化嵌入符号任务规划
  Multi → G: 非合作多机 → 博弈论框架

前置知识依赖矩阵¶

本大纲假设学习者已完成 SLAM v8 主线课程。下表列出各专题对 v8 具体章节的依赖，以及额外需要的数学与编程基础。

横切专题前置依赖¶

横切专题	SLAM v8 前置	额外数学基础	额外编程基础	最低可启动
T: 时空规划	点云处理、占据栅格	凸优化(对偶)、多项式插值	C++ 数值优化库(Eigen, OSQP)	Ch11+Ch24
U: 不确定性	贝叶斯滤波、EKF/UKF	随机过程、CVaR 风险度量	Python 概率编程	Ch11+Ch18+Ch20
G: 博弈规划	多目标跟踪(MOT)基础	博弈论(Nash 均衡)、微分博弈	自动微分(JAX/Julia)	Ch24+Ch22
MPPI: 采样MPC	无直接依赖	最优控制(LQR/iLQR)、信息论	CUDA C++、PyTorch	Ch11
Multi: 多机	分布式 SLAM(如有)	图论、共识算法、ADMM	ROS2 多节点、DDS	Ch31+Ch19
TAMP: 任务运动	语义 SLAM(如有)	符号 AI(PDDL)、混合系统	PDDL 求解器接口	Ch6+Ch31

无人机章节前置依赖¶

无人机章节	SLAM v8 前置	横切专题前置	备注
D0 仿真环境	ROS2 基础通信	无	独立入口
D1 微分平坦	Eigen(Ch11)、SO(3)/SE(3)(Ch23)	无	需刚体动力学基础
D2 MPC	非线性优化(Ch17-18)	MPPI_01(推荐)	与 MPPI 互补
D3 多项式轨迹	Eigen(Ch11)	T0-T1(推荐)	走廊概念来自 T 专题
D4 B 样条	无直接依赖	D3(必须)	B 样条是 D3 延伸
D5 MINCO	Eigen(Ch11)	D3+D4(必须)	MINCO 统一前两者
D6 环境表示	占据栅格、ESDF、点云	无	直接复用 SLAM 知识
D7 感知引导	视觉 SLAM、点云	D6(必须), U0(推荐)	感知不确定性连 U 专题
D8 敏捷飞行	无直接依赖	D1+D5(必须)	高速场景轨迹跟踪
D9 RL 飞控	无直接依赖	D1(必须)	需 RL 基础(PPO/SAC)
D10 集群	分布式系统概念	Multi_01-03(推荐)	连接 Multi 专题
D11 前沿	NeRF/3DGS(如有)	视具体论文	跟踪最新进展
D12 综合实战	全部相关章节	D0-D8(必须)	集成性项目

v8 前置三层口径¶

最低可启动: Ch11(Eigen)、Ch17-18(优化)、Ch24(轨迹)。可支撑任一角色快速路径启动。
推荐补齐: Ch11、Ch14、Ch17-20、Ch23(李群)、Ch24、Ch31(ROS2)。适合完整学习任一 Part。
完整前置: 完成 v8 Ch1-Ch46 全部内容，进入全部横切专题+无人机无障碍。

生态速览 (2026-05)¶

本方向涉及多个活跃开源生态，各有核心维护团队和技术路线。了解生态格局有助于选择代码基础和社区资源。

浙大规划学派 (ZJU FAST Lab / 高飞团队)¶

围绕多项式/B 样条/MINCO 轨迹优化构建了完整的无人机规划栈。

项目	定位	状态	星标
GCOPTER	通用走廊约束轨迹优化器	稳定，学术基准	~400
EGO-Planner	ESDF-free 梯度在线规划	广泛使用	~600
EGO-Swarm	多机去中心化扩展	D10 核心参考	~1.9k
MIGHTY (2025)	大规模异构集群	最新，百级无人机	--

特点: 理论严谨、header-only 风格、论文与代码一一对应。偏学术，工业移植需额外工程化。

MPPI/采样 MPC 生态¶

MPPI 从机器人领域扩展到自动驾驶和敏捷飞行，形成活跃社区。

项目	语言	定位	状态
MPPI-Generic (ACDSLab)	C++/CUDA	Header-only 模板库	活跃维护
pytorch_mppi (UM-ARM-Lab)	Python/PyTorch	可微分 MPPI	研究友好
Tube-MPPI	C++	鲁棒管道约束	MPPI_03 参考
Diffusion-MPPI (2025)	PyTorch	扩散先验 MPPI	前沿
DIAL-MPC (2025)	Python	扩散退火+全身力矩	ICRA Best Paper Finalist

特点: GPU 加速是核心竞争力，C++ 和 Python 两条路线并行。

PX4 + ROS2 无人机工具链¶

PX4 飞控与 ROS2 的集成在 2024-2025 年间趋于成熟。

组件	定位	状态
PX4 Autopilot v1.15+	开源飞控固件	持续活跃
uXRCE-DDS Agent	PX4-ROS2 通信桥	官方推荐，替代 mavros
Gazebo Harmonic	仿真环境	ROS2 原生集成
OmniDrones/Aerial Gym	RL 训练仿真	IsaacLab 生态

最新动态: ROSCon 2025 专题讨论 PX4+ROS2 生产级部署; uXRCE-DDS 带宽优化持续推进; PX4 社区探索 VLM/LLM 集成接口。

多智能体 RL 生态¶

项目	定位	状态
MARLlib	18 算法，全任务模式	统一 MARL 框架
EPyMARL	扩展 PyMARL，异构支持	标准化评估
HARL	HAPPO/HATRPO 统一库	协作强基线
MASH (2025)	异构人形 MARL	前沿

扩散式规划生态 (2023-2026 最热方向)¶

工作	会议/年份	核心贡献	对应章节
Diffuser	ICML 2022	轨迹优化折进扩散模型	T6, MPPI_05
Diffusion Policy	RSS 2023	视觉运动 BC, 条件 DDPM	T6, 06_具身
Diffusion-Planner	ICLR 2025	自动驾驶联合规划	T6, MPPI_05
TD-MPC2	ICLR 2024	Latent MPPI + world model	MPPI_06
DIAL-MPC	ICRA 2025	扩散退火全身力矩	MPPI_05, MPPI_07

自动驾驶规划生态¶

项目	定位	状态
Apollo Planning	L4 量产规划栈	T4 核心参考
Autoware.Universe	开源全栈自动驾驶	T4 核心参考
CARLA/Highway-env	仿真 Benchmark	G/T 线通用
iLQGames (Fridovich-Keil)	实时博弈求解	G2 核心
hj_reachability	HJI 安全验证	G1 核心

各 Part 详细大纲¶

Part-T: 时空联合规划 (T0-T6 + 附录, ~16 周)¶

线路定位: 从经典路径-速度解耦到端到端时空轨迹优化，贯穿自动驾驶与机器人导航两大应用域 里程碑: 完成本线后，学习者**能设计时空联合轨迹优化器，理解 Apollo/Autoware 规划架构** 文件目录: 10_时空规划/ 文件清单: 8 个 .md 文件

T0 时空联合规划总论 (1 周)¶

前置: 无 (本线入口) 核心主题: 时空耦合动机与三核心洞察 . 路径-速度解耦范式的局限性 . 时空联合规划谱系总览 . 6 章路线图与学习依赖 . 评价指标体系(安全/效率/舒适) . 典型失败案例分析文件: 10_时空规划/10_时空联合规划总论.md 共享标记: 导论章节

T1 Frenet 坐标系与 ST 图 (2 周) ⭐⭐¶

前置: v8 Ch24(优化基础), 微分几何初步 核心主题: Frenet-Serret 坐标系变换 . 曲率/挠率与路径参数化 . ST 图构建与搜索策略 . DP+QP 两阶段求解 . 纵横向耦合场景分析 . 坐标奇异性处理 . 参考线平滑 关键论文: Werling et al. (2010) ICRA -- Frenet Frame Planner 文件: 10_时空规划/20_Frenet坐标系与ST图.md 共享标记: 🏭🔬 自动驾驶+导航通用

T2 时空走廊构建 (2 周) ⭐⭐¶

前置: T1(Frenet/ST), 凸优化基础 核心主题: 时空 A*/Hybrid A* 搜索 . SFC 生成算法(DecompUtil/FIRI/CIRI) . 凸分解与 IRIS 方法 . 动态障碍物时空建模 . 走廊连续性与可行性保证 关键论文: Liu et al. (2017) -- Safe flight corridors 文件: 10_时空规划/30_时空走廊与搜索.md 共享标记: 🔬 无人机/自动驾驶走廊通用

T3 时空轨迹优化方法 (3 周) ⭐⭐⭐¶

前置: T2(走廊), 最优控制基础 核心主题: CILQR(约束迭代 LQR) . TEB(Timed Elastic Band) . OBCA(Optimization-Based Collision Avoidance) . MINCO 轨迹表示 . 求解器选型(OSQP/IPOPT/CasADi) . 实时性对比 关键论文: Zhang et al. (2020) -- EGO-Planner/MINCO, Wang (2022) -- GCOPTER 文件: 10_时空规划/40_时空轨迹优化.md 共享标记: 🏭🔬 核心算法章，理论密度最高

T4 Apollo 与 Autoware 规划架构剖析 (3 周) ⭐⭐⭐ 🏭¶

前置: T1-T3(理论基础) 核心主题: Apollo Planning 模块架构(Scenario/Stage/Task) . EM Planner 解耦流程 . Lattice Planner 实现 . Autoware.Universe Planning 栈 . 工业级代码质量分析 关键论文: Fan et al. (2018) -- Apollo EM motion planner 文件: 10_时空规划/50_Apollo_Autoware框架.md 共享标记: 🏭 工业框架深度剖析

T5 多智能体时空规划 (3 周) ⭐⭐⭐¶

前置: T3(轨迹优化), 图搜索算法 核心主题: CBS 冲突搜索 . LaCAM 大规模 MAPF . ORCA 互惠避碰 . EGO-Swarm 去中心化 . MADER 时空安全 . 规模可扩展性分析 关键论文: Sharon (2015) CBS, Zhou (2021) EGO-Swarm, Tordesillas (2022) MADER 文件: 10_时空规划/60_多智能体时空协调.md 共享标记: 🔬 多机/集群核心

T6 端到端与扩散式时空规划 (1.5 周) ⭐⭐ 🔬¶

前置: T3(轨迹优化), 深度学习基础 核心主题: 扩散模型基础(DDPM/Score Matching) . Diffusion Policy 时空轨迹生成 . CTG 条件引导 . 端到端范式(UniAD/VAD) . 安全性挑战 关键论文: Chi (2023) Diffusion Policy, Janner (2022) Diffuser 文件: 10_时空规划/70_端到端与扩散式规划.md 共享标记: 🔬 前沿研究方向

T 附录综合对比 (0.5 周)¶

前置: T0-T6 全线 核心主题: 方法分类矩阵 . 计算复杂度横评 . 安全性保证层级 . 开源实现索引 . 面试/选题建议文件: 10_时空规划/80_综合对比与附录.md

T 线依赖 DAG¶

T0(总论) ──> T1(Frenet/ST) ──> T2(走廊) ──> T3(轨迹优化) ──┬──> T4(Apollo/Autoware)
                                                            ├──> T5(多智能体)
                                                            └──> T6(扩散规划)
                                                   T0-T6 ──> T附录

T 线周历 (16 周)¶

周次	章节	核心产出
W1	T0 总论	文献地图，学习路线
W2-W3	T1 Frenet/ST	Frenet 变换库 + ST 搜索器
W4-W5	T2 走廊	走廊生成器，动态障碍 Demo
W6-W8	T3 轨迹优化	MINCO 优化器，TEB/OBCA 对比
W9-W11	T4 Apollo/Autoware	源码走读报告，部署调参
W12-W14	T5 多智能体	CBS 求解器，EGO-Swarm 仿真
W15	T6 扩散规划	Diffusion Policy 实验
W15.5-W16	T 附录	综合 Benchmark + 对比报告

T 线核心参考论文¶

Werling et al. (2010) -- Optimal trajectory generation in a Frenet frame
Liu et al. (2017) -- Safe flight corridors for quadrotor planning
Wang (2022) -- GCOPTER/MINCO trajectory optimization (TRO)
Fan et al. (2018) -- Baidu Apollo EM motion planner
Zhou et al. (2021) -- EGO-Swarm decentralized planning (ICRA)

T 线里程碑检验: 1. 工程能力: 能设计时空联合轨迹优化器，理解 Apollo/Autoware 规划架构 2. 系统能力: 能独立完成 Frenet 坐标变换到走廊约束优化的完整 Pipeline 3. 验收标准: 动态障碍物场景时空轨迹规划，满足安全/平滑/实时三约束

Part-U: 不确定性规划 (U0-U5 + 附录, ~12 周)¶

线路定位: 从确定性规划扩展到真实世界的感知噪声、模型不确定与环境随机性 里程碑: 完成本线后，学习者**能实现 Tube MPC/CBF 安全约束，理解 POMDP 决策框架** 文件目录: 30_不确定性规划/ 文件清单: 7 个 .md 文件

U0 不确定性规划总论 (1 周)¶

前置: 概率论基础, MPC 入门 核心主题: 不确定性来源分类(认知/偶然/模型/环境) . 鲁棒 vs 随机 vs 分布式鲁棒谱系 . 安全性定义层级 . 确定性规划的失效场景分析文件: 30_不确定性规划/10_不确定性规划总论.md 共享标记: 导论章节

U1 分支场景与应急规划 (2 周) ⭐⭐¶

前置: U0(总论), 决策树/MDP 基础 核心主题: Contingency Planning 条件分支 . MPDM 多策略决策 . 场景树构建与概率赋权 . Multi-stage NMPC . 自动驾驶变道案例 关键论文: Cunningham (2015) MPDM 文件: 30_不确定性规划/20_分支场景规划.md 共享标记: 🏭 自动驾驶决策核心

U2 鲁棒规划与安全滤波 (2.5 周) ⭐⭐⭐¶

前置: U1(分支), 李雅普诺夫稳定性 核心主题: Tube MPC 鲁棒管道 . CBF 安全屏障函数 . CLF-CBF-QP 安全滤波器 . GP-MPC 高斯过程增强 . CBF 高阶相对度处理 关键论文: Mayne (2005) Tube MPC, Ames (2017) CBF-QP 文件: 30_不确定性规划/30_鲁棒规划与安全滤波.md 共享标记: 🏭🔬 安全关键系统核心

U3 机会约束规划 (2 周) ⭐⭐¶

前置: U2(鲁棒), 随机优化 核心主题: CC-MPC 机会约束 . IRA 迭代风险分配 . CC-RRT 概率约束采样 . 约束紧缩技术 关键论文: Blackmore (2011) Chance-constrained path planning 文件: 30_不确定性规划/40_机会约束规划.md 共享标记: 🔬 概率安全保证

U4 POMDP 与 Belief 空间规划 (2.5 周) ⭐⭐⭐ 🔬¶

前置: U3(机会约束), MDP/贝叶斯推理 核心主题: POMDP 框架 . Belief 空间表示 . 信息收集型规划 . POMCP/DESPOT 在线求解 . 探索-利用权衡 关键论文: Silver & Veness (2010) POMCP 文件: 30_不确定性规划/50_POMDP与Belief规划.md 共享标记: 🔬 理论深度最高

U5 风险敏感与 CVaR 规划 (1.5 周) ⭐⭐ 🔬¶

前置: U3(机会约束), 风险度量基础 核心主题: CVaR 条件风险值 . 分布式鲁棒优化(DRO) . Distributional RL . 一致性风险度量 关键论文: Majumdar & Pavone (2020) -- CVaR planning 文件: 30_不确定性规划/60_风险敏感规划CVaR.md 共享标记: 🔬 交叉学科(金融+机器人)

U 附录综合对比 (0.5 周)¶

前置: U0-U5 全线 核心主题: 方法分类矩阵 . 保守性-计算量权衡 . 安全保证强度排序 . 求解器索引文件: 30_不确定性规划/70_综合对比与附录.md

U 线依赖 DAG¶

U0(总论) ──> U1(分支) ──> U2(鲁棒/CBF) ──> U3(机会约束) ──┬──> U4(POMDP)
                                                           └──> U5(CVaR)
                                                  U0-U5 ──> U附录

U 线周历 (12 周)¶

周次	章节	核心产出
W1	U0 总论	不确定性分类 Notebook
W2-W3	U1 分支场景	MPDM 决策器
W4-W5.5	U2 鲁棒/CBF	Tube MPC 控制器, CBF 滤波器
W6-W7	U3 机会约束	CC-MPC 规划器
W8-W9.5	U4 POMDP	POMCP 求解器
W10-W11	U5 CVaR	CVaR 轨迹优化器
W11.5-W12	U 附录	统一 Benchmark + 选型决策树

U 线里程碑检验: 1. 安全能力: 能实现 Tube MPC/CBF 安全约束 2. 决策能力: 理解 POMDP 框架，能设计信息收集策略 3. 验收标准: CBF 滤波器零碰撞; POMDP 决策优于 greedy 基线 20%+

Part-G: 博弈规划 (G0-G4 + 附录, ~10 周)¶

线路定位: 将规划从单智能体扩展到多智能体交互博弈 里程碑: 完成本线后，学习者**能建模多智能体博弈，实现 iLQGames 求解器** 文件目录: 40_博弈规划/ 文件清单: 6 个 .md 文件

G0 博弈规划总论 (1 周)¶

前置: 博弈论入门, 最优控制基础 核心主题: 博弈论在规划中的动机 . Nash/Stackelberg 均衡 . 静态 vs 微分博弈 . 交互建模缺陷分析文件: 40_博弈规划/10_博弈规划总论.md 共享标记: 导论章节

G1 微分博弈与 HJI 可达性 (2 周) ⭐⭐⭐¶

前置: G0(总论), 偏微分方程基础 核心主题: 微分博弈形式化 . HJI 方程 . 可达性分析 . Level Set 方法 . DeepReach 神经网络近似 关键论文: Bansal (2017) -- HJ reachability overview 文件: 40_博弈规划/20_微分博弈与HJI.md 共享标记: 🔬 安全验证基础

G2 实时博弈求解 (2.5 周) ⭐⭐⭐¶

前置: G1(微分博弈), iLQR 算法 核心主题: iLQGames 迭代线性二次博弈 . ALGAMES 增广拉格朗日 . 开环 vs 反馈 Nash . 收敛性与多均衡 . 实时性优化 关键论文: Fridovich-Keil (2020) iLQGames, Le Cleac'h (2022) ALGAMES 文件: 40_博弈规划/30_实时博弈求解器.md 共享标记: 🏭🔬 核心算法章

G3 逆博弈与 Level-k 推理 (2 周) ⭐⭐ 🔬¶

前置: G2(实时博弈), 逆最优控制 核心主题: 逆博弈问题定义 . 从观测推断对手目标 . Level-k 认知层级 . 预测-规划一体化 关键论文: Peters (2021) -- Inverse Games 文件: 40_博弈规划/40_逆博弈与预测规划.md 共享标记: 🔬 预测规划交叉

G4 安全证书与 MARL 交界 (2 周) ⭐⭐ 🔬¶

前置: G2(实时博弈), RL 基础 核心主题: 安全证书 . Stackelberg 博弈 . 博弈+CBF 融合 . MARL 基础(MAPPO/QMIX) . 博弈均衡与 MARL 收敛 关键论文: GCBF+ (MIT REALM), PSRO (Lanctot 2017) 文件: 40_博弈规划/50_安全证书与MARL.md 共享标记: 🔬 博弈+学习交界

G 附录综合对比 (0.5 周)¶

前置: G0-G4 全线 核心主题: 方法分类矩阵 . 均衡概念选择指南 . 信息结构影响 . 开源索引文件: 40_博弈规划/60_综合对比与附录.md

G 线依赖 DAG¶

G0(总论) ──> G1(HJI) ──> G2(实时博弈) ──┬──> G3(逆博弈/Level-k)
                                         └──> G4(安全/MARL)
                                G0-G4 ──> G附录

G 线周历 (10 周)¶

周次	章节	核心产出
W1	G0 总论	博弈分类 Notebook
W2-W3	G1 HJI	HJI 求解器(2D/3D)
W4-W5.5	G2 实时博弈	iLQGames 求解器
W6-W7	G3 逆博弈	意图推断器
W8-W9	G4 安全/MARL	博弈 CBF 系统
W9.5-W10	G 附录	统一评测 + 选型报告

G 线里程碑检验: 1. 建模能力: 能定义玩家/策略空间/代价函数 2. 求解能力: iLQGames 双车交互 10Hz+ 实时求解 3. 验收标准: 逆博弈意图推断 ADE < 基线 50%

Part-MPPI: 采样式 MPC (Ch1-10 + 附录, ~18 周)¶

线路定位: 从梯度式 MPC 扩展到采样式/路径积分控制范式，天然兼容不连续代价、黑箱仿真器、神经网络动力学 里程碑: 完成本线后，学习者**能设计、调优并部署基于 MPPI 的实时控制器** 文件目录: 20_采样式MPC/ 文件清单: 12 个 .md 文件 核心谱系: Kappen (Radboud) -> Todorov (UCSD) -> Theodorou (Georgia Tech) -> Williams (ACDS)

Part 1: 理论与核心实现 (Ch1-Ch2, 4 周)¶

里程碑：路径积分数学推导 + 可运行 CUDA MPPI 控制器

MPPI_01 | 路径积分控制理论 | ⭐⭐⭐ | 2 周

核心主题: Kappen 指数变换 -> HJB 线性化 . Feynman-Kac 路径积分 . 自由能-KL 散度对偶 . MPPI 权重公式 . 温度 lambda 的物理意义 . MPPI 与 REINFORCE 同构 关键论文: Kappen 2005, Todorov 2009 (PNAS), Williams 2017 (JGCD), Williams 2018 (T-RO) 文件: 20_采样式MPC/20_路径积分控制理论.md

MPPI_02 | 核心算法与 GPU 并行实现 | ⭐⭐⭐ | 2 周

核心主题: MPPI 伪代码 . CUDA kernel 设计 . 协方差调度 . MPPI-Generic 精读 . pytorch_mppi 快速原型 . MuJoCo GPU rollout 关键论文: Williams 2017 (JGCD), Vlahov 2024 (MPPI-Generic, RA-L) 文件: 20_采样式MPC/30_MPPI核心算法与GPU.md

Part 2: 变体与统一视角 (Ch3-Ch4, 3.5 周)¶

里程碑：6 大变体适用场景 + CEM/Stein 统一理论

MPPI_03 | MPPI 六大变体 | ⭐⭐⭐⭐ | 2 周

核心主题: Smooth-MPPI . Tube-MPPI(鲁棒) . Robust-MPPI(min-max) . Log-MPPI(权重坍缩) . CoVO-MPC(协方差优化) . SVG-MPPI(Stein 引导) 关键论文: Williams 2018 Tube-MPPI, Pan 2023 CoVO-MPC, Honda 2024 SVG-MPPI 文件: 20_采样式MPC/40_MPPI六大变体.md

MPPI_04 | CEM 家族与采样 MPC 统一视角 | ⭐⭐⭐ | 1.5 周

核心主题: CEM -> iCEM -> Predictive Sampling . Tsallis MPPI . 统一框架: "采样分布 x 代价评估 x 更新规则" 关键论文: Pinneri 2021 iCEM (NeurIPS), Howell 2022 Predictive Sampling 文件: 20_采样式MPC/50_CEM家族与统一视角.md

Part 3: 前沿融合 (Ch5-Ch6, 4 周)¶

里程碑：MPPI 与扩散模型/世界模型的交叉前沿

MPPI_05 | 扩散启发采样 MPC | ⭐⭐⭐⭐ | 2 周 🔬

核心主题: DDPM 去噪 <-> MPPI 加权更新数学同构 . MBD(Model-Based Diffusion) . DIAL-MPC 扩散退火全身力矩 . Go1/H1 实验 关键论文: Pan 2024 MBD (NeurIPS), Xue 2025 DIAL-MPC (ICRA Best Paper Finalist) 文件: 20_采样式MPC/60_扩散启发采样MPC.md

MPPI_06 | 学习世界模型 + 采样规划 (TD-MPC) | ⭐⭐⭐⭐ | 2 周 🔬

核心主题: TD-MPC 三组件 . MPPI 在 latent 空间规划 . TD-MPC2 规模化(317M 参数, 104 任务) . Transformer-MPPI 关键论文: Hansen 2022 TD-MPC (ICML), Hansen 2024 TD-MPC2 (ICLR) 文件: 20_采样式MPC/70_学习世界模型TD-MPC.md

Part 4: 领域应用 (Ch7-Ch8, 3.5 周)¶

里程碑：采样 MPC 部署到真实机器人领域

MPPI_07 | 腿足全身 MPPI 与接触操作 | ⭐⭐⭐⭐ | 2 周 🏭🔬

核心主题: 接触不连续 -> 梯度 MPC 失效 -> 采样天然兼容 . 全身力矩空间 MPPI . 与 RL 混合架构 关键论文: Howell 2022 MuJoCo MPC, Xue 2025 DIAL-MPC 文件: 20_采样式MPC/80_腿足全身MPPI.md

MPPI_08 | 导航、自驾与无人机采样 MPC | ⭐⭐⭐ | 1.5 周 🏭🔬

核心主题: ROS2 Nav2 MPPI Controller . AutoRally 实车 . 自动驾驶 MPPI . 无人机 SE(3) MPPI 关键论文: Williams 2018 AutoRally, Macenski 2023 Nav2 MPPI 文件: 20_采样式MPC/90_导航自驾无人机采样.md

Part 5: 对比与综合实战 (Ch9-Ch10, 3 周)¶

里程碑：选型决策能力 + 完整项目交付

MPPI_09 | MPPI vs 梯度式 MPC 选型 | ⭐⭐⭐ | 1 周

核心主题: 五维对比 . 决策树 . 混合架构 . 计算预算 Pareto 前沿文件: 20_采样式MPC/100_MPPI与梯度式对比.md

MPPI_10 | Mini-MPPI 综合实战 | ⭐⭐⭐⭐⭐ | 2 周 🏭

核心主题: 完整 CUDA MPPI 控制器 . 至少两任务验证 . K/T 扫参 . ROS2 节点封装文件: 20_采样式MPC/110_Mini-MPPI实战.md

MPPI 附录: 20_采样式MPC/120_附录.md

MPPI 线里程碑检验: 1. 理论能力: 能推导路径积分 -> MPPI 权重公式全链 2. 工程能力: CUDA CartPole MPPI K=4096 >1kHz 3. 部署能力: ROS2 封装可运行 MPPI 控制器

Part-Multi: 多机器人协作 (Ch1-13 + 附录, ~21.5 周)¶

线路定位: 从单体规控扩展到多机协作规控 里程碑: 完成本线后，学习者**能设计分布式 MPC + MARL 混合多机系统** 文件目录: 50_多机器人协作/ 文件清单: 16 个 .md 文件

Part 1: 多机基础 (Ch1-Ch3, 4 周)¶

Multi_01 | 多机系统全景 | ⭐⭐ | 1 周

核心主题: 三维分类(架构 x 交互 x 信息) . 通信拓扑(Laplacian, 代数连通性 lambda_2) . 架构决策树文件: 50_多机器人协作/20_多机系统全景.md

Multi_02 | 共识算法与分布式优化 | ⭐⭐⭐ | 1.5 周

核心主题: 线性共识协议 . 切换拓扑 . ADMM 分布式优化 . ADMM 用于多机 MPC 解耦 关键论文: Olfati-Saber 2004, Boyd 2011 ADMM 文件: 50_多机器人协作/30_共识算法与分布式优化.md

Multi_03 | 任务分配与路径规划 (MAPF) | ⭐⭐⭐ | 1.5 周

核心主题: CBBA 分布式拍卖 . CBS 两层搜索 . LaCAM 加速 . 仓库 MAPF vs 编队 关键论文: Choi 2009 CBBA, Sharon 2015 CBS 文件: 50_多机器人协作/40_任务分配与路径规划.md

Part 2: 协同运动控制 (Ch4-Ch6, 4 周)¶

Multi_04 | 分布式 MPC 多足编队 | ⭐⭐⭐⭐ | 2 周 🏭🔬

核心主题: 集中 vs 分布式 MPC . ADMM 解耦 . 编队约束 . 双 Go2 编队 关键论文: Kim 2023 (T-RO) 双四足, Keviczky 2008 分布式 MPC 文件: 50_多机器人协作/50_分布式MPC多足编队.md

Multi_05 | 协同搬运与力控 | ⭐⭐⭐⭐ | 2 周

核心主题: Grasp Matrix . 内力子空间 . 阻抗协调 . 负载估计与自适应文件: 50_多机器人协作/60_协同搬运与力控.md

Multi_06 | 异构多机协同 | ⭐⭐⭐ | 1 周

核心主题: 地空联合(四足+无人机) . 异构通信 . 联合状态估计文件: 50_多机器人协作/70_异构多机协同.md

Part 3: 协同操作 (Ch7-Ch9, 5 周)¶

Multi_07 | 双臂与多臂协同操作 | ⭐⭐⭐⭐ | 2 周

核心主题: 闭链运动学 . 力分配 . 双臂 impedance 协调文件: 50_多机器人协作/80_双臂多臂协同操作.md

Multi_08 | 多足协同 Loco-Manipulation | ⭐⭐⭐⭐ | 1.5 周 🏭🔬

核心主题: 协同步态同步 . 负载动态分配 . 协同 WBC 关键论文: De Vincenti/Coros 2024 (ETH CRL) 文件: 50_多机器人协作/90_多足协同Loco-Manipulation.md

Multi_09 | 人形/四足+臂协同控制 | ⭐⭐⭐⭐ | 1.5 周

核心主题: 层次化全身协同 . 异构团队 . MASH(2025) 异构 MARL 文件: 50_多机器人协作/100_人形四足臂协同控制.md

Part 4: MARL 多智能体强化学习 (Ch10-Ch12, 5.5 周)¶

Multi_10 | MARL 基础 | ⭐⭐⭐ | 2 周

核心主题: CTDE 范式 . MADDPG . VDN/QMIX . MAPPO . HAPPO/HATRPO . HARL 库 关键论文: Lowe 2017 MADDPG, Rashid 2018 QMIX, Yu 2022 MAPPO 文件: 50_多机器人协作/110_MARL基础.md

Multi_11 | MARL 多机运动协调 | ⭐⭐⭐⭐ | 1.5 周

核心主题: 编队 MARL . 通信学习(CommNet/TarMAC) . 涌现协调 . sim-to-real 文件: 50_多机器人协作/120_MARL多机运动协调.md

Multi_12 | MARL + 传统规控混合 | ⭐⭐⭐⭐ | 2 周 🔬

核心主题: RL 高层 + MPC 底层 . Safe MARL(GCBF+) . 约束 MARL . 残差策略 . MASH 关键论文: MIT REALM GCBF+, PKU HARL 文件: 50_多机器人协作/130_MARL与传统规控混合.md

Part 5: 综合实战 (Ch13, 2 周)¶

Multi_13 | Mini-MultiBot 综合实战 | ⭐⭐⭐⭐⭐ | 2 周 🏭

核心主题: 端到端多机系统 . 分布式 MPC + MARL 双范式 . 系统级评估文件: 50_多机器人协作/140_Mini-MultiBot综合实战.md

Multi 附录: 50_多机器人协作/150_附录.md

Multi 线里程碑检验: 1. 协调能力: 双 Go2 ADMM 编队行走 2. 学习能力: MAPPO 多机协作导航训练 3. 验收标准: Mini-MultiBot 双任务系统级交付

Part-TAMP: 任务与运动规划 (1 章, ~4 周)¶

线路定位: 符号 AI（任务规划）与几何 AI（运动规划）的交叉 文件目录: 60_任务运动规划/ 文件清单: 1 个 .md 文件 (3177 行，内部渐进)

TAMP_T1 | 任务与运动规划基础 | ⭐ ~ ⭐⭐⭐⭐ | 4 周 | 3177 行

前置: A* 搜索、一阶逻辑、RRT/PRM 核心参考: Garrett et al. (2021) Annual Review 内部结构 (9 大节): 1. 为什么需要 TAMP -- 符号 vs 几何 gap 2. 经典任务规划 -- STRIPS -> PDDL -> FF; ADL 扩展 3. 采样运动规划回顾 -- C-space -> RRT/PRM 4. TAMP 核心范式 -- skeleton search + PDDLStream 5. LGP 逻辑-几何规划 -- Toussaint KOMO 联合优化 6. Learning-based TAMP -- GNN/LLM/扩散引导搜索 7. 工程实践 -- PDDLStream + MoveIt2 8. 前沿方向 -- SayCan / Code-as-Policies / VoxPoser 9. 综合练习 -- 桌面整理全流程文件: 60_任务运动规划/10_任务与运动规划基础.md

Part-D: 无人机 (D0-D12 + 附录, ~22 周)¶

线路定位: 完整的无人机规控应用实例，从仿真到实飞 文件目录: 70_无人机/ 文件清单: 14 章 + 6 篇附录 核心技术栈: Eigen / GCOPTER / Fast-Planner / PX4 / acados / IsaacLab 核心实验室: ZJU FAST Lab / HKUST Aerial / UZH RPG / HKU MaRS / MIT ACL

三大认知跨越 (从 SLAM 到无人机规控)¶

跨越一: 从"估计过去"到"规划未来"。 SLAM 是后验推断; 规控是前瞻规划。数学从最小二乘转向约束优化(QP/NLP/L-BFGS)。

跨越二: 从"软实时 10Hz"到"硬实时 1ms"。 SLAM 丢一帧精度下降; 控制丢一帧姿态失稳。热路径零堆分配/零异常/零阻塞。

跨越三: 从"传感器前端"到"执行器后端"。 SLAM 擅长点云/图像/IMU; 规控要求理解电机/ESC/电池/桨涡。

SLAM 技能迁移速查¶

SLAM 技能	无人机规控对应	迁移难度
Eigen 矩阵运算	MINCO 带状矩阵, Jacobian 组装	零
Sophus SE(3)/manif	Lee 几何控制 SO(3) 误差	低
GTSAM 因子图	MPC KKT 块三对角 (数学同构)	低
PCL 点云	ikd-Tree/voxblox/ROG-Map	零
FAST-LIO2	无人机感知管线默认后端	零
FCL 碰撞检测	不用 FCL -- 用 ESDF/凸包/走廊	高
OMPL 采样规划	不用 OMPL -- 用 kinodynamic A*+轨迹优化	高

章间依赖 DAG¶

D0(仿真) ──→ D1(微分平坦/SE(3)) ──→ D2(MPC) ──→ D8(敏捷飞行)
                    |                     |               |
                    v                     v               v
               D3(Min-Snap) ──→ D4(B样条) ──→ D5(MINCO) ──→ D9(RL)
                                     |           |
                                     v           v
                                D6(环境表示) → D7(探索) → D10(集群) → D11(前沿)
                                                                          |
                                                                          v
                                                                     D12(综合实战)

Part 0: 仿真环境 (1 周)¶

D0 无人机仿真环境与资产管道 ⭐⭐ (1 周)

前置: v8 Ch36(CUDA), Ch31(ROS2), P02(sim-to-real) 核心主题: 四代仿真器演进 . CTBR/SRT/RPM 控制接口 . Agilicious 安全架构 . IsaacLab/OmniDrones PPO 管线 关键项目: gym-pybullet-drones, Aerial Gym, OmniDrones, Flightmare, FiGS 文件: 70_无人机/140_无人机仿真环境.md

Part 1: 动力学与控制 (4 周)¶

D1 微分平坦与 SE(3) 几何控制 ⭐⭐⭐ (2 周)

前置: Eigen(Ch11), SO(3)/SE(3)(Ch23) 核心主题: 微分平坦性 sigma=(x,y,z,psi) . 平坦映射全链 . Lee-Leok-McClamroch SE(3) 控制 . Bhat-Bernstein 拓扑障碍 . PX4 级联 PID vs 几何控制 关键论文: Lee 2010 (CDC, ~3800 引), Mellinger 2011 (ICRA Best Paper, ~4500 引) 文件: 70_无人机/20_微分平坦与几何控制.md

D2 MPC 与自适应控制 ⭐⭐⭐ (2 周) 🏭🔬

前置: D1, 非线性优化(Ch17-18) 核心主题: 四旋翼 MPC 标准问题结构 . SQP-RTI . acados+HPIPM . L1 自适应叠加 . GP-MPC . Neural-MPC . IPC 统一规控 关键论文: Hanover 2022 L1-NMPC, Torrente 2021 GP-MPC, O'Connell 2022 Neural-Fly 文件: 70_无人机/30_MPC与自适应控制.md

Part 2: 轨迹生成与优化 (5 周)¶

D3 多项式轨迹生成 ⭐⭐⭐ (1 周)

核心主题: Min-Snap QP . Richter 端点导数参数化 . Bernstein 基凸包 . mav_trajectory_generation 关键论文: Mellinger 2011, Richter 2016 (IJRR) 文件: 70_无人机/40_多项式轨迹生成.md

D4 B 样条轨迹优化 ⭐⭐⭐ (1.5 周)

核心主题: 均匀 B 样条五大性质 . Fast-Planner/EGO-Planner 管线 . LBFGS-Lite 关键论文: Zhou 2019 Fast-Planner, Zhou 2021 EGO-Planner 文件: 70_无人机/50_B样条轨迹优化.md

D5 MINCO 轨迹表示与安全走廊 ⭐⭐⭐ (2 周) 🏭🔬

核心主题: MINCO 数学本质 . GCOPTER header-only . SFC 三代演进 . SUPER 双轨迹 . ROG-Map 关键论文: Wang 2022 GCOPTER/MINCO (TRO), Ren 2025 SUPER (Science Robotics) 文件: 70_无人机/60_MINCO轨迹表示与安全走廊.md

Part 3: 环境感知与探索 (4 周)¶

D6 环境表示 ⭐⭐ (2 周)

核心主题: 六种表示(八叉树/体素哈希/环形缓冲/栅格/kd树/高斯椭球) . ESDF 梯度 . 3DGS 碰撞原语 . nvblox GPU 177x 关键项目: voxblox, ikd-Tree, nvblox, ROG-Map, OctoMap 文件: 70_无人机/70_无人机环境表示.md

D7 感知引导规划与自主探索 ⭐⭐⭐ (2 周)

核心主题: 探索三代(NBV -> TSP/ATSP -> 覆盖引导) . FUEL/TARE/RACER/FALCON . yaw 一等决策变量 关键论文: Zhou 2021 FUEL, Cao 2021 TARE (RSS Best Paper), Zhou 2023 RACER (TRO Best Paper) 文件: 70_无人机/80_感知引导规划与自主探索.md

Part 4: 敏捷飞行与 RL (4 周)¶

D8 敏捷飞行平台与集成规控 ⭐⭐⭐ (2 周) 🏭

核心主题: Agilicious 全栈 . CPC/IPC/MPCC/DFBC 四范式 . Actor-Critic MPC 关键论文: Foehn 2021 CPC (Science Robotics), Romero 2025 Actor-Critic MPC 文件: 70_无人机/90_敏捷飞行平台与集成规控.md

D9 RL 敏捷飞行与 sim-to-real ⭐⭐⭐ (2 周) 🔬

核心主题: Swift 完整管线 . SimpleFlight 五因子 . RLtools C++17 头文件 RL . RAPTOR 2084 参数跨形态 关键论文: Kaufmann 2023 Swift (Nature), Song 2023 RL 超越 MPC (Science Robotics) 文件: 70_无人机/100_RL敏捷飞行与sim-to-real.md

Part 5: 集群与前沿 (3 周)¶

D10 集群协同规划 ⭐⭐ (1.5 周)

核心主题: ZJU 路线(软惩罚: EGO-Swarm) vs MIT 路线(硬约束: MADER/RMADER) . Primitive-Swarm 1000 机 . 多机任务分配 关键论文: Zhou 2021 EGO-Swarm, Tordesillas 2022 MADER, Hou 2025 1000 机文件: 70_无人机/110_集群协同规划.md

D11 前沿方向 ⭐⭐ (1.5 周) 🔬

核心主题: 五大前沿 -- (A) VLM/LLM 任务层 . (B) 3DGS 规划 . (C) 非标构型 . (D) 安全与形式验证 . (E) 端到端视觉 RL 关键论文: DroneSplat CVPR 2025, DroneVLA 2025, Dream to Fly ICRA 2026 文件: 70_无人机/120_前沿方向.md

Part 6: 综合实战 (2 周)¶

D12 Mini-Drone 综合实战 ⭐⭐⭐ (2 周) 🏭

核心主题: 端到端系统集成 . 三级验收: Bronze(悬停)/Silver(单房间 >70%)/Gold(多房间 >85%+返航) 文件: 70_无人机/130_综合实战.md

附录 (6 篇)¶

附录	覆盖	文件
附录 A: 轨迹生成深度叙述	D3-D5 十年演进	`附录A_轨迹生成深度叙述.md`
附录 B: 感知规划一体深度叙述	D6-D7 演进	`附录B_感知规划一体深度叙述.md`
附录 C: MPC 与几何控制深度叙述	D1-D2 演进	`附录C_MPC与几何控制深度叙述.md`
附录 D: RL 敏捷飞行深度叙述	D8-D9 演进	`附录D_RL敏捷飞行深度叙述.md`
附录: 教学大纲配套	周次/依赖/速成	`附录_教学大纲配套.md`
附录: 项目全景调研	85+ 项目	`附录_项目全景调研.md`

无人机里程碑验收汇总¶

Part	周次	核心验收标准
Part 0	W49	gym-pybullet-drones 悬停 + OmniDrones PPO 训练
Part 1	W50-53	手推平坦映射全链; SE(3) 仿真跟踪; acados MPC 100Hz
Part 2	W54-58	Min-Snap QP 推导; GCOPTER 走廊修改
Part 3	W59-62	环境表示选型; FUEL/TARE 代码追踪
Part 4	W63-66	四种敏捷范式; CTBR 门穿越训练
Part 5	W67-69	ZJU vs MIT 路线权衡; 五大前沿雷达
Part 6	W70-71	端到端系统; Bronze/Silver/Gold 交付

Part-S: 综述 (~3 周)¶

线路定位: 贯穿连接线，将横切方法论与应用实例缝合为统一知识体系 文件目录: 80_综述/ 文件清单: 5 个 .md 文件

S1 | 总览与时空联合规划 (0.5 周)

覆盖: T 线全貌 + D3-D5 轨迹优化连接定位: 从时空规划发展脉络理解方法演进逻辑文件: 80_综述/10_总览与时空联合规划.md

S2 | 不确定性规划 (0.5 周)

覆盖: U 线 + 五条子路线(鲁棒/机会/POMDP/CVaR/分布鲁棒) 定位: 五种不确定性处理范式的 C++ 教学可操作性评估文件: 80_综述/20_不确定性规划.md

S3 | 博弈规划 (0.5 周)

覆盖: G 线 + HJI/iLQGames/逆博弈定位: C++ 抓手仅 ilqgames + hj_reachability，ALGAMES 等已迁 Julia 文件: 80_综述/30_博弈规划.md

S4 | 交互意图预测 (0.5 周)

覆盖: G3 逆博弈 + 自动驾驶行为预测定位: 预测-规划一体化的 C++ 锚点(Apollo prediction) 文件: 80_综述/40_交互意图预测.md

S5 | RL 与经典规控贯穿关系 (1 周)

覆盖: 全线贯穿视角 -- POMDP/Safe RL/MCTS/MARL/Diffusion/TD-MPC/VLA 核心判断: 2023-2026 "规划层 RL + 经典融合"成熟方向 = Diffusion Planner + TD-MPC2 + 可微 MPC + VLA 定位: 教学收官视角，将四个经典范式映射到四类 RL 连接文件: 80_综述/50_RL与经典规控贯穿关系与结论.md

交叉引用地图¶

04_移动机器人规控内部交叉¶

三线交叉节点速查表 (T/U/G)¶

交叉点	T 线章节	U 线章节	G 线章节	说明
安全约束优化	T3(OBCA)	U2(CBF/Tube MPC)	G4(安全证书)	约束形式化互通
多智能体协调	T5(CBS/ORCA)	U4(多机 POMDP)	G2-G4(博弈)	协作到竞争的完整谱系
学习型方法	T6(扩散规划)	U5(Distributional RL)	G4(MARL)	数据驱动+模型融合
工业部署	T4(Apollo)	U1(MPDM)	G3(行为预测)	自动驾驶全栈

MPPI/Multi/TAMP 三线交叉¶

上游	下游	依赖内容
MPPI_01-02	Multi_04	分布式 MPC 可选 MPPI 作为 local solver
MPPI_07	Multi_08	腿足全身 MPPI -> 多足协同 loco-manipulation
Multi_10-12	MPPI_06	TD-MPC 的 MARL 对比视角
Multi_04-05	TAMP_T1	多机协同搬运 -> TAMP 长时域需求
MPPI_05	TAMP_T1	Learning-based TAMP 中扩散采样

横切方法论与无人机应用交叉¶

横切方法	无人机章节	交叉内容
T: 时空联合规划	D3-D5 轨迹优化	走廊生成、MINCO 时间参数化
U: 不确定性规划	D7 感知引导	感知不确定性 -> 鲁棒重规划
G: 博弈规划	D10 集群对抗	非合作多机 -> 博弈论框架
MPPI: 采样 MPC	D2 MPC 基础	梯度式 vs 采样式互补
Multi: 多机协作	D10 集群协同	EGO-Swarm/MADER 分布式规划
TAMP: 任务运动	D11 前沿(VLM)	VLM 任务层 -> 连续控制

04_移动机器人规控与其他方向交叉¶

与 03_SLAM¶

04 规控章节	03 SLAM 章节	交叉内容
D6 环境表示	占据栅格/ESDF/体素	SLAM 建图输出即规划输入
D7 感知引导	视觉 SLAM 前端	主动感知: 规划驱动相机视角
U0-U2 不确定性	EKF/UKF 滤波	定位不确定性传播到规划层
D11 前沿	NeRF/3DGS	隐式表示同时服务 SLAM 与规划

典型闭环流程:

SLAM定位+建图 → 生成ESDF/走廊 → 轨迹优化(D3-D5/T专题) → 控制执行(D2/MPPI)
     ^                                                              |
     └──────────────── 里程计反馈 ←──────────────────────────────────┘

与 05_运动控制¶

04 规控方法	05 运动控制应用	说明
MPPI (采样 MPC)	足式实时步态规划	采样并行化适合高频控制
MPC (D2/MPPI)	全身运动控制 WBC	MPC+WBC 是足式主流架构
Multi (多机协作)	多足协调、双臂协调	分布式优化通用
TAMP (任务运动)	具身智能任务规划层	符号到连续接口
G (博弈规划)	人机交互意图推理	逆博弈推断人类意图

与 06_具身智能¶

04 规控方法	06 具身智能应用	说明
TAMP (任务运动)	SayCan/VoxPoser	Foundation Model + TAMP
T6 扩散规划	Diffusion Policy	条件生成式操作
MPPI_06 TD-MPC	VLA 中的规划模块	世界模型 + MPPI latent 规划
D11 VLM 无人机	DroneVLA	VLA -> 无人机操纵

学习路径建议¶

按目标角色的推荐顺序¶

路径 A -- 自动驾驶方向: T0 -> T1 -> T2 -> T3 -> T4 -> U0 -> U1 -> U2 -> G0 -> G2 -> G3 -> S1 -> S4

路径 B -- 无人机全栈方向: D0 -> D1 -> D2 -> D3 -> D4 -> D5 -> D6 -> D7 -> D8 -> D9 -> D12 -> MPPI_01 -> MPPI_02

路径 C -- 多机器人方向: Multi_01 -> Multi_02 -> Multi_03 -> Multi_04 -> Multi_10 -> Multi_12 -> Multi_13 -> D10 -> G4

路径 D -- 理论研究方向: T0 -> T1 -> T3 -> U0 -> U2 -> U3 -> U4 -> U5 -> G0 -> G1 -> G3 -> MPPI_01 -> MPPI_05 -> S5

路径 E -- MPPI 专精方向 (8 周): MPPI_01 -> MPPI_02 -> MPPI_03 -> MPPI_05 -> MPPI_07 -> MPPI_10

并行推进建议¶

三大横切线（T/U/G）可并行推进，但建议 T 线先行至 T3 后再启动 U/G 线，以建立足够的优化基础。MPPI 线与 Multi 线相对独立，可任意顺序。TAMP 建议在至少完成一条横切线后学习。综述（S 线）建议在对应横切线完成后阅读，作为复习与贯穿。

文件索引¶

10_时空规划 (8 文件)¶

编号	文件名	对应章节	周
10	`10_时空联合规划总论.md`	T0	1
20	`20_Frenet坐标系与ST图.md`	T1	2
30	`30_时空走廊与搜索.md`	T2	2
40	`40_时空轨迹优化.md`	T3	3
50	`50_Apollo_Autoware框架.md`	T4	3
60	`60_多智能体时空协调.md`	T5	3
70	`70_端到端与扩散式规划.md`	T6	1.5
80	`80_综合对比与附录.md`	T 附录	0.5

20_采样式MPC (12 文件)¶

编号	文件名	对应章节	周
10	`10_采样式MPC总论.md`	MPPI_00	-
20	`20_路径积分控制理论.md`	MPPI_01	2
30	`30_MPPI核心算法与GPU.md`	MPPI_02	2
40	`40_MPPI六大变体.md`	MPPI_03	2
50	`50_CEM家族与统一视角.md`	MPPI_04	1.5
60	`60_扩散启发采样MPC.md`	MPPI_05	2
70	`70_学习世界模型TD-MPC.md`	MPPI_06	2
80	`80_腿足全身MPPI.md`	MPPI_07	2
90	`90_导航自驾无人机采样.md`	MPPI_08	1.5
100	`100_MPPI与梯度式对比.md`	MPPI_09	1
110	`110_Mini-MPPI实战.md`	MPPI_10	2
120	`120_附录.md`	MPPI 附录	-

30_不确定性规划 (7 文件)¶

编号	文件名	对应章节	周
10	`10_不确定性规划总论.md`	U0	1
20	`20_分支场景规划.md`	U1	2
30	`30_鲁棒规划与安全滤波.md`	U2	2.5
40	`40_机会约束规划.md`	U3	2
50	`50_POMDP与Belief规划.md`	U4	2.5
60	`60_风险敏感规划CVaR.md`	U5	1.5
70	`70_综合对比与附录.md`	U 附录	0.5

40_博弈规划 (6 文件)¶

编号	文件名	对应章节	周
10	`10_博弈规划总论.md`	G0	1
20	`20_微分博弈与HJI.md`	G1	2
30	`30_实时博弈求解器.md`	G2	2.5
40	`40_逆博弈与预测规划.md`	G3	2
50	`50_安全证书与MARL.md`	G4	2
60	`60_综合对比与附录.md`	G 附录	0.5

50_多机器人协作 (16 文件)¶

编号	文件名	对应章节	周
10	`10_多机器人协作总论.md`	Multi_00	-
20	`20_多机系统全景.md`	Multi_01	1
30	`30_共识算法与分布式优化.md`	Multi_02	1.5
40	`40_任务分配与路径规划.md`	Multi_03	1.5
50	`50_分布式MPC多足编队.md`	Multi_04	2
60	`60_协同搬运与力控.md`	Multi_05	2
70	`70_异构多机协同.md`	Multi_06	1
80	`80_双臂多臂协同操作.md`	Multi_07	2
90	`90_多足协同Loco-Manipulation.md`	Multi_08	1.5
100	`100_人形四足臂协同控制.md`	Multi_09	1.5
110	`110_MARL基础.md`	Multi_10	2
120	`120_MARL多机运动协调.md`	Multi_11	1.5
130	`130_MARL与传统规控混合.md`	Multi_12	2
140	`140_Mini-MultiBot综合实战.md`	Multi_13	2
150	`150_附录.md`	Multi 附录	-

60_任务运动规划 (1 文件)¶

编号	文件名	对应章节	周
10	`10_任务与运动规划基础.md`	TAMP_T1	4

70_无人机 (14 章 + 6 附录)¶

编号	文件名	对应章节	周
10	`10_导读与路线图.md`	导读	-
20	`20_微分平坦与几何控制.md`	D1	2
30	`30_MPC与自适应控制.md`	D2	2
40	`40_多项式轨迹生成.md`	D3	1
50	`50_B样条轨迹优化.md`	D4	1.5
60	`60_MINCO轨迹表示与安全走廊.md`	D5	2
70	`70_无人机环境表示.md`	D6	2
80	`80_感知引导规划与自主探索.md`	D7	2
90	`90_敏捷飞行平台与集成规控.md`	D8	2
100	`100_RL敏捷飞行与sim-to-real.md`	D9	2
110	`110_集群协同规划.md`	D10	1.5
120	`120_前沿方向.md`	D11	1.5
130	`130_综合实战.md`	D12	2
140	`140_无人机仿真环境.md`	D0	1
--	`附录A_轨迹生成深度叙述.md`	附录	-
--	`附录B_感知规划一体深度叙述.md`	附录	-
--	`附录C_MPC与几何控制深度叙述.md`	附录	-
--	`附录D_RL敏捷飞行深度叙述.md`	附录	-
--	`附录_教学大纲配套.md`	附录	-
--	`附录_项目全景调研.md`	附录	-

80_综述 (5 文件)¶

编号	文件名	对应章节	周
10	`10_总览与时空联合规划.md`	S1	0.5
20	`20_不确定性规划.md`	S2	0.5
30	`30_博弈规划.md`	S3	0.5
40	`40_交互意图预测.md`	S4	0.5
50	`50_RL与经典规控贯穿关系与结论.md`	S5	1

统计总览¶

八大 Part 统计¶

Part	章节数	周数	理论密度峰	工程密度峰	前沿研究峰
T: 时空规划	8	16	T3(轨迹优化)	T4(Apollo)	T6(扩散)
MPPI: 采样MPC	12	18	MPPI_01(路径积分)	MPPI_10(实战)	MPPI_05(扩散)
U: 不确定性	8	12	U4(POMDP)	U2(Tube/CBF)	U5(CVaR)
G: 博弈	7	10	G1(HJI)	G2(iLQGames)	G3(逆博弈)
Multi: 多机	16	21.5	Multi_02(共识)	Multi_04(分布MPC)	Multi_12(混合)
TAMP	1	4	全渐进	PDDLStream	LGP/VLM
D: 无人机	14+6附录	22	D5(MINCO)	D8(Agilicious)	D9(Swift)
S: 综述	5	3	S5(RL贯穿)	--	S5(Diffusion)

关键求解器与工具链¶

专题	核心求解器	主要仿真平台
T: 时空	OSQP/IPOPT/CasADi	Apollo Dreamview, CARLA
MPPI: 采样	MPPI-Generic (CUDA)	MuJoCo, IsaacLab
U: 不确定	MOSEK/CVXPY/GPML	Gazebo, Isaac Gym
G: 博弈	iLQGames/hj_reachability	CARLA, Highway-env
Multi: 多机	MARLlib/HARL/OCS2	IsaacLab, MuJoCo
TAMP	PDDLStream/rai	MuJoCo, MoveIt2
D: 无人机	acados/GCOPTER/PX4	Gazebo, OmniDrones

跨线能力矩阵¶

完成多线学习后，学习者应具备以下复合能力:

复合能力	涉及章节	说明
安全自动驾驶全栈	T4 + U2 + G2	Apollo 架构 + CBF + 博弈交互
多机器人安全协调	T5 + U2 + G4	MAPF + 鲁棒约束 + 竞合博弈
不确定交互决策	T1 + U1 + G3	场景表示 + 分支决策 + 意图推断
学习型规划前沿	T6 + U5 + G4 + MPPI_05	扩散 + CVaR + MARL + 采样
无人机全栈端到端	D0-D12 + MPPI_08	仿真到实飞 + 采样 MPC
多机无人机集群	D10 + Multi_04-06 + T5	集群协同 + 分布 MPC + MAPF

前沿补充 (截至 2026-05-14)¶

以下为最近重要进展，与本大纲多个章节直接相关。

感知与表示前沿¶

工作	会议/年份	核心贡献	对应章节
DroneSplat	CVPR 2025	无人机图像 3DGS 重建+规划	D6, D11
Splat-Nav	TRO 2025	3DGS 椭球碰撞取代 ESDF	D6
nvblox GPU	NVIDIA 2025	GPU 加速 TSDF/ESDF 177x	D6

基于大模型的无人机智能¶

工作	年份	核心贡献	对应章节
DroneVLA	2025	VLA 直接输出无人机控制	D11
CognitiveDrone	2025	VLM 认知导航	D11
AeroAgent	2025	LLM 任务规划器	D11, TAMP

规划方法论前沿¶

工作	会议/年份	核心贡献	对应章节
Diffusion-Planner	ICLR 2025	扩散自动驾驶联合规划	T6, MPPI_05
DIAL-MPC	ICRA 2025	扩散退火全身力矩 MPPI	MPPI_05, MPPI_07
Stein Variational MPC	2025	SVGD 多模态轨迹	MPPI_05
Dream to Fly	ICRA 2026	DreamerV3 纯想象敏捷飞行	D9

多智能体前沿¶

工作	年份	核心贡献	对应章节
MASH	2025	异构人形 MARL	Multi_12, 05_运动控制
GCBF+	2025	分布式 CBF 安全 MARL	Multi_12, U2
MIGHTY	2025	百级异构集群规划	D10, T5

与机械臂方向对照¶

维度	移动机器人规控 (本大纲)	机械臂 (v1.2)
章数	76 章 (横切 52 + 无人机 20 + 综述 5)	37 章 (P/M/F/D)
周数	~106.5 周	~76 周
C++ 风格	header-only, 编译期固定维度, C++11/14	pluginlib 运行时多态, C++17/20
核心数学	微分平坦, MINCO, L-BFGS, 博弈均衡	空间向量代数, RNEA/ABA, QP/NLP
规划范式	工作空间连续轨迹优化(平坦+走廊)	配置空间采样(OMPL)+轨迹优化
控制范式	SE(3) 几何 / NMPC / RL CTBR	ros2_control + JTC
实时约束	1-10ms 重规划 + 200-500Hz 控制	1kHz 伺服(PREEMPT_RT)
RL 成熟度	极高(Swift/Nature 2023)	中(RL->ros2_control 刚起步)
SLAM 重叠	极高(VIO/LiDAR 是感知核心)	中(共享 Eigen/ROS2)
代表项目	GCOPTER, Fast-Planner, Agilicious	Pinocchio, MoveIt2, BT.CPP

版本历史¶

版本	日期	变更
v1.0	2026-05-04	初版：统一 75 个章节文件为总大纲，含横切 6 条线+无人机 13 章
v2.0	2026-05-14	重写：增加角色快速路径(自驾/无人机/多机)、计算与硬件需求表、工业 vs 研究标记系统化、方法-应用双导航路线图、前置知识依赖矩阵细化、生态速览扩展(MPPI/扩散/MARL/PX4/自驾)、Per-Part 全 8 子方向详细大纲、综述层(Part-S)独立列出、交叉引用地图(内部+跨方向+跨模块)、统计总览与能力矩阵、前沿补充(2026-05-14)、文件索引完整化

配置层级	硬件规格	覆盖范围
最低入门	8 核 CPU / 16GB RAM / 无独显	横切 T/U/G 基础 + 无人机 D0-D5
推荐标准	12 核 CPU / 32GB RAM / RTX 3060 12GB	全部章节仿真部分
完整配置	上述 + RTX 4090 24GB	全部章节 + 大规模 MARL 训练
实机配置	推荐标准 + PX4 开发套件 (Holybro X500/Pixhawk 6C)	D8/D12 实机实战