120_附录
附录¶
附录 A:完整论文谱系表¶
| # | 年份 | 作者 | 论文标题 | Venue | 引用 | 核心贡献 |
|---|---|---|---|---|---|---|
| 1 | 2005 | Kappen | Path integrals and symmetry breaking for optimal control theory | J.Stat.Mech. | ~2000 | HJB 指数变换→线性 PDE |
| 2 | 2005 | Kappen | Linear theory for control of nonlinear stochastic systems | PRL | ~800 | 姊妹篇 |
| 3 | 2009 | Todorov | Efficient computation of optimal actions | PNAS | ~700 | KL-control / LMDP |
| 4 | 2010 | Theodorou 等 | Generalized Path Integral Control | JMLR | ~950 | PI² 策略搜索 |
| 5 | 2015 | Williams 等 | MPPI using Covariance Variable Importance Sampling | arXiv→JGCD | ~350 | MPPI 首次提出 |
| 6 | 2016 | Williams 等 | Aggressive Driving with MPPI | ICRA | ~600 | AutoRally 实车 |
| 7 | 2017 | Williams 等 | MPPI: From Theory to Parallel Computation | JGCD | ~700 | GPU 工程详解 |
| 8 | 2018 | Williams 等 | Information-Theoretic MPC | T-RO | ~1000 | 信息论统一推导 |
| 9 | 2018 | Williams 等 | Robust Sampling Based MPC (Tube-MPPI) | RSS | ~200 | nominal+tracking 双层 |
| 10 | 2019 | Goldfain 等 | AutoRally: An Open Platform | IEEE CSM | ~350 | 完整硬件平台 |
| 11 | 2020 | Pinneri 等 | iCEM | CoRL | ~150 | 有色噪声+elite memory |
| 12 | 2020 | Lambert 等 | Stein Variational MPC | CoRL | ~130 | SVGD 非参数多模态 |
| 13 | 2020 | Pravitra 等 | L1-Adaptive MPPI | CDC | ~60 | L1+MPPI 无人机 |
| 14 | 2021 | Gandhi 等 | Robust MPPI | RA-L | ~100 | 自由能上界证明 |
| 15 | 2021 | Wang, Theodorou 等 | Tsallis VI-MPC | RSS | ~80 | 统一 MPPI/CEM/SV-MPC |
| 16 | 2021 | Bhardwaj 等 | STORM | CoRL/IROS | ~150 | GPU MPPI 操作 |
| 17 | 2022 | Kim 等 | Smooth MPPI | RA-L | ~80 | input-lifting |
| 18 | 2022 | Mohamed 等 | Log-MPPI | RA-L | ~60 | NLN 混合采样 |
| 19 | 2022 | Howell 等 | Predictive Sampling (MJPC) | arXiv | ~100 | 极简采样器基线 |
| 20 | 2022 | Hansen 等 | TD-MPC | ICML | ~300 | latent MPPI + TD value |
| 21 | 2024 | Hansen 等 | TD-MPC2 | ICLR | ~200 | 317M 参数 104 任务 |
| 22 | 2024 | Honda 等 | SVG-MPPI | ICRA | ~20 | Stein 变分引导 |
| 23 | 2024 | Yi, Pan 等 | CoVO-MPC | L4DC | ~30 | 首个收敛性证明 |
| 24 | 2024 | Pan, Shi | Model-Based Diffusion (MBD) | NeurIPS | ~新 | 动力学作为 score |
| 25 | 2024 | Vlahov 等 | MPPI-Generic | arXiv | ~新 | 统一 CUDA 库 |
| 26 | 2025 | Xue, Pan 等 | DIAL-MPC | ICRA BP Finalist | ~新 | 扩散退火全身 MPPI |
| 27 | 2025 | Mohamed 等 | U-MPPI | T-RO | ~新 | Unscented Transform |
| 28 | 2025 | Alvarez-Padilla 等 | Whole-Body MPPI | ICRA (CMU) | ~新 | 全身力矩级 MPPI |
注:引用量为 2026 年 4 月 Google Scholar / Semantic Scholar 量级估计,"~新"表示发表不足 1 年。
附录 B:开源项目速查表¶
| # | 项目名 | GitHub | Stars | 语言 | License | 一句话描述 | 教学价值 |
|---|---|---|---|---|---|---|---|
| 1 | MPPI-Generic | ACDSLab/MPPI-Generic | ~80 | C++/CUDA | Apache-2.0 | Georgia Tech 官方 CUDA MPPI 库 | ★★★★★ |
| 2 | pytorch_mppi | UM-ARM-Lab/pytorch_mppi | ~670 | Python/PyTorch | MIT | PyTorch MPPI,含 SMPPI/KMPPI | ★★★★★ |
| 3 | MuJoCo MPC (MJPC) | google-deepmind/mujoco_mpc | ~1.6k | C++/Python | Apache-2.0 | 4 种 planner 横向对比平台 | ★★★★★ |
| 4 | AutoRally | AutoRally/autorally | ~900 | C++/CUDA/ROS1 | BSD | MPPI 原始实车平台 | ★★★★ |
| 5 | Nav2 MPPI | ros-navigation/navigation2 | ~2.5k | C++/ROS2 | BSD | 工业级 ROS2 MPPI 导航 | ★★★★★ |
| 6 | DIAL-MPC | LeCAR-Lab/dial-mpc | ~200 | Python/JAX | MIT | 扩散退火全身 MPPI | ★★★★ |
| 7 | CoVO-MPC | LeCAR-Lab/CoVO-MPC | ~50 | Python/JAX | MIT | 最优协方差设计 | ★★★★ |
| 8 | TD-MPC2 | nicklashansen/tdmpc2 | ~770 | Python/PyTorch | MIT | 317M 世界模型+MPPI | ★★★★★ |
| 9 | STORM | NVlabs/storm | ~200 | Python/PyTorch | — | GPU MPPI 操作 | ★★★★ |
| 10 | iCEM | martius-lab/iCEM | ~70 | Python | — | 改进 CEM 轨迹优化 | ★★★ |
| 11 | SVG-MPPI | kohonda/proj-svg_mppi | ~110 | C++/ROS1 | — | Stein 变分引导 MPPI | ★★★ |
| 12 | log-MPPI_ros | IhabMohamed/log-MPPI_ros | ~30 | Python/PyCUDA | — | Log-MPPI ROS 实现 | ★★★ |
| 13 | U-MPPI | IhabMohamed/U-MPPI | ~10 | Python/ROS | — | Unscented MPPI | ★★★ |
| 14 | TD-MPC | nicklashansen/tdmpc | ~500 | Python/PyTorch | MIT | TD-MPC 早期版本 | ★★★ |
| 15 | MBD | LeCAR-Lab/model-based-diffusion | ~50 | Python/JAX | MIT | 模型基扩散轨迹优化 | ★★★ |
注:Stars 为 2026 年 4 月估计值。
附录 C:推荐学习资源¶
博客与教程¶
- Georgia Tech ACDS Lab MPPI 主页:https://sites.gatech.edu/acds/mppi/——论文/代码/视频汇总
- MPPI-Generic 官方文档:https://acdslab.github.io/mppi-generic-website/——算法概述+API
- Steve Macenski Nav2 MPPI 文档:https://docs.ros.org/en/iron/p/nav2_mppi_controller/
- Freiburg 大学 MPCRL 课程 Lecture 10 "MPPI Control"——优秀的数学推导讲义
视频讲座¶
- Theodorou "Path Integral Control and Stochastic Optimal Control" 系列讲座(Georgia Tech)
- ROSCon 2023 Nav2 MPPI 演讲(Macenski/Budyakov)
- CMU LeCAR Lab DIAL-MPC / CoVO-MPC 视频演示
教材章节¶
- Kappen & Ruiz, "Stochastic Optimal Control Theory" 综述章节
- Theodorou 博士论文(USC 2011):"Iterative Path Integral Stochastic Optimal Control"
附录 D:MPPI 与梯度式 MPC 数学对照表¶
| 数学概念 | 梯度式 MPC (iLQR/SQP) | 采样式 MPC (MPPI) |
|---|---|---|
| 核心方程 | KKT 条件 / Riccati 递推 | Feynman-Kac 路径积分 |
| 最优性条件 | \(\nabla_u L = 0\)(一阶必要) | \(P^* \propto Q \cdot \exp(-S/\lambda)\)(吉布斯分布) |
| 求解方式 | 矩阵分解(Cholesky/LDL) | 蒙特卡洛采样 + 加权平均 |
| 梯度来源 | 解析/自动微分 | 不需要梯度 |
| 温度/正则化 | Tikhonov 正则化 \(\lambda \cdot \|\delta u\|^2\) | 温度参数 \(\lambda\)(KL 正则化) |
| 收敛性 | 局部二次收敛 | 线性收敛(CoVO-MPC 证明) |
| 约束处理 | 内点法/ADMM/投影 | Barrier 函数/拒绝采样/CBF |
| 并行性 | 低(Riccati 串行) | 极高(K 条 rollout 独立) |
| 代价函数要求 | C² 连续,Hessian 正定 | 任意(含 indicator) |
| 动力学要求 | 可微(\(\partial f/\partial x, \partial f/\partial u\)) | 黑箱(仿真器即可) |
| RL 等价 | 可微 MPC 作为 actor | MPPI \(\equiv\) 零阶策略梯度 |
从 MPPI 专项进入多机器人协作专项:MPPI/采样式 MPC 提供了一种强大的单体规划求解范式。但当场景中存在多个机器人需要协作时,问题的核心从"如何为一个智能体求解最优控制"转变为"如何让 N 个智能体在共享环境中协调动作"。这涉及通信拓扑、共识算法、分布式优化、协同力学等全新维度。接下来的多机器人协作专项正是处理这些"从单体到多体"的系统级挑战——它综合运用了前述各专题的成果,包括时空联合规划中的 MAPF/CBS(T5)、不确定性规划中的分布式 MPC(U2)、博弈规划中的 Nash 均衡与 MARL(G1-G4),以及 MPPI 本身在多智能体场景下的扩展。