跳转至

120_附录

附录


附录 A:完整论文谱系表

# 年份 作者 论文标题 Venue 引用 核心贡献
1 2005 Kappen Path integrals and symmetry breaking for optimal control theory J.Stat.Mech. ~2000 HJB 指数变换→线性 PDE
2 2005 Kappen Linear theory for control of nonlinear stochastic systems PRL ~800 姊妹篇
3 2009 Todorov Efficient computation of optimal actions PNAS ~700 KL-control / LMDP
4 2010 Theodorou 等 Generalized Path Integral Control JMLR ~950 PI² 策略搜索
5 2015 Williams 等 MPPI using Covariance Variable Importance Sampling arXiv→JGCD ~350 MPPI 首次提出
6 2016 Williams 等 Aggressive Driving with MPPI ICRA ~600 AutoRally 实车
7 2017 Williams 等 MPPI: From Theory to Parallel Computation JGCD ~700 GPU 工程详解
8 2018 Williams 等 Information-Theoretic MPC T-RO ~1000 信息论统一推导
9 2018 Williams 等 Robust Sampling Based MPC (Tube-MPPI) RSS ~200 nominal+tracking 双层
10 2019 Goldfain 等 AutoRally: An Open Platform IEEE CSM ~350 完整硬件平台
11 2020 Pinneri 等 iCEM CoRL ~150 有色噪声+elite memory
12 2020 Lambert 等 Stein Variational MPC CoRL ~130 SVGD 非参数多模态
13 2020 Pravitra 等 L1-Adaptive MPPI CDC ~60 L1+MPPI 无人机
14 2021 Gandhi 等 Robust MPPI RA-L ~100 自由能上界证明
15 2021 Wang, Theodorou 等 Tsallis VI-MPC RSS ~80 统一 MPPI/CEM/SV-MPC
16 2021 Bhardwaj 等 STORM CoRL/IROS ~150 GPU MPPI 操作
17 2022 Kim 等 Smooth MPPI RA-L ~80 input-lifting
18 2022 Mohamed 等 Log-MPPI RA-L ~60 NLN 混合采样
19 2022 Howell 等 Predictive Sampling (MJPC) arXiv ~100 极简采样器基线
20 2022 Hansen 等 TD-MPC ICML ~300 latent MPPI + TD value
21 2024 Hansen 等 TD-MPC2 ICLR ~200 317M 参数 104 任务
22 2024 Honda 等 SVG-MPPI ICRA ~20 Stein 变分引导
23 2024 Yi, Pan 等 CoVO-MPC L4DC ~30 首个收敛性证明
24 2024 Pan, Shi Model-Based Diffusion (MBD) NeurIPS ~新 动力学作为 score
25 2024 Vlahov 等 MPPI-Generic arXiv ~新 统一 CUDA 库
26 2025 Xue, Pan 等 DIAL-MPC ICRA BP Finalist ~新 扩散退火全身 MPPI
27 2025 Mohamed 等 U-MPPI T-RO ~新 Unscented Transform
28 2025 Alvarez-Padilla 等 Whole-Body MPPI ICRA (CMU) ~新 全身力矩级 MPPI

注:引用量为 2026 年 4 月 Google Scholar / Semantic Scholar 量级估计,"~新"表示发表不足 1 年。


附录 B:开源项目速查表

# 项目名 GitHub Stars 语言 License 一句话描述 教学价值
1 MPPI-Generic ACDSLab/MPPI-Generic ~80 C++/CUDA Apache-2.0 Georgia Tech 官方 CUDA MPPI 库 ★★★★★
2 pytorch_mppi UM-ARM-Lab/pytorch_mppi ~670 Python/PyTorch MIT PyTorch MPPI,含 SMPPI/KMPPI ★★★★★
3 MuJoCo MPC (MJPC) google-deepmind/mujoco_mpc ~1.6k C++/Python Apache-2.0 4 种 planner 横向对比平台 ★★★★★
4 AutoRally AutoRally/autorally ~900 C++/CUDA/ROS1 BSD MPPI 原始实车平台 ★★★★
5 Nav2 MPPI ros-navigation/navigation2 ~2.5k C++/ROS2 BSD 工业级 ROS2 MPPI 导航 ★★★★★
6 DIAL-MPC LeCAR-Lab/dial-mpc ~200 Python/JAX MIT 扩散退火全身 MPPI ★★★★
7 CoVO-MPC LeCAR-Lab/CoVO-MPC ~50 Python/JAX MIT 最优协方差设计 ★★★★
8 TD-MPC2 nicklashansen/tdmpc2 ~770 Python/PyTorch MIT 317M 世界模型+MPPI ★★★★★
9 STORM NVlabs/storm ~200 Python/PyTorch GPU MPPI 操作 ★★★★
10 iCEM martius-lab/iCEM ~70 Python 改进 CEM 轨迹优化 ★★★
11 SVG-MPPI kohonda/proj-svg_mppi ~110 C++/ROS1 Stein 变分引导 MPPI ★★★
12 log-MPPI_ros IhabMohamed/log-MPPI_ros ~30 Python/PyCUDA Log-MPPI ROS 实现 ★★★
13 U-MPPI IhabMohamed/U-MPPI ~10 Python/ROS Unscented MPPI ★★★
14 TD-MPC nicklashansen/tdmpc ~500 Python/PyTorch MIT TD-MPC 早期版本 ★★★
15 MBD LeCAR-Lab/model-based-diffusion ~50 Python/JAX MIT 模型基扩散轨迹优化 ★★★

注:Stars 为 2026 年 4 月估计值。


附录 C:推荐学习资源

博客与教程

  • Georgia Tech ACDS Lab MPPI 主页:https://sites.gatech.edu/acds/mppi/——论文/代码/视频汇总
  • MPPI-Generic 官方文档:https://acdslab.github.io/mppi-generic-website/——算法概述+API
  • Steve Macenski Nav2 MPPI 文档:https://docs.ros.org/en/iron/p/nav2_mppi_controller/
  • Freiburg 大学 MPCRL 课程 Lecture 10 "MPPI Control"——优秀的数学推导讲义

视频讲座

  • Theodorou "Path Integral Control and Stochastic Optimal Control" 系列讲座(Georgia Tech)
  • ROSCon 2023 Nav2 MPPI 演讲(Macenski/Budyakov)
  • CMU LeCAR Lab DIAL-MPC / CoVO-MPC 视频演示

教材章节

  • Kappen & Ruiz, "Stochastic Optimal Control Theory" 综述章节
  • Theodorou 博士论文(USC 2011):"Iterative Path Integral Stochastic Optimal Control"

附录 D:MPPI 与梯度式 MPC 数学对照表

数学概念 梯度式 MPC (iLQR/SQP) 采样式 MPC (MPPI)
核心方程 KKT 条件 / Riccati 递推 Feynman-Kac 路径积分
最优性条件 \(\nabla_u L = 0\)(一阶必要) \(P^* \propto Q \cdot \exp(-S/\lambda)\)(吉布斯分布)
求解方式 矩阵分解(Cholesky/LDL) 蒙特卡洛采样 + 加权平均
梯度来源 解析/自动微分 不需要梯度
温度/正则化 Tikhonov 正则化 \(\lambda \cdot \|\delta u\|^2\) 温度参数 \(\lambda\)(KL 正则化)
收敛性 局部二次收敛 线性收敛(CoVO-MPC 证明)
约束处理 内点法/ADMM/投影 Barrier 函数/拒绝采样/CBF
并行性 低(Riccati 串行) 极高(K 条 rollout 独立)
代价函数要求 C² 连续,Hessian 正定 任意(含 indicator)
动力学要求 可微(\(\partial f/\partial x, \partial f/\partial u\) 黑箱(仿真器即可)
RL 等价 可微 MPC 作为 actor MPPI \(\equiv\) 零阶策略梯度

从 MPPI 专项进入多机器人协作专项:MPPI/采样式 MPC 提供了一种强大的单体规划求解范式。但当场景中存在多个机器人需要协作时,问题的核心从"如何为一个智能体求解最优控制"转变为"如何让 N 个智能体在共享环境中协调动作"。这涉及通信拓扑、共识算法、分布式优化、协同力学等全新维度。接下来的多机器人协作专项正是处理这些"从单体到多体"的系统级挑战——它综合运用了前述各专题的成果,包括时空联合规划中的 MAPF/CBS(T5)、不确定性规划中的分布式 MPC(U2)、博弈规划中的 Nash 均衡与 MARL(G1-G4),以及 MPPI 本身在多智能体场景下的扩展。