120_附录

附录¶

附录 A：完整论文谱系表¶

#	年份	作者	论文标题	Venue	引用	核心贡献
1	2005	Kappen	Path integrals and symmetry breaking for optimal control theory	J.Stat.Mech.	~2000	HJB 指数变换→线性 PDE
2	2005	Kappen	Linear theory for control of nonlinear stochastic systems	PRL	~800	姊妹篇
3	2009	Todorov	Efficient computation of optimal actions	PNAS	~700	KL-control / LMDP
4	2010	Theodorou 等	Generalized Path Integral Control	JMLR	~950	PI² 策略搜索
5	2015	Williams 等	MPPI using Covariance Variable Importance Sampling	arXiv→JGCD	~350	MPPI 首次提出
6	2016	Williams 等	Aggressive Driving with MPPI	ICRA	~600	AutoRally 实车
7	2017	Williams 等	MPPI: From Theory to Parallel Computation	JGCD	~700	GPU 工程详解
8	2018	Williams 等	Information-Theoretic MPC	T-RO	~1000	信息论统一推导
9	2018	Williams 等	Robust Sampling Based MPC (Tube-MPPI)	RSS	~200	nominal+tracking 双层
10	2019	Goldfain 等	AutoRally: An Open Platform	IEEE CSM	~350	完整硬件平台
11	2020	Pinneri 等	iCEM	CoRL	~150	有色噪声+elite memory
12	2020	Lambert 等	Stein Variational MPC	CoRL	~130	SVGD 非参数多模态
13	2020	Pravitra 等	L1-Adaptive MPPI	CDC	~60	L1+MPPI 无人机
14	2021	Gandhi 等	Robust MPPI	RA-L	~100	自由能上界证明
15	2021	Wang, Theodorou 等	Tsallis VI-MPC	RSS	~80	统一 MPPI/CEM/SV-MPC
16	2021	Bhardwaj 等	STORM	CoRL/IROS	~150	GPU MPPI 操作
17	2022	Kim 等	Smooth MPPI	RA-L	~80	input-lifting
18	2022	Mohamed 等	Log-MPPI	RA-L	~60	NLN 混合采样
19	2022	Howell 等	Predictive Sampling (MJPC)	arXiv	~100	极简采样器基线
20	2022	Hansen 等	TD-MPC	ICML	~300	latent MPPI + TD value
21	2024	Hansen 等	TD-MPC2	ICLR	~200	317M 参数 104 任务
22	2024	Honda 等	SVG-MPPI	ICRA	~20	Stein 变分引导
23	2024	Yi, Pan 等	CoVO-MPC	L4DC	~30	首个收敛性证明
24	2024	Pan, Shi	Model-Based Diffusion (MBD)	NeurIPS	~新	动力学作为 score
25	2024	Vlahov 等	MPPI-Generic	arXiv	~新	统一 CUDA 库
26	2025	Xue, Pan 等	DIAL-MPC	ICRA BP Finalist	~新	扩散退火全身 MPPI
27	2025	Mohamed 等	U-MPPI	T-RO	~新	Unscented Transform
28	2025	Alvarez-Padilla 等	Whole-Body MPPI	ICRA (CMU)	~新	全身力矩级 MPPI

注：引用量为 2026 年 4 月 Google Scholar / Semantic Scholar 量级估计，"~新"表示发表不足 1 年。

附录 B：开源项目速查表¶

#	项目名	GitHub	Stars	语言	License	一句话描述	教学价值
1	MPPI-Generic	ACDSLab/MPPI-Generic	~80	C++/CUDA	Apache-2.0	Georgia Tech 官方 CUDA MPPI 库	★★★★★
2	pytorch_mppi	UM-ARM-Lab/pytorch_mppi	~670	Python/PyTorch	MIT	PyTorch MPPI，含 SMPPI/KMPPI	★★★★★
3	MuJoCo MPC (MJPC)	google-deepmind/mujoco_mpc	~1.6k	C++/Python	Apache-2.0	4 种 planner 横向对比平台	★★★★★
4	AutoRally	AutoRally/autorally	~900	C++/CUDA/ROS1	BSD	MPPI 原始实车平台	★★★★
5	Nav2 MPPI	ros-navigation/navigation2	~2.5k	C++/ROS2	BSD	工业级 ROS2 MPPI 导航	★★★★★
6	DIAL-MPC	LeCAR-Lab/dial-mpc	~200	Python/JAX	MIT	扩散退火全身 MPPI	★★★★
7	CoVO-MPC	LeCAR-Lab/CoVO-MPC	~50	Python/JAX	MIT	最优协方差设计	★★★★
8	TD-MPC2	nicklashansen/tdmpc2	~770	Python/PyTorch	MIT	317M 世界模型+MPPI	★★★★★
9	STORM	NVlabs/storm	~200	Python/PyTorch	—	GPU MPPI 操作	★★★★
10	iCEM	martius-lab/iCEM	~70	Python	—	改进 CEM 轨迹优化	★★★
11	SVG-MPPI	kohonda/proj-svg_mppi	~110	C++/ROS1	—	Stein 变分引导 MPPI	★★★
12	log-MPPI_ros	IhabMohamed/log-MPPI_ros	~30	Python/PyCUDA	—	Log-MPPI ROS 实现	★★★
13	U-MPPI	IhabMohamed/U-MPPI	~10	Python/ROS	—	Unscented MPPI	★★★
14	TD-MPC	nicklashansen/tdmpc	~500	Python/PyTorch	MIT	TD-MPC 早期版本	★★★
15	MBD	LeCAR-Lab/model-based-diffusion	~50	Python/JAX	MIT	模型基扩散轨迹优化	★★★

注：Stars 为 2026 年 4 月估计值。

附录 C：推荐学习资源¶

博客与教程¶

Georgia Tech ACDS Lab MPPI 主页：https://sites.gatech.edu/acds/mppi/——论文/代码/视频汇总
MPPI-Generic 官方文档：https://acdslab.github.io/mppi-generic-website/——算法概述+API
Steve Macenski Nav2 MPPI 文档：https://docs.ros.org/en/iron/p/nav2_mppi_controller/
Freiburg 大学 MPCRL 课程 Lecture 10 "MPPI Control"——优秀的数学推导讲义

视频讲座¶

Theodorou "Path Integral Control and Stochastic Optimal Control" 系列讲座（Georgia Tech）
ROSCon 2023 Nav2 MPPI 演讲（Macenski/Budyakov）
CMU LeCAR Lab DIAL-MPC / CoVO-MPC 视频演示

教材章节¶

Kappen & Ruiz, "Stochastic Optimal Control Theory" 综述章节
Theodorou 博士论文（USC 2011）："Iterative Path Integral Stochastic Optimal Control"

附录 D：MPPI 与梯度式 MPC 数学对照表¶

数学概念	梯度式 MPC (iLQR/SQP)	采样式 MPC (MPPI)
核心方程	KKT 条件 / Riccati 递推	Feynman-Kac 路径积分
最优性条件	\(\nabla_u L = 0\)（一阶必要）	\(P^* \propto Q \cdot \exp(-S/\lambda)\)（吉布斯分布）
求解方式	矩阵分解（Cholesky/LDL）	蒙特卡洛采样 + 加权平均
梯度来源	解析/自动微分	不需要梯度
温度/正则化	Tikhonov 正则化 \(\lambda \cdot \\|\delta u\\|^2\)	温度参数 \(\lambda\)（KL 正则化）
收敛性	局部二次收敛	线性收敛（CoVO-MPC 证明）
约束处理	内点法/ADMM/投影	Barrier 函数/拒绝采样/CBF
并行性	低（Riccati 串行）	极高（K 条 rollout 独立）
代价函数要求	C² 连续，Hessian 正定	任意（含 indicator）
动力学要求	可微（\(\partial f/\partial x, \partial f/\partial u\)）	黑箱（仿真器即可）
RL 等价	可微 MPC 作为 actor	MPPI \(\equiv\) 零阶策略梯度

从 MPPI 专项进入多机器人协作专项：MPPI/采样式 MPC 提供了一种强大的单体规划求解范式。但当场景中存在多个机器人需要协作时，问题的核心从"如何为一个智能体求解最优控制"转变为"如何让 N 个智能体在共享环境中协调动作"。这涉及通信拓扑、共识算法、分布式优化、协同力学等全新维度。接下来的多机器人协作专项正是处理这些"从单体到多体"的系统级挑战——它综合运用了前述各专题的成果，包括时空联合规划中的 MAPF/CBS（T5）、不确定性规划中的分布式 MPC（U2）、博弈规划中的 Nash 均衡与 MARL（G1-G4），以及 MPPI 本身在多智能体场景下的扩展。