150_附录
附录
附录 A:完整论文谱系表
| # |
年份 |
作者 |
论文标题 |
Venue |
引用 |
核心贡献 |
| 1 |
2004 |
Olfati-Saber, Murray |
Consensus Problems in Networks of Agents |
TAC |
~12000 |
共识奠基 |
| 2 |
2005 |
Ren, Beard |
Consensus Seeking in Multiagent Systems |
TAC |
~8000 |
动态拓扑共识 |
| 3 |
2006 |
Olfati-Saber |
Flocking for Multi-Agent Dynamic Systems |
TAC |
~6000 |
蜂群三规则 |
| 4 |
2007 |
Olfati-Saber 等 |
Consensus and Cooperation in Networked MAS |
Proc. IEEE |
~12000 |
综述标杆 |
| 5 |
2008 |
Keviczky 等 |
Decentralized Receding Horizon Control |
T-CST |
~500 |
分布式 MPC 编队 |
| 6 |
2009 |
Choi, How |
CBBA |
T-RO |
~1000 |
共识拍卖任务分配 |
| 7 |
2011 |
Boyd 等 |
ADMM |
Found. Trends |
~12000 |
分布式优化标准框架 |
| 8 |
2012 |
Sharon 等 |
CBS for MAPF |
AAAI→AIJ |
~1500 |
两层冲突搜索 |
| 9 |
2017 |
Lowe 等 |
MADDPG |
NeurIPS |
~8000 |
CTDE 奠基 |
| 10 |
2018 |
Rashid 等 |
QMIX |
ICML |
~3000 |
值函数分解 |
| 11 |
2019 |
Verginis 等 |
Cooperative Manipulation via Internal Force |
T-CST |
~100 |
分布式自适应搬运 |
| 12 |
2022 |
Kuba 等 |
HATRPO/HAPPO |
ICLR |
~300 |
异构 MARL 单调改进 |
| 13 |
2022 |
Yu 等 |
MAPPO |
NeurIPS |
~1500 |
PPO 协作 MARL 强基线 |
| 14 |
2022 |
Zhao, Finn |
ALOHA |
RSS |
~300 |
低成本双臂遥操作 |
| 15 |
2023 |
Kim, Hamed 等 |
Layered Control for Cooperative Locomotion |
T-RO |
~80 |
多足协同 MPC+WBC 标杆 |
| 16 |
2023 |
De Vincenti, Coros |
Centralized MPC for Collaborative Loco-Manipulation |
RSS |
~50 |
Robot-agnostic SQP |
| 17 |
2023 |
Okumura |
LaCAM |
AAAI |
~100 |
万级 agent MAPF |
| 18 |
2024 |
Fu 等 |
Mobile ALOHA |
CoRL |
~440 |
移动双臂 50 demo 学习 |
| 19 |
2024 |
Chi 等 |
Diffusion Policy |
RSS |
~600 |
扩散策略双臂操作 |
| 20 |
2024 |
Xiong 等 |
MQE |
IROS |
~20 |
多四足 MARL 环境 |
| 21 |
2024 |
Qin 等 |
GCBF+ |
T-RO |
~30 |
GNN-CBF 可扩展安全 |
| 22 |
2024 |
Mandi 等 |
RoCo |
ICRA |
~40 |
LLM 多机协调 |
| 23 |
2024 |
Turrisi 等 |
PACC |
IROS |
~新 |
被动臂协同搬运 |
| 24 |
2024 |
An, Hutter |
Permutation-invariant Networks |
RSS |
~新 |
排列不变多足策略 |
| 25 |
2025 |
Pandit 等 |
decPLM |
arXiv |
~新 |
10 Go2 零通信搬运 |
| 26 |
2025 |
Jose, Zhang |
Dual-Quadruped Safe RL |
arXiv |
~新 |
HAPPO+CMDG |
| 27 |
2025 |
Imran, Hamed |
Obstacle-Aware Distributed NMPC |
J. Dyn. Sys. |
~新 |
4 agent 分布式 NMPC+CBF |
| 28 |
2025 |
Zhang, Fan |
Discrete GCBF PPO |
ICLR |
~新 |
CBF+PPO 融合 |
| 29 |
2025 |
Pandit 等 |
Multi-Biped Transport |
CoRL |
~新 |
多人形搬运 |
| 30 |
2025 |
FALCON |
Force-Adaptive Loco-Manipulation |
arXiv |
~新 |
人形力自适应 |
注:引用量为 2026 年 4 月 Google Scholar / Semantic Scholar 量级估计。
附录 B:开源项目速查表
| # |
项目名 |
GitHub |
Stars |
语言 |
一句话描述 |
教学价值 |
| 1 |
libMultiRobotPlanning |
whoenig/ |
~500 |
C++14 |
CBS/ECBS/SIPP MAPF 实现 |
★★★★★ |
| 2 |
MAPPO (on-policy) |
marlbenchmark/ |
~1.8k |
Python |
MAPPO 官方实现 |
★★★★★ |
| 3 |
HARL |
PKU-MARL/ |
~300 |
Python |
HAPPO/HATD3/HASAC 统一库 |
★★★★★ |
| 4 |
PyMARL |
oxwhirl/ |
~800 |
Python |
QMIX/VDN/COMA 实现 |
★★★★ |
| 5 |
MQE |
ziyanx02/ |
~200 |
Python |
IsaacGym 多四足环境 |
★★★★★ |
| 6 |
GCBF+ |
MIT-REALM/ |
~100 |
JAX |
GNN-CBF 安全多智能体 |
★★★★★ |
| 7 |
Mobile ALOHA |
tonyzhaozh/ |
~3k |
Python |
双臂移动操作 |
★★★★ |
| 8 |
Diffusion Policy |
columbia-ai/ |
~1.5k |
Python |
扩散策略双臂操作 |
★★★★ |
| 9 |
Open-RMF |
open-rmf/ |
~200 |
C++/ROS2 |
多机器人中间件 |
★★★ |
| 10 |
OCS2 |
leggedrobotics/ |
~1k |
C++ |
单体/多体 MPC 框架 |
★★★★★ |
| 11 |
EECBS |
Jiaoyang-Li/ |
~200 |
C++ |
高效 ECBS MAPF |
★★★★ |
| 12 |
decPLM |
(如开源) |
— |
Python |
零通信多足搬运 |
★★★★ |
| 13 |
TD-MPC2 |
nicklashansen/ |
~770 |
Python |
世界模型+MPPI(单体参考) |
★★★ |
| 14 |
nav2_multi_robot |
ros-navigation/ |
~2.5k |
C++/ROS2 |
Nav2 多机扩展 |
★★★ |
| 15 |
IsaacLab |
isaac-sim/ |
~3k |
Python |
GPU 并行仿真(多 agent) |
★★★★★ |
附录 C:推荐学习资源
教材与综述
- Bullo, "Lectures on Network Systems"(免费在线教材)——图论+共识+分布式控制的最佳教材
- Olfati-Saber 2007 Proc. IEEE 综述——多智能体共识的经典
- Zhong 2023 JMLR HARL——异构 MARL 的系统化综述
视频讲座
- MIT 6.832 Underactuated Robotics(Tedrake)——多体系统控制基础
- UC Berkeley CS 285 Deep RL(Levine)——单智能体 RL→MARL 的直接扩展
- CMU 16-891 Multi-Robot Planning and Coordination——多机规划课程
重要会议/期刊
- 规控方向:IEEE T-RO、RA-L、ICRA、IROS、RSS、CoRL
- MARL 方向:NeurIPS、ICML、ICLR、AAMAS
- 安全方向:L-CSS、CDC、ACC
附录 D:同构/异构/无人机集群方法对照表
| 维度 |
同构多足(本大纲重点) |
异构地空(本大纲涵盖) |
纯无人机集群(排除,仅对照) |
| 典型系统 |
2-10 Go2 搬运 |
Go2 + Crazyflie |
10-100+ 四旋翼 |
| 动力学耦合 |
通过负载力耦合 |
通过任务/通信耦合 |
通过下洗流/碰撞 |
| 控制范式 |
分布式 MPC / MAPPO |
HAPPO / 层次化 |
EGO-Swarm / MADER |
| 代表规划器 |
ADMM-MPC / CBS |
CBBA 异构扩展 |
安全走廊+B 样条 |
| MARL 可行性 |
高(参数共享) |
中(需 HAPPO) |
高(但 sim-to-real 难) |
| 安全方法 |
pairwise CBF / GCBF+ |
分层 CBF |
安全走廊几何约束 |
| 通信需求 |
低-零(接触力隐式) |
中(任务分配) |
高(实时位置广播) |
| sim-to-real 难度 |
高(接触精度) |
极高(异构交互) |
中(空气动力学简单) |
| 开源生态 |
MQE、OCS2 |
较少 |
EGO-Swarm、MADER 成熟 |
| 成熟度 |
2023 起快速发展 |
2024 起探索 |
2020 起已成熟 |