附录A_轨迹生成深度叙述
附录A:无人机轨迹生成深度叙述¶
→ 对应主大纲章节:D3-D5(轨迹优化/B样条/安全飞行走廊)
无人机轨迹生成十五年:从最小抖动到MINCO¶
四旋翼运动规划的发展历程讲述了一个连贯的故事:如何利用微分平坦性,将一个棘手的非线性最优控制问题转化为稀疏、带状、易于求梯度的优化问题,使其能在嵌入式CPU上以千赫兹级速度收敛。每一项重大进展——梅林格(Mellinger)的最小抖动四旋翼规划(QP) (2011)、Richter的无约束重构(2013)、Fast-Planner的运动动力学B样条管道(2019)、EGO-Planner对ESDF的消除(2021),以及Wang等人提出的MINCO表示法(2022)——都逐步揭示了更多结构并简化了更多实现机制。 到2025年,浙江大学FAST实验室、香港科技大学空中机器人实验室和香港大学MaRS实验室已将激进的自主飞行精炼为仅数百行“仅头文件”的C++代码,这些代码基于Eigen并捆绑了L-BFGS算法。本报告追溯了这一演变历程,并基于SLAM工程师理解该领域所需的精确论文、代码库和代码成果。
这一叙事弧分为四个篇章。 第一幕(2011–2016)确立了平滑输出空间中的多项式轨迹作为标准表示形式。第二幕(2019–2021)将其替换为均匀B样条,以实现实时局部路径重规划。第三幕(2022)通过MINCO类回归多项式,该类能在**每段线性时间**内联合优化空间航点与航段时长。 第四幕(2023–2025)将安全保障(双轨迹、配置空间走廊)融入其中,将表示方法推广至四旋翼以外的场景(尾坐式飞行器、地面机器人),并开始将其与学习技术(神经网络MPC、强化学习竞速)融合。
第一幕,2011–2016:平坦输出空间中的多项式¶
奠基性论文是**Daniel Mellinger 和 Vijay Kumar 的《四旋翼机的最小瞬变轨迹生成与控制》(Minimum Snap Trajectory Generation and Control for Quadrotors),发表于 ICRA 2011,第 2520–2525 页**(DOI 10.1109/ICRA.2011.5980409)。 梅林格证明了四旋翼机在平坦输出 \(\sigma = (x, y, z, \psi)\) 下具有微分平坦性:给定该4维空间中的一个 \(C^4\) 轨迹,其完整的12维状态及全部四个输入量均可通过代数方法恢复。 微分链条至关重要——推力由加速度决定,姿态由加加速度决定,机体角速度由加加速度决定,而电机控制角速度则由瞬变率(即四阶导数)决定。因此,最小化 \(\int\|\sigma^{(4)}\|^2\) 可获得平滑的电机控制指令。 由此产生的QP在每个航点处将位置及至瞬变的导数进行固定,从而生成7次或9次多项式片段(对应N=8或N=10个系数);连续性约束将相邻片段耦合;通过采样线性不等式来确保航道安全。其理论基础是Murray、Rathinam和Sluis于1995年提出的微分平坦机械系统目录。
两年后,Charles Richter、Adam Bry 和 Nicholas Roy 在《密集室内环境中四旋翼机激进飞行的多项式轨迹规划》(ISRR 2013)(Springer STAR 第 114 卷,第 649–666 页,2016 年)一文中解决了 Mellinger 方法的数值瓶颈。 单项式基生成了一个范德蒙德(Vandermonde)式的映射,其条件数随多项式阶数和分段数呈指数级增长;梅林格的受约束多项式规划在超过五个9阶分段时,成功率降至0%。 Richter的诀窍在于**将变量从系数转换为端点导数**:求解各区段映射A_i的逆矩阵,将导数划分为固定项(路点、边界条件)和自由项(内部速度/加速度/抖动/瞬变),并以d_P* = −R_PP⁻¹ R_FPᵀ d_F的形式闭合KKT方程组。 此时自由变量已成为**物理意义明确且量级可比的量**,该公式在50多个15次段的配置下仍保持数值稳定性。该论文还确立了**运动学RRT* → 路点修剪 → 多项式QP → 基于二分法的碰撞修复**这一流程,此后所有规划器均效仿此流程。
这一时期最具代表性的开源项目是 ethz-asl/mav_trajectory_generation(Apache-2.0 许可证,截至 2026 年 4 月约有 640 个赞和 233 个分支),由 Rik Bähnemann 在 Roland Siegwart 的 ASL 团队维护。 它采用纯C++11实现,其**顶点 → 段 → 轨迹**的抽象层级与数学模型相呼应:一个Vertex包含一个std::map<int, Eigen::VectorXd>(用于存储导数阶→值约束),一个Segment拥有按维度划分的Polynomial对象及其持续时间,而Trajectory则将它们组合起来。 引擎是 PolynomialOptimization<N> —— 它以 系数个数作为非类型参数 进行模板化,甚至通过 static_assert(N % 2 == 0) 强制执行,从而确保在编译时已知海森矩阵块大小 Eigen::Matrix<double, N, N>,以支持 SIMD 和内联。 NLopt 提供了外层的时间分配循环(BOBYQA、SBPLX),而内层的 Richter 求解则采用稠密特征值分解。该库确立了该领域的术语体系——derivative_to_optimize、makeStartOrEnd,以及“瞬变与抖动”的选择——至今仍是大多数研究生接触该学科的入门方式。
其教学价值巨大。一位研读过这三份成果的SLAM工程师将理解:为何仅需位置和偏航角即可规划四旋翼机的完整状态、为何瞬变(而非跳变)是正确的成本、为何 \(2r-1\) 是最小化第r阶导数的正确多项式次数,以及**为何单项式基在数值计算中难以驾驭**。 此后发表的每篇论文都默认读者已具备这一理解。
第二幕,2019–2021:均匀B样条在实时重规划中取代多项式¶
多项式时代解决了在动作捕捉室中进行*离线*激进飞行的难题。而*在线*问题——即在嵌入式CPU上基于流式深度摄像头以10–100 Hz频率进行重规划——则需要一种不同的表示方法。
Vladyslav Usenko、Lukas von Stumberg、Andrej Pangercic 和 Daniel Cremers,《基于均匀B样条和3D环形缓冲区的微型飞行器实时轨迹重规划》,IROS 2017 (慕尼黑工业大学 DSO 团队)提出了这一新范式的两大支柱:一种 5 次均匀 B 样条(这是保证差分平滑控制下 \(C^4\) 连续性的最经济方式,无需拼接约束),以及一种 带增量 ESDF 的环形缓冲区 3D 占用网格(环形索引机制避免了无人机移动一个体素时产生的 \(O(N^3)\) 位移运算)。 其表 II ——“ESDF 构建消耗约 70% 的规划时间”——成为后续研究的焦点。相关代码库 VladyslavUsenko/ewok 目前拥有约 381 个星标。
随后,沈绍杰领导的香港科技大学空中机器人研究组发表了权威的 B-样条规划器: 周博宇、高飞、王璐琪、刘楚浩和沈绍杰,《用于快速自主飞行的鲁棒高效四旋翼轨迹生成》,IEEE RA-L 4(4):3529–3536, 2019(arXiv 1907.01531,发表于IROS 2019)。Fast-Planner的架构是其模板:一个基于双积分器状态空间中离散化加速度原语的运动动力学A*前端,采用**庞特里亚金最小原理(Pontryagin-minimum-principle)作为成本函数,既作为g值,也作为两点边界值启发式; 当节点可直接连接至目标时采用**解析式单步扩展(相当于四旋翼版的Reeds-Shepp算法);后端则采用B样条,通过NLopt求解平滑性 + 碰撞检测(ESDF-gradient)+ 可行性(对速度/加速度控制点施加凸包盒约束)。随后通过非均匀结点拉伸处理优化后的执行器限值问题。 2020年ICRA会议的后续研究引入了拓扑路径枚举(arXiv 1912.12644),而RAPTOR(T-RO 2021, arXiv 2007.03465)在此基础上进一步增加了偏航角/视场感知能力。 HKUST-Aerial-Robotics/Fast-Planner 目前拥有 ~3.2k 个星标、756 个分支(GPLv3)——这是 GitHub 上获得星标最多的单一无人机规划器。
由高飞领导的浙江大学FAST实验室对此给出了回应:周鑫、王哲培、叶洪凯、徐超和高飞合著的《EGO-Planner:一种无需ESDF的基于梯度的四旋翼局部规划器》(IEEE RA-L 2021)(arXiv 2008.08835)。 EGO-Planner的洞见看似简单:如果仅需碰撞控制点处的距离和梯度,则完全无需密集的ESDF。每个碰撞控制点 \(Q_j\) 都会获得一对按需生成的(p_ij, v_ij)——一个通过从 \(Q_j\) 向局部A*参考路径 \(\Gamma\) 进行射线投射而在障碍物表面上找到的锚点,以及一个单位排斥方向。 碰撞计算量降至 (sc − v_ij·(Q_j − p_ij))³₊,梯度计算仅需 −3(…)² v_ij —— 仅需进行标量-向量乘法,无需三线性插值,也无需体素扫描。多个对在迭代过程中可累积于单个控制点,经验表明这能加速通过凹形障碍物的收敛过程。 总规划时间降至**~1 毫秒**(相比之下,在相同硬件上 Fast-Planner 需 ~10 毫秒,Ewok 需 ~30 毫秒)。ZJU-FAST-Lab/ego-planner 达到 ~2.4k 星,ego-planner-swarm 达到 ~1.9k 星。
B-样条为何能胜出,归结于德布尔-考克斯基底的五个特性:凸包性质(对控制点施加盒形约束可保证整条曲线满足这些约束——将无限维路径约束替换为有限个线性约束)、局部支撑 (改变一个控制点仅影响 p+1 个子段,从而产生带状雅可比矩阵并支持暖启动重规划),自动 \(C^{p-1}\) 连续性(无需 KKT 拼接),导数 = 低阶 B-样条(速度/加速度/抖动成本在原始控制点上呈线性关系),以及**与滚动局部映射的自然契合**。 付出的代价是:B-样条对路点进行的是*近似*而非*插值*,且**时间分配与空间优化解耦**——除非后续叠加非均匀拉伸,否则单一均匀结点跨度必须是保守的。这种解耦正是MINCO随后要解决的问题。
工程模式在此得以凝练。这三种规划器均采用由小型 ROS 包(plan_env、path_searching、bspline_opt、plan_manage)构成的 catkin 工作空间, 在热点循环中使用 aligned_allocator 替代 std::vector 处理 Eigen 固定尺寸类型,并采用手动推导的解析梯度,因为自动微分(Ceres Jet、CppAD)会耗尽 1 毫秒的预算。 EGO-Planner 将 Fast-Planner 的 NLopt 替换为 LBFGS-Lite(ZJU-FAST-Lab/LBFGS-Lite,约 345 星,单头文件,仅依赖 Eigen),该算法为非光滑势垒添加了 Lewis–Overton 线搜索,并为非凸问题采用了 Li–Fukushima 谨慎更新。 README文件甚至警告称,亚毫秒级的计算*无法将Linux频率调节器推高至空闲状态以上*,并推荐使用cpufreq-set -g performance——这提醒我们性能循环已变得何等严苛。
第三幕,2022年:MINCO与多项式的回归¶
B-样条规划器虽然速度快,但在结构上却不够理想:其单结点跨度是一种*全局*折中方案,因为B-样条无法直接表达“在特定时间通过该航点”的需求。ZJU FAST实验室通过一种结合了多项式精确度、联合时空优化以及线性分段复杂度的表示方法解决了这一问题。
王哲沛、周鑫、徐超和高飞,《多旋翼飞行器的几何约束轨迹优化》,IEEE T-RO 38(5):3259–3278, 2022 (arXiv 2103.00190) 提出了 MINCO (最小控制)——这是一种度数为 \(2s-1\) 的分段多项式轨迹类,给定 \(M-1\) 个中间航点 q 和 M 个时间段 T,该类轨迹能唯一地满足具有 \(C^{s-1}\) 连续性的最小控制力最优条件。 从数学上讲,系数向量 c 满足带状线性系统 M(T) c = b(q)(带宽 O(s),尺寸 \(2sM \times 2sM\)),其块为 \(T_i\) 的多项式,且右边是 q 的线性组合加上边界数据。带状 PLU 分解可在 O(M) 的时间和空间复杂度内 求解该系统。 梯度通过 M(T)c = b(q) 的隐式求导——∂J/∂q = (∂b/∂q)ᵀ M(T)⁻ᵀ (∂J/∂c) 和 ∂J/∂T = ∂J/∂T|_c − …——向后传播,同样为 O(M)。最终结果:O(M) 的构造、评估和梯度计算,且具有 对航点位置和路段持续时间的精确解析灵敏度。
三项设计举措使 MINCO 成为完整的解决方案,而非单纯的表示技巧。首先,密集的连续时间可行性约束(推力、身体速率、走廊半空间成员资格、速度边界)通过 对每个片段在若干时间点进行采样 并为每个采样点添加软惩罚项来近似——从而将“密集约束评估与稀疏参数化”解耦。 其次,通过**微分同胚参数化** \(\xi\) 和 \(\tau\),消除了决策变量的硬约束(航点必须位于连续SFC多面体的交集内;持续时间必须为正值),从而将问题转化为普通的无约束优化问题。第三,随后使用普通的L-BFGS算法闭环求解。无需SQP、IPOPT或Mosek。
代码库 ZJU-FAST-Lab/GCOPTER(约1.1k颗星,MIT许可证)是参考C++实现。其设计在简洁性上极具突破性:核心采用**基于 gcopter/include/gcopter/ 的纯头文件C++——gcopter.hpp(外部无约束求解器和惩罚项组装)、minco.hpp (轨迹类本身,基于控制阶 \(s\in\{2,3,4\}\) 的模板化),sfc_gen.hpp 和 firi.hpp(下文所述的走廊生成器),以及捆绑的 lbfgs.hpp。 编译时使用 Matrix<double, 2s, m> 等固定大小的 Eigen 块,可让表达式模板在不涉及堆内存访问的情况下融合带状组件。带状 LU 矩阵是手动实现的,而非 Eigen::SparseLU,因为通用稀疏求解器会产生无法避免的 analyzePattern 开销——这一点在早期的 am_traj README 中已明确说明。 其前身 ZJU-FAST-Lab/am_traj(RA-L 2020,现已弃用,约 194 颗星)和 ZJU-FAST-Lab/large_scale_traj_optimizer (ICRA 2021,约253个星标)已率先实现了“**仅需两个头文件”的承诺——通过getGradT和getGradInnerP提供可微分黑盒接口——并报告称能在四秒内求解一百万个分段的空间问题。
MINCO 随即催生了一个生态系统。周鑫等人,《野外微型飞行机器人群》,《科学机器人》7(66):eabm5954, 2022年5月4日(EGO-Planner-v2)将 EGO-Planner 的 B-样条后端替换为 MINCO 以实现去中心化群集;每架无人机广播其 MINCO 多项式,而互避问题则简化为对接收轨迹上采样点的软惩罚。 代码库 ZJU-FAST-Lab/EGO-Planner-v2(约630颗星,GPLv3)正是那段10架无人机森林英雄视频背后的软件。 **Han等人,《Fast-Racing》(RA-L 2021,arXiv 2105.10276)**将MINCO移植到SE(3)无人机竞速中,并引入了基于门位的姿态走廊(约213颗星)。 其他 MINCO 的衍生版本包括 Bubble Planner(球形走廊)、Swarm-Formation(约 515 颗星)、Aerobatic-Planner,以及适用于任意形状机器人的 Implicit-SVSDF-Planner(SIGGRAPH 2024,约 218 颗星)。
王等人承认的这一明确权衡——在2025年11月的MIGHTY论文(arXiv 2511.10822)中也有所提及——在于MINCO**不具备严格的局部控制**:扰动一个(q_i, T_i)会通过耦合带状求解改变整个系数向量c。 对于大多数无人机应用而言,这是联合 (q, T) 最优化的微不足道的代价;对于局部扰动至关重要的问题(例如长轨迹的在线变形),赫尔姆霍兹-样条混合模型是一个活跃的研究方向。
安全飞行走廊:使一切得以运行的几何结构¶
每个基于梯度的规划器都需要一种简洁的方式来表示“该区域是空闲的”。主流的形式化方法是**安全飞行走廊(SFC)**:一个从起点延伸至终点的、由重叠凸多面体 \(P_i = \{x : A_i x \le b_i\}\) 组成的有序序列,每个多面体均由占用图上的路径段扩展而来。
Sikang Liu、Michael Watterson、Kartik Mohta、Ke Sun、Subhrajit Bhattacharya、Camillo J. Taylor 和 Vijay Kumar,《利用安全飞行走廊在三维复杂环境中为四旋翼机规划动态可行轨迹》,IEEE RA-L 2(3):1688–1695, 2017 (DOI 10.1109/LRA.2017.2663526),该研究由宾夕法尼亚大学KumarRobotics研究组完成,确立了这一标准流程。 对于每个路径段,以该路径段为长轴展开一个椭球体,并迭代收缩至最近的障碍点,同时记录切线超平面;当内部不再存在障碍物且切线平面构成多面体时终止。 结合**贝塞尔/伯恩斯坦基轨迹**,该凸包性质将走廊隶属约束简化为控制点上的有限个线性不等式——从而得到一个由Mosek求解的标准二次规划问题。 相关代码位于 sikang/mpl_ros(约 732 颗星)、sikang/DecompUtil(约 273 颗星,仅头文件)和 sikang/DecompROS(约 226 颗星);几乎所有后续系统(包括 HKU SUPER)都依赖 DecompUtil 进行基准测试。
香港科技大学的**Fei Gao、William Wu、Yi Lin 和 Shaojie Shen,"基于快速行进法和伯恩斯坦基多项式的四旋翼在线安全轨迹生成" ICRA 2018**(Btraj 仓库,约504个星标)采用更简单的轴对齐立方体膨胀技术,基于快速行进法构建的ESDF,以多面体体积为代价换取亚毫秒级的生成速度。 Teach-Repeat-Replan(Gao等人,T-RO 2020,约1.1k颗星)通过RILS风格的膨胀沿预设轨迹扩展多面体走廊,并能处理闭环情况。
走廊问题本身的最新研究是 FIRI —— 快速迭代区域膨胀 —— 王倩浩等人,IEEE T-RO 2025(arXiv 2403.02977,代码于 2022 年 3 月首次发布为 gcopter/include/gcopter/firi.hpp)。 FIRI 交替进行 限制性膨胀(在障碍物作用下扩展椭球体,同时显式约束 种子集 ——点、线或多面体——保持在生成的多面体内部)与 最大内切体积椭球体步骤。 关键的工程突破在于将最大内接体积椭球(MVIE)问题表述为**SOCP而非Deits & Tedrake的SDP**(IRIS 2014),从而实现了数量级的加速;在2D场景下,FIRI提供了首个针对最大内接面积椭圆问题的线性复杂度精确算法。 该算法采用浙江大学自主研发的仅头文件实现的 SDLP(Seidel 线性规划,小维数下预期线性时间)和 VertexEnumeration3D(性能优于 cddlib),而非 CGAL——后者因延迟问题被 UAV-SFC 社区刻意规避。 FIRI 的种子包含保证使其区别于 IRIS(不强制执行)和 Liu 的 SFC(硬编码一条线种子)。
CIRI — 配置空间迭代区域膨胀 见于 Yunfan Ren, Fangcheng Zhu, Guozheng Lu, Yixi Cai, Longji Yin, Fanze Kong, Jiarong Lin, Nan Chen, Fu Zhang, "确保安全的小型无人飞行器高速导航", 《Science Robotics》 10(98):eado6187, 2025 — 香港大学MaRS实验室的SUPER系统。CIRI在FIRI的基础上进行了扩展,通过**将MAV本体建模为球体**,并在生成走廊前对障碍物进行明科夫斯基膨胀处理,从而确保多面体对整个体积的机器人(而非仅其质心)具有可证明的安全性——消除了早期方法中采用的经验性缩小步骤。
2025年选择新型规划器的实用方案已然明朗: 若需经过充分验证、符合论文标准的基线,请使用 DecompUtil;若希望在不依赖商业求解器的情况下获得最大可证明走廊,请使用 FIRI;若机器人半径不容忽视且全身安全至关重要,请使用 CIRI。 这三种方案均仅基于 Eigen 实现,并以头文件形式发布。
时间最优规划:无人机与机械臂的分歧点¶
在执行器限制下最小化轨迹持续时间,与平滑度优化是截然不同的问题,这也是无人机真正比机械臂更难处理的唯一领域。
经典的机械臂方法是**Hung Pham 和 Quang-Cuong Pham 的《基于可达性分析的时间最优路径参数化新方法》(A New Approach to Time-Optimal Path Parameterization Based on Reachability Analysis),IEEE T-RO 34(3):645–659, 2018** ——即TOPP-RA算法,已实现于hungpham2511/toppra(约845颗星,麻省理工学院)。给定一条固定的几何路径,替换x = ṡ²和u = s̈,使得ẋ = 2u呈线性,且在每个路径坐标处,运动学/动力学约束在(u, x)中呈线性。 通过两次线性规划扫描——前向可达集和后向可控集——可在 \(O(K \cdot n_{LP})\) 时间内得到时间最优的参数化方案,对于数百个网格点,计算时间不到一毫秒。对于在线运动生成,金标准是 Lars Berscheid 和 Torsten Kröger, 《具有任意目标状态的加减速率受限实时轨迹生成》(RSS 2021),该方法已实现于 pantor/ruckig(约1.1k星,麻省理工学院),其能在微秒级时间内为每个自由度计算出解析的加减速率受限双稳态曲线(标准情况下为7段),并实现跨自由度的时序同步。
香港科技大学针对固定几何结构无人机路径的研究对应成果是**高飞、吴威廉、潘杰、周博宇和沈绍杰,《四旋翼飞行器轨迹生成的最优时间分配》,IROS 2018**(HKUST-Aerial-Robotics/TimeOptimizer,约92个星标)。 对于 ∫ ds/√x,若采用相同的 Bobrow 替换法并结合旋转的二阶锥约束,时间重参数化将转化为由 Mosek 求解的凸 SOCP 问题。但该建模仅满足轴向速度/加速度限制——**而非**真正的单电机推力和机身角速度限制。
这一限制至关重要。四旋翼机在给定姿态下无法产生任意加速度:推力沿机身z轴方向,而改变加速度方向需要通过受限机身角速度的动力学 Iω̇ + ω × Iω = τ 旋转机身。 因此,瞬时可达的加速度集取决于当前姿态和角速度——即输入的*历史*——这打破了 Bobrow 基于单步线性规划的推理。在完全受单电机推力限制的情况下,真正的时效最优问题是非凸的。
Philipp Foehn、Angel Romero 和 Davide Scaramuzza,《四旋翼飞行器的时效最优航点规划》,《Science Robotics》6(56):eabh1221,2021 —— 苏黎世大学(UZH)RPG 团队提出的 CPC(互补进度约束) —— 是首个真正解决这一问题的算法。 对于每个航点 j,引入一个进度变量 \(\lambda_j\),该变量仅在无人机位于该航点时才可能减小(即互补性约束 (λ_j,k − λ_j,k+1) · ‖p_k − p_{wj}‖ = 0)。因此,优化器能够**同时确定轨迹、时间安排以及哪个离散节点经过每个航点**——从而恢复了固定节点分配的 NMPC 无法实现的“bang-bang”最优性。 CasADi + IPOPT 结合互变法处理互补性裕度,可在数分钟至数小时内离线求解。代码见 uzh-rpg/rpg_time_optimal(约 119 颗星),生成的轨迹是首个在具有外部状态反馈的真实赛道上击败专业无人机飞行员的方案。 Kaufmann 等人的《基于深度强化学习的冠军级无人机竞速》(Nature 620:982–987, 2023)(Swift 系统)随后突破了 CPC 无法跨越的界限——端到端的基于视觉的策略击败了三位世界冠军级 FPV 飞行员——尽管该代码尚未发布。
TimeOptimizer的轴向SOCP与CPC的完整动力学NLP之间的实时性能差距,正是大多数商用无人机所处的应用场景。 ZJU FAST实验室的Primitive-Planner / Primitive-Swarm,IEEE T-RO 41:3629–3648, 2025(arXiv 2502.16882/2502.16887, ~173颗星) 将TOPP-RA 离线*迁移至预计算的运动原语库,从而使在线规划简化为具有毫秒级延迟和40架无人机可扩展性的A*风格图搜索。 **Fast-Racing (RA-L 2021, ~213 颗星)* 是浙江大学的基于模型的无人机竞速基线,采用带 SE(3) 门约束的 MINCO 算法。
第四幕,2023–2025:安全保证、四旋翼以外的飞行器及学习¶
2025 年最具影响力的论文是前文提到的 SUPER。 其创新之处在于**继承自麻省理工学院FASTER的双轨迹范式,但现基于MINCO + CIRI而非MIQP构建**:每次重新规划都会生成一条主轨迹(可能延伸至*未知*空间以实现速度最大化),以及一条**严格位于已知自由空间内且终点为保证安全悬停的备用轨迹**。 若主轨迹在下一规划周期中失效,预设的备用轨迹将确保飞行器安全。在配备 Livox 传感器、推重比 > 5 的 280 毫米微型飞行器上,SUPER 实现了 在茂密森林中夜间以 20 米/秒的速度飞行,其故障率比单轨迹基线低约 36 倍,且规划时间仅为后者的一半。 代码库 hku-mars/SUPER(约800颗星)还发布了 ROG-Map(IROS 2024,约530颗星),这是一种高效的机器人中心占用网格,可确保映射吞吐量与规划器保持同步。
由张富领导的香港大学 MaRS 实验室还把类似 MINCO 的规划方法推广到了 标准四旋翼机以外的场景。 Guozheng Lu 等,《激进尾坐式飞行的轨迹生成与跟踪控制》,IJRR 43(3):241–280, 2024 证明,在采用 完整 空气动力学模型并假设协同飞行的情况下,尾坐飞行器在整个飞行包线内(而不仅限于悬停附近)具有位置微分平坦性。 配套的T-RO 2025论文《未知环境下的自主尾坐式飞行》(arXiv 2411.15003)介绍了**EFOPT**, 这是一种可行性有保障的序贯信任域(SQP)求解器(针对信任域子问题的Steihaug共轭梯度法,结合Marquardt收缩/扩展方案),在处理由此产生的非凸非线性规划(NLP)问题时,其性能优于TRAJOPT和Gurobi。由于尾坐式飞行器的执行器约束在平坦输出下呈非凸性,GCOPTER的无约束L-BFGS算法已不足以应对; EFOPT 保留了类似 MINCO 的时空参数化方案,但将其封装在合适的 NLP 求解器中。相关仓库 hku-mars/EFOPT 于 2026 年 3 月创建(约 12 颗星,尚属新项目)。
集成规划与控制将最后两层融合在一起。刘文义、任云帆和张富,《存在突发障碍物和扰动条件下四旋翼导航的集成规划与控制》,IEEE RA-L 2023 (hku-mars/IPC, ~244 星) 采用 A* 前端和 基于高阶积分器平输出模型的线性 MPC,以 SFC 超平面作为线性不等式约束,全部通过 osqp-eigen 以 100 Hz 频率求解 OSQP。 通过压缩处理流程,可实现对突发障碍物低于10毫秒的反应时间——这是MINCO风格的20–50毫秒重规划周期在不增加额外反应层的情况下无法实现的。
浙江大学FAST实验室在**Zhang, Chen, Wang, Qiu, Han, Ren, Xu, Gao, Cao, "Universal Trajectory Optimization Framework for Differential Drive Robot Class," IEEE T-ASE 22:13030, 2025**(arXiv 2409.07924, ZJU-FAST-Lab/DDR-opt, ~360 颗星)中,将MINCO推广至非全向控地面机器人。 关键发现是,仅对笛卡尔位置进行参数化在滑移转向和履带式机器人上会失效——偏航仅存在弱耦合,且会出现拐点。DDR-opt 则对 **运动状态或其积分(角速度、线速度、弧长)进行参数化,从而原生地强制执行角速度限制,并允许连续的前进/后退运动。 针对不平坦地形上汽车类机器人的类似扩展见于 uneven_planner(约 211 颗星)和 seb_naver(约 73 颗星)。任意形状的扩展是 Implicit-SVSDF-Planner(SIGGRAPH 2024,约 218 颗星),该方法使用扫掠体积有符号距离场,使规划器能够感知机器人的实际几何形状。
截至2026年初,基于学习的轨迹生成仍是次要研究方向。Tim Salzmann、Elia Kaufmann、Jon Arrizabalaga、Marco Pavone、Davide Scaramuzza 和 Markus Ryll 的论文《实时神经网络模型预测控制:四旋翼及敏捷机器人平台的深度学习模型预测控制》(IEEE RA-L 8(4):2397–2404, 2023(arXiv 2203.07747)通过一阶和二阶局部泰勒逼近,将大型 PyTorch 动力学模型嵌入 SQP/Acados 中,从而在 50 Hz 控制环路内支持规模扩大 4000 倍的训练模型,并相较于基于标称模型的 MPC,将跟踪误差降低高达 82%。 诸如 DroneDiffusion (arXiv 2409.11292) 和 DDAT (arXiv 2502.15043) 这样的基于扩散的规划器已开始探索投影到可达集上的生成式轨迹模型,但目前尚无任何方法能在速度或走廊安全保证方面与 MINCO 家族规划器相媲美。 Swift(《自然》2023)仍属特例:这是一种完全绕过显式轨迹生成的端到端学习策略,但未开源,也未能像MINCO那样揭示工程实践经验。
SLAM工程师应从中汲取的实际经验¶
学习路径应紧凑:首先研读Mellinger & Kumar,以深入理解**微分平坦性及snap的作用**; 阅读 Richter–Bry–Roy 以了解 为何单项式基底在数值计算中具有破坏性,以及端点导数参数化如何解决这一问题;研读 mav_trajectory_generation 以掌握 顶点/线段/轨迹抽象 及非类型模板参数模式。 随后通过 Ewok / Fast-Planner / EGO-Planner 链切换至 B-样条视角,以理解 凸包性质、局部支撑以及亚毫秒级规划中的 Linux 频率调节器问题。 Ewok 的环形缓冲区 ESDF、Fast-Planner 采用解析展开的 PMP 成本动力学 A* 算法,以及 EGO-Planner 的 (p, v) 按需障碍信息,这三项独特的工程实践都值得优先研读源代码。
MINCO 系列论文是该研究的集大成之作。请阅读 GCOPTER T-RO 论文以及 am_traj / large_scale_traj_optimizer 的 README 文件,了解 M(T)c = b(q) 的隐式微分如何产生 O(M) 级别的解析灵敏度,以及微分同胚参数化如何将硬约束转化为无约束的 L-BFGS 算法。 克隆 GCOPTER 并追踪 minco.hpp、firi.hpp 和 lbfgs.hpp —— 整个系统仅由几千行纯头文件的 Eigen C++ 代码构成。 随后阅读 SUPER 和 EFOPT 以了解当前的两大前沿:基于承诺备份轨迹的安全认证,以及 当执行器约束变为非凸时,将平输出机制扩展至四旋翼以外的场景。
有三项工程原则贯穿始终。首先,稀疏性是首要关注点——Mellinger 中的块对角海森矩阵、B-样条中的带状雅可比矩阵、MINCO 中的带状 PLU;通用稀疏 LU 算法的开销 analyzePattern 无法接受,因此专用代码总是胜出。 其次,在千赫兹级速率下必须具备解析梯度;在最内层循环中,自动微分根本行不通。 第三,商用求解器正逐渐被取代:刘/Btraj时代的Mosek QP让位于OSQP(IPC),随后是基于惩罚项重构的L-BFGS(GCOPTER、SUPER),最终演变为定制SQP(EFOPT)。 该领域的演进轨迹是:针对结构日益复杂的问题,求解器栈将变得越来越精简,而每种情况的关键都在于对微分平坦性的精确利用。
结论¶
从 Mellinger 2011 到 SUPER 2025 的十五年历程,是**结构洞察力如何产生复利效应**的教科书式范例。2011 年的微分平坦性使多项式规划成为可能; 2013年Richter提出的端点导数重参数化使其在大规模应用中数值稳定;2019–2021年的Fast-Planner和EGO-Planner将重规划速度提升至毫秒级;2022年的MINCO揭示了时间分配和路点选择是*唯一*真正的自由度,且二者均可通过线性复杂度的解析梯度求解; 2024–2025年的SUPER、IPC、EFOPT和DDR-opt则分层构建了安全保障机制,并将表示方法推广至尾坐式无人机和地面机器人。该领域在此过程中**放弃**的内容同样具有启示意义:笨重的QP求解器、稠密ESDF、全局凸性、离线计算。 而该领域**保留**的——微分平坦性、多项式光滑度成本、基于凸包的走廊隶属度、L-BFGS——才是真正能在实际硬件中发挥作用的结构性基础。一位2026年进入无人机规划领域的SLAM工程师,完全可以合理地直接选用GCOPTER作为初始实现方案,但若不追溯Mellinger与Kumar的完整研究路径,便无法理解其设计背后的深层逻辑。