专题 2 · 摩擦锥理论与凸松弛：Coulomb 摩擦的几何结构、对偶原理与优化视角¶

所属：第七批 · 接触力学专题序列 · 专题 2 档位：核心档位 3（博士入学）＋进阶档位 4（博士毕业＋） 建议时长：档位 3 约 30–40 h；档位 4 额外 15–20 h 前置：专题 1（LCP/NCP 与 Signorini 条件）；第零批线性代数（特征值、正定矩阵、投影）；第二批凸分析（凸集、凸锥、对偶锥、法锥、次微分、KKT 条件、Fenchel 对偶）下游：专题 3（Moreau 时步法）、专题 4（可微接触仿真）、专题 6（接触隐式 MPC）；05 足式 §80（接触力学与约束优化）、§90（WBC 分层优化与 TSID）

专题 1（LCP/NCP 与 Signorini 条件）告诉我们：接触的本质是互补问题。然而只要把摩擦拿进来，这个互补问题就立刻离开了"良态"——它不再是单调的、不再是 P-矩阵、不再必然有解，甚至在经典 Coulomb 律下被 Painlevé 构造反例（Stewart, SIAM Review 2000）。本专题的任务就是：用**几何**（二阶锥、法锥、极限面）、对偶（最大耗散原理 MDP、de Saxcé 双势）和**凸松弛**（Anitescu CCP、SAP）这三把钥匙，把摩擦"驯化"成一个工程上可求解、可微、可实时的对象。只有理解了这一步，后续专题 3（时步法）、4（可微接触）、6（CI-MPC）才有共同的地基。

前置自测¶

📋 前置自测（答不出 $\ge 2$ 题 → 先回专题 1 与第二批凸分析复习）

互补条件：写出标量互补条件 $0 \le a \perp b \ge 0$ 的完整含义（三个不等式 + 一个等式）。它与 Signorini 条件 $0 \le g_N \perp r_N \ge 0$ 中的 $g_N, r_N$ 分别是什么物理量？（指向专题 1）
凸锥与对偶锥：什么是凸锥？给定闭凸锥 $K \subseteq \mathbb{R}^n$，它的对偶锥 $K^* = \{y : \langle y, x\rangle \ge 0,\ \forall x \in K\}$ 的几何含义是什么？自对偶锥的例子有哪些？（指向第二批凸分析）
法锥与投影：闭凸集 $C$ 在点 $x \in C$ 处的法锥 $N_C(x)$ 如何定义？投影算子 $\mathrm{proj}_C(\cdot)$ 与法锥的关系（投影的变分刻画）是什么？（指向第二批凸分析）
KKT 条件：对约束优化 $\min_x f(x)$ s.t. $g(x) \le 0$，写出 KKT 一阶必要条件（平稳性、原始可行、对偶可行、互补松弛）。Lagrange 乘子的符号约定是什么？（指向第二批凸分析与专题 1）
正定与 Schur 补：对称矩阵 $M \succ 0$ 的三个等价判据是什么？$2\times 2$ 分块矩阵正定与其 Schur 补正定的关系是什么？（指向第零批线性代数）

自测说明：第 1 题答不出 → 本专题所有"互补 $\perp$"记号你会卡住，先读专题 1 §1–3。第 2、3 题答不出 → §2.2（MDP）与 §2.3（de Saxcé）的法锥/投影推导无法跟上，先读第二批凸分析的"凸锥与对偶"和"投影定理"两节。第 4 题答不出 → §2.2、§2.5 的 KKT 提取看不懂。第 5 题答不出 → §2.5 的 Delassus 算子 $N = D^\top M^{-1}D$ 正定性论证会有障碍。

本章目标¶

学完本章后，你应当能够：

完整陈述 Coulomb 摩擦律的集值（set-valued）形式，解释它为什么不能写成单值函数 $\mathbf{r}_T = f(\mathbf{u}_T)$，并指出"丢信息"的代价具体出现在哪。
识别摩擦锥 $K_\mu$ 是二阶锥（Lorentz 冰激凌锥），证明它的自对偶性（$\mu=1$ 时）与一般缩放下的对偶锥，并把"无滑动抓取/支撑"判据写成 $\mathbf{r} \in \mathrm{int}\,K_\mu$。
从最大耗散原理（MDP）出发，用两行 KKT 推出全部粘/滑行为，并理解 MDP 与 Gauss 最小约束原理的原始-对偶关系。
理解"非关联流动"为什么破坏标准凸对偶，掌握 de Saxcé 双势如何用"虚拟法向速度修正项"$\mu\|\mathbf{u}_T\|\mathbf{e}_N$ 救回变分结构。
推导多面体（pyramidal）近似的内切/外切误差 $\mu\cos(\pi/k)$，量化 $\sqrt 2$ 各向异性伪影，并在 LCP 与 SOCP 两条工程路线之间做出有依据的选型。
从 Anitescu 2006 的凸松弛推导锥互补问题（CCP），解释凸化代价（"forces from a distance" 隔空作用力伪影）的来源与暴露场景。
用 Euclidean Jordan 代数的谱分解写出三维摩擦锥投影的闭式与广义 Jacobian，解释为什么半光滑 Newton 能二次收敛（强半光滑），并能据此读懂研究级二阶锥求解器（Siconos/Pinocchio 3）。
用隐函数定理对锥投影/CCP 求接触梯度，理解可微性在粘滑切换处崩溃的根源，掌握随机光滑如何把"崩溃的梯度"救成"优化友好的方向"，并把这一切桥接到可微接触仿真。
把上述理论桥接到足式 Convex MPC（每脚 4 不等式）、WBC 的摩擦锥约束、抓取 force closure 判据，并能拿起任意仿真器文档在 30 分钟内定位它的摩擦建模选择。

本章知识导航¶

本章围绕一个核心对象——摩擦锥 $K_\mu$——在三个抽象层上展开，这三层不是可自由挑选的竞争方案，而是**同一条物理律在不同精度-速度权衡下的投影**：

抽象层	核心对象	回答的问题	对应节
几何层	二阶锥 $K_\mu$、对偶锥、法锥	摩擦约束"长什么形状"	§2.1
变分层	MDP、Gauss 原理、de Saxcé 双势	摩擦力"是哪个优化问题的解"	§2.2–§2.3
计算层	pyramidal LCP、SOCP、CCP、半光滑 Newton、SOCCP/Jordan 代数、可微接触梯度	摩擦"怎么落地到可求解、可微的代码"	§2.4–§2.7

本章包含 11 个核心知识点，它们的依赖关系如下（推荐按编号顺序阅读，§3 极限面与 §4 进阶可在主线读完后按兴趣选读）：

§2.1 Coulomb 律 + 摩擦锥几何（一切的原点）
   │
   ├──→ §2.2 最大耗散原理 MDP（把"判断式"变"优化"）
   │        │
   │        └──→ §2.3 de Saxcé 双势（救回非关联流动的变分结构）
   │
   ├──→ §2.4 多面体 vs SOCP（几何近似的两条工程路线）
   │        │
   │        └──→ §2.5 CCP 与凸松弛代价（现代凸接触仿真的核心）
   │                 │
   │                 └──→ §2.6 SOCCP 与 Jordan 代数（谱分解、锥投影闭式、二次收敛的代数地基）
   │                          │
   │                          └──→ §2.7 摩擦锥可微化（IFT 对锥投影求梯度、随机光滑、桥接可微接触）
   │
   ├──→ §3 极限面与操作力学（从"接触点"抬到"整体滑动响应"）
   │
   └──→ §4 进阶（measure DI、各向异性、黏附、Alart-Curnier）

§5–§9：教材对照、定理清单、机器人对应表、资源、节奏（速查与延伸）

导航提示：如果你的目标是**写 Convex MPC / WBC**，主线是 §2.1 → §2.4（pyramidal/SOCP）→ §7（机器人对应表）。如果你的目标是**写或读懂仿真器**（MuJoCo/Drake/Bullet），主线是 §2.1 → §2.2 → §2.5（CCP）→ §6（定理清单）。如果你的目标是**写研究级高精度求解器**（Siconos/Pinocchio 3），加读 §2.6（SOCCP/Jordan 代数）。如果你的目标是**做可微接触/接触辨识/CI-MPC**，主线是 §2.1 → §2.5 → §2.6 → §2.7（可微化）。如果你的目标是**抓取与操作**，主线是 §2.1 → §3（极限面、force closure）。

前置知识桥接¶

回顾专题 1（LCP/NCP 与 Signorini 条件）：在专题 1 里我们把单边接触（unilateral contact）写成互补条件 $0 \le g_N \perp r_N \ge 0$——间隙 $g_N$（gap，物体表面到障碍的有符号距离）与法向反力 $r_N$（normal reaction force）满足"要么接触（$g_N=0$，可有力）、要么分离（$g_N>0$，力为零）"，二者不能同时为正。专题 1 还证明了**纯法向**接触（无摩擦）对应的 LCP 系统矩阵是对称半正定的，因而互补问题良态（有解、解集凸、可用 Lemke 算法或投影迭代稳定求解）。

本专题在专题 1 基础上解决的新问题：一旦把切向摩擦力 $\mathbf{r}_T$ 拿进来，互补结构发生质变。摩擦力的方向受切向滑动速度 $\mathbf{u}_T$ 约束（最大耗散），而摩擦力的大小受法向力 $r_N$ 约束（$\|\mathbf{r}_T\| \le \mu r_N$）——这种**切向受法向调制**的耦合，让原本对称良态的 LCP 变成**非对称、非单调**的问题。本专题就是要回答：摩擦如何毁掉良态性（§2.4 末、§6 定理 1），又如何通过凸松弛（§2.5）和对偶（§2.2–§2.3）重新救回可解性。

复用的工具清单：专题 1 的"互补 $\perp$"记号贯穿全章；专题 1 的投影迭代思想在 §2.5 的 PGS 求解器里直接复用（只是把"投影到非负象限"换成"投影到二阶锥"）；专题 1 的 Delassus/Schur 补结构在 §2.5 的 $N = D^\top M^{-1}D$ 里再次出现。

如果跳过本章会怎样¶

场景一（写足式 MPC 时被对角线步态"坑"）：你照着某教程用 $k=4$ 金字塔近似摩擦锥写了 Convex MPC，机器人在直行和侧移时表现正常，但一让它走 $45°$ 斜线就频繁打滑或步态"发飘"。你查遍了增益参数都找不到原因——因为根因不在控制器，而在 $k=4$ 金字塔沿对角方向把可用摩擦力低估了 $1/\sqrt2 \approx 0.71$ 倍（§2.4）。不学本章，你会把一个**几何近似的系统性偏差**误诊为"参数没调好"，浪费数周。
场景二（读 Pinocchio 3 / Siconos 源码看到"怪异修正项"）：你在 Pinocchio 3.0 的 admm-solver.hpp 或 Siconos 的摩擦求解器里看到切向速度被改成 tangent_velocity + mu*||v_t||*n，凭直觉觉得这是个 bug 或 hack，想"修正"它。不学本章（§2.3 de Saxcé 双势），你不知道这是**唯一让 Coulomb 律具备变分结构的数学构造**，删掉它求解器就会不收敛。
场景三（精密装配中 MuJoCo "隔空推开"零件）：你用 MuJoCo 仿真 peg-in-hole，发现零件在还没接触时就被推开了一点点。不学本章（§2.5 CCP 凸松弛代价），你不知道这是凸松弛在大步长下的固有伪影"forces from a distance"，会误以为是碰撞检测的 bug，最终在错误的方向上反复尝试。

预计阅读时间¶

阅读方式	时间	适合谁
精读（含推导手算与练习）	30–40 h	要自己写摩擦求解器或深入理解仿真器的读者
速读（跳过 §2.3 de Saxcé 与 §4 进阶的细节推导）	12–16 h	只需用 MPC/WBC 中现成锥约束的读者
速查（只看 §2.1 锥定义、§2.4 选型表、§6 定理清单、§7 对应表、§11 陷阱）	90 min	遇到具体工程问题时回来查

§0 为什么摩擦配得上独立一章¶

在进入定义之前，先回答一个元问题：接触力学已经有专题 1 讲互补、专题 3 讲时步法，为什么摩擦还要单独占一整章？答案是：在机器人与环境交互的所有数学对象里，Coulomb 摩擦是**最不友好的一块**，它同时具备四个"坏"性质，每一个都足以让一个标准数值方法失效。理解这四重病态，是理解后续所有"为什么要这么麻烦"的钥匙。

坏性质一：非光滑（non-smooth）。 摩擦在"粘滞"（stick，无相对滑动）与"滑动"（slip，有相对滑动）切换的瞬间不可微。粘滞时摩擦力可以是锥内任意方向的一族值，滑动时摩擦力突然被钉死在锥面上且方向反平行于滑动速度——这个切换是一个**非光滑的集值映射**，标准的基于梯度的方法（牛顿法、梯度下降）在切换处直接失去定义。

坏性质二：非对称（non-symmetric）。 一维的切向滑动方向，决定了整片二维切向子空间的力响应。这种"低维输入调制高维输出"的结构破坏了系统矩阵的对称性——而对称性正是专题 1 中无摩擦 LCP 良态的根基。失去对称性，意味着失去"半正定 ⟹ 有解 ⟹ 凸解集"这条黄金链。

坏性质三：非凸（non-convex）。 严格的 Signorini 条件（互补）叠加 Coulomb 摩擦后，可行的速度-力配对集合**不是凸集**。非凸意味着可能有多个孤立的局部解，意味着标准凸优化的"局部最优即全局最优"保证失效。

坏性质四：非唯一（non-unique）。 这是最戏剧性的一条。1895 年法国数学家 Paul Painlevé 构造了一个简单例子——一根细杆以特定角度在高摩擦地面上滑动——使得对应的运动方程**无解或有多解**（Painlevé 佯谬，Painlevé paradox）。这不是数值误差，而是经典刚体 + Coulomb 律这个数学模型本身的内在矛盾。

本质洞察：摩擦的四重病态——非光滑、非对称、非凸、非唯一——不是四个独立的麻烦，而是**同一个根源的四个侧面**：Coulomb 律是一个"切向受法向单向调制"的集值律。正是这个"单向调制"（法向力限制切向力上界，但切向力不反过来影响法向）破坏了对称性（坏性质二）、破坏了凸性（坏性质三）、在临界角度制造了不相容（坏性质四），而集值性本身就是非光滑（坏性质一）。后续所有的凸松弛、对偶、近似，本质上都是在"修补"这一个根源在不同层面的副作用。

工程上的直接证据**是：业界三大仿真引擎各用**完全不同的摩擦模型，且谁也说服不了谁——

仿真器	摩擦模型	主导者 / 出处	设计取向
MuJoCo	Todorov 2014 凸松弛 + 可切换 pyramidal/elliptic 锥	Emo Todorov（DeepMind 官方文档 `mujoco.readthedocs.io`）	平滑可微、RL 友好
Drake	从 v1.5.0（2022-07）默认 Castro-Permenter-Han 2023 IEEE T-RO 的 SAP 求解器（本质是 Anitescu 2006 凸松弛 + 柔性接触消约束）	TRI / Castro et al.	物理准确、操作仿真
Bullet	Erwin Coumans 的 Sequential Impulse + 1/2 向 pyramid	Erwin Coumans	游戏级实时
Siconos / Pinocchio 3	真实二阶锥 SOCP/ADMM	Acary-Brogliato（Inria TRIPOP）/ Carpentier	数学精确、研究基准

没有一个模型在所有指标上占优——这正是摩擦四重病态的工程显影。如果摩擦像无摩擦接触那样良态，业界早就收敛到一个标准算法了；正因为它病态，每个团队才必须在"精度-速度-可微-鲁棒"的四维权衡里选一个角落。

本质洞察：仿真器的"摩擦模型之争"不是工程师品味之争，而是一个**没有占优解的多目标优化的不同 Pareto 点**。读完本章你会明白：MuJoCo 选了"可微 + 实时"的角落（代价是 forces-from-a-distance 伪影），Siconos 选了"精确"的角落（代价是 SOCP 求解慢、不总光滑），Drake SAP 试图在中间（用柔性接触换取凸性与一定的物理性）。理解这一点，你才能根据**自己的任务**选对工具，而不是迷信某个"最好的仿真器"。

本专题在大纲中的位置承上启下：承接专题 1 把"接触 = 互补"讲清楚之后，本专题解释**摩擦如何把良态 LCP 毁掉、又如何通过凸松弛/对偶重新救回来**；它为专题 3（Moreau 时步法）提供离散摩擦律、为专题 4（可微接触）解释梯度为何依赖松弛化、为专题 6（Contact-Implicit MPC）提供足式 MPC 中无处不在的锥约束形式。

四重病态 → 全章解药的路线图¶

为了让你带着"问题意识"读后面的推导，先把"四重病态"和"全章在哪治它"列成一张路线图。这张表是本章的"剧情大纲"——每读完一节，回来看一眼它治了哪个病。

病态（§0）	数学根源	本章的解药	解药代价
非光滑	粘↔滑切换处集值、不可微	§2.1 集值律 + §2.2 MDP 把判断式变优化；§4.4 半光滑 Newton 用广义 Jacobian	仍非处处可微（本质如此）
非对称	法向单向调制切向（$\mu$ 项，$(2.24b)$）	§2.3 de Saxcé 修正恢复变分对称结构	引入虚拟法向速度
非凸	Signorini + Coulomb 的可行配对集非凸	§2.5 Anitescu 凸松弛 → 凸 QP	forces-from-a-distance 伪影 $O(h)$
非唯一	Painlevé：经典刚体可无解/多解	§2.5 凸松弛后必有唯一解；§2.4 近似规整化	解是松弛解，非精确解

读这张表的方式：四个病态不是孤立的（§0 本质洞察已说它们同源于"单向调制"），所以四个解药也彼此关联——MDP（治非光滑）为 de Saxcé（治非对称）铺路，de Saxcé 为凸松弛（治非凸/非唯一）铺路。全章就是沿着"几何 → 变分 → 计算"三层，把这四个同源病态逐层驯服的过程。 现在带着这张地图，进入第一层——几何。

§2.1 Coulomb 摩擦律与摩擦锥的几何结构 ⭐⭐¶

动机：一张被擦掉一半的实验记录¶

摩擦不是某个数学家在书桌前发明的，而是从一摞实验数据里"擦"出来的。1699 年，法国物理学家 Guillaume Amontons 把一块物体放在斜面上，缓缓抬高斜面，记录物体开始下滑时的临界角 $\alpha$。他换不同的材料、不同的接触面积、不同的重量，反复做。最后他发现一个让当时所有人都意外的规律：临界角 $\alpha$ 与接触面积无关、与重量无关，只与材料对有关。也就是说，把同一对材料的物块切成两半叠起来，或者压上十倍的重物，它开始打滑的临界角都一样。

这个"无关"非常反直觉。日常经验告诉我们"压得越重越难推"——这没错，最大静摩擦力确实随法向力线性增长。但 Amontons 发现的是更深的东西：最大摩擦力与法向力的比值是个常数，这个常数后来被记作 $\mu$（摩擦系数，friction coefficient）。1781 年 Charles-Augustin de Coulomb（就是那个库仑定律的库仑）用更精密的实验把这个规律系统化，区分了静摩擦与动摩擦，并指出**滑动时的摩擦力方向总是与相对滑动方向相反**。今天我们把这一整套经验规律统称为 Coulomb 摩擦律（Coulomb friction law），又叫 Amontons–Coulomb 律。

我们要解决的核心问题是：给定一个接触点，作用在物体上的接触力 $\mathbf{r}$（包含法向分量 $r_N$ 与切向分量 $\mathbf{r}_T$）必须满足什么约束，才符合 Coulomb 律？切向力又怎么由滑动速度决定？这两个问题的答案，一个是"几何"（力的可行集长什么形状），一个是"变分"（力在可行集里具体取哪个值）。本节解决第一个——几何；§2.2 解决第二个——变分。

把符号先约定清楚，全章一致。$r_N \in \mathbb{R}$ 是法向反力的标量（沿接触法向 $\mathbf{n}$ 的分量，约定 $r_N \ge 0$ 表示推开物体，不能拉），$\mathbf{r}_T \in \mathbb{R}^2$ 是切向力在接触切平面内的二维向量。完整接触力 $\mathbf{r} = r_N \mathbf{n} + \mathbf{r}_T \in \mathbb{R}^3$。对应地，接触点相对速度 $\mathbf{u} = u_N \mathbf{n} + \mathbf{u}_T$，其中 $u_N$ 是法向分离速度、$\mathbf{u}_T \in \mathbb{R}^2$ 是切向滑动速度。注意我们沿用专题 1 的物理量命名，但把"力"统一记为 $\mathbf{r}$（reaction，反力）以区别于外力 $\mathbf{f}$。

如果不这样做会怎样：三种"想当然"的错误模型¶

在给出正确的 Coulomb 律之前，先看三个初学者最容易写出的错误模型，理解它们错在哪，正确模型的每一个细节就都有了来由。这正是规范 R5 要求的"反面"——不先看到坑，就不知道为什么要绕路。

错误模型一：把摩擦力写成黏性阻尼 $\mathbf{r}_T = -c\,\mathbf{u}_T$。 这是最常见的"图省事"写法，把摩擦当成和空气阻力一样的线性阻尼。它错在两点：第一，黏性阻尼在 $\mathbf{u}_T \to 0$ 时摩擦力也 $\to 0$，但真实摩擦在静止时可以提供一个**非零的静摩擦力**来抵抗外力（否则斜面上的物块早就滑下去了）——黏性模型根本无法表达"静止物体被摩擦力顶住"这件事。第二，黏性阻尼的摩擦力无上界，速度越大力越大，但 Coulomb 律说滑动摩擦力**被钉死在 $\mu r_N$**，与速度大小无关。

错误模型二：把摩擦力写成定值 $\|\mathbf{r}_T\| = \mu r_N$、方向反平行于速度。 这个对了一半——滑动时确实如此。但它无法处理静摩擦：当物体静止（$\mathbf{u}_T = \mathbf{0}$）时，速度方向没有定义，这个公式直接崩溃。而且它强制摩擦力**总是取到最大值** $\mu r_N$，可现实里一个静止在水平桌面上、没有外力推它的物块，摩擦力是零，不是 $\mu r_N$。摩擦力的大小在静止时是"按需供给"的——外力推多大，它就反推多大，直到上限。

错误模型三：把切向力和法向力解耦，各自独立约束。 比如分别要求 $|r_{T,x}| \le \mu r_N$ 且 $|r_{T,y}| \le \mu r_N$。这是把圆形的可行域换成了方形，看似只是近似，实则引入了**方向各向异性**——沿坐标轴方向能用的摩擦力（$\mu r_N$）比沿对角线方向（$\sqrt2\,\mu r_N$）小了 $\sqrt2$ 倍。一个本该各向同性的物理现象，被人为地刻上了坐标系的烙印。这个错误的"升级版"正是 §2.4 要批判的多面体近似——只不过那里我们用足够多的面把方形磨成接近圆形。

本质洞察：上面三个错误模型分别丢掉了 Coulomb 律的三个本质特征——静摩擦的按需供给性（错误一、二）、滑动摩擦的速度无关上界（错误一）、各向同性（错误三）。正确的 Coulomb 律必须同时容纳这三件事，而能同时容纳它们的数学对象，只有一个：集值映射 + 圆锥约束。换句话说，摩擦的"麻烦"不是数学家故意找的，而是物理本身要求的最低复杂度——任何更简单的模型都会丢掉一个真实特征。

历史：从经验律到集值律的三百年¶

把 Coulomb 律写成现代数学形式，经历了三个阶段，每个阶段都对应一次"语言升级"。

第一阶段是 代数不等式语言（18 世纪 Amontons–Coulomb 到 19 世纪）：$\|\mathbf{r}_T\| \le \mu r_N$。这抓住了"摩擦力有上界"，但说不清静摩擦力具体取多少。

第二阶段是 变分不等式语言（20 世纪中叶，Moreau、Duvaut–Lions 的凸分析框架）：摩擦力是某个能量泛函的次微分（subdifferential）。这把"按需供给"用次微分的集值性精确表达了——次微分在不可微点是一个集合，恰好对应静摩擦力的多值性。Jean-Jacques Moreau 在 1960–70 年代用凸分析重写了整个接触力学，他引入的"凸分析+测度微分包含"框架是今天一切严格处理的基础（专题 3 会深入）。

第三阶段是 互补/锥语言（20 世纪末至今，Stewart–Trinkle、Anitescu–Potra、Acary–Brogliato）：把摩擦律写成二阶锥上的互补条件或锥规划，使它直接对接数值优化求解器。本章 §2.2–§2.5 走的就是这条线。

历史的教训：同一个物理律，换一种数学语言，能解的问题范围就变一次。代数语言只能判断"会不会滑"，变分语言能算出"滑多少"，锥语言能让计算机"实时求解千个接触点"。这告诉我们：当一个理论"卡住"时，往往不是物理不对，而是**数学语言的表达力不够**——这也是为什么本章要在三种抽象层（几何/变分/计算）之间反复横跳。

理论一：Coulomb 律的完整集值形式¶

现在给出正确的、完整的 Coulomb 律。它由两条独立的陈述组成——一条管"力的大小可行域"，一条管"力的方向如何由速度决定"。很多教材只讲第一条就开始用，这正是混乱的源头。

陈述 A（可行域 / 摩擦锥约束）：在任何时刻，接触力必须落在摩擦锥内： $$ |\mathbf{r}_T| \le \mu\, r_N, \qquad r_N \ge 0. \tag{2.1} $$ 这定义了一个集合，我们记作 $K_\mu$（见理论二）。约束 $(2.1)$ 对粘滞和滑动**都成立**——它只是说"力不能超出锥"，并没说力具体在哪。

陈述 B（最大耗散 / 流动法则）：摩擦力的**方向**由切向滑动速度通过"最大耗散"决定： $$ \mathbf{r}T \in \arg\max_T\bigr), \tag{2.2} $$ 即在所有满足锥约束的候选切向力 }| \le \mu r_N} \bigl(-\mathbf{s}^\top \mathbf{u$\mathbf{s}$ 中，真实摩擦力是使耗散功率 $-\mathbf{s}^\top \mathbf{u}_T$ 最大的那个（耗散功率 $=$ 摩擦力做的负功的相反数 $=$ 摩擦从系统中抽走能量的速率）。这一条 §2.2 会从头推导，这里先给结论，让陈述 A 与 B 成对出现。

把陈述 B 解开，得到 Coulomb 律最有用的"分情形"形式——这是工程中真正在用的版本，务必记牢：

\[ \boxed{ \begin{cases} \mathbf{u}_T = \mathbf{0} \ (\textbf{粘滞 stick}): & \|\mathbf{r}_T\| \le \mu r_N,\ \mathbf{r}_T\ \text{方向任意（多值！）}\\[4pt] \mathbf{u}_T \ne \mathbf{0} \ (\textbf{滑动 slip}): & \mathbf{r}_T = -\mu r_N\,\dfrac{\mathbf{u}_T}{\|\mathbf{u}_T\|}\ \text{（钉死在锥面、反平行于速度）} \end{cases}} \tag{2.3} \]

逐项读懂这个框：

粘滞情形（$\mathbf{u}_T = \mathbf{0}$）：没有相对滑动。此时摩擦力可以是锥**内部**任意一个方向、任意一个不超过 $\mu r_N$ 的大小的向量。具体取哪个，由"它要平衡多大的外切向力"决定——这就是前面说的"按需供给"。注意这里 $\mathbf{r}_T$ 是**多值的**：给定 $\mathbf{u}_T = \mathbf{0}$，无法唯一确定 $\mathbf{r}_T$，它是一整个圆盘 $\{\|\mathbf{r}_T\| \le \mu r_N\}$。这就是"集值"二字的来源。
滑动情形（$\mathbf{u}_T \ne \mathbf{0}$）：有相对滑动。此时摩擦力**必然**取到最大幅值 $\mu r_N$（钉死在锥面上），方向**必然**与滑动速度严格反平行。这里 $\mathbf{r}_T$ 是**单值的**——给定非零 $\mathbf{u}_T$，$\mathbf{r}_T$ 被唯一确定。

阶段小结：到这里我们完成了 Coulomb 律的完整陈述——陈述 A 管"在锥内"，陈述 B 管"锥内哪一点"。接下来要做的是把"锥"这个集合 $K_\mu$ 的几何本质（它是个二阶锥）讲透，并证明它的自对偶性。

深入理解：摩擦系数 $\mu$ 的微观来源与"单向调制"的物理根源¶

读到这里你可能会问——为什么最大摩擦力恰好正比于法向力？这个看似简单的比例关系，背后藏着 §0"单向调制"病态的物理根源，值得展开。

微观图像（Bowden–Tabor 黏着理论，1950s）：两个看似光滑的固体表面，在微观下布满凹凸的"微凸体（asperity）"。真实接触只发生在这些微凸体的尖端，真实接触面积 $A_{\text{real}}$ 远小于表观面积。当法向力 $r_N$ 增大，微凸体被压扁、更多微凸体接触，使 $A_{\text{real}}$ 正比于 $r_N$ 增长（塑性接触）。而切向摩擦力来自剪断这些黏着点所需的力，正比于 $A_{\text{real}}$ 和材料剪切强度 $\tau_s$： $$ |\mathbf{r}T|, $$ 其中 } = \tau_s A_{\text{real}} \propto \tau_s\cdot r_N = \mu\, r_N,\qquad \mu \approx \tau_s/p_{\text{flow}$p_{\text{flow}}$ 是材料的流动压强（屈服硬度）。这就解释了 Amontons 的"摩擦力与表观面积无关"之谜——把物块切两半，每半的法向力减半、真实接触面积减半，但单位真实面积的摩擦不变，总摩擦力随法向力线性变。摩擦系数 $\mu=\tau_s/p_{\text{flow}}$ 只是两个材料属性的比值，所以"只与材料对有关"。

单向调制的物理根源：注意这个微观图像里的因果方向——法向力决定真实接触面积，真实接触面积决定最大切向力。是法向"单向地"调制切向，反过来切向力（剪断黏着点）几乎不影响真实接触面积（在小变形下）。这个**物理上的单向因果**，正是 §0 "坏性质二非对称"和 §2.3 "非关联流动"的根源——数学上的"切向受法向调制、法向不受切向影响"，对应的就是这个微观的单向因果链。

本质洞察：Coulomb 律的全部"麻烦"——非对称、非凸、非唯一——都可以追溯到这个微观事实：法向压力通过控制真实接触面积来设定切向摩擦的上限，而这个控制是单向的。理解了这一点，你就明白为什么不能简单地把法向和切向解耦处理（错误模型三），也明白为什么把法向力当常数（§2.2 MDP 的简化）虽然方便但会在法向-切向耦合处留下裂缝（§2.3）。物理的单向因果，注定了数学的非对称。

类比（标边界）：摩擦锥像一个"预算约束"。法向力 $r_N$ 像你的"收入"，它决定了你能花的切向力"预算"上限 $\mu r_N$；切向力 $\mathbf{r}_T$ 像你的"支出"，必须不超预算。相似处：预算上限由收入单向决定（收入→预算，支出不改收入），正如切向上限由法向单向决定。不像处：预算约束通常是 $\ell_1$ 或盒式（各项独立上限），而摩擦是 $\ell_2$ 范数约束（切向各分量耦合成一个圆）——这个区别正是 §2.4 多面体（盒式/$\ell_\infty$ 近似）与真锥（$\ell_2$）的差异来源。边界：不要把这个类比延伸到"预算可以储蓄/借贷"——摩擦没有跨时间的累积，它是每个瞬间独立的约束。

深入理解：静摩擦系数 vs 动摩擦系数，以及为什么本章用单一 $\mu$¶

细心的读者会问：中学物理讲"最大静摩擦系数 $\mu_s$ 比动摩擦系数 $\mu_k$ 大"（推一个重物，刚推动的瞬间最费力，动起来后省力），那本章的摩擦锥用哪个 $\mu$？

物理事实：确实 $\mu_s\gtrsim\mu_k$（典型差 $10\%$–$30\%$）。这对应一个"双锥"结构——静止时力可达较胖的静摩擦锥 $K_{\mu_s}$，一旦滑动力掉到较瘦的动摩擦锥 $K_{\mu_k}$。这个"由静转动时摩擦力突降"是**粘滑振动（stick-slip oscillation）** 的根源——门轴吱呀、粉笔尖叫、地震断层滑动，都是 $\mu_s>\mu_k$ 制造的"积累-突释"循环。

为什么本章（和绝大多数机器人接触模型）用单一 $\mu$？ 三个理由：(1) 数学简洁——单一 $\mu$ 让摩擦锥是一个固定的凸锥，$\mu_s\ne\mu_k$ 会让锥"随状态跳变"，破坏凸性和连续性，求解大大复杂化。(2) 机器人场景下差异小——多数机器人接触（足底、指尖）的 $\mu_s$ 与 $\mu_k$ 差异在建模误差范围内，单一 $\mu$ 够用。(3) 粘滑振动多数时候是要避免的——控制器希望平滑接触，不希望激发 stick-slip，所以用单一 $\mu$（通常取偏保守的 $\mu_k$）反而符合控制目标。

类比（标边界）：单一 $\mu$ 像"把台阶磨成斜坡"。真实摩擦的静→动是个"台阶"（$\mu_s$ 突降到 $\mu_k$），单一 $\mu$ 模型把台阶抹平成一个高度。相似处：都给出"摩擦力有上界"的核心行为。不像处：单一 $\mu$ 模型无法产生 stick-slip 振动（没有突降就没有积累-突释循环）。边界：研究 stick-slip 现象（如断层力学、乐器发声、精密定位的爬行）时**必须**用双锥 $\mu_s>\mu_k$，单一 $\mu$ 会完全错过这个现象；但做平滑运动控制时单一 $\mu$ 足够且更稳定。本章及下游 MPC/WBC 默认单一 $\mu$，遇到 stick-slip 问题时回到这里。

理论二：摩擦锥 $K_\mu$ 是一个二阶锥（Lorentz 冰激凌锥）¶

把所有满足陈述 A 的接触力 $\mathbf{r} = (r_N, \mathbf{r}_T) = (r_N, r_{T,x}, r_{T,y}) \in \mathbb{R}^3$ 收集起来，得到 摩擦锥（friction cone）： $$ K_\mu \;=\; \bigl{\,\mathbf{r} = (r_N, \mathbf{r}_T) \in \mathbb{R}^3 \;:\; |\mathbf{r}_T| \le \mu\, r_N \,\bigr}. \tag{2.4} $$

这个集合的形状是一个**以法向轴 $\mathbf{n}$ 为中心轴、半顶角为 $\arctan\mu$ 的实心圆锥**（顶点在原点）。它看起来就像一支倒立的冰激凌甜筒——这也是它的别名"冰激凌锥（ice-cream cone）"的由来。半顶角 $\theta_\mu = \arctan\mu$ 是因为：在锥面上 $\|\mathbf{r}_T\| = \mu r_N$，切向分量与法向分量之比就是 $\tan\theta_\mu = \|\mathbf{r}_T\|/r_N = \mu$。

为什么它叫"二阶锥（second-order cone, SOC）"？ 二阶锥的标准定义是 $$ \mathcal{Q}^{n+1} = \bigl{\, (t, \mathbf{x}) \in \mathbb{R} \times \mathbb{R}^n : |\mathbf{x}|_2 \le t \,\bigr}, \tag{2.5} $$ 也叫 Lorentz 锥（Lorentz cone）（因为它和狭义相对论里"未来光锥" $\{(t,\mathbf{x}): \|\mathbf{x}\| \le ct\}$ 同构）。对比 $(2.4)$ 与 $(2.5)$：摩擦锥就是把标准二阶锥的轴向坐标 $t$ 换成 $\mu r_N$。具体地，做线性变换 $t = \mu r_N$、$\mathbf{x} = \mathbf{r}_T$，则 $K_\mu$ 与标准 Lorentz 锥 $\mathcal{Q}^3$ 仿射同构。所以**摩擦锥是二阶锥的一个线性像**，这件事是后面一切"用 SOCP 求解器解摩擦"的根本依据。

"二阶"这个名字来自约束 $\|\mathbf{x}\| \le t$ 平方后是 $x_1^2 + \cdots + x_n^2 \le t^2$（一个二次/二阶不等式）。这与"一阶锥"——非负象限 $\mathbb{R}^n_{\ge 0} = \{\mathbf{x}: x_i \ge 0\}$，由线性（一阶）不等式定义——形成对照。专题 1 的无摩擦 LCP 活在一阶锥（非负象限）里，本章的摩擦把我们抬进了二阶锥。

多视角理解（几何视角 vs 代数视角）： - 几何视角：$K_\mu$ 是 $\mathbb{R}^3$ 中一个实心圆锥，"在锥内"= 力的方向偏离法向轴不超过 $\arctan\mu$ 度。这个视角让你一眼看出"摩擦系数越大、锥越胖、能用的切向力越多"。 - 代数视角：$K_\mu = \{\mathbf{r}: \mu r_N - \|\mathbf{r}_T\| \ge 0\}$ 是一个二次不等式的解集，是 SOC 的线性像。这个视角让你能把它丢进 SOCP 求解器（如 ECOS、Mosek、Clarabel）。两个视角的边界：几何视角直观但不可计算（你没法让求解器"看图"），代数视角可计算但不直观（看不出胖瘦）。工程中要在两者间自由切换——画图时用几何，写约束时用代数。

为什么是凸的？ $K_\mu$ 是凸集，这一点至关重要（后面凸松弛的全部价值都建立在此）。证明很短但要会：取 $\mathbf{r}^{(1)}, \mathbf{r}^{(2)} \in K_\mu$ 和 $\lambda \in [0,1]$，记 $\mathbf{r} = \lambda \mathbf{r}^{(1)} + (1-\lambda)\mathbf{r}^{(2)}$。则法向分量 $r_N = \lambda r_N^{(1)} + (1-\lambda) r_N^{(2)} \ge 0$（非负数的凸组合非负）。切向分量用三角不等式： $$ |\mathbf{r}_T| = |\lambda \mathbf{r}_T^{(1)} + (1-\lambda)\mathbf{r}_T^{(2)}| \le \lambda|\mathbf{r}_T^{(1)}| + (1-\lambda)|\mathbf{r}_T^{(2)}| \le \lambda \mu r_N^{(1)} + (1-\lambda)\mu r_N^{(2)} = \mu r_N. $$ 所以 $\mathbf{r} \in K_\mu$，凸性得证。关键用到的是**范数的凸性（三角不等式）**——这也解释了为什么把锥换成方形（用 $\ell_\infty$ 范数的"球")仍然凸，但换成非凸的范数就会破坏凸性。

理论三：对偶锥与自对偶性¶

回顾前置自测第 2 题：闭凸锥 $K$ 的**对偶锥（dual cone）**定义为 $$ K^* = \bigl{\, \mathbf{y} \in \mathbb{R}^n : \langle \mathbf{y}, \mathbf{x}\rangle \ge 0, \forall \mathbf{x} \in K \,\bigr}. \tag{2.6} $$ 几何上，$K^*$ 是"与 $K$ 中每个向量夹角都不超过 $90°$ 的所有向量"。对偶锥在接触力学里不是抽象装饰——它正是**速度可行集**所在的锥，§2.2 会看到力在 $K_\mu$、速度在与之配对的对偶结构里，这种"力-锥/速度-对偶锥"的配对是整个变分框架的骨架。

计算摩擦锥的对偶锥。 对 $K_\mu = \{(r_N,\mathbf{r}_T): \|\mathbf{r}_T\| \le \mu r_N\}$，我们要找所有 $(y_N, \mathbf{y}_T)$ 使得对任意 $(r_N, \mathbf{r}_T) \in K_\mu$ 有 $$ \langle (y_N,\mathbf{y}T), (r_N,\mathbf{r}_T)\rangle = y_N r_N + \mathbf{y}_T^\top \mathbf{r}_T \ge 0. $$ 最难为这个内积的 $\mathbf{r}_T$ 是"使内积最负"的方向：固定 $r_N$，让 $\mathbf{r}_T$ 取模长 $\mu r_N$、方向沿 $-\mathbf{y}_T$，此时 $\mathbf{y}_T^\top \mathbf{r}_T = -\mu r_N \|\mathbf{y}_T\|$。代入要求内积非负： $$ y_N r_N - \mu r_N|\mathbf{y}_T| \ge 0 \quad\Longrightarrow\quad y_N \ge \mu|\mathbf{y}_T| \quad\Longrightarrow\quad |\mathbf{y}_T| \le \tfrac{1}{\mu} y_N. $$ 所以 $$ \boxed{\,K\mu^* = \bigl{ (y_N,\mathbf{y}T) : |\mathbf{y}_T| \le \tfrac{1}{\mu}\, y_N \bigr} = K \tag{2.7} $$ }.\,摩擦锥的对偶锥是摩擦系数取倒数的摩擦锥。这个结果极其优美：原锥半顶角 $\arctan\mu$，对偶锥半顶角 $\arctan(1/\mu) = 90° - \arctan\mu$——两个锥的半顶角互余，它们的锥面互相垂直。这正是"夹角不超过 $90°$"的几何兑现。

自对偶性（self-duality）。 当 $\mu = 1$ 时，$K_1^* = K_{1/1} = K_1$，摩擦锥与自身对偶——这就是 §2.1 目标里说的"$\mu=1$ 时的自对偶性"。标准 Lorentz 锥 $\mathcal{Q}^{n+1}$（对应 $\mu=1$）是自对偶锥的典范例子，和非负象限 $\mathbb{R}^n_{\ge0}$、半正定锥 $\mathbb{S}^n_+$ 并列为凸优化三大自对偶锥。$\mu \ne 1$ 时摩擦锥不自对偶，但仍然是 SOC 的线性像，这个区别在写对偶问题时要小心（§2.5）。

本质洞察：对偶锥不是"为了对称好看"硬造的概念。$K_\mu^* = K_{1/\mu}$ 这个事实的物理含义是——法向速度与切向滑动之间也有一个"摩擦锥"，只不过系数是 $1/\mu$。当 $\mu$ 很大（粗糙地面）时，力锥很胖（$\arctan\mu \to 90°$），而速度对偶锥很瘦（$\arctan(1/\mu)\to 0°$），意味着"几乎任何方向的力都合法，但合法的滑动方向被法向速度严格限制"。这种"一胖一瘦"的对偶关系，是 §2.3 de Saxcé 双势能成立的几何根基。

理论四：无滑动判据 $\mathbf{r} \in \mathrm{int}\,K_\mu$¶

有了锥的几何，"会不会打滑"这个工程问题就有了一句话的判据。回顾分情形式 $(2.3)$：

力在锥的**内部**（$\|\mathbf{r}_T\| < \mu r_N$，严格小于）$\;\Longleftrightarrow\;$ 必然处于**粘滞**状态（$\mathbf{u}_T = \mathbf{0}$）。因为若有滑动，按 $(2.3)$ 力必在锥面上，矛盾。
力在锥的**边界（锥面）**上（$\|\mathbf{r}_T\| = \mu r_N$）$\;\Longleftrightarrow\;$ **临界**或**滑动**状态。

所以**无滑动（粘滞）的充要判据**是接触力落在摩擦锥内部： $$ \boxed{ \text{无滑动} \quad\Longleftrightarrow\quad \mathbf{r} \in \mathrm{int}\, K_\mu \quad\Longleftrightarrow\quad |\mathbf{r}_T| < \mu r_N (\text{且} r_N > 0). } \tag{2.8} $$

这条判据是抓取（grasping）与足式支撑（support）分析的命门。在抓取力闭合（force closure）里，"抓得稳"的一个必要条件就是每个指尖接触力都在各自摩擦锥内部、且合起来能平衡任意外部扰动（§3 会展开）；在足式机器人里，"脚不打滑"就是要求地面反力落在摩擦锥内部，这直接变成 MPC 里每只脚的约束（§7）。

理论-工程桥接：判据 $(2.8)$ 在工程里不会原样写——你不能要求"严格小于"（数值上 $<$ 和 $\le$ 没法区分，且严格不等式不是闭约束、优化器处理不了）。实际做法是引入**安全裕度**：要求 $\|\mathbf{r}_T\| \le (\mu - \epsilon) r_N$ 或 $\|\mathbf{r}_T\| \le \mu r_N$ 配合在目标里惩罚靠近锥面。足式 MPC 里常用稍微保守的 $\mu_{\text{ctrl}} = 0.7\mu_{\text{real}}$，留 $30\%$ 裕度对抗模型误差和估计噪声——这就是把"$\in \mathrm{int}\,K_\mu$"工程化的标准手法。

理论四补：摩擦锥与法向 Signorini 如何"合体"成完整接触律¶

§2.1 到目前只讲了摩擦（切向 + 锥），但完整的接触还有专题 1 的法向 Signorini 互补。这两块怎么拼成一个完整的接触律？这一步常被略过，却是理解 §2.5 CCP 的前提，必须讲清楚。

回顾专题 1：法向 Signorini 是 $0\le g_N\perp r_N\ge0$（间隙 $g_N$ 与法向力 $r_N$ 互补——要么接触 $g_N=0$ 可有力、要么分离 $g_N>0$ 力为零）。在**速度层**（时步法用的形式），它变成 $0\le u_N\perp r_N\ge0$（接触激活时 $u_N\ge0$ 不侵入、$r_N\ge0$）。

把法向 Signorini 和切向 Coulomb 锥拼起来，完整的单接触律是： $$ \boxed{\; \begin{aligned} &\text{法向：}\quad 0\le u_N \perp r_N\ge0 \quad(\text{Signorini，专题 1})\ &\text{切向：}\quad \mathbf{r}T\in\mathbb{D}}, -\mathbf{uT\in N) \end{aligned}\;} \tag{2.8a} $$ 关键观察：}_{\mu r_N}}(\mathbf{r}_T)\quad(\text{Coulomb MDP，§2.2这两块通过 $r_N$ 耦合——切向圆盘的半径 $\mu r_N$ 由法向力决定。这正是 §0"单向调制"的完整数学形式：法向 Signorini 定 $r_N$，$r_N$ 定切向锥半径，切向 MDP 在这个半径的圆盘上定 $\mathbf{r}_T$。三者像多米诺骨牌，但只能单向倒（法向→切向，不能反）。

把 $(2.8a)$ 合并写成"力在整个二阶锥 $K_\mu$ 内"的形式：法向 $r_N\ge0$ 是锥的"轴向非负"，切向 $\|\mathbf{r}_T\|\le\mu r_N$ 是锥的"侧向约束"，合起来 $\mathbf{r}\in K_\mu$。所以摩擦锥 $K_\mu$ 不只编码摩擦，它把"只推不拉的法向"和"有界的切向"统一进了一个锥——这就是为什么 §2.5 的 CCP 能用一个锥互补 $K_\mu\ni\mathbf{r}\perp\mathbf{u}\in K_\mu^*$ 同时表达法向和切向接触。

本质洞察：二阶锥 $K_\mu$ 的"轴"恰好是法向、"截面"恰好是切向，这个几何安排不是偶然——它精确镜像了接触物理的结构（法向只推不拉对应轴向非负，切向有界对应截面圆盘）。专题 1 的法向互补是 $K_\mu$ 在轴上的投影，本章的切向摩擦是 $K_\mu$ 在截面上的约束，两者是同一个锥的两个侧面。 理解这一点，你就明白为什么接触力学能用"一个锥"统一处理法向和切向——它们本就是同一个几何对象的两个维度。

理论五：为什么"丢信息"——集值映射不能写成单值函数¶

§2.1 目标里有一句"解释它为什么不能写成单值函数 $\mathbf{r}_T = f(\mathbf{u}_T)$，并指出丢信息的代价具体出现在哪"。现在我们已有足够工具回答。

考虑粘滞状态：$\mathbf{u}_T = \mathbf{0}$，但 $\mathbf{r}_T$ 可以是圆盘 $\{\|\mathbf{r}_T\|\le\mu r_N\}$ 里**任意一点**。如果硬要写成函数 $\mathbf{r}_T = f(\mathbf{u}_T)$，那么 $f(\mathbf{0})$ 必须是一个确定的值——但物理上它是一整个圆盘。单值函数在 $\mathbf{u}_T = \mathbf{0}$ 处无法表达多值性，这就是第一处丢信息。

很多工程实现为了"图省事"，用一个**正则化（regularization）把摩擦律改写成单值函数，最常见的是 $$ \mathbf{r}_T = -\mu r_N \frac{\mathbf{u}_T}{|\mathbf{u}_T| + \varepsilon} \quad\text{或}\quad \mathbf{r}_T = -\mu r_N\,\tanh!\bigl(\mathbf{u}_T/v_s\bigr), \tag{2.9} $$ 用一个小参数 $\varepsilon$（或特征速度 $v_s$）把 $\mathbf{u}_T=\mathbf{0}$ 处的"硬拐角"磨成光滑曲线。这确实让摩擦律变成单值、可微、好求解，但代价是**静摩擦消失了：当外切向力很小、物体应当静止时，正则化模型会给出一个微小但非零的滑动速度 $\mathbf{u}_T \ne \mathbf{0}$（因为只有 $\mathbf{u}_T\ne\mathbf{0}$ 才能产生抵抗外力的 $\mathbf{r}_T$）。这就是**蠕变（creep）/漂移（drift）伪影**——理论上静止的物体在斜面上会以肉眼难见的速度缓慢下滑。

对比性思维（不是 X 而是 Y）：正则化摩擦**不是 Coulomb 律的近似，而是一个本质不同的物理模型**——它是黏性摩擦（错误模型一！）的变种，只不过在大速度区把幅值压到 $\mu r_N$。它在"动"的区域像 Coulomb，在"静"的区域像黏性。理解这一点你就知道：MuJoCo 默认的平滑摩擦在快速运动的腿上很准，但在"机器人静止站立"这类需要真静摩擦的场景会有微小漂移——这不是 bug，是模型选择的必然代价。

丢信息的代价具体出现在哪？ 三个场景：(1) 精密装配中零件应静止却缓慢漂移（蠕变）；(2) 抓取中"夹住不动"的物体在正则化下持续微滑，长时间累积成可见位移；(3) 足式机器人长时间静态站立时足底接触点缓慢蠕动，导致里程计漂移。这些都不是数值误差，而是**用单值函数表达集值律必然付出的代价**。要消除它，要么回到真正的集值/锥形式（§2.2 之后），要么把 $\varepsilon$ 取得极小（但会让方程刚性、求解变慢）——又一个精度-速度权衡。

⚠️ 常见陷阱¶

💡 概念误区一：把摩擦锥的"锥"理解成只有侧面（空心锥） - 新手想法："摩擦锥就是那个甜筒的表面，力要落在锥面上。" - 实际上：$K_\mu$ 是**实心锥**（solid cone），包含内部所有点，不只是侧面。力落在内部（$\|\mathbf{r}_T\|<\mu r_N$）是合法的、且对应粘滞；只有滑动时力才在锥面上。把锥理解成空心面，会误以为"任何合法摩擦力都取到最大值 $\mu r_N$"——这正是错误模型二。 - 为什么重要：判据 $(2.8)$ 的全部意义就在于区分"内部"（粘）和"边界"（滑）。混淆实心/空心，整个粘滑分析就崩了。 - 自检：问自己"一个静止在水平桌面、无人推它的物块，摩擦力是多少？"答案是零（在锥的顶点/内部最深处），不是 $\mu r_N$。

💡 概念误区二：认为摩擦系数 $\mu$ 一定小于 1 - 新手想法："$\mu$ 是个小数，橡胶撑死 0.8，所以摩擦锥半顶角总小于 $45°$。" - 实际上：$\mu = \tan\theta_\mu$ 可以大于 1。硅橡胶对玻璃、某些专用抓取材料 $\mu$ 可达 1.5–2，对应半顶角超过 $56°$。$\mu>1$ 时锥比 $45°$ 还胖，对偶锥比 $45°$ 还瘦。代码里若把 $\mu$ 默认裁剪到 $\le 1$ 会错误地缩小可行域。 - 为什么重要：抓取设计里专门选高 $\mu$ 材料来"扩胖摩擦锥"，从而用更小的法向夹持力实现 force closure。把 $\mu$ 当成 $<1$ 会低估抓取能力。 - 自检：$\arctan(2) \approx 63.4°$，确认你的几何直觉允许锥比 $45°$ 胖。

🧠 思维陷阱：把 Coulomb 律当成"一条公式"而非"一对陈述" - 新手想法："Coulomb 律就是 $\|\mathbf{r}_T\| \le \mu r_N$ 一个不等式。" - 实际上：那只是陈述 A（可行域）。完整 Coulomb 律还有陈述 B（最大耗散/流动法则），它决定力在可行域里**具体取哪一点**。只记 A 不记 B，你能判断"会不会超出锥"，但永远算不出"摩擦力具体多大、朝哪"。仿真器代码里 A 体现为约束、B 体现为互补条件或目标函数，两者缺一不可。 - 正确思维：每次遇到摩擦，问两个问题——"力的可行集是什么形状？"（A，几何）和"力在这个集合里取哪一点？"（B，变分）。本章 §2.1 答 A，§2.2 答 B。 - 自检：闭眼说出滑动状态下 $\mathbf{r}_T$ 的方向和大小——若只能说"$\le\mu r_N$"答不出方向，说明你只装了陈述 A。

练习¶

以下练习建议在草稿纸上完成关键推导步骤。

代码验证（可选，理论结论的数值确认）¶

理论教学中代码只承担"验证推导结论"的角色（规范 R8 步骤⑤）。下面用一段简短的 Python 数值验证 §2.1 的两个核心结论——对偶锥 $K_\mu^*=K_{1/\mu}$（$(2.7)$）与二阶锥投影 $(11.1)$ 的正确性。

import numpy as np

def in_cone(r, mu):
    """判断 r=(r_N, r_Tx, r_Ty) 是否在摩擦锥 K_mu 内（陈述 A / (2.4)）。"""
    r_N, r_T = r[0], r[1:]
    return r_N >= 0 and np.linalg.norm(r_T) <= mu * r_N + 1e-12  # 容差防浮点误差

def project_to_cone(z, w, mu):
    """投影到二阶锥 K_mu，三分支 (11.1)：锥内/极锥/侧面。"""
    nw = np.linalg.norm(w)
    if nw <= mu * z:                       # 已在锥内，不变
        return z, w
    if nw <= -z / mu:                      # 在极锥（对偶锥负向），投到原点
        return 0.0, np.zeros_like(w)
    z_plus = (mu * nw + z) / (1 + mu**2)   # 锥外侧面区，投到锥面
    w_plus = mu * z_plus * w / nw
    return z_plus, w_plus

# 验证 1：对偶锥 K_mu* = K_{1/mu}。随机取 y in K_{1/mu}，验证它与所有 K_mu 中的 r 内积 >= 0。
mu = 0.5
rng = np.random.default_rng(0)
y = np.array([1.0, 0.3, 0.4])            # ||y_T||=0.5 = (1/mu)*... 检查 y in K_{1/mu}: 0.5 <= 2*1 ✓
assert np.linalg.norm(y[1:]) <= (1/mu) * y[0] + 1e-9, "y 不在 K_{1/mu} 内"
min_ip = min((y @ r) for r in
             [np.array([1, mu*np.cos(t), mu*np.sin(t)]) for t in np.linspace(0, 2*np.pi, 360)])
print(f"y in K_(1/mu) 与所有 K_mu 母线的最小内积 = {min_ip:.4f} (应 >= 0)")  # ≈ 0，确认对偶

# 验证 2：投影后确实落在锥面（§11 算例的数 (0.10, [-0.40,0]) -> 应得 (0.24, [-0.12,0]))
z_p, w_p = project_to_cone(0.10, np.array([-0.40, 0.0]), mu)
print(f"投影结果 z={z_p:.4f}, w={w_p}, 在锥面? {abs(np.linalg.norm(w_p) - mu*z_p) < 1e-9}")

运行输出验证：内积最小值 $\approx 0$（确认 $y\in K_{1/\mu}$ 与 $K_\mu$ 每条母线夹角 $\le90°$，即对偶锥正确），投影结果为 $(0.24, [-0.12, 0])$ 且落在锥面（与 §11 手算一致）。代码不替代推导，只是给手算的结论盖一个数值确认的章——理论已在前面推完，这里只是验证。

练习 2.1.1（推导题，⭐⭐） 半顶角与对偶。已知摩擦锥 $K_\mu$ 半顶角为 $\arctan\mu$。(a) 用纯几何（不借助 $(2.7)$ 的代数推导）论证：对偶锥的半顶角必为 $90°-\arctan\mu$。提示：对偶锥的锥面法向恰是原锥的母线方向。(b) 由此独立验证 $K_\mu^* = K_{1/\mu}$。(c) 当 $\mu\to\infty$（完全粗糙）时，$K_\mu$ 和 $K_\mu^*$ 各退化成什么集合？给出物理解释。

练习 2.1.2（开放思考题，⭐⭐⭐） 各向异性摩擦。真实情况里某些表面（如拉丝金属、织物）沿不同方向摩擦系数不同（$\mu_x \ne \mu_y$）。(a) 写出此时可行域的集合形式。(b) 它还是二阶锥吗？是椭圆锥（elliptic cone）吗？椭圆锥还是 SOC 的线性像吗？(c) 它的对偶锥是什么形状？提示：椭圆锥可经对角缩放化为标准 Lorentz 锥。这个练习直通 §4 的各向异性主题与 Matchstick 模型。

练习 2.1.3（证明题，⭐⭐⭐） 集值映射的闭性。把粘滑律 $(2.3)$ 看成从速度到力的集值映射 $\mathbf{u}_T \mapsto \mathcal{R}(\mathbf{u}_T) \subseteq \mathbb{R}^2$（粘滞时是圆盘，滑动时是单点）。(a) 证明这个映射的图（graph）$\{(\mathbf{u}_T, \mathbf{r}_T): \mathbf{r}_T\in\mathcal{R}(\mathbf{u}_T)\}$ 是 $\mathbb{R}^2\times\mathbb{R}^2$ 中的闭集（上半连续，upper semicontinuous）。(b) 说明这个闭性为什么对"解的存在性"很重要（提示：联系专题 1 里的不动点定理需要映射闭）。(c) 反之，正则化模型 $(2.9)$ 的映射是单值连续的——它牺牲了什么换来了这个好性质？

§2.2 最大耗散原理（MDP）：把"判断式"变成"优化问题" ⭐⭐⭐¶

过渡：从"在哪个集合"到"取哪一点"¶

§2.1 把摩擦力的可行集 $K_\mu$ 的几何讲透了，并通过分情形式 $(2.3)$ 给出了力的取值规则。但 $(2.3)$ 是一个**分情形的、带逻辑判断的**陈述（"如果粘则……如果滑则……"），它有两个工程上的硬伤：第一，"$\mathbf{u}_T=\mathbf{0}$"这个判断在浮点数里几乎永不精确成立，代码里满是 if (norm < 1e-9) 这样的脆弱阈值；第二，分情形结构无法直接塞进一个统一的优化求解器。本节的任务就是把这个"判断式"重写成一个**单一的优化问题**——这就是最大耗散原理（Maximum Dissipation Principle, MDP）。一旦摩擦律变成"某个优化问题的解"，专题 1 的全部凸优化机器（KKT、对偶、投影迭代）就能直接接管。

动机：摩擦在"偷"能量，而且偷得最多¶

观察一个物理事实：摩擦总是消耗机械能（变成热）。滑动时摩擦力反平行于速度，做负功，功率为 $P_{\text{fric}} = \mathbf{r}_T^\top \mathbf{u}_T < 0$。我们把**耗散功率（dissipated power）**定义为这个负功的相反数 $D = -\mathbf{r}_T^\top \mathbf{u}_T \ge 0$（摩擦从系统抽走能量的速率）。

现在问一个看似奇怪的问题：给定当前滑动速度 $\mathbf{u}_T$，在所有**合法**的摩擦力（落在锥约束 $\|\mathbf{s}\|\le\mu r_N$ 内）中，真实的摩擦力是哪一个？历史上 von Mises、Moreau、Goyal–Ruina 等人从不同角度给出了同一个答案——真实摩擦力是使耗散功率最大的那个合法力。这就是最大耗散原理：

\[ \mathbf{r}_T \;=\; \arg\max_{\mathbf{s}:\,\|\mathbf{s}\|\le \mu r_N}\ \bigl(-\mathbf{s}^\top \mathbf{u}_T\bigr). \tag{2.10} \]

反面：如果不用 MDP，你被迫维护一棵 if-else 决策树¶

不用 MDP 的世界长什么样？你得手写一棵决策树：先判断 $\|\mathbf{u}_T\|$ 是否为零 → 若非零，算 $-\mu r_N \mathbf{u}_T/\|\mathbf{u}_T\|$ → 若为零，再去解一个"摩擦力要平衡多大外力"的子问题，而这个子问题本身又依赖于其他接触点的状态（耦合！）……多个接触点时，每个点独立判断粘/滑，组合爆炸，且"猜错粘滑状态"会导致整个线性系统不一致。这正是早期 事件驱动（event-driven） 接触仿真的噩梦：每次粘滑切换都是一个"事件"，求解器要停下来重新分类、重新组装方程。MDP 的革命性在于：它**不需要预先知道粘还是滑**——把所有接触点的摩擦力作为一个统一优化问题的变量，最优解自动给出每个点正确的粘/滑状态。这就是 时步法（time-stepping） 相对事件驱动的根本优势（专题 3 主题）。

历史：Moreau 的凸分析革命与 Goyal–Ruina 的极限面¶

MDP 的思想可追溯到塑性力学的 最大塑性耗散原理（principle of maximum plastic dissipation）——von Mises 1928 提出，说塑性流动方向使塑性耗散最大。Moreau 在 1960–70 年代意识到 Coulomb 摩擦在数学上与理想塑性"流动法则"同构，于是把凸分析（他自己也是凸分析奠基人之一，"Moreau 包络""Moreau 分解"都是他的）整体搬进接触力学，将摩擦律写成次微分包含 $-\mathbf{u}_T \in \partial \psi_{K_\mu}(\mathbf{r}_T)$ 的形式（$\psi$ 是支撑函数的共轭）。1991 年 Goyal、Ruina、Papadopoulos 从"极限面（limit surface）"角度给出了等价表述（§3 详述），把 MDP 几何化为"速度是极限面在力点处的外法向"。这些工作让摩擦从"经验律"升级为"变分原理"，是本章 §2.3、§2.5 的共同源头。

理论：从 MDP 用两行 KKT 推出全部粘滑行为¶

现在兑现 §2.2 标题里的承诺——用两行 KKT 从 MDP 推出 $(2.3)$ 的全部粘滑行为。这是本章最重要的推导之一，每一步都要看懂。

Step 0：把 $\arg\max$ 写成标准凸优化。 $(2.10)$ 是在二阶锥的"圆盘截面"$\{\|\mathbf{s}\|\le\mu r_N\}$（半径 $\mu r_N$ 的二维圆盘，记作 $\mathbb{D}_{\mu r_N}$）上最大化线性函数 $-\mathbf{s}^\top\mathbf{u}_T$。等价地最小化 $\mathbf{s}^\top\mathbf{u}_T$： $$ \min_{\mathbf{s}\in\mathbb{R}^2} \mathbf{s}^\top\mathbf{u}_T \qquad \text{s.t.}\quad g(\mathbf{s}) := \tfrac12\bigl(|\mathbf{s}|^2 - (\mu r_N)^2\bigr)\le 0. \tag{2.11} $$ （约束写成 $g\le0$ 的二次形式是为了求导方便；$\tfrac12$ 和平方不改变可行域。）目标线性、约束凸（$g$ 是凸二次），这是一个凸优化问题，KKT 条件充要。

Step 1（第一行 KKT——平稳性）： 引入乘子 $\lambda\ge0$，Lagrange 函数 $\mathcal{L}(\mathbf{s},\lambda) = \mathbf{s}^\top\mathbf{u}_T + \lambda\cdot\tfrac12(\|\mathbf{s}\|^2-(\mu r_N)^2)$。对 $\mathbf{s}$ 求梯度置零： $$ \nabla_{\mathbf{s}}\mathcal{L} = \mathbf{u}_T + \lambda\,\mathbf{s} = \mathbf{0} \quad\Longrightarrow\quad \mathbf{r}_T \equiv \mathbf{s}^\star = -\frac{1}{\lambda}\mathbf{u}_T \quad(\text{当} \lambda>0). \tag{2.12} $$

Step 2（第二行 KKT——互补松弛）： $\lambda\, g(\mathbf{s}^\star) = 0$，即 $\lambda\bigl(\|\mathbf{s}^\star\|^2-(\mu r_N)^2\bigr)=0$。配合可行性 $g\le0$ 和对偶可行性 $\lambda\ge0$。

就这两行。 现在分情形读出全部物理：

情形一：$\mathbf{u}_T \ne \mathbf{0}$（滑动）。 由 $(2.12)$，若 $\lambda=0$ 则梯度方程给 $\mathbf{u}_T=\mathbf{0}$，矛盾。故 $\lambda>0$。由互补松弛 $\lambda>0\Rightarrow g=0\Rightarrow\|\mathbf{s}^\star\|=\mu r_N$（力在锥面上！）。再由 $(2.12)$，$\mathbf{s}^\star=-\frac1\lambda\mathbf{u}_T$ 与 $\mathbf{u}_T$ 反平行，且模长为 $\mu r_N$，故 $\lambda = \|\mathbf{u}_T\|/(\mu r_N)$，于是 $$ \mathbf{r}_T = -\mu r_N\frac{\mathbf{u}_T}{|\mathbf{u}_T|}. $$ 这正是 $(2.3)$ 的滑动分支！ 我们没有"假设"它，而是从 MDP 推出来了。
情形二：$\mathbf{u}_T = \mathbf{0}$（粘滞）。 目标函数 $\mathbf{s}^\top\mathbf{u}_T = 0$ 对任意 $\mathbf{s}$ 都是零——目标是平的！于是**圆盘内任意一点都是最优解**。最优解集 $= \{\|\mathbf{s}\|\le\mu r_N\}$，即整个圆盘。这正是 $(2.3)$ 的粘滞分支——多值！ MDP 自动给出了多值性，不需要单独处理。

本质洞察：MDP 的威力在于它把"分情形判断"内化成了"目标函数的平/不平"。滑动时速度非零，目标线性函数有唯一最大值（锥面上反平行那点）；粘滞时速度为零，目标恒为零、处处最优（整个圆盘）。集值性不是 MDP 的麻烦，而是 MDP 的自然产物——优化问题的最优解集本来就可以是集合而非单点。这是"把判断式变优化"带来的最大认知红利：你不再需要 if-else，最优解的结构自动编码了粘滑。

阶段小结：到这里我们用两行 KKT 从 MDP 推出了完整的 Coulomb 粘滑律。接下来把 MDP 与它的"对偶兄弟"——Gauss 最小约束原理——放在一起，理解原始-对偶关系。

理论：MDP 与 Gauss 最小约束原理的原始-对偶关系¶

MDP 是"固定速度、对力优化"。它有一个对偶面孔——固定力、对速度（加速度）优化，这就是 Gauss 最小约束原理（Gauss's principle of least constraint）。Gauss 1829 提出：受约束系统的真实加速度，是在所有满足约束的加速度中，使"约束偏差"（真实加速度与无约束加速度之差的质量加权范数）最小的那个。

把这两个原理放在接触问题里，它们构成一对**原始-对偶（primal-dual）问题： $$ \underbrace{\min_{\mathbf{u}} \tfrac12(\mathbf{u}-\mathbf{u}^{\text{free}})^\top M (\mathbf{u}-\mathbf{u}^{\text{free}}) \text{s.t. 速度可行}}{\text{Gauss（原始，对速度）}} \quad\Longleftrightarrow\quad \underbrace{\max \tag{2.13} $$ （}\in K_\mu} (\cdots) \text{s.t. 力平衡}}_{\text{MDP（对偶，对力）}$\mathbf{u}^{\text{free}}$ 是无接触力时的"自由速度"，$M$ 是质量矩阵。）这个原始-对偶对子在 §2.5 会具体化为 **CCP（锥互补问题）——Anitescu 的凸松弛正是把 Gauss 原理的可行域稍微"放大"使其变凸。

多视角理解（力视角 vs 速度视角）：同一个接触物理可以从两个对偶视角看—— - 力视角（MDP）：固定速度，问"哪个力耗散最多"。约束是力锥 $K_\mu$，变量是力 $\mathbf{r}$。 - 速度视角（Gauss）：固定力的可行性，问"哪个加速度最接近自由运动"。约束是速度可行集，变量是速度 $\mathbf{u}$。边界：两者在"关联流动（associated flow）"下严格对偶（Lagrange 对偶无间隙）。但 Coulomb 摩擦是**非关联**的（§2.3），所以这个对偶在摩擦项上会"破裂"——这正是 §2.3 de Saxcé 双势要修补的。不标这个边界，会误以为 MDP 和 Gauss 永远完美对偶。

理论：Gauss 最小约束原理的完整推导（与 MDP 对偶配对）¶

上面给了 MDP-Gauss 对偶的"结论形式"$(2.13)$，这里把 Gauss 原理本身推导一遍，让对偶关系落到实处——这也是规范 R1"完整推导链、禁止由文献可知"的要求。

Gauss 原理的陈述：考虑一个无约束时加速度为 $\mathbf{a}^{\text{free}}=M^{-1}\mathbf{f}_{\text{ext}}$ 的系统（$\mathbf{f}_{\text{ext}}$ 是外力）。施加约束（这里是接触不可侵入 + 摩擦）后，真实加速度 $\mathbf{a}$ 是在所有**满足约束的加速度**中，使"约束偏差" $$ Z(\mathbf{a}) = \tfrac12(\mathbf{a}-\mathbf{a}^{\text{free}})^\top M (\mathbf{a}-\mathbf{a}^{\text{free}}) \tag{2.13a} $$ 最小的那个。$Z$ 是真实加速度偏离自由加速度的"质量加权平方距离"——Gauss 把它叫"约束量（constraint）"，原理就是"自然以最小约束量运动"。

为什么这个泛函是 $M$ 加权的二次型？ 这不是任意选的。把约束力 $\mathbf{r}_c$ 写出来：$M\mathbf{a}=\mathbf{f}_{\text{ext}}+\mathbf{r}_c$，故 $\mathbf{a}-\mathbf{a}^{\text{free}}=M^{-1}\mathbf{r}_c$。代入 $(2.13a)$： $$ Z = \tfrac12(M^{-1}\mathbf{r}_c)^\top M (M^{-1}\mathbf{r}_c)=\tfrac12\mathbf{r}_c^\top M^{-1}\mathbf{r}_c. \tag{2.13b} $$ 最小化加速度偏差 $\Leftrightarrow$ 最小化约束力的 $M^{-1}$ 加权范数。这把 Gauss 原理（对加速度）翻译成了一个关于约束力的二次型——而这个二次型 $\tfrac12\mathbf{r}_c^\top M^{-1}\mathbf{r}_c$ 正是 §2.5 CCP 凸 QP $(2.26)$ 目标里 $\tfrac12\mathbf{r}^\top N\mathbf{r}$ 的来源（$N=D^\top M^{-1}D$ 是把它投影到接触空间）。至此 Gauss 原理与 CCP 的目标函数严格对接上了——这不是巧合，是原始-对偶的必然。

对偶配对的严格陈述：Gauss（原始，min 加速度偏差，约束是"速度/加速度可行"）与 MDP（对偶，max 耗散，约束是"力在锥内"）构成一对凸优化的原始-对偶问题。在关联流动下，强对偶成立（无对偶间隙），两个问题的最优值相等、最优解通过 KKT 互为表里。Coulomb 的非关联性（§2.3）正是让这个强对偶在"法向-切向耦合"项上出现间隙的原因——de Saxcé 的修正恰好补上这个间隙。

本质洞察：Gauss 原理告诉我们一件深刻的事——约束力（包括接触力、摩擦力）不是"额外加进来的外力"，而是系统为了"以最小代价满足约束"自发产生的最优响应。摩擦力之所以"按需供给"（§2.1），正是因为它是这个最小化问题的解：需要多少约束力来维持不侵入/不打滑，系统就产生多少，多一分都不要（$M^{-1}$ 范数最小）。这把 §2.1 的"按需供给"从一句直觉提升成了一个变分原理的推论。

深入对比：集值摩擦 vs 正则化摩擦的定量差异¶

§2.1 理论五定性讲了正则化摩擦会丢静摩擦、产生蠕变。这里用 MDP 框架把两者的差异定量化，让你在选模型时有数。

考虑一维切向、$\mu r_N=1$（锥半径 1），施加一个缓慢增大的切向外力 $f$（从 0 增到 2），物体从静止开始。比较三种模型给出的"摩擦力 $r_T$ 随外力 $f$ 的响应曲线"：

外力 $f$	集值 Coulomb（真）	正则化 $r_T=-\tanh(u_T/v_s)$	黏性 $r_T=-cu_T$
$0.0$	$r_T=0$，$u_T=0$（静止）	$r_T\approx0$，$u_T\approx0$（近似静止）	$r_T=0$，$u_T=0$
$0.5$	$r_T=-0.5$，$u_T=0$（静摩擦顶住，不动）	$r_T\approx-0.5$，$u_T=$ 小但非零（微蠕变）	$r_T=-0.5$，$u_T=0.5/c$（一直在动）
$1.0$	$r_T=-1$，$u_T=0$（临界，仍不动）	$r_T\approx-1$，$u_T$ 稍大	$u_T=1/c$
$1.5$	$r_T=-1$，$u_T>0$（打滑，力饱和）	$r_T\to-1$，$u_T$ 增大	$u_T=1.5/c$（力无饱和）
$2.0$	$r_T=-1$，$u_T$ 更大（饱和）	$r_T\to-1$（渐近饱和）	$r_T=-2$（无上界，错！）

读这张表： - 集值 Coulomb（真）：$f\le1$ 时物体**完全静止**（$u_T=0$），摩擦力按需从 0 增到 1；$f>1$ 时打滑，力**饱和在 1**。这是物理正确的——有真静摩擦、有饱和。 - 正则化：$f\le1$ 时物体**微微蠕变**（$u_T$ 小但非零，因为只有动才有力）——这就是蠕变伪影。但它有饱和（$\tanh\to1$），且光滑可微好求解。$v_s$ 越小越接近真 Coulomb 但越刚性。 - 黏性（错误模型一）：物体**一直在动**（无静摩擦），且力**无上界**（$f=2$ 给 $r_T=-2>$ 锥半径 1，物理错误）。两个本质缺陷都暴露。

对比性思维（三种模型的取舍一目了然）：集值 Coulomb 物理最准但非光滑、需锥求解器；正则化光滑可微、好求解但有蠕变（静止区微动）；黏性最简单但既无静摩擦又无饱和（双重错误）。MuJoCo 默认走正则化（换可微）、Siconos 走集值（换精确）、没人用纯黏性（太错）——这又是 §0 仿真器之争的一个切面。选型口诀：要可微/RL → 正则化（接受蠕变）；要静态精确（如静止站立、精密装配）→ 集值/锥。

理论：MDP 的次微分形式（连接专题 70 非光滑分析）¶

把 MDP 的最优性条件 $(2.12)$+$(2.13)$ 用凸分析的语言重写，得到 Coulomb 律最紧凑的形式。回顾：$\mathbb{D}_{\mu r_N}$ 是半径 $\mu r_N$ 的圆盘，其**指示函数（indicator function）** $\psi_{\mathbb{D}}(\mathbf{s})=0$ 若 $\mathbf{s}\in\mathbb{D}$、$+\infty$ 否则。MDP 的最优性等价于 $$ \boxed{\,-\mathbf{u}T \in N \tag{2.14} $$ 即**负切向速度落在圆盘在力点处的法锥（normal cone）里**。这是 Coulomb 律的"法锥形式"，是专题 70（非光滑分析）和专题 3（Moreau 时步法）最常用的写法。}_{\mu r_N}}(\mathbf{r}_T),\,

逐项验证 $(2.14)$ 等价于粘滑律：法锥 $N_C(\mathbf{x})$ 的定义是"在 $\mathbf{x}$ 处指向集合外、与所有可行方向夹角 $\ge90°$ 的向量集合"。

若 $\mathbf{r}_T$ 在圆盘**内部**：法锥 $N_{\mathbb{D}}(\mathbf{r}_T) = \{\mathbf{0}\}$（内部点的法锥只有零向量）。则 $(2.14)$ 给 $-\mathbf{u}_T=\mathbf{0}$，即 $\mathbf{u}_T=\mathbf{0}$——粘滞。
若 $\mathbf{r}_T$ 在圆盘**边界**（$\|\mathbf{r}_T\|=\mu r_N$）：法锥是沿径向向外的射线 $N_{\mathbb{D}}(\mathbf{r}_T)=\{\alpha\mathbf{r}_T:\alpha\ge0\}$。则 $-\mathbf{u}_T=\alpha\mathbf{r}_T$，即 $\mathbf{u}_T$ 与 $\mathbf{r}_T$ 反平行——滑动，且方向正确。

理论-工程桥接：法锥形式 $(2.14)$ 不只是理论优雅。专题 3 的 Moreau 时步法把整个接触动力学写成一个"测度微分包含"$-\mathbf{u} \in N_{K}(\mathbf{r})$，离散后变成投影方程 $\mathbf{r}^{+} = \mathrm{proj}_{K}(\mathbf{r}^{+}-\rho\mathbf{u})$（$\rho>0$ 步长）——这个投影方程是 PGS（Projected Gauss-Seidel）求解器的核心循环，MuJoCo、Bullet、Drake 内部都在跑它的变体。理解 $(2.14)$ 就是理解所有现代接触求解器的数学心脏。 投影到圆盘只需一行：$\mathrm{proj}_{\mathbb{D}_{\mu r_N}}(\mathbf{v})=\mu r_N\,\mathbf{v}/\max(\|\mathbf{v}\|,\mu r_N)$，比投影到非负象限（专题 1）只复杂一点点。

理论：投影方程的等价性证明（变分刻画）¶

上面直接给了"法锥包含 ⟺ 投影方程"，这一步是前置自测第 3 题的核心，值得严格证一遍——它是所有接触求解器从"理论"走到"可迭代代码"的桥。

命题：对闭凸集 $C$、点 $\mathbf{x}\in C$、向量 $\mathbf{v}$、任意 $\rho>0$，以下三者等价： $$ \text{(i)} \mathbf{v}\in N_C(\mathbf{x})\quad\Longleftrightarrow\quad\text{(ii)} \mathbf{x}=\mathrm{proj}_C(\mathbf{x}+\rho\mathbf{v})\quad\Longleftrightarrow\quad\text{(iii)} \langle\mathbf{v},\mathbf{y}-\mathbf{x}\rangle\le0 \forall\mathbf{y}\in C. $$

证明 (i)⟺(iii)：法锥的定义就是 $N_C(\mathbf{x})=\{\mathbf{v}:\langle\mathbf{v},\mathbf{y}-\mathbf{x}\rangle\le0,\ \forall\mathbf{y}\in C\}$（指向集合外、与所有可行方向 $\mathbf{y}-\mathbf{x}$ 夹角 $\ge90°$）。(iii) 就是这个定义的逐字展开。∎

证明 (ii)⟺(iii)：投影 $\mathrm{proj}_C(\mathbf{z})$ 的变分刻画是"投影点 $\mathbf{p}$ 满足 $\langle\mathbf{z}-\mathbf{p},\mathbf{y}-\mathbf{p}\rangle\le0,\ \forall\mathbf{y}\in C$"（投影点与任意可行点的连线，和"残差 $\mathbf{z}-\mathbf{p}$"夹角 $\ge90°$，这是凸投影的基本不等式）。令 $\mathbf{z}=\mathbf{x}+\rho\mathbf{v}$、$\mathbf{p}=\mathbf{x}$，则残差 $\mathbf{z}-\mathbf{p}=\rho\mathbf{v}$，刻画变为 $\langle\rho\mathbf{v},\mathbf{y}-\mathbf{x}\rangle\le0$，即 $\langle\mathbf{v},\mathbf{y}-\mathbf{x}\rangle\le0$（$\rho>0$ 可除掉），正是 (iii)。∎

为什么这个等价是求解器的命门：(i) 是 Coulomb 律的理论形式（集值包含，没法直接算），(ii) 是一个**不动点方程**（$\mathbf{r}=\mathrm{proj}_K(\mathbf{r}-\rho\mathbf{u})$，可迭代！）。这个等价把"理论"翻译成"算法"——把 (i) 写成 (ii)，就能用不动点迭代 $\mathbf{r}^{k+1}=\mathrm{proj}_K(\mathbf{r}^k-\rho\mathbf{u}^k)$ 求解。$\rho$ 是步长（任意正数都等价，但影响收敛速度）。专题 1 的投影迭代、本章 §2.5 的 PGS、§4 的 Alart-Curnier，全是这个等价的应用。

本质洞察：从"集值法锥包含"到"单值投影方程"的等价，是非光滑优化里最重要的"语言转换"之一。它的深层意义是——凸约束的"互补/法锥"结构，永远可以等价改写成"投影到该凸集"的不动点方程。这就是为什么无论接触约束多复杂（非负象限、二阶锥、椭圆锥、带黏附的平移锥），只要它是凸的，就总能用"投影 + 不动点迭代"求解；唯一变的是"投影到哪个集合"的那行公式。理解了这个，你就掌握了接触求解器的通用模板。

⚠️ 常见陷阱¶

🧠 思维陷阱一：以为"最大耗散"意味着摩擦力总取最大值 $\mu r_N$ - 新手想法："最大耗散嘛，那摩擦力当然总是越大越好，取 $\mu r_N$。" - 实际上：MDP 是"在给定速度下"最大化耗散功率 $-\mathbf{s}^\top\mathbf{u}_T$。粘滞时 $\mathbf{u}_T=\mathbf{0}$，耗散功率恒为零、与 $\mathbf{s}$ 无关，所以摩擦力**不取最大值**，而是由力平衡决定的某个内部值。只有滑动时（$\mathbf{u}_T\ne\mathbf{0}$）最大化才迫使力到锥面。"最大耗散"最大化的是**功率**不是**力的模长**。 - 为什么重要：混淆这两者，会误以为静止物体也受 $\mu r_N$ 的摩擦力，从而算错静力平衡。 - 自检：水平桌面静止物块，$\mathbf{u}_T=\mathbf{0}$，耗散功率 $=0$，MDP 对力没有任何偏好——力由外力平衡决定（无外力则为零）。

🧠 思维陷阱二：把 MDP 的目标当成"最小化摩擦力"或"最小化能量" - 新手想法："摩擦让能量减少，所以摩擦力应该最小化系统总能量。" - 实际上：MDP 最大化的是**当前瞬时耗散功率**，不是最小化总能量，也不是最小化力。它是个"局部、瞬时"的变分原理，对应物理上的"最速下降"方向选择，而非全局能量最优。把它当全局能量最小化，会与 Gauss 原理（其实是 Gauss 在最小化加速度偏差，不是能量）混淆。 - 正确思维：记住 $(2.13)$ 的对偶结构——MDP 管力（max 耗散），Gauss 管速度（min 约束偏差），两者都是**瞬时**原理。 - 自检：能写出 $(2.10)$ 的目标函数 $-\mathbf{s}^\top\mathbf{u}_T$ 并说出每个符号含义，就不会混。

💡 概念误区：认为 MDP 唯一确定摩擦力 - 新手想法："MDP 是个优化问题，优化问题有唯一最优解，所以摩擦力唯一确定。" - 实际上：当目标函数"平"时（粘滞，$\mathbf{u}_T=\mathbf{0}$），最优解集是整个圆盘——不唯一。MDP 在滑动时给单值、在粘滞时给集值。优化问题的"最优解"完全可以是集合。这与 §2.1 的集值性是同一件事的两种说法。 - 为什么重要：在多接触耦合问题里，粘滞接触点的力由"全局力平衡"在多值集合里挑出来，不是 MDP 局部就能定的——这是为什么需要全局求解器。 - 自检：目标函数关于 $\mathbf{s}$ 的梯度是 $\mathbf{u}_T$；梯度为零（粘滞）⟺ 目标平 ⟺ 解不唯一。

练习¶

练习 2.2.1（推导题，⭐⭐） 三维 MDP。把 $(2.11)$ 推广到摩擦力为三维（$\mathbf{r}_T\in\mathbb{R}^3$，例如球面接触），写出 KKT 条件并推出对应粘滑律。验证维度不影响"滑动时反平行于速度、模长 $\mu r_N$；粘滞时取实心球"这一结论。说明为什么 MDP 的推导对切向维度数完全免疫。

练习 2.2.2（证明题，⭐⭐⭐） 法锥形式的等价性。严格证明 MDP 的 KKT 条件 $(2.12)$+互补松弛等价于法锥包含 $(2.14)$。提示：对凸集 $C$ 与点 $\mathbf{x}\in C$，$\mathbf{v}\in N_C(\mathbf{x})\Leftrightarrow \mathbf{x}=\arg\max_{\mathbf{y}\in C}\mathbf{v}^\top\mathbf{y}$（支撑函数的可达性）。把 $\mathbf{v}=-\mathbf{u}_T$、$C=\mathbb{D}_{\mu r_N}$ 代入。

练习 2.2.3（跨章综合题，⭐⭐⭐⭐，综合专题 1 + 第二批凸分析 + 本节） 投影迭代求解单接触摩擦。给定单个接触点，质量矩阵 $M=I_3$，自由速度 $\mathbf{u}^{\text{free}}=(-1, 0.5, 0.3)^\top$（法向、切向 x、切向 y），$\mu=0.5$，法向力已定 $r_N=1$。(a) 用专题 1 的投影迭代思想写出求 $\mathbf{r}_T$ 的不动点迭代 $\mathbf{r}_T^{k+1}=\mathrm{proj}_{\mathbb{D}_{0.5}}(\mathbf{r}_T^k - \rho\,\mathbf{u}_T^k)$，其中 $\mathbf{u}_T^k$ 由当前力更新。(b) 手算两步迭代（取 $\rho=0.5$）。(c) 说明这个迭代如何同时复用了专题 1 的"投影到锥"、本节的 MDP 法锥形式、和第二批凸分析的投影算子。这道题打通三章，是理解 PGS 求解器的最小可运行例子。

§2.3 de Saxcé 双势：救回非关联流动的变分结构 ⭐⭐⭐⭐¶

过渡与动机：MDP 看似完美，为什么还需要第三节？¶

§2.2 用 MDP 把摩擦律写成了优化问题，似乎一切都解决了。但 MDP 有一个被刻意藏起来的"裂缝"：它在推导 $(2.10)$ 时，把法向力 $r_N$ 当成了已知常数。可在真实接触里，法向力和切向力是同一个力的两个分量，由同一个动力学方程同时决定——你不能先定法向、再定切向。一旦把法向力 $r_N$ 也当成变量，MDP 的"圆盘"半径 $\mu r_N$ 就随 $r_N$ 变化，可行域从"固定圆盘"变成"整个二阶锥 $K_\mu$"，而摩擦的流动法则就**不再满足标准凸对偶的"关联性"假设**。这个微妙的失配，就是本节要解决的"非关联流动（non-associated flow）"问题，de Saxcé 的"双势（bipotential）"是目前唯一干净的修补方案。

这一节标了 ⭐⭐⭐⭐（研究级）。如果你的目标只是用现成的 MPC/WBC 锥约束，可以速读结论、跳过推导细节，直接看本节末的"工程桥接"——但如果你要读 Pinocchio 3 / Siconos 源码，或想真正理解"为什么仿真器里有那个怪异修正项"，这一节是必经之路。

反面：标准凸对偶在哪里"破裂"——关联 vs 非关联¶

先把"关联流动"讲清楚，才能看懂 Coulomb 为什么"非关联"。在塑性力学和凸分析里，一个本构律若满足**关联流动法则（associated flow rule），意味着：流动方向（这里是滑动速度方向）是屈服面（这里是摩擦锥面）的**外法向。数学上，关联律 $\Leftrightarrow$ 速度 $-\mathbf{u} \in N_{K}(\mathbf{r})$，即**整个三维速度（含法向）落在摩擦锥 $K_\mu$ 在力点处的法锥里**。

现在算一下 Coulomb 律是否满足这个。摩擦锥面 $\|\mathbf{r}_T\|=\mu r_N$ 在力点 $\mathbf{r}=(r_N,\mathbf{r}_T)$ 处的外法向，要对约束函数 $\phi(\mathbf{r})=\|\mathbf{r}_T\|-\mu r_N$ 求梯度： $$ \nabla\phi = \Bigl(-\mu, \frac{\mathbf{r}_T}{|\mathbf{r}_T|}\Bigr) \in \mathbb{R}^3 \quad(\text{法向分量}=-\mu, \text{切向分量}=\hat{\mathbf{r}}_T). \tag{2.15} $$ 关联流动会要求 速度方向正比于这个法向，即法向速度 $u_N \propto -(-\mu)=\mu\|\mathbf{u}_T\|>0$——也就是说，滑动时物体应当**法向膨胀（normal dilation）**，以正比于 $\mu$ 的速率离开接触面！

但物理上 Coulomb 滑动是**等容（isochoric）的——物体贴着地面滑，法向速度 $u_N = 0$，不会自己飘起来。**这就是裂缝：Coulomb 律要求 $u_N=0$，而关联流动要求 $u_N=\mu\|\mathbf{u}_T\|>0$，两者矛盾。所以

\[ \boxed{\text{Coulomb 摩擦是非关联的：滑动速度方向} \ne \text{摩擦锥面的外法向。}} \tag{2.16} \]

本质洞察：Coulomb 律的"非关联性"不是某种数学瑕疵，而是**物理真实性**的体现——真实摩擦不让物体无故弹起。代价是：非关联律**不能写成单个凸势函数的次微分**（关联律才能）。这就摧毁了 §2.2 末尾那个干净的 MDP-Gauss 对偶——它在切向是对的，但一旦把法向力作为变量纳入，整体就失去了"单一势函数"的变分结构。von Mises 塑性是关联的（所以好处理），Drucker–Prager 塑性和 Coulomb 摩擦是非关联的（所以麻烦）——这是同一个数学困难在两个领域的两副面孔。

反面的代价：失去变分结构意味着什么¶

"失去单一凸势的变分结构"听起来抽象，工程后果却很具体：

不能直接套标准 SOCP 对偶：原始问题（对力）与对偶问题（对速度）之间出现**对偶间隙（duality gap）**或干脆对偶问题不良定义。许多现成凸优化求解器的对偶证书（dual certificate）失效。
PGS 等投影迭代的收敛性失去保证：关联律下投影迭代是某个凸函数的坐标下降，必收敛；非关联律下它变成求解一个**变分不等式（VI）**而非优化问题，收敛性需要额外的单调性条件，否则可能振荡。
算子可能非对称：这正是 §0 "坏性质二（非对称）"的数学根源——非关联流动让线性化后的系统矩阵不对称。

历史：de Saxcé 与双势方法（1991–1998）¶

法国力学家 Géry de Saxcé 在 1991–1998 年提出了**双势（bipotential）方法，专门处理 Coulomb 这类非关联律。核心洞察是：虽然 Coulomb 律不能写成**单个**势函数的次微分，但可以写成一个**双变量函数 $b(\mathbf{r}, -\mathbf{u})$（同时依赖力和速度）的"广义次微分"。这个 $b$ 满足一个推广的 Fenchel–Young 不等式 $$ b(\mathbf{r}, -\mathbf{u}) \ge -\mathbf{r}^\top\mathbf{u},\qquad \text{等号成立} \Leftrightarrow (\mathbf{r}, -\mathbf{u}) \text{是物理可行对}, \tag{2.17} $$ "双"就来自它同时是关于 $\mathbf{r}$ 和关于 $-\mathbf{u}$ 的"势"。de Saxcé 证明：用 $b$ 可以把 Coulomb 律写成一个**对称的、有变分结构**的包含关系，从而救回数值算法所需的全部好性质。这套理论是 Inria 的 Siconos 库、以及 Acary–Brogliato 专著《Numerical Methods for Nonsmooth Dynamical Systems》(2008) 的理论基础之一。

理论：de Saxcé 修正——虚拟法向速度 $\mu\|\mathbf{u}_T\|\mathbf{e}_N$¶

de Saxcé 方法最实用、也最常在源码里见到的产物，是一个**速度修正项**。回顾裂缝 $(2.16)$：问题出在"真实法向速度 $u_N=0$，但变分结构需要它等于 $\mu\|\mathbf{u}_T\|$"。de Saxcé 的修补是——人为地给速度加上一个虚拟法向分量，把真实速度 $\mathbf{u}=(u_N,\mathbf{u}_T)$ 换成"修正速度" $$ \boxed{ \hat{\mathbf{u}} = \bigl(u_N + \mu|\mathbf{u}_T|, \mathbf{u}_T\bigr) = \mathbf{u} + \mu|\mathbf{u}_T|\,\mathbf{e}_N. } \tag{2.18} $$ 其中 $\mathbf{e}_N=(1,0,0)$ 是法向单位向量。关键定理（de Saxcé–Feng 1991）：

定理（de Saxcé 关联化）：Coulomb 律 $(\mathbf{r}, \mathbf{u})$ 满足完整粘滑律 $(2.3)$ 当且仅当 修正对 $(\mathbf{r}, \hat{\mathbf{u}})$ 满足**关联**流动法则 $-\hat{\mathbf{u}} \in N_{K_\mu}(\mathbf{r})$，即修正后的负速度落在摩擦锥的法锥里。

换句话说，加上虚拟法向速度 $\mu\|\mathbf{u}_T\|\mathbf{e}_N$ 之后，非关联的 Coulomb 律就变成了关联律，于是标准凸对偶、变分结构、求解器收敛性全部回来了。直觉上，这一项恰好"抵消"了 $(2.15)$ 中法向梯度 $-\mu$ 造成的失配——你强行让速度"假装"有那个法向膨胀分量，几何上就对齐了锥面法向。

验证（粘滞与滑动两情形）： - 滑动时，真实 $u_N=0$，修正后 $\hat u_N = \mu\|\mathbf{u}_T\|$。要求 $-\hat{\mathbf{u}}\parallel\nabla\phi=(-\mu,\hat{\mathbf{r}}_T)$：法向 $-\hat u_N = -\mu\|\mathbf{u}_T\|$ 对应 $\alpha(-\mu)$ 取 $\alpha=\|\mathbf{u}_T\|$；切向 $-\mathbf{u}_T$ 对应 $\alpha\hat{\mathbf{r}}_T=\|\mathbf{u}_T\|\hat{\mathbf{r}}_T$，即 $\mathbf{u}_T = -\|\mathbf{u}_T\|\hat{\mathbf{r}}_T$，正是反平行。一致！ - 粘滞时，$\mathbf{u}_T=\mathbf{0}\Rightarrow$ 修正项为零 $\Rightarrow\hat{\mathbf{u}}=\mathbf{u}$，且 $u_N=0$（接触保持），$-\hat{\mathbf{u}}=\mathbf{0}\in N_{K_\mu}(\mathbf{r})$ 对锥内任意 $\mathbf{r}$ 成立。一致！

多视角理解（修正项的两种读法）： - 代数读法：$\mu\|\mathbf{u}_T\|\mathbf{e}_N$ 是让非关联律"形式上关联化"的拉格朗日技术项，目的是恢复对称变分结构。 - 几何读法：它把速度向量"扳正"到摩擦锥面的外法向方向上。Coulomb 滑动速度本来贴着切平面（不沿锥面法向），加上这一项后，"修正速度"恰好指向锥面法向——于是力(在锥面)和修正速度(沿法向)满足正交互补，几何上对偶配对。边界：这个修正**只在变分/数值层面有意义，不是真实的物理速度**。物体并没有真的法向膨胀——$\hat u_N$ 是个"计算用的幽灵分量"。若误把 $\hat u_N$ 当真实分离速度输出给上层（如碰撞检测），会得到物体"虚假抬起"的错误。这正是下面陷阱要讲的。

理论：de Saxcé 双势的显式形式¶

把上述关联化写成显式双势函数。对 Coulomb 接触，de Saxcé 双势为 $$ b(\mathbf{r}, -\mathbf{u}) = \mu r_N\,|\mathbf{u}T| + \psi), \tag{2.19} $$ 其中 }(\mathbf{r}) + \psi_{K_\mu^*}(-\hat{\mathbf{u}$\psi_{K_\mu}$、$\psi_{K_\mu^*}$ 分别是摩擦锥与其对偶锥（$(2.7)$）的指示函数。第一项 $\mu r_N\|\mathbf{u}_T\|$ 正是耗散功率的"摩擦贡献"，后两项强制力在锥内、修正速度在对偶锥内。满足 $(2.17)$ 等号的 $(\mathbf{r},-\mathbf{u})$ 对，恰好是 Coulomb 物理解。这个 $b$ 的存在性就是"Coulomb 律有（广义）变分结构"的严格表述。

理论-工程桥接：现在回到 §0 场景二的伏笔——你在 Pinocchio 3.0 的 admm-solver.hpp 或 Siconos 摩擦求解器里看到 tangent_velocity + mu*||v_t||*n 这样的代码，它**就是** $(2.18)$ 的 de Saxcé 修正。求解器在每次迭代里先把真实切向速度加上这个虚拟法向项，再投影到对偶锥——这样投影迭代才在非关联律下收敛。删掉这一项，求解器会因为失去变分结构而不收敛或收敛到错误解。 它不是 bug，不是 hack，而是"让 Coulomb 律可被凸方法求解"的唯一已知干净构造。理解了这一点，你读这类源码时就不会再想"修正"它。

数值演示：亲眼看一次非关联失配与 de Saxcé 修复¶

抽象的"非关联"听过就忘，跑一组具体数字才记得住。取 $\mu=1$（自对偶，几何最干净）、滑动状态 $\mathbf{u}_T=(1,0)$、$u_N=0$、$r_N=1$。

第一步：真实速度与摩擦力。 滑动律 $(2.3)$ 给 $\mathbf{r}_T=-\mu r_N\hat{\mathbf{u}}_T=(-1,0)$，故 $\mathbf{r}=(r_N,\mathbf{r}_T)=(1,-1,0)$。真实速度 $\mathbf{u}=(u_N,\mathbf{u}_T)=(0,1,0)$。

第二步：算摩擦锥面在 $\mathbf{r}$ 处的外法向（$(2.15)$）。 $\nabla\phi=(-\mu,\hat{\mathbf{r}}_T)=(-1,\ -1,0)$（$\mu=1$，$\hat{\mathbf{r}}_T=(-1,0)$）。

第三步：检验真实速度是否关联（沿外法向）。 关联要求 $-\mathbf{u}\parallel\nabla\phi$。$-\mathbf{u}=(0,-1,0)$，$\nabla\phi=(-1,-1,0)$。这两个向量**不平行**（$-\mathbf{u}$ 法向分量是 $0$，$\nabla\phi$ 法向分量是 $-1$）——非关联确认！ 几何上：真实负速度 $(0,-1,0)$ 完全在切平面内（贴地滑），而锥面外法向 $(-1,-1,0)$ 有一个朝向锥外的法向分量。两者差了一个法向分量，这就是裂缝。

第四步：de Saxcé 修正。 $\hat{\mathbf{u}}=\mathbf{u}+\mu\|\mathbf{u}_T\|\mathbf{e}_N=(0,1,0)+1\cdot1\cdot(1,0,0)=(1,1,0)$。则 $-\hat{\mathbf{u}}=(-1,-1,0)$。

第五步：检验修正后是否关联。 $-\hat{\mathbf{u}}=(-1,-1,0)$ 与 $\nabla\phi=(-1,-1,0)$ —— 完全相等，平行！关联化成功！ 加上虚拟法向速度 $\mu\|\mathbf{u}_T\|=1$ 后，负速度恰好"扳正"到锥面外法向方向。

这组数字把 §2.3 的全部抽象落地了：真实速度 $(0,-1,0)$ 不沿法向（非关联）→ 加 $(1,0,0)$ 虚拟法向项 → 修正速度的负向 $(-1,-1,0)$ 正好沿锥面法向（关联）。那个被加进去的 $1$，就是源码里 mu*||v_t||*n 算出来的数。 你现在不仅知道它是什么，还能手算它的值、验证它确实修复了关联性。

阶段小结：到这里我们用 $\mu=1$ 的具体数字完整走了一遍"发现非关联 → de Saxcé 修正 → 验证关联化"。接下来给出双势的显式形式，把这个修复升级成一个完整的变分结构。

⚠️ 常见陷阱¶

🧠 思维陷阱一：把 de Saxcé 修正的虚拟法向速度当成真实分离速度 - 新手想法："$\hat u_N = \mu\|\mathbf{u}_T\|>0$，说明滑动时物体在离开地面，得把这个分离速度报告给碰撞检测。" - 实际上：$\hat u_N$ 是**纯计算构造**，物体物理上仍贴着地面（真实 $u_N=0$）。把 $\hat u_N$ 当真实分离速度，会让物体在快速滑动时"虚假抬起"，与 Anitescu 凸松弛的 forces-from-a-distance（§2.5）叠加，造成更严重的隔空伪影。 - 为什么重要：求解器内部用 $\hat{\mathbf{u}}$，但对外输出的运动学必须用真实 $\mathbf{u}$。混淆这两个速度是接触求解器最隐蔽的 bug 之一。 - 自检：滑动停止前后，真实 $u_N$ 始终为 0（接触维持），$\hat u_N$ 随 $\|\mathbf{u}_T\|$ 变化——这两个量不该相等。

💡 概念误区二：以为"非关联"是 Coulomb 律的缺陷，关联律才"正确" - 新手想法："关联流动数学上漂亮，Coulomb 不关联是它的毛病，应该用关联近似。" - 实际上：恰恰相反——关联流动在摩擦里是物理错误的（它预言滑动时物体法向膨胀飞起）。Coulomb 的非关联性是**物理正确**的代价。有些教材/软件确实用"关联摩擦近似"（associated friction）换取凸性和易解性（如某些 MPM/有限元接触），但那是**牺牲物理换数值方便**，会高估法向反力、产生虚假膨胀。 - 为什么重要：选模型时要清楚"关联近似"省了算力但引入了系统性物理偏差，不能盲目用。 - 自检：关联摩擦预言滑动→法向膨胀（$u_N>0$）；问自己"现实里滑冰的人会自己浮起来吗？"答案显然否，所以真实摩擦非关联。

🧠 思维陷阱三：以为 de Saxcé 双势让问题变回"凸优化" - 新手想法："有了双势和变分结构，摩擦就是个凸优化问题了。" - 实际上：双势恢复的是**变分不等式（VI）/广义方程**的对称结构，使数值算法可收敛，但完整的"接触+Coulomb 摩擦"问题**整体仍非凸**（§0 坏性质三、§2.5 会讲为什么需要"松弛"才凸）。双势让单接触摩擦律可处理，但不消除多接触耦合的非凸性。de Saxcé 救的是"变分结构"，Anitescu 救的是"凸性"——两者解决不同层面的病态。 - 正确思维：分清三个层次——单接触摩擦律的集值性（MDP/§2.2 解决）、非关联性（de Saxcé/本节解决）、多接触整体非凸性（凸松弛/§2.5 解决）。 - 自检：能说出"双势恢复变分结构 $\ne$ 问题变凸"的区别，就过关。

练习¶

练习 2.3.1（推导题，⭐⭐⭐） 验证关联化定理。对滑动状态，取具体数值 $\mu=0.5$、$\mathbf{u}_T=(0.6,0.8)$（故 $\|\mathbf{u}_T\|=1$）、$u_N=0$、$\mathbf{r}_T=-\mu r_N\hat{\mathbf{u}}_T$、$r_N=2$。(a) 写出真实速度 $\mathbf{u}$ 和修正速度 $\hat{\mathbf{u}}$。(b) 计算摩擦锥面在 $\mathbf{r}$ 处的外法向 $\nabla\phi$。(c) 验证 $-\hat{\mathbf{u}}$ 确实平行于 $\nabla\phi$（即满足关联流动），而 $-\mathbf{u}$ 不平行（非关联）。

练习 2.3.2（开放思考题，⭐⭐⭐⭐） 修正项的唯一性。de Saxcé 用 $\mu\|\mathbf{u}_T\|\mathbf{e}_N$ 关联化 Coulomb 律。(a) 这个修正项是唯一的吗？能否用其他形式（如 $\mu^2\|\mathbf{u}_T\|\mathbf{e}_N$）也实现关联化？给出论证或反例。(b) 对各向异性摩擦（练习 2.1.2），修正项该如何推广？(c) 思考：为什么修正项恰好是 $\mu\|\mathbf{u}_T\|$ 而不是别的——它与摩擦锥半顶角 $\arctan\mu$ 有什么几何关系？

练习 2.3.3（证明题，⭐⭐⭐⭐） 双势的 Fenchel–Young 不等式。证明 $(2.19)$ 定义的双势 $b$ 满足广义 Fenchel–Young 不等式 $(2.17)$：$b(\mathbf{r},-\mathbf{u})\ge -\mathbf{r}^\top\mathbf{u}$，且等号成立当且仅当 $(\mathbf{r},-\mathbf{u})$ 是 Coulomb 物理可行对。提示：分别在锥内/锥外、粘滞/滑动情形验证，用到 $\mathbf{r}^\top\hat{\mathbf{u}} = r_N\hat u_N + \mathbf{r}_T^\top\mathbf{u}_T$ 的展开。

§2.4 多面体近似 vs 二阶锥：几何近似的两条工程路线 ⭐⭐⭐¶

过渡与动机：圆锥很美，但 LCP 求解器只吃多面体¶

§2.1–§2.3 把摩擦锥的几何与变分讲透了。但有一个工程现实横亘在前：摩擦锥 $K_\mu$ 是个**圆**锥（约束 $\|\mathbf{r}_T\|\le\mu r_N$ 带二次范数），而历史上最成熟、最稳定的接触求解器——基于**线性互补问题（LCP）** 的 Lemke 算法、PATH 求解器——只能处理**线性**约束。圆锥的二次约束 $\|\mathbf{r}_T\|\le\mu r_N$ 不是线性的，没法直接喂给 LCP。

于是 Stewart–Trinkle（1996）、Anitescu–Potra（1997）提出了那个影响了之后二十年接触仿真的工程妥协：用一个多面体（polyhedron）去近似圆锥——把圆锥侧面用 $k$ 个平面"切"成一个 $k$ 棱的金字塔（pyramid），金字塔的每个面都是线性约束，于是整个问题落回 LCP。本节就讲这条"多面体路线"和它的对手"SOCP 路线"，以及两者的精度-速度权衡——这是 §2.4 标题"两条工程路线"的含义，也是 §0 场景一（对角线步态打滑）的理论根源。

反面：直接用圆锥约束会遇到什么困难¶

如果不做多面体近似、坚持用真圆锥，会面对什么？(1) 失去 LCP 的成熟算法生态——Lemke、PATH 等几十年打磨的 pivoting 求解器全部用不了，得换 SOCP 求解器（ECOS、Mosek）或专门的锥互补迭代（CCP/PGS），生态薄、调试难。(2) 二次约束让问题成为 SOCP/NCP，理论上更难分析有限终止性。(3) 早期（1990s）SOCP 求解器还不成熟、不够快，实时仿真承受不起。这些是当年选择多面体的历史理由。今天 SOCP 求解器已很成熟（Clarabel、ECOS、Mosek），加上专门的锥投影方法，"坚持圆锥"重新变得可行——这是为什么 Siconos/Pinocchio 3 走了 SOCP 路线（§0 表格）。

历史：Stewart–Trinkle 与多面体摩擦锥的黄金二十年¶

1996 年 David Stewart 与 Jeff Trinkle 在 International Journal for Numerical Methods in Engineering 发表了奠基性论文，把"刚体动力学+Coulomb 摩擦+单边接触"完整写成一个**线性互补问题**——前提是把摩擦锥用多面体近似。同年 Anitescu–Potra 给出了类似的时步法 LCP 表述并证明了解的存在性。这套"多面体 LCP"成为之后二十年接触仿真的事实标准：ODE（Open Dynamics Engine）、早期 Bullet、PhysX 全用它的变体。它的好处是**可解性有理论保证**（LCP 在适当矩阵类下有限步终止）、生态成熟；代价就是本节要量化的**多面体近似误差**和**各向异性伪影**。

理论一：内切多面体与外切多面体¶

把圆锥的截面（半径 $\mu r_N$ 的圆）用正 $k$ 边形近似，有两种做法，方向相反：

内切多面体（inner / inscribed polyhedron）：$k$ 边形的**顶点**落在圆上，整个多边形在圆**内部**。它是圆锥的**欠近似（under-approximation）**——可用的摩擦力比真实的少。这是工程上最常用的（保守、安全：不会高估摩擦从而避免"以为抓得住其实打滑"）。摩擦力被表示为 $k$ 条"母线方向"$\mathbf{d}_i$ 的非负组合： $$ \mathbf{r}T = \sum\Bigr), \tag{2.20} $$ 即每条母线对应法向力为 1、切向偏移 }^{k}\beta_i\,\mathbf{d}_i,\qquad \beta_i\ge0,\qquad \mathbf{d}_i = \mu\Bigl(\cos\tfrac{2\pi i}{k}, \sin\tfrac{2\pi i}{k$\mu$ 沿第 $i$ 个方向的"棱"。这个"非负组合"形式正是它能塞进 LCP 的关键——$\beta_i\ge0$ 是线性互补天然支持的非负象限约束（专题 1 的一阶锥）。

外切多面体（outer / circumscribed polyhedron）：$k$ 边形的**边**与圆相切，多边形在圆**外部**。它是**过近似（over-approximation）**——可用摩擦力比真实的多。用半空间（每条边一个线性不等式）表示： $$ \mathbf{r}_T\in P_k^{\text{out}}=\bigl{\mathbf{r}_T: \mathbf{a}_i^\top\mathbf{r}_T\le\mu r_N, i=1,\dots,k\bigr},\qquad \mathbf{a}_i=\bigl(\cos\tfrac{2\pi i}{k},\sin\tfrac{2\pi i}{k}\bigr). \tag{2.21} $$ 外切近似常用于"保证可行性"的场景（如保守的可达性分析），但在控制里少用——它会高估摩擦，导致"以为能用 1.1 倍摩擦其实只有 1 倍"的乐观偏差，可能造成实际打滑。

多视角理解（顶点表示 V-rep vs 半空间表示 H-rep）：内切多面体用"母线非负组合"$(2.20)$（顶点/生成元表示，V-representation），外切多面体用"半空间交"$(2.21)$（不等式表示，H-representation）。这是凸多面体的两种对偶表示。边界：V-rep 适合"力是哪些基方向的组合"（LCP 变量直接是 $\beta_i$），H-rep 适合"力满足哪些不等式"（QP/MPC 约束直接是 $k$ 个不等式行）。足式 Convex MPC 用的是 H-rep——"每脚 4 不等式"就是 $k=4$ 的 $(2.21)$。

理论二：内切误差 $\mu\cos(\pi/k)$ 的推导（核心）¶

现在推导 §2.4 标题与本章目标里的核心公式——内切 $k$ 棱金字塔的近似误差 $\mu\cos(\pi/k)$。这是本节最重要的定量结果，务必跟着推一遍。

考虑圆锥截面（半径 $R=\mu r_N$ 的圆）的内切正 $k$ 边形。圆周被 $k$ 个顶点均分，相邻两顶点的夹角为 $2\pi/k$。沿不同切向方向 $\theta$，内切多边形能提供的最大切向力 $\rho(\theta)$ 不再是常数 $R$（圆是 $R$），而是随 $\theta$ 振荡：

沿顶点方向（$\theta$ 正对某个顶点）：$\rho = R = \mu r_N$（顶点在圆上，取到满值）。这是**最好**方向。
沿边中点方向（$\theta$ 正对某条边的中点，离两端顶点最远）：边中点到圆心的距离是多边形的**内切半径（apothem）**。正 $k$ 边形顶点在半径 $R$ 圆上时，边中点距圆心 $$ \rho_{\min} = R\cos\frac{\pi}{k} = \mu r_N\cos\frac{\pi}{k}. \tag{2.22} $$ 推导 $(2.22)$：相邻顶点夹角 $2\pi/k$，边中点对应的半角是 $\pi/k$。从圆心向边中点作垂线，与到顶点的半径 $R$ 夹角为 $\pi/k$，垂线长（apothem）$=R\cos(\pi/k)$。这是**最差**方向。

所以内切多面体沿不同方向能用的摩擦力在 $[\mu r_N\cos(\pi/k),\ \mu r_N]$ 之间振荡。最差方向的有效摩擦系数被低估为 $\mu\cos(\pi/k)$，相对误差为 $$ \boxed{ \text{最大相对低估} = 1-\cos\frac{\pi}{k}. } \tag{2.23} $$

代入具体 $k$ 值看这个误差有多大（这张表要记住）：

棱数 $k$	最差方向有效 $\mu$	$\cos(\pi/k)$	相对低估 $1-\cos(\pi/k)$	工程评价
3	$0.500\,\mu$	0.500	$50.0\%$	太粗，几乎不用
4（金字塔）	$0.707\,\mu$	$0.707$	$29.3\%$	足式 MPC 常用，对角方向严重低估
6	$0.866\,\mu$	0.866	$13.4\%$	折中
8	$0.924\,\mu$	0.924	$7.6\%$	较好，Bullet 高精度档
16	$0.981\,\mu$	0.981	$1.9\%$	接近圆锥
32	$0.995\,\mu$	0.995	$0.5\%$	基本等于圆锥

本质洞察：多面体近似的误差**不是均匀的，而是方向相关（各向异性）的**——沿顶点方向零误差，沿边中点方向误差最大 $1-\cos(\pi/k)$。这意味着用多面体近似，你给一个本该各向同性的物理现象人为刻上了一个 $k$ 重对称的"棱角"。机器人沿"好方向"（对准顶点）运动时一切正常，沿"坏方向"（对准边中点）运动时摩擦被系统性低估——这正是 §0 场景一里"直行侧移正常、$45°$ 斜线打滑"的根本原因。

逐角度看 $k=6$ 内切六边形的有效摩擦（取 $\mu=0.6$、$r_N=1$，真圆锥处处给 $0.6$）。六边形顶点在 $0°,60°,120°,\dots$，边中点在 $30°,90°,\dots$。沿任意方向 $\theta$，有效摩擦力 $\rho(\theta)=\mu r_N\cdot\dfrac{\cos(\pi/k)}{\cos(\theta_{\text{rem}})}$ 的最小/最大在边中点/顶点取到（$\theta_{\text{rem}}$ 是 $\theta$ 到最近顶点的角差）：

方向 $\theta$	到最近顶点角差	有效摩擦 $\rho$	相对真圆锥
$0°$（顶点）	$0°$	$0.600$	$100\%$（满值）
$15°$	$15°$	$0.582$	$97\%$
$30°$（边中点）	$30°$	$0.520$	$87\%$（最差）
$45°$	$15°$	$0.582$	$97\%$
$60°$（顶点）	$0°$	$0.600$	$100\%$

注意有效摩擦以 $60°$ 为周期振荡（$k=6$ 的 6 重对称），在 $[0.520, 0.600]$ 间起伏，最差方向（边中点 $30°$）低估到 $87\%$，正是 $\cos(30°)=\cos(\pi/6)=0.866$ 倍。这张振荡表就是"各向异性伪影"的肉眼可见形式——一个本该是水平直线（圆锥处处 $0.6$）的曲线，被多面体掰成了带 6 个波峰波谷的波浪线。$k$ 越大波浪越平，但永远不会变回直线（除非 $k\to\infty$）。

理论二补：外切多面体的误差与"内外夹逼"¶

内切误差讲完了，外切误差也要会算——因为有些场景（保证可行性的可达性分析、保守的安全包络）反而要用外切。外切正 $k$ 边形的**边**与半径 $R=\mu r_N$ 的圆相切，所以边到圆心距离恰为 $R$（apothem $=R$），而**顶点**到圆心距离更大： $$ \rho_{\max}^{\text{out}} = \frac{R}{\cos(\pi/k)} = \frac{\mu r_N}{\cos(\pi/k)}. \tag{2.23a} $$ 推导：外切多边形顶点在两条切边的交点，顶点到圆心的连线与 apothem（$=R$）夹角 $\pi/k$，故顶点距离 $=R/\cos(\pi/k)$。所以外切多面体沿顶点方向的有效摩擦系数被**高估**为 $\mu/\cos(\pi/k)$，最大相对高估 $\frac{1}{\cos(\pi/k)}-1$。$k=4$ 时高估 $\sqrt2-1\approx41.4\%$（比内切的低估 $29.3\%$ 还大）。

内外夹逼：把内切与外切放一起，真实圆锥被夹在中间： $$ \underbrace{\mu r_N\cos\tfrac{\pi}{k}}{\text{内切最差(欠)}} \;\le\; \underbrace{\mu r_N}. \tag{2.23b} $$ 这个夹逼关系有个漂亮的工程用途：}} \;\le\; \underbrace{\frac{\mu r_N}{\cos(\pi/k)}}_{\text{外切最好(过)}用内切和外切各解一次，两个解就给出了真实接触力的上下界——若两者足够接近（$k$ 够大），你就知道真解被夹得很紧，不必再加 $k$。这是"严格上下界包夹"的可靠性分析思路（专题 4 可微接触里也会用类似的夹逼来界定梯度误差）。

对比性思维（内切 vs 外切，不是哪个对，而是各自保守在哪个方向）：内切**低估**摩擦——它认为"能用的摩擦比真实少"，用在控制里偏保守（不会高估抓地力，安全）。外切**高估**摩擦——它认为"能用的摩擦比真实多"，用在"保证不超出某集合"的可达性分析里才对（因为它包含真锥）。用反方向会得到相反的安全性结论：控制里用外切 → 乐观 → 可能实际打滑；可达性里用内切 → 漏掉边界 → 可能误判不可达为可达。记住口诀：控制用内切（宁可保守），包络用外切（宁可放大）。

理论三：$k=4$ 金字塔的 $\sqrt2$ 各向异性伪影¶

$k=4$（四棱金字塔）是足式 Convex MPC 里最常用的近似（"每脚 4 不等式"），因为它最省约束、最快。但它的各向异性最严重，值得单独剖析——这就是 §2.4 目标里"量化 $\sqrt2$ 各向异性伪影"。

$k=4$ 时，四条母线沿 $\pm x,\pm y$ 轴（$\theta=0,90°,180°,270°$）。内切正方形：

沿坐标轴方向（顶点方向，$\theta=0$）：有效 $\mu = \mu$（满值）。
沿对角线方向（边中点方向，$\theta=45°$）：$\cos(\pi/4)=1/\sqrt2\approx0.707$，有效 $\mu=\mu/\sqrt2$。

所以 $k=4$ 金字塔在**对角方向把可用摩擦力低估了 $1/\sqrt2\approx0.71$ 倍**（等价地，沿轴方向比对角方向"多 $\sqrt2$ 倍"摩擦）。如果你用 $\mu=0.6$ 的真实地面、$k=4$ 近似，机器人沿对角走时实际只能用到 $0.6/\sqrt2\approx0.42$ 的有效摩擦——少了近 $30\%$。这足以让一个本来稳定的对角步态打滑。

对比性思维（不是参数没调好，而是几何近似有系统偏差）：当足式 MPC 在斜线方向打滑、查遍增益都找不到原因时，根因不在控制器参数，而在 $k=4$ 金字塔的几何低估。这是一个"模型层面的系统性偏差"被误诊为"参数层面的随机问题"的典型。修法有三：(1) 提高 $k$（如 $k=8$，误差降到 $7.6\%$，但约束翻倍、QP 变慢）；(2) 旋转金字塔让"好方向"对准主要运动方向（治标）；(3) 用 $\mu_{\text{ctrl}}=\mu/\sqrt2$ 的保守值消除最差方向的低估（牺牲轴向裕度换全向安全，工程常用）；(4) 改用真 SOCP 锥约束（根治，代价是求解器换型）。

理论-工程桥接：MIT Cheetah 的 Convex MPC（Di Carlo et al. 2018）就用 $k=4$ 金字塔（每脚力满足 4 个不等式 $|r_{T,x}|\le\mu r_N$、$|r_{T,y}|\le\mu r_N$），换取 QP 能在 1kHz 实时求解。他们知道有 $\sqrt2$ 低估，所以 $\mu$ 取得保守。这就是工程权衡的活教材：宁可低估摩擦（保守、不打滑）也要保住实时性。读他们的代码看到 mu 被设得比真实地面小，别以为是写错——那是在补偿 $k=4$ 的各向异性。

理论四：LCP 路线 vs SOCP 路线的系统选型¶

把两条路线并排，给出有依据的选型框架（§2.4 目标的最后一项）：

维度	多面体 LCP 路线	真二阶锥 SOCP 路线
约束类型	线性（$k$ 个不等式/母线）	二次锥约束 $\\|\mathbf{r}_T\\|\le\mu r_N$
求解器	Lemke / PATH / PGS	ECOS / Mosek / Clarabel / 锥 PGS
精度	各向异性，误差 $1-\cos(\pi/k)$	精确，各向同性
问题规模	$k$ 倍变量膨胀（$k=8$ 时 LCP 约大 $10\times$）	锥维度不膨胀
可解性理论	LCP 有限步终止（适当矩阵类）	SOCP 多项式时间，但锥互补需迭代
典型使用者	足式 Convex MPC、ODE、早期 Bullet	Siconos、Pinocchio 3、研究基准
何时选它	需实时、需 LCP 生态、$k$ 适中可接受误差	需精确各向同性、求解器已就绪、能容忍迭代

系统性分类（按"你能容忍什么"选）：选型不是"哪个更好"，而是"你的任务能容忍什么代价"—— - 容忍各向异性、要实时 → 多面体 LCP，$k=4$（控制）或 $k=8$（仿真）。 - 要精确各向同性、能接受迭代 → SOCP。 - 要可微（梯度） → §2.5 凸松弛 CCP（多面体和 SOCP 都可松弛化）。没有占优解——这是 §0 "仿真器之争"在算法层面的再现。

算例：足式 MPC 里"每脚 4 不等式"的完整写出¶

把 §2.4 理论落到足式 MPC 最常见的形式——这是 §0 场景一、§7 对应表反复提到的"每脚 4 不等式"，现在完整写出来，让你以后读 MIT Cheetah / 各种四足 MPC 代码时一眼认出。

设接触法向沿世界系 $z$ 轴，切向是 $x,y$。一只脚的地面反力 $\mathbf{r}=(r_x,r_y,r_z)$，$r_z\ge0$（法向只推不拉），$\mu$ 是地面摩擦系数。用内切 $k=4$ 金字塔（母线沿 $\pm x,\pm y$），摩擦约束等价于 $|r_x|\le\mu r_z$ 且 $|r_y|\le\mu r_z$，拆成 4 个线性不等式（H-rep）： $$ \begin{aligned} &r_x - \mu r_z \le 0 &&(\text{面 1：}+x \text{侧})\ &-r_x - \mu r_z \le 0 &&(\text{面 2：}-x \text{侧})\ &r_y - \mu r_z \le 0 &&(\text{面 3：}+y \text{侧})\ &-r_y - \mu r_z \le 0 &&(\text{面 4：}-y \text{侧}) \end{aligned} \tag{2.21a} $$ 写成矩阵形式 $C\mathbf{r}\le\mathbf{0}$，其中 $$ C=\begin{bmatrix} 1 & 0 & -\mu\ -1 & 0 & -\mu\ 0 & 1 & -\mu\ 0 & -1 & -\mu\end{bmatrix}. \tag{2.21b} $$ 这 4 行就是金字塔的 4 个侧面。再加上法向 $r_z\ge0$（第 5 个约束，对应金字塔"开口朝上"），就完整描述了 $k=4$ 内切金字塔。在 MPC 的 QP 里，每只着地的脚贡献这样一组约束，$n$ 只脚就是 $5n$ 行不等式——这就是足式 Convex MPC 的摩擦约束块的全部来历。

验证各向异性（对接 §2.1 圆锥）： - 沿 $+x$ 方向最大力：约束 $r_x\le\mu r_z$ 取等，$r_x^{\max}=\mu r_z$。与圆锥一致（顶点方向满值）。 - 沿对角 $(1,1)/\sqrt2$ 方向最大力：要同时满足 $r_x\le\mu r_z$ 和 $r_y\le\mu r_z$，对角力 $\|\mathbf{r}_T\|$ 在 $r_x=r_y=\mu r_z$ 时取最大 $=\sqrt2\mu r_z$……等等，这是**外切**行为？不——注意 $(2.21a)$ 是用 $|r_x|,|r_y|$ 分别 $\le\mu r_z$，这其实是个**正方形（盒式/$\ell_\infty$）**，它**外切**于半径 $\mu r_z$ 的圆（对角顶点在 $\sqrt2\mu r_z$ 处，圆外）！

这是一个极重要的细节澄清：足式 MPC 里"每脚 4 不等式"$|r_x|\le\mu r_z\wedge|r_y|\le\mu r_z$ 写出的是**外切正方形**（盒式约束），不是内切！它沿对角**高估**摩擦到 $\sqrt2\mu r_z$。为了保守（内切、欠近似），工程上把系数改成 $\mu/\sqrt2$：用 $|r_x|\le\tfrac{\mu}{\sqrt2}r_z\wedge|r_y|\le\tfrac{\mu}{\sqrt2}r_z$，这样对角方向 $\|\mathbf{r}_T\|_{\max}=\sqrt2\cdot\tfrac{\mu}{\sqrt2}r_z=\mu r_z$ 恰好不超过圆——这才是内切。这就是为什么足式 MPC 代码里常看到 $\mu$ 被除以 $\sqrt2$ 或直接用保守值——不是随意保守，而是把盒式约束从"外切高估"扳成"内切欠近似"的精确补偿。

对比性思维（盒式 4 不等式不是内切金字塔，而是外切正方形）：很多人以为"每脚 4 不等式"是 §2.4 理论一的内切 $k=4$ 金字塔——错。$|r_x|\le\mu r_z\wedge|r_y|\le\mu r_z$ 是**外切**正方形（对角高估 $\sqrt2$）。真正的内切 $k=4$ 金字塔母线在 $\pm x,\pm y$、顶点在圆上，对角是**低估** $1/\sqrt2$。两者方向相反！盒式约束乐观（可能打滑），内切金字塔保守（可能浪费摩擦）。理解这个区别，你才能正确判断手里的 MPC 是"乐观高估"还是"保守低估"，并对症补偿。这是本章最容易被混淆、也最有工程价值的一个点。

⚠️ 常见陷阱¶

💡 概念误区一：以为增大 $k$ 总是免费的好事 - 新手想法："$k$ 越大越精确，那就用 $k=64$ 一劳永逸。" - 实际上：每增加一条母线/一个面，LCP/QP 就多一个变量/约束。$k=8$ 时 LCP 规模约为无摩擦的 $10$ 倍（Acary 等的估计），$k=64$ 会让实时求解崩溃。精度提升是 $1-\cos(\pi/k)\sim \pi^2/(2k^2)$ 的二次衰减——从 $k=8$ 到 $k=16$ 误差从 $7.6\%$ 降到 $1.9\%$，但规模翻倍；继续加收益递减。 - 为什么重要：盲目加 $k$ 会把"省下的打滑"换成"求解超时"，得不偿失。 - 自检：算 $k=8$ 的误差 $7.6\%$ 是否已小于你的模型不确定度（通常 $\mu$ 本身就有 $\pm20\%$ 误差）——若是，加 $k$ 没意义。

💡 概念误区二：混淆内切与外切，用错了近似方向 - 新手想法："多面体近似嘛，内切外切差不多。" - 实际上：内切是**欠近似**（低估摩擦，保守安全），外切是**过近似**（高估摩擦，乐观危险）。控制中用外切会让你"以为有更多摩擦"，实际打滑；可达性分析里若需要"保证不超出"才用外切。用反了方向，安全性结论会完全相反。 - 为什么重要：安全攸关的足式控制必须用内切（宁可保守）。 - 自检：内切多边形顶点在圆上、整体在圆内；外切多边形边切圆、整体在圆外。画个图确认你用的是哪个。

🧠 思维陷阱：以为多面体近似只影响"精度"不影响"定性行为" - 新手想法："近似嘛，无非是数值差一点，定性上一样。" - 实际上：$k=4$ 的各向异性会产生**定性的虚假行为**——机器人会"偏好"沿坐标轴方向运动（那里摩擦足），"回避"对角方向（那里摩擦虚弱），表现为步态在某些方向莫名"发飘"或修正过度。这不是"差一点"，而是引入了一个真实物理里不存在的**方向偏好**。各向异性伪影是定性的，不是定量的。 - 正确思维：多面体近似改变的不只是摩擦力大小，还有摩擦的**对称性**——从连续旋转对称 $O(2)$ 降到离散 $k$ 重对称。对称性的破缺是定性变化。 - 自检：让机器人原地沿不同方向各推一次，若沿对角方向明显更易滑，就是 $k=4$ 伪影在作怪。

练习¶

代码验证（可选，多面体误差的数值确认）¶

验证内切误差公式 $(2.22)$/$(2.23)$ 与各向异性振荡——把"最差方向有效 $\mu=\mu\cos(\pi/k)$"用数值跑出来。

import numpy as np

def inner_pyramid_effective_mu(mu, k, n_dirs=720):
    """内切 k 棱金字塔沿各方向的有效摩擦系数，返回 (最小, 最大)。"""
    verts = np.array([[np.cos(2*np.pi*i/k), np.sin(2*np.pi*i/k)] for i in range(k)])  # 单位圆上顶点
    eff = []
    for theta in np.linspace(0, 2*np.pi, n_dirs, endpoint=False):
        d = np.array([np.cos(theta), np.sin(theta)])           # 查询方向
        # 内切多边形沿 d 的支撑半径 = 多边形边界与射线 d 的交点到原点距离
        # 对凸多边形，= min over 边 of (边法向投影约束)；这里用顶点凸组合的支撑函数对偶式
        # 简化：内切多边形在方向 d 的半径 = 1 / max_i (顶点 i 在 d 上的投影 / ||顶点i||^2 的支撑)
        # 实用近似：射线与多边形边界交点（多边形顶点在单位圆上，缩放 mu）
        radius = polygon_radius_along(verts, d)
        eff.append(mu * radius)
    return min(eff), max(eff)

def polygon_radius_along(verts, d):
    """单位内切多边形沿方向 d 的边界半径（射线 d 与多边形边的交点距离）。"""
    k = len(verts)
    best = np.inf
    for i in range(k):
        a, b = verts[i], verts[(i+1) % k]      # 一条边 a->b
        # 解 t*d = a + s*(b-a), s in [0,1], t>0
        M = np.array([d, a - b]).T
        if abs(np.linalg.det(M)) < 1e-12: continue
        t, s = np.linalg.solve(M, a)
        if t > 0 and -1e-9 <= s <= 1 + 1e-9:
            best = min(best, t)
    return best

mu = 0.6
for k in [4, 6, 8, 16]:
    lo, hi = inner_pyramid_effective_mu(mu, k)
    predicted_min = mu * np.cos(np.pi / k)     # 理论 (2.22)
    print(f"k={k:2d}: 数值最差有效mu={lo:.4f}, 理论 mu*cos(pi/k)={predicted_min:.4f}, "
          f"最好={hi:.4f} (=mu? {abs(hi-mu)<1e-3})")

预期输出：每个 $k$ 的数值最差有效 $\mu$ 与理论 $\mu\cos(\pi/k)$ 吻合（$k=4$ 时 $\approx0.424=0.6/\sqrt2$，$k=8$ 时 $\approx0.554$），最好方向恒为 $\mu=0.6$（顶点满值）。这数值确认了"内切金字塔沿最差方向低估到 $\mu\cos(\pi/k)$、沿顶点方向满值"的各向异性振荡——§2.4 理论二、理论三的结论得到验证。

练习 2.4.1（推导题，⭐⭐） 误差公式的二次衰减。从 $(2.23)$ 出发，对大 $k$ 做 Taylor 展开，证明 $1-\cos(\pi/k)\approx \pi^2/(2k^2)$。由此说明：要把最差方向误差从 $5\%$ 降到 $1.25\%$，$k$ 需要翻几倍？这解释了"加 $k$ 收益递减"的定量规律。

练习 2.4.2（开放思考题，⭐⭐⭐） 旋转金字塔的策略。$k=4$ 金字塔的"好方向"沿坐标轴。(a) 若机器人主要沿某固定方向 $\theta_0$ 行走，应如何旋转金字塔以最小化该方向的摩擦低估？(b) 若运动方向时变（全向移动），固定旋转还有用吗？(c) 设计一个"自适应旋转金字塔"策略的思路，并讨论它相比直接用 SOCP 的优劣。这道题直通足式 MPC 的工程实现细节。

练习 2.4.3（跨章综合题，⭐⭐⭐，综合 §2.1 几何 + §2.4 + 足式 05 §80） 每脚 4 不等式的来历。足式 Convex MPC 里每只脚的摩擦约束常写成 4 个线性不等式。(a) 从内切 $k=4$ 金字塔 $(2.20)$ 或外切 $(2.21)$ 出发，写出这 4 个不等式的显式形式（设法向沿 $z$、切向 $x,y$）。(b) 说明这 4 个不等式对应金字塔的哪 4 个面。(c) 验证：沿 $x$ 轴方向最大切向力是 $\mu r_N$，沿 $45°$ 方向最大切向力是 $\mu r_N/\sqrt2$——把 §2.1 的圆锥与本节的金字塔在这一个具体数字上对接起来。

§2.5 锥互补问题（CCP）与凸松弛代价：现代凸接触仿真的核心 ⭐⭐⭐⭐¶

过渡与动机：明明可解，为什么还要"松弛"？¶

走到这里我们已经有了：摩擦锥几何（§2.1）、MDP 变分（§2.2）、de Saxcé 关联化（§2.3）、多面体/SOCP 两条近似路线（§2.4）。看起来摩擦已经被"驯服"了。但 §0 反复强调的"坏性质三：非凸"还没真正解决——单接触摩擦律可处理 $\ne$ 多接触整体问题是凸的。当多个接触点通过同一个刚体的动力学耦合在一起，"严格 Signorini 互补 + 严格 Coulomb"叠加出的可行集**不是凸集**，标准凸优化的"局部最优=全局最优"保证失效，求解器可能卡在局部解或不收敛。

Mihai Anitescu 在 2006 年（Mathematical Programming，"Optimization-based simulation of nonsmooth rigid multibody dynamics"）给出了一个革命性的答案：与其精确求解非凸问题，不如把它松弛（relax）成一个凸问题——一个锥互补问题（Cone Complementarity Problem, CCP）。松弛后问题必有解、解集凸、可用迭代稳定求解，代价是引入一个可控的、随步长趋零而消失的物理偏差。这就是本节的主题，也是 MuJoCo（Todorov 2014）、Drake SAP（Castro-Permenter-Han 2023）等现代可微/实时仿真器的共同数学地基。

反面：不做凸松弛，直接解非凸 NCP 会怎样¶

坚持精确求解非凸的"接触+Coulomb"NCP（nonlinear complementarity problem），后果在 §0 已铺垫，这里量化：(1) 可能无解——Painlevé 构型下经典刚体方程无相容解（§6 定理 1），求解器报"infeasible"或发散。(2) 多解——非凸可行集可有多个孤立解，不同初值收敛到不同物理上都"合法"的解，仿真不可复现。(3) 不收敛/振荡——非单调 NCP 的 pivoting 或 Newton 迭代无全局收敛保证。(4) 不可微——精确解在粘滑切换处不可微，无法用于基于梯度的轨迹优化（专题 4、6）。Anitescu 凸松弛一举把(1)(2)(3)变成"必有唯一解、可稳定迭代"，把(4)的不可微"抹平"成可微——代价集中体现为下面要讲的"forces from a distance"伪影。

历史：从 Stewart-Trinkle 的 LCP 到 Anitescu 的凸松弛¶

接触仿真的算法史是一条"逐步凸化"的路线：

Stewart–Trinkle 1996 / Anitescu–Potra 1997：多面体 LCP（§2.4）。LCP 在 P-矩阵下可解，但带摩擦的 LCP 系统矩阵**非对称、非半正定**（§0 坏性质二），只在"copositive"等较弱矩阵类下有解，Lemke 算法可能在"ray termination"时失败。
Anitescu 2006 / Anitescu–Tasora 2008：凸松弛。把 LCP 松弛成 CCP（锥互补问题），等价于一个**凸二次规划/锥规划**。关键改动：把速度层的互补条件从"精确 Signorini"放宽为"接触速度落在对偶摩擦锥内"。松弛后问题凸、必有解、PGS 迭代全局收敛。
Todorov 2014（MuJoCo）：进一步加**软约束/正则化**，得到处处光滑可微的凸优化，RL 友好。
Castro–Permenter–Han 2023（Drake SAP）：把柔性接触（compliant contact）写成**无约束凸优化**（解析消去约束），全局收敛 + 可热启动，达到交互式实时。本质仍是 Anitescu 凸松弛 + 柔性正则化。

这条线印证了 §2.1 历史小节的教训——同一个物理律，数学语言每升级一次（LCP→CCP→无约束凸），可解规模和性质就改善一次。从"可能失败的非对称 LCP"到"全局收敛的无约束凸"，二十年走的就是"凸化"这一条主线。

理论一：锥互补问题（CCP）的形式¶

先把单接触的离散接触动力学写出来（专题 3 会从时步法严格推导，这里给结论形式，复用专题 1 的 Delassus/Schur 补结构）。设一个时间步内，接触冲量 $\mathbf{r}=(r_N,\mathbf{r}_T)\in K_\mu$，接触点速度 $\mathbf{u}=(u_N,\mathbf{u}_T)$，二者通过 Delassus 算子 线性关联： $$ \mathbf{u} = N\mathbf{r} + \mathbf{b},\qquad N = D^\top M^{-1} D \succ 0, \tag{2.24} $$ 其中 $M$ 是质量矩阵、$D$ 是接触雅可比、$\mathbf{b}$ 是自由速度项（由前一步状态和外力决定）。$N=D^\top M^{-1}D$ 就是前置自测第 5 题预告的 Delassus 算子，它是对称正定的（$M\succ0$ 保证），这一点专题 1 已证——它是整个求解结构的"系统矩阵"。

**精确（非凸）接触问题**要求 $\mathbf{u}$ 与 $\mathbf{r}$ 满足完整 Signorini+Coulomb：法向互补 $0\le u_N\perp r_N\ge0$、切向 MDP $(2.14)$。这是非凸的。

Anitescu 凸松弛（CCP）**把它改写成：求 $\mathbf{r}\in K_\mu$ 使得 $$ \boxed{ K_\mu \ni \mathbf{r} \perp (\,N\mathbf{r}+\mathbf{b} + \boldsymbol{\Phi}(\mathbf{r})\,)\in K_\mu^* } \tag{2.25} $$ 其中 $\boldsymbol{\Phi}(\mathbf{r}) = \mu\|\mathbf{r}_T\|\,\mathbf{e}_N\cdot(\text{相关项})$ 正是 §2.3 de Saxcé 修正在冲量层的体现（这里复用了 $(2.18)$ 的虚拟法向项）。这个"锥 $\ni$ 变量 $\perp$ 余量 $\in$ 对偶锥"的结构就是 **CCP——它把专题 1 的"非负象限互补 $0\le\mathbf{r}\perp\mathbf{u}\ge0$"推广到了"锥互补 $K_\mu\ni\mathbf{r}\perp\mathbf{u}\in K_\mu^*$"。关键：CCP 等价于一个**凸**优化问题 $$ \min_{\mathbf{r}\in K_\mu} \tfrac12\mathbf{r}^\top N\mathbf{r} + \mathbf{b}^\top\mathbf{r}, \tag{2.26} $$ 因为 $N\succ0$（Delassus 正定）、$K_\mu$ 凸（§2.1），目标凸+可行域凸 ⟹ 凸优化 ⟹ 必有唯一解、局部即全局。这就是凸松弛把非凸变凸的全部魔法——把"精确 Signorini 的非凸互补"换成"投影到凸锥 $K_\mu$ 的凸 QP"。

多视角理解（CCP vs 专题 1 的 LCP）： - 专题 1 LCP：$\mathbb{R}^n_{\ge0}\ni\mathbf{r}\perp\mathbf{u}\ge0$，锥是非负象限（一阶锥），自对偶，问题对称半正定、良态。 - 本节 CCP：$K_\mu\ni\mathbf{r}\perp\mathbf{u}\in K_\mu^*$，锥是二阶锥，$\mu\ne1$ 时非自对偶，但松弛后仍凸可解。边界：从 LCP 到 CCP，"非负象限"换成"二阶锥"，"投影到象限"（截断负数）换成"投影到锥"（$(2.14)$ 后那个一行公式）。专题 1 的 PGS 迭代结构几乎原样复用——这正是前置知识桥接里说的"投影迭代思想直接复用，只是把投影目标从象限换成锥"。

理论补：为什么"多面体摩擦 LCP"的系统矩阵非对称（具体看一遍）¶

§0 反复说"摩擦让系统矩阵非对称（坏性质二）"，但一直没具体展示。这里用 §2.4 多面体 LCP 的最小结构看一遍——这是理解"为什么无摩擦 LCP 良态、有摩擦 LCP 病态"的关键。

把 Stewart–Trinkle 多面体 LCP 的变量排成 $\mathbf{z}=(r_N,\ \boldsymbol{\beta},\ \lambda)$：法向力 $r_N$、$k$ 个母线系数 $\boldsymbol{\beta}\in\mathbb{R}^k_{\ge0}$（切向力 $\mathbf{r}_T=\sum\beta_i\mathbf{d}_i$，$(2.20)$）、以及一个辅助乘子 $\lambda\ge0$（代表"切向滑动速度幅值"）。互补条件有三组： $$ \begin{aligned} 0\le r_N &\perp u_N \ge0 &&(\text{法向 Signorini})\ 0\le \boldsymbol{\beta} &\perp (\lambda\mathbf{e}+E^\top\mathbf{u}_T)\ge0 &&(\text{切向：每条母线方向的滑动})\ 0\le \lambda &\perp (\mu r_N - \mathbf{e}^\top\boldsymbol{\beta})\ge0 &&(\text{摩擦锥：}\textstyle\sum\beta_i\le\mu r_N) \end{aligned} \tag{2.24a} $$ （$E$ 是母线方向矩阵，$\mathbf{e}=(1,\dots,1)^\top$。）把它整理成标准 LCP $0\le\mathbf{z}\perp(\mathbf{M}\mathbf{z}+\mathbf{q})\ge0$，系统矩阵 $\mathbf{M}$ 的分块结构是： $$ \mathbf{M}=\begin{bmatrix} \ast & \mathbf{0} & \mathbf{0}\ \mathbf{0} & \ast & \mathbf{e}\ \boxed{\mu} & \boxed{-\mathbf{e}^\top} & 0\end{bmatrix}. \tag{2.24b} $$ 看最后一行和最后一列：摩擦约束行里出现了 $\mu$（耦合 $r_N$）和 $-\mathbf{e}^\top$（耦合 $\boldsymbol{\beta}$），而对应的列里是 $+\mathbf{e}$——$\mathbf{M}$ 的 $(\lambda, r_N)$ 元是 $\mu$、但 $(r_N,\lambda)$ 元是 $0$；$(\lambda,\boldsymbol{\beta})$ 块是 $-\mathbf{e}^\top$、但 $(\boldsymbol{\beta},\lambda)$ 块是 $+\mathbf{e}$。$\mathbf{M}\ne\mathbf{M}^\top$，非对称！

这个非对称的根源就是那个 $\mu$——它出现在"摩擦锥约束耦合法向力"的位置（法向单向调制切向），但反过来没有对称的项（切向不调制法向）。这正是 §0 坏性质二、§2.3 非关联性、本节理论补微观单向因果在 LCP 矩阵上的最终显形。非对称的后果：(1) $\mathbf{M}$ 不再半正定，LCP 失去"对称半正定 ⟹ 有解 ⟹ 凸解集"的黄金链；(2) Lemke 算法只在较弱的 copositive 矩阵类下保证终止，可能 ray termination 失败。

本质洞察：把无摩擦 LCP 的对称矩阵和有摩擦 LCP 的非对称矩阵 $(2.24b)$ 并排看，那个破坏对称的 $\mu$ 项就是整章故事的"罪魁"——它是 §0 四重病态的代数化身，是 §2.3 de Saxcé 要修补的裂缝的矩阵形式，是 §2.5 凸松弛要"绕过"的障碍。Anitescu 凸松弛的本质，就是修改这个非对称矩阵使其变成对称正定的 $N=D^\top M^{-1}D$（$(2.24)$）——以放宽互补（引入边界层伪影）为代价，把病态的非对称 LCP 换成良态的对称凸 QP。这一行矩阵，把全章串起来了。

理论二：凸松弛的代价——"forces from a distance"（隔空作用力）¶

凸松弛不是免费的。$(2.25)$ 里那个 de Saxcé 修正项 $\boldsymbol{\Phi}(\mathbf{r})=\mu\|\mathbf{r}_T\|\mathbf{e}_N$ 在松弛后被"误读"为真实的法向速度，导致 §2.3 陷阱一警告过的后果——滑动接触会产生一个虚假的法向分离速度。在离散时步法里，这个虚假分离速度乘以步长 $h$，变成一个**虚假的法向间隙增量** $\Delta g_N \approx h\mu\|\mathbf{u}_T\|$。物理后果是：两个相对滑动的物体之间被"撑开"一个薄边界层（boundary layer）——它们在还没真正接触、或本应贴合滑动时，被推开一个正比于 $h\mu\|\mathbf{u}_T\|$ 的小距离。

这就是 Anitescu 凸松弛著名的 "forces from a distance"（隔空作用力）伪影：物体仿佛能隔着一小段空气施加接触力。它的特征： - 正比于步长 $h$：$h\to0$ 时伪影消失（这是松弛"渐近正确"的保证——精确解是 $h\to0$ 的极限）。 - 正比于滑动速度 $\|\mathbf{u}_T\|$ 和摩擦系数 $\mu$：高速滑动、粗糙表面时最明显。 - 只在滑动时出现：粘滞时 $\mathbf{u}_T=0$，修正项为零，无伪影。

本质洞察：forces-from-a-distance 不是 bug，而是**用凸性换可解性必然支付的"物理税"**。它的数学根源就是 §2.3 那个 de Saxcé 虚拟法向速度——在连续/精确层面它只是个计算构造（不影响真实运动），但在凸松弛+有限步长的离散层面，它"泄漏"成了真实的法向位移。换句话说：凸松弛把"非关联流动的变分裂缝"用一个 $O(h)$ 的法向膨胀"填平"了，膨胀量就是伪影。理解这一点，你就理解了为什么所有基于 Anitescu 松弛的仿真器（MuJoCo、Drake SAP、Chrono）在大步长下都有这个伪影，且都靠减小 $h$ 或柔性接触来缓解。

理论-工程桥接：现在回收 §0 场景三的伏笔——你用 MuJoCo 仿真 peg-in-hole，零件"还没接触就被推开一点点"，这**就是** forces-from-a-distance。它不是碰撞检测的 bug，而是凸松弛在大步长下的固有伪影。诊断方法：把步长 $h$ 减半，若推开距离也大致减半（正比于 $h$），确认是松弛伪影而非碰撞 bug。缓解：减小步长、降低 $\mu$（若可接受）、或换用更小松弛的求解器（Siconos SOCP 无此伪影但慢）。误把它当碰撞 bug，会在错误方向上浪费数天——这正是"不学本章会怎样"的代价。

理论补：边界层厚度的定量推导与 sim-to-real 影响¶

把 forces-from-a-distance 的厚度精确算出来——这是判断"某个仿真器在你的步长下伪影有多大"的依据。

回顾松弛的来源：CCP $(2.25)$ 把速度层互补从"精确 $u_N\ge0$"放宽。在 Anitescu 松弛里，被放宽的法向速度约束实际变成 $$ u_N \ge -\mu|\mathbf{u}_T|\quad(\text{而非精确的} u_N\ge0), \tag{2.25a} $$ 即允许法向速度有一个 $-\mu\|\mathbf{u}_T\|$ 的"侵入容差"（或等价地，分离时多一个 $\mu\|\mathbf{u}_T\|$ 的虚拟分离）。这个虚拟法向速度乘以步长 $h$，积分成一步内的虚拟间隙增量： $$ \boxed{\;\Delta g_N \approx h\,\mu\,|\mathbf{u}_T|.\;} \tag{2.25b} $$ 这就是边界层厚度。代入数字（练习 2.5.2 的设定）：$h=10\,$ms、$\mu=0.8$、$\|\mathbf{u}_T\|=0.5\,$m/s，得 $\Delta g_N\approx 0.01\times0.8\times0.5=4\times10^{-3}\,$m $=4\,$mm。$4$mm 的隔空间隙在精密装配里是灾难性的（零件公差常在亚毫米级）。要压到 $0.1\,$mm，需 $h\le 0.1/(0.8\times0.5\times1000)=0.25\,$ms——比实时仿真常用的 $1$–$10\,$ms 小得多。这就是为什么纯靠减 $h$ 来消伪影对实时仿真不现实，Drake SAP 才改用**柔性接触**（让接触有一点弹性变形，把硬约束的伪影"吸收"进柔性形变里，不必减 $h$）。

sim-to-real 的隐患：做摩擦辨识时，你观测仿真里的接触行为去匹配真实数据。但仿真里有这个 $O(h)$ 边界层——如果直接拿大步长仿真的接触力/间隙去标定 $\mu$，你会**把伪影当成真实摩擦**学进去，得到偏大的 $\mu$（因为伪影让物体"看起来"更早分离、接触更软）。正确做法：先在 $h\to0$ 的小步长极限下标定（扣除伪影），或显式建模伪影 $(2.25b)$ 再在辨识里减掉。这是 §7 与 04 不确定性桥接的一个具体技术点——不理解伪影来源，sim-to-real 的摩擦参数就会系统性偏差。

本质洞察：边界层厚度 $(2.25b)$ 把 §2.3 的"虚拟法向速度"（那时是纯计算构造）和 §2.5 的"隔空作用力"（这里是真实物理偏差）定量地连了起来——同一个 $\mu\|\mathbf{u}_T\|$，在连续/精确层面只是关联化的计算项（不影响运动），在凸松弛+有限步长的离散层面就泄漏成 $h\mu\|\mathbf{u}_T\|$ 的真实位移。$h\to0$ 时泄漏消失，松弛收敛到精确解。这条 $O(h)$ 的链，是理解"为什么凸松弛渐近正确但有限步长有偏"的全部数学。

理论三：半光滑 Newton 法——求解 CCP 的另一条路¶

PGS（投影 Gauss-Seidel，复用专题 1）是求解 CCP 最简单的迭代——逐接触点投影到锥，线性收敛、实现简单（Bullet、早期 MuJoCo 用它）。但 PGS 收敛慢（病态时尤甚）。现代高精度求解器（Siconos、Pinocchio 3 ADMM、Drake SAP）多用**半光滑 Newton 法（semismooth Newton）**或 ADMM。

半光滑 Newton 的思想：把锥互补 $(2.25)$ 用一个**C-函数（complementarity function）重写成非光滑方程 $F(\mathbf{r})=\mathbf{0}$，例如 Fischer–Burmeister 函数的锥推广，或"自然残差" $\mathbf{r}-\mathrm{proj}_{K_\mu}(\mathbf{r}-\rho\mathbf{u})=\mathbf{0}$。这个 $F$ 处处连续但在锥面/顶点不可微（"半光滑"），用**广义 Jacobian（Clarke 次微分，专题 70）做 Newton 迭代： $$ \mathbf{r}^{k+1} = \mathbf{r}^k - V_k^{-1}F(\mathbf{r}^k),\qquad V_k\in\partial_C F(\mathbf{r}^k). \tag{2.27} $$ 半光滑 Newton 在解附近**超线性收敛**（Qi–Sun 1993 理论），远快于 PGS，代价是每步要解一个线性系统、且需要广义 Jacobian（涉及锥投影的次微分，专题 70 主题）。这是 §2.5 目标里"半光滑 Newton"的落点，也是它依赖专题 70 非光滑分析的原因。

系统性分类（CCP 求解器谱系）：按"收敛速度 vs 每步成本"分三档—— - 一阶（PGS/投影梯度）：每步极便宜（一次锥投影），线性收敛。适合实时、低精度、海量接触（颗粒仿真）。 - 一阶加速（ADMM/APGD）：每步仍便宜，收敛快于纯 PGS。Pinocchio 3、Chrono 用。 - 二阶（半光滑 Newton）：每步贵（解线性系统 + 广义 Jacobian），超线性收敛。适合少量接触、高精度（操作仿真、研究基准）。选型仍是"接触数量 $\times$ 精度需求 $\times$ 实时预算"的三维权衡，无占优解。

理论补：多接触 PGS 的"逐点扫描"结构¶

单接触的投影迭代讲清了，多接触（$m$ 个接触点）怎么办？PGS（Projected Gauss-Seidel）的做法是"逐点扫描"——这是它名字里 Gauss-Seidel 的含义，也是它能处理海量接触的关键。

多接触 CCP 是 $\min_{\mathbf{r}\in K}\tfrac12\mathbf{r}^\top N\mathbf{r}+\mathbf{b}^\top\mathbf{r}$，其中 $\mathbf{r}=(\mathbf{r}_1,\dots,\mathbf{r}_m)$ 是所有接触力堆叠，$K=K_{\mu_1}\times\cdots\times K_{\mu_m}$ 是各接触锥的笛卡尔积，$N$ 是 $3m\times3m$ 的 Delassus 矩阵（块 $N_{ij}=D_i^\top M^{-1}D_j$ 编码接触 $i,j$ 通过刚体的耦合）。PGS 一轮扫描： $$ \text{for } i=1,\dots,m:\quad \mathbf{r}i \leftarrow \mathrm{proj}}}!\Bigl(\mathbf{ri - \rho_i\bigl(\textstyle\sum_j N_i\bigr)\Bigr), \tag{2.27a} $$ }\mathbf{r}_j+\mathbf{b逐点更新，且用最新值（Gauss-Seidel 风格：算接触 $i$ 时，$j<i$ 的 $\mathbf{r}_j$ 已是本轮更新过的）。每次只投影一个接触点到它自己的小锥 $K_{\mu_i}$（一次 $(2.14)$ 那行公式），极便宜；扫描多轮直到收敛。

为什么 PGS 能处理上万接触点（颗粒仿真）：因为它从不组装、从不求逆整个 $3m\times3m$ 矩阵——只逐点做局部锥投影。代价是收敛慢（线性），且依赖 $N$ 的对角占优性（接触耦合弱时快、强时慢）。这正是 §2.5 凸松弛的工程价值兑现处：因为松弛后 $N\succ0$、问题凸，PGS 的逐点投影才保证收敛（专题 1 的非负象限 PGS 收敛性原样推广到锥）。若不松弛、$N$ 非对称（$(2.24b)$），PGS 可能振荡不收敛。

本质洞察：从专题 1 的"逐点投影到非负象限"到本节的"逐点投影到二阶锥"，PGS 的骨架一字未改——只把每点的投影目标从象限换成锥。这就是为什么理解了单接触的锥投影 $(2.14)$，就理解了海量接触的求解器：多接触只是单接触的笛卡尔积 + Gauss-Seidel 扫描，没有新的数学，只有"把同一个投影做 $m$ 次、扫描多轮"。Chrono 用这个结构在 GPU 上仿真百万颗粒，内核就是这一行锥投影。

⚠️ 常见陷阱¶

🧠 思维陷阱一：把 forces-from-a-distance 当成碰撞检测 bug - 新手想法："物体没接触就受力，肯定是碰撞检测算错了间隙。" - 实际上：这是 Anitescu 凸松弛 + 有限步长的**固有伪影**，与碰撞检测无关。它正比于 $h\mu\|\mathbf{u}_T\|$，只在滑动时出现。去查碰撞检测代码是南辕北辙。 - 为什么重要：误诊会浪费大量时间在正确的碰撞检测上找不存在的 bug。 - 自检：减半步长 $h$，伪影距离若也大致减半 → 确认是松弛伪影；若不变 → 才可能是碰撞 bug。

💡 概念误区二：以为凸松弛"无损"，松弛解就是精确解 - 新手想法："松弛成凸问题求解，得到的就是真实接触力。" - 实际上：松弛解只在 $h\to0$ 时**渐近**收敛到精确解。任何有限步长下，松弛解与精确解差一个 $O(h)$ 的边界层（forces-from-a-distance）。它是"可控近似"不是"精确"。把松弛解当精确解，会在大步长仿真里得到系统性偏移（物体间隙偏大、接触力偏软）。 - 为什么重要：做接触辨识、sim-to-real 时，必须知道仿真里有这个 $O(h)$ 偏差，否则会把伪影当成真实物理去匹配。 - 自检：能写出伪影量 $\sim h\mu\|\mathbf{u}_T\|$ 并说出它随 $h\to0$ 消失，就理解了"渐近正确"。

🧠 思维陷阱三：以为 CCP 的凸性来自摩擦锥凸，与 Delassus 正定无关 - 新手想法："$K_\mu$ 是凸锥，所以 CCP 自然是凸问题。" - 实际上：凸优化 $(2.26)$ 需要**两个**条件——可行域凸（$K_\mu$ 凸，§2.1）和**目标凸（$N\succ0$，Delassus 正定）。若 $N$ 不正定（例如冗余接触、奇异配置导致半正定但有零方向），目标不严格凸，解可能不唯一、QP 退化。两个条件缺一不可。 - **正确思维：CCP 凸 = 锥凸（几何，§2.1）+ Delassus 正定（动力学，专题 1）。前者保证可行域，后者保证目标。 - 自检：问"如果两个接触点雅可比线性相关（$D$ 列相关），$N$ 还正定吗？"——不，只半正定，此时解集可能是个面而非点。

练习¶

练习 2.5.1（推导题，⭐⭐⭐） 从 NCP 到 CCP 的松弛。写出单接触精确 Signorini+Coulomb 的 NCP 形式，然后逐步松弛：(a) 指出哪个条件是非凸的（提示：法向互补与切向 MDP 的耦合）。(b) 用 de Saxcé 修正 $(2.18)$ 把它改写成 $(2.25)$ 的锥互补形式。(c) 论证为什么 $(2.25)$ 等价于凸 QP $(2.26)$，并指出这个等价用到了 $N\succ0$ 的哪一步。

练习 2.5.2（开放思考题，⭐⭐⭐⭐） 伪影的量化与权衡。给定步长 $h=10\,$ms、$\mu=0.8$、滑动速度 $\|\mathbf{u}_T\|=0.5\,$m/s。(a) 估算 forces-from-a-distance 边界层厚度 $\Delta g_N\approx h\mu\|\mathbf{u}_T\|$ 的数量级。(b) 若要把伪影压到 $0.1\,$mm 以下，$h$ 需多小？这对实时仿真（需 $h\gtrsim1\,$ms）意味着什么？(c) Drake SAP 用柔性接触缓解伪影而非一味减 $h$——查阅其思路，说明"柔性"如何在不减 $h$ 的前提下减小有效伪影。

练习 2.5.3（跨章综合题，⭐⭐⭐⭐，综合专题 1 + §2.2 + §2.3 + 本节） 手推单接触 CCP 一步。质量矩阵 $M=\mathrm{diag}(1,1,1)$，接触雅可比 $D=I_3$（故 $N=I_3$），自由速度 $\mathbf{b}=(-0.2, 0.3, 0)^\top$（法向、切向 x、y），$\mu=0.5$。(a) 写出凸 QP $(2.26)$。(b) 用投影梯度 $\mathbf{r}^{k+1}=\mathrm{proj}_{K_\mu}(\mathbf{r}^k-\rho(N\mathbf{r}^k+\mathbf{b}))$ 手算两步（$\rho=1$，初值 $\mathbf{r}^0=\mathbf{0}$），其中投影到二阶锥 $K_{0.5}$ 用 §2.2 的圆盘投影 + 法向截断的组合公式。(c) 这道题如何同时用到专题 1 的 Delassus 算子、§2.2 的锥投影、§2.3 的修正项、本节的凸松弛？写一段话串起来。

§2.6 SOCCP 与 Euclidean Jordan 代数：3D 摩擦的真实代数结构 ⭐⭐⭐⭐¶

过渡与动机：§2.5 欠了三笔"代数债"¶

§2.5 把摩擦接触写成了锥互补问题（CCP）$K_\mu\ni\mathbf{r}\perp\hat{\mathbf{u}}\in K_\mu^*$，并给了三种求解器（PGS、ADMM、半光滑 Newton）。但回头看，那一节其实欠了三笔"代数债"，全都卡在同一个缺口上——我们一直在用"投影到二阶锥"这个动作，却从未把它在三维（真实接触是 3D：1 法向 + 2 切向）写成闭式：

§2.2 只给了"圆盘投影"（$\mathrm{proj}_{\mathbb{D}_{\mu r_N}}$，二维），那是**固定 $r_N$** 后切向的投影。可真实 CCP 里 $r_N$ 是未知量，法向和切向要**一起**投影到整个三维锥 $K_\mu$。三维锥投影的闭式是什么？
§2.5 (2.27) 写了半光滑 Newton $\mathbf{r}^{k+1}=\mathbf{r}^k-V_k^{-1}F(\mathbf{r}^k)$，但 $V_k\in\partial_C F$（锥投影的广义 Jacobian）到底长什么样？没有它，Newton 一步都迈不动。
§2.5 说半光滑 Newton "超线性收敛"，但凭什么？一般半光滑函数只保证超线性，二阶锥这里其实能更强——二次收敛，靠的是一个叫"强半光滑（strong semismoothness）"的性质。它从哪来？

这三笔债有一个共同的还款方式：Euclidean Jordan 代数（Euclidean Jordan algebra）的谱分解。二阶锥不是一个孤立的几何对象，它是一个**代数结构**的"非负元素集合"——就像非负象限 $\mathbb{R}^n_{\ge0}$ 是逐元素乘法下的"非负元素"、半正定锥 $\mathbb{S}^n_+$ 是矩阵乘法下的"非负元素"一样。一旦认出这个代数结构，三维锥投影、广义 Jacobian、二次收敛全都从"谱分解"这**一个**工具里流出来。这正是本节要补的"§2.5 的代数地基"。

本质洞察：§2.5 把摩擦化成了"凸优化问题"，这是**分析层面**的胜利（保证有解、唯一、可迭代）。但要让求解器真正高效（二次收敛而非线性），需要**代数层面**的结构——二阶锥的 Jordan 代数。分析告诉你"解存在且可逼近"，代数告诉你"怎么以最快速度逼近"。 这一节就是从"摩擦的分析"下沉到"摩擦的代数"，是理解 Siconos/Pinocchio 3 这类高精度求解器为什么快的钥匙。

反面：不认代数结构，3D 锥投影会被你拆成"错误的两步"¶

先看一个极常见的错误，理解它，正确的谱分解投影就有了来由。

很多人（包括不少早期代码）面对"投影 $(z_0,\mathbf{z}_1)$ 到三维摩擦锥 $K_\mu=\{\|\mathbf{r}_T\|\le\mu r_N\}$"时，凭直觉拆成两步：先把法向截断到非负 $r_N=\max(z_0,0)$，再把切向投影到半径 $\mu r_N$ 的圆盘。这看上去合理——法向归法向、切向归切向。但它**错了**，而且错得很隐蔽。

错在哪？投影是"找锥内离 $(z_0,\mathbf{z}_1)$ 欧氏距离最近**的点"，这是一个二维优化（在 $(r_N,\|\mathbf{r}_T\|)$ 平面里），法向和切向的最优值**互相耦合：为了离 $\mathbf{z}_1$ 更近，最优的 $r_N$ 可能要**比 $z_0$ 更大**（把锥"撑胖"一点去够切向分量），而不是简单地等于 $\max(z_0,0)$。拆成两步等于假设"法向先定、切向再调"，丢掉了这个耦合，给出的不是真正的最近点。

对比性思维（不是 X 而是 Y）：三维锥投影**不是"法向投影 + 切向投影"的两步串联，而是一个 $(r_N,\|\mathbf{r}_T\|)$ 平面里的整体二维投影**。只有当点已经在锥内或在锥的"正对轴"区域时，两步法才偶然正确；在锥面外的一般点，两步法系统性地偏离真投影。这个错误在 PGS 的每一步都会累积，导致求解器收敛到错误的力——而且因为偏差小、不报错，极难排查。

历史：从 Nesterov–Todd 到 Faraut–Korányi 的代数统一（1990s）¶

二阶锥能被纳入 Jordan 代数，源于 1990 年代凸优化的一次大统一。Yurii Nesterov 与 Michael Todd（1997, Math. Oper. Res.）发现：线性规划（活在非负象限）、二阶锥规划（活在 Lorentz 锥）、半正定规划（活在 PSD 锥）这三类看似不同的内点法，其实共享同一套理论——只要把锥看成某个 Jordan 代数的"对称锥（symmetric cone）"。背后的纯数学是 Jacques Faraut 与 Adam Korányi 的专著《Analysis on Symmetric Cones》(1994)，它把 19 世纪 Pascual Jordan 为量子力学引入的"Jordan 代数"与对称锥一一对应（Jordan–von Neumann–Wigner 1934 分类定理：有限维 Euclidean Jordan 代数只有五类，二阶锥对应其中的"自旋因子 spin factor"）。

到接触力学这边，是 Acary–Brogliato（Inria）和后来的 Carpentier（Pinocchio 3）把这套代数搬进摩擦求解器：既然摩擦锥是二阶锥、二阶锥有 Jordan 代数结构，那就能用谱分解写出锥投影的闭式、用它的 Jacobian 做半光滑 Newton。Defeng Sun 与 Jie Sun（2005, Mathematical Programming 103:575–581）则证明了关键的"强半光滑"性质，把收敛阶从超线性提到二次。

历史的教训（与 §2.1 历史呼应）：§2.1 末说"换一种数学语言，能解的问题范围就变一次"。这里是又一例——把二阶锥从"几何对象"重新表述为"Jordan 代数的对称锥"，立刻继承了一整套谱分解机器（特征值、特征向量、矩阵函数）。摩擦求解器的现代化，本质是一次"语言移植"：把成熟的对称矩阵谱理论，通过 Jordan 代数移植到二阶锥上。

理论一：二阶锥的 Jordan 代数与谱分解¶

把二阶锥的元素 $\mathbf{x}=(x_0,\mathbf{x}_1)\in\mathbb{R}\times\mathbb{R}^{n-1}$ 配上一个"乘法"，使它成为代数。Jordan 积（Jordan product） 定义为 $$ \mathbf{x}\circ\mathbf{y} = \bigl(\,\mathbf{x}^\top\mathbf{y}, x_0\mathbf{y}_1 + y_0\mathbf{x}_1\,\bigr)\in\mathbb{R}\times\mathbb{R}^{n-1}. \tag{2.28} $$ 它的单位元是 $\mathbf{e}=(1,\mathbf{0})$（验证：$\mathbf{e}\circ\mathbf{x}=(x_0,\,1\cdot\mathbf{x}_1+x_0\mathbf{0})=\mathbf{x}$✓）。这个乘法可交换（$\mathbf{x}\circ\mathbf{y}=\mathbf{y}\circ\mathbf{x}$）但**不结合**（一般 $(\mathbf{x}\circ\mathbf{y})\circ\mathbf{z}\ne\mathbf{x}\circ(\mathbf{y}\circ\mathbf{z})$）——这正是 Jordan 代数区别于普通结合代数的特征。

谱分解（spectral decomposition）：任何 $\mathbf{x}=(x_0,\mathbf{x}_1)$ 都能唯一写成两个"特征向量"的加权和。当 $\mathbf{x}_1\ne\mathbf{0}$ 时， $$ \boxed{\;\mathbf{x} = \lambda_1\,\mathbf{c}1 + \lambda_2\,\mathbf{c}_2,\qquad \lambda} = x_0 \pm |\mathbf{x1|,\quad \mathbf{c} \tag{2.29} $$ 这里 } = \tfrac12\Bigl(1, \pm\tfrac{\mathbf{x}_1}{|\mathbf{x}_1|}\Bigr).\;$\lambda_1,\lambda_2$ 叫 $\mathbf{x}$ 的**特征值（eigenvalues），$\mathbf{c}_1,\mathbf{c}_2$ 叫**谱幂等元（spectral idempotents / Jordan frame）。它们满足三条性质，与对称矩阵的谱分解一字不差： - 幂等：$\mathbf{c}_i\circ\mathbf{c}_i=\mathbf{c}_i$（自己乘自己等于自己）； - 正交：$\mathbf{c}_1\circ\mathbf{c}_2=\mathbf{0}$（互相乘等于零）； - 完备：$\mathbf{c}_1+\mathbf{c}_2=\mathbf{e}$（加起来是单位元）。

验证一条（正交）：$\mathbf{c}_1\circ\mathbf{c}_2=\bigl(\mathbf{c}_1^\top\mathbf{c}_2,\,\tfrac12\cdot\tfrac12(\tfrac{\mathbf{x}_1}{\|\mathbf{x}_1\|}-\tfrac{\mathbf{x}_1}{\|\mathbf{x}_1\|})\bigr)$。第一分量 $\mathbf{c}_1^\top\mathbf{c}_2=\tfrac14(1-\tfrac{\mathbf{x}_1^\top\mathbf{x}_1}{\|\mathbf{x}_1\|^2})=\tfrac14(1-1)=0$，第二分量也是 $\mathbf{0}$，故 $\mathbf{c}_1\circ\mathbf{c}_2=\mathbf{0}$✓。

这两个特征值与锥的关系是一切的核心：$\mathbf{x}\in\mathcal{Q}^n$（标准二阶锥 $\|\mathbf{x}_1\|\le x_0$）$\Longleftrightarrow$ $\lambda_1\ge0$ 且 $\lambda_2\ge0$。因为 $\lambda_2=x_0-\|\mathbf{x}_1\|\ge0$ 正是锥约束，$\lambda_1=x_0+\|\mathbf{x}_1\|\ge0$ 在前者成立时自动满足。"在锥内"等价于"两个特征值都非负"——这与"对称矩阵半正定 ⟺ 特征值都非负"完全平行。二阶锥就是 Jordan 代数里的"半正定元素"。

多视角理解（矩阵谱 vs Jordan 谱，标边界）： - 相似处：Jordan 谱分解 $(2.29)$ 与对称矩阵谱分解 $A=\sum\lambda_iP_i$ 结构同形——都有实特征值、正交幂等投影、完备性 $\sum P_i=I$，且"在锥内 ⟺ 特征值非负"。 - 不像处：对称矩阵的特征值有 $n$ 个、幂等元是秩一投影 $P_i=\mathbf{v}_i\mathbf{v}_i^\top$；二阶锥的特征值**永远只有 2 个**（无论 $n$ 多大！），幂等元是 $(2.29)$ 那种"半个单位 + 半个方向"。 - 边界：不要把"只有 2 个特征值"延伸到"信息量少"——这 2 个特征值 + 1 个方向 $\mathbf{x}_1/\|\mathbf{x}_1\|$ 已完整编码了 $\mathbf{x}$ 的全部 $n$ 个自由度（$\lambda_1,\lambda_2$ 给 2 个，方向给 $n-1$ 个，但方向是单位向量故 $n-2$ 个独立，合计 $n$）。"2 个特征值"是二阶锥**秩为 2** 的体现，不是信息丢失。

理论二：用谱分解算锥投影（闭式，还掉第一笔债）¶

有了谱分解，"投影到二阶锥"立刻有了和"投影到 PSD 锥"一模一样的公式——把负特征值截断为零。对标准锥 $\mathcal{Q}^n$： $$ \boxed{\;\mathrm{proj}{\mathcal{Q}^n}(\mathbf{x}) = [\lambda_1]+\,\mathbf{c}1 + [\lambda_2]+\,\mathbf{c}2,\qquad [\,t\,]+:=\max(t,0).\;} \tag{2.30} $$ （与对称矩阵投影到 PSD 锥的 $\mathrm{proj}(A)=\sum[\lambda_i]_+P_i$ 逐字对应。）把它展开成三种情形，就是工程代码里真正写的那段——这正是 §2.2 圆盘投影在三维的"完整版"，也修正了前面"两步法"的错误：

\[ \mathrm{proj}_{\mathcal{Q}^n}(x_0,\mathbf{x}_1)= \begin{cases} (x_0,\mathbf{x}_1), & \|\mathbf{x}_1\|\le x_0 \quad(\textbf{已在锥内：原样返回})\\[4pt] (0,\mathbf{0}), & \|\mathbf{x}_1\|\le -x_0 \quad(\textbf{在极锥/对偶负向：投到顶点})\\[4pt] \dfrac{x_0+\|\mathbf{x}_1\|}{2}\Bigl(1,\ \dfrac{\mathbf{x}_1}{\|\mathbf{x}_1\|}\Bigr), & |x_0|<\|\mathbf{x}_1\| \quad(\textbf{在锥侧面外：投到锥面}) \end{cases} \tag{2.31} \]

逐情形读懂——这三种情形恰好对应特征值的三种符号组合： - 情形一（$\lambda_1,\lambda_2\ge0$）：$\mathbf{x}$ 已在锥内，$[\lambda_i]_+=\lambda_i$，$(2.30)$ 还原成 $\mathbf{x}$ 自己。 - 情形二（$\lambda_1,\lambda_2\le0$，即 $x_0\le-\|\mathbf{x}_1\|$）：两个特征值都被截断为零，投到锥顶点 $\mathbf{0}$。几何上 $\mathbf{x}$ 落在**极锥**（polar cone $-\mathcal{Q}^n$）里。 - 情形三（$\lambda_2<0<\lambda_1$）：只有大特征值幸存，$\mathrm{proj}=\lambda_1\mathbf{c}_1=\frac{x_0+\|\mathbf{x}_1\|}{2}(1,\frac{\mathbf{x}_1}{\|\mathbf{x}_1\|})$，投到**锥面**上。注意系数 $\frac{x_0+\|\mathbf{x}_1\|}{2}$——它**同时**调整了法向（从 $x_0$ 变成 $\frac{x_0+\|\mathbf{x}_1\|}{2}>x_0$）和切向，正是前面"两步法"丢掉的耦合！法向被"撑胖"了 $\frac{\|\mathbf{x}_1\|-x_0}{2}$ 去够切向，这就是反面教材里说的"最优 $r_N$ 可能比 $z_0$ 更大"。

从标准锥 $\mathcal{Q}^n$ 到摩擦锥 $K_\mu$：摩擦锥不是标准锥（除非 $\mu=1$），但 §2.1 已证它是 SOC 的线性像（$t=\mu r_N$）。投影到 $K_\mu$ 需先做坐标变换 $(r_N,\mathbf{r}_T)\mapsto(\mu r_N,\mathbf{r}_T)$ 化为标准锥、投影、再变回——但因为这个变换不是正交的（缩放了法向），直接套 $(2.31)$ 会得到"加权投影"而非欧氏投影。这是一个极易被忽略的陷阱（见本节陷阱二）：$\mu\ne1$ 时，"欧氏投影到 $K_\mu$"要解一个关于缩放的小标量方程，不能简单套标准锥公式。实践中 Siconos 用变量变换把 $\mu$ 归一化到锥的度量里，正是为绕开这个非正交缩放。

本质洞察：$(2.31)$ 的情形三是整个二阶锥求解器的"灵魂公式"。它用一行算出了"锥面最近点"，而这一行的系数 $\frac{x_0+\|\mathbf{x}_1\|}{2}=\frac{\lambda_1}{2}\cdot 2\cdot\frac12$... 准确说就是 $[\lambda_1]_+$ 乘到幂等元 $\mathbf{c}_1$ 上。"投影 = 截断负特征值"这个在对称矩阵里学过的事实，原封不动搬到了二阶锥——这就是 Jordan 代数统一的全部威力：你不需要为锥重新发明投影，谱分解自动给你。§2.2 的圆盘投影 $\mathrm{proj}_{\mathbb{D}}(\mathbf{v})=\mu r_N\mathbf{v}/\max(\|\mathbf{v}\|,\mu r_N)$ 是 $(2.31)$ 在"$r_N$ 已固定"时的退化——固定 $r_N$ 就是冻结了 $\lambda$ 的法向部分，只剩切向截断。

理论三：锥投影的广义 Jacobian（还掉第二笔债）¶

§2.5 (2.27) 的半光滑 Newton 需要 $\mathrm{proj}_{\mathcal{Q}^n}$ 的广义 Jacobian。$(2.31)$ 是分段函数，在情形交界（锥面、极锥面）不可微，但**几乎处处可微**，可微处的 Jacobian 由谱分解直接给出。最有用的是**情形三（锥面外、可微区）** 的 Jacobian——求解器 $99\%$ 的时间在这个区里迭代。对 $\mathbf{x}=(x_0,\mathbf{x}_1)$、记 $\hat{\mathbf{x}}_1=\mathbf{x}_1/\|\mathbf{x}_1\|$、$r=\|\mathbf{x}_1\|$，可微处 $$ \nabla\,\mathrm{proj}{\mathcal{Q}^n}(\mathbf{x})=\frac12 \begin{bmatrix} 1 & \hat{\mathbf{x}}_1^\top\[4pt] \hat{\mathbf{x}}_1 & \bigl(1+\tfrac{x_0}{r}\bigr)I_1^\top \end{bmatrix}. \tag{2.32} $$ 这个矩阵**对称半正定**（投影到凸集的 Jacobian 必对称 PSD，是凸投影的一般性质），特征值在 } - \tfrac{x_0}{r}\hat{\mathbf{x}}_1\hat{\mathbf{x}$[0,1]$ 之间（投影是"非扩张"映射的微分体现）。它的结构一眼可读：左上角 $\frac12$ 是法向自身的灵敏度，右下角的 $I_{n-1}$ 项是切向的"各向同性伸缩"，$\hat{\mathbf{x}}_1\hat{\mathbf{x}}_1^\top$ 项是"沿当前切向方向的修正"——法向与切向通过非对角块 $\frac12\hat{\mathbf{x}}_1$ 耦合，这又是前面"两步法"丢掉的耦合，现在以 Jacobian 非对角块的形式显形。

在情形一（锥内）Jacobian 是单位阵 $I_n$（投影是恒等，微分自然是 $I$）；情形二（极锥）Jacobian 是零（投影到固定点，微分为零）。半光滑 Newton 在交界处从 Clarke 次微分 $\partial_C\mathrm{proj}$ 里任取一个元素即可——这是 §2.5 说的"广义 Jacobian"的具体形态，也是 §4 Alart-Curnier 公式里那个"分块对角 + 切换"结构的来源。

理论-工程桥接：把 $(2.31)$ 的投影和 $(2.32)$ 的 Jacobian 写进代码，就得到一个二阶锥的半光滑 Newton 求解器内核——这正是 Pinocchio 3 的 contact-solver 和 Siconos 的 FrictionContact3D 里跑的东西。每个接触点是一个 $3\times3$ 的 $(2.32)$ 块，$m$ 个接触组装成 $3m\times3m$ 的广义 Jacobian，配合 Delassus 算子 $N$（专题 1 + §2.5）做 Newton 迭代。理解了 $(2.31)$+$(2.32)$ 这两个公式，你就能从零写出一个研究级摩擦求解器的核心——剩下的只是线性代数的工程封装（稀疏、并行、线搜索）。

理论四：强半光滑与二次收敛（还掉第三笔债）¶

最后一笔债：为什么二阶锥的半光滑 Newton 能**二次收敛**，而不只是一般半光滑函数的超线性？答案是二阶锥投影 $\mathrm{proj}_{\mathcal{Q}^n}$（以及基于它的 Fischer–Burmeister 锥 C-函数）是**强半光滑（strongly semismooth）** 的。

回顾（专题 70）半光滑的层级：一个函数 $F$ 在 $\mathbf{x}$ 处 - 半光滑（semismooth）：方向导数存在且 $\|F(\mathbf{x}+\mathbf{d})-F(\mathbf{x})-V\mathbf{d}\|=o(\|\mathbf{d}\|)$（$V\in\partial_C F(\mathbf{x}+\mathbf{d})$）。配合非奇异性，半光滑 Newton 超线性**收敛。 - **强半光滑（strongly semismooth）：把 $o(\|\mathbf{d}\|)$ 加强为 $O(\|\mathbf{d}\|^2)$。配合非奇异性，半光滑 Newton **二次**收敛（与光滑 Newton 同阶！）。

Sun–Sun（2005, Math. Prog. 103:575–581）证明了**二阶锥与半正定锥的 Fischer–Burmeister C-函数处处强半光滑**。他们的证明用了一个漂亮的桥：把"非对称矩阵的奇异值分解（SVD）"与"对称矩阵的谱分解"联系起来——而二阶锥投影的不光滑恰好是 $\|\cdot\|$（在 $\mathbf{x}_1=\mathbf{0}$ 处）和 $[\cdot]_+$（在 $\lambda_i=0$ 处）的不光滑，这两个都是分片光滑（piecewise smooth）函数，自动强半光滑。

多视角理解（收敛阶的三个台阶，标边界）：求解 CCP 的迭代法按收敛阶分三个台阶—— - 线性（PGS、投影梯度）：误差 $e_{k+1}\le\rho\,e_k$（$\rho<1$），每步固定比例下降。 - 超线性（一般半光滑 Newton）：$e_{k+1}=o(e_k)$，越靠近解越快。 - 二次（强半光滑 Newton，本节）：$e_{k+1}\le C\,e_k^2$，误差位数翻倍式下降（$10^{-2}\to10^{-4}\to10^{-8}$）。 相似处：三者都是不动点/Newton 迭代。不像处：每步成本递增（PGS 一次投影，Newton 要解线性系统）。边界：二次收敛是**局部**性质（只在解附近成立），远离解时强半光滑 Newton 可能不收敛，需配全局化策略（线搜索、信赖域、或先用 PGS 暖启动再切 Newton）——这正是 Siconos 等求解器"PGS 暖启动 + Newton 精修"两段式策略的理论依据。

把三笔债结清：3D 锥投影闭式 $(2.31)$、广义 Jacobian $(2.32)$、强半光滑保二次收敛——它们全部从一个谱分解 $(2.29)$ 流出。这就是 §2.5"半光滑 Newton"那一行背后完整的代数机器。

⚠️ 常见陷阱¶

💡 概念误区一：把二阶锥投影拆成"法向截断 + 切向圆盘投影"两步 - 新手想法："投影到 $K_\mu$ 嘛，先 $r_N=\max(z_0,0)$，再切向投到半径 $\mu r_N$ 的圆盘，分开做。" - 现象/后果：求解器收敛到错误的接触力，且偏差小、不报错、不发散——表现为"仿真看着正常但接触力对不上真值"，做接触辨识/sim-to-real 时怎么都匹配不上。 - 根本原因：投影是 $(r_N,\|\mathbf{r}_T\|)$ 平面里的**整体**二维最近点问题，法向与切向最优值耦合（$(2.31)$ 情形三的系数 $\frac{x_0+\|\mathbf{x}_1\|}{2}$ 把法向撑胖去够切向）。两步法假设"法向先定"，丢掉这个耦合。 - 正确做法：用谱分解闭式 $(2.31)$ 三情形整体投影；$\mu\ne1$ 时还要处理非正交缩放（陷阱二）。

💡 概念误区二：$\mu\ne1$ 时直接套标准锥投影公式 $(2.31)$ - 新手想法："$(2.31)$ 是二阶锥投影公式，摩擦锥是二阶锥，直接代 $x_0=r_N$、$\mathbf{x}_1=\mathbf{r}_T$ 即可。" - 现象/后果：得到的"投影"不是欧氏最近点，而是某个加权范数下的最近点，在 $\mu$ 远离 1 时（如 $\mu=0.3$ 的低摩擦或 $\mu=2$ 的高摩擦）偏差显著。 - 根本原因：$(2.31)$ 是对**标准**锥 $\mathcal{Q}^n=\{\|\mathbf{x}_1\|\le x_0\}$ 的欧氏投影。摩擦锥 $K_\mu=\{\|\mathbf{r}_T\|\le\mu r_N\}$ 化到标准锥要做缩放 $t=\mu r_N$，这个缩放**非正交**，破坏了欧氏度量——投影在变换前后不等价。 - 正确做法：要么解一个关于锥面最近点的小标量方程（$\mu\ne1$ 时投影到旋转锥需求解一元方程，见 Fukushima–Luo–Tseng 的处理），要么像 Siconos 那样把 $\mu$ 吸进锥的度量做变量替换。$\mu=1$ 时（自对偶）才能直接套 $(2.31)$。

🧠 思维陷阱三：以为二阶锥有 $n$ 个特征值（类比 $n\times n$ 矩阵） - 新手想法："$\mathbb{R}^n$ 里的二阶锥，元素是 $n$ 维向量，应该有 $n$ 个特征值。" - 现象/后果：试图写"$n$ 项谱分解"，或在实现广义 Jacobian 时凭空多算特征值，代码维度对不上。 - 根本原因：二阶锥的 Jordan 代数**秩为 2**（自旋因子代数），无论环境维度 $n$ 多大，谱分解永远是 $(2.29)$ 的**两项**。这与 $n\times n$ 对称矩阵（秩 $n$、$n$ 个特征值）本质不同——别被"都叫谱分解"误导。 - 正确做法：记住 $\lambda_{1,2}=x_0\pm\|\mathbf{x}_1\|$ 只有两个；锥的"秩"由代数结构定（二阶锥永远是 2），不由向量维度定。

🧠 思维陷阱四：以为半光滑 Newton 一定二次收敛、随处可用 - 新手想法："Sun–Sun 证了强半光滑，那半光滑 Newton 就是二次收敛的，直接全程用它。" - 现象/后果：从远离解的初值启动，Newton 步乱跳、不收敛甚至发散，反而不如 PGS 稳。 - 根本原因：二次收敛是**局部**性质（解附近）。强半光滑 + 广义 Jacobian 非奇异只保证"足够近时二次收敛"，不保证全局收敛；远离解时广义 Jacobian 可能病态或方向错误。 - 正确做法：两段式——先 PGS/投影梯度暖启动（全局收敛但慢），进入解的邻域后切半光滑 Newton（局部二次收敛）；或加线搜索/信赖域全局化。这是 Siconos、Pinocchio 3 的标准工程做法。

练习¶

练习 2.6.1（推导题，⭐⭐⭐） 谱分解的三性质。对 $\mathbf{x}=(x_0,\mathbf{x}_1)$（$\mathbf{x}_1\ne\mathbf{0}$）的谱幂等元 $\mathbf{c}_{1,2}=\tfrac12(1,\pm\hat{\mathbf{x}}_1)$，用 Jordan 积 $(2.28)$ 验证：(a) 幂等 $\mathbf{c}_i\circ\mathbf{c}_i=\mathbf{c}_i$；(b) 完备 $\mathbf{c}_1+\mathbf{c}_2=\mathbf{e}$；(c) 重构 $\lambda_1\mathbf{c}_1+\lambda_2\mathbf{c}_2=\mathbf{x}$。（正交已在正文证，本题补其余三条。在草稿纸上完成。）

练习 2.6.2（推导题，⭐⭐⭐⭐） 锥投影闭式。给定 $\mathbf{x}=(1,\ 2,\ 0)\in\mathbb{R}^3$（即 $x_0=1$，$\mathbf{x}_1=(2,0)$），投影到标准锥 $\mathcal{Q}^3$。(a) 算特征值 $\lambda_{1,2}$，判断 $\mathbf{x}$ 落在三情形的哪一种。(b) 用 $(2.31)$ 算出 $\mathrm{proj}_{\mathcal{Q}^3}(\mathbf{x})$。(c) 验证耦合：投影后的法向分量是多少？它比原始 $x_0=1$ 大还是小？用这个数值说明为什么"两步法"（先 $r_N=\max(1,0)=1$ 再投切向）给出的法向是错的。

练习 2.6.3（跨章综合题，⭐⭐⭐⭐⭐，综合专题 70 + §2.2 + §2.5 + 本节） 从谱分解到求解器一步。单接触，$N=I_3$，$\mathbf{b}=(-0.3,\ 0.5,\ 0)^\top$，$\mu=1$（取 1 以便直接用标准锥公式）。(a) 写出 CCP 的投影方程不动点 $\mathbf{r}=\mathrm{proj}_{K_1}(\mathbf{r}-\rho(\mathbf{r}+\mathbf{b}))$。(b) 取 $\rho=1$、$\mathbf{r}^0=\mathbf{0}$，用 $(2.31)$ 手算一步投影梯度。(c) 写出该步落在 $(2.31)$ 哪个情形、对应的广义 Jacobian $(2.32)$ 取什么值。(d) 用一段话说明：这道题如何把专题 70 的"广义 Jacobian/半光滑"、§2.2 的"投影方程"、§2.5 的"CCP 凸松弛"、和本节的"谱分解闭式"四者串成一个二次收敛求解器的最小可运行例子。

§2.7 摩擦锥的可微化：从锥投影到可微接触梯度 ⭐⭐⭐⭐¶

过渡与动机：CCP 解出来了，但它的"导数"在哪？¶

§2.5–§2.6 解决了"给定接触配置，求接触力"这个**正向（forward）问题——CCP 有唯一解、可二次收敛求解。但现代机器人学越来越多地问一个**反向（backward）**问题：**接触力（以及接触后的状态）对系统参数（摩擦系数 $\mu$、接触点位置、控制输入、甚至神经网络权重）的导数是什么？一旦有了这个导数，就能：用梯度下降做轨迹优化穿过接触（contact-implicit trajectory optimization）、用反向传播训练带接触的策略（differentiable simulation for RL）、做接触参数的系统辨识（system identification）、求接触敏感度做鲁棒性分析。这就是 可微接触仿真（differentiable contact simulation）——本专题下游 [[40_可微接触仿真]] 的核心，本节为它铺数学地基。

问题的尖锐之处在于：§0 早就指出摩擦是**非光滑**的（粘↔滑切换处不可微）。那"对一个非光滑过程求导"听起来自相矛盾——导数在切换处根本不存在。本节要回答的正是：在哪些点可微？不可微处怎么办？工程上用什么救？ 这把全章的"非光滑"主题，从"求解器怎么处理"（§2.2–§2.6）推进到"梯度怎么处理"（本节），是理论闭环的最后一块。

反面：把仿真器当黑盒做数值差分，会得到"骗人的梯度"¶

最朴素的"求接触梯度"想法是：把仿真器当黑盒，用有限差分 $\frac{\partial \mathbf{r}}{\partial \mu}\approx\frac{\mathbf{r}(\mu+\delta)-\mathbf{r}(\mu)}{\delta}$。这在无接触的光滑动力学里没问题，但一碰到接触就**系统性地骗人**，分两种灾难：

灾难一（差分跨越切换 → 梯度爆炸或归零）：如果 $\mu+\delta$ 与 $\mu$ 恰好落在粘/滑切换的两侧，分子是两个本质不同状态的差，差分商会给出一个巨大且方向随机的"伪梯度"。反过来，如果整个 $[\mu,\mu+\delta]$ 都在粘滞区（接触力对 $\mu$ 不敏感，因为没到锥面），差分商是零——但真实敏感度未必为零。有限差分在非光滑点附近给出的梯度，要么爆炸要么归零，几乎从不正确。

灾难二（接触的"开关"性质 → 梯度信息缺失）：接触有"激活/不激活"的开关（Signorini 互补，专题 1）。物体刚好不接触时，接触力对"让它接触一点点"的参数变化梯度为零（因为还没接触），但这恰恰是优化最需要的信息（"该往哪个方向推才能建立接触"）。真实梯度在这里是零或不存在，但优化器需要一个"有用的方向"——这是可微接触最棘手的地方，§2.7 理论三的随机光滑正是为它而生。

对比性思维（不是 X 而是 Y）：可微接触要的**不是"数值上算出导数"，而是"得到一个能驱动优化的有用方向"**。这两者在光滑问题里等价，在非光滑接触里分道扬镳——真实导数可能为零或不存在（无用），而"有用方向"可能需要对真实导数做平滑/随机化才能得到。理解这个区别，才能理解为什么可微接触有"解析梯度（IFT）"和"随机梯度（randomized smoothing）"两条互补路线，而非一条。

历史：从可微优化层到接触梯度的两条路（2018–2024）¶

可微接触脱胎于两个源头的合流。一是 可微优化层（differentiable optimization layers）：Amos–Kolter 的 OptNet（2017）和后续 cvxpylayers（Agrawal et al. 2019）证明了"凸优化问题的解对其参数可微，导数由对 KKT 条件用隐函数定理得到"——这给了"对 CCP 求导"的通用机器。二是 可微物理引擎：从 Brax、Nimble（Werling et al. 2021）、Dojo（Howell et al. 2022）到 Le Lidec 等人在 Pinocchio 3 里的可微接触。

两条求梯度的路线随之成形：(1) 解析路线（隐函数定理 IFT）——对 CCP 的最优性条件（锥互补/KKT）用隐函数定理，得到解析的雅可比；(2) 随机光滑路线（randomized smoothing）——Suh–Pang–Tedrake（2022, IEEE RA-L，Bundled Gradients through Contact via Randomized Smoothing）发现，对接触动力学做随机扰动再平均（"梯度束 gradient bundle"），能得到比解析梯度**更利于优化**的平滑梯度，解释了为什么无梯度的 RL 在接触任务上反而常胜过解析可微仿真。Le Lidec 等人（2024, IEEE T-RO，Contact models in robotics: a comparative analysis）系统比较了各接触模型及其梯度，指出"正确的接触模型是物理有意义梯度的前提"。

历史的教训：可微接触不是"给仿真器加个 .backward()"那么简单。它是"凸优化的隐函数定理"与"非光滑动力学"的交叉地带——解析梯度数学上正确但优化上可能无用（梯度为零/刚性），随机梯度数学上是近似但优化上更有用。2022 年 Suh 等人的工作是认知转折点：它把"为什么无梯度方法在接触上常赢"这个长期困惑，用随机光滑理论解释清楚了。

理论一：隐函数定理对锥投影/CCP 求梯度（解析路线）¶

先讲解析路线，它最直接地复用了 §2.6 的谱分解机器。核心是 §2.2 的**投影方程不动点**——CCP 的解 $\mathbf{r}^\star$ 满足 $$ \mathbf{r}^\star = \mathrm{proj}{K\mu}\bigl(\mathbf{r}^\star - \rho\,(N\mathbf{r}^\star + \mathbf{b})\bigr) =: \mathrm{proj}{K\mu}(\mathbf{z}^\star),\qquad \mathbf{z}^\star=\mathbf{r}^\star-\rho(N\mathbf{r}^\star+\mathbf{b}). \tag{2.33} $$ 这是一个关于 $\mathbf{r}^\star$ 和参数 $\theta$（$\theta$ 可以是 $\mu,\mathbf{b},N$ 中任意一个，它们都依赖系统参数）的**隐方程** $\Psi(\mathbf{r}^\star,\theta)=\mathbf{r}^\star-\mathrm{proj}_{K_\mu}(\mathbf{z}^\star)=\mathbf{0}$。隐函数定理（implicit function theorem, IFT） 说：若 $\partial\Psi/\partial\mathbf{r}$ 在解处可逆，则解 $\mathbf{r}^\star(\theta)$ 局部可微，且 $$ \boxed{\;\frac{\partial\mathbf{r}^\star}{\partial\theta} = -\Bigl(\frac{\partial\Psi}{\partial\mathbf{r}}\Bigr)^{-1}\frac{\partial\Psi}{\partial\theta}.\;} \tag{2.34} $$ 把 $\Psi$ 的导数展开，记 $J:=\nabla\,\mathrm{proj}_{K_\mu}(\mathbf{z}^\star)$（正是 §2.6 的锥投影广义 Jacobian $(2.32)$！），链式法则给 $\frac{\partial\Psi}{\partial\mathbf{r}}=I-J\cdot(I-\rho N)$。于是 $$ \frac{\partial\mathbf{r}^\star}{\partial\theta} = \bigl[I-J(I-\rho N)\bigr]^{-1}\,J\,\rho\,\frac{\partial(N\mathbf{r}^\star+\mathbf{b})}{\partial\theta}\Big|_{\text{显式部分}}. \tag{2.35} $$ 关键认识：可微接触的解析梯度，"零件"就是 §2.6 的锥投影 Jacobian $J$。 一旦你有了 $(2.32)$，把它代进 $(2.34)$–$(2.35)$，对 $\mu$、对接触点、对控制输入的导数全部到手——这就是 §2.6 末说的"§2.6 是可微接触的代数地基"的兑现，也是 [[40_可微接触仿真]] 反向传播那一步的数学内核。

理论-工程桥接：cvxpylayers、OptNet、Dojo、Pinocchio 3 的可微接触，内部全在做 $(2.34)$——对最优性条件用隐函数定理。差别只在"用 KKT 还是用投影方程"、"投影 Jacobian 怎么算"。本节用投影方程 $(2.33)$ 是因为它最贴合 §2.2–§2.6 的脉络：投影方程的雅可比 = 锥投影 Jacobian + Delassus 算子的线性组合，全是前面学过的零件。理解 $(2.35)$，你读任何可微接触库的反向代码都不会迷路。

理论二：可微性在哪里成立、在哪里崩溃¶

IFT 有个前提——"$\partial\Psi/\partial\mathbf{r}$ 可逆"且 $\mathrm{proj}$ 在 $\mathbf{z}^\star$ 处可微。这两个前提恰好对应 §2.6 锥投影的三情形： - 锥内部（粘滞，情形一）：$J=I$，投影是恒等，$(2.35)$ 良定。梯度存在且光滑。 - 锥外部（投到锥面，情形三）：$J$ 是 $(2.32)$ 那个 PSD 矩阵，$\mathrm{proj}$ 可微，$(2.35)$ 良定。梯度存在。 - 锥面/顶点（粘↔滑切换，情形交界）：$\mathrm{proj}$ 不可微（$(2.31)$ 的分段交界），$J$ 只能取 Clarke 次微分里的一个元素，$(2.35)$ 给出的是"次梯度（subgradient）"而非真梯度。这正是 §0 非光滑性的精确显形——粘滑切换面就是可微性崩溃的那条线。

所以解析梯度的图景是：几乎处处可微（在粘滞区和确定滑动区），但在粘滑切换的测度零集合上不可微。工程上常用 §2.6 的 Clarke 次微分元素当"梯度"硬推过去——多数时候有效，但在切换面附近梯度会突变（不连续跳变），导致基于梯度的优化在接触切换处震荡。

本质洞察（与 §0 四重病态闭环）：可微接触的"梯度崩溃点"，与 §0 说的"非光滑切换点"、§2.2 说的"目标函数变平的粘滞点"、§2.6 说的"锥投影分段交界"，是同一条线在四个层面的显影。非光滑性不是某一层的麻烦，它从物理（粘滑切换）一路贯穿到几何（锥面）、变分（目标变平）、代数（投影分段）、再到微分（梯度崩溃）。全章从头到尾都在和这一条"切换线"打交道——只是每一节用不同的语言描述它。 这是本章最深的统一：摩擦的全部难点，都是"那条粘滑切换线"在不同数学结构里的投影。

理论三：随机光滑——把"崩溃的梯度"救成"有用的方向"¶

解析梯度在切换面崩溃，且在粘滞区为零（接触力对参数不敏感）——这对优化是致命的（优化器拿不到"该往哪走"的信息）。随机光滑（randomized smoothing） 是绕过它的关键思路：不求真梯度，而求一个**平滑化函数**的梯度。

定义平滑化的接触力：对参数 $\theta$ 加随机扰动 $\boldsymbol{\xi}\sim\mathcal{N}(0,\sigma^2I)$ 后取期望， $$ \bar{\mathbf{r}}\sigma(\theta) := \mathbb{E})\bigr]. \tag{2.36} $$ 即使 }}\bigl[\mathbf{r}^\star(\theta+\boldsymbol{\xi$\mathbf{r}^\star(\cdot)$ 非光滑，期望 $\bar{\mathbf{r}}_\sigma$ 一定光滑（高斯卷积是无穷可微的——卷积把不可微"抹平"）。它的梯度有一个无需求 $\mathbf{r}^\star$ 导数的估计（"零阶梯度"，likelihood-ratio / REINFORCE 形式）： $$ \nabla_\theta\bar{\mathbf{r}}\sigma(\theta) = \mathbb{E}. \tag{2.37} $$ }}\Bigl[\mathbf{r}^\star(\theta+\boldsymbol{\xi})\,\frac{\boldsymbol{\xi}}{\sigma^2}\Bigr] \approx \frac{1}{K}\sum_{i=1}^{K}\mathbf{r}^\star(\theta+\boldsymbol{\xi}_i)\frac{\boldsymbol{\xi}_i}{\sigma^2它只需对 $\mathbf{r}^\star$ 做 $K$ 次采样（每次跑一遍正向求解器），不需要 $\mathbf{r}^\star$ 的导数——这就是 Suh–Pang–Tedrake 的"梯度束（gradient bundle）"。它在切换面附近不崩溃（因为期望抹平了切换），在"刚好不接触"处也能给出非零方向（因为部分采样落入接触区，反馈了"往这个方向能建立接触"）。这定量解释了 §2.7 反面里的灾难二，也解释了为什么无梯度的 RL（本质在做类似采样）在接触任务上常胜过解析可微仿真。

多视角理解（解析梯度 vs 随机梯度，标边界）： - 解析（IFT，理论一）：精确（在可微处）、便宜（一次反向）、但在切换面崩溃、粘滞区为零。 - 随机（光滑，理论三）：是近似（带偏差 $O(\sigma)$ 和方差 $O(1/K)$）、贵（$K$ 次正向）、但处处光滑、切换面与非接触处都给有用方向。 相似处：都给优化器一个"下降方向"。不像处：解析梯度是"真梯度"，随机梯度是"平滑代理梯度"；$\sigma\to0$ 时随机梯度的期望趋于解析梯度（在可微处）。边界：不要把随机梯度当"更好的真梯度"——它是**不同函数（平滑化 $\bar{\mathbf{r}}_\sigma$）的真梯度**。$\sigma$ 是关键旋钮：太小则恢复解析梯度的崩溃，太大则过度平滑、丢失接触的真实结构。选 $\sigma$ 是可微接触的核心调参，类比 §2.1 正则化的 $\varepsilon$、§2.5 的步长 $h$——又一个精度-平滑权衡。

理论四：与 [[40_可微接触仿真]] 的桥接¶

把本节嵌进下游专题 4 的全景。可微接触仿真要算的是整条轨迹对参数的梯度 $\frac{\partial \mathbf{q}_{T}}{\partial\theta}$（终态对参数），它由每一步接触求解的梯度 $\frac{\partial\mathbf{r}^\star_t}{\partial\theta}$ 沿时间反向传播链式串起来。本节给的 $(2.35)$ 是**单步**接触梯度，专题 4 把它沿时间步展开成完整的伴随（adjoint）递推。两节的分工是： - 本节（§2.7）：单个接触求解 $\mathbf{r}^\star$ 对参数 $\theta$ 的梯度——IFT $(2.34)$ + 锥投影 Jacobian $(2.32)$，或随机光滑 $(2.37)$。 - 专题 4：把单步梯度沿轨迹反向传播（伴随法/反向模式自动微分），处理多步累积、接触序列变化、长时程梯度消失/爆炸。

理论-工程桥接：当你在专题 4 看到"接触雅可比的反向传播"，回到本节就知道那个雅可比的核心零件是 §2.6 的锥投影 Jacobian $(2.32)$，通过 IFT $(2.35)$ 组装。§2.1 几何 → §2.2 变分 → §2.5 凸松弛 → §2.6 代数 → §2.7 可微，是一条完整的下沉链：每一层都为下一层提供零件，最终在可微接触里全部组装。 这就是为什么本章值得读到这里——它不是孤立的"摩擦理论"，而是可微接触、CI-MPC 等下游一切技术的零件库。

⚠️ 常见陷阱¶

🧠 思维陷阱一：用黑盒有限差分求接触梯度 - 新手想法："求 $\partial\mathbf{r}/\partial\mu$ 嘛，扰动 $\mu$ 一点点，差分一下就行。" - 现象/后果：梯度要么爆炸（差分步跨越粘滑切换，分子是两个不同状态之差）、要么归零（差分步全在粘滞区，对 $\mu$ 不敏感），优化器被错误方向带跑或原地不动。 - 根本原因：接触非光滑（§0），有限差分在切换面附近无意义；且接触有"激活开关"，不接触处真梯度为零但优化需要非零方向。 - 正确做法：可微处用 IFT 解析梯度 $(2.34)$（复用 §2.6 锥投影 Jacobian）；切换面附近或需"建立接触"的方向用随机光滑 $(2.37)$。绝不裸用黑盒有限差分。

💡 概念误区二：以为解析梯度（IFT）总是"正确且够用" - 新手想法："IFT 给的是精确导数，那它一定比随机近似好，全程用解析梯度。" - 现象/后果：在接触切换密集的任务（如抓取、装配、步态切换）里，解析梯度在切换处不连续跳变，优化震荡、不收敛；在"还没接触"的初始阶段梯度为零，优化卡死。 - 根本原因：解析梯度数学正确但优化上可能无用——切换面不可微（次梯度跳变）、粘滞/非接触区梯度为零（无下降信息）。"正确的导数" $\ne$ "有用的方向"。 - 正确做法：接触切换密集或需探索接触的任务，用随机光滑 $(2.37)$ 得平滑代理梯度；接触稳定的精修阶段再用解析梯度。两者互补，按任务相位切换（这也是 Suh 等人 2022 的核心结论）。

💡 概念误区三：把随机光滑梯度当成"带噪声的真梯度" - 新手想法："随机光滑就是真梯度加了点采样噪声，采样够多就收敛到真梯度。" - 现象/后果：把 $\sigma$ 调到极小想"逼近真梯度"，结果恢复了解析梯度的崩溃（切换处又开始跳变）；或误判 $K\to\infty$ 能消除偏差。 - 根本原因：随机光滑梯度 $(2.37)$ 是**平滑化函数 $\bar{\mathbf{r}}_\sigma$（不同的函数）的真梯度**，不是原函数真梯度加噪声。$K\to\infty$ 只消方差不消 $\sigma$ 引入的偏差；$\sigma\to0$ 才趋于原函数梯度（但同时丢掉平滑的好处）。 - 正确做法：把 $\sigma$ 当独立的"平滑尺度"超参（类比正则化 $\varepsilon$、步长 $h$）来调——大到能跨越接触切换、小到不抹掉真实接触结构，按任务调出权衡点。

练习¶

练习 2.7.1（推导题，⭐⭐⭐⭐） IFT 接触梯度。从投影方程 $(2.33)$ 出发，设 $\theta=\mathbf{b}$（自由速度项），推导 $\frac{\partial\mathbf{r}^\star}{\partial\mathbf{b}}$ 的显式表达。(a) 写出隐方程 $\Psi(\mathbf{r}^\star,\mathbf{b})=\mathbf{0}$。(b) 算 $\partial\Psi/\partial\mathbf{r}$ 和 $\partial\Psi/\partial\mathbf{b}$（用锥投影 Jacobian $J$）。(c) 代入 IFT $(2.34)$ 得 $\frac{\partial\mathbf{r}^\star}{\partial\mathbf{b}}$。(d) 当接触处于粘滞（$J=I$）时这个梯度化简成什么？物理上解释。（在草稿纸上完成。）

练习 2.7.2（开放思考题，⭐⭐⭐⭐） 梯度何时崩溃。考虑一个物块在斜面上，摩擦系数 $\mu$ 恰好等于斜面正切（临界打滑）。(a) 此时接触在粘滑切换面上，论证为什么 $\frac{\partial\mathbf{r}^\star}{\partial\mu}$ 的解析梯度不连续。(b) 若用随机光滑 $(2.37)$ 加扰动 $\sigma$，定性说明得到的平滑梯度长什么样、为什么对优化更友好。(c) 把这与 §2.1 理论五的正则化摩擦 $(2.9)$ 对比——正则化的 $\varepsilon$ 和随机光滑的 $\sigma$ 在"用平滑换可微"这件事上有何异同？

练习 2.7.3（跨章综合题，⭐⭐⭐⭐⭐，综合 §2.5 + §2.6 + 本节 + 下游专题 4） 单步可微接触的"全栈"。沿用 §11 综合算例的设定（$M=\mathrm{diag}(2,2,2)$、$D=I_3$、$\mu=0.5$、$\mathbf{b}=(-0.1,0.4,0)^\top$）。(a) 假设已解出 $\mathbf{r}^\star$ 且接触在滑动（落在 $(2.31)$ 情形三），写出该处的锥投影 Jacobian $(2.32)$。(b) 用 IFT $(2.35)$ 写出 $\frac{\partial\mathbf{r}^\star}{\partial\mu}$ 的表达式（符号即可，不必算到底）。(c) 说明这个单步梯度如何成为专题 4 沿轨迹反向传播的"一节"。(d) 用一段话总结：从 §2.1 的锥几何，到 §2.6 的谱分解 Jacobian，再到本节的 IFT，这条"零件链"是怎样最终组装成一个可微接触仿真器的？

§3 极限面与操作力学：从"接触点"抬到"整体滑动响应" ⭐⭐⭐¶

过渡与动机：一个手指压在桌面上转，摩擦怎么算？¶

§2 全程在讲**单个接触点**的摩擦——法向力、切向力、滑动速度都是"点"的量。但真实操作里，物体与环境往往沿**一片接触面（patch）接触：一根手指的指腹压在桌面上、一个箱子的底面贴着地面。这时"接触"不是一个点，而是一片分布的压强场，物体可以**平移滑动**也可以**绕法向轴自转（spin）。问题来了：分布在整片面上的无数个 Coulomb 接触点，合起来对物体施加的**合摩擦力 + 合摩擦力矩**，遵循什么规律？这就是 §3 要讲的**极限面（limit surface）**理论——把 §2 的"点摩擦"积分上升为"面摩擦"，是抓取（grasping）与平面操作（planar manipulation）的核心工具。

这一节让本章从"接触力学的微观（点）"自然过渡到"操作力学的宏观（面/物体）"，也对接下游 05 足式 §80 接触力学与抓取的 force closure。

历史：Goyal–Ruina–Papadopoulos 的极限面（1991）¶

1991 年 Suresh Goyal、Andy Ruina、John Papadopoulos 在两篇 Wear 论文里提出**极限面**概念。他们问：给定一片接触面的压强分布，把"物体能承受的所有 (合力 $\mathbf{f}$, 合力矩 $\tau$) 组合的边界"画在 $(\mathbf{f}, \tau)$ 空间里，是个什么形状的曲面？答案是一个**凸的、关于原点中心对称的闭曲面**——极限面。它是 §2.2 最大耗散原理在"面"尺度的兑现：物体的滑动 twist（平移+自转的组合速度）方向，恰是极限面在当前 (力,力矩) 点处的**外法向**（这正是 §2.3 讲的关联流动结构在极限面上的体现——极限面层面摩擦是关联的）。

理论一：极限面的定义与法向流动法则¶

设接触面上压强分布为 $p(\mathbf{x})\ge0$（$\mathbf{x}$ 遍历接触面），局部 Coulomb 系数 $\mu$。物体做平面运动，其瞬时运动可用一个**旋转中心（Center of Rotation, COR）** 描述。对每个 COR，积分整片面上的 Coulomb 摩擦得到合力旋量 $\mathbf{w}=(\mathbf{f}, \tau)\in\mathbb{R}^3$（平面情形：2 维力 + 1 维绕法向力矩）。当物体**滑动**（任意非零 twist）时，合力旋量落在一个固定曲面上： $$ \text{极限面}\quad \mathcal{L} = \bigl{\,(\mathbf{f}, \tau) \text{由某个滑动 twist 产生}\,\bigr}. \tag{3.1} $$ 法向流动法则（最大耗散在面尺度）：物体的滑动 twist $\mathbf{t}=(\mathbf{v},\omega)$ 是极限面 $\mathcal{L}$ 在合力旋量点 $\mathbf{w}$ 处的外法向： $$ \mathbf{t} \parallel \nabla_{\mathbf{w}}\,(\text{极限面方程}). \tag{3.2} $$ 这是 §2.2 MDP 的"宏观版"——单点的"速度垂直于摩擦圆盘边界"升级成"twist 垂直于极限面"。

理论二：极限面的椭球近似与各向同性¶

精确极限面形状依赖压强分布 $p(\mathbf{x})$，一般无闭式。工程上最常用的近似是**椭球（ellipsoidal）极限面**： $$ \Bigl(\frac{f_x}{f_{\max}}\Bigr)^2 + \Bigl(\frac{f_y}{f_{\max}}\Bigr)^2 + \Bigl(\frac{\tau}{\tau_{\max}}\Bigr)^2 = 1, \tag{3.3} $$ 其中 $f_{\max}=\mu\,W$（$W$ 是总法向载荷）是纯平移时的最大摩擦力，$\tau_{\max}=\mu\,W\,r_g$（$r_g$ 是压强分布的"摩擦回转半径"）是纯自转时的最大摩擦力矩。椭球近似把"力-力矩耦合"几何化——它解释了一个反直觉的操作现象：物体一边平移一边自转时，能用的平移摩擦力会减小（因为合旋量要落在椭球上，力矩"吃掉"了一部分力的预算）。这就是为什么"推着箱子同时转它"比"纯推"更容易让箱子滑脱。

本质洞察：极限面把"摩擦力有上界 $\mu r_N$"这件标量的事，升级成了"力-力矩联合有界"这件几何的事。单点摩擦的可行集是个圆盘（§2.1），整面摩擦的可行集是个三维椭球（$(3.3)$）。维度升高，但"凸+最大耗散=外法向流动"的结构原样保留——这是 §2 变分框架的普适性的最好证明：无论点还是面，Coulomb 摩擦永远是"凸集上的最大耗散"。

算例：圆盘接触的极限面与"推+转"耦合¶

把椭球极限面用具体数字走一遍，体会"自转吃掉平移摩擦预算"。设一个半径 $a$、均匀压强分布的圆盘形脚底，总法向载荷 $W$、摩擦系数 $\mu$。

纯平移最大力：$f_{\max}=\mu W$（整片均匀滑动，每点摩擦力同向叠加）。

纯自转最大力矩：均匀圆盘绕中心自转时，半径 $\rho$ 处的环带摩擦力矩为 $\mu\,p\,(2\pi\rho\,d\rho)\cdot\rho$（$p=W/(\pi a^2)$ 是压强）。积分： $$ \tau_{\max}=\int_0^a \mu\frac{W}{\pi a^2}2\pi\rho^2\,d\rho=\frac{2\mu W}{a^2}\int_0^a\rho^2 d\rho=\frac{2\mu W}{a^2}\cdot\frac{a^3}{3}=\frac{2}{3}\mu W a. $$ 所以圆盘的"摩擦回转半径" $r_g=\tau_{\max}/(\mu W)=\frac23 a$。椭球极限面 $(3.3)$ 为 $(f_x/\mu W)^2+(f_y/\mu W)^2+(\tau/(\tfrac23\mu Wa))^2=1$。

推+转耦合：现在脚底同时平移（沿 $+x$）和自转（角速度 $\omega$）。由法向流动法则，合力旋量落在椭球上。若自转用掉了一半的力矩预算（$\tau=\tfrac12\tau_{\max}$），代入椭球方程：$(f_x/\mu W)^2+0+(1/2)^2=1\Rightarrow f_x=\mu W\sqrt{1-1/4}=\tfrac{\sqrt3}{2}\mu W\approx0.87\,\mu W$。平移摩擦力从 $\mu W$ 掉到了 $0.87\mu W$——自转用掉 $50\%$ 力矩预算，平移力只剩 $87\%$。若自转用满力矩预算（$\tau=\tau_{\max}$），平移力 $f_x=0$——纯自转时完全没有平移摩擦力。

这就定量解释了那个反直觉的操作现象："边推边转"比"纯推"更容易让物体滑脱，因为自转分走了一部分摩擦预算，留给"阻止平移滑动"的摩擦就少了。机器人推箱子、拨零件的操作规划必须考虑这个耦合——这是 §3 极限面相对 §2.1 单点摩擦的核心增量。

理论三：force closure（力闭合）判据与摩擦锥¶

抓取理论的核心问题是 force closure（力闭合）：一组指尖接触能否抵抗**任意方向**的外部扰动旋量？答案直接建立在 §2.1 的摩擦锥上。

设 $n$ 个指尖接触，第 $i$ 个接触力 $\mathbf{r}_i$ 必须落在各自摩擦锥 $K_{\mu_i}$ 内。每个接触力对物体产生一个旋量 $\mathbf{w}_i=G_i\mathbf{r}_i$（$G_i$ 是抓取矩阵 grasp map）。force closure 的判据是：

force closure 充要条件：所有指尖摩擦锥经抓取映射后张成的旋量集合的**凸包覆盖整个旋量空间的原点的一个邻域**——等价地，$\mathbf{0}$ 在 $\{G_i K_{\mu_i}\}$ 的凸包**内部**（不只是边界）。

直觉：能抵抗任意外扰 ⟺ 接触能产生任意方向的合旋量来抵消它 ⟺ 摩擦锥（经映射）的"正张成（positive span）"填满整个空间。这把 §2.1 的"$\mathbf{r}\in\mathrm{int}\,K_\mu$"（单接触不滑）和"凸锥的正张成"（多接触闭合）连成一气。

理论-工程桥接：抓取规划软件（如 GraspIt!、Dexterous 抓取库）计算 force closure 时，正是把每个接触的摩擦锥用 §2.4 的多面体（$k=4$ 或 $8$）近似，然后检查这些多面体生成元的凸包是否包含原点、并求"最大可抵抗扰动"作为抓取质量度量（$Q_1$ 度量 = 凸包到原点的最小距离）。摩擦系数 $\mu$ 越大、锥越胖，凸包越容易包含原点 —— 这就是为什么高 $\mu$ 材料（硅胶指尖）更易实现稳定抓取。§2.1 陷阱二（$\mu$ 可大于 1）在这里有直接工程意义：选高 $\mu$ 指尖能用更少的指、更小的夹持力抓稳。

算例：两指夹持平面物体的最小摩擦系数¶

把 force closure 落到最简单的具体例子——两根手指从左右两侧夹一块平面方块（接触法向相对、沿 $x$ 轴）。这是抓取里的"hello world"，但能讲清楚摩擦锥与闭合的关系。

设两接触点在物体左右两面中心，接触法向沿 $\pm x$，摩擦系数 $\mu$。每个接触力 $\mathbf{r}_i$ 落在以法向为轴、半顶角 $\arctan\mu$ 的摩擦锥内。问：要抵抗一个**沿 $+y$（切向）的外部扰动力** $f_d$，需要多大的 $\mu$？

分析：每个指能提供的切向力上限是 $\mu N$（$N$ 是夹持法向力）。两指合起来沿 $y$ 的最大摩擦力是 $2\mu N$（两指切向力同向叠加）。要抵抗 $f_d$，需 $2\mu N\ge f_d$，即 $\mu\ge f_d/(2N)$。夹得越紧（$N$ 大）、$\mu$ 越大，越能抵抗切向扰动。

但 force closure 要抵抗任意方向扰动，不只 $+y$。 关键的难方向是**绕物体中心的力矩扰动** $\tau_d$。两指接触点若都在过中心的同一条水平线上（共线），它们的切向力对中心的力矩臂相同、方向相反，能提供一个绕中心的合力矩——可以抵抗 $\tau_d$。但若两指接触点重合于中心（无力矩臂），就抵抗不了任何力矩，非 force closure。所以两指夹持闭合的条件是：(1) 每点 $\mu$ 足够大让切向力能产生抵抗力（局部，§2.1），(2) 两接触点不重合、有力矩臂（全局，几何）。

最小 $\mu$ 的几何判据：两指 force closure 当且仅当两个摩擦锥（沿相对法向）的"对顶"使它们的负向有重叠——即连接两接触点的直线落在**两个摩擦锥内**。几何上，这要求摩擦锥半顶角 $\arctan\mu\ge$ 接触线与法向的夹角。对正对夹持（接触线沿法向），夹角为 0，任意 $\mu>0$ 都闭合（理想情况）；对偏斜接触，需要更大的 $\mu$。

本质洞察：两指 force closure 的几何判据"连接两接触点的线落在两摩擦锥内"，是 §2.1 摩擦锥与 §3 全局闭合的完美结合——局部的"力在锥内"和全局的"几何配置"必须同时满足。这解释了为什么人抓滑的玻璃杯（低 $\mu$）要么夹得很紧（增大有效摩擦力）、要么用更多手指（增加锥的覆盖）、要么找有棱角的地方抓（制造非摩擦的几何约束）——三种策略分别对应增大 $N$、增加锥数、改几何配置。

⚠️ 常见陷阱¶

💡 概念误区一：以为极限面是"摩擦力的上界曲面"而忽略力矩维度 - 新手想法："极限面就是合力 $\|\mathbf{f}\|\le\mu W$ 画出来的圆。" - 实际上：极限面在 (力, 力矩) 联合空间，是三维椭球 $(3.3)$，不是力空间的二维圆。忽略 $\tau$ 维度，就看不到"自转吃掉平移摩擦预算"这个关键耦合，无法解释"推+转更易滑脱"。 - 为什么重要：平面操作（推箱子、拨零件）的规划必须考虑力-力矩耦合，否则会高估纯平移之外的摩擦能力。 - 自检：物体纯自转时，平移摩擦力 $f$ 还剩多少？由 $(3.3)$，$\tau=\tau_{\max}$ 时 $f=0$——自转耗尽全部摩擦预算。

🧠 思维陷阱二：把单点不滑（$\mathbf{r}\in\mathrm{int}\,K_\mu$）等同于抓取稳定（force closure） - 新手想法："每个手指都不打滑，抓取就稳了。" - 实际上：单点不滑是**局部**条件，force closure 是**全局**条件——要求合起来能抵抗**任意**外扰。两个手指都不打滑，但若它们的摩擦锥张不满旋量空间（如两指共线、无法抵抗绕公共轴的力矩），抓取仍不闭合，一推就掉。 - 正确思维：抓取稳定 = 每点在锥内（局部，§2.1）+ 锥的正张成含原点邻域（全局，force closure）。两者缺一不可。 - 自检：两根手指捏一支笔的两端（共线接触），各自不打滑，但能抵抗"绕笔轴旋转"的力矩吗？不能——非 force closure。

练习¶

练习 3.1（推导题，⭐⭐⭐） 椭球极限面的耦合。从 $(3.3)$ 出发，设 $f_{\max}=\mu W$、$\tau_{\max}=\mu W r_g$。(a) 物体以 twist $(\mathbf{v},\omega)$ 滑动，用法向流动法则 $(3.2)$ 求合力旋量 $(\mathbf{f},\tau)$ 与 twist 的关系。(b) 证明：当 $\omega\ne0$（有自转）时，可用平移摩擦力 $\|\mathbf{f}\|<\mu W$ 严格小于纯平移值。(c) 给出"平移+自转"下有效平移摩擦系数随自转率衰减的显式公式。

练习 3.2（开放思考题，⭐⭐⭐⭐，综合 §2.1 + §3 + 05 足式抓取） force closure 与摩擦锥的关系。(a) 用 §2.1 摩擦锥，论证"两指平行夹持平面物体"实现 force closure 的最小摩擦系数条件。(b) 三指抓球时，指尖位置如何分布能让所需 $\mu$ 最小？(c) 把 §2.4 的多面体近似引入 force closure 判据，讨论 $k=4$ 的各向异性会如何影响"抓取质量度量 $Q_1$"——是高估还是低估抓取鲁棒性？

§4 进阶专题：测度微分包含、各向异性、黏附与 Alart-Curnier ⭐⭐⭐⭐¶

本节为研究级补充，主线读者（写 MPC/WBC/读仿真器）可按兴趣选读。它把 §2 的经典 Coulomb 律向四个方向推广，对应当前接触力学研究的活跃前沿。

进阶一：测度微分包含（Measure Differential Inclusion, MDI）¶

§2 的 Coulomb 律是"光滑时间"上的，但接触动力学里速度会在碰撞瞬间**跳变**（不连续）——经典微分方程 $\dot{\mathbf{v}}=\cdots$ 在跳变处无定义。Moreau 用**测度微分包含**解决：把加速度 $\dot{\mathbf{v}}$ 换成速度的**微分测度（differential measure）** $d\mathbf{v}$（一个可含 Dirac 原子的测度），动力学写成 $$ M\,d\mathbf{v} = \mathbf{f}\,dt + D\,d\mathbf{r},\qquad -d\mathbf{u} \in N_{K_\mu}(d\mathbf{r}) (\text{测度意义}), \tag{4.1} $$ 其中 $d\mathbf{r}$ 是接触**冲量测度**（含碰撞瞬间的原子部分）。这让"光滑滑动"（$dt$ 部分）与"瞬时碰撞冲量"（原子部分）统一在一个框架里。MDI 是专题 3（Moreau 时步法）的严格数学基础——时步法离散的正是 $(4.1)$。本章 §2.5 的 CCP $(2.25)$ 用的"冲量 $\mathbf{r}$"而非"力"，正是因为它隐含在 MDI 框架里（冲量 = 力对时间的测度积分）。

进阶二：各向异性摩擦与 Matchstick 模型¶

§2.1 练习 2.1.2 已预告：某些表面（拉丝金属、毛发、织物）沿不同方向 $\mu$ 不同（$\mu_x\ne\mu_y$），摩擦锥变成**椭圆锥（elliptic cone）。Andrews 等的 **Matchstick 模型（CGF 2019） 进一步处理"火柴杆"式强各向异性（沿杆易滑、垂直杆难滑），其摩擦锥截面是高偏心率椭圆。椭圆锥仍是 SOC 的**线性像**（经对角缩放化为标准 Lorentz 锥），所以 §2 的全部理论（MDP、对偶、de Saxcé）经一个线性变换都能推广——这是"二阶锥"这个抽象层级威力的又一体现：换了物理细节，数学骨架不变。

进阶三：黏附（adhesion）与可拉力接触¶

§2.1 约定 $r_N\ge0$（只能推不能拉）。但壁虎脚、胶带、微观范德华力能提供**法向拉力**（$r_N$ 可负）。此时摩擦锥不再以原点为顶点，而是平移到 $r_N\ge -r_{\text{adh}}$（$r_{\text{adh}}$ 是最大黏附力）——锥被"下移"成一个截顶锥或带负法向偏置的锥。这破坏了 §2.1 的"锥过原点 ⟹ 正齐次 ⟹ 可缩放"性质，需要专门处理（JKR、DMT 黏附接触模型）。机器人爬壁、微操作里这是核心。

进阶四：Alart-Curnier 公式与半光滑 Newton 的具体形式¶

§2.5 提到半光滑 Newton 用 C-函数把锥互补写成方程。Alart–Curnier 公式（1991） 是其中最经典、最常被实现的一个——它把 Signorini+Coulomb 合并成一个单一的**增广（augmented）** 投影方程： $$ \mathbf{R}(\mathbf{r}) = \mathbf{r} - \mathrm{proj}{K\mu}\bigl(\mathbf{r} - \rho\,\mathbf{u}(\mathbf{r})\bigr) = \mathbf{0}, \tag{4.2} $$ 法向用"投影到 $[0,\infty)$"、切向用"投影到圆盘 $\mathbb{D}_{\mu r_N}$"（两者组合成投影到 $K_\mu$）。$(4.2)$ 处处连续、半光滑，其广义 Jacobian 分块清晰（粘滞块、滑动块、分离块各有显式形式），是 Siconos、Pinocchio 3 等求解器的核心方程。它是 §2.2 法锥形式 $(2.14)$ 的"可计算化身"——把"$-\mathbf{u}\in N_K(\mathbf{r})$"这个集值包含，等价改写成"$\mathbf{r}=\mathrm{proj}_K(\mathbf{r}-\rho\mathbf{u})$"这个单值方程，从而可用 Newton 求解。

本质洞察：从 §2.2 的法锥包含 $(2.14)$，到 §2.5 的 CCP $(2.25)$，再到本节的 Alart-Curnier 方程 $(4.2)$，是**同一个 Coulomb 律的三次"语言转写"**——集值包含（理论最简）→ 锥互补（连接 LCP 生态）→ 投影方程（可用 Newton）。每次转写都不改变物理，只为对接不同的数学工具。这再次印证 §2.1 的元教训：理论的进展常常是"换语言"而非"换物理"。

⚠️ 常见陷阱¶

💡 概念误区：以为各向异性/黏附摩擦需要全新理论 - 新手想法："椭圆锥、带黏附的锥，§2 的圆锥理论都用不了，得重学。" - 实际上：椭圆锥经线性变换就是标准 Lorentz 锥，§2 全部理论直接适用；黏附锥只是把顶点平移，正齐次性失而其余结构在。二阶锥这个抽象层级的价值，就是让这些"看似不同"的摩擦律共享同一套 MDP/对偶/de Saxcé 机制。 需要重学的不是理论，是参数化。 - 为什么重要：避免在遇到各向异性/黏附时推倒重来，浪费精力。 - 自检：椭圆锥的对偶锥是什么？答：把缩放取逆的椭圆锥——和 §2.1 的 $K_\mu^*=K_{1/\mu}$ 结构平行。

🧠 思维陷阱：把 Alart-Curnier 投影方程当成"近似" - 新手想法："$(4.2)$ 用投影把互补'近似'成方程，是不是损失了精度？" - 实际上：$(4.2)$ 是锥互补的**精确等价**改写（对任意 $\rho>0$ 成立），不是近似。它只是把集值包含换成单值方程，物理内容完全一致。损失的不是精度，是"光滑性"（方程半光滑、不处处可微）——但这正是 Coulomb 律的本质（§0 坏性质一），不是改写引入的。 - 正确思维：投影方程 $\Leftrightarrow$ 法锥包含 $\Leftrightarrow$ 互补，三者数学等价，选哪个看求解器。 - 自检：能证明"$\mathbf{r}=\mathrm{proj}_K(\mathbf{r}-\rho\mathbf{u})\Leftrightarrow -\mathbf{u}\in N_K(\mathbf{r})$"（投影的变分刻画，前置自测第 3 题），就懂了它是精确等价。

练习¶

练习 4.1（推导题，⭐⭐⭐⭐） 椭圆锥的完整推广。设各向异性摩擦 $\mu_x\ne\mu_y$。(a) 写出椭圆摩擦锥的集合形式。(b) 给出把它化为标准 Lorentz 锥的对角缩放变换 $T$。(c) 在变换后的坐标里套用 §2.2 MDP，再变换回来，导出各向异性 Coulomb 的粘滑律。验证"二阶锥理论经线性变换普适"这一论断。

练习 4.2（开放思考题，⭐⭐⭐⭐） Alart-Curnier 的广义 Jacobian。对方程 $(4.2)$，(a) 分别在"粘滞""滑动""分离"三种局部状态下，写出投影 $\mathrm{proj}_{K_\mu}$ 的广义 Jacobian（用 §2.2 的圆盘投影求导）。(b) 说明为什么滑动状态下 Jacobian 包含一个秩亏的"切向投影"块，这与 §0 坏性质二（非对称）有什么联系？(c) 这个秩亏对半光滑 Newton 的收敛有何影响（提示：需要正则化或线搜索）。

§5 教材与文献对照¶

本章内容横跨接触力学、凸优化、机器人三个领域，不同教材的切入角度不同。按"想深入哪一层"选读：

教材 / 文献	覆盖本章哪部分	切入角度	难度
Stewart, SIAM Review 2000, "Rigid-body dynamics with friction and impact"	§2.4、§6（Painlevé）	病态性综述，必读起点	⭐⭐⭐
Acary & Brogliato, Numerical Methods for Nonsmooth Dynamical Systems (2008)	§2.2、§2.3、§2.5、§4	非光滑动力学的权威专著，de Saxcé/MDI 严格处理	⭐⭐⭐⭐
Brogliato, Nonsmooth Mechanics (3rd ed., 2016)	§2.1–§2.3、§4.1（MDI）	测度微分包含、互补的数学基础	⭐⭐⭐⭐
Murray, Li & Sastry, A Mathematical Introduction to Robotic Manipulation (1994)	§2.1、§3（force closure）	抓取与摩擦锥的经典处理	⭐⭐⭐
Lynch & Park, Modern Robotics (2017), Ch.12	§2.1、§2.4、§3	最易读的摩擦锥/极限面入门	⭐⭐
Boyd & Vandenberghe, Convex Optimization (2004), §4.6.2	§2.1（SOC）、§2.5（SOCP）	二阶锥规划的标准参考	⭐⭐⭐
Anitescu, Math. Program. 2006	§2.5（CCP 凸松弛）	凸松弛的原始论文	⭐⭐⭐⭐
Todorov, ICRA 2014, "Convex and analytically-invertible dynamics..."	§2.5（MuJoCo 模型）	平滑可微凸接触	⭐⭐⭐⭐
Castro, Permenter & Han, IEEE T-RO 2023 (SAP)	§2.5（Drake SAP）	无约束凸柔性接触	⭐⭐⭐⭐
de Saxcé & Feng, 1991/1998（双势）	§2.3	双势方法原始文献	⭐⭐⭐⭐
Goyal, Ruina & Papadopoulos, Wear 1991	§3（极限面）	极限面原始文献	⭐⭐⭐⭐
Fukushima, Luo & Tseng, SIAM J. Optim. 12(2), 2002	§2.6（SOCCP）	二阶锥互补的光滑函数与 Jordan 代数处理	⭐⭐⭐⭐
Faraut & Korányi, Analysis on Symmetric Cones (1994)	§2.6（Jordan 代数）	对称锥/Jordan 代数纯数学权威	⭐⭐⭐⭐
Sun & Sun, Math. Program. 103, 2005	§2.6（强半光滑）	FB 锥 C-函数的强半光滑性，二次收敛依据	⭐⭐⭐⭐
Amos & Kolter, ICML 2017 (OptNet) / Agrawal et al., NeurIPS 2019 (`cvxpylayers`)	§2.7（IFT 求梯度）	可微凸优化层，隐函数定理求解的解的导数	⭐⭐⭐⭐
Suh, Pang & Tedrake, IEEE RA-L 2022, "Bundled Gradients through Contact via Randomized Smoothing"	§2.7（随机光滑）	接触梯度的随机光滑，解释无梯度法为何常胜	⭐⭐⭐⭐
Le Lidec et al., IEEE T-RO 2024, "Contact models in robotics: a comparative analysis"	§2.5–§2.7	接触模型与其梯度的系统比较	⭐⭐⭐⭐

阅读路线建议：入门先读 Lynch & Park Ch.12（最友好）→ 想懂病态性读 Stewart 2000 综述 → 想写求解器读 Acary & Brogliato → 想懂现代仿真器读 Anitescu 2006 + Todorov 2014 + Castro 2023 三篇 → 想写研究级二阶锥求解器读 Fukushima–Luo–Tseng 2002 + Sun–Sun 2005 → 想做可微接触读 Amos–Kolter 2017 + Suh–Pang–Tedrake 2022 + Le Lidec 2024。

§6 核心定理与公式清单¶

把全章的硬核结论汇成一张"定理速查表"（章末小结还有一份更精简的符号/公式表，此处侧重"陈述+一句话直觉"）。

定理 1（Painlevé 佯谬 / 非唯一与非存在） 经典刚体 + 严格 Coulomb 律 + 单边接触的运动方程，在某些构型（高摩擦 + 特定接触角）下**无相容解或有多解**（Painlevé 1895；Stewart 2000 严格化）。一句话直觉：法向力随切向运动的"单向调制"在临界角制造了自相矛盾的方程，这是 §0 坏性质四的数学定理形式。工程含义：凸松弛（§2.5）通过"放宽互补"绕过了它——松弛问题永远有唯一解。

定理 2（摩擦锥的二阶锥性与对偶） $K_\mu=\{(r_N,\mathbf{r}_T):\|\mathbf{r}_T\|\le\mu r_N\}$ 是 SOC 的线性像，凸；对偶锥 $K_\mu^*=K_{1/\mu}$；$\mu=1$ 时自对偶（§2.1，$(2.4)(2.7)$）。一句话直觉：摩擦约束"长得像冰激凌锥"，力锥与速度对偶锥半顶角互余。

定理 3（MDP ⟹ 粘滑律） 最大耗散原理 $(2.10)$ 的 KKT 条件等价于完整 Coulomb 粘滑律 $(2.3)$；等价于法锥包含 $-\mathbf{u}_T\in N_{\mathbb{D}_{\mu r_N}}(\mathbf{r}_T)$（§2.2，$(2.14)$）。一句话直觉：摩擦力是"给定速度下耗散最多的合法力"，两行 KKT 自动给出粘（多值）滑（单值）。

定理 4（de Saxcé 关联化） Coulomb 律 $(\mathbf{r},\mathbf{u})$ 满足粘滑律 ⟺ 修正对 $(\mathbf{r},\hat{\mathbf{u}})$（$\hat{\mathbf{u}}=\mathbf{u}+\mu\|\mathbf{u}_T\|\mathbf{e}_N$）满足关联流动 $-\hat{\mathbf{u}}\in N_{K_\mu}(\mathbf{r})$（§2.3，$(2.18)$）。一句话直觉：加一个虚拟法向速度，非关联的 Coulomb 就"假装"成关联，救回变分结构。

定理 5（内切多面体误差） 内切正 $k$ 棱金字塔沿最差方向（边中点）有效摩擦系数为 $\mu\cos(\pi/k)$，最大相对低估 $1-\cos(\pi/k)$；$k=4$ 时对角方向低估 $1-1/\sqrt2\approx29.3\%$（§2.4，$(2.22)(2.23)$）。一句话直觉：用多面体近似圆锥，给各向同性摩擦刻上了 $k$ 重对称的棱角。

定理 6（CCP 凸性） Anitescu 凸松弛把非凸接触 NCP 改写成锥互补 $K_\mu\ni\mathbf{r}\perp\mathbf{u}\in K_\mu^*$，等价于凸 QP $\min_{\mathbf{r}\in K_\mu}\tfrac12\mathbf{r}^\top N\mathbf{r}+\mathbf{b}^\top\mathbf{r}$（$N=D^\top M^{-1}D\succ0$）；必有唯一解、PGS 全局收敛；代价是 $O(h)$ 的 forces-from-a-distance 伪影（§2.5，$(2.24)$–$(2.26)$）。一句话直觉：放宽互补换凸性，凸性换可解性，可解性的税是隔空作用力。

定理 7（极限面流动法则） 整片接触面的滑动 twist 是极限面 $\mathcal{L}$ 在合力旋量点处的外法向（Goyal–Ruina 1991，$(3.2)$）；椭球近似 $(3.3)$ 揭示力-力矩耦合。一句话直觉：MDP 从"点"升到"面"，圆盘升成椭球，外法向流动结构不变。

§7 机器人系统对应表（理论 → 实战桥接）¶

本章理论在机器人各子领域的落地映射——这是 §2.5 目标里"把理论桥接到足式 MPC、WBC、抓取"的总表，也是与 05 足式、04 不确定性两批的衔接枢纽。

机器人场景	用到本章哪个结果	具体形式	衔接章节
足式 Convex MPC	§2.4 内切 $k=4$ 金字塔	每脚 4 不等式 $\\|r_{T,x}\\|\le\mu r_N,\\|r_{T,y}\\|\le\mu r_N$，$\mu$ 取保守值补偿 $\sqrt2$ 低估	05 足式 §80 接触力学
WBC（全身控制）摩擦约束	§2.1 摩擦锥 + §2.4 多面体	QP 不等式约束 $G\mathbf{r}\le0$（H-rep），分层优先级下保证不打滑	05 足式 §90 WBC/TSID
抓取 force closure	§2.1 锥内判据 + §3 凸包含原点	每指 $\mathbf{r}_i\in\mathrm{int}\,K_{\mu_i}$ + 抓取映射凸包含 $\mathbf{0}$；$Q_1$ 质量度量	05 足式抓取 / 操作
MuJoCo / Drake 仿真	§2.5 CCP 凸松弛 + §2.3 de Saxcé	凸 QP/无约束凸求解，forces-from-a-distance 伪影	专题 3 时步法、专题 4 可微接触
接触隐式 MPC（CI-MPC）	§2.5 互补/松弛 + §4.1 MDI	把接触互补作为优化约束/松弛，梯度依赖松弛化	专题 6 CI-MPC
Sim-to-Real 摩擦辨识	§2.5 伪影 + §2.1 $\mu$ 不确定性	$\mu$ 作为不确定参数域随机化；区分真实摩擦与 $O(h)$ 伪影	04 不确定性（域随机化、参数辨识）
足式打滑检测/恢复	§2.1 判据 $(2.8)$	实时监测 $\\|\mathbf{r}_T\\|/r_N$ 接近 $\mu$ → 触发恢复策略	05 足式容错控制

与 04 不确定性的桥接（重点展开）：摩擦系数 $\mu$ 是机器人里**最难精确测量、最易随环境变化**的参数之一（同一双鞋在干/湿/油地面 $\mu$ 可差 $3$ 倍）。这把本章与 04 不确定性批直接连起来：(1) 域随机化——训练 RL 策略时把 $\mu$ 在 $[\mu_{\min},\mu_{\max}]$ 随机化，让策略对摩擦不确定鲁棒（这是 §2.1 摩擦锥"胖瘦不定"的概率化版本）；(2) 参数辨识——用接触力/滑动观测在线估计 $\mu$，但必须先扣除 §2.5 的 $O(h)$ 伪影才不会把仿真伪影当真实摩擦；(3) 鲁棒约束——MPC 里用 $\mu$ 的置信下界 $\underline{\mu}$ 写锥约束，对应 §2.1 判据 $(2.8)$ 的"保守裕度"工程化。理解本章的确定性摩擦理论，是把摩擦纳入不确定性框架的前提——你得先知道"摩擦锥是什么"，才能问"摩擦锥的参数不确定时怎么办"。

与 05 足式的桥接（重点展开）：足式机器人是本章理论最密集的应用场。05 足式 §80 直接用 §2.4 的多面体锥写 MPC 约束、§90 WBC 用 §2.1 锥约束做分层 QP。本章为它们提供的不只是"约束的形式"，更是"为什么这样写"的理解——读完本章，足式 §80/§90 里那些"每脚 4 不等式""$\mu$ 取 0.7"的工程选择，你能从 §2.4 的 $\sqrt2$ 各向异性、§2.1 的安全裕度直接推出来源，而不是当成魔法常数照抄。

§8 资源与工具速查¶

资源	类型	用途	链接形式
MuJoCo 文档 "Computation > Contact"	官方文档	§2.5 凸松弛模型、pyramidal/elliptic 锥切换	`mujoco.readthedocs.io`
Drake `MultibodyPlant` / SAP solver 文档	官方文档	§2.5 SAP 无约束凸求解	`drake.mit.edu`
Siconos	开源库	§2.3/§2.5 真 SOCP、Alart-Curnier、de Saxcé	`siconos.gitlab.io`
Pinocchio 3 `admm-solver.hpp`	开源源码	§2.3 de Saxcé 修正项实战、§2.5 ADMM	`github.com/stack-of-tasks/pinocchio`
Bullet `btSequentialImpulseConstraintSolver`	开源源码	§2.4 多面体 + Sequential Impulse	`github.com/bulletphysics`
ECOS / Clarabel / Mosek	SOCP 求解器	§2.5 直接解二阶锥规划	各自官网
Chrono::Multicore	开源库	§2.5 GPU 大规模 CCP（颗粒仿真）	`projectchrono.org`

§9 阅读节奏与本章速查卡¶

阅读节奏复盘¶

本章按"几何（轻）→ 变分（重）→ 计算（重）→ 应用（轻）"的密度节奏组织：§2.1 几何相对直观（轻松段，建立锥的图像）；§2.2–§2.3 变分层是最硬的推导（密集段，MDP 的 KKT、de Saxcé 的关联化）；§2.4 多面体回到直观的几何近似（轻松段，缓冲）；§2.5 CCP 又是密集段（凸松弛、CCP）；§3 极限面 + §7 应用表是轻松收尾。建议精读时在 §2.3 后、§2.5 后各停下来做一遍对应练习，巩固最硬的两块。

一页速查卡¶

【Coulomb 律】两条陈述缺一不可：
  A 可行域：‖r_T‖ ≤ μ r_N（在锥内）
  B 流动法则（MDP）：粘(u_T=0)→力在锥内多值；滑(u_T≠0)→r_T=-μr_N·u_T/‖u_T‖（锥面、反平行）

【摩擦锥 K_μ】二阶锥(冰激凌锥)，半顶角 arctan μ，凸；
  对偶锥 K_μ* = K_{1/μ}；μ=1 自对偶。
  无滑判据：r ∈ int K_μ ⟺ ‖r_T‖ < μ r_N。

【MDP】r_T = argmax_{‖s‖≤μr_N}(-sᵀu_T)；KKT 两行出全部粘滑；法锥形式 -u_T ∈ N_D(r_T)。

【de Saxcé】Coulomb 非关联（滑动速度≠锥面法向）；
  修正速度 û = u + μ‖u_T‖e_N 使其关联化 → 救回变分结构。
  源码里的 v_t + μ‖v_t‖n 就是它，别删！

【多面体近似】内切 k 棱金字塔，最差方向有效 μ = μcos(π/k)；
  k=4 对角低估 1/√2≈0.71（29.3%）；k=8 误差 7.6%。
  内切=欠近似(保守)，外切=过近似(乐观)。

【CCP 凸松弛】K_μ ∋ r ⊥ (Nr+b+Φ) ∈ K_μ*，N=DᵀM⁻¹D≻0；
  等价凸 QP，必有唯一解，PGS 收敛；
  代价：forces-from-a-distance 伪影 ~ O(h·μ·‖u_T‖)，h→0 消失。

【选型】实时→多面体LCP(k=4/8)；精确→SOCP；可微→凸松弛CCP；无占优解。

§10 渐隐示例：从"完全跟随"到"独立求解"一个摩擦锥问题¶

本节用认知科学的"渐隐示例（faded worked examples）"训练核心技能——判断一个接触是粘还是滑、并算出摩擦力。四个阶段逐步撤除引导。建议在草稿纸上做，做完再看下一阶段。

这是本章最核心的可操作技能：给定法向力、切向外力（或滑动速度），判断粘/滑并求摩擦力。所有足式/抓取/仿真的接触求解，归根结底是在反复做这件事。

Phase 1：完整示范（你只需观察每一步）¶

问题：水平桌面，物块质量产生法向力 $r_N=10\,$N，$\mu=0.4$。外部施加水平切向力 $\mathbf{f}_{\text{ext}}=(3, 0)\,$N，物块当前静止（$\mathbf{u}_T=\mathbf{0}$）。求摩擦力 $\mathbf{r}_T$ 并判断是否打滑。

Step 1 — 算锥的最大切向力（锥半径）：$\mu r_N = 0.4\times10 = 4\,$N。这是摩擦力幅值的上限（锥面）。

Step 2 — 假设粘滞，由力平衡求所需摩擦力：静止 ⟹ 切向合力为零 ⟹ 摩擦力必须平衡外力 $\mathbf{r}_T = -\mathbf{f}_{\text{ext}} = (-3, 0)\,$N，所需幅值 $\|\mathbf{r}_T\|=3\,$N。

Step 3 — 检验所需摩擦力是否在锥内（§2.1 判据 $(2.8)$）：$\|\mathbf{r}_T\|=3 < \mu r_N = 4$ ✓。需求 $3$N 小于供给上限 $4$N，摩擦力够用。

Step 4 — 下结论：$\mathbf{r}_T=(-3,0)\,$N，在锥**内部**（严格小于），故**粘滞、不打滑**。这正是 §2.1 理论一"按需供给"的体现——摩擦力只供给所需的 $3$N，不取满 $4$N。

Phase 2：填空（关键步骤留给你）¶

问题：同样桌面，$r_N=10\,$N，$\mu=0.4$，但外力增大到 $\mathbf{f}_{\text{ext}}=(5, 0)\,$N，物块仍假设静止。

Step 1 — 锥最大切向力 $\mu r_N = \underline{\quad}\,$N。
Step 2 — 假设粘滞所需摩擦力 $\mathbf{r}_T = \underline{\quad}$，所需幅值 $\underline{\quad}\,$N。
Step 3 — 检验：所需幅值 $\underline{\quad}$ 与 $\mu r_N=\underline{\quad}$ 比较，结果是所需 $\underline{\quad}$（大于/小于）供给。
Step 4 — 结论：摩擦力**不够**，物块**开始打滑**。一旦打滑，摩擦力被钉在锥面：$\|\mathbf{r}_T\|=\mu r_N=\underline{\quad}\,$N，方向反平行于运动（运动会沿外力方向 $+x$ 启动，故 $\mathbf{r}_T=\underline{\quad}$）。净切向力 $=5-4=\underline{\quad}\,$N 推动物块加速。

答案核对：Step1: $4$；Step2: $(-5,0)$、$5$；Step3: $5$、$4$、大于；Step4: $4$、$(-4,0)$、$1$。关键认知：粘滞假设失败（所需 > 供给）就翻到滑动分支，摩擦力立刻取满 $\mu r_N$。

Phase 3：框架提示（大部分你来做）¶

问题：二维切向。$r_N=20\,$N，$\mu=0.5$，外力 $\mathbf{f}_{\text{ext}}=(6, 8)\,$N，物块静止。判断粘/滑并求 $\mathbf{r}_T$。

提示框架：(1) 锥最大切向力 $=\mu r_N=?$。(2) 所需摩擦力 $=-\mathbf{f}_{\text{ext}}$，幅值 $=\|\mathbf{f}_{\text{ext}}\|=\sqrt{6^2+8^2}=?$。(3) 比较所需幅值与 $\mu r_N$，判断粘/滑。(4) 若滑，摩擦力 $=\mu r_N\cdot(-\hat{\mathbf{f}}_{\text{ext}})$（注意方向是外力反方向的单位向量乘锥半径）。自己写出每步数值与结论。

Phase 4：独立求解（全新问题，无提示）¶

问题：足式机器人一只脚，法向力 $r_N=150\,$N，地面 $\mu=0.6$，但控制器用保守值 $\mu_{\text{ctrl}}=0.6/\sqrt2\approx0.424$（补偿 $k=4$ 金字塔，§2.4）。MPC 求出的切向力需求是 $\mathbf{r}_T^{\text{des}}=(50, 50)\,$N。(a) 用真实 $\mu$ 判断这只脚实际会不会打滑。(b) 用控制器的保守 $\mu_{\text{ctrl}}$ 判断 MPC 是否认为它打滑。(c) 解释这个"控制器以为会滑、实际不会滑"的保守性从何而来（提示：§2.4 的 $\sqrt2$ 各向异性 + 对角方向 $\mathbf{r}_T^{\text{des}}$）。这道题把 §2.1 判据、§2.4 多面体补偿、§7 工程裕度三者合在一个足式实例里——做完它，你就真正打通了"理论锥"到"工程脚"的全链路。

本章常见误解汇总¶

#	常见误解	正确理解	出处
1	Coulomb 律就是 $\\|\mathbf{r}_T\\|\le\mu r_N$ 一个不等式	还需陈述 B（MDP/流动法则）决定力在锥内取哪一点；A 管可行域、B 管取值	§2.1、§2.2
2	摩擦锥是空心的（只有侧面）	是实心锥；内部对应粘滞、表面对应滑动	§2.1
3	摩擦系数 $\mu$ 一定 $<1$	$\mu$ 可 $>1$（硅胶可达 $1.5$–$2$），锥可比 $45°$ 胖	§2.1
4	静止物块受到 $\mu r_N$ 的摩擦力	静止时摩擦力按需供给，无外力则为零；只有滑动才取满 $\mu r_N$	§2.1、§2.2
5	摩擦力可以写成单值函数 $\mathbf{r}_T=f(\mathbf{u}_T)$	粘滞时多值（整个圆盘），单值函数无法表达；正则化会丢静摩擦、产生蠕变	§2.1
6	"最大耗散"意味着摩擦力总取最大值	最大化的是耗散功率 $-\mathbf{s}^\top\mathbf{u}_T$；粘滞时功率恒零、力不取满	§2.2
7	MDP 唯一确定摩擦力	粘滞时目标平、最优解是整个圆盘，不唯一	§2.2
8	关联流动是"正确"的，Coulomb 非关联是缺陷	关联流动预言滑动→法向膨胀飞起，物理错误；非关联才是物理真实	§2.3
9	de Saxcé 修正的虚拟法向速度是真实分离速度	纯计算构造，真实 $u_N=0$；误用会致虚假抬起	§2.3
10	增大金字塔棱数 $k$ 总是免费的好事	每增一面 LCP 规模增大；精度按 $1/k^2$ 衰减、收益递减，求解变慢	§2.4
11	内切/外切多面体差不多	内切=欠近似(保守安全)，外切=过近似(乐观危险)，安全结论相反	§2.4
12	多面体近似只影响精度不改定性	$k=4$ 各向异性产生方向偏好（虚假定性行为），对称性从 $O(2)$ 降到 $k$ 重	§2.4
13	forces-from-a-distance 是碰撞检测 bug	凸松弛+有限步长的固有伪影 $\sim O(h)$，与碰撞检测无关	§2.5
14	凸松弛解就是精确解	只在 $h\to0$ 渐近收敛；有限 $h$ 差一个 $O(h)$ 边界层	§2.5
15	各向异性/黏附摩擦需要全新理论	椭圆锥经线性变换即标准 Lorentz 锥，§2 理论普适；黏附只是平移顶点	§4

本章小结¶

符号表¶

符号	含义	首次出现
$r_N$	法向反力标量（$\ge0$，只推不拉）	§2.1
$\mathbf{r}_T\in\mathbb{R}^2$	切向摩擦力向量	§2.1
$\mathbf{r}=(r_N,\mathbf{r}_T)\in\mathbb{R}^3$	完整接触力（冲量）	§2.1
$u_N,\ \mathbf{u}_T,\ \mathbf{u}$	法向分离速度、切向滑动速度、完整接触速度	§2.1
$\mu$	摩擦系数（$=\tan$ 半顶角）	§2.1
$K_\mu$	摩擦锥 $\{\\|\mathbf{r}_T\\|\le\mu r_N\}$（二阶锥/冰激凌锥）	§2.1
$\mathcal{Q}^{n+1}$	标准 Lorentz/二阶锥 $\{(t,\mathbf{x}):\\|\mathbf{x}\\|\le t\}$	§2.1
$K_\mu^*=K_{1/\mu}$	摩擦锥的对偶锥	§2.1
$\mathrm{int}\,K_\mu$	摩擦锥内部（粘滞判据）	§2.1
$\mathbb{D}_{\mu r_N}$	半径 $\mu r_N$ 的二维圆盘（锥的截面）	§2.2
$N_C(\mathbf{x})$	凸集 $C$ 在点 $\mathbf{x}$ 的法锥	§2.2
$\mathrm{proj}_C$	到凸集 $C$ 的投影算子	§2.2
$D$（耗散功率）	$-\mathbf{r}_T^\top\mathbf{u}_T\ge0$	§2.2
$\psi_C$	凸集 $C$ 的指示函数（$0$/$+\infty$）	§2.2
$\hat{\mathbf{u}}=\mathbf{u}+\mu\\|\mathbf{u}_T\\|\mathbf{e}_N$	de Saxcé 修正速度	§2.3
$\mathbf{e}_N$	法向单位向量 $(1,0,0)$	§2.3
$b(\mathbf{r},-\mathbf{u})$	de Saxcé 双势	§2.3
$\mathbf{d}_i,\ \beta_i$	多面体母线方向、非负组合系数（V-rep）	§2.4
$k$	多面体棱数（金字塔面数）	§2.4
$\mu\cos(\pi/k)$	内切多面体最差方向有效摩擦系数	§2.4
$N=D^\top M^{-1}D$	Delassus 算子（$\succ0$）	§2.5
$M,\ D,\ \mathbf{b}$	质量矩阵、接触雅可比、自由速度项	§2.5
$\boldsymbol{\Phi}(\mathbf{r})$	CCP 中的 de Saxcé 修正项	§2.5
$h$	时间步长（伪影 $\sim O(h)$）	§2.5
$\mathbf{x}\circ\mathbf{y}$	二阶锥的 Jordan 积 $(\mathbf{x}^\top\mathbf{y},\,x_0\mathbf{y}_1+y_0\mathbf{x}_1)$	§2.6
$\lambda_{1,2}=x_0\pm\\|\mathbf{x}_1\\|$	元素 $\mathbf{x}$ 的 Jordan 特征值（永远只 2 个）	§2.6
$\mathbf{c}_{1,2}=\tfrac12(1,\pm\hat{\mathbf{x}}_1)$	谱幂等元（Jordan frame）	§2.6
$\mathcal{Q}^n$	标准二阶锥（Jordan 代数的对称锥）	§2.6
$\nabla\,\mathrm{proj}_{\mathcal{Q}^n}$	锥投影广义 Jacobian $(2.32)$（半光滑 Newton 用）	§2.6
$\theta$	可微接触的参数（$\mu$/接触点/控制输入等）	§2.7
$\Psi(\mathbf{r}^\star,\theta)$	CCP 投影方程隐函数（IFT 求梯度）	§2.7
$J=\nabla\,\mathrm{proj}_{K_\mu}$	IFT 梯度里的锥投影 Jacobian 零件	§2.7
$\bar{\mathbf{r}}_\sigma,\ \sigma$	随机光滑接触力、平滑尺度超参	§2.7
$\mathcal{L}$	极限面（limit surface）	§3
$\mathbf{w}=(\mathbf{f},\tau)$	合力旋量（力+力矩）	§3
$\mathbf{t}=(\mathbf{v},\omega)$	滑动 twist（平移+自转）	§3
$G_i$	抓取映射矩阵（grasp map）	§3
$d\mathbf{v},\ d\mathbf{r}$	速度微分测度、冲量测度（MDI）	§4

定理速查表¶

定理/公式	一句话说明	对应节
Coulomb 集值律 $(2.3)$	粘滞→锥内多值；滑动→锥面反平行于速度	§2.1
摩擦锥二阶锥性 $(2.4)$	$K_\mu$ 是 SOC 线性像，凸，半顶角 $\arctan\mu$	§2.1
对偶锥 $(2.7)$	$K_\mu^*=K_{1/\mu}$，$\mu=1$ 自对偶	§2.1
无滑判据 $(2.8)$	$\mathbf{r}\in\mathrm{int}\,K_\mu\Leftrightarrow\\|\mathbf{r}_T\\|<\mu r_N\Leftrightarrow$ 粘滞	§2.1
MDP $(2.10)$	摩擦力是给定速度下耗散功率最大的合法力	§2.2
法锥形式 $(2.14)$	$-\mathbf{u}_T\in N_{\mathbb{D}_{\mu r_N}}(\mathbf{r}_T)$，求解器心脏	§2.2
MDP-Gauss 对偶 $(2.13)$	力视角(max 耗散) ⟷ 速度视角(min 约束偏差)	§2.2
de Saxcé 修正 $(2.18)$	$\hat{\mathbf{u}}=\mathbf{u}+\mu\\|\mathbf{u}_T\\|\mathbf{e}_N$ 把非关联律关联化	§2.3
de Saxcé 双势 $(2.19)$	Coulomb 律的（广义）变分结构存在性	§2.3
内切误差 $(2.22)(2.23)$	最差方向有效 $\mu=\mu\cos(\pi/k)$，$k=4$ 低估 $29.3\%$	§2.4
Delassus 算子 $(2.24)$	$N=D^\top M^{-1}D\succ0$，接触系统矩阵	§2.5
CCP / 凸松弛 $(2.25)(2.26)$	锥互补 ⟺ 凸 QP；必有唯一解、PGS 收敛	§2.5
forces-from-a-distance	凸松弛伪影 $\sim O(h\mu\\|\mathbf{u}_T\\|)$，$h\to0$ 消失	§2.5
Jordan 谱分解 $(2.29)$	$\mathbf{x}=\lambda_1\mathbf{c}_1+\lambda_2\mathbf{c}_2$；在锥内 ⟺ 特征值非负	§2.6
锥投影闭式 $(2.31)$	截断负特征值；三情形（内/顶点/锥面）	§2.6
锥投影 Jacobian $(2.32)$	半光滑 Newton 与 IFT 梯度的公共零件	§2.6
强半光滑（Sun–Sun 2005）	FB 锥 C-函数处处强半光滑 ⟹ Newton 二次收敛	§2.6
IFT 接触梯度 $(2.34)(2.35)$	对投影方程用隐函数定理；零件是 $(2.32)$	§2.7
随机光滑梯度 $(2.37)$	高斯卷积抹平非光滑，得优化友好的代理梯度	§2.7
Painlevé 佯谬（定理 1）	经典刚体+Coulomb 可无解/多解	§6
极限面流动法则 $(3.2)$	滑动 twist 是极限面外法向；椭球近似 $(3.3)$	§3
Alart-Curnier $(4.2)$	投影方程 $\mathbf{r}=\mathrm{proj}_{K_\mu}(\mathbf{r}-\rho\mathbf{u})$，半光滑 Newton 用	§4

知识点总表¶

编号	知识点	核心要点	对应节	难度
1	Coulomb 律集值形式	两条陈述：可行域(锥)+流动法则(MDP)；粘滞多值、滑动单值	§2.1	⭐⭐
2	摩擦锥几何	二阶锥、半顶角 $\arctan\mu$、凸；冰激凌锥	§2.1	⭐⭐
3	对偶锥与自对偶	$K_\mu^*=K_{1/\mu}$；$\mu=1$ 自对偶；半顶角互余	§2.1	⭐⭐⭐
4	无滑判据	$\mathbf{r}\in\mathrm{int}\,K_\mu$；工程上留安全裕度	§2.1	⭐⭐
5	最大耗散原理 MDP	两行 KKT 出全部粘滑；目标平/不平编码粘/滑	§2.2	⭐⭐⭐
6	MDP-Gauss 对偶	力视角 ⟷ 速度视角的原始-对偶	§2.2	⭐⭐⭐
7	法锥/投影形式	求解器心脏；投影到锥一行公式	§2.2	⭐⭐⭐
8	非关联流动	Coulomb 滑动速度 $\ne$ 锥面法向；破坏标准对偶	§2.3	⭐⭐⭐⭐
9	de Saxcé 双势	虚拟法向速度关联化；源码修正项的来历	§2.3	⭐⭐⭐⭐
10	多面体近似	内切/外切、V-rep/H-rep；$\mu\cos(\pi/k)$ 误差	§2.4	⭐⭐⭐
11	$\sqrt2$ 各向异性	$k=4$ 对角低估 $29.3\%$；对角步态打滑根源	§2.4	⭐⭐⭐
12	LCP vs SOCP 选型	实时/精确/可微的三维权衡，无占优解	§2.4	⭐⭐⭐
13	CCP 凸松弛	非凸→凸 QP；锥凸+Delassus 正定	§2.5	⭐⭐⭐⭐
14	forces-from-a-distance	凸松弛的 $O(h)$ 物理税；隔空作用力伪影	§2.5	⭐⭐⭐⭐
15	半光滑 Newton/Alart-Curnier	互补→投影方程→广义 Jacobian Newton	§2.5、§4	⭐⭐⭐⭐
16	SOCCP 与 Jordan 代数	谱分解 $(2.29)$；锥投影闭式 $(2.31)$；广义 Jacobian $(2.32)$；强半光滑保二次收敛	§2.6	⭐⭐⭐⭐
17	摩擦锥可微化	IFT 对投影方程求梯度 $(2.35)$；随机光滑 $(2.37)$；桥接可微接触	§2.7	⭐⭐⭐⭐
18	极限面与 force closure	点摩擦→面摩擦；椭球耦合；抓取闭合判据	§3	⭐⭐⭐
19	进阶推广	MDI、各向异性、黏附——二阶锥框架普适	§4	⭐⭐⭐⭐

§11 综合算例：一个接触点的"全栈"求解¶

本节把全章理论串成一个完整的、可手算的端到端流程——从给定运动学到输出接触力。它是本章的"集成测试"，对应规范要求的"端到端组装"综合练习。读完它，你应该能独立给任意单接触点算出摩擦力。

问题设定¶

一个刚体（质量矩阵 $M=\mathrm{diag}(2, 2, 2)$，单位 kg）在一个时间步 $h=5\,$ms 内与地面有一个接触点。接触雅可比 $D=I_3$（接触点速度直接等于刚体的 $(z, x, y)$ 速度，法向沿 $z$）。摩擦系数 $\mu=0.5$。本步开始时的"自由速度"（不含接触冲量时刚体在外力下的速度）为 $$ \mathbf{u}^{\text{free}} = \mathbf{b} = (-0.10, 0.40, 0.00)^\top \text{m/s}\quad(\text{法向} u_N^{\text{free}}=-0.10, \text{切向} \mathbf{u}_T^{\text{free}}=(0.40,0)). $$ 法向分量 $-0.10$ 为负，表示刚体正以 $0.10\,$m/s **压向**地面（侵入），所以接触会激活、产生法向冲量。切向分量 $(0.40,0)$ 表示刚体有沿 $+x$ 的滑动趋势。我们要求接触冲量 $\mathbf{r}=(r_N,\mathbf{r}_T)$（单位 N·s）使接触后运动物理合理。

Step 1（专题 1 复用）：组装 Delassus 算子¶

由 $(2.24)$，$N=D^\top M^{-1}D = I_3\cdot\mathrm{diag}(1/2,1/2,1/2)\cdot I_3 = \mathrm{diag}(0.5, 0.5, 0.5)$。这是本接触点的"系统矩阵"，对称正定（$M\succ0$ 保证），CCP 凸性的目标函数正定性由它担保。接触后速度 $\mathbf{u}=N\mathbf{r}+\mathbf{b}$。

Step 2（§2.5）：写出凸 QP（CCP）¶

由 $(2.26)$，求 $$ \min_{\mathbf{r}\in K_{0.5}} \tfrac12\mathbf{r}^\top N\mathbf{r}+\mathbf{b}^\top\mathbf{r} = \min_{|\mathbf{r}T|\le0.5 r_N} \tfrac14(r_N^2+|\mathbf{r}_T|^2) + (-0.10\,r_N + 0.40\,r). $$ 目标凸（$N\succ0$）、可行域 $K_{0.5}$ 凸，故有唯一最优解。

Step 3（§2.2 投影 + §2.5 投影梯度）：迭代求解¶

用投影梯度 $\mathbf{r}^{k+1}=\mathrm{proj}_{K_{0.5}}\bigl(\mathbf{r}^k-\rho(N\mathbf{r}^k+\mathbf{b})\bigr)$，取 $\rho=1$、初值 $\mathbf{r}^0=\mathbf{0}$。

迭代 0→1：$N\mathbf{r}^0+\mathbf{b}=\mathbf{b}=(-0.10,0.40,0)$。梯度步 $\mathbf{r}^0-\rho(\cdots)=\mathbf{0}-(-0.10,0.40,0)=(0.10,-0.40,0)$。现在投影到 $K_{0.5}$：候选点法向 $0.10>0$、切向 $\|(-0.40,0)\|=0.40$。检查锥约束 $0.40 \le 0.5\times0.10=0.05$？否（$0.40\gg0.05$），点在锥外，需投影。

到二阶锥 $K_\mu$ 的投影公式（标准结果，$\mu=0.5$）。给定点 $(z,\mathbf{w})$（$z$ 法向、$\mathbf{w}$ 切向）： - 若 $\|\mathbf{w}\|\le\mu z$（锥内）：投影 $=(z,\mathbf{w})$ 不变。 - 若 $\|\mathbf{w}\|\le -z/\mu$（极锥内，即对偶锥的负向）：投影 $=\mathbf{0}$。 - 否则（锥外侧面区）：投影到锥面， $$ z^+ = \frac{\mu|\mathbf{w}|+z}{1+\mu^2},\qquad \mathbf{w}^+ = \mu z^+\frac{\mathbf{w}}{|\mathbf{w}|}. \tag{11.1} $$ 代入 $(z,\mathbf{w})=(0.10,(-0.40,0))$，$\|\mathbf{w}\|=0.40$，$\mu=0.5$：检查中间区——$\|\mathbf{w}\|=0.40$，$-z/\mu=-0.20$，$\mu z=0.05$。因 $0.40>0.05$ 且 $0.40>-0.20$，落在锥外侧面区，用 $(11.1)$： $$ z^+=\frac{0.5\times0.40+0.10}{1+0.25}=\frac{0.30}{1.25}=0.24,\quad \mathbf{w}^+=0.5\times0.24\times\frac{(-0.40,0)}{0.40}=(−0.12,0). $$ 所以 $\mathbf{r}^1=(0.24, -0.12, 0)$。验证在锥面：$\|\mathbf{r}_T^1\|=0.12=0.5\times0.24=\mu r_N^1$ ✓。

迭代 1→2：$N\mathbf{r}^1+\mathbf{b}=\mathrm{diag}(0.5)(0.24,-0.12,0)+(-0.10,0.40,0)=(0.12,-0.06,0)+(-0.10,0.40,0)=(0.02,0.34,0)$。梯度步：$\mathbf{r}^1-(0.02,0.34,0)=(0.22,-0.46,0)$。投影：$z=0.22$、$\mathbf{w}=(-0.46,0)$、$\|\mathbf{w}\|=0.46>\mu z=0.11$，锥外侧面区： $$ z^+=\frac{0.5\times0.46+0.22}{1.25}=\frac{0.45}{1.25}=0.36,\quad\mathbf{w}^+=0.5\times0.36\times(-1,0)=(-0.18,0). $$ $\mathbf{r}^2=(0.36,-0.18,0)$，仍在锥面（$0.18=0.5\times0.36$ ✓）。迭代在向不动点爬升，继续会收敛到满足"接触后法向速度 $\ge0$（不再侵入）+ 切向落在锥上"的解。

Step 4（§2.1 判据 + §2.3）：解读物理¶

收敛解里 $\mathbf{r}_T$ 落在**锥面**上（$\|\mathbf{r}_T\|=\mu r_N$），说明这个接触是**滑动**状态——切向滑动趋势 $0.40\,$m/s 太大，摩擦力顶不住，物体边接触边沿 $+x$ 滑。摩擦力方向 $(-, 0)$ 即沿 $-x$，反平行于滑动方向，与 §2.1 滑动分支 $(2.3)$ 一致。注意 §2.3 的 de Saxcé 修正在这里隐含——精确实现里梯度步要对切向速度加 $\mu\|\mathbf{u}_T\|\mathbf{e}_N$ 才严格收敛，本例为手算清晰略去了它，故收敛到的是略带 forces-from-a-distance 偏差的松弛解（§2.5）。

Step 5：把它接回机器人¶

如果这是一只足，"滑动状态"就是打滑信号——足式控制器（05 §80）会据此判断该脚不可靠、调整步态或落足点。如果用真实 $\mu=0.5$ 但控制器用 $\mu_{\text{ctrl}}=0.35$（§2.4 补偿），MPC 会更早判定打滑、更保守地分配力。整个链路：运动学 → Delassus → 凸 QP → 锥投影迭代 → 粘滑判读 → 控制决策，就是本章理论的"全栈"兑现。

本质洞察：这个算例暴露了一个深层事实——接触求解本质上就是"把自由运动投影到摩擦锥约束的可行流形上"。自由速度 $\mathbf{b}$ 是"如果没有接触会怎样"，接触冲量 $\mathbf{r}$ 是"把它扳回物理可行所需的最小修正"，而扳的方式正是反复投影到 $K_\mu$。专题 1 的无摩擦接触是投影到非负象限，本章的摩擦接触是投影到二阶锥——同一个"投影到凸集"的思想，换了个锥而已。这就是为什么理解了 §2.2 那一行锥投影公式，就理解了所有接触求解器的内核。

累积项目：本章新增模块¶

本批次（接触力学）的累积项目是**从零实现一个最小可用的单接触/多接触摩擦求解器** MiniContactSolver，每个专题加一个模块，最终能仿真"物块在斜面上的粘滑/抓取力闭合判断"。

本章（专题 2）新增模块：friction_cone.py + cone_projection.py

模块	实现内容	对应本章
`FrictionCone(mu)`	摩擦锥类：成员函数 `contains(r)` 判断 $\mathbf{r}\in K_\mu$、`is_strictly_inside(r)` 判断 $\in\mathrm{int}\,K_\mu$（粘滞判据 $(2.8)$）	§2.1
`dual_cone()`	返回 $K_{1/\mu}$，验证 $K_\mu^*=K_{1/\mu}$	§2.1
`project_to_cone(z, w)`	二阶锥投影 $(11.1)$（三分支：锥内/极锥/侧面）	§2.2、§11
`pyramid_constraints(k)`	生成内切 $k$ 棱金字塔的 V-rep 母线 $(2.20)$ 与 H-rep 不等式 $(2.21)$	§2.4
`pyramid_error(k)`	返回 $\mu\cos(\pi/k)$ 与相对误差 $1-\cos(\pi/k)$	§2.4
`de_saxce_correct(u, mu)`	速度修正 $\hat{\mathbf{u}}=\mathbf{u}+\mu\\|\mathbf{u}_T\\|\mathbf{e}_N$ $(2.18)$	§2.3
`solve_ccp(N, b, mu)`	投影梯度求解单接触 CCP $(2.26)$，返回 $\mathbf{r}$ 与粘/滑状态	§2.5、§11

与前章衔接：专题 1 已实现 signorini.py（法向互补、投影到非负象限）。本章的 project_to_cone 是 project_to_nonneg 的"升级版"——把投影目标从象限换成二阶锥；solve_ccp 复用专题 1 的 delassus(M, D) 组装 $N$。

为后续铺垫：专题 3（Moreau 时步法）将用本章的 solve_ccp 作为每个时间步的接触子求解器，外面套一个时间积分循环；专题 4（可微接触）将给 solve_ccp 加上对 $\mu$、$\mathbf{b}$ 的梯度（依赖锥投影的次微分，§2.5 半光滑/§4 Alart-Curnier Jacobian）；专题 6（CI-MPC）将把 CCP 约束嵌入轨迹优化。

验收标准：用 §11 算例的数值（$M=\mathrm{diag}(2,2,2)$、$\mathbf{b}=(-0.10,0.40,0)$、$\mu=0.5$）跑 solve_ccp，应收敛到锥面上的滑动解（$\|\mathbf{r}_T\|=\mu r_N$、$\mathbf{r}_T$ 沿 $-x$）；用 pyramid_error(4) 应返回 $\approx0.293$（$29.3\%$）。

延伸阅读¶

入门级（⭐⭐） - Lynch & Park, Modern Robotics, Ch.12（接触运动学）——最友好的摩擦锥/极限面入门，配在线讲义与视频。 - 在线资源：modernrobotics.northwestern.edu 的 12.2 Friction 节，含交互图。

核心级（⭐⭐⭐） - Stewart, D. "Rigid-body dynamics with friction and impact." SIAM Review 42(1), 2000——病态性（Painlevé）权威综述，本章 §0、§6 的主要依据，强烈建议精读。 - Boyd & Vandenberghe, Convex Optimization, §4.6.2（二阶锥规划）+ §2.6（对偶锥）——SOC/对偶锥的标准参考。 - Murray, Li & Sastry, Robotic Manipulation, Ch.5——抓取与 force closure 的经典处理。

研究级（⭐⭐⭐⭐） - Acary & Brogliato, Numerical Methods for Nonsmooth Dynamical Systems, Springer 2008——非光滑动力学权威专著，§2.2/§2.3/§2.5/§4 的深层依据。 - Anitescu, M. "Optimization-based simulation of nonsmooth rigid multibody dynamics." Math. Program. 105, 2006——凸松弛/CCP 原始论文（§2.5 核心）。 - Todorov, E. "Convex and analytically-invertible dynamics with contacts and constraints." ICRA 2014——MuJoCo 凸接触模型。 - Castro, Permenter & Han. "An Unconstrained Convex Formulation of Compliant Contact." IEEE T-RO 2023——Drake SAP 求解器（§2.5）。 - de Saxcé, G. & Feng, Z.-Q. "New inequality and functional for contact with friction: the implicit standard material approach." 1991——双势方法原始文献（§2.3）。 - Goyal, Ruina & Papadopoulos. "Planar sliding with dry friction." Wear 143, 1991——极限面（§3）。 - Brogliato, B. Nonsmooth Mechanics, 3rd ed., Springer 2016——测度微分包含（§4.1）的严格基础。 - Fukushima, M., Luo, Z.-Q. & Tseng, P. "Smoothing functions for second-order-cone complementarity problems." SIAM J. Optim. 12(2), 2002——SOCCP 的光滑函数与 Jordan 代数处理（§2.6）。 - Faraut, J. & Korányi, A. Analysis on Symmetric Cones, Oxford 1994——对称锥/Euclidean Jordan 代数的纯数学权威，谱分解 $(2.29)$ 的来源（§2.6）。 - Sun, D. & Sun, J. "Strong semismoothness of the Fischer-Burmeister SDC and SOC complementarity functions." Math. Program. 103, 575–581, 2005——强半光滑性，半光滑 Newton 二次收敛的依据（§2.6）。 - Amos, B. & Kolter, J.Z. "OptNet: Differentiable optimization as a layer in neural networks." ICML 2017；Agrawal et al. "Differentiable convex optimization layers." NeurIPS 2019——隐函数定理对凸优化解求导（§2.7）。 - Suh, H.J.T., Pang, T. & Tedrake, R. "Bundled gradients through contact via randomized smoothing." IEEE RA-L 2022——接触梯度的随机光滑，§2.7 理论三的原始文献。 - Le Lidec, Q. et al. "Contact models in robotics: a comparative analysis." IEEE T-RO 2024——接触模型及其梯度的系统比较，§2.5–§2.7 的现代综述。

源码（边读边学） - Pinocchio 3 的 admm-solver.hpp / contact-solver——看 §2.3 de Saxcé 修正项与 §2.6 锥投影 Jacobian 的实战写法。 - Siconos 的 FrictionContact3D 求解器——§2.6 二阶锥谱分解投影、Alart-Curnier（§4.4）的参考实现。 - cvxpylayers / OptNet——§2.7 隐函数定理对凸优化层求梯度的最小实现。 - MuJoCo 文档 "Computation > Contact"——§2.5 凸松弛模型与 pyramidal/elliptic 锥切换。

本章与后续章节的关系¶

后续章节	与本章的关系	本章哪个知识点为其铺垫
专题 3：Moreau 时步法与数值积分	把本章的（连续/瞬时）摩擦律离散成每个时间步的接触子问题	§2.5 CCP（每步的凸子问题）、§4.1 MDI（离散的数学基础）、§11 算例（单步求解模板）
专题 4：可微接触仿真	对本章的接触求解器求梯度（对 $\mu$、状态）	§2.7 IFT 单步接触梯度 $(2.35)$、§2.6 锥投影 Jacobian $(2.32)$（梯度零件）、§2.7 随机光滑、forces-from-a-distance（梯度依赖松弛化）
专题 5：混合动力系统与 Saltation	粘↔滑切换是混合系统的离散事件	§2.1 粘滑切换的非光滑性（§0 坏性质一）
专题 6：接触隐式轨迹优化与 MPC	把接触互补/锥约束嵌入轨迹优化	§2.5 互补约束、§2.4 多面体约束（MPC 友好形式）
专题 7：非光滑分析基础	提供本章用到的法锥、次微分、Clarke 广义 Jacobian 的严格理论	§2.2 法锥形式、§4.4 半光滑 Newton 反向依赖它
05 足式 §80 接触力学与约束优化	直接用本章摩擦锥写足式 MPC 约束	§2.4 每脚 4 不等式、§2.1 无滑判据、§7 对应表
05 足式 §90 WBC 分层优化与 TSID	WBC 的 QP 里摩擦锥是核心不等式约束	§2.1 锥约束、§2.4 H-rep 多面体
04 不确定性（域随机化、参数辨识）	$\mu$ 作为最不确定的接触参数	§2.1 摩擦锥(参数 $\mu$)、§2.5 区分真实摩擦与伪影、§7 桥接段

🔧 故障排查手册¶

#	症状	可能原因	排查步骤	相关章节
1	足式机器人直行/侧移正常，$45°$ 斜线打滑	$k=4$ 金字塔对角方向把摩擦低估 $1/\sqrt2$（$29.3\%$）	1.确认摩擦约束用的是 $k=4$ 金字塔；2.把控制器 $\mu$ 改为 $\mu/\sqrt2$ 或提高到 $k=8$；3.或旋转金字塔对准运动方向；4.重测斜线步态	§2.4
2	仿真中物体还没接触就被推开一点点	Anitescu 凸松弛的 forces-from-a-distance 伪影 $\sim O(h\mu\\|\mathbf{u}_T\\|)$	1.把步长 $h$ 减半，看推开距离是否也大致减半（正比于 $h$ → 确认是松弛伪影）；2.降低 $\mu$ 或滑动速度验证；3.改用 Siconos SOCP（无此伪影）或减小 $h$/用柔性接触缓解	§2.5、§2.3
3	自己写的摩擦求解器不收敛或振荡	缺 de Saxcé 修正项，非关联律无变分结构	1.检查切向速度是否加了 $\mu\\|\mathbf{u}_T\\|\mathbf{e}_N$（$(2.18)$）；2.检查投影是否投到正确的锥（力→$K_\mu$、修正速度→$K_\mu^*$）；3.检查 Delassus $N$ 是否正定（雅可比是否列满秩）	§2.3、§2.5
4	静止物体在斜面上缓慢下滑（蠕变）	用了正则化摩擦（单值函数 $(2.9)$），静摩擦消失	1.确认摩擦模型是否为 $\tanh$/分母加 $\varepsilon$ 的正则化；2.减小正则化参数 $\varepsilon$/$v_s$（代价：刚性增大、变慢）；3.或换真集值/锥摩擦消除蠕变	§2.1 理论五
5	抓取规划判定 force closure 通过，实际一抓就掉	单点不滑 $\ne$ 全局闭合；摩擦锥张不满旋量空间	1.检查是否只验了"每点在锥内"而漏了"凸包含原点邻域"；2.检查接触点是否共线/退化（无法抵抗某方向力矩）；3.算 $Q_1$ 质量度量（凸包到原点最小距离）是否 $>0$	§3
6	提高金字塔棱数 $k$ 后求解超时	$k$ 太大致 LCP/QP 规模爆炸（$k=8$ 时约 $10\times$）	1.确认 $k$ 与精度需求匹配（误差 $\sim1/k^2$，$k=8$ 已 $7.6\%$）；2.若 $\mu$ 本身误差 $>10\%$，$k>8$ 无意义；3.要更高精度改用 SOCP（锥维度不随精度膨胀）	§2.4
7	接触力求解给出法向力为负（拉力）	未约束 $r_N\ge0$，或误把 de Saxcé 虚拟法向速度当真实输出	1.检查锥约束是否含 $r_N\ge0$；2.检查是否把 $\hat u_N$（含虚拟项）当真实分离速度报给上层；3.若需真实拉力（黏附）才用带偏置的锥（§4.3）	§2.1、§2.3
8	sim-to-real：仿真里调好的 $\mu$ 到真机不对	把仿真的 $O(h)$ 伪影当成真实摩擦去匹配；或 $\mu$ 随环境变化大	1.先在 $h\to0$ 极限下标定 $\mu$（扣除伪影）；2.把 $\mu$ 作不确定参数做域随机化；3.MPC 用 $\mu$ 置信下界写约束	§2.5、§7（04 桥接）

研究实践建议¶

给初学者（刚接触接触力学） - 先把 §2.1 的"两条陈述"和锥的几何图像刻进脑子——这是后面一切的地基。能闭眼说出"粘滞=锥内多值、滑动=锥面反平行"就过关。 - §2.2 的 MDP 两行 KKT 推导亲手推一遍，体会"把判断式变优化"的认知红利。这是本章最值得花时间的 30 分钟。 - 不要被 §2.3 de Saxcé 吓退——你只需记住结论"加 $\mu\|\mathbf{u}_T\|\mathbf{e}_N$ 关联化"和它在源码里的样子，推导细节可暂时跳过，等真要读 Siconos/Pinocchio 源码时再回来。 - §2.4 的 $\sqrt2$ 数字和 §6 定理 5 务必记住——这是你将来 debug 足式打滑的第一反应。

给有经验者（要写求解器或读仿真器） - 把 §11 算例用代码实现一遍（累积项目 solve_ccp），它是理解所有接触求解器的最小可运行内核。 - 读 MuJoCo / Drake SAP / Siconos 三个仿真器的接触求解代码，对照 §0 表格理解它们各自选了哪个 Pareto 角落（可微/精确/中间）。 - 深入 §4.4 Alart-Curnier 与半光滑 Newton——这是现代高精度求解器（Pinocchio 3、Siconos）的核心，依赖专题 7 的 Clarke 广义 Jacobian。 - 做接触辨识/sim-to-real 时，时刻记住 §2.5 的 $O(h)$ 伪影——它是仿真与真实差异的一个系统性来源，不扣除它会把伪影当真实摩擦学进去。

研究方向提示 - 可微接触的梯度质量（§2.5 半光滑点处的次梯度选择）仍是活跃问题（专题 4）。 - 各向异性/黏附摩擦（§4.2/§4.3）在软体/微操作机器人里方兴未艾。 - 凸松弛伪影与物理准确性的权衡（Drake SAP 的柔性接触 vs Siconos 的精确 SOCP）是当前仿真器设计的核心张力。

版本信息速查¶

工具/库/文献	版本/年份	本章涉及处
MuJoCo	凸接触模型源自 Todorov ICRA 2014；当前文档 `mujoco.readthedocs.io`	§0、§2.5、§8
Drake	SAP 求解器自 v1.5.0（2022-07）起为默认；Castro-Permenter-Han IEEE T-RO 2023	§0、§2.5、§8
Bullet	Sequential Impulse + pyramid（Erwin Coumans）	§0、§2.4、§8
Siconos	Inria TRIPOP，Acary-Brogliato；Alart-Curnier 参考实现	§0、§2.3、§4.4、§8
Pinocchio	3.0+（`admm-solver.hpp`，含 de Saxcé 修正）；Carpentier et al.	§0、§2.3、§2.5、§8
Anitescu 凸松弛	Math. Program. 105, 2006	§2.5、§6
de Saxcé 双势	1991（与 Feng）/ 1998	§2.3
Stewart 病态性综述	SIAM Review 42(1), 2000	§0、§6
Goyal-Ruina 极限面	Wear 143, 1991	§3
Stewart-Trinkle LCP	IJNME, 1996	§2.4
MIT Cheetah Convex MPC	Di Carlo et al., IROS 2018（$k=4$ 金字塔实例）	§2.4、§7

本章完。 你从"摩擦为什么配得上独立一章"（§0 四重病态）出发，依次理解了它的几何（§2.1 二阶锥）、变分（§2.2 MDP、§2.3 de Saxcé）、计算（§2.4 多面体/SOCP、§2.5 CCP 凸松弛）三个抽象层；再从计算层继续下沉到代数（§2.6 Euclidean Jordan 代数谱分解——锥投影闭式、广义 Jacobian、二次收敛的地基）与微分（§2.7 隐函数定理对锥投影求梯度、随机光滑、桥接可微接触）。这条"几何 → 变分 → 凸松弛 → 代数 → 可微"的下沉链上，每一层都为下一层提供零件：§2.6 的锥投影 Jacobian 同时是半光滑 Newton 的核心与 §2.7 IFT 接触梯度的零件，最终在可微接触/CI-MPC 等下游全部组装。你也把它桥接到极限面/抓取（§3）、进阶推广（§4）、机器人实战（§7）与可微/不确定性下游。回到 §0 的元问题——现在你应该能拿起任意仿真器文档，在 30 分钟内定位它在"精度-速度-可微-鲁棒"四维权衡里选了哪个角落，并理解那个选择的每一个代价。更进一步：你还看清了贯穿全章最深的统一——非光滑性从物理（粘滑切换）一路投影到几何（锥面）、变分（目标变平）、代数（投影分段）、微分（梯度崩溃），全章始终在和"那一条粘滑切换线"打交道，只是每节用不同语言描述它。这就是本章的终点，也是专题 3 的起点。

外力 \(f\)	集值 Coulomb（真）	正则化 \(r_T=-\tanh(u_T/v_s)\)	黏性 \(r_T=-cu_T\)
\(0.0\)	\(r_T=0\)，\(u_T=0\)（静止）	\(r_T\approx0\)，\(u_T\approx0\)（近似静止）	\(r_T=0\)，\(u_T=0\)
\(0.5\)	\(r_T=-0.5\)，\(u_T=0\)（静摩擦顶住，不动）	\(r_T\approx-0.5\)，\(u_T=\) 小但非零（微蠕变）	\(r_T=-0.5\)，\(u_T=0.5/c\)（一直在动）
\(1.0\)	\(r_T=-1\)，\(u_T=0\)（临界，仍不动）	\(r_T\approx-1\)，\(u_T\) 稍大	\(u_T=1/c\)
\(1.5\)	\(r_T=-1\)，\(u_T>0\)（打滑，力饱和）	\(r_T\to-1\)，\(u_T\) 增大	\(u_T=1.5/c\)（力无饱和）
\(2.0\)	\(r_T=-1\)，\(u_T\) 更大（饱和）	\(r_T\to-1\)（渐近饱和）	\(r_T=-2\)（无上界，错！）

棱数 \(k\)	最差方向有效 \(\mu\)	\(\cos(\pi/k)\)	相对低估 \(1-\cos(\pi/k)\)	工程评价
3	\(0.500\,\mu\)	0.500	\(50.0\%\)	太粗，几乎不用
4（金字塔）	\(0.707\,\mu\)	\(0.707\)	\(29.3\%\)	足式 MPC 常用，对角方向严重低估
6	\(0.866\,\mu\)	0.866	\(13.4\%\)	折中
8	\(0.924\,\mu\)	0.924	\(7.6\%\)	较好，Bullet 高精度档
16	\(0.981\,\mu\)	0.981	\(1.9\%\)	接近圆锥
32	\(0.995\,\mu\)	0.995	\(0.5\%\)	基本等于圆锥

方向 \(\theta\)	到最近顶点角差	有效摩擦 \(\rho\)	相对真圆锥
\(0°\)（顶点）	\(0°\)	\(0.600\)	\(100\%\)（满值）
\(15°\)	\(15°\)	\(0.582\)	\(97\%\)
\(30°\)（边中点）	\(30°\)	\(0.520\)	\(87\%\)（最差）
\(45°\)	\(15°\)	\(0.582\)	\(97\%\)
\(60°\)（顶点）	\(0°\)	\(0.600\)	\(100\%\)

#	症状	可能原因	排查步骤	相关章节
1	足式机器人直行/侧移正常，\(45°\) 斜线打滑	\(k=4\) 金字塔对角方向把摩擦低估 \(1/\sqrt2\)（\(29.3\%\)）	1.确认摩擦约束用的是 \(k=4\) 金字塔；2.把控制器 \(\mu\) 改为 \(\mu/\sqrt2\) 或提高到 \(k=8\)；3.或旋转金字塔对准运动方向；4.重测斜线步态	§2.4
2	仿真中物体还没接触就被推开一点点	Anitescu 凸松弛的 forces-from-a-distance 伪影 \(\sim O(h\mu\\|\mathbf{u}_T\\|)\)	1.把步长 \(h\) 减半，看推开距离是否也大致减半（正比于 \(h\) → 确认是松弛伪影）；2.降低 \(\mu\) 或滑动速度验证；3.改用 Siconos SOCP（无此伪影）或减小 \(h\)/用柔性接触缓解	§2.5、§2.3
3	自己写的摩擦求解器不收敛或振荡	缺 de Saxcé 修正项，非关联律无变分结构	1.检查切向速度是否加了 \(\mu\\|\mathbf{u}_T\\|\mathbf{e}_N\)（\((2.18)\)）；2.检查投影是否投到正确的锥（力→\(K_\mu\)、修正速度→\(K_\mu^*\)）；3.检查 Delassus \(N\) 是否正定（雅可比是否列满秩）	§2.3、§2.5
4	静止物体在斜面上缓慢下滑（蠕变）	用了正则化摩擦（单值函数 \((2.9)\)），静摩擦消失	1.确认摩擦模型是否为 \(\tanh\)/分母加 \(\varepsilon\) 的正则化；2.减小正则化参数 \(\varepsilon\)/\(v_s\)（代价：刚性增大、变慢）；3.或换真集值/锥摩擦消除蠕变	§2.1 理论五
5	抓取规划判定 force closure 通过，实际一抓就掉	单点不滑 \(\ne\) 全局闭合；摩擦锥张不满旋量空间	1.检查是否只验了"每点在锥内"而漏了"凸包含原点邻域"；2.检查接触点是否共线/退化（无法抵抗某方向力矩）；3.算 \(Q_1\) 质量度量（凸包到原点最小距离）是否 \(>0\)	§3
6	提高金字塔棱数 \(k\) 后求解超时	\(k\) 太大致 LCP/QP 规模爆炸（\(k=8\) 时约 \(10\times\)）	1.确认 \(k\) 与精度需求匹配（误差 \(\sim1/k^2\)，\(k=8\) 已 \(7.6\%\)）；2.若 \(\mu\) 本身误差 \(>10\%\)，\(k>8\) 无意义；3.要更高精度改用 SOCP（锥维度不随精度膨胀）	§2.4
7	接触力求解给出法向力为负（拉力）	未约束 \(r_N\ge0\)，或误把 de Saxcé 虚拟法向速度当真实输出	1.检查锥约束是否含 \(r_N\ge0\)；2.检查是否把 \(\hat u_N\)（含虚拟项）当真实分离速度报给上层；3.若需真实拉力（黏附）才用带偏置的锥（§4.3）	§2.1、§2.3
8	sim-to-real：仿真里调好的 \(\mu\) 到真机不对	把仿真的 \(O(h)\) 伪影当成真实摩擦去匹配；或 \(\mu\) 随环境变化大	1.先在 \(h\to0\) 极限下标定 \(\mu\)（扣除伪影）；2.把 \(\mu\) 作不确定参数做域随机化；3.MPC 用 \(\mu\) 置信下界写约束	§2.5、§7（04 桥接）

抽象层	核心对象	回答的问题	对应节
几何层	二阶锥 \(K_\mu\)、对偶锥、法锥	摩擦约束"长什么形状"	§2.1
变分层	MDP、Gauss 原理、de Saxcé 双势	摩擦力"是哪个优化问题的解"	§2.2–§2.3
计算层	pyramidal LCP、SOCP、CCP、半光滑 Newton、SOCCP/Jordan 代数、可微接触梯度	摩擦"怎么落地到可求解、可微的代码"	§2.4–§2.7

维度	多面体 LCP 路线	真二阶锥 SOCP 路线
约束类型	线性（\(k\) 个不等式/母线）	二次锥约束 \(\\|\mathbf{r}_T\\|\le\mu r_N\)
求解器	Lemke / PATH / PGS	ECOS / Mosek / Clarabel / 锥 PGS
精度	各向异性，误差 \(1-\cos(\pi/k)\)	精确，各向同性
问题规模	\(k\) 倍变量膨胀（\(k=8\) 时 LCP 约大 \(10\times\)）	锥维度不膨胀
可解性理论	LCP 有限步终止（适当矩阵类）	SOCP 多项式时间，但锥互补需迭代
典型使用者	足式 Convex MPC、ODE、早期 Bullet	Siconos、Pinocchio 3、研究基准
何时选它	需实时、需 LCP 生态、\(k\) 适中可接受误差	需精确各向同性、求解器已就绪、能容忍迭代

机器人场景	用到本章哪个结果	具体形式	衔接章节
足式 Convex MPC	§2.4 内切 \(k=4\) 金字塔	每脚 4 不等式 \(\\|r_{T,x}\\|\le\mu r_N,\\|r_{T,y}\\|\le\mu r_N\)，\(\mu\) 取保守值补偿 \(\sqrt2\) 低估	05 足式 §80 接触力学
WBC（全身控制）摩擦约束	§2.1 摩擦锥 + §2.4 多面体	QP 不等式约束 \(G\mathbf{r}\le0\)（H-rep），分层优先级下保证不打滑	05 足式 §90 WBC/TSID
抓取 force closure	§2.1 锥内判据 + §3 凸包含原点	每指 \(\mathbf{r}_i\in\mathrm{int}\,K_{\mu_i}\) + 抓取映射凸包含 \(\mathbf{0}\)；\(Q_1\) 质量度量	05 足式抓取 / 操作
MuJoCo / Drake 仿真	§2.5 CCP 凸松弛 + §2.3 de Saxcé	凸 QP/无约束凸求解，forces-from-a-distance 伪影	专题 3 时步法、专题 4 可微接触
接触隐式 MPC（CI-MPC）	§2.5 互补/松弛 + §4.1 MDI	把接触互补作为优化约束/松弛，梯度依赖松弛化	专题 6 CI-MPC
Sim-to-Real 摩擦辨识	§2.5 伪影 + §2.1 \(\mu\) 不确定性	\(\mu\) 作为不确定参数域随机化；区分真实摩擦与 \(O(h)\) 伪影	04 不确定性（域随机化、参数辨识）
足式打滑检测/恢复	§2.1 判据 \((2.8)\)	实时监测 \(\\|\mathbf{r}_T\\|/r_N\) 接近 \(\mu\) → 触发恢复策略	05 足式容错控制

#	常见误解	正确理解	出处
1	Coulomb 律就是 \(\\|\mathbf{r}_T\\|\le\mu r_N\) 一个不等式	还需陈述 B（MDP/流动法则）决定力在锥内取哪一点；A 管可行域、B 管取值	§2.1、§2.2
2	摩擦锥是空心的（只有侧面）	是实心锥；内部对应粘滞、表面对应滑动	§2.1
3	摩擦系数 \(\mu\) 一定 \(<1\)	\(\mu\) 可 \(>1\)（硅胶可达 \(1.5\)–\(2\)），锥可比 \(45°\) 胖	§2.1
4	静止物块受到 \(\mu r_N\) 的摩擦力	静止时摩擦力按需供给，无外力则为零；只有滑动才取满 \(\mu r_N\)	§2.1、§2.2
5	摩擦力可以写成单值函数 \(\mathbf{r}_T=f(\mathbf{u}_T)\)	粘滞时多值（整个圆盘），单值函数无法表达；正则化会丢静摩擦、产生蠕变	§2.1
6	"最大耗散"意味着摩擦力总取最大值	最大化的是耗散功率 \(-\mathbf{s}^\top\mathbf{u}_T\)；粘滞时功率恒零、力不取满	§2.2
7	MDP 唯一确定摩擦力	粘滞时目标平、最优解是整个圆盘，不唯一	§2.2
8	关联流动是"正确"的，Coulomb 非关联是缺陷	关联流动预言滑动→法向膨胀飞起，物理错误；非关联才是物理真实	§2.3
9	de Saxcé 修正的虚拟法向速度是真实分离速度	纯计算构造，真实 \(u_N=0\)；误用会致虚假抬起	§2.3
10	增大金字塔棱数 \(k\) 总是免费的好事	每增一面 LCP 规模增大；精度按 \(1/k^2\) 衰减、收益递减，求解变慢	§2.4
11	内切/外切多面体差不多	内切=欠近似(保守安全)，外切=过近似(乐观危险)，安全结论相反	§2.4
12	多面体近似只影响精度不改定性	\(k=4\) 各向异性产生方向偏好（虚假定性行为），对称性从 \(O(2)\) 降到 \(k\) 重	§2.4
13	forces-from-a-distance 是碰撞检测 bug	凸松弛+有限步长的固有伪影 \(\sim O(h)\)，与碰撞检测无关	§2.5
14	凸松弛解就是精确解	只在 \(h\to0\) 渐近收敛；有限 \(h\) 差一个 \(O(h)\) 边界层	§2.5
15	各向异性/黏附摩擦需要全新理论	椭圆锥经线性变换即标准 Lorentz 锥，§2 理论普适；黏附只是平移顶点	§4

符号	含义	首次出现
\(r_N\)	法向反力标量（\(\ge0\)，只推不拉）	§2.1
\(\mathbf{r}_T\in\mathbb{R}^2\)	切向摩擦力向量	§2.1
\(\mathbf{r}=(r_N,\mathbf{r}_T)\in\mathbb{R}^3\)	完整接触力（冲量）	§2.1
\(u_N,\ \mathbf{u}_T,\ \mathbf{u}\)	法向分离速度、切向滑动速度、完整接触速度	§2.1
\(\mu\)	摩擦系数（\(=\tan\) 半顶角）	§2.1
\(K_\mu\)	摩擦锥 \(\{\\|\mathbf{r}_T\\|\le\mu r_N\}\)（二阶锥/冰激凌锥）	§2.1
\(\mathcal{Q}^{n+1}\)	标准 Lorentz/二阶锥 \(\{(t,\mathbf{x}):\\|\mathbf{x}\\|\le t\}\)	§2.1
\(K_\mu^*=K_{1/\mu}\)	摩擦锥的对偶锥	§2.1
\(\mathrm{int}\,K_\mu\)	摩擦锥内部（粘滞判据）	§2.1
\(\mathbb{D}_{\mu r_N}\)	半径 \(\mu r_N\) 的二维圆盘（锥的截面）	§2.2
\(N_C(\mathbf{x})\)	凸集 \(C\) 在点 \(\mathbf{x}\) 的法锥	§2.2
\(\mathrm{proj}_C\)	到凸集 \(C\) 的投影算子	§2.2
\(D\)（耗散功率）	\(-\mathbf{r}_T^\top\mathbf{u}_T\ge0\)	§2.2
\(\psi_C\)	凸集 \(C\) 的指示函数（\(0\)/\(+\infty\)）	§2.2
\(\hat{\mathbf{u}}=\mathbf{u}+\mu\\|\mathbf{u}_T\\|\mathbf{e}_N\)	de Saxcé 修正速度	§2.3
\(\mathbf{e}_N\)	法向单位向量 \((1,0,0)\)	§2.3
\(b(\mathbf{r},-\mathbf{u})\)	de Saxcé 双势	§2.3
\(\mathbf{d}_i,\ \beta_i\)	多面体母线方向、非负组合系数（V-rep）	§2.4
\(k\)	多面体棱数（金字塔面数）	§2.4
\(\mu\cos(\pi/k)\)	内切多面体最差方向有效摩擦系数	§2.4
\(N=D^\top M^{-1}D\)	Delassus 算子（\(\succ0\)）	§2.5
\(M,\ D,\ \mathbf{b}\)	质量矩阵、接触雅可比、自由速度项	§2.5
\(\boldsymbol{\Phi}(\mathbf{r})\)	CCP 中的 de Saxcé 修正项	§2.5
\(h\)	时间步长（伪影 \(\sim O(h)\)）	§2.5
\(\mathbf{x}\circ\mathbf{y}\)	二阶锥的 Jordan 积 \((\mathbf{x}^\top\mathbf{y},\,x_0\mathbf{y}_1+y_0\mathbf{x}_1)\)	§2.6
\(\lambda_{1,2}=x_0\pm\\|\mathbf{x}_1\\|\)	元素 \(\mathbf{x}\) 的 Jordan 特征值（永远只 2 个）	§2.6
\(\mathbf{c}_{1,2}=\tfrac12(1,\pm\hat{\mathbf{x}}_1)\)	谱幂等元（Jordan frame）	§2.6
\(\mathcal{Q}^n\)	标准二阶锥（Jordan 代数的对称锥）	§2.6
\(\nabla\,\mathrm{proj}_{\mathcal{Q}^n}\)	锥投影广义 Jacobian \((2.32)\)（半光滑 Newton 用）	§2.6
\(\theta\)	可微接触的参数（\(\mu\)/接触点/控制输入等）	§2.7
\(\Psi(\mathbf{r}^\star,\theta)\)	CCP 投影方程隐函数（IFT 求梯度）	§2.7
\(J=\nabla\,\mathrm{proj}_{K_\mu}\)	IFT 梯度里的锥投影 Jacobian 零件	§2.7
\(\bar{\mathbf{r}}_\sigma,\ \sigma\)	随机光滑接触力、平滑尺度超参	§2.7
\(\mathcal{L}\)	极限面（limit surface）	§3
\(\mathbf{w}=(\mathbf{f},\tau)\)	合力旋量（力+力矩）	§3
\(\mathbf{t}=(\mathbf{v},\omega)\)	滑动 twist（平移+自转）	§3
\(G_i\)	抓取映射矩阵（grasp map）	§3
\(d\mathbf{v},\ d\mathbf{r}\)	速度微分测度、冲量测度（MDI）	§4

定理/公式	一句话说明	对应节
Coulomb 集值律 \((2.3)\)	粘滞→锥内多值；滑动→锥面反平行于速度	§2.1
摩擦锥二阶锥性 \((2.4)\)	\(K_\mu\) 是 SOC 线性像，凸，半顶角 \(\arctan\mu\)	§2.1
对偶锥 \((2.7)\)	\(K_\mu^*=K_{1/\mu}\)，\(\mu=1\) 自对偶	§2.1
无滑判据 \((2.8)\)	\(\mathbf{r}\in\mathrm{int}\,K_\mu\Leftrightarrow\\|\mathbf{r}_T\\|<\mu r_N\Leftrightarrow\) 粘滞	§2.1
MDP \((2.10)\)	摩擦力是给定速度下耗散功率最大的合法力	§2.2
法锥形式 \((2.14)\)	\(-\mathbf{u}_T\in N_{\mathbb{D}_{\mu r_N}}(\mathbf{r}_T)\)，求解器心脏	§2.2
MDP-Gauss 对偶 \((2.13)\)	力视角(max 耗散) ⟷ 速度视角(min 约束偏差)	§2.2
de Saxcé 修正 \((2.18)\)	\(\hat{\mathbf{u}}=\mathbf{u}+\mu\\|\mathbf{u}_T\\|\mathbf{e}_N\) 把非关联律关联化	§2.3
de Saxcé 双势 \((2.19)\)	Coulomb 律的（广义）变分结构存在性	§2.3
内切误差 \((2.22)(2.23)\)	最差方向有效 \(\mu=\mu\cos(\pi/k)\)，\(k=4\) 低估 \(29.3\%\)	§2.4
Delassus 算子 \((2.24)\)	\(N=D^\top M^{-1}D\succ0\)，接触系统矩阵	§2.5
CCP / 凸松弛 \((2.25)(2.26)\)	锥互补 ⟺ 凸 QP；必有唯一解、PGS 收敛	§2.5
forces-from-a-distance	凸松弛伪影 \(\sim O(h\mu\\|\mathbf{u}_T\\|)\)，\(h\to0\) 消失	§2.5
Jordan 谱分解 \((2.29)\)	\(\mathbf{x}=\lambda_1\mathbf{c}_1+\lambda_2\mathbf{c}_2\)；在锥内 ⟺ 特征值非负	§2.6
锥投影闭式 \((2.31)\)	截断负特征值；三情形（内/顶点/锥面）	§2.6
锥投影 Jacobian \((2.32)\)	半光滑 Newton 与 IFT 梯度的公共零件	§2.6
强半光滑（Sun–Sun 2005）	FB 锥 C-函数处处强半光滑 ⟹ Newton 二次收敛	§2.6
IFT 接触梯度 \((2.34)(2.35)\)	对投影方程用隐函数定理；零件是 \((2.32)\)	§2.7
随机光滑梯度 \((2.37)\)	高斯卷积抹平非光滑，得优化友好的代理梯度	§2.7
Painlevé 佯谬（定理 1）	经典刚体+Coulomb 可无解/多解	§6
极限面流动法则 \((3.2)\)	滑动 twist 是极限面外法向；椭球近似 \((3.3)\)	§3
Alart-Curnier \((4.2)\)	投影方程 \(\mathbf{r}=\mathrm{proj}_{K_\mu}(\mathbf{r}-\rho\mathbf{u})\)，半光滑 Newton 用	§4

模块	实现内容	对应本章
`FrictionCone(mu)`	摩擦锥类：成员函数 `contains(r)` 判断 \(\mathbf{r}\in K_\mu\)、`is_strictly_inside(r)` 判断 \(\in\mathrm{int}\,K_\mu\)（粘滞判据 \((2.8)\)）	§2.1
`dual_cone()`	返回 \(K_{1/\mu}\)，验证 \(K_\mu^*=K_{1/\mu}\)	§2.1
`project_to_cone(z, w)`	二阶锥投影 \((11.1)\)（三分支：锥内/极锥/侧面）	§2.2、§11
`pyramid_constraints(k)`	生成内切 \(k\) 棱金字塔的 V-rep 母线 \((2.20)\) 与 H-rep 不等式 \((2.21)\)	§2.4
`pyramid_error(k)`	返回 \(\mu\cos(\pi/k)\) 与相对误差 \(1-\cos(\pi/k)\)	§2.4
`de_saxce_correct(u, mu)`	速度修正 \(\hat{\mathbf{u}}=\mathbf{u}+\mu\\|\mathbf{u}_T\\|\mathbf{e}_N\) \((2.18)\)	§2.3
`solve_ccp(N, b, mu)`	投影梯度求解单接触 CCP \((2.26)\)，返回 \(\mathbf{r}\) 与粘/滑状态	§2.5、§11

专题 2 · 摩擦锥理论与凸松弛：Coulomb 摩擦的几何结构、对偶原理与优化视角¶

前置自测¶

本章目标¶

本章知识导航¶

前置知识桥接¶

如果跳过本章会怎样¶

预计阅读时间¶

§0 为什么摩擦配得上独立一章¶

四重病态 → 全章解药的路线图¶

§2.1 Coulomb 摩擦律与摩擦锥的几何结构 ⭐⭐¶

动机：一张被擦掉一半的实验记录¶

如果不这样做会怎样：三种"想当然"的错误模型¶

历史：从经验律到集值律的三百年¶

理论一：Coulomb 律的完整集值形式¶

深入理解：摩擦系数 \(\mu\) 的微观来源与"单向调制"的物理根源¶

深入理解：静摩擦系数 vs 动摩擦系数，以及为什么本章用单一 \(\mu\)¶

理论二：摩擦锥 \(K_\mu\) 是一个二阶锥（Lorentz 冰激凌锥）¶

理论三：对偶锥与自对偶性¶

理论四：无滑动判据 \(\mathbf{r} \in \mathrm{int}\,K_\mu\)¶

理论四补：摩擦锥与法向 Signorini 如何"合体"成完整接触律¶

理论五：为什么"丢信息"——集值映射不能写成单值函数¶

⚠️ 常见陷阱¶

练习¶

代码验证（可选，理论结论的数值确认）¶

§2.2 最大耗散原理（MDP）：把"判断式"变成"优化问题" ⭐⭐⭐¶

过渡：从"在哪个集合"到"取哪一点"¶

动机：摩擦在"偷"能量，而且偷得最多¶

反面：如果不用 MDP，你被迫维护一棵 if-else 决策树¶

历史：Moreau 的凸分析革命与 Goyal–Ruina 的极限面¶

理论：从 MDP 用两行 KKT 推出全部粘滑行为¶

理论：MDP 与 Gauss 最小约束原理的原始-对偶关系¶

理论：Gauss 最小约束原理的完整推导（与 MDP 对偶配对）¶

深入对比：集值摩擦 vs 正则化摩擦的定量差异¶

理论：MDP 的次微分形式（连接专题 70 非光滑分析）¶

理论：投影方程的等价性证明（变分刻画）¶

⚠️ 常见陷阱¶

练习¶

§2.3 de Saxcé 双势：救回非关联流动的变分结构 ⭐⭐⭐⭐¶

过渡与动机：MDP 看似完美，为什么还需要第三节？¶

反面：标准凸对偶在哪里"破裂"——关联 vs 非关联¶

反面的代价：失去变分结构意味着什么¶

历史：de Saxcé 与双势方法（1991–1998）¶

理论：de Saxcé 修正——虚拟法向速度 \(\mu\|\mathbf{u}_T\|\mathbf{e}_N\)¶

理论：de Saxcé 双势的显式形式¶

数值演示：亲眼看一次非关联失配与 de Saxcé 修复¶

⚠️ 常见陷阱¶

练习¶

§2.4 多面体近似 vs 二阶锥：几何近似的两条工程路线 ⭐⭐⭐¶

过渡与动机：圆锥很美，但 LCP 求解器只吃多面体¶

反面：直接用圆锥约束会遇到什么困难¶

历史：Stewart–Trinkle 与多面体摩擦锥的黄金二十年¶

理论一：内切多面体与外切多面体¶

理论二：内切误差 \(\mu\cos(\pi/k)\) 的推导（核心）¶

理论二补：外切多面体的误差与"内外夹逼"¶

理论三：\(k=4\) 金字塔的 \(\sqrt2\) 各向异性伪影¶

理论四：LCP 路线 vs SOCP 路线的系统选型¶

算例：足式 MPC 里"每脚 4 不等式"的完整写出¶

⚠️ 常见陷阱¶

练习¶

代码验证（可选，多面体误差的数值确认）¶

§2.5 锥互补问题（CCP）与凸松弛代价：现代凸接触仿真的核心 ⭐⭐⭐⭐¶

过渡与动机：明明可解，为什么还要"松弛"？¶

反面：不做凸松弛，直接解非凸 NCP 会怎样¶

历史：从 Stewart-Trinkle 的 LCP 到 Anitescu 的凸松弛¶

理论一：锥互补问题（CCP）的形式¶

理论补：为什么"多面体摩擦 LCP"的系统矩阵非对称（具体看一遍）¶

理论二：凸松弛的代价——"forces from a distance"（隔空作用力）¶

理论补：边界层厚度的定量推导与 sim-to-real 影响¶

理论三：半光滑 Newton 法——求解 CCP 的另一条路¶

理论补：多接触 PGS 的"逐点扫描"结构¶

⚠️ 常见陷阱¶

练习¶

§2.6 SOCCP 与 Euclidean Jordan 代数：3D 摩擦的真实代数结构 ⭐⭐⭐⭐¶

过渡与动机：§2.5 欠了三笔"代数债"¶

反面：不认代数结构，3D 锥投影会被你拆成"错误的两步"¶

历史：从 Nesterov–Todd 到 Faraut–Korányi 的代数统一（1990s）¶

理论一：二阶锥的 Jordan 代数与谱分解¶

理论二：用谱分解算锥投影（闭式，还掉第一笔债）¶

理论三：锥投影的广义 Jacobian（还掉第二笔债）¶

理论四：强半光滑与二次收敛（还掉第三笔债）¶