多线性代数、张量积与外代数¶
课程定位|机器人学博士数学基础 · A 模块(高等线性代数)· 第 6 章 文档类型:理论教学(以数学推导为核心,代码仅作数值验证,text:code \(\ge\) 85:15) 前置章节:
20_向量空间与线性变换.md(向量空间、线性映射、对偶空间 \(V^*\))、30_内积空间与伴随算子.md(内积、Riesz 表示、伴随算子 \(T^*\))、40_谱定理SVD与极分解.md(谱定理、SVD、行列式的矩阵定义)、50_极小多项式与Jordan标准形.md(特征多项式、Cayley-Hamilton) 后继章节:70_点集拓扑.md、80_抽象代数.md、第一层(微分几何、李群、微分形式) 难度标记:⭐ 必学 · ⭐⭐ 核心 · ⭐⭐⭐ 进阶 · ⭐⭐⭐⭐ 研究级
前置自测 ⭐¶
📋 答不出 \(\ge 2\) 题 \(\to\) 先回前置章节复习再来。 本章从"多线性"出发构建张量积与外代数,所有推导都以线性映射、对偶空间、内积为基础工具。
| 编号 | 问题 | 答不出 \(\to\) 回顾 |
|---|---|---|
| 1 | 对偶空间 \(V^*\) 的元素是什么?给定 \(V\) 的基 \(\{e_1,\ldots,e_n\}\),对偶基 \(\{e^1,\ldots,e^n\}\) 满足什么关系? | 20_向量空间 §对偶空间 |
| 2 | Riesz 表示定理说了什么?它给出了 \(V\) 与 \(V^*\) 之间怎样的联系? | 30_内积空间 §Riesz |
| 3 | 内积 \(\langle u,v \rangle\) 关于每个变量分别是什么?如果固定 \(u\),映射 \(v \mapsto \langle u,v \rangle\) 是线性的还是共轭线性的? | 30_内积空间 §内积公理 |
| 4 | 行列式 \(\det(A)\) 满足 \(\det(AB)=\det(A)\det(B)\),但你能从排列公式直接看出这一点吗?觉得困难的话,本章会给出一行证明。 | 40_谱定理SVD + 本章 §6 |
| 5 | 什么是线性映射的像(range)和核(kernel)?如果 \(\{v_1,\ldots,v_k\}\) 线性无关,\(T\) 的限制在这组向量上一定是单射吗? | 20_向量空间 §线性映射 |
自测答案要点(先自己想,再对照):
- \(V^*=L(V,F)\) 是所有线性泛函构成的空间;对偶基满足 \(e^i(e_j)=\delta^i_j\)(Kronecker \(\delta\))。
- Riesz 表示定理说每个线性泛函 \(\varphi \in V^*\) 唯一地表示为 \(\varphi(\cdot)=\langle u,\cdot \rangle\),从而给出共轭线性同构 \(V \cong V^*\)。
- 内积关于第一变量线性,第二变量共轭线性(本课程约定)。固定 \(u\) 时,\(v \mapsto \langle u,v \rangle\) 是共轭线性的(实数域退化为线性)。
- 从排列公式 \(\det(A)=\sum_\sigma \operatorname{sgn}(\sigma)\prod_i a_{i,\sigma(i)}\) 直接推导乘法性需要冗长的组合论证。本章用外代数一行完成。
- 像 \(\operatorname{range}(T)=\{Tv:v\in V\}\),核 \(\ker(T)=\{v:Tv=0\}\)。\(T\) 限制在线性无关组上不一定是单射——这组向量可能部分在核中。
本章目标 ⭐¶
学完本章后,你应该能够:
- **定义多线性映射**并区分它与线性映射的本质差异,解释为什么行列式、叉积、惯性张量都是多线性对象。
- 从泛性质出发构造张量积 \(V \otimes W\),完成从自由向量空间到商空间的完整推导,并证明 \(\dim(V \otimes W) = \dim V \cdot \dim W\)。
- 区分简单张量与一般张量,解释为什么"并非所有张量都可分解"以及这与量子纠缠的联系。
- 构建外代数 \(\Lambda(V)\) 并推导楔积的基本性质,包括分级反交换律 \(\alpha \wedge \beta = (-1)^{pq}\beta \wedge \alpha\)。
- 用外代数给出行列式的无坐标定义,并一行证明乘法性 \(\det(AB)=\det(A)\det(B)\)。
- **推导 Hodge 星算子**并解释叉积 \(u \times v = *(u \wedge v)\) 为何是三维空间的偶然现象。
- 掌握指标记号与 Einstein 求和约定,理解协变与逆变的区别以及度量张量的升降指标机制。
- **认识 Clifford 代数**与四元数的联系,理解 \(\operatorname{Spin}(3) \cong SU(2)\) 对 \(SO(3)\) 的双重覆盖。
本章知识导航 ⭐¶
本章是高等线性代数(A2 模块)的收官之作。前四章(A2a--A2d)把"单线性"代数做到了极致:向量空间、对偶、内积、谱、Jordan 标准形。本章的分水岭是从线性跳到多线性——处理两个以上向量同时输入的对象。行列式、叉积、惯性张量、质量矩阵、刚体动能——这些机器人学的日用品全部是多线性的。
本章交付三件事:
- 补全行列式的黑箱:前章(A2c/A2d)使用行列式定义特征多项式和 SVD,但行列式本身依赖坐标。本章用外代数 \(\Lambda^n\) 给出无坐标定义。
- 把"张量"从物理符号提升为严格数学对象:张量积的泛性质让多线性映射获得统一的代数框架。
- 为后续微分形式与李代数铺设纯代数脚手架:第一层的微分形式 \(\Omega^k(M)\)、Lie 括号 \([\cdot,\cdot]\)、联络 \(\nabla\) 都是本章工具的流形版本。
═══ 第一部分:多线性映射与双线性型 (§1–§2) ═══
§1 多线性映射 ──→ §2 双线性型与 Sylvester 惯性律
│
═══ 第二部分:张量积 (§3–§5) ═══
§3 张量积 V⊗W(泛性质与构造)──→ §4 线性映射的张量积 ──→ §5 迭代张量积
│
═══ 第三部分:对称与反对称 (§6–§7) ═══ │
§6 对称与反对称张量 ←─────────────────────────────────────────┘
│
└──→ §7 张量代数 T(V)
│
═══ 第四部分:外代数与楔积 (§8–§10) ═══
§8 楔积定义 ──→ §9 外代数 Λ(V) ──→ §10 基与维数
│
═══ 第五部分:行列式的无坐标理论 (§11–§14) ═══
§11 行列式 = Λⁿ 上的标量 ──→ §12 行列式性质 ──→ §13 体积与定向
│ │
└──→ §14 余因子矩阵与 Cramer 法则 │
│
═══ 第六部分:楔积的几何应用 (§15–§17) ═══ │
§15 叉积 = *(u∧v) ←────────────────────────────────┘
│
└──→ §16 内积算子 ι_v ──→ §17 Hodge 星算子
═══ 第七部分:指标语言与张量分析 (§18–§20) ═══
§18 Einstein 求和 ──→ §19 度量张量与升降指标 ──→ §20 张量缩并与迹
═══ 第八部分:进阶代数 (§21–§22) ═══
§21 对称代数 S(V) ──→ §22 Clifford 代数与 Spin 群
推荐阅读路径:
- 首次精读(主干):§1 \(\to\) §2 \(\to\) §3 \(\to\) §5 \(\to\) §6 \(\to\) §8 \(\to\) §10 \(\to\) §11 \(\to\) §12 \(\to\) §15 \(\to\) §17 \(\to\) §18 \(\to\) §19。这条线串起"多线性 \(\to\) 张量积 \(\to\) 外代数 \(\to\) 行列式 \(\to\) Hodge 星 \(\to\) 指标语言"。
- 进阶补全(二读):§4(Kronecker 积)、§7(张量代数)、§13--§14(体积/Cramer)、§16(内积算子)、§20(缩并与迹)、§21--§22(Clifford 代数)。
- 速查回头:遇到微分形式回来看 §8--§10;遇到指标记号回来看 §18--§19;遇到四元数回来看 §22。
前置知识桥接 ⭐¶
本章把前四章的工具从"单线性"升级到"多线性"。在深入之前,先重新激活三个关键概念:
回顾 20_向量空间与线性变换.md:对偶空间 \(V^*\)。 对偶空间 \(V^*=L(V,F)\) 是所有线性泛函构成的空间。给定 \(V\) 的基 \(\{e_1,\ldots,e_n\}\),对偶基 \(\{e^1,\ldots,e^n\}\) 满足 \(e^i(e_j)=\delta^i_j\)。在那里我们用对偶空间分析了零化子和维数公式。本章我们需要对偶空间的两个新角色:(1) 张量积 \(V^* \otimes W \cong \operatorname{Hom}(V,W)\) 把线性映射空间统一到张量框架;(2) 外幂 \(\Lambda^k(V^*)\) 成为微分 \(k\)-形式的代数模型。
回顾 30_内积空间与伴随算子.md:内积与 Riesz 表示。 内积 \(\langle\cdot,\cdot\rangle\) 是正定对称(实)或 Hermite(复)双线性型。Riesz 表示定理给出共轭线性同构 \(V \cong V^*\)。本章将这个故事推广到两个方向:(1) 把"双线性"本身作为研究对象(§1--§2),而不只是工具;(2) 把 Riesz 同构用指标语言重述为"音乐同构" \(\flat\) 和 \(\sharp\)(§19)。
回顾 40_谱定理SVD与极分解.md:行列式。 在那里行列式 \(\det(A)\) 通过排列公式 \(\det(A)=\sum_\sigma \operatorname{sgn}(\sigma)\prod_i a_{i,\sigma(i)}\) 定义——依赖于坐标选择。我们用行列式定义了特征多项式、证明了 \(\det(AB)=\det(A)\det(B)\)(虽然证明并不优雅)。本章将给出行列式的真正定义:它是 \(\Lambda^n(T)\) 在一维空间 \(\Lambda^n(V)\) 上的作用标量,不依赖任何基的选择,乘法性是函子性的直接推论。
如果跳过本章会怎样 ⭐¶
不学本章,后续会在以下三个具体场景中卡住:
- 场景一:微分形式变成天书。 第一层(微分几何)的微分形式 \(\omega \in \Omega^k(M)\) 是外代数丛 \(\Lambda^k(T^*M)\) 的截面。如果你不理解楔积 \(\wedge\)、分级反交换律、Hodge 星 \(*\),那么 Stokes 定理、de Rham 上同调、Cartan 魔法公式都无从入手。
- 场景二:张量的上下标让你彻底迷路。 机器人动力学和广义相对论中遍布 \(T^{ij}_{\ \ k}\)、\(g_{ij}\)、\(\Gamma^i_{jk}\) 这样的指标表达式。不理解协变/逆变、Einstein 求和、升降指标,你只能机械地记忆公式而无法理解"为什么一个指标在上面、另一个在下面"。
- 场景三:不知道行列式到底是什么。 前几章用排列公式定义行列式,但那只是计算工具,不是概念本质。本章揭示行列式的真正身份:它是线性映射在最高外幂上的作用——一个关于体积和定向的几何量。不理解这一点,你就无法明白为什么 \(\det(R)=+1\) 定义了"保持定向"的旋转。
预计阅读时间 ⭐¶
| 阅读方式 | 时间 | 适合谁 |
|---|---|---|
| 精读(含推导与练习) | 12--16 小时 | 需要深入理解张量积和外代数的读者 |
| 速读(跳过进阶证明) | 6--8 小时 | 有抽象代数基础的读者 |
| 速查(只看定义、定理和速查表) | 30--45 分钟 | 遇到具体问题时回来查 |
第一部分:多线性映射与双线性型¶
§1 多线性映射 ⭐⭐¶
§1.1 动机:为什么线性不够用¶
前四章的所有对象——线性映射 \(T:V \to W\)、对偶空间 \(V^*\)、伴随 \(T^*\)——都是关于单个向量的线性函数。但机器人学中大量的核心对象同时依赖**两个或更多**向量,并且对每个变量分别线性:
- 内积 \(\langle u,v \rangle\):固定 \(u\) 对 \(v\) 线性,固定 \(v\) 对 \(u\) 线性(即双线性),它把两个向量压缩成一个标量。
- 叉积 \(u \times v\):固定 \(u\) 对 \(v\) 线性,固定 \(v\) 对 \(u\) 线性,它把两个三维向量变成另一个三维向量。
- 行列式 \(\det(v_1,\ldots,v_n)\):把 \(n\) 个向量映射为一个标量,对每个 \(v_i\) 分别线性。
- 动能 \(T = \frac{1}{2}\dot{q}^\top M(q)\dot{q}\):关于 \(\dot{q}\) 是二次的——它是双线性型 \(B(\dot{q}_1,\dot{q}_2) = \dot{q}_1^\top M(q)\dot{q}_2\) 的对角值 \(B(\dot{q},\dot{q})\)。
这些对象有一个共同特征:它们不是"整体线性"的。例如 \(\det(cv_1,v_2,\ldots,v_n) = c\det(v_1,v_2,\ldots,v_n)\)(对第一个变量齐次),但 \(\det(v_1+v_1',v_2,\ldots,v_n) = \det(v_1,v_2,\ldots,v_n) + \det(v_1',v_2,\ldots,v_n)\)(对第一个变量可加)——它对**每个变量分别**线性,而不是对所有变量的"组合"线性。
本质洞察:从线性到多线性,不是简单的"推广",而是质的飞跃。线性映射 \(T(cv+w)=cT(v)+T(w)\) 只涉及一个输入。多线性映射涉及多个输入之间的**耦合**——正是这种耦合产生了行列式(体积)、楔积(定向面积)、张量(多方向信息),这些都是单线性映射无法表达的几何量。
§1.2 多线性映射的定义¶
定义(多线性映射,Multilinear Map):设 \(V_1, V_2, \ldots, V_k, W\) 是域 \(F\) 上的向量空间。映射
称为**\(k\)-线性映射**(\(k\)-linear map,或多线性映射),如果对每个 \(i \in \{1,\ldots,k\}\),固定其他所有变量时,\(f\) 关于第 \(i\) 个变量是线性的。即对所有 \(v_j \in V_j\)(\(j \neq i\))、\(v_i, v_i' \in V_i\)、\(c \in F\):
\(k=2\) 时称**双线性**(bilinear),\(k=3\) 时称**三线性**(trilinear),等等。
阶段小结:多线性映射是对每个输入槽分别线性的映射。它不是 \(V_1 \oplus \cdots \oplus V_k \to W\) 的线性映射——后者只要求整体线性,前者要求逐槽线性,条件严格得多。
§1.3 多线性映射与线性映射的本质区别¶
这个区别值得展开讨论,因为初学者经常混淆。考虑 \(f: V \times W \to U\) 双线性与 \(g: V \oplus W \to U\) 线性:
- 线性映射 \(g\) 满足 \(g(c_1 v_1 + c_2 v_2, c_3 w_1 + c_4 w_2) = c_1 g(v_1,0) + c_2 g(v_2,0) + c_3 g(0,w_1) + c_4 g(0,w_2)\)。它是"各分量独立贡献"的。
- 双线性映射 \(f\) 满足 \(f(c_1 v_1 + c_2 v_2, c_3 w_1 + c_4 w_2) = c_1 c_3 f(v_1,w_1) + c_1 c_4 f(v_1,w_2) + c_2 c_3 f(v_2,w_1) + c_2 c_4 f(v_2,w_2)\)。注意**交叉项**的出现——这就是"耦合"。
类比:线性映射像加法,双线性映射像乘法。\(a(x+y) = ax + ay\)(线性),但 \((a+b)(x+y) = ax + ay + bx + by\)(双线性展开出交叉项)。这个类比的边界在于:双线性映射的"乘法"不需要交换,也不需要结合,它只保证分别对每个因子线性。
§1.4 多线性映射空间¶
所有 \(k\)-线性映射 \(V_1 \times \cdots \times V_k \to W\) 构成一个向量空间,记为 \(\operatorname{Mult}(V_1,\ldots,V_k;W)\)。加法和数乘逐点定义:
维数:选定各 \(V_i\) 的基 \(\{e^{(i)}_{j_i}\}\),一个 \(k\)-线性映射由其在所有基元素组上的值 \(f(e^{(1)}_{j_1},\ldots,e^{(k)}_{j_k})\) 完全确定。因此
特别地,\(\dim \operatorname{Mult}(V_1,\ldots,V_k;F) = \prod_{i=1}^k \dim V_i\)。
§1.5 经典例子¶
例 1:点积(对称双线性型)。 标准内积 \(\langle u,v \rangle = \sum_{i=1}^n u_i v_i\) 是 \(\mathbb{R}^n \times \mathbb{R}^n \to \mathbb{R}\) 的双线性映射,且满足对称性 \(\langle u,v \rangle = \langle v,u \rangle\)。
例 2:叉积(反对称双线性映射)。 \(u \times v: \mathbb{R}^3 \times \mathbb{R}^3 \to \mathbb{R}^3\) 满足 \(u \times v = -(v \times u)\),因此是反对称的。它对每个变量线性,但结果不是标量而是向量。
例 3:行列式(\(n\)-重反对称多线性型)。 \(\det: \underbrace{F^n \times \cdots \times F^n}_{n} \to F\) 是 \(n\)-线性且完全反对称的——交换任意两个输入,结果变号。
例 4:Curry 化同构。 存在自然同构
将双线性映射 \(f: V \times W \to U\) 与"返回线性映射的线性映射" \(\hat{f}: V \to \operatorname{Hom}(W,U)\) 对应,其中 \(\hat{f}(v)(w) = f(v,w)\)。这是函数式编程中 Curry 化的数学原型,也是 §3 张量积泛性质的预演。
§1.6 机器人学中的多线性对象¶
机器人学中到处隐藏着多线性映射:
| 对象 | 类型 | 多线性性质 |
|---|---|---|
| 内积 \(\langle u,v \rangle\) | 双线性 \(V \times V \to \mathbb{R}\) | 对称 |
| 叉积 \(u \times v\) | 双线性 \(\mathbb{R}^3 \times \mathbb{R}^3 \to \mathbb{R}^3\) | 反对称 |
| 行列式 \(\det(v_1,\ldots,v_n)\) | \(n\)-线性 \((F^n)^n \to F\) | 完全反对称 |
| 质量矩阵 \(\dot{q}^\top M(q)\dot{q}\) | 双线性型 \(T_qQ \times T_qQ \to \mathbb{R}\) | 对称正定 |
| Yoshikawa 可操作度 \(\sqrt{\det(JJ^\top)}\) | 通过 \(\Lambda^n\) 的合成 | 由 \(n\)-线性行列式诱导 |
应用视角:Jacobian \(J\) 本身是线性映射 \(J: T_qQ \to T_xM\),但"可操作性椭球体积" \(\sqrt{\det(JJ^\top)}\) 把 \(J\) 的列通过 \(n\)-线性的 \(\Lambda^n\) 压成标量——这是 Yoshikawa 可操作度的多线性本质。
⚠️ 常见陷阱¶
💡 概念误区 1:混淆"多线性"与"线性" 新手想法:双线性映射 \(f: V \times W \to U\) 就是 \(V \oplus W \to U\) 的线性映射。 实际上:两者维数就不同。\(\dim \operatorname{Hom}(V \oplus W, U) = (\dim V + \dim W)\dim U\),而 \(\dim \operatorname{Mult}(V,W;U) = (\dim V)(\dim W)\dim U\)。维数的"加法"变成了"乘法"——这正是张量积的代数本质。 正确理解:多线性是比线性更强的条件。直和上的线性是"分量独立",乘积上的多线性是"分量耦合"。
🧠 思维陷阱 1:以为多线性映射可以像线性映射一样"提取公因子" 新手想法:\(f(u+v, w) = f(u,w) + f(v,w)\),所以 \(f(cu, cv) = c^2 f(u,v)\)? 实际上:确实如此!\(f(cu,cv) = c f(u,cv) = c \cdot c f(u,v) = c^2 f(u,v)\)。这不是错误,但要注意 \(f(cu+dv, w) = cf(u,w) + df(v,w)\),而**不是** \((c+d)f(u+v,w)/2\) 之类的错误简化。多线性映射的齐次性是**逐变量**的。
§1.7 多线性映射与线性映射的维数对比¶
为了加深理解,我们把两种空间的维数放在一起比较:
| 空间 | 维数 | 公式性质 |
|---|---|---|
| \(\operatorname{Hom}(V \oplus W, U)\) | \((\dim V + \dim W) \cdot \dim U\) | 加法 |
| \(\operatorname{Mult}(V, W; U)\) | \((\dim V) \cdot (\dim W) \cdot \dim U\) | 乘法 |
维数从"加法"变成"乘法"——这是多线性映射的核心数学特征。张量积(§3)的维数公式 \(\dim(V \otimes W) = \dim V \cdot \dim W\) 正是这个"乘法"的体现。
考虑一个具体的数值例子。设 \(V = \mathbb{R}^3\), \(W = \mathbb{R}^2\), \(U = \mathbb{R}\)。则:
- 线性映射 \(V \oplus W \to U\) 的空间维数 \(= (3+2) \cdot 1 = 5\)
- 双线性映射 \(V \times W \to U\) 的空间维数 \(= 3 \cdot 2 \cdot 1 = 6\)
5 vs 6——维数不同,两者当然不可能等同!双线性映射空间"更大"是因为它包含了两个输入之间的耦合信息。
如果不引入多线性映射会怎样? 我们只能在 \(V \oplus W\) 上做线性运算,那么两个输入的耦合信息(如 \(v_1 w_2 - v_2 w_1\) 这种"交叉项")将无法被表达。行列式、叉积、动能——所有这些涉及变量耦合的量都将失去统一的代数框架。
练习¶
- (推导题) 证明:如果 \(f: V \times W \to U\) 是双线性映射,且 \(f(v,w)=0\) 对所有 \(w \in W\) 成立,则 \(v=0\) 或 \(f\) 不是非退化的。给出"非退化双线性映射"的精确定义。
- (开放思考题) 三线性映射 \(f: V \times V \times V \to F\) 的"对称"和"反对称"该如何定义?有多少种不同的对称类型?(提示:对称群 \(S_3\) 的不可约表示。)
- (推导题) 验证 Curry 化同构 \(\operatorname{Mult}(V,W;U) \cong \operatorname{Hom}(V, \operatorname{Hom}(W,U))\):写出两个方向的映射并验证它们互逆。(在草稿纸上完成。)
§2 双线性型与 Sylvester 惯性律 ⭐⭐¶
§2.1 动机:从内积到一般双线性型¶
30_内积空间与伴随算子.md 中我们定义了**正定对称双线性型**(即内积)。但物理和工程中大量出现不正定的双线性型:
- Minkowski 度量 \(\eta = \operatorname{diag}(-1,+1,+1,+1)\) 是 Lorentz 空间的双线性型,签名 \((1,3)\),不正定。
- 辛形式 \(\omega(u,v) = u^\top J v\)(\(J = \begin{pmatrix} 0 & I \\ -I & 0 \end{pmatrix}\))是反对称非退化双线性型,在 Hamilton 力学中无处不在。
- 二次型 \(Q(v) = v^\top A v\) 出现在优化的二阶条件(Hessian)、Lyapunov 稳定性分析中。
如果只研究正定内积,我们会错过这些重要对象。本节把双线性型从正定的特例推广到一般情形。
§2.2 双线性型的定义与矩阵表示¶
定义:域 \(F\) 上向量空间 \(V\) 上的**双线性型**(bilinear form)是双线性映射 \(B: V \times V \to F\)。
给定 \(V\) 的基 \(\{e_1,\ldots,e_n\}\),\(B\) 由矩阵 \(M = (m_{ij})\) 表示:
基变换:若新基 \(\{\tilde{e}_j\}\) 满足 \(\tilde{e}_j = \sum_i P_{ij} e_i\)(即基变换矩阵为 \(P\)),则
这称为**合同变换**(congruence)。注意与相似变换 \(P^{-1}MP\) 的区别:
| 变换类型 | 公式 | 保持不变的 | 何时出现 |
|---|---|---|---|
| 相似 | \(P^{-1}MP\) | 特征值、迹、行列式 | 线性映射 \(T\) 在不同基下的矩阵 |
| 合同 | \(P^\top MP\) | 签名(正/负/零特征值个数) | 双线性型 \(B\) 在不同基下的矩阵 |
本质洞察:相似变换和合同变换的区别反映了线性映射与双线性型的根本差异。线性映射 \(T: V \to V\) 吃一个向量吐一个向量,基变换时输入和输出各变换一次(\(P^{-1}\) 和 \(P\))。双线性型 \(B: V \times V \to F\) 吃两个向量吐一个标量,基变换时两个输入各变换一次(\(P^\top\) 和 \(P\))。
§2.3 对称型、反对称型、非退化性¶
对称双线性型:\(B(u,v) = B(v,u)\),等价于矩阵 \(M\) 对称(\(M = M^\top\))。
反对称双线性型(又称斜对称):\(B(u,v) = -B(v,u)\),等价于矩阵 \(M\) 反对称(\(M = -M^\top\))。在 \(\operatorname{char}(F) \neq 2\) 时,\(B(v,v) = -B(v,v) = 0\)。
非退化:\(B\) 称为非退化的,若 \(B(v,w)=0\) 对所有 \(w\) 成立蕴含 \(v=0\)。等价地,诱导的线性映射
是同构。再等价地,矩阵 \(M\) 可逆(\(\det M \neq 0\))。
回顾 30_内积空间:Riesz 表示定理说的正是"内积诱导的 \(\hat{B}: V \to V^*\) 是(共轭线性)同构"。因此**内积 = 正定对称非退化双线性型**——它是双线性型中非常特殊的一类。
§2.4 对称型的对角化¶
定理:设 \(F\) 的特征 \(\operatorname{char}(F) \neq 2\),\(B\) 为 \(V\) 上对称双线性型。则存在 \(V\) 的基 \(\{f_1,\ldots,f_n\}\),使得
即 \(B\) 在此基下的矩阵为对角阵 \(\operatorname{diag}(d_1,\ldots,d_n)\)。
证明思路:如果存在 \(v\) 使 \(B(v,v) \neq 0\),取 \(f_1 = v\),对 \(\{f_1\}^\perp\)(相对于 \(B\))做归纳。如果所有 \(B(v,v)=0\),则由极化恒等式 \(B(u+v,u+v) - B(u,u) - B(v,v) = 2B(u,v)\) 知 \(B=0\)(需要 \(\operatorname{char} \neq 2\))。
在 \(\mathbb{R}\) 上,每个非零对角元素可以通过缩放变为 \(\pm 1\)(取 \(f_i' = f_i/\sqrt{|d_i|}\)),得到标准形 \(\operatorname{diag}(\underbrace{+1,\ldots,+1}_{p},\underbrace{-1,\ldots,-1}_{q},\underbrace{0,\ldots,0}_{z})\)。
§2.5 Sylvester 惯性律¶
定理(Sylvester 惯性律,Sylvester's Law of Inertia, 1852):实对称双线性型的签名 \((p,q,z)\)(正、负、零对角元素的个数)是基变换不变量。
证明:设两组对角化分别给出 \(p\) 个正元素和 \(p'\) 个正元素,不妨设 \(p > p'\)。令 \(V_+\) 为第一组对角化中 \(B\) 正定的 \(p\) 维子空间,\(V'_{\le 0}\) 为第二组中 \(B \le 0\) 的 \((q'+z')\) 维子空间。则
因此 \(V_+ \cap V'_{\le 0} \neq \{0\}\)。取非零 \(v \in V_+ \cap V'_{\le 0}\),则 \(B(v,v) > 0\)(因为 \(v \in V_+\))且 \(B(v,v) \le 0\)(因为 \(v \in V'_{\le 0}\)),矛盾。
阶段小结:签名 \((p,q,z)\) 是合同变换下的完整不变量——两个实对称双线性型合同当且仅当它们签名相同。秩 \(= p+q\),零度 \(= z\)。
§2.6 二次型与极化恒等式¶
给定对称双线性型 \(B\),对应的**二次型**为 \(Q(v) = B(v,v)\)。反过来,\(B\) 可以从 \(Q\) 通过**极化恒等式**恢复:
因此在 \(\operatorname{char}(F) \neq 2\) 时,对称双线性型与二次型是等价的。
正定性判则(Sylvester 判据):对称矩阵 \(M\) 正定 \(\iff\) 所有顺序主子式(leading principal minors)\(> 0\):
§2.7 机器人学中的双线性型¶
质量矩阵是正定对称双线性型。 机器人的动能
其中 \(M(q)\) 是正定对称矩阵。从抽象角度看,\(M(q)\) 在每个配置 \(q\) 处定义了切空间 \(T_qQ\) 上的正定对称双线性型——这正是 Riemann 度量。签名 \((n,0,0)\) 对应物理合理性(动能非负,只在静止时为零)。
Minkowski 度量的签名。 在狭义相对论中,时空度量 \(\eta = \operatorname{diag}(-1,+1,+1,+1)\) 的签名是 \((3,1,0)\)(或 \((1,3,0)\),取决于约定)。光锥上 \(\eta(v,v)=0\) 的向量对应光速运动。
⚠️ 常见陷阱¶
💡 概念误区 2:混淆"合同"与"相似" 新手想法:\(P^\top M P\) 和 \(P^{-1}MP\) 差不多,反正基变换嘛。 实际上:相似保特征值,合同保签名——这是两个完全不同的不变量。例如 \(\operatorname{diag}(1,4)\) 相似于 \(\operatorname{diag}(1,4)\)(特征值 \(1,4\)),但合同于 \(\operatorname{diag}(1,1)\)(签名 \((2,0)\))。 根本原因:相似变换对应"同一个线性映射换基",合同变换对应"同一个双线性型换基"。两者的几何意义完全不同。
🧠 思维陷阱 2:以为所有对称双线性型都可以"找到正交基" 新手想法:谱定理说对称矩阵可以正交对角化,所以对称双线性型也行。 实际上:谱定理需要**内积**(正交性依赖内积定义),对称双线性型的对角化**不需要正交性**——只需要找到一组基使矩阵对角。当 \(B\) 本身不正定时,"相对于 \(B\) 的正交"可能不是通常意义的正交。
§2.8 反对称双线性型与辛形式¶
前面讨论了对称双线性型。现在简要提及另一大类——反对称型。
辛形式(symplectic form):设 \(V\) 为偶数维(\(\dim V = 2n\)),\(\omega: V \times V \to F\) 是非退化的反对称双线性型。则存在基 \(\{e_1,\ldots,e_n,f_1,\ldots,f_n\}\) 使得
矩阵形式为 \(J = \begin{pmatrix} 0 & I_n \\ -I_n & 0 \end{pmatrix}\)。这在 Hamilton 力学中至关重要——相空间 \(T^*Q\) 天然带有辛结构,Hamilton 方程 \(\dot{z} = J \nabla H(z)\) 中的 \(J\) 正是辛矩阵。
| 双线性型类型 | 对称性 | 标准形 | 物理应用 |
|---|---|---|---|
| 正定对称 | \(B(u,v)=B(v,u)\), \(B(v,v)>0\) | \(I_n\) | 动能、Riemann 度量 |
| 不定对称 | \(B(u,v)=B(v,u)\) | \(\operatorname{diag}(\pm 1)\) | Minkowski 度量 |
| 非退化反对称 | \(B(u,v)=-B(v,u)\) | \(J\) | 辛形式、Hamilton 力学 |
这三种类型覆盖了物理和工程中几乎所有重要的双线性型。对称型用 Sylvester 惯性律分类(签名),反对称型用辛标准形分类(维数)。
练习¶
- (推导题) 设 \(B\) 是 \(\mathbb{R}^3\) 上矩阵为 \(M = \begin{pmatrix} 1 & 2 & 0 \\ 2 & 1 & 0 \\ 0 & 0 & -3 \end{pmatrix}\) 的对称双线性型。求 \(B\) 的签名 \((p,q,z)\)。在草稿纸上完成对角化。
- (证明题) 证明:反对称双线性型 \(B(u,v)=-B(v,u)\) 的矩阵在 \(\operatorname{char}(F) \neq 2\) 时秩必为偶数。(提示:反对称矩阵的特征值成对出现。)
- (开放思考题) 为什么辛形式要求 \(\dim V\) 为偶数?如果 \(\dim V\) 是奇数,非退化反对称双线性型存在吗?
第二部分:张量积¶
§3 张量积 \(V \otimes W\):泛性质与构造 ⭐⭐¶
§3.1 动机:让多线性"变成"线性¶
§1 告诉我们多线性映射是重要的。但线性代数的全部工具——基、维数、秩-零度定理、特征值——都是为**线性映射**准备的。如果能把多线性映射"翻译"成线性映射,我们就能复用整套线性代数工具。
张量积 \(V \otimes W\) 正是实现这个翻译的"万能适配器"。核心思想是:
左边的对象(双线性)是"困难"的,右边的对象(线性)有全套工具可用。张量积 \(V \otimes W\) 是一个新的向量空间,它"吸收"了双线性性,使得后续只需处理线性映射。
类比:这就像对数把"乘法"变成"加法"——\(\log(ab) = \log a + \log b\)。张量积把"双线性"变成"线性"。像的部分:两者都是"改变运算类型的转换器"。不像的部分:对数是实数上的标量函数,张量积是向量空间层面的构造;对数是可逆的,张量积的映射 \(\otimes: V \times W \to V \otimes W\) 不是同构(维数不同)。
§3.2 泛性质(Universal Mapping Property)¶
定义(张量积的泛性质):向量空间 \(V\) 和 \(W\) 的**张量积**是一对 \((V \otimes W, \otimes)\),其中 \(V \otimes W\) 是向量空间,\(\otimes: V \times W \to V \otimes W\) 是双线性映射,满足以下**泛性质**:
对任意向量空间 \(U\) 和任意双线性映射 \(B: V \times W \to U\),存在**唯一**的线性映射 \(L: V \otimes W \to U\),使得 \(B = L \circ \otimes\)。
用交换图表示:
这张图必须刻进脑海。 它说的是:每个双线性映射 \(B\) 都唯一地"经过" \(V \otimes W\) 分解为 \(\otimes\) 后接线性映射 \(L\)。
本质洞察:泛性质不是在说"张量积是什么"(具体构造),而是在说"张量积做什么"(任何双线性映射都能唯一线性化)。这种"由功能定义对象"的思维方式贯穿现代数学——范畴论的核心精神。
§3.3 泛性质的唯一性¶
定理:满足泛性质的 \((V \otimes W, \otimes)\) 在同构意义下唯一。
证明:设 \((T, b)\) 和 \((T', b')\) 都满足泛性质。对 \(b': V \times W \to T'\)(双线性),由 \((T,b)\) 的泛性质得唯一的线性 \(f: T \to T'\) 使 \(b' = f \circ b\)。对 \(b: V \times W \to T\),由 \((T',b')\) 的泛性质得唯一的线性 \(g: T' \to T\) 使 \(b = g \circ b'\)。
则 \(g \circ f: T \to T\) 满足 \(b = (g \circ f) \circ b\)。但 \(\operatorname{id}_T\) 也满足 \(b = \operatorname{id}_T \circ b\)。由 \((T,b)\) 泛性质的**唯一性**,\(g \circ f = \operatorname{id}_T\)。同理 \(f \circ g = \operatorname{id}_{T'}\)。因此 \(f\) 是同构。
阶段小结:泛性质既保证存在性(下面构造),又保证唯一性(刚才证明)。这是数学中"用性质定义对象"的范式——先说清楚你要的功能(泛性质),再构造一个满足它的对象,唯一性自动跟来。
§3.4 具体构造¶
存在性证明:我们需要构造一个具体的 \((V \otimes W, \otimes)\)。
Step 1:自由向量空间。 对集合 \(V \times W\) 取**自由向量空间** \(F(V \times W)\):以 \(V \times W\) 的每个元素 \((v,w)\) 为一个独立基向量 \(\delta_{(v,w)}\),生成的向量空间。\(F(V \times W)\) 是巨大的——每对 \((v,w)\) 都是独立的,还没有任何线性或双线性关系。
Step 2:商掉双线性关系。 定义子空间 \(D \subseteq F(V \times W)\) 为以下四类元素生成的子空间:
Step 3:定义张量积。 令 \(V \otimes W := F(V \times W) / D\),映射 \(\otimes(v,w) := \delta_{(v,w)} + D\)(商类),简记为 \(v \otimes w\)。
验证泛性质:给定双线性 \(B: V \times W \to U\),定义 \(\tilde{L}: F(V \times W) \to U\) 为 \(\tilde{L}(\delta_{(v,w)}) = B(v,w)\) 的线性延拓。由于 \(B\) 是双线性的,\(\tilde{L}\) 在 \(D\) 上为零(例如 \(\tilde{L}(\delta_{(v+v',w)} - \delta_{(v,w)} - \delta_{(v',w)}) = B(v+v',w) - B(v,w) - B(v',w) = 0\))。因此 \(\tilde{L}\) 因子分解为 \(L: V \otimes W \to U\)。唯一性:\(L\) 在生成元 \(v \otimes w\) 上的值被 \(B\) 完全确定,所以 \(L\) 唯一。
§3.5 维数定理¶
定理:\(\dim(V \otimes W) = \dim V \cdot \dim W\)。若 \(\{e_1,\ldots,e_m\}\) 是 \(V\) 的基,\(\{f_1,\ldots,f_n\}\) 是 \(W\) 的基,则 \(\{e_i \otimes f_j : 1 \le i \le m,\ 1 \le j \le n\}\) 是 \(V \otimes W\) 的基。
证明:
张成性:任意 \(v \otimes w = (\sum_i a_i e_i) \otimes (\sum_j b_j f_j) = \sum_{i,j} a_i b_j (e_i \otimes f_j)\)(利用双线性性)。由于简单张量张成 \(V \otimes W\)(由构造),而简单张量可以用 \(\{e_i \otimes f_j\}\) 线性表示,所以 \(\{e_i \otimes f_j\}\) 张成 \(V \otimes W\)。
线性无关(这是深刻的一步):对每对 \((k,\ell)\),构造双线性映射 \(B_{k\ell}: V \times W \to F\),定义为
其中 \(e^k, f^\ell\) 是对偶基。由泛性质得唯一线性 \(L_{k\ell}: V \otimes W \to F\) 满足
现在设 \(\sum_{i,j} c_{ij}(e_i \otimes f_j) = 0\)。对此等式施加 \(L_{k\ell}\) 得
由 \((k,\ell)\) 的任意性,所有 \(c_{ij} = 0\)。这证明了线性无关。
Keith Conrad 格言:"不知怎么办时,造一个巧妙的双线性映射,然后用泛性质把它变成线性映射。" 这个技巧在张量积理论中反复出现——泛性质不仅是定义,更是强大的证明工具。
§3.6 简单张量与一般张量¶
形如 \(v \otimes w\) 的元素称为**简单张量**(simple tensor)或**可分解张量**(decomposable tensor)。一般的张量是简单张量的**有限线性组合** \(\sum_i v_i \otimes w_i\)。
关键事实:并非所有张量都是简单张量。 在 \(\mathbb{R}^2 \otimes \mathbb{R}^2\) 中考虑
如果 \(\tau = v \otimes w\)(可分解),则在 \(V^* \otimes W \cong \operatorname{Hom}(V,W)\) 的同构下,\(\tau\) 对应秩 \(1\) 矩阵。但 \(\tau\) 对应的矩阵是 \(\begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}\)(单位阵),秩为 \(2\)。矛盾!
类比(有边界的):这与量子力学中的**纠缠态**完全对应。Bell 态 \(\frac{1}{\sqrt{2}}(|0\rangle \otimes |0\rangle + |1\rangle \otimes |1\rangle)\) 不可分解为 \(|\psi\rangle \otimes |\phi\rangle\) 的形式。像的部分:两者都是张量空间中不可分解的元素。不像的部分:量子力学中的张量积带有 Hilbert 空间结构(内积、归一化),而纯代数的张量积不需要。
§3.7 张量积的代数性质¶
在深入同构定理之前,整理张量积的基本运算性质:
交换律:\(V \otimes W \cong W \otimes V\)(通过 \(v \otimes w \mapsto w \otimes v\)),但注意这是**同构**而非恒等——\(v \otimes w\) 和 \(w \otimes v\) 是不同空间的元素。
分配律:\(V \otimes (W_1 \oplus W_2) \cong (V \otimes W_1) \oplus (V \otimes W_2)\)。这与整数的分配律 \(a(b+c)=ab+ac\) 完全对应——张量积对直和的分配律是"维数乘法对维数加法"的分配。
标量张量积:\(F \otimes V \cong V\)(通过 \(c \otimes v \mapsto cv\))。标量域 \(F\) 是张量积的"乘法单位元"。
零空间:\(\{0\} \otimes V = \{0\}\)——与零做张量积得零。
这些性质让张量积在向量空间的范畴中扮演了"乘法"的角色,而直和 \(\oplus\) 扮演"加法"。维数公式 \(\dim(V \otimes W) = \dim V \cdot \dim W\) 和 \(\dim(V \oplus W) = \dim V + \dim W\) 完美对应。
§3.8 同构 \(V^* \otimes W \cong \operatorname{Hom}(V,W)\)¶
定理:在有限维情形下,\(V^* \otimes W \cong \operatorname{Hom}(V,W)\)。
证明:定义双线性映射 \(\Phi: V^* \times W \to \operatorname{Hom}(V,W)\),\(\Phi(\varphi, w)(v) = \varphi(v) \cdot w\)。由泛性质得线性映射 \(\tilde{\Phi}: V^* \otimes W \to \operatorname{Hom}(V,W)\)。
在基 \(\{e^i \otimes f_j\}\) 上,\(\tilde{\Phi}(e^i \otimes f_j)\) 是"把 \(e_i\) 分量取出来乘以 \(f_j\)"的映射,即矩阵中第 \((j,i)\) 位为 \(1\)、其余为 \(0\) 的线性映射。这组映射构成 \(\operatorname{Hom}(V,W)\) 的基,因此 \(\tilde{\Phi}\) 是同构。
简单张量 \(\leftrightarrow\) 秩 \(1\) 映射:\(\varphi \otimes w\) 对应 \(v \mapsto \varphi(v) w\),这是像为一维的线性映射(秩 \(1\))。一般张量对应一般秩的映射。
⚠️ 常见陷阱¶
💡 概念误区 3:以为 \(v \otimes w\) 中 \(\otimes\) 只是"形式符号" 新手想法:\(v \otimes w\) 就是把 \(v\) 和 \(w\) 并排写,没有实质内容。 实际上:\(\otimes\) 蕴含了商空间的全部关系——\((v+v') \otimes w = v \otimes w + v' \otimes w\)、\(c(v \otimes w) = (cv) \otimes w = v \otimes (cw)\) 等。没有这些关系,\(V \times W\) 的自由向量空间是无穷维的(每对 \((v,w)\) 独立);正是商掉关系 \(D\) 才使维数变为 \(\dim V \cdot \dim W\)。
💡 概念误区 4:以为所有张量都可分解 新手想法:\(V \otimes W\) 中的元素都可以写成 \(v \otimes w\)。 实际上:如 §3.6 所示,\(e_1 \otimes e_1 + e_2 \otimes e_2\) 不可分解。可分解张量在 \(V \otimes W\) 中张成但不构成基。在 \(V^* \otimes W \cong \operatorname{Hom}(V,W)\) 的视角下,可分解张量恰好是秩 \(\le 1\) 的映射——它们只占全部映射的一个"薄"子集。
🧠 思维陷阱 3:以为张量积是笛卡尔积 新手想法:\(V \otimes W\) 和 \(V \times W\) 差不多。 实际上:\(\dim(V \times W) = \dim V + \dim W\),\(\dim(V \otimes W) = \dim V \cdot \dim W\)。加法 vs 乘法——完全不同!\(V \times W\) 的元素是"有序对" \((v,w)\),\(V \otimes W\) 的元素是"线性组合" \(\sum c_{ij} e_i \otimes f_j\)。
练习¶
- (推导题) 证明 \(F \otimes V \cong V\)(标量域张量上去不增加信息)。提示:考虑双线性映射 \((c,v) \mapsto cv\),用泛性质。
- (证明题) 在 \(\mathbb{R}^2 \otimes \mathbb{R}^2\) 中,判断 \(\tau = e_1 \otimes e_2 + e_2 \otimes e_1\) 是否可分解。如果不可分解,证明之;如果可分解,找到 \(v,w\) 使 \(\tau = v \otimes w\)。
§4 线性映射的张量积与 Kronecker 积 ⭐⭐¶
§4.1 映射的张量积¶
给定线性映射 \(T: V \to V'\) 和 \(S: W \to W'\),定义 \(T \otimes S: V \otimes W \to V' \otimes W'\):
首先 \((v,w) \mapsto T(v) \otimes S(w)\) 是双线性映射 \(V \times W \to V' \otimes W'\)。由泛性质,唯一存在线性映射 \(T \otimes S: V \otimes W \to V' \otimes W'\) 满足
函子性:\((T' \otimes S') \circ (T \otimes S) = (T'T) \otimes (S'S)\),\(\operatorname{id}_V \otimes \operatorname{id}_W = \operatorname{id}_{V \otimes W}\)。这在范畴论语言中说的是 \(\otimes\) 是一个**双函子**。
§4.2 矩阵表示:Kronecker 积¶
在基 \(\{e_i \otimes f_j\}\) 下,\(T \otimes S\) 的矩阵是**Kronecker 积** \([T] \otimes_{\mathrm{Kr}} [S]\)。如果 \([T]\) 是 \(m \times m\) 矩阵,\([S]\) 是 \(n \times n\) 矩阵,则 Kronecker 积是 \(mn \times mn\) 的分块矩阵:
Kronecker 积的性质:
| 性质 | 公式 | 备注 |
|---|---|---|
| 迹 | \(\operatorname{tr}(T \otimes S) = \operatorname{tr}(T) \cdot \operatorname{tr}(S)\) | 迹是"乘法性的" |
| 行列式 | \(\det(T \otimes S) = \det(T)^n \cdot \det(S)^m\) | \(m = \dim V\), \(n = \dim W\) |
| 秩 | \(\operatorname{rank}(T \otimes S) = \operatorname{rank}(T) \cdot \operatorname{rank}(S)\) | 秩也是"乘法性的" |
| 特征值 | \(\lambda_i(T) \cdot \mu_j(S)\) 是 \(T \otimes S\) 的特征值 | 所有两两乘积 |
工程中常见的 Kronecker 积于此获得内蕴解释:它不是一个"随意定义"的矩阵运算,而是张量积在基下的坐标表示。
⚠️ 常见陷阱¶
💡 概念误区 5:Kronecker 积 \(=\) 张量积 新手想法:Kronecker 积就是张量积,两个词可以互换。 实际上:Kronecker 积是张量积在**选定基之后**的矩阵表示。张量积是内蕴的(不依赖基),Kronecker 积依赖基的排序。换基后 Kronecker 积矩阵会变,但它们表示的是同一个张量积映射。
练习¶
- (计算题) 计算 \(A = \begin{pmatrix} 1 & 2 \\ 0 & 3 \end{pmatrix}\) 和 \(B = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\) 的 Kronecker 积 \(A \otimes_{\mathrm{Kr}} B\)。验证 \(\det(A \otimes_{\mathrm{Kr}} B) = \det(A)^2 \cdot \det(B)^2\)。
§5 迭代张量积与张量空间 ⭐⭐¶
§5.1 结合律¶
定理:\((U \otimes V) \otimes W \cong U \otimes (V \otimes W) \cong U \otimes V \otimes W\)(自然同构)。
这个同构**不是恒等映射**,但总是自然的(即不依赖基的选择)。在实践中,我们可以"略去括号",直接写 \(U \otimes V \otimes W\)。
§5.2 张量幂¶
定义:\(V^{\otimes k} = \underbrace{V \otimes \cdots \otimes V}_{k}\),\(\dim V^{\otimes k} = (\dim V)^k\)。
\(k\)-重张量等同于 \(k\)-线性映射的线性化。具体地,\(V^{\otimes k}\) 的对偶 \((V^{\otimes k})^* \cong (V^*)^{\otimes k}\) 恰好是所有 \(k\)-线性型 \(V^k \to F\) 构成的空间。
§5.3 对称群作用¶
翻转同构:\(\tau: V \otimes W \to W \otimes V\),\(v \otimes w \mapsto w \otimes v\),是自然同构(非恒等)。
在 \(V^{\otimes k}\) 上,对称群 \(S_k\) 通过置换因子位置给出右作用:
这个群作用是 §6 对称/反对称分解的基础。
§5.4 \((p,q)\)-型张量空间¶
定义:
\(p\) 称为**逆变秩**(contravariant rank),\(q\) 称为**协变秩**(covariant rank)。
| \((p,q)\) | 对象 | 机器人学中的例子 |
|---|---|---|
| \((1,0)\) | 向量 \(v \in V\) | 速度 \(\dot{q}\) |
| \((0,1)\) | 余向量 \(\varphi \in V^*\) | 力/力矩 \(\tau\) |
| \((1,1)\) | 线性映射 \(T \in \operatorname{Hom}(V,V)\) | Jacobian \(J\) |
| \((0,2)\) | 双线性型 \(B: V \times V \to F\) | 质量矩阵 \(M(q)\), 度量 \(g\) |
| \((2,0)\) | \(V \otimes V\) 中的元素 | 逆度量 \(g^{-1}\) |
本质洞察:机器人学和物理学中所有的"张量"都是 \(T^p_q(V)\) 的元素——这不是一个比喻,而是精确的数学陈述。当物理学家说"惯性张量是二阶张量"时,他们的意思是 \(I \in T^0_2(V)\)(或 \(T^2_0(V)\),取决于升降指标约定)。
⚠️ 常见陷阱¶
🧠 思维陷阱 4:混淆"逆变"与"协变" 新手想法:"上指标"和"下指标"只是书写习惯。 实际上:逆变分量(上指标)在基变换时与基**反向**变换(\(\tilde{v}^i = (P^{-1})^i_{\ j} v^j\)),协变分量(下指标)与基**同向**变换(\(\tilde{\alpha}_i = P^j_{\ i} \alpha_j\))。混淆二者会导致坐标变换出错。§18 将详细展开。
练习¶
- (推导题) 证明 \((V \otimes W)^* \cong V^* \otimes W^*\)(有限维情形)。提示:两边维数相同,构造自然映射并验证它是同构。
- (开放思考题) 如果 \(V\) 是无穷维的,\((V \otimes W)^* \cong V^* \otimes W^*\) 还成立吗?哪一步会失败?
第三部分:对称与反对称张量¶
§6 对称与反对称张量 ⭐⭐¶
§6.1 对称化与反对称化算子¶
\(V^{\otimes k}\) 上的对称群 \(S_k\) 作用允许我们定义两个投影算子:
对称化算子:
反对称化(交替)算子:
在 \(\operatorname{char}(F) = 0\)(或 \(\operatorname{char}(F) \nmid k!\))时,\(\operatorname{Sym}\) 和 \(\operatorname{Alt}\) 都是**幂等的**(\(\operatorname{Sym}^2 = \operatorname{Sym}\)),即它们是投影算子。
\(k=2\) 的例子:对 \(v \otimes w \in V^{\otimes 2}\):
任意 \(\tau \in V^{\otimes 2}\) 都可以分解为 \(\tau = \operatorname{Sym}(\tau) + \operatorname{Alt}(\tau)\)——这是 \(k=2\) 时的**对称-反对称分解**。
§6.2 对称张量空间与反对称张量空间¶
维数公式:
其中 \(n = \dim V\)。
| \(k\) | \(\dim \operatorname{Sym}^k(\mathbb{R}^3)\) | \(\dim \Lambda^k(\mathbb{R}^3)\) |
|---|---|---|
| 0 | 1 | 1 |
| 1 | 3 | 3 |
| 2 | 6 | 3 |
| 3 | 10 | 1 |
| 4 | 15 | 0 |
注意 \(\Lambda^k(V) = 0\) 当 \(k > n\)——这与 \(\operatorname{Sym}^k(V)\) 永远非零形成对比。直觉上,反对称性强制不同因子"占据不同位置"(类似 Pauli 不相容原理),所以 \(k\) 不能超过空间维数 \(n\)。
§6.3 物理意义¶
对称张量:应力张量 \(\sigma_{ij} = \sigma_{ji}\)(角动量守恒)、惯性张量 \(I_{ij} = I_{ji}\)(定义对称)、质量矩阵 \(M_{ij}(q) = M_{ji}(q)\)(动能对称性)——它们都是 \(\operatorname{Sym}^2(V^*)\) 的元素。
反对称张量:电磁场张量 \(F_{\mu\nu} = -F_{\nu\mu}\)、微分 \(2\)-形式、涡量张量——它们是 \(\Lambda^2(V^*)\) 的元素。
⚠️ 常见陷阱¶
💡 概念误区 6:以为 \(V^{\otimes k}\) 总是分解为对称+反对称 新手想法:\(V^{\otimes k} = \operatorname{Sym}^k(V) \oplus \Lambda^k(V)\)。 实际上:\(k=2\) 时确实如此。但 \(k \ge 3\) 时有更多的 \(S_k\) 不可约分量(对应 Young 图)。例如 \(V^{\otimes 3}\) 分解为完全对称、完全反对称和两个"混合对称"部分。
练习¶
- (推导题) 对 \(V = \mathbb{R}^2\),显式写出 \(V^{\otimes 2}\) 到 \(\operatorname{Sym}^2(V) \oplus \Lambda^2(V)\) 的分解。在草稿纸上验证 \(\dim \operatorname{Sym}^2(\mathbb{R}^2) + \dim \Lambda^2(\mathbb{R}^2) = \dim V^{\otimes 2}\)。
§7 张量代数 \(T(V)\) ⭐⭐⭐¶
§7.1 定义与泛性质¶
定义:张量代数
是以 \(\otimes\) 为乘法的**分次结合代数**(graded associative algebra)。\(T^0(V) = F\)(标量),\(T^1(V) = V\)(向量),乘法就是张量积。
泛性质:任意线性映射 \(\varphi: V \to A\)(\(A\) 是结合代数)唯一延拓为代数同态 \(\tilde{\varphi}: T(V) \to A\)。换言之,\(T(V)\) 是 \(V\) 生成的**自由结合代数**。
§7.2 通往外代数与对称代数的桥梁¶
\(T(V)\) 是"最自由"的代数——没有任何交换或反对称关系。通过商掉不同的关系,我们得到:
- 商掉 \(\langle v \otimes v : v \in V \rangle\) \(\to\) 外代数 \(\Lambda(V)\)(§8)
- 商掉 \(\langle v \otimes w - w \otimes v : v,w \in V \rangle\) \(\to\) 对称代数 \(S(V)\)(§21)
第四部分:外代数与楔积¶
§8 楔积的定义 ⭐⭐¶
§8.1 动机:为什么需要反对称乘积¶
行列式是**反对称**的——交换任意两行,结果变号。叉积也是**反对称**的——\(u \times v = -(v \times u)\)。这些对象有一个共同的代数结构,需要一个统一的框架来描述。
如果不引入外代数会怎样?我们只能在每个具体情境中单独处理反对称性——行列式用排列公式,叉积用分量计算——无法看到它们的深层统一。
§8.2 两种等价定义¶
路径 (a):交替多线性路径。 \(\Lambda^k(V) := \operatorname{Alt}^k(V) \subseteq V^{\otimes k}\)(§6 的反对称化像)。楔积定义为
其中 \(\alpha \in \Lambda^p(V)\),\(\beta \in \Lambda^q(V)\)。组合因子 \(\frac{(p+q)!}{p!\,q!}\) 保证结合律成立。
路径 (b):商路径。 \(\Lambda(V) := T(V) / I\),其中 \(I\) 是由 \(\{v \otimes v : v \in V\}\) 生成的双边理想。\(v\) 在商中的像仍记为 \(v\),乘法记为 \(\wedge\)。
两条路径在 \(\operatorname{char}(F) = 0\) 时给出同构的结果。在 \(\operatorname{char}(F) = 2\) 时,只有商路径 (b) 正确(因为 \(\operatorname{Alt}\) 不再是投影)。
§8.3 基本性质¶
性质 1:\(v \wedge v = 0\) 对所有 \(v \in V\)。
证明(商路径):由理想 \(I\) 的定义直接得到。
性质 2:\(v \wedge w = -w \wedge v\)。
证明:由 \((v+w) \wedge (v+w) = 0\) 展开得
性质 3(分级反交换律):若 \(\alpha \in \Lambda^p(V)\),\(\beta \in \Lambda^q(V)\),则
特别地,当 \(p\) 和 \(q\) 都是奇数时,\(\alpha \wedge \beta = -\beta \wedge \alpha\)(反交换)。当至少一个是偶数时,\(\alpha \wedge \beta = \beta \wedge \alpha\)(交换)。
§8.4 为什么两种定义等价¶
在 \(\operatorname{char}(F) = 0\) 下,路径 (a) 和路径 (b) 给出同构的代数。直觉上:
- 路径 (a) 从 \(V^{\otimes k}\) 内部出发,用投影 \(\operatorname{Alt}\) "挑出"反对称部分。
- 路径 (b) 从 \(T(V)\) 出发,用商映射"压碎"对称部分。
同构映射是:\(\operatorname{Alt}\) 的像 \(\hookrightarrow V^{\otimes k} \twoheadrightarrow T(V)/I\) 的 \(k\)-次分量。在 \(\operatorname{char} = 0\) 时 \(\operatorname{Alt}\) 是投影,其像在商映射下同构到对应分量。
为什么 \(\operatorname{char} = 2\) 时路径 (a) 失败? 因为 \(\operatorname{Alt} = \frac{1}{k!}\sum \operatorname{sgn}(\sigma)\sigma\),当 \(\operatorname{char}(F) | k!\) 时,分母 \(k!\) 不可逆,\(\operatorname{Alt}\) 不再是投影。例如 \(\operatorname{char} = 2\) 时 \(\operatorname{Alt}(v \otimes w) = \frac{1}{2}(v \otimes w - w \otimes v)\),而 \(\frac{1}{2}\) 在 \(\mathbb{F}_2\) 中不存在。路径 (b) 的商构造不依赖特征,总是有效的。
阶段小结:两种定义各有优势——路径 (a) 的几何直觉更好(反对称化投影),路径 (b) 的代数适用范围更广(任意特征)。在特征零的实数域/复数域(机器人学的工作域)中,两者完全等价。
§8.5 可分解楔积的几何意义¶
定理:\(v_1 \wedge v_2 \wedge \cdots \wedge v_k \neq 0\) 当且仅当 \(\{v_1, \ldots, v_k\}\) 线性无关。
证明:如果 \(v_1,\ldots,v_k\) 线性相关,不妨设 \(v_k = \sum_{i=1}^{k-1} c_i v_i\)。则
因为每一项中 \(v_i\) 出现两次,\(v_i \wedge v_i = 0\)。
反方向(线性无关 \(\Rightarrow\) 楔积非零)需要基扩充和对偶基技术,在 §10.2 证明。
几何直觉:\(|v_1 \wedge v_2 \wedge \cdots \wedge v_k|\)(需要内积定义模长)是这 \(k\) 个向量张成的**\(k\)-维平行多面体的体积**。楔积为零等价于这些向量共面——"体积塌陷"。
⚠️ 常见陷阱¶
💡 概念误区 7:以为 \(v \wedge w = 0\) 意味着 \(v=0\) 或 \(w=0\) 新手想法:像乘法一样,积为零则因子之一为零。 实际上:\(v \wedge w = 0\) 当且仅当 \(v\) 和 \(w\) 线性相关(即共线)。例如 \((2e_1) \wedge (3e_1) = 6(e_1 \wedge e_1) = 0\),但两个因子都不为零。
🧠 思维陷阱 5:符号是 \((-1)^{pq}\) 不是 \((-1)^{p+q}\) 新手想法:\(\alpha \wedge \beta = (-1)^{p+q} \beta \wedge \alpha\)。 实际上:正确的是 \((-1)^{pq}\)。当 \(p=q=2\) 时,\((-1)^{pq} = (-1)^4 = +1\)(交换),而 \((-1)^{p+q} = (-1)^4 = +1\)——两者碰巧一致。但 \(p=1, q=3\) 时 \((-1)^{pq} = (-1)^3 = -1\),\((-1)^{p+q} = (-1)^4 = +1\)——差一个符号!
练习¶
- (推导题) 在 \(\mathbb{R}^4\) 中,验证 \(e_1 \wedge e_2 \wedge e_3 \wedge e_4 \neq 0\) 但 \(e_1 \wedge e_2 \wedge (e_1+e_2) \wedge e_4 = 0\)。
- (证明题) 证明分级反交换律:对可分解元素 \(\alpha = v_1 \wedge \cdots \wedge v_p\) 和 \(\beta = w_1 \wedge \cdots \wedge w_q\),有 \(\alpha \wedge \beta = (-1)^{pq}\beta \wedge \alpha\)。(在草稿纸上完成。)
§8.6 楔积的结合律¶
定理:楔积满足结合律 \((\alpha \wedge \beta) \wedge \gamma = \alpha \wedge (\beta \wedge \gamma)\)。
在商路径 (b) 中这是直接的——\(\Lambda(V)\) 继承了 \(T(V)\) 的结合乘法。在路径 (a) 中需要验证组合因子的选择使得 \(\operatorname{Alt}((\operatorname{Alt}(\alpha \otimes \beta)) \otimes \gamma) = \operatorname{Alt}(\alpha \otimes (\operatorname{Alt}(\beta \otimes \gamma)))\),这需要一些组合计算。
结合律意味着我们可以不加括号地写 \(v_1 \wedge v_2 \wedge \cdots \wedge v_k\)——运算顺序不影响结果。这与实数乘法的结合律类似,但楔积不满足交换律(只满足**分级**交换律)。
§9 外代数 \(\Lambda(V)\) 作为分次代数 ⭐⭐¶
§9.1 结构¶
是**有限维分次代数**。\(\Lambda^0(V) = F\)(标量),\(\Lambda^1(V) = V\)(向量),\(\Lambda^k(V) = 0\) 当 \(k > n = \dim V\)。
总维数:
类比:如果把 \(\{e_1,\ldots,e_n\}\) 看作 \(n\) 个"独立选择"(取或不取),\(\Lambda(V)\) 的基恰好由 \(\{e_1,\ldots,e_n\}\) 的所有子集标记——\(2^n\) 个。这与集合的幂集一一对应。像的部分:两者都是"从 \(n\) 个元素中选子集"。不像的部分:外代数中子集有序(\(e_1 \wedge e_2 = -e_2 \wedge e_1\)),幂集中子集无序。
§9.2 \(\mathbb{Z}_2\)-分级与超交换¶
\(\Lambda(V)\) 不仅是 \(\mathbb{Z}\)-分次的(按 \(k\) 分),还可以更粗糙地按奇偶性分为 \(\mathbb{Z}_2\)-分次:
其中 \(\Lambda^{\text{even}} = \Lambda^0 \oplus \Lambda^2 \oplus \Lambda^4 \oplus \cdots\),\(\Lambda^{\text{odd}} = \Lambda^1 \oplus \Lambda^3 \oplus \Lambda^5 \oplus \cdots\)。
偶次元素之间**交换**:\(\alpha \wedge \beta = \beta \wedge \alpha\)(\(\alpha, \beta \in \Lambda^{\text{even}}\))。这使得 \(\Lambda^{\text{even}}(V)\) 是一个交换子代数。
奇次元素之间**反交换**:\(\alpha \wedge \beta = -\beta \wedge \alpha\)(\(\alpha, \beta \in \Lambda^{\text{odd}}\))。
在物理中,这种 \(\mathbb{Z}_2\)-分次结构对应**费米子代数**——费米子场算符满足反对易关系 \(\{a, b\} = ab + ba = 0\),这正是外代数的分级反交换律。
§9.3 下游预告:微分形式¶
\(\Lambda(V)\) 是纯代数的。在微分几何中,把 \(V\) 替换为余切空间 \(T^*_pM\),并让 \(p\) 遍历流形 \(M\) 的每一点,就得到**微分形式代数** \(\Omega^*(M) = \Gamma(\Lambda(T^*M))\)。外微分 \(d: \Omega^k \to \Omega^{k+1}\) 满足 Leibniz 规则 \(d(\alpha \wedge \beta) = d\alpha \wedge \beta + (-1)^p \alpha \wedge d\beta\)——这里的 \((-1)^p\) 正是分级反交换律的体现。
§10 \(\Lambda^k(V)\) 的基与维数 ⭐⭐¶
§10.1 基的构造¶
定理:给定 \(V\) 的基 \(\{e_1,\ldots,e_n\}\),则
是 \(\Lambda^k(V)\) 的基,\(\dim \Lambda^k(V) = \binom{n}{k}\)。
张成性:由楔积的反对称性,任意 \(v_1 \wedge \cdots \wedge v_k\) 都可以展开为上述形式的线性组合(将每个 \(v_i\) 用基展开,利用 \(e_i \wedge e_i = 0\) 和反交换律整理为递增指标序列)。
线性无关:用与 §3.5 类似的对偶基技术。对每个递增指标序列 \(I = (i_1 < \cdots < i_k)\),构造对偶的多线性泛函 \(\omega_I(e_{j_1} \wedge \cdots \wedge e_{j_k}) = \delta_{I,J}\)。这些泛函把假设的线性关系 \(\sum c_I e_I = 0\) 中的每个系数 \(c_I\) 分离出来,证明都为零。
§10.2 分级反交换律的完整证明¶
定理:对 \(\alpha = v_1 \wedge \cdots \wedge v_p \in \Lambda^p(V)\) 和 \(\beta = w_1 \wedge \cdots \wedge w_q \in \Lambda^q(V)\):
证明:
将 \(w_1\) 逐次越过 \(v_p, v_{p-1}, \ldots, v_1\)(利用 \(a \wedge b = -b \wedge a\)),共 \(p\) 次换位,产生因子 \((-1)^p\):
然后将 \(w_2\) 越过 \(v_1,\ldots,v_p\)(\(p\) 次换位,因子 \((-1)^p\)),以此类推。\(q\) 个 \(w_j\) 各移动 \(p\) 次,总符号为 \((-1)^{pq}\):
对一般的(非可分解)\(\alpha, \beta\),由线性延拓得到相同结论。 \(\square\)
阶段小结:符号 \((-1)^{pq}\) 而不是 \((-1)^{p+q}\) 的原因是清楚的——每个 \(w_j\) 要越过**所有** \(p\) 个 \(v_i\),共 \(q\) 次各 \(p\) 步,总步数 \(pq\)。
§10.3 维数对偶性¶
\(\binom{n}{k} = \binom{n}{n-k}\)——这是一个组合恒等式,但它有深刻的几何意义:\(\Lambda^k(V)\) 和 \(\Lambda^{n-k}(V)\) 维数相同,因此存在(非自然的)同构。当 \(V\) 配备内积和定向时,Hodge 星 \(*: \Lambda^k(V) \to \Lambda^{n-k}(V)\)(§17)给出**自然的**等距同构。
§10.4 Grassmannian 与 Pluecker 嵌入¶
Grassmannian \(\operatorname{Gr}(k,n)\) 是 \(\mathbb{R}^n\) 中所有 \(k\) 维子空间的集合。它是一个光滑流形,维数为 \(k(n-k)\)。
外代数给出 Grassmannian 的自然嵌入——Pluecker 嵌入:
具体地,\(k\) 维子空间 \(W = \operatorname{span}\{v_1,\ldots,v_k\}\) 映射到 \([v_1 \wedge \cdots \wedge v_k] \in \mathbb{P}(\Lambda^k(\mathbb{R}^n))\)(射影化后的楔积)。
良定义性:不同的基 \(\{v_1',\ldots,v_k'\}\) 给出的楔积 \(v_1' \wedge \cdots \wedge v_k' = \det(P) \cdot v_1 \wedge \cdots \wedge v_k\)(\(P\) 为基变换矩阵),在射影空间中是同一个点。
机器人学应用:Pluecker 坐标描述三维空间中的直线(\(\operatorname{Gr}(2,4)\) 的 Pluecker 嵌入到 \(\Lambda^2(\mathbb{R}^4)\))。Featherstone 的空间代数中,螺旋轴的表示与 Pluecker 坐标直接相关。
§10.5 关键例子:\(\Lambda^2(\mathbb{R}^3)\)¶
\(\dim \Lambda^2(\mathbb{R}^3) = \binom{3}{2} = 3\),恰好与 \(\dim \mathbb{R}^3 = 3\) 相同。基为 \(\{e_1 \wedge e_2,\ e_2 \wedge e_3,\ e_3 \wedge e_1\}\)。这个"维数巧合" \(\binom{n}{2} = n \iff n = 3\) 是叉积存在的唯一理由(§15)。
对比:\(\dim \Lambda^2(\mathbb{R}^4) = \binom{4}{2} = 6 \neq 4\),所以 \(\mathbb{R}^4\) 中**没有叉积**。六个独立的"旋转平面"对应 \(\mathfrak{so}(4)\) 的六维李代数。
⚠️ 常见陷阱¶
💡 概念误区 8:以为叉积在任何维度都存在 新手想法:叉积可以推广到 \(\mathbb{R}^n\)。 实际上:叉积 \(V \times V \to V\)(双线性反对称、值在 \(V\) 中)只在 \(n=3\) 和 \(n=7\) 时存在。\(n=3\) 来自 \(\binom{3}{2}=3\)(上面解释的),\(n=7\) 来自八元数。本章只讨论 \(n=3\) 的情形。
练习¶
- (推导题) 写出 \(\Lambda^*(\mathbb{R}^3) = \Lambda^0 \oplus \Lambda^1 \oplus \Lambda^2 \oplus \Lambda^3\) 的所有基元素和维数。验证总维数 \(= 2^3 = 8\)。
- (开放思考题) \(\Lambda^n(V)\) 是一维的(\(\binom{n}{n}=1\))。这个一维空间的非零元素代表什么几何对象?(提示:体积形式。)
第五部分:行列式的无坐标理论¶
上一部分建立了外代数。现在我们用它来彻底理解行列式——这是本章最令人满意的应用之一。
§11 行列式的外代数定义 ⭐⭐¶
§11.1 动机:行列式的"真正"定义¶
40_谱定理SVD与极分解.md 中我们用排列公式 \(\det(A) = \sum_\sigma \operatorname{sgn}(\sigma)\prod_i a_{i,\sigma(i)}\) 定义了行列式。这个定义可以用来计算,但有三个不满意之处:
- 它**依赖坐标**——需要选基才能写出矩阵 \(A\)。
- 基独立性需要额外证明——不同基下计算得到相同结果,不是显然的。
- \(\det(AB) = \det(A)\det(B)\) 的**证明冗长**——需要组合论证。
外代数给出一个更优雅的定义,三个问题全部消失。
§11.2 定义¶
设 \(T: V \to V\) 是线性映射,\(\dim V = n\)。\(T\) 诱导 \(\Lambda^n(T): \Lambda^n(V) \to \Lambda^n(V)\):
由于 \(\Lambda^n(V)\) 是**一维的**(\(\binom{n}{n}=1\)),\(\Lambda^n(T)\) 只能是某个标量的乘法:
定义 \(\det(T) := c\)。即 \(T(v_1) \wedge \cdots \wedge T(v_n) = \det(T) \cdot (v_1 \wedge \cdots \wedge v_n)\)。
本质洞察:行列式是线性映射在最高外幂上的"放大因子"。\(|\det(T)|\) 是体积的放大率,\(\operatorname{sgn}(\det(T))\) 是定向的保持/反转。这个定义不需要选基——\(T\) 和 \(V\) 就足够了。
§11.3 可操作度的外代数解释¶
Jacobian 的列 \(Je_1, \ldots, Je_n\) 的楔积给出
对非方形 \(J\)(\(m \times n\), \(m < n\)),Yoshikawa 可操作度 \(w = \sqrt{\det(JJ^\top)}\) 是这 \(n\) 个列向量在 \(\mathbb{R}^m\) 中张成的 \(n\)-维子体积的 Gram 行列式平方根。奇异位形 \(\iff\) \(\det(J) = 0\) \(\iff\) 列的 \(n\)-楔消失 \(\iff\) 可操作性椭球塌陷。
这给出了奇异性的**几何解释**:在奇异位形处,末端执行器的速度能力在某个方向上"退化"——对应的体积(楔积的模)为零。
§11.4 与排列公式的一致性¶
取标准基 \(\{e_1,\ldots,e_n\}\),\(T(e_j) = \sum_i a_{ij}e_i\)。则
展开后,只有 \((i_1,\ldots,i_n)\) 是 \(\{1,\ldots,n\}\) 的排列时项才不为零(否则有重复指标,楔积消失)。得到
因此 \(\det(T) = \sum_\sigma \operatorname{sgn}(\sigma) \prod_i a_{\sigma(i),i}\),恢复了 Leibniz 公式。
阶段小结:排列公式不是行列式的**定义**,而是外代数定义在选定基之后的**坐标表达**。
§12 行列式的性质 ⭐⭐¶
§12.1 乘法性¶
定理:\(\det(AB) = \det(A)\det(B)\)。
证明:\(\Lambda^n(AB) = \Lambda^n(A) \circ \Lambda^n(B) = (\det A \cdot \operatorname{id}) \circ (\det B \cdot \operatorname{id}) = (\det A \cdot \det B) \cdot \operatorname{id}\)。
一维空间上两个标量乘法的合成等于标量之积——一行证明完毕。
对比排列公式的乘法性证明,需要 Cauchy-Binet 公式或冗长的组合论证。外代数定义的威力在于:把深层性质变成直接推论。
§12.2 基本性质速查¶
| 性质 | 公式 | 外代数证明思路 |
|---|---|---|
| 乘法性 | \(\det(AB) = \det(A)\det(B)\) | \(\Lambda^n\) 的函子性 |
| 单位 | \(\det(I) = 1\) | \(\Lambda^n(\operatorname{id}) = \operatorname{id}\) |
| 逆 | \(\det(A^{-1}) = (\det A)^{-1}\) | 乘法性 + \(\det(I)=1\) |
| 可逆性 | \(A\) 可逆 \(\iff\) \(\det A \neq 0\) | \(\Lambda^n(A)\) 可逆 \(\iff\) 非零标量 |
| 转置 | \(\det(A^\top) = \det(A)\) | 排列求和的对称性 |
§12.3 行列式与特征多项式¶
回填:50_极小多项式与Jordan标准形.md 中,特征多项式 \(p_T(\lambda) = \det(\lambda I - T)\) 的系数其实是**外幂的迹**:
其中 \(\operatorname{tr}(\Lambda^k T)\) 是 \(T\) 在 \(\Lambda^k(V)\) 上诱导映射的迹,等于 \(T\) 的所有 \(k \times k\) 主子式之和。这把特征多项式的"每个系数"都用外代数统一解释了。
⚠️ 常见陷阱¶
💡 概念误区 9:以为行列式只是一个"计算工具" 新手想法:行列式的用途就是判断矩阵是否可逆和解线性方程组。 实际上:行列式有深刻的几何意义——它是体积放大率与定向的合体。\(|\det(T)|\) 告诉你 \(T\) 把单位立方体变成了多大的平行多面体,\(\operatorname{sgn}(\det T)\) 告诉你定向是否翻转。这就是为什么 \(SO(n) = \{R \in O(n) : \det R = +1\}\)——正行列式意味着保持定向。
🧠 思维陷阱 6:以为外代数定义"更难"所以不实用 新手想法:排列公式可以直接算,外代数定义太抽象了。 实际上:抽象恰恰是威力所在。乘法性 \(\det(AB)=\det(A)\det(B)\) 用排列公式证明需要一整页,用外代数一行完成。基独立性用排列公式需要额外论证,用外代数是定义的直接推论。越是深层的性质,抽象定义越占优势。
练习¶
- (证明题) 用外代数定义证明:如果 \(T\) 有特征值 \(\lambda_1,\ldots,\lambda_n\)(计重数),则 \(\det(T) = \lambda_1 \cdots \lambda_n\)。
- (推导题) 证明 \(\det(cA) = c^n \det(A)\),其中 \(c\) 是标量,\(A\) 是 \(n \times n\) 矩阵。从外代数和从排列公式两种方式各给一个证明。
§12.4 Laplace 展开(按行/列展开)¶
行列式可以按任意一行或一列展开:
其中 \(M_{ij}\) 是删去第 \(i\) 行第 \(j\) 列后的 \((n-1) \times (n-1)\) 子式的行列式。
从外代数角度看,这是**内积收缩** \(\iota_{e_i}\) 作用于 \(n\)-形式 \(e_1 \wedge \cdots \wedge e_n\) 的结果——把 \(n\)-形式"沿第 \(i\) 个方向收缩"得到 \((n-1)\)-形式,然后求值。
Schur 补公式:对分块矩阵 \(M = \begin{pmatrix} A & B \\ C & D \end{pmatrix}\)(\(A\) 可逆),
其中 \(S = D - CA^{-1}B\) 是 \(D\) 关于 \(A\) 的 Schur 补。这在 SLAM 的边缘化(marginalization)中至关重要——消去一组变量等价于计算 Schur 补,对应的行列式分解反映了条件概率的乘法律。
练习¶
- (推导题) 验证 Schur 补公式对 \(2 \times 2\) 分块矩阵 \(\begin{pmatrix} a & b \\ c & d \end{pmatrix}\) 成立(此时 \(A = (a)\), \(B = (b)\), \(C = (c)\), \(D = (d)\), Schur 补 \(= d - ca^{-1}b\))。
§13 行列式与体积、定向 ⭐⭐¶
§13.1 体积解释¶
\(\mathbb{R}^n\) 中平行多面体 \(P = \{t_1 v_1 + \cdots + t_n v_n : 0 \le t_i \le 1\}\) 的 \(n\)-维体积为
证明思路:\(\det\) 是归一化的交替 \(n\)-线性函数(\(\det(e_1,\ldots,e_n) = 1\))。Lebesgue 测度给出的体积函数也是归一化的交替 \(n\)-线性函数(体积对向量双线性、交换两个向量翻转定向)。由 \(\Lambda^n(V)\) 的一维性(§10),两者至多差一个常数,归一化后相等。
§13.2 定向¶
定义:\(\mathbb{R}^n\) 的一个**定向**(orientation)是 \(\Lambda^n(\mathbb{R}^n)\) 中非零元素的等价类(正倍数等价)。\(\Lambda^n(\mathbb{R}^n)\) 是一维的,所以恰好有两个定向(正和负)。
\(\det(T) > 0\) 意味着 \(T\) 保持定向,\(\det(T) < 0\) 意味着 \(T\) 反转定向。这就是 \(SO(n) = \{A \in O(n) : \det A = +1\}\) 的含义——旋转保持定向,反射反转定向。
§13.3 配置流形上的体积¶
在机器人学中,行列式的体积解释直接关联到**配置空间的采样**。RRT(Rapidly-exploring Random Trees)等运动规划算法需要在配置空间 \(Q\) 上均匀采样。当 \(Q\) 是 Lie 群(如 \(SO(3)\), \(SE(3)\))时,"均匀"意味着相对于**左不变体积形式**(Haar 测度)。
对 \(SO(3)\) 来说,Haar 测度在轴角参数 \((\theta, \hat{n})\) 下的密度为
其中 \(dS^2\) 是单位球面上的面积元。注意密度因子 \(\frac{1-\cos\theta}{4\pi^2}\) 不是常数——这反映了轴角参数不是"等距"参数化,度量张量的行列式(即体积元的 Jacobian)随 \(\theta\) 变化。
§13.4 变量替换公式¶
微积分中的变量替换公式
中的 \(|\det D\varphi|\) 正是 \(\varphi\) 在每一点处的体积放大率——这是行列式几何意义的直接应用。在流形上,这将推广为微分形式的拉回和积分。
练习¶
- (推导题) 设 \(v_1 = (1,2)\), \(v_2 = (3,1)\)。计算 \(v_1, v_2\) 张成的平行四边形面积。用 \(|v_1 \wedge v_2|\)(需要定义范数)和 \(|\det[v_1|v_2]|\) 两种方式验证一致。
§14 余因子矩阵与 Cramer 法则 ⭐⭐⭐¶
§14.1 伴随矩阵¶
定义:\(n \times n\) 矩阵 \(A\) 的**伴随矩阵**(adjugate/classical adjoint)\(\operatorname{adj}(A)\) 定义为
其中 \(M_{ji}\) 是 \(A\) 删去第 \(j\) 行第 \(i\) 列后的 \((n-1) \times (n-1)\) 子式的行列式(余子式)。注意转置:\(\operatorname{adj}(A)\) 的 \((i,j)\) 元素用的是 \(A\) 的 \((j,i)\) 余子式。
核心恒等式:
§14.2 Cramer 法则¶
定理:若 \(Ax = b\) 且 \(\det(A) \neq 0\),则
其中 \(A_j\) 是将 \(A\) 的第 \(j\) 列替换为 \(b\) 所得的矩阵。
工程警示:Cramer 法则的计算复杂度为 \(O(n \cdot n!)\)(计算 \(n+1\) 个行列式),远逊于 LU 分解的 \(O(n^3)\)。它的价值是**理论性的**——用于隐函数定理的证明、符号微分等,而不是数值计算。
⚠️ 常见陷阱¶
🧠 思维陷阱 7:用 Cramer 法则做数值计算 新手想法:\(x_j = \det(A_j)/\det(A)\) 很简洁,用它来解方程组。 实际上:数值计算中**永远不要**用 Cramer 法则。\(O(n!)\) 的复杂度意味着 \(n=20\) 时就需要 \(\sim 10^{18}\) 次运算。用 LU 分解(\(O(n^3)\))或迭代方法。
练习¶
- (推导题) 用核心恒等式 \(A \cdot \operatorname{adj}(A) = \det(A) \cdot I\) 推导 \(A^{-1} = \operatorname{adj}(A)/\det(A)\)(当 \(\det A \neq 0\))。
第六部分:楔积的几何应用¶
§15 叉积作为 \(\Lambda^2(\mathbb{R}^3)\) 的特殊情形 ⭐⭐¶
§15.1 维数偶然性¶
回顾 §10.3:\(\dim \Lambda^2(\mathbb{R}^3) = 3 = \dim \mathbb{R}^3\)。这个等式 \(\binom{n}{2} = n\) 只在 \(n=3\) 时成立(以及 \(n=0,1\) 的退化情形)。正是这个维数巧合使得我们可以定义一个"把两个向量变成一个向量"的运算——叉积。
在 \(\mathbb{R}^4\) 中,\(\dim \Lambda^2(\mathbb{R}^4) = 6 \neq 4\),所以没有类似的运算。如果有人告诉你"四维空间也有叉积",那一定不是通常意义上的叉积。
§15.2 叉积 \(=\) Hodge 星 \(\circ\) 楔积¶
给定标准内积和标准定向(\(e_1 \wedge e_2 \wedge e_3\) 为正定向),Hodge 星 \(*: \Lambda^2(\mathbb{R}^3) \to \Lambda^1(\mathbb{R}^3) = \mathbb{R}^3\) 由以下对应定义:
定义:\(u \times v := *(u \wedge v)\)。
验证:设 \(u = u_1 e_1 + u_2 e_2 + u_3 e_3\),\(v = v_1 e_1 + v_2 e_2 + v_3 e_3\),则
施加 Hodge 星:
这正是叉积的标准公式!
本质洞察:叉积不是一个"基本运算"——它是楔积(纯代数)后接 Hodge 星(依赖度量和定向)的复合。\(u \wedge v \in \Lambda^2(\mathbb{R}^3)\) 才是"真正的对象",它表示 \(u\) 和 \(v\) 张成的平面(带面积和定向)。叉积 \(u \times v\) 是把这个平面的"法向量"取出来——这需要度量(定义"垂直")和定向(选择法向量的朝向)。
§15.3 角速度与帽映射¶
在机器人学中,角速度 \(\omega \in \mathbb{R}^3\) 通过**帽映射**(hat map)\(\hat{\cdot}: \mathbb{R}^3 \to \mathfrak{so}(3)\) 变为反对称矩阵:
满足 \(\hat{\omega}v = \omega \times v\)。从外代数角度看,帽映射就是 \(\mathbb{R}^3 \cong \Lambda^2(\mathbb{R}^3) \cong \mathfrak{so}(3)\) 的同构链。
在 \(SO(4)\) 或 \(SE(3)\) 中这个"简便"失效——\(\dim \mathfrak{so}(4) = 6 \neq 4\)——转而用 Pluecker 坐标或伴随作用 \(\operatorname{ad}_\xi\)。
⚠️ 常见陷阱¶
💡 概念误区 10:以为叉积是"坐标无关的" 新手想法:叉积只依赖两个向量,不依赖坐标系。 实际上:楔积 \(u \wedge v\) 是坐标无关的,但叉积 \(u \times v = *(u \wedge v)\) 需要 Hodge 星,而 Hodge 星依赖**度量和定向**。换一个度量(非欧几里得)或定向(左手系),叉积的值会变。
练习¶
- (推导题) 验证 \(|u \times v|^2 = |u|^2|v|^2 - (u \cdot v)^2\)(Lagrange 恒等式),从 \(u \times v = *(u \wedge v)\) 出发。
- (跨章综合题) 结合
30_内积空间的 Gram-Schmidt 和本章的外代数,证明:\(n\) 个向量的 Gram 行列式 \(G = \det(\langle v_i, v_j \rangle)\) 等于 \(|v_1 \wedge \cdots \wedge v_n|^2\)。
§16 内积(缩并)算子 \(\iota_v\) ⭐⭐⭐¶
§16.1 定义¶
对 \(v \in V\),内积算子(interior product 或 contraction)\(\iota_v: \Lambda^k(V) \to \Lambda^{k-1}(V)\) 在可分解元素上定义为:
其中 \(\hat{w}_i\) 表示删去 \(w_i\)。
§16.2 关键性质¶
- 反导性(antiderivation):\(\iota_v(\alpha \wedge \beta) = \iota_v(\alpha) \wedge \beta + (-1)^p \alpha \wedge \iota_v(\beta)\),\(\alpha \in \Lambda^p\)。
- 幂零性:\(\iota_v \circ \iota_v = 0\)。
- 反交换:\(\iota_v \iota_w + \iota_w \iota_v = 0\)。
§16.3 下游应用¶
Cartan 魔法公式:\(\mathcal{L}_X = d \circ \iota_X + \iota_X \circ d\),把**李导数**(\(\mathcal{L}_X\))、外微分(\(d\))、缩并(\(\iota_X\))统一起来。这是几何控制理论的基石——判断一个系统是否沿某个方向"不变"。
§16.4 计算示例¶
在 \(\mathbb{R}^3\)(标准内积)中计算 \(\iota_{e_1}(e_1 \wedge e_2 \wedge e_3)\):
再计算 \(\iota_{e_1}(e_2 \wedge e_3)\):
这验证了 \(\iota_{e_1} \circ \iota_{e_1} = 0\)(幂零性)。
向量分析中的对应:在 \(\mathbb{R}^3\) 中,\(\iota_v\) 对应的经典运算取决于作用对象的次数:
| 作用对象 | \(\iota_v\) 的经典对应 | 结果 |
|---|---|---|
| \(3\)-形式(体积元) | \(v \cdot\) 体积元 | \(2\)-形式(面积元) |
| \(2\)-形式 | 类似"点乘" | \(1\)-形式 |
| \(1\)-形式 | \(v\) 与余向量配对 | 标量 |
练习¶
- (推导题) 在 \(\Lambda^2(\mathbb{R}^3)\) 上验证 \(\iota_{e_1}(e_1 \wedge e_2 \wedge e_3) = e_2 \wedge e_3\)(假设标准内积),即 \(\iota_{e_1}\) 把 \(3\)-形式"降"为 \(2\)-形式。
- (推导题) 计算 \(\iota_{e_1+e_2}(e_1 \wedge e_2)\)。利用 \(\iota\) 关于 \(v\) 的线性性简化计算。
§17 Hodge 星算子 ⭐⭐¶
§17.1 前提¶
Hodge 星需要两个额外结构:
- 非退化内积 \(\langle\cdot,\cdot\rangle\)(由 §2 的双线性型推广,不要求正定)。
- 定向:选定 \(\operatorname{vol} \in \Lambda^n(V)\),归一化为 \(\langle\operatorname{vol},\operatorname{vol}\rangle = \pm 1\)。
§17.2 定义¶
定义:\(*: \Lambda^k(V) \to \Lambda^{n-k}(V)\) 由以下条件唯一确定:
其中 \(\langle\cdot,\cdot\rangle_{\Lambda^k}\) 是由 \(V\) 的内积诱导的 \(\Lambda^k(V)\) 上的内积(Gram 行列式公式:\(\langle v_1 \wedge \cdots \wedge v_k, w_1 \wedge \cdots \wedge w_k \rangle = \det[\langle v_i,w_j \rangle]\))。
存在唯一性来自配对 \(\Lambda^k \times \Lambda^{n-k} \to \Lambda^n\) 的非退化性。
§17.3 标准正交基上的计算¶
设 \(\{e_1,\ldots,e_n\}\) 是标准正交基。对递增指标序列 \(I = (i_1 < \cdots < i_k)\),记 \(I^c\) 为其补集(也递增排列)。则
其中 \(\operatorname{sgn}(I, I^c)\) 是把 \((I, I^c)\) 排列成 \((1,2,\ldots,n)\) 所需的置换的符号。
恒等式:
广义签名 \((p,q)\) 时多一个 \((-1)^s\) 因子(\(s\) 为负号个数)。
§17.4 Hodge 星是等距¶
定理:\(\langle *\omega, *\eta \rangle = \langle \omega, \eta \rangle\)。
证明:\(\langle *\omega, *\eta \rangle \cdot \operatorname{vol} = (*\omega) \wedge *(*\eta) = (-1)^{k(n-k)}(*\omega) \wedge \eta = (-1)^{k(n-k)} \eta \wedge (*\omega) \cdot (-1)^{(n-k)k} = \eta \wedge *\omega = \langle \eta, \omega \rangle \cdot \operatorname{vol} = \langle \omega, \eta \rangle \cdot \operatorname{vol}\)。
§17.5 Maxwell 方程与端口 Hamilton 系统¶
在四维 Minkowski 时空中,电磁场张量 \(F \in \Lambda^2\) 和电流 \(J \in \Lambda^1\) 满足 Maxwell 方程的紧凑形式:
Hodge 星把拓扑约束(\(d\))与几何/度量约束(\(*\))分离。在软体/连续介质机器人中,van der Schaft-Maschke 的 Stokes-Dirac 结构把动力学写成 \(d\) 与 \(*\) 的配对,保持能量守恒。
⚠️ 常见陷阱¶
💡 概念误区 11:以为 Hodge 星是纯代数的 新手想法:\(*\) 只是一个代数运算,和楔积一样。 实际上:楔积 \(\wedge\) 是纯代数的(不需要度量),但 Hodge 星 \(*\) 需要**度量和定向**。换一个度量(如从欧几里得换到 Minkowski),\(*\) 的结果完全不同。这就是为什么 Maxwell 方程中 \(dF=0\) 是"拓扑的"(不依赖度量),而 \(d*F=*J\) 是"度量的"(依赖时空度量)。
练习¶
- (推导题) 在 \(\mathbb{R}^4\)(标准度量),计算 \(*(e_1 \wedge e_2)\)。验证 \(**=+1\)(因为 \(k=2\), \(n=4\), \(k(n-k) = 4\))。
- (证明题) 证明在 \(\mathbb{R}^3\)(标准度量和定向)中,\(*(1) = e_1 \wedge e_2 \wedge e_3\),\(*(e_1 \wedge e_2 \wedge e_3) = 1\)。
第七部分:指标语言与张量分析¶
前六部分用无坐标的方式建立了张量积和外代数。本部分引入物理学家和工程师常用的**指标记号**——它不是新理论,而是前面理论的坐标表达。
§18 指标记号与 Einstein 求和约定 ⭐⭐¶
§18.1 动机:为什么需要指标记号¶
无坐标的张量语言(\(T \in V \otimes V^*\),\(\Lambda^k(T)\))在理论推导中优雅且不易出错。但在具体计算中——尤其是涉及复杂张量缩并的动力学方程中——把所有东西写成无坐标形式会极其繁琐。指标记号是一种"坐标速记法",让复杂的张量运算变得可操作。
类比:无坐标语言就像自然语言(表达精确但冗长),指标记号就像数学符号(紧凑但需要学习语法规则)。像的部分:两者表达相同的内容。不像的部分:指标记号依赖基的选择(虽然最终结果不依赖),无坐标语言不依赖。
§18.2 上下指标约定¶
向量(逆变,上指标):\(v = v^i e_i\)(Einstein 约定:重复指标自动求和)。
余向量(协变,下指标):\(\alpha = \alpha_i e^i\)。
Einstein 求和约定:重复出现的一对上下指标(称为**哑指标**)隐含求和。例如:
关键规则:上下指标**必须配对**求和。两个上指标或两个下指标相乘不缩并——除非有度量张量升降指标(§19)。
§18.3 \((p,q)\)-型张量的指标表示¶
\((p,q)\)-型张量 \(T \in T^p_q(V)\) 在基 \(\{e_i\}\) 和对偶基 \(\{e^j\}\) 下表示为:
基变换律:设新基 \(\tilde{e}_j = A^i_{\ j} e_i\)(\(A\) 为基变换矩阵),则
- 逆变分量:\(\tilde{v}^i = (A^{-1})^i_{\ j} v^j\)(与基**反**方向变换)
- 协变分量:\(\tilde{\alpha}_j = A^i_{\ j} \alpha_i\)(与基**同**方向变换)
- 一般 \((p,q)\) 张量:每个上指标贴 \(A^{-1}\),每个下指标贴 \(A\)
§18.4 指标记号的基本运算¶
张量乘积(外积):两个张量的分量直接相乘,指标并列。例如 \((p,0)\)-型张量 \(A^{i_1\cdots i_p}\) 和 \((0,q)\)-型张量 \(B_{j_1 \cdots j_q}\) 的张量积是 \((p,q)\)-型张量 \(C^{i_1\cdots i_p}_{\ \ \ \ j_1\cdots j_q} = A^{i_1\cdots i_p} B_{j_1\cdots j_q}\)。
缩并:令一对上下指标相等并求和。例如对 \((1,1)\)-型张量 \(T^i_{\ j}\),缩并得标量 \(T^i_{\ i} = \operatorname{tr}(T)\)。
对称化与反对称化:\(T^{(ij)} = \frac{1}{2}(T^{ij} + T^{ji})\)(对称部分),\(T^{[ij]} = \frac{1}{2}(T^{ij} - T^{ji})\)(反对称部分)。
具体计算示例:设 \(v^i = (3, 1)\), \(\alpha_j = (2, -1)\)。则 \(\alpha_i v^i = 2 \cdot 3 + (-1) \cdot 1 = 5\)(标量)。外积 \(v^i \alpha_j\) 是 \(2 \times 2\) 矩阵:
缩并 \(v^i \alpha_i = 6 + (-1) = 5\)——与内积一致。
§18.5 为什么区分上下指标至关重要¶
在欧几里得空间 + 正交基中,度量矩阵 \(g_{ij} = \delta_{ij}\)(单位阵),上指标和下指标在数值上没有区别。这容易让人以为"上下标只是书写习惯"。
但在以下情形中,混淆上下标会导致严重错误:
| 情形 | 后果 |
|---|---|
| 弯曲空间(广义相对论) | \(g_{ij} \neq \delta_{ij}\),\(v^i \neq v_i\) |
| 非正交基(关节空间) | 质量矩阵 \(M_{ij} \neq \delta_{ij}\) |
| Minkowski 时空 | \(g = \operatorname{diag}(-1,+1,+1,+1)\),混淆导致符号错误 |
本质洞察:上下标的区分不是"记号约定",而是反映了向量(推动/速度/逆变)与余向量(拉回/力/协变)的物理差异。在欧几里得空间中这个差异被正交基掩盖了,但在一般的流形上(配置空间、时空)它是本质的。
⚠️ 常见陷阱¶
💡 概念误区 12:以为 Einstein 求和中两个下标也可以缩并 新手想法:\(a_i b_i\) 就是 \(\sum a_i b_i\)。 实际上:严格的 Einstein 约定要求一上一下配对。\(a_i b_i\) 在没有度量的情况下**没有意义**——你需要用度量把 \(b_i\) 升为 \(b^i\)(即 \(a_i g^{ij} b_j\))才能缩并。在欧几里得空间 \(g^{ij} = \delta^{ij}\),结果数值相同,但概念上是不同的运算。
🧠 思维陷阱 8:以为"逆变"意味着"变换方向相反"就结束了 新手想法:知道"逆变 \(=\) 与基反向变换"就够了。 实际上:更深层的理解是——逆变和协变反映的是张量的**函子性**。速度(逆变)在映射 \(\varphi: M \to N\) 下被**前推**(pushforward),力(协变)被**拉回**(pullback)。这在微分几何中有精确的范畴论意义。
练习¶
- (推导题) 在二维空间中,基 \(\{e_1,e_2\}\) 下向量 \(v = 3e_1 + 2e_2\)。新基 \(\tilde{e}_1 = e_1 + e_2\), \(\tilde{e}_2 = e_1 - e_2\)。求新基下的分量 \(\tilde{v}^i\)。验证 \(\tilde{v}^i \tilde{e}_i = v\)。
- (推导题) 写出 \((1,1)\)-型张量 \(T^i_{\ j}\) 在基变换 \(\tilde{e}_k = A^i_{\ k} e_i\) 下的变换律。验证 \(\operatorname{tr}(T) = T^i_{\ i}\) 是基变换不变量。
§19 度量张量与指标升降 ⭐⭐¶
§19.1 度量张量¶
定义:度量张量 \(g\) 是一个 \((0,2)\)-型对称非退化张量:
在标准正交基中 \(g_{ij} = \delta_{ij}\)(欧几里得)或 \(g_{ij} = \eta_{ij}\)(Minkowski)。
逆度量 \(g^{ij}\) 满足 \(g^{ik}g_{kj} = \delta^i_{\ j}\)。
§19.2 音乐同构¶
降指标(flat, \(\flat\)):\(v^i \mapsto v_i := g_{ij}v^j\)。将向量(\(V\) 中)变为余向量(\(V^*\) 中)。
升指标(sharp, \(\sharp\)):\(\alpha_i \mapsto \alpha^i := g^{ij}\alpha_j\)。将余向量变为向量。
这两个操作互逆:\(\sharp \circ \flat = \operatorname{id}\)。
与 Riesz 表示的一致性:回顾 30_内积空间:Riesz 表示定理给出 \(V \cong V^*\)(通过内积)。\(\flat(v) = g(v, \cdot) = \langle v, \cdot \rangle\) 正是 Riesz 映射。指标语言中的升降操作就是 Riesz 同构的坐标表达。
§19.3 延拓到张量¶
度量 \(g\) 不仅作用于向量,还诱导所有张量空间上的内积。特别地:
\(\Lambda^k(V)\) 上的内积:由 Gram 行列式定义:
这正是 §17 Hodge 星的定义所需要的内积。
\(T^p_q(V)\) 上的内积:通过 \(g\) 的逐分量作用定义。在指标语言中,\((p,q)\)-型张量 \(S\) 和 \(T\) 的内积为
即"所有上指标用 \(g\) 缩并,所有下指标用 \(g^{-1}\) 缩并"。
§19.4 Riemann 度量与配置空间¶
机器人质量矩阵 \(M(q) = (g_{ij}(q))\) 就是配置空间 \(Q\) 上的 Riemann 度量。 动能
是"长度平方"的动力学版本。自由运动(无外力)的方程是**测地方程**:
其中 Christoffel 符号
是由度量唯一确定的 Levi-Civita 联络。Coriolis 项 \(C(q,\dot{q})\dot{q}\) 正是来自 Christoffel 符号。
应用视角:Slotine-Li 自适应控制利用 \(\dot{M} - 2C\) 的斜对称性——这个性质来自度量张量的"无挠性"(Levi-Civita 联络的对称性)。不理解度量张量,就无法从几何层面理解这个控制设计。
⚠️ 常见陷阱¶
💡 概念误区 13:以为"升降指标只是乘以 \(M\)" 新手想法:升降指标就是矩阵乘法,没什么深刻的。 实际上:升降指标改变了张量的**类型**——从向量变成余向量,或反之。在物理上,速度(逆变)和力矩(协变)是不同的物理量,虽然在标准基下数值相同。度量张量是"翻译"这两种语言的字典。
练习¶
- (推导题) 对度量 \(g = \begin{pmatrix} 1 & 1/2 \\ 1/2 & 1 \end{pmatrix}\),计算逆度量 \(g^{ij}\)。对向量 \(v = (v^1, v^2) = (1, 2)\),计算协变分量 \(v_i = g_{ij}v^j\)。验证 \(v_i v^i = g_{ij}v^i v^j\)。
§20 张量缩并与迹 ⭐⭐¶
§20.1 缩并¶
对 \((p,q)\)-型张量,选择一对上下指标令其相等并求和(Einstein 约定自动完成),得到 \((p-1,q-1)\)-型张量。无坐标形式:缩并是求值映射 \(\operatorname{ev}: V \otimes V^* \to F\)(\(v \otimes \varphi \mapsto \varphi(v)\))的自然延拓。
例:对 \((1,1)\)-型张量 \(T^i_{\ j}\),缩并得标量 \(T^i_{\ i} = \operatorname{tr}(T)\)(迹)。
§20.2 迹的基不变性¶
在 \(\operatorname{Hom}(V,V) \cong V^* \otimes V\) 的同构下,迹 \(=\) 缩并唯一的指标对。基变换 \(\tilde{T}^i_{\ j} = (A^{-1})^i_{\ k} T^k_{\ \ell} A^\ell_{\ j}\) 下 \(\tilde{T}^i_{\ i} = (A^{-1})^i_{\ k} T^k_{\ \ell} A^\ell_{\ i} = T^k_{\ \ell} \delta^\ell_k = T^k_{\ k}\),即 \(\operatorname{tr}(\tilde{T}) = \operatorname{tr}(T)\)。
迹的基不变性是缩并的基本变换律的直接推论——不需要额外证明。
§20.3 缩并的坐标无关性¶
缩并的结果不依赖基的选择——这是因为缩并对应的是自然映射 \(\operatorname{ev}: V \otimes V^* \to F\)。"自然"在范畴论中有精确含义:\(\operatorname{ev}(v \otimes \varphi) = \varphi(v)\) 不需要选择任何基。
相对照地,"取第 \(i\) 个分量" \(v \mapsto v^i\) 不是自然的——它依赖基的选择。缩并之所以给出不变量,是因为上指标的非自然性和下指标的非自然性"相互抵消"了。
这个观察的推论是:任何由张量的缩并和张量积组合得到的标量表达式都是坐标不变的。这就是为什么 \(\operatorname{tr}(T)\)、\(\det(T)\)、\(T^{ij}S_{ij}\) 等等都不依赖基——它们都是缩并的结果。
§20.4 下游预告:Ricci 缩并¶
在 Riemann 几何中,Riemann 曲率张量 \(R^i_{\ jk\ell}\) 是 \((1,3)\)-型张量。对第一和第三指标缩并得 \((0,2)\)-型的 Ricci 张量:
进一步用度量缩并得**标量曲率** \(R = g^{j\ell}R_{j\ell}\)。这两步缩并是 Einstein 场方程 \(R_{j\ell} - \frac{1}{2}Rg_{j\ell} = 8\pi G T_{j\ell}\) 的左端——它把几何(曲率)与物质(能量-动量张量 \(T_{j\ell}\))联系起来。
在机器人学中,虽然我们通常不处理 Einstein 方程,但配置空间的曲率张量(通过质量矩阵 \(M(q)\) 定义的 Riemann 度量)确实影响运动规划——在正曲率区域,测地线(自由运动轨迹)趋于聚拢;在负曲率区域,测地线趋于发散。
§20.5 双缩并¶
对 \((0,2)\)-型张量 \(\sigma_{ij}\) 和 \((2,0)\)-型张量 \(\varepsilon^{ij}\),双缩并 \(\sigma_{ij}\varepsilon^{ij}\) 是标量。物理中的"冒号积" \(\sigma : \varepsilon\)(应力-应变能密度)就是此运算。
§20.6 张量方程的指标运算¶
指标记号的强大之处在于复杂的张量方程可以系统地操作。以下是一些常见的指标操作模式:
模式 1:乘法后缩并。 \(A^i_{\ j} B^j_{\ k} = C^i_{\ k}\)(矩阵乘法的指标版本)。
模式 2:对称化。 \(S_{ij} = \frac{1}{2}(T_{ij} + T_{ji})\)(提取对称部分)。
模式 3:反对称化。 \(A_{ij} = \frac{1}{2}(T_{ij} - T_{ji})\)(提取反对称部分)。
模式 4:Levi-Civita 张量。 完全反对称张量 \(\varepsilon_{ijk}\)(\(n=3\))满足 \(\varepsilon_{123} = 1\),置换任意两个指标变号。叉积可以写为 \((u \times v)^i = \varepsilon^{ijk}u_j v_k\)。
模式 5:Kronecker \(\delta\)。 \(\delta^i_{\ j}\) 是 \((1,1)\)-型张量,满足 \(\delta^i_{\ j}v^j = v^i\)(恒等映射)。
练习¶
- (推导题) 对 \((2,1)\)-型张量 \(T^{ij}_{\ \ k}\),写出对 \((i,k)\) 缩并后的结果。它是什么类型的张量?
- (推导题) 用 Levi-Civita 张量 \(\varepsilon_{ijk}\) 和 Einstein 约定写出叉积 \((u \times v)^i = \varepsilon^{ijk}u_j v_k\)。验证这与分量公式 \((u \times v)_1 = u_2 v_3 - u_3 v_2\) 等一致。
- (证明题) 证明 \(\varepsilon^{ijk}\varepsilon_{imn} = \delta^j_m \delta^k_n - \delta^j_n \delta^k_m\)(Levi-Civita 恒等式)。这个恒等式在向量恒等式 \(a \times (b \times c) = b(a \cdot c) - c(a \cdot b)\) 的证明中至关重要。
第八部分:进阶代数¶
§21 对称代数 \(S(V)\) ⭐⭐⭐¶
§21.1 定义¶
对称代数是张量代数 \(T(V)\) 商掉交换关系后的结果:
它是 \(V\) 生成的**自由交换代数**。
§21.2 与多项式环的同构¶
选定 \(V\) 的基 \(\{e_1,\ldots,e_n\}\) 后,\(S(V) \cong F[x_1,\ldots,x_n]\)(多项式环),通过 \(e_i \mapsto x_i\)。
分级维数:\(\dim S^k(V) = \binom{n+k-1}{k}\)(长度为 \(k\) 的多项式的单项式个数)。
Poincare 级数:\(\sum_{k=0}^{\infty} \dim S^k(V) \cdot t^k = \frac{1}{(1-t)^n}\)。
对比外代数的 Poincare 级数 \(\sum_{k=0}^{n} \dim \Lambda^k(V) \cdot t^k = (1+t)^n\)。一个是 \(1/(1-t)^n\),一个是 \((1+t)^n\)——在物理中对应**玻色子**(对称,可以占据同一状态)和**费米子**(反对称,Pauli 不相容原理)。
练习¶
- (开放思考题) 为什么对称代数 \(S(V)\) 是无穷维的(\(\dim S^k(V) > 0\) 对所有 \(k\)),而外代数 \(\Lambda(V)\) 是有限维的(\(\Lambda^k = 0\) 当 \(k > n\))?用 \(v \wedge v = 0\) 和 \(v \cdot v = v^2 \neq 0\) 给出直觉解释。
§22 Clifford 代数与 Spin 群 ⭐⭐⭐¶
§22.1 动机:量子化外代数¶
外代数 \(\Lambda(V)\) 满足 \(v \wedge v = 0\)(平方为零)。但如果向量有"长度"(二次型 \(q\)),我们可以修改这个关系为 \(v \cdot v = q(v) \cdot 1\)。这就是 Clifford 代数——它把度量信息编码进代数乘法中。
§22.2 定义¶
定义:给定二次型 \(q: V \to F\),Clifford 代数
- 当 \(q \equiv 0\) 时,\(\operatorname{Cl}(V,0) = \Lambda(V)\)(外代数是 Clifford 代数的特例)。
- 当 \(q\) 非退化时,Clifford 代数"量子化"了外代数。
乘法关系:选择 \(q\)-正交基 \(\{e_1,\ldots,e_n\}\)(\(q(e_i) = q_i\)),则
基和维数与外代数相同(\(2^n\) 维),但乘法不同。
§22.3 四元数作为 Clifford 代数¶
\(\operatorname{Cl}^+(3,0)\)(\(\operatorname{Cl}(\mathbb{R}^3, |\cdot|^2)\) 的偶子代数)同构于四元数 \(\mathbb{H}\),通过
验证:\(i^2 = (-e_2 e_3)^2 = e_2 e_3 e_2 e_3 = -e_2 e_2 e_3 e_3 = -(+1)(+1) = -1\)。类似地 \(j^2 = k^2 = -1\),\(ij = k\) 等。
§22.4 对偶四元数与 \(SE(3)\)¶
四元数描述旋转 \(SO(3)\),而**对偶四元数**(dual quaternions)描述刚体运动 \(SE(3)\)(旋转+平移)。
对偶数是形如 \(a + \varepsilon b\) 的数,其中 \(\varepsilon^2 = 0\)(\(\varepsilon\) 是"无穷小量",类似于 Taylor 展开的一阶项)。对偶四元数 \(\hat{q} = q + \varepsilon q'\) 中 \(q\) 是旋转四元数,\(q'\) 编码平移信息。
| 表示方法 | 描述的群 | 参数数 | 约束数 | 自由度 |
|---|---|---|---|---|
| 四元数 \(q \in \mathbb{H}\), $ | q | =1$ | \(SO(3)\) | 4 |
| 对偶四元数 \(\hat{q}\) | \(SE(3)\) | 8 | 2 | 6 |
| \(4 \times 4\) 齐次矩阵 | \(SE(3)\) | 16 | 10 | 6 |
对偶四元数在航天器姿态和位置控制中广泛使用(Han et al. 2008),因为它避免了齐次矩阵的冗余参数化,同时支持高效的插值(ScLERP)。
§22.5 Spin 群与双重覆盖¶
\(\operatorname{Spin}(n) \subseteq \operatorname{Cl}^+(n,0)\) 是 Clifford 代数偶子代数中的一个群,满足:
双重覆盖意味着 \(SO(n)\) 中的每个旋转对应 \(\operatorname{Spin}(n)\) 中的**两个**元素(\(q\) 和 \(-q\))。
\(n=3\) 的具体情形:\(\operatorname{Spin}(3) \cong SU(2) \cong\) 单位四元数。旋转 \(R \in SO(3)\) 对应单位四元数 \(q = \cos(\theta/2) + \sin(\theta/2)(n_1 i + n_2 j + n_3 k)\) 和 \(-q\)。
其中 \(v\) 视为纯虚四元数。
应用视角:四元数法(SLERP 插值、无万向锁姿态控制)、对偶四元数(\(SE(3)\) 的描述)、motor 代数(6-DOF 螺旋运动)——这些机器人学工具的数学本质都是 Clifford 代数。
⚠️ 常见陷阱¶
💡 概念误区 14:以为四元数"只是"另一种旋转表示 新手想法:四元数和旋转矩阵本质上一样,只是换了一种写法。 实际上:四元数 \(q\) 和 \(-q\) 表示同一个旋转——这个 \(2:1\) 对应反映了 \(SO(3)\) 的基本群 \(\pi_1(SO(3)) = \mathbb{Z}/2\)。Spin 群 \(\operatorname{Spin}(3) \cong SU(2)\) 是 \(SO(3)\) 的**万有覆盖**——它是单连通的。这个拓扑差异在控制中有实际后果:连续姿态控制不可避免地有"不连续点"(拓扑障碍),而在 \(SU(2)\) 上可以做全局连续控制。
🧠 思维陷阱 9:以为 Clifford 代数只是代数好奇心 新手想法:\(\operatorname{Cl}(V,q)\) 太抽象了,实际用不到。 实际上:Clifford 代数统一了标量、向量、二向量、三向量等所有几何对象。在**几何代数**(Geometric Algebra)框架下,旋转、反射、投影、对偶都可以用 Clifford 乘法统一表达。Dorst-Fontijne-Mann 的 Geometric Algebra for Computer Science 和 Selig 的 Geometric Fundamentals of Robotics 展示了这些应用。
练习¶
- (推导题) 在 \(\operatorname{Cl}(\mathbb{R}^2, |\cdot|^2)\) 中,验证 \(e_1 e_2\) 满足 \((e_1 e_2)^2 = -1\)。这意味着 \(\operatorname{Cl}(\mathbb{R}^2) \cong\)?
- (跨章综合题) 结合
40_谱定理SVD与极分解.md的极分解和本章的 Clifford 代数,解释为什么单位四元数参数化了 \(SU(2) \cong \operatorname{Spin}(3)\)。(提示:\(SU(2)\) 是 \(\mathbb{R}^4\) 中的单位球 \(S^3\)。)
本章常见误解汇总¶
| 编号 | 误解 | 正确理解 |
|---|---|---|
| 1 | 多线性映射 \(=\) 线性映射 | 多线性是逐变量线性,严格强于整体线性 |
| 2 | 合同变换 \(=\) 相似变换 | 相似保特征值,合同保签名——两个不同不变量 |
| 3 | \(v \otimes w\) 只是形式符号 | 蕴含商空间的全部双线性关系 |
| 4 | 所有张量都可分解为 \(v \otimes w\) | 不可分解张量对应高秩映射(如单位阵) |
| 5 | Kronecker 积 \(=\) 张量积 | Kronecker 积是张量积在选定基后的矩阵表示 |
| 6 | \(V^{\otimes k}\) 总分解为对称+反对称 | \(k \ge 3\) 时有更多不可约分量 |
| 7 | \(v \wedge w = 0\) \(\Rightarrow\) \(v=0\) 或 \(w=0\) | 等价于 \(v,w\) 线性相关 |
| 8 | 叉积在任何维度都存在 | 只在 \(n=3\) 和 \(n=7\) |
| 9 | 行列式只是计算工具 | 它是体积放大率和定向的几何量 |
| 10 | 叉积是坐标无关的 | 楔积是,但叉积需要 Hodge 星(依赖度量和定向) |
| 11 | Hodge 星是纯代数运算 | 需要度量和定向 |
| 12 | Einstein 约定中两个下标也可缩并 | 需一上一下配对(无度量时) |
| 13 | 升降指标只是乘以矩阵 | 改变张量类型(向量 \(\leftrightarrow\) 余向量) |
| 14 | 四元数只是另一种旋转表示 | 反映 \(SO(3)\) 的双重覆盖和拓扑性质 |
本章小结¶
符号表¶
| 符号 | 含义 | 首次出现 |
|---|---|---|
| \(\operatorname{Mult}(V_1,\ldots,V_k;W)\) | \(k\)-线性映射空间 | §1.4 |
| \(B: V \times V \to F\) | 双线性型 | §2.2 |
| \((p,q,z)\) | Sylvester 签名 | §2.5 |
| \(V \otimes W\) | 张量积 | §3.2 |
| \(v \otimes w\) | 简单张量 | §3.4 |
| \(\otimes_{\mathrm{Kr}}\) | Kronecker 积 | §4.2 |
| \(T^p_q(V)\) | \((p,q)\)-型张量空间 | §5.4 |
| \(\operatorname{Sym}^k(V)\) | 对称 \(k\)-张量空间 | §6.2 |
| \(\Lambda^k(V)\) | 反对称 \(k\)-张量空间(第 \(k\) 外幂) | §6.2 |
| \(T(V)\) | 张量代数 | §7.1 |
| \(\alpha \wedge \beta\) | 楔积 | §8.2 |
| \(\Lambda(V)\) | 外代数 | §9.1 |
| \(\det(T)\) | 行列式(外代数定义) | §11.2 |
| \(\operatorname{adj}(A)\) | 伴随矩阵(经典) | §14.1 |
| \(u \times v\) | 叉积 | §15.2 |
| \(\iota_v\) | 内积(缩并)算子 | §16.1 |
| \(*\) | Hodge 星算子 | §17.2 |
| \(v^i\), \(\alpha_i\) | 逆变/协变分量 | §18.2 |
| \(g_{ij}\), \(g^{ij}\) | 度量张量及其逆 | §19.1 |
| \(\flat\), \(\sharp\) | 音乐同构(降/升指标) | §19.2 |
| \(\Gamma^i_{jk}\) | Christoffel 符号 | §19.3 |
| \(S(V)\) | 对称代数 | §21.1 |
| \(\operatorname{Cl}(V,q)\) | Clifford 代数 | §22.2 |
| \(\operatorname{Spin}(n)\) | Spin 群 | §22.4 |
定理速查表¶
| 定理/公式 | 一句话说明 | 对应节 |
|---|---|---|
| 张量积泛性质 | 双线性映射 \(\leftrightarrow\) 张量积上的线性映射 | §3.2 |
| \(\dim(V \otimes W) = \dim V \cdot \dim W\) | 张量积的维数是因子维数之积 | §3.5 |
| \(V^* \otimes W \cong \operatorname{Hom}(V,W)\) | 线性映射空间是张量积 | §3.7 |
| Sylvester 惯性律 | 实对称双线性型的签名是基变换不变量 | §2.5 |
| \(\dim \Lambda^k(V) = \binom{n}{k}\) | 第 \(k\) 外幂的维数 | §10.1 |
| 分级反交换律 | \(\alpha \wedge \beta = (-1)^{pq}\beta \wedge \alpha\) | §8.3 |
| \(\det(T) = \Lambda^n(T)\) 的标量 | 行列式的无坐标定义 | §11.2 |
| \(\det(AB) = \det(A)\det(B)\) | 乘法性,由 \(\Lambda^n\) 函子性一行证明 | §12.1 |
| \(u \times v = *(u \wedge v)\) | 叉积 \(=\) 楔积 + Hodge 星 | §15.2 |
| Hodge 星是等距 | \(\langle *\omega, *\eta \rangle = \langle \omega, \eta \rangle\) | §17.4 |
| \(\operatorname{Spin}(3) \cong SU(2)\) | 单位四元数双重覆盖 \(SO(3)\) | §22.4 |
知识点总表¶
| 编号 | 知识点 | 核心要点 | 对应节 | 难度 |
|---|---|---|---|---|
| 1 | 多线性映射 | 逐变量线性,维数乘法 | §1 | ⭐⭐ |
| 2 | 双线性型 | 合同变换,Sylvester 签名 | §2 | ⭐⭐ |
| 3 | 张量积构造 | 泛性质,自由空间/商空间 | §3 | ⭐⭐ |
| 4 | Kronecker 积 | 张量积的矩阵表示 | §4 | ⭐⭐ |
| 5 | 张量空间 \(T^p_q(V)\) | 逆变/协变秩 | §5 | ⭐⭐ |
| 6 | 对称/反对称分解 | \(S_k\) 作用,\(\operatorname{Sym}^k\), \(\Lambda^k\) | §6 | ⭐⭐ |
| 7 | 张量代数 \(T(V)\) | 自由结合代数 | §7 | ⭐⭐⭐ |
| 8 | 楔积 | 反对称乘积,\(v \wedge v = 0\) | §8 | ⭐⭐ |
| 9 | 外代数 \(\Lambda(V)\) | 分次代数,\(\dim = 2^n\) | §9 | ⭐⭐ |
| 10 | 外幂的基与维数 | \(\binom{n}{k}\),维数对偶性 | §10 | ⭐⭐ |
| 11 | 行列式(外代数) | \(\Lambda^n\) 上的标量,无坐标 | §11 | ⭐⭐ |
| 12 | 行列式性质 | 乘法性一行证明 | §12 | ⭐⭐ |
| 13 | 体积与定向 | $ | \det | $ = 体积放大率 |
| 14 | Cramer 法则 | 理论价值,非数值 | §14 | ⭐⭐⭐ |
| 15 | 叉积 \(=\) 楔积 + Hodge 星 | 三维特有,维数偶然 | §15 | ⭐⭐ |
| 16 | 内积算子 \(\iota_v\) | 反导性,Cartan 公式预告 | §16 | ⭐⭐⭐ |
| 17 | Hodge 星 | 依赖度量和定向,等距 | §17 | ⭐⭐ |
| 18 | Einstein 约定 | 上下指标配对缩并 | §18 | ⭐⭐ |
| 19 | 度量张量 | 升降指标,音乐同构 | §19 | ⭐⭐ |
| 20 | 缩并与迹 | 迹 = 缩并,基不变 | §20 | ⭐⭐ |
| 21 | 对称代数 \(S(V)\) | 多项式环,玻色-费米对偶 | §21 | ⭐⭐⭐ |
| 22 | Clifford 代数 | 四元数,Spin 群,双重覆盖 | §22 | ⭐⭐⭐ |
累积项目:本章新增模块¶
项目名称:手写张量计算库
本章为累积项目新增以下模块:
| 模块 | 功能 | 依赖 |
|---|---|---|
TensorProduct |
两个向量空间的张量积计算 | Ch1 基础结构 |
ExteriorAlgebra |
楔积、外幂基计算 | TensorProduct |
Determinant |
用外代数计算行列式 | ExteriorAlgebra |
HodgeStar |
Hodge 星算子 | ExteriorAlgebra + Ch2 内积 |
IndexNotation |
指标升降、缩并 | TensorProduct + Ch2 内积 |
本章新增任务:实现 \(\Lambda^k(\mathbb{R}^n)\) 的基生成和楔积计算,用它验证 \(\det(AB) = \det(A)\det(B)\)。
延伸阅读¶
入门级 ⭐: - Axler, Linear Algebra Done Right, 4th edition, Chapter 10 —— 外代数最友好的入门。 - Spivak, Calculus on Manifolds, §4 —— 微分形式视角的简洁处理。
核心级 ⭐⭐: - Roman, Advanced Linear Algebra (GTM 135), §11, §14--§16 —— 张量积和外代数的标准教材。 - Halmos, Finite-Dimensional Vector Spaces, §23--§33 —— 经典抽象处理。 - Conrad, "Tensor Products I/II" (lecture notes) —— 张量积泛性质最清晰的讲解。
进阶级 ⭐⭐⭐: - Greub, Multilinear Algebra —— 多线性代数的百科全书。 - Lang, Algebra (GTM 211), §XIII, §XVI, §XIX —— 代数视角的系统处理。 - Lee, Introduction to Smooth Manifolds, §11--§16 —— 流形上的张量和微分形式。 - Bowen-Wang, Introduction to Vectors and Tensors, Vol. 1--2 —— 工程导向的张量分析。
研究级 ⭐⭐⭐⭐: - Lawson-Michelsohn, Spin Geometry, Chapter 1 —— Clifford 代数和 Spin 群。 - Selig, Geometric Fundamentals of Robotics, Chapter 9--10 —— 机器人中的几何代数。 - Dorst-Fontijne-Mann, Geometric Algebra for Computer Science —— 计算机科学中的应用。
本章与后续章节的关系¶
| 后续章节 | 与本章的关系 | 本章哪个知识点为其铺垫 |
|---|---|---|
70_点集拓扑.md |
度量空间的结构 | §2(双线性型诱导的度量) |
80_抽象代数.md |
群、环、代数的例子 | §7(张量代数)、§22(Clifford 代数) |
| 第一层:微分几何 | 微分形式 \(\Omega^k(M)\)、度量张量 | §8--§10(外代数)、§19(度量) |
| 第一层:李群 | \(\mathfrak{so}(3)\) 与帽映射 | §15(叉积与 \(\Lambda^2\))、§22(Spin 群) |
| 第一层:Riemann 几何 | Christoffel 符号、测地方程 | §19(度量张量)、§20(缩并) |
| 第二层:几何控制 | Cartan 魔法公式、端口 Hamilton | §16(\(\iota_v\))、§17(Hodge 星) |
| 第二层:动力学 | 质量矩阵、Coriolis 项 | §19(Riemann 度量) |
故障排查手册¶
| 症状 | 可能原因 | 排查步骤 | 相关章节 |
|---|---|---|---|
| 张量积维数算错 | 混淆 \(\dim(V \times W)\) 与 \(\dim(V \otimes W)\) | 1. 确认是加法还是乘法 2. 检查 \(\dim V \cdot \dim W\) | §3.5 |
| 楔积符号算错 | \((-1)^{pq}\) 写成 \((-1)^{p+q}\) | 1. 逐步写出换位过程 2. 检查 \(p,q\) 的奇偶性 | §8.3, §10.4 |
| 行列式乘法性证不出 | 用排列公式而非外代数 | 1. 回到 \(\Lambda^n\) 定义 2. 用函子性 | §12.1 |
| 指标缩并结果类型错误 | 缩并了两个同类型指标 | 1. 检查一上一下配对 2. 需要度量时先升/降 | §18, §20 |
| Hodge 星计算结果符号错 | 忘记 \(\operatorname{sgn}(I,I^c)\) | 1. 写出完整排列 2. 数换位次数 | §17.3 |
研究实践建议¶
给初学者:
- 先掌握 §1--§3(多线性映射、张量积构造、维数定理),这是全章的基础。不理解泛性质没关系——先记住"双线性 \(\leftrightarrow\) 线性"的对应,用几次自然就懂了。
- 外代数(§8--§12)是投入产出比最高的部分。行列式的外代数定义(§11)和乘法性的一行证明(§12)是"顿悟时刻"——一旦理解,对行列式的认识会永久升级。
- 指标记号(§18--§19)需要大量练习。理论上简单,但手算容易犯错。建议对照具体例子(\(2 \times 2\) 或 \(3 \times 3\) 矩阵)做升降指标和缩并练习。
- Clifford 代数(§22)可以后看。如果你暂时不涉及四元数或 Spin 群,可以先跳过。
给有经验者:
- 关注泛性质的范畴论视角(§3.2--§3.3)。泛性质是现代数学的基本工具——理解它在张量积中的应用,有助于理解其他代数构造(如局部化、完备化、诱导表示)。
- 深入 Hodge 星与 Maxwell 方程(§17.5)。Hodge 分解 \(\Omega^k = d\Omega^{k-1} \oplus d^*\Omega^{k+1} \oplus \mathcal{H}^k\)(精确形式+余精确形式+调和形式)是流形上 PDE 理论的核心。
- 探索几何代数在机器人学中的应用。Selig 的书展示了如何用 Clifford 代数统一处理旋转、平移、螺旋运动——比传统的齐次变换矩阵更优雅。
进一步学习路径:
| 方向 | 下一步 | 本章基础 |
|---|---|---|
| 微分形式 | Lee Smooth Manifolds Ch. 14--16 | §8--§10, §16--§17 |
| Riemann 几何 | do Carmo Riemannian Geometry | §19(度量张量) |
| 辛几何/Hamilton 力学 | Abraham-Marsden Foundations of Mechanics | §2(辛形式), §17(Hodge 星) |
| 代数拓扑 | Hatcher Algebraic Topology | §10(外幂的维数), §9(分次代数) |
| 几何代数 | Dorst et al. GA for CS | §22(Clifford 代数) |
| 表示论 | Fulton-Harris Representation Theory | §6(\(S_k\) 作用), §7(张量代数) |
跨章综合练习¶
以下练习需要综合前几章(
20_向量空间与线性变换、30_内积空间与伴随算子、40_谱定理SVD与极分解)和本章的知识。
-
(综合题:SVD 与外代数) 设 \(T: V \to W\) 的 SVD 为 \(T = U\Sigma V^*\),奇异值为 \(\sigma_1 \ge \cdots \ge \sigma_r > 0\)。证明 \(\Lambda^k(T)\) 的奇异值恰好是 \(\{\sigma_{i_1}\cdots\sigma_{i_k} : 1 \le i_1 < \cdots < i_k \le r\}\)。特别地,\(\Lambda^r(T)\) 的唯一奇异值是 \(\sigma_1\cdots\sigma_r = |\det(T)|\)(当 \(V=W\) 且 \(r=n\) 时)。(在草稿纸上完成。需综合 §A2c 的 SVD 和本章 §11 的行列式定义。)
-
(综合题:内积与 Hodge 星) 设 \(V = \mathbb{R}^3\) 配标准内积。验证 Hodge 星将 \(1\)-形式的"梯度"、\(2\)-形式的"旋度"、\(3\)-形式的"散度"统一为外微分 \(d\) 的不同伪装。具体地:\(\nabla f = \sharp(df)\),\(\nabla \times F = \sharp(*d(\flat(F)))\),\(\nabla \cdot F = *d*(\flat(F))\)。这里 \(\flat\) 和 \(\sharp\) 是 §19 的音乐同构。(需综合 §A2b 的内积、§17 的 Hodge 星、§19 的升降指标。)
-
(综合题:四元数与极分解) 单位四元数 \(q \in SU(2)\) 通过 \(R(v) = qvq^{-1}\) 给出旋转。设 \(q = a + bi + cj + dk\),写出对应的 \(3 \times 3\) 旋转矩阵 \(R\) 的显式公式。然后用
40_谱定理SVD与极分解.md的极分解验证:任意可逆 \(3 \times 3\) 矩阵 \(A = R|A|\) 中的 \(R\) 可以用单位四元数表示(当 \(\det(A)>0\) 时)。 -
(综合题:Gram 行列式与 Yoshikawa 可操作度) 设机械臂 Jacobian \(J\) 为 \(3 \times 6\) 矩阵。Yoshikawa 可操作度定义为 \(w = \sqrt{\det(JJ^\top)}\)。证明 \(w\) 等于 \(J\) 的六个列向量在 \(\mathbb{R}^3\) 中形成的"广义体积",并用 Gram 行列式公式 \(\det(JJ^\top) = \sum_{|I|=3} (\det J_I)^2\)(\(J_I\) 是 \(J\) 的 \(3 \times 3\) 子矩阵)给出 \(w\) 的组合解释。
版本信息速查¶
| 工具/库 | 版本 | 用途 |
|---|---|---|
| Eigen(C++) | 3.4+ | 矩阵运算、Kronecker 积验证 |
| NumPy(Python) | 1.24+ | numpy.kron 计算 Kronecker 积 |
| SymPy(Python) | 1.12+ | 符号张量积和楔积计算 |
| manif(C++) | 0.0.4+ | Lie 群/Lie 代数运算(本章 §15 的帽映射) |
| SageMath | 10.0+ | 符号化外代数和张量积(教学验证) |
| Mathematica | 14.0+ | TensorProduct, WedgeProduct 函数 |
全章回顾:本章从线性跳到多线性,建立了张量积(§3)和外代数(§8--§10)两大代数工具。用外代数给出了行列式的无坐标定义(§11),一行证明了乘法性(§12),揭示了叉积的维数偶然性本质(§15)。通过指标记号(§18--§20)桥接了抽象代数与物理/工程的计算实践。最后以 Clifford 代数(§22)收尾,连接了四元数与 Spin 群。这些工具在下一层(微分几何、李群)中将"逐点黏在流形上",成为微分形式、联络和曲率的代数基础。
给读者的一句话:如果 A2a--A2d 是学会了"读写",那么 A2e 就是学会了"修辞"——同样的向量、矩阵、内积,在张量与外代数的视角下获得了内蕴、协变、几何化的新表达。掌握这套语言,机器人学的微分几何就不再神秘。