跳转至

多线性代数、张量积与外代数

课程定位|机器人学博士数学基础 · A 模块(高等线性代数)· 第 6 章 文档类型:理论教学(以数学推导为核心,代码仅作数值验证,text:code \(\ge\) 85:15) 前置章节20_向量空间与线性变换.md(向量空间、线性映射、对偶空间 \(V^*\))、30_内积空间与伴随算子.md(内积、Riesz 表示、伴随算子 \(T^*\))、40_谱定理SVD与极分解.md(谱定理、SVD、行列式的矩阵定义)、50_极小多项式与Jordan标准形.md(特征多项式、Cayley-Hamilton) 后继章节70_点集拓扑.md80_抽象代数.md、第一层(微分几何、李群、微分形式) 难度标记:⭐ 必学 · ⭐⭐ 核心 · ⭐⭐⭐ 进阶 · ⭐⭐⭐⭐ 研究级


前置自测 ⭐

📋 答不出 \(\ge 2\)\(\to\) 先回前置章节复习再来。 本章从"多线性"出发构建张量积与外代数,所有推导都以线性映射、对偶空间、内积为基础工具。

编号 问题 答不出 \(\to\) 回顾
1 对偶空间 \(V^*\) 的元素是什么?给定 \(V\) 的基 \(\{e_1,\ldots,e_n\}\),对偶基 \(\{e^1,\ldots,e^n\}\) 满足什么关系? 20_向量空间 §对偶空间
2 Riesz 表示定理说了什么?它给出了 \(V\)\(V^*\) 之间怎样的联系? 30_内积空间 §Riesz
3 内积 \(\langle u,v \rangle\) 关于每个变量分别是什么?如果固定 \(u\),映射 \(v \mapsto \langle u,v \rangle\) 是线性的还是共轭线性的? 30_内积空间 §内积公理
4 行列式 \(\det(A)\) 满足 \(\det(AB)=\det(A)\det(B)\),但你能从排列公式直接看出这一点吗?觉得困难的话,本章会给出一行证明。 40_谱定理SVD + 本章 §6
5 什么是线性映射的像(range)和核(kernel)?如果 \(\{v_1,\ldots,v_k\}\) 线性无关,\(T\) 的限制在这组向量上一定是单射吗? 20_向量空间 §线性映射

自测答案要点(先自己想,再对照):

  1. \(V^*=L(V,F)\) 是所有线性泛函构成的空间;对偶基满足 \(e^i(e_j)=\delta^i_j\)(Kronecker \(\delta\))。
  2. Riesz 表示定理说每个线性泛函 \(\varphi \in V^*\) 唯一地表示为 \(\varphi(\cdot)=\langle u,\cdot \rangle\),从而给出共轭线性同构 \(V \cong V^*\)
  3. 内积关于第一变量线性,第二变量共轭线性(本课程约定)。固定 \(u\) 时,\(v \mapsto \langle u,v \rangle\) 是共轭线性的(实数域退化为线性)。
  4. 从排列公式 \(\det(A)=\sum_\sigma \operatorname{sgn}(\sigma)\prod_i a_{i,\sigma(i)}\) 直接推导乘法性需要冗长的组合论证。本章用外代数一行完成。
  5. \(\operatorname{range}(T)=\{Tv:v\in V\}\),核 \(\ker(T)=\{v:Tv=0\}\)\(T\) 限制在线性无关组上不一定是单射——这组向量可能部分在核中。

本章目标 ⭐

学完本章后,你应该能够:

  1. **定义多线性映射**并区分它与线性映射的本质差异,解释为什么行列式、叉积、惯性张量都是多线性对象。
  2. 从泛性质出发构造张量积 \(V \otimes W\),完成从自由向量空间到商空间的完整推导,并证明 \(\dim(V \otimes W) = \dim V \cdot \dim W\)
  3. 区分简单张量与一般张量,解释为什么"并非所有张量都可分解"以及这与量子纠缠的联系。
  4. 构建外代数 \(\Lambda(V)\) 并推导楔积的基本性质,包括分级反交换律 \(\alpha \wedge \beta = (-1)^{pq}\beta \wedge \alpha\)
  5. 用外代数给出行列式的无坐标定义,并一行证明乘法性 \(\det(AB)=\det(A)\det(B)\)
  6. **推导 Hodge 星算子**并解释叉积 \(u \times v = *(u \wedge v)\) 为何是三维空间的偶然现象。
  7. 掌握指标记号与 Einstein 求和约定,理解协变与逆变的区别以及度量张量的升降指标机制。
  8. **认识 Clifford 代数**与四元数的联系,理解 \(\operatorname{Spin}(3) \cong SU(2)\)\(SO(3)\) 的双重覆盖。

本章知识导航 ⭐

本章是高等线性代数(A2 模块)的收官之作。前四章(A2a--A2d)把"单线性"代数做到了极致:向量空间、对偶、内积、谱、Jordan 标准形。本章的分水岭是从线性跳到多线性——处理两个以上向量同时输入的对象。行列式、叉积、惯性张量、质量矩阵、刚体动能——这些机器人学的日用品全部是多线性的。

本章交付三件事:

  1. 补全行列式的黑箱:前章(A2c/A2d)使用行列式定义特征多项式和 SVD,但行列式本身依赖坐标。本章用外代数 \(\Lambda^n\) 给出无坐标定义。
  2. 把"张量"从物理符号提升为严格数学对象:张量积的泛性质让多线性映射获得统一的代数框架。
  3. 为后续微分形式与李代数铺设纯代数脚手架:第一层的微分形式 \(\Omega^k(M)\)、Lie 括号 \([\cdot,\cdot]\)、联络 \(\nabla\) 都是本章工具的流形版本。
═══ 第一部分:多线性映射与双线性型 (§1–§2) ═══
§1 多线性映射 ──→ §2 双线性型与 Sylvester 惯性律
═══ 第二部分:张量积 (§3–§5) ═══
§3 张量积 V⊗W(泛性质与构造)──→ §4 线性映射的张量积 ──→ §5 迭代张量积
═══ 第三部分:对称与反对称 (§6–§7) ═══                         │
§6 对称与反对称张量 ←─────────────────────────────────────────┘
    └──→ §7 张量代数 T(V)
═══ 第四部分:外代数与楔积 (§8–§10) ═══
§8 楔积定义 ──→ §9 外代数 Λ(V) ──→ §10 基与维数
═══ 第五部分:行列式的无坐标理论 (§11–§14) ═══
§11 行列式 = Λⁿ 上的标量 ──→ §12 行列式性质 ──→ §13 体积与定向
    │                                                │
    └──→ §14 余因子矩阵与 Cramer 法则                │
═══ 第六部分:楔积的几何应用 (§15–§17) ═══          │
§15 叉积 = *(u∧v) ←────────────────────────────────┘
    └──→ §16 内积算子 ι_v ──→ §17 Hodge 星算子

═══ 第七部分:指标语言与张量分析 (§18–§20) ═══
§18 Einstein 求和 ──→ §19 度量张量与升降指标 ──→ §20 张量缩并与迹

═══ 第八部分:进阶代数 (§21–§22) ═══
§21 对称代数 S(V) ──→ §22 Clifford 代数与 Spin 群

推荐阅读路径

  • 首次精读(主干):§1 \(\to\) §2 \(\to\) §3 \(\to\) §5 \(\to\) §6 \(\to\) §8 \(\to\) §10 \(\to\) §11 \(\to\) §12 \(\to\) §15 \(\to\) §17 \(\to\) §18 \(\to\) §19。这条线串起"多线性 \(\to\) 张量积 \(\to\) 外代数 \(\to\) 行列式 \(\to\) Hodge 星 \(\to\) 指标语言"。
  • 进阶补全(二读):§4(Kronecker 积)、§7(张量代数)、§13--§14(体积/Cramer)、§16(内积算子)、§20(缩并与迹)、§21--§22(Clifford 代数)。
  • 速查回头:遇到微分形式回来看 §8--§10;遇到指标记号回来看 §18--§19;遇到四元数回来看 §22。

前置知识桥接 ⭐

本章把前四章的工具从"单线性"升级到"多线性"。在深入之前,先重新激活三个关键概念:

回顾 20_向量空间与线性变换.md:对偶空间 \(V^*\) 对偶空间 \(V^*=L(V,F)\) 是所有线性泛函构成的空间。给定 \(V\) 的基 \(\{e_1,\ldots,e_n\}\),对偶基 \(\{e^1,\ldots,e^n\}\) 满足 \(e^i(e_j)=\delta^i_j\)。在那里我们用对偶空间分析了零化子和维数公式。本章我们需要对偶空间的两个新角色:(1) 张量积 \(V^* \otimes W \cong \operatorname{Hom}(V,W)\) 把线性映射空间统一到张量框架;(2) 外幂 \(\Lambda^k(V^*)\) 成为微分 \(k\)-形式的代数模型。

回顾 30_内积空间与伴随算子.md:内积与 Riesz 表示。 内积 \(\langle\cdot,\cdot\rangle\) 是正定对称(实)或 Hermite(复)双线性型。Riesz 表示定理给出共轭线性同构 \(V \cong V^*\)。本章将这个故事推广到两个方向:(1) 把"双线性"本身作为研究对象(§1--§2),而不只是工具;(2) 把 Riesz 同构用指标语言重述为"音乐同构" \(\flat\)\(\sharp\)(§19)。

回顾 40_谱定理SVD与极分解.md:行列式。 在那里行列式 \(\det(A)\) 通过排列公式 \(\det(A)=\sum_\sigma \operatorname{sgn}(\sigma)\prod_i a_{i,\sigma(i)}\) 定义——依赖于坐标选择。我们用行列式定义了特征多项式、证明了 \(\det(AB)=\det(A)\det(B)\)(虽然证明并不优雅)。本章将给出行列式的真正定义:它是 \(\Lambda^n(T)\) 在一维空间 \(\Lambda^n(V)\) 上的作用标量,不依赖任何基的选择,乘法性是函子性的直接推论。

如果跳过本章会怎样 ⭐

不学本章,后续会在以下三个具体场景中卡住:

  • 场景一:微分形式变成天书。 第一层(微分几何)的微分形式 \(\omega \in \Omega^k(M)\) 是外代数丛 \(\Lambda^k(T^*M)\) 的截面。如果你不理解楔积 \(\wedge\)、分级反交换律、Hodge 星 \(*\),那么 Stokes 定理、de Rham 上同调、Cartan 魔法公式都无从入手。
  • 场景二:张量的上下标让你彻底迷路。 机器人动力学和广义相对论中遍布 \(T^{ij}_{\ \ k}\)\(g_{ij}\)\(\Gamma^i_{jk}\) 这样的指标表达式。不理解协变/逆变、Einstein 求和、升降指标,你只能机械地记忆公式而无法理解"为什么一个指标在上面、另一个在下面"。
  • 场景三:不知道行列式到底是什么。 前几章用排列公式定义行列式,但那只是计算工具,不是概念本质。本章揭示行列式的真正身份:它是线性映射在最高外幂上的作用——一个关于体积和定向的几何量。不理解这一点,你就无法明白为什么 \(\det(R)=+1\) 定义了"保持定向"的旋转。

预计阅读时间 ⭐

阅读方式 时间 适合谁
精读(含推导与练习) 12--16 小时 需要深入理解张量积和外代数的读者
速读(跳过进阶证明) 6--8 小时 有抽象代数基础的读者
速查(只看定义、定理和速查表) 30--45 分钟 遇到具体问题时回来查

第一部分:多线性映射与双线性型

§1 多线性映射 ⭐⭐

§1.1 动机:为什么线性不够用

前四章的所有对象——线性映射 \(T:V \to W\)、对偶空间 \(V^*\)、伴随 \(T^*\)——都是关于单个向量的线性函数。但机器人学中大量的核心对象同时依赖**两个或更多**向量,并且对每个变量分别线性:

  • 内积 \(\langle u,v \rangle\):固定 \(u\)\(v\) 线性,固定 \(v\)\(u\) 线性(即双线性),它把两个向量压缩成一个标量。
  • 叉积 \(u \times v\):固定 \(u\)\(v\) 线性,固定 \(v\)\(u\) 线性,它把两个三维向量变成另一个三维向量。
  • 行列式 \(\det(v_1,\ldots,v_n)\):把 \(n\) 个向量映射为一个标量,对每个 \(v_i\) 分别线性。
  • 动能 \(T = \frac{1}{2}\dot{q}^\top M(q)\dot{q}\):关于 \(\dot{q}\) 是二次的——它是双线性型 \(B(\dot{q}_1,\dot{q}_2) = \dot{q}_1^\top M(q)\dot{q}_2\) 的对角值 \(B(\dot{q},\dot{q})\)

这些对象有一个共同特征:它们不是"整体线性"的。例如 \(\det(cv_1,v_2,\ldots,v_n) = c\det(v_1,v_2,\ldots,v_n)\)(对第一个变量齐次),但 \(\det(v_1+v_1',v_2,\ldots,v_n) = \det(v_1,v_2,\ldots,v_n) + \det(v_1',v_2,\ldots,v_n)\)(对第一个变量可加)——它对**每个变量分别**线性,而不是对所有变量的"组合"线性。

本质洞察:从线性到多线性,不是简单的"推广",而是质的飞跃。线性映射 \(T(cv+w)=cT(v)+T(w)\) 只涉及一个输入。多线性映射涉及多个输入之间的**耦合**——正是这种耦合产生了行列式(体积)、楔积(定向面积)、张量(多方向信息),这些都是单线性映射无法表达的几何量。

§1.2 多线性映射的定义

定义(多线性映射,Multilinear Map):设 \(V_1, V_2, \ldots, V_k, W\) 是域 \(F\) 上的向量空间。映射

\[ f: V_1 \times V_2 \times \cdots \times V_k \to W \]

称为**\(k\)-线性映射**(\(k\)-linear map,或多线性映射),如果对每个 \(i \in \{1,\ldots,k\}\),固定其他所有变量时,\(f\) 关于第 \(i\) 个变量是线性的。即对所有 \(v_j \in V_j\)\(j \neq i\))、\(v_i, v_i' \in V_i\)\(c \in F\)

\[ f(v_1, \ldots, v_i + v_i', \ldots, v_k) = f(v_1, \ldots, v_i, \ldots, v_k) + f(v_1, \ldots, v_i', \ldots, v_k) \]
\[ f(v_1, \ldots, cv_i, \ldots, v_k) = c \cdot f(v_1, \ldots, v_i, \ldots, v_k) \]

\(k=2\) 时称**双线性**(bilinear),\(k=3\) 时称**三线性**(trilinear),等等。

阶段小结:多线性映射是对每个输入槽分别线性的映射。它不是 \(V_1 \oplus \cdots \oplus V_k \to W\) 的线性映射——后者只要求整体线性,前者要求逐槽线性,条件严格得多。

§1.3 多线性映射与线性映射的本质区别

这个区别值得展开讨论,因为初学者经常混淆。考虑 \(f: V \times W \to U\) 双线性与 \(g: V \oplus W \to U\) 线性:

  • 线性映射 \(g\) 满足 \(g(c_1 v_1 + c_2 v_2, c_3 w_1 + c_4 w_2) = c_1 g(v_1,0) + c_2 g(v_2,0) + c_3 g(0,w_1) + c_4 g(0,w_2)\)。它是"各分量独立贡献"的。
  • 双线性映射 \(f\) 满足 \(f(c_1 v_1 + c_2 v_2, c_3 w_1 + c_4 w_2) = c_1 c_3 f(v_1,w_1) + c_1 c_4 f(v_1,w_2) + c_2 c_3 f(v_2,w_1) + c_2 c_4 f(v_2,w_2)\)。注意**交叉项**的出现——这就是"耦合"。

类比:线性映射像加法,双线性映射像乘法。\(a(x+y) = ax + ay\)(线性),但 \((a+b)(x+y) = ax + ay + bx + by\)(双线性展开出交叉项)。这个类比的边界在于:双线性映射的"乘法"不需要交换,也不需要结合,它只保证分别对每个因子线性。

§1.4 多线性映射空间

所有 \(k\)-线性映射 \(V_1 \times \cdots \times V_k \to W\) 构成一个向量空间,记为 \(\operatorname{Mult}(V_1,\ldots,V_k;W)\)。加法和数乘逐点定义:

\[ (f+g)(v_1,\ldots,v_k) = f(v_1,\ldots,v_k) + g(v_1,\ldots,v_k) \]
\[ (cf)(v_1,\ldots,v_k) = c \cdot f(v_1,\ldots,v_k) \]

维数:选定各 \(V_i\) 的基 \(\{e^{(i)}_{j_i}\}\),一个 \(k\)-线性映射由其在所有基元素组上的值 \(f(e^{(1)}_{j_1},\ldots,e^{(k)}_{j_k})\) 完全确定。因此

\[ \dim \operatorname{Mult}(V_1,\ldots,V_k;W) = (\dim V_1) \cdots (\dim V_k) \cdot \dim W \]

特别地,\(\dim \operatorname{Mult}(V_1,\ldots,V_k;F) = \prod_{i=1}^k \dim V_i\)

§1.5 经典例子

例 1:点积(对称双线性型)。 标准内积 \(\langle u,v \rangle = \sum_{i=1}^n u_i v_i\)\(\mathbb{R}^n \times \mathbb{R}^n \to \mathbb{R}\) 的双线性映射,且满足对称性 \(\langle u,v \rangle = \langle v,u \rangle\)

例 2:叉积(反对称双线性映射)。 \(u \times v: \mathbb{R}^3 \times \mathbb{R}^3 \to \mathbb{R}^3\) 满足 \(u \times v = -(v \times u)\),因此是反对称的。它对每个变量线性,但结果不是标量而是向量。

例 3:行列式(\(n\)-重反对称多线性型)。 \(\det: \underbrace{F^n \times \cdots \times F^n}_{n} \to F\)\(n\)-线性且完全反对称的——交换任意两个输入,结果变号。

例 4:Curry 化同构。 存在自然同构

\[ \operatorname{Mult}(V,W;U) \cong \operatorname{Hom}(V, \operatorname{Hom}(W,U)) \]

将双线性映射 \(f: V \times W \to U\) 与"返回线性映射的线性映射" \(\hat{f}: V \to \operatorname{Hom}(W,U)\) 对应,其中 \(\hat{f}(v)(w) = f(v,w)\)。这是函数式编程中 Curry 化的数学原型,也是 §3 张量积泛性质的预演。

§1.6 机器人学中的多线性对象

机器人学中到处隐藏着多线性映射:

对象 类型 多线性性质
内积 \(\langle u,v \rangle\) 双线性 \(V \times V \to \mathbb{R}\) 对称
叉积 \(u \times v\) 双线性 \(\mathbb{R}^3 \times \mathbb{R}^3 \to \mathbb{R}^3\) 反对称
行列式 \(\det(v_1,\ldots,v_n)\) \(n\)-线性 \((F^n)^n \to F\) 完全反对称
质量矩阵 \(\dot{q}^\top M(q)\dot{q}\) 双线性型 \(T_qQ \times T_qQ \to \mathbb{R}\) 对称正定
Yoshikawa 可操作度 \(\sqrt{\det(JJ^\top)}\) 通过 \(\Lambda^n\) 的合成 \(n\)-线性行列式诱导

应用视角:Jacobian \(J\) 本身是线性映射 \(J: T_qQ \to T_xM\),但"可操作性椭球体积" \(\sqrt{\det(JJ^\top)}\)\(J\) 的列通过 \(n\)-线性的 \(\Lambda^n\) 压成标量——这是 Yoshikawa 可操作度的多线性本质。

⚠️ 常见陷阱

💡 概念误区 1:混淆"多线性"与"线性" 新手想法:双线性映射 \(f: V \times W \to U\) 就是 \(V \oplus W \to U\) 的线性映射。 实际上:两者维数就不同。\(\dim \operatorname{Hom}(V \oplus W, U) = (\dim V + \dim W)\dim U\),而 \(\dim \operatorname{Mult}(V,W;U) = (\dim V)(\dim W)\dim U\)。维数的"加法"变成了"乘法"——这正是张量积的代数本质。 正确理解:多线性是比线性更强的条件。直和上的线性是"分量独立",乘积上的多线性是"分量耦合"。

🧠 思维陷阱 1:以为多线性映射可以像线性映射一样"提取公因子" 新手想法\(f(u+v, w) = f(u,w) + f(v,w)\),所以 \(f(cu, cv) = c^2 f(u,v)\)实际上:确实如此!\(f(cu,cv) = c f(u,cv) = c \cdot c f(u,v) = c^2 f(u,v)\)。这不是错误,但要注意 \(f(cu+dv, w) = cf(u,w) + df(v,w)\),而**不是** \((c+d)f(u+v,w)/2\) 之类的错误简化。多线性映射的齐次性是**逐变量**的。

§1.7 多线性映射与线性映射的维数对比

为了加深理解,我们把两种空间的维数放在一起比较:

空间 维数 公式性质
\(\operatorname{Hom}(V \oplus W, U)\) \((\dim V + \dim W) \cdot \dim U\) 加法
\(\operatorname{Mult}(V, W; U)\) \((\dim V) \cdot (\dim W) \cdot \dim U\) 乘法

维数从"加法"变成"乘法"——这是多线性映射的核心数学特征。张量积(§3)的维数公式 \(\dim(V \otimes W) = \dim V \cdot \dim W\) 正是这个"乘法"的体现。

考虑一个具体的数值例子。设 \(V = \mathbb{R}^3\), \(W = \mathbb{R}^2\), \(U = \mathbb{R}\)。则:

  • 线性映射 \(V \oplus W \to U\) 的空间维数 \(= (3+2) \cdot 1 = 5\)
  • 双线性映射 \(V \times W \to U\) 的空间维数 \(= 3 \cdot 2 \cdot 1 = 6\)

5 vs 6——维数不同,两者当然不可能等同!双线性映射空间"更大"是因为它包含了两个输入之间的耦合信息。

如果不引入多线性映射会怎样? 我们只能在 \(V \oplus W\) 上做线性运算,那么两个输入的耦合信息(如 \(v_1 w_2 - v_2 w_1\) 这种"交叉项")将无法被表达。行列式、叉积、动能——所有这些涉及变量耦合的量都将失去统一的代数框架。

练习

  1. (推导题) 证明:如果 \(f: V \times W \to U\) 是双线性映射,且 \(f(v,w)=0\) 对所有 \(w \in W\) 成立,则 \(v=0\)\(f\) 不是非退化的。给出"非退化双线性映射"的精确定义。
  2. (开放思考题) 三线性映射 \(f: V \times V \times V \to F\) 的"对称"和"反对称"该如何定义?有多少种不同的对称类型?(提示:对称群 \(S_3\) 的不可约表示。)
  3. (推导题) 验证 Curry 化同构 \(\operatorname{Mult}(V,W;U) \cong \operatorname{Hom}(V, \operatorname{Hom}(W,U))\):写出两个方向的映射并验证它们互逆。(在草稿纸上完成。)

§2 双线性型与 Sylvester 惯性律 ⭐⭐

§2.1 动机:从内积到一般双线性型

30_内积空间与伴随算子.md 中我们定义了**正定对称双线性型**(即内积)。但物理和工程中大量出现不正定的双线性型:

  • Minkowski 度量 \(\eta = \operatorname{diag}(-1,+1,+1,+1)\) 是 Lorentz 空间的双线性型,签名 \((1,3)\),不正定。
  • 辛形式 \(\omega(u,v) = u^\top J v\)\(J = \begin{pmatrix} 0 & I \\ -I & 0 \end{pmatrix}\))是反对称非退化双线性型,在 Hamilton 力学中无处不在。
  • 二次型 \(Q(v) = v^\top A v\) 出现在优化的二阶条件(Hessian)、Lyapunov 稳定性分析中。

如果只研究正定内积,我们会错过这些重要对象。本节把双线性型从正定的特例推广到一般情形。

§2.2 双线性型的定义与矩阵表示

定义:域 \(F\) 上向量空间 \(V\) 上的**双线性型**(bilinear form)是双线性映射 \(B: V \times V \to F\)

给定 \(V\) 的基 \(\{e_1,\ldots,e_n\}\)\(B\) 由矩阵 \(M = (m_{ij})\) 表示:

\[ B(u,v) = u^\top M v, \quad m_{ij} = B(e_i, e_j) \]

基变换:若新基 \(\{\tilde{e}_j\}\) 满足 \(\tilde{e}_j = \sum_i P_{ij} e_i\)(即基变换矩阵为 \(P\)),则

\[ \tilde{M} = P^\top M P \]

这称为**合同变换**(congruence)。注意与相似变换 \(P^{-1}MP\) 的区别:

变换类型 公式 保持不变的 何时出现
相似 \(P^{-1}MP\) 特征值、迹、行列式 线性映射 \(T\) 在不同基下的矩阵
合同 \(P^\top MP\) 签名(正/负/零特征值个数) 双线性型 \(B\) 在不同基下的矩阵

本质洞察:相似变换和合同变换的区别反映了线性映射与双线性型的根本差异。线性映射 \(T: V \to V\) 吃一个向量吐一个向量,基变换时输入和输出各变换一次(\(P^{-1}\)\(P\))。双线性型 \(B: V \times V \to F\) 吃两个向量吐一个标量,基变换时两个输入各变换一次(\(P^\top\)\(P\))。

§2.3 对称型、反对称型、非退化性

对称双线性型\(B(u,v) = B(v,u)\),等价于矩阵 \(M\) 对称(\(M = M^\top\))。

反对称双线性型(又称斜对称):\(B(u,v) = -B(v,u)\),等价于矩阵 \(M\) 反对称(\(M = -M^\top\))。在 \(\operatorname{char}(F) \neq 2\) 时,\(B(v,v) = -B(v,v) = 0\)

非退化\(B\) 称为非退化的,若 \(B(v,w)=0\) 对所有 \(w\) 成立蕴含 \(v=0\)。等价地,诱导的线性映射

\[ \hat{B}: V \to V^*, \quad \hat{B}(v)(w) = B(v,w) \]

是同构。再等价地,矩阵 \(M\) 可逆(\(\det M \neq 0\))。

回顾 30_内积空间:Riesz 表示定理说的正是"内积诱导的 \(\hat{B}: V \to V^*\) 是(共轭线性)同构"。因此**内积 = 正定对称非退化双线性型**——它是双线性型中非常特殊的一类。

§2.4 对称型的对角化

定理:设 \(F\) 的特征 \(\operatorname{char}(F) \neq 2\)\(B\)\(V\) 上对称双线性型。则存在 \(V\) 的基 \(\{f_1,\ldots,f_n\}\),使得

\[ B(f_i, f_j) = 0 \quad (i \neq j) \]

\(B\) 在此基下的矩阵为对角阵 \(\operatorname{diag}(d_1,\ldots,d_n)\)

证明思路:如果存在 \(v\) 使 \(B(v,v) \neq 0\),取 \(f_1 = v\),对 \(\{f_1\}^\perp\)(相对于 \(B\))做归纳。如果所有 \(B(v,v)=0\),则由极化恒等式 \(B(u+v,u+v) - B(u,u) - B(v,v) = 2B(u,v)\)\(B=0\)(需要 \(\operatorname{char} \neq 2\))。

\(\mathbb{R}\) 上,每个非零对角元素可以通过缩放变为 \(\pm 1\)(取 \(f_i' = f_i/\sqrt{|d_i|}\)),得到标准形 \(\operatorname{diag}(\underbrace{+1,\ldots,+1}_{p},\underbrace{-1,\ldots,-1}_{q},\underbrace{0,\ldots,0}_{z})\)

§2.5 Sylvester 惯性律

定理(Sylvester 惯性律,Sylvester's Law of Inertia, 1852):实对称双线性型的签名 \((p,q,z)\)(正、负、零对角元素的个数)是基变换不变量。

证明:设两组对角化分别给出 \(p\) 个正元素和 \(p'\) 个正元素,不妨设 \(p > p'\)。令 \(V_+\) 为第一组对角化中 \(B\) 正定的 \(p\) 维子空间,\(V'_{\le 0}\) 为第二组中 \(B \le 0\)\((q'+z')\) 维子空间。则

\[ \dim V_+ + \dim V'_{\le 0} = p + (q'+z') = p + (n-p') > n \]

因此 \(V_+ \cap V'_{\le 0} \neq \{0\}\)。取非零 \(v \in V_+ \cap V'_{\le 0}\),则 \(B(v,v) > 0\)(因为 \(v \in V_+\))且 \(B(v,v) \le 0\)(因为 \(v \in V'_{\le 0}\)),矛盾。

阶段小结:签名 \((p,q,z)\) 是合同变换下的完整不变量——两个实对称双线性型合同当且仅当它们签名相同。秩 \(= p+q\),零度 \(= z\)

§2.6 二次型与极化恒等式

给定对称双线性型 \(B\),对应的**二次型**为 \(Q(v) = B(v,v)\)。反过来,\(B\) 可以从 \(Q\) 通过**极化恒等式**恢复:

\[ B(u,v) = \frac{1}{2}[Q(u+v) - Q(u) - Q(v)] \]

因此在 \(\operatorname{char}(F) \neq 2\) 时,对称双线性型与二次型是等价的。

正定性判则(Sylvester 判据):对称矩阵 \(M\) 正定 \(\iff\) 所有顺序主子式(leading principal minors)\(> 0\)

\[ m_{11} > 0, \quad \begin{vmatrix} m_{11} & m_{12} \\ m_{21} & m_{22} \end{vmatrix} > 0, \quad \ldots, \quad \det(M) > 0 \]

§2.7 机器人学中的双线性型

质量矩阵是正定对称双线性型。 机器人的动能

\[ T = \frac{1}{2}\dot{q}^\top M(q)\dot{q} \]

其中 \(M(q)\) 是正定对称矩阵。从抽象角度看,\(M(q)\) 在每个配置 \(q\) 处定义了切空间 \(T_qQ\) 上的正定对称双线性型——这正是 Riemann 度量。签名 \((n,0,0)\) 对应物理合理性(动能非负,只在静止时为零)。

Minkowski 度量的签名。 在狭义相对论中,时空度量 \(\eta = \operatorname{diag}(-1,+1,+1,+1)\) 的签名是 \((3,1,0)\)(或 \((1,3,0)\),取决于约定)。光锥上 \(\eta(v,v)=0\) 的向量对应光速运动。

⚠️ 常见陷阱

💡 概念误区 2:混淆"合同"与"相似" 新手想法\(P^\top M P\)\(P^{-1}MP\) 差不多,反正基变换嘛。 实际上:相似保特征值,合同保签名——这是两个完全不同的不变量。例如 \(\operatorname{diag}(1,4)\) 相似于 \(\operatorname{diag}(1,4)\)(特征值 \(1,4\)),但合同于 \(\operatorname{diag}(1,1)\)(签名 \((2,0)\))。 根本原因:相似变换对应"同一个线性映射换基",合同变换对应"同一个双线性型换基"。两者的几何意义完全不同。

🧠 思维陷阱 2:以为所有对称双线性型都可以"找到正交基" 新手想法:谱定理说对称矩阵可以正交对角化,所以对称双线性型也行。 实际上:谱定理需要**内积**(正交性依赖内积定义),对称双线性型的对角化**不需要正交性**——只需要找到一组基使矩阵对角。当 \(B\) 本身不正定时,"相对于 \(B\) 的正交"可能不是通常意义的正交。

§2.8 反对称双线性型与辛形式

前面讨论了对称双线性型。现在简要提及另一大类——反对称型。

辛形式(symplectic form):设 \(V\) 为偶数维(\(\dim V = 2n\)),\(\omega: V \times V \to F\) 是非退化的反对称双线性型。则存在基 \(\{e_1,\ldots,e_n,f_1,\ldots,f_n\}\) 使得

\[ \omega(e_i, f_j) = \delta_{ij}, \quad \omega(e_i, e_j) = 0, \quad \omega(f_i, f_j) = 0 \]

矩阵形式为 \(J = \begin{pmatrix} 0 & I_n \\ -I_n & 0 \end{pmatrix}\)。这在 Hamilton 力学中至关重要——相空间 \(T^*Q\) 天然带有辛结构,Hamilton 方程 \(\dot{z} = J \nabla H(z)\) 中的 \(J\) 正是辛矩阵。

双线性型类型 对称性 标准形 物理应用
正定对称 \(B(u,v)=B(v,u)\), \(B(v,v)>0\) \(I_n\) 动能、Riemann 度量
不定对称 \(B(u,v)=B(v,u)\) \(\operatorname{diag}(\pm 1)\) Minkowski 度量
非退化反对称 \(B(u,v)=-B(v,u)\) \(J\) 辛形式、Hamilton 力学

这三种类型覆盖了物理和工程中几乎所有重要的双线性型。对称型用 Sylvester 惯性律分类(签名),反对称型用辛标准形分类(维数)。

练习

  1. (推导题)\(B\)\(\mathbb{R}^3\) 上矩阵为 \(M = \begin{pmatrix} 1 & 2 & 0 \\ 2 & 1 & 0 \\ 0 & 0 & -3 \end{pmatrix}\) 的对称双线性型。求 \(B\) 的签名 \((p,q,z)\)。在草稿纸上完成对角化。
  2. (证明题) 证明:反对称双线性型 \(B(u,v)=-B(v,u)\) 的矩阵在 \(\operatorname{char}(F) \neq 2\) 时秩必为偶数。(提示:反对称矩阵的特征值成对出现。)
  3. (开放思考题) 为什么辛形式要求 \(\dim V\) 为偶数?如果 \(\dim V\) 是奇数,非退化反对称双线性型存在吗?

第二部分:张量积

§3 张量积 \(V \otimes W\):泛性质与构造 ⭐⭐

§3.1 动机:让多线性"变成"线性

§1 告诉我们多线性映射是重要的。但线性代数的全部工具——基、维数、秩-零度定理、特征值——都是为**线性映射**准备的。如果能把多线性映射"翻译"成线性映射,我们就能复用整套线性代数工具。

张量积 \(V \otimes W\) 正是实现这个翻译的"万能适配器"。核心思想是:

\[ \text{双线性映射 } V \times W \to U \quad \longleftrightarrow \quad \text{线性映射 } V \otimes W \to U \]

左边的对象(双线性)是"困难"的,右边的对象(线性)有全套工具可用。张量积 \(V \otimes W\) 是一个新的向量空间,它"吸收"了双线性性,使得后续只需处理线性映射。

类比:这就像对数把"乘法"变成"加法"——\(\log(ab) = \log a + \log b\)。张量积把"双线性"变成"线性"。像的部分:两者都是"改变运算类型的转换器"。不像的部分:对数是实数上的标量函数,张量积是向量空间层面的构造;对数是可逆的,张量积的映射 \(\otimes: V \times W \to V \otimes W\) 不是同构(维数不同)。

§3.2 泛性质(Universal Mapping Property)

定义(张量积的泛性质):向量空间 \(V\)\(W\) 的**张量积**是一对 \((V \otimes W, \otimes)\),其中 \(V \otimes W\) 是向量空间,\(\otimes: V \times W \to V \otimes W\) 是双线性映射,满足以下**泛性质**:

对任意向量空间 \(U\) 和任意双线性映射 \(B: V \times W \to U\),存在**唯一**的线性映射 \(L: V \otimes W \to U\),使得 \(B = L \circ \otimes\)

用交换图表示:

\[ \begin{array}{ccc} V \times W & \xrightarrow{\otimes} & V \otimes W \\ & \searrow^{B} & \downarrow^{\exists ! L} \\ & & U \end{array} \]

这张图必须刻进脑海。 它说的是:每个双线性映射 \(B\) 都唯一地"经过" \(V \otimes W\) 分解为 \(\otimes\) 后接线性映射 \(L\)

本质洞察:泛性质不是在说"张量积是什么"(具体构造),而是在说"张量积做什么"(任何双线性映射都能唯一线性化)。这种"由功能定义对象"的思维方式贯穿现代数学——范畴论的核心精神。

§3.3 泛性质的唯一性

定理:满足泛性质的 \((V \otimes W, \otimes)\) 在同构意义下唯一。

证明:设 \((T, b)\)\((T', b')\) 都满足泛性质。对 \(b': V \times W \to T'\)(双线性),由 \((T,b)\) 的泛性质得唯一的线性 \(f: T \to T'\) 使 \(b' = f \circ b\)。对 \(b: V \times W \to T\),由 \((T',b')\) 的泛性质得唯一的线性 \(g: T' \to T\) 使 \(b = g \circ b'\)

\(g \circ f: T \to T\) 满足 \(b = (g \circ f) \circ b\)。但 \(\operatorname{id}_T\) 也满足 \(b = \operatorname{id}_T \circ b\)。由 \((T,b)\) 泛性质的**唯一性**,\(g \circ f = \operatorname{id}_T\)。同理 \(f \circ g = \operatorname{id}_{T'}\)。因此 \(f\) 是同构。

阶段小结:泛性质既保证存在性(下面构造),又保证唯一性(刚才证明)。这是数学中"用性质定义对象"的范式——先说清楚你要的功能(泛性质),再构造一个满足它的对象,唯一性自动跟来。

§3.4 具体构造

存在性证明:我们需要构造一个具体的 \((V \otimes W, \otimes)\)

Step 1:自由向量空间。 对集合 \(V \times W\) 取**自由向量空间** \(F(V \times W)\):以 \(V \times W\) 的每个元素 \((v,w)\) 为一个独立基向量 \(\delta_{(v,w)}\),生成的向量空间。\(F(V \times W)\) 是巨大的——每对 \((v,w)\) 都是独立的,还没有任何线性或双线性关系。

Step 2:商掉双线性关系。 定义子空间 \(D \subseteq F(V \times W)\) 为以下四类元素生成的子空间:

\[ \delta_{(v+v',w)} - \delta_{(v,w)} - \delta_{(v',w)} \quad \text{(左分配律)} \]
\[ \delta_{(v,w+w')} - \delta_{(v,w)} - \delta_{(v,w')} \quad \text{(右分配律)} \]
\[ \delta_{(cv,w)} - c\,\delta_{(v,w)} \quad \text{(左齐次性)} \]
\[ \delta_{(v,cw)} - c\,\delta_{(v,w)} \quad \text{(右齐次性)} \]

Step 3:定义张量积。\(V \otimes W := F(V \times W) / D\),映射 \(\otimes(v,w) := \delta_{(v,w)} + D\)(商类),简记为 \(v \otimes w\)

验证泛性质:给定双线性 \(B: V \times W \to U\),定义 \(\tilde{L}: F(V \times W) \to U\)\(\tilde{L}(\delta_{(v,w)}) = B(v,w)\) 的线性延拓。由于 \(B\) 是双线性的,\(\tilde{L}\)\(D\) 上为零(例如 \(\tilde{L}(\delta_{(v+v',w)} - \delta_{(v,w)} - \delta_{(v',w)}) = B(v+v',w) - B(v,w) - B(v',w) = 0\))。因此 \(\tilde{L}\) 因子分解为 \(L: V \otimes W \to U\)。唯一性:\(L\) 在生成元 \(v \otimes w\) 上的值被 \(B\) 完全确定,所以 \(L\) 唯一。

§3.5 维数定理

定理\(\dim(V \otimes W) = \dim V \cdot \dim W\)。若 \(\{e_1,\ldots,e_m\}\)\(V\) 的基,\(\{f_1,\ldots,f_n\}\)\(W\) 的基,则 \(\{e_i \otimes f_j : 1 \le i \le m,\ 1 \le j \le n\}\)\(V \otimes W\) 的基。

证明

张成性:任意 \(v \otimes w = (\sum_i a_i e_i) \otimes (\sum_j b_j f_j) = \sum_{i,j} a_i b_j (e_i \otimes f_j)\)(利用双线性性)。由于简单张量张成 \(V \otimes W\)(由构造),而简单张量可以用 \(\{e_i \otimes f_j\}\) 线性表示,所以 \(\{e_i \otimes f_j\}\) 张成 \(V \otimes W\)

线性无关(这是深刻的一步):对每对 \((k,\ell)\),构造双线性映射 \(B_{k\ell}: V \times W \to F\),定义为

\[ B_{k\ell}(v,w) = e^k(v) \cdot f^\ell(w) \]

其中 \(e^k, f^\ell\) 是对偶基。由泛性质得唯一线性 \(L_{k\ell}: V \otimes W \to F\) 满足

\[ L_{k\ell}(e_i \otimes f_j) = B_{k\ell}(e_i, f_j) = e^k(e_i) \cdot f^\ell(f_j) = \delta_{ik}\delta_{j\ell} \]

现在设 \(\sum_{i,j} c_{ij}(e_i \otimes f_j) = 0\)。对此等式施加 \(L_{k\ell}\)

\[ c_{k\ell} = L_{k\ell}\Big(\sum_{i,j} c_{ij}(e_i \otimes f_j)\Big) = L_{k\ell}(0) = 0 \]

\((k,\ell)\) 的任意性,所有 \(c_{ij} = 0\)。这证明了线性无关。

Keith Conrad 格言:"不知怎么办时,造一个巧妙的双线性映射,然后用泛性质把它变成线性映射。" 这个技巧在张量积理论中反复出现——泛性质不仅是定义,更是强大的证明工具。

§3.6 简单张量与一般张量

形如 \(v \otimes w\) 的元素称为**简单张量**(simple tensor)或**可分解张量**(decomposable tensor)。一般的张量是简单张量的**有限线性组合** \(\sum_i v_i \otimes w_i\)

关键事实:并非所有张量都是简单张量。\(\mathbb{R}^2 \otimes \mathbb{R}^2\) 中考虑

\[ \tau = e_1 \otimes e_1 + e_2 \otimes e_2 \]

如果 \(\tau = v \otimes w\)(可分解),则在 \(V^* \otimes W \cong \operatorname{Hom}(V,W)\) 的同构下,\(\tau\) 对应秩 \(1\) 矩阵。但 \(\tau\) 对应的矩阵是 \(\begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}\)(单位阵),秩为 \(2\)。矛盾!

类比(有边界的):这与量子力学中的**纠缠态**完全对应。Bell 态 \(\frac{1}{\sqrt{2}}(|0\rangle \otimes |0\rangle + |1\rangle \otimes |1\rangle)\) 不可分解为 \(|\psi\rangle \otimes |\phi\rangle\) 的形式。像的部分:两者都是张量空间中不可分解的元素。不像的部分:量子力学中的张量积带有 Hilbert 空间结构(内积、归一化),而纯代数的张量积不需要。

§3.7 张量积的代数性质

在深入同构定理之前,整理张量积的基本运算性质:

交换律\(V \otimes W \cong W \otimes V\)(通过 \(v \otimes w \mapsto w \otimes v\)),但注意这是**同构**而非恒等——\(v \otimes w\)\(w \otimes v\) 是不同空间的元素。

分配律\(V \otimes (W_1 \oplus W_2) \cong (V \otimes W_1) \oplus (V \otimes W_2)\)。这与整数的分配律 \(a(b+c)=ab+ac\) 完全对应——张量积对直和的分配律是"维数乘法对维数加法"的分配。

标量张量积\(F \otimes V \cong V\)(通过 \(c \otimes v \mapsto cv\))。标量域 \(F\) 是张量积的"乘法单位元"。

零空间\(\{0\} \otimes V = \{0\}\)——与零做张量积得零。

这些性质让张量积在向量空间的范畴中扮演了"乘法"的角色,而直和 \(\oplus\) 扮演"加法"。维数公式 \(\dim(V \otimes W) = \dim V \cdot \dim W\)\(\dim(V \oplus W) = \dim V + \dim W\) 完美对应。

§3.8 同构 \(V^* \otimes W \cong \operatorname{Hom}(V,W)\)

定理:在有限维情形下,\(V^* \otimes W \cong \operatorname{Hom}(V,W)\)

证明:定义双线性映射 \(\Phi: V^* \times W \to \operatorname{Hom}(V,W)\)\(\Phi(\varphi, w)(v) = \varphi(v) \cdot w\)。由泛性质得线性映射 \(\tilde{\Phi}: V^* \otimes W \to \operatorname{Hom}(V,W)\)

在基 \(\{e^i \otimes f_j\}\) 上,\(\tilde{\Phi}(e^i \otimes f_j)\) 是"把 \(e_i\) 分量取出来乘以 \(f_j\)"的映射,即矩阵中第 \((j,i)\) 位为 \(1\)、其余为 \(0\) 的线性映射。这组映射构成 \(\operatorname{Hom}(V,W)\) 的基,因此 \(\tilde{\Phi}\) 是同构。

简单张量 \(\leftrightarrow\)\(1\) 映射\(\varphi \otimes w\) 对应 \(v \mapsto \varphi(v) w\),这是像为一维的线性映射(秩 \(1\))。一般张量对应一般秩的映射。

⚠️ 常见陷阱

💡 概念误区 3:以为 \(v \otimes w\)\(\otimes\) 只是"形式符号" 新手想法\(v \otimes w\) 就是把 \(v\)\(w\) 并排写,没有实质内容。 实际上\(\otimes\) 蕴含了商空间的全部关系——\((v+v') \otimes w = v \otimes w + v' \otimes w\)\(c(v \otimes w) = (cv) \otimes w = v \otimes (cw)\) 等。没有这些关系,\(V \times W\) 的自由向量空间是无穷维的(每对 \((v,w)\) 独立);正是商掉关系 \(D\) 才使维数变为 \(\dim V \cdot \dim W\)

💡 概念误区 4:以为所有张量都可分解 新手想法\(V \otimes W\) 中的元素都可以写成 \(v \otimes w\)实际上:如 §3.6 所示,\(e_1 \otimes e_1 + e_2 \otimes e_2\) 不可分解。可分解张量在 \(V \otimes W\) 中张成但不构成基。在 \(V^* \otimes W \cong \operatorname{Hom}(V,W)\) 的视角下,可分解张量恰好是秩 \(\le 1\) 的映射——它们只占全部映射的一个"薄"子集。

🧠 思维陷阱 3:以为张量积是笛卡尔积 新手想法\(V \otimes W\)\(V \times W\) 差不多。 实际上\(\dim(V \times W) = \dim V + \dim W\)\(\dim(V \otimes W) = \dim V \cdot \dim W\)。加法 vs 乘法——完全不同!\(V \times W\) 的元素是"有序对" \((v,w)\)\(V \otimes W\) 的元素是"线性组合" \(\sum c_{ij} e_i \otimes f_j\)

练习

  1. (推导题) 证明 \(F \otimes V \cong V\)(标量域张量上去不增加信息)。提示:考虑双线性映射 \((c,v) \mapsto cv\),用泛性质。
  2. (证明题)\(\mathbb{R}^2 \otimes \mathbb{R}^2\) 中,判断 \(\tau = e_1 \otimes e_2 + e_2 \otimes e_1\) 是否可分解。如果不可分解,证明之;如果可分解,找到 \(v,w\) 使 \(\tau = v \otimes w\)

§4 线性映射的张量积与 Kronecker 积 ⭐⭐

§4.1 映射的张量积

给定线性映射 \(T: V \to V'\)\(S: W \to W'\),定义 \(T \otimes S: V \otimes W \to V' \otimes W'\)

首先 \((v,w) \mapsto T(v) \otimes S(w)\) 是双线性映射 \(V \times W \to V' \otimes W'\)。由泛性质,唯一存在线性映射 \(T \otimes S: V \otimes W \to V' \otimes W'\) 满足

\[ (T \otimes S)(v \otimes w) = T(v) \otimes S(w) \]

函子性\((T' \otimes S') \circ (T \otimes S) = (T'T) \otimes (S'S)\)\(\operatorname{id}_V \otimes \operatorname{id}_W = \operatorname{id}_{V \otimes W}\)。这在范畴论语言中说的是 \(\otimes\) 是一个**双函子**。

§4.2 矩阵表示:Kronecker 积

在基 \(\{e_i \otimes f_j\}\) 下,\(T \otimes S\) 的矩阵是**Kronecker 积** \([T] \otimes_{\mathrm{Kr}} [S]\)。如果 \([T]\)\(m \times m\) 矩阵,\([S]\)\(n \times n\) 矩阵,则 Kronecker 积是 \(mn \times mn\) 的分块矩阵:

\[ [T] \otimes_{\mathrm{Kr}} [S] = \begin{pmatrix} t_{11}[S] & t_{12}[S] & \cdots & t_{1m}[S] \\ t_{21}[S] & t_{22}[S] & \cdots & t_{2m}[S] \\ \vdots & \vdots & \ddots & \vdots \\ t_{m1}[S] & t_{m2}[S] & \cdots & t_{mm}[S] \end{pmatrix} \]

Kronecker 积的性质

性质 公式 备注
\(\operatorname{tr}(T \otimes S) = \operatorname{tr}(T) \cdot \operatorname{tr}(S)\) 迹是"乘法性的"
行列式 \(\det(T \otimes S) = \det(T)^n \cdot \det(S)^m\) \(m = \dim V\), \(n = \dim W\)
\(\operatorname{rank}(T \otimes S) = \operatorname{rank}(T) \cdot \operatorname{rank}(S)\) 秩也是"乘法性的"
特征值 \(\lambda_i(T) \cdot \mu_j(S)\)\(T \otimes S\) 的特征值 所有两两乘积

工程中常见的 Kronecker 积于此获得内蕴解释:它不是一个"随意定义"的矩阵运算,而是张量积在基下的坐标表示。

⚠️ 常见陷阱

💡 概念误区 5:Kronecker 积 \(=\) 张量积 新手想法:Kronecker 积就是张量积,两个词可以互换。 实际上:Kronecker 积是张量积在**选定基之后**的矩阵表示。张量积是内蕴的(不依赖基),Kronecker 积依赖基的排序。换基后 Kronecker 积矩阵会变,但它们表示的是同一个张量积映射。

练习

  1. (计算题) 计算 \(A = \begin{pmatrix} 1 & 2 \\ 0 & 3 \end{pmatrix}\)\(B = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\) 的 Kronecker 积 \(A \otimes_{\mathrm{Kr}} B\)。验证 \(\det(A \otimes_{\mathrm{Kr}} B) = \det(A)^2 \cdot \det(B)^2\)

§5 迭代张量积与张量空间 ⭐⭐

§5.1 结合律

定理\((U \otimes V) \otimes W \cong U \otimes (V \otimes W) \cong U \otimes V \otimes W\)(自然同构)。

这个同构**不是恒等映射**,但总是自然的(即不依赖基的选择)。在实践中,我们可以"略去括号",直接写 \(U \otimes V \otimes W\)

§5.2 张量幂

定义\(V^{\otimes k} = \underbrace{V \otimes \cdots \otimes V}_{k}\)\(\dim V^{\otimes k} = (\dim V)^k\)

\(k\)-重张量等同于 \(k\)-线性映射的线性化。具体地,\(V^{\otimes k}\) 的对偶 \((V^{\otimes k})^* \cong (V^*)^{\otimes k}\) 恰好是所有 \(k\)-线性型 \(V^k \to F\) 构成的空间。

§5.3 对称群作用

翻转同构\(\tau: V \otimes W \to W \otimes V\)\(v \otimes w \mapsto w \otimes v\),是自然同构(非恒等)。

\(V^{\otimes k}\) 上,对称群 \(S_k\) 通过置换因子位置给出右作用:

\[ \sigma \cdot (v_1 \otimes \cdots \otimes v_k) = v_{\sigma^{-1}(1)} \otimes \cdots \otimes v_{\sigma^{-1}(k)} \]

这个群作用是 §6 对称/反对称分解的基础。

§5.4 \((p,q)\)-型张量空间

定义

\[ T^p_q(V) := \underbrace{V \otimes \cdots \otimes V}_{p} \otimes \underbrace{V^* \otimes \cdots \otimes V^*}_{q} \]

\(p\) 称为**逆变秩**(contravariant rank),\(q\) 称为**协变秩**(covariant rank)。

\((p,q)\) 对象 机器人学中的例子
\((1,0)\) 向量 \(v \in V\) 速度 \(\dot{q}\)
\((0,1)\) 余向量 \(\varphi \in V^*\) 力/力矩 \(\tau\)
\((1,1)\) 线性映射 \(T \in \operatorname{Hom}(V,V)\) Jacobian \(J\)
\((0,2)\) 双线性型 \(B: V \times V \to F\) 质量矩阵 \(M(q)\), 度量 \(g\)
\((2,0)\) \(V \otimes V\) 中的元素 逆度量 \(g^{-1}\)

本质洞察:机器人学和物理学中所有的"张量"都是 \(T^p_q(V)\) 的元素——这不是一个比喻,而是精确的数学陈述。当物理学家说"惯性张量是二阶张量"时,他们的意思是 \(I \in T^0_2(V)\)(或 \(T^2_0(V)\),取决于升降指标约定)。

⚠️ 常见陷阱

🧠 思维陷阱 4:混淆"逆变"与"协变" 新手想法:"上指标"和"下指标"只是书写习惯。 实际上:逆变分量(上指标)在基变换时与基**反向**变换(\(\tilde{v}^i = (P^{-1})^i_{\ j} v^j\)),协变分量(下指标)与基**同向**变换(\(\tilde{\alpha}_i = P^j_{\ i} \alpha_j\))。混淆二者会导致坐标变换出错。§18 将详细展开。

练习

  1. (推导题) 证明 \((V \otimes W)^* \cong V^* \otimes W^*\)(有限维情形)。提示:两边维数相同,构造自然映射并验证它是同构。
  2. (开放思考题) 如果 \(V\) 是无穷维的,\((V \otimes W)^* \cong V^* \otimes W^*\) 还成立吗?哪一步会失败?

第三部分:对称与反对称张量

§6 对称与反对称张量 ⭐⭐

§6.1 对称化与反对称化算子

\(V^{\otimes k}\) 上的对称群 \(S_k\) 作用允许我们定义两个投影算子:

对称化算子

\[ \operatorname{Sym} = \frac{1}{k!}\sum_{\sigma \in S_k} \sigma \]

反对称化(交替)算子

\[ \operatorname{Alt} = \frac{1}{k!}\sum_{\sigma \in S_k} \operatorname{sgn}(\sigma) \cdot \sigma \]

\(\operatorname{char}(F) = 0\)(或 \(\operatorname{char}(F) \nmid k!\))时,\(\operatorname{Sym}\)\(\operatorname{Alt}\) 都是**幂等的**(\(\operatorname{Sym}^2 = \operatorname{Sym}\)),即它们是投影算子。

\(k=2\) 的例子:对 \(v \otimes w \in V^{\otimes 2}\)

\[ \operatorname{Sym}(v \otimes w) = \frac{1}{2}(v \otimes w + w \otimes v) \]
\[ \operatorname{Alt}(v \otimes w) = \frac{1}{2}(v \otimes w - w \otimes v) \]

任意 \(\tau \in V^{\otimes 2}\) 都可以分解为 \(\tau = \operatorname{Sym}(\tau) + \operatorname{Alt}(\tau)\)——这是 \(k=2\) 时的**对称-反对称分解**。

§6.2 对称张量空间与反对称张量空间

\[ \operatorname{Sym}^k(V) := \operatorname{Im}(\operatorname{Sym}) \subseteq V^{\otimes k} \]
\[ \Lambda^k(V) := \operatorname{Im}(\operatorname{Alt}) \subseteq V^{\otimes k} \]

维数公式

\[ \dim \operatorname{Sym}^k(V) = \binom{n+k-1}{k} \quad \text{(组合重复)} \]
\[ \dim \Lambda^k(V) = \binom{n}{k} \quad \text{(组合无重复)} \]

其中 \(n = \dim V\)

\(k\) \(\dim \operatorname{Sym}^k(\mathbb{R}^3)\) \(\dim \Lambda^k(\mathbb{R}^3)\)
0 1 1
1 3 3
2 6 3
3 10 1
4 15 0

注意 \(\Lambda^k(V) = 0\)\(k > n\)——这与 \(\operatorname{Sym}^k(V)\) 永远非零形成对比。直觉上,反对称性强制不同因子"占据不同位置"(类似 Pauli 不相容原理),所以 \(k\) 不能超过空间维数 \(n\)

§6.3 物理意义

对称张量:应力张量 \(\sigma_{ij} = \sigma_{ji}\)(角动量守恒)、惯性张量 \(I_{ij} = I_{ji}\)(定义对称)、质量矩阵 \(M_{ij}(q) = M_{ji}(q)\)(动能对称性)——它们都是 \(\operatorname{Sym}^2(V^*)\) 的元素。

反对称张量:电磁场张量 \(F_{\mu\nu} = -F_{\nu\mu}\)、微分 \(2\)-形式、涡量张量——它们是 \(\Lambda^2(V^*)\) 的元素。

⚠️ 常见陷阱

💡 概念误区 6:以为 \(V^{\otimes k}\) 总是分解为对称+反对称 新手想法\(V^{\otimes k} = \operatorname{Sym}^k(V) \oplus \Lambda^k(V)\)实际上\(k=2\) 时确实如此。但 \(k \ge 3\) 时有更多的 \(S_k\) 不可约分量(对应 Young 图)。例如 \(V^{\otimes 3}\) 分解为完全对称、完全反对称和两个"混合对称"部分。

练习

  1. (推导题)\(V = \mathbb{R}^2\),显式写出 \(V^{\otimes 2}\)\(\operatorname{Sym}^2(V) \oplus \Lambda^2(V)\) 的分解。在草稿纸上验证 \(\dim \operatorname{Sym}^2(\mathbb{R}^2) + \dim \Lambda^2(\mathbb{R}^2) = \dim V^{\otimes 2}\)

§7 张量代数 \(T(V)\) ⭐⭐⭐

§7.1 定义与泛性质

定义:张量代数

\[ T(V) = \bigoplus_{k=0}^{\infty} V^{\otimes k} = F \oplus V \oplus (V \otimes V) \oplus (V \otimes V \otimes V) \oplus \cdots \]

是以 \(\otimes\) 为乘法的**分次结合代数**(graded associative algebra)。\(T^0(V) = F\)(标量),\(T^1(V) = V\)(向量),乘法就是张量积。

泛性质:任意线性映射 \(\varphi: V \to A\)\(A\) 是结合代数)唯一延拓为代数同态 \(\tilde{\varphi}: T(V) \to A\)。换言之,\(T(V)\)\(V\) 生成的**自由结合代数**。

§7.2 通往外代数与对称代数的桥梁

\(T(V)\) 是"最自由"的代数——没有任何交换或反对称关系。通过商掉不同的关系,我们得到:

  • 商掉 \(\langle v \otimes v : v \in V \rangle\) \(\to\) 外代数 \(\Lambda(V)\)(§8)
  • 商掉 \(\langle v \otimes w - w \otimes v : v,w \in V \rangle\) \(\to\) 对称代数 \(S(V)\)(§21)
            T(V)(自由,无关系)
           ╱                    ╲
   商掉 v⊗v=0               商掉 v⊗w=w⊗v
          ╱                        ╲
     Λ(V)(反对称)            S(V)(对称)
   dim = 2ⁿ(有限)        dim = ∞(多项式环)

第四部分:外代数与楔积

§8 楔积的定义 ⭐⭐

§8.1 动机:为什么需要反对称乘积

行列式是**反对称**的——交换任意两行,结果变号。叉积也是**反对称**的——\(u \times v = -(v \times u)\)。这些对象有一个共同的代数结构,需要一个统一的框架来描述。

如果不引入外代数会怎样?我们只能在每个具体情境中单独处理反对称性——行列式用排列公式,叉积用分量计算——无法看到它们的深层统一。

§8.2 两种等价定义

路径 (a):交替多线性路径。 \(\Lambda^k(V) := \operatorname{Alt}^k(V) \subseteq V^{\otimes k}\)(§6 的反对称化像)。楔积定义为

\[ \alpha \wedge \beta = \frac{(p+q)!}{p!\, q!}\operatorname{Alt}(\alpha \otimes \beta) \]

其中 \(\alpha \in \Lambda^p(V)\)\(\beta \in \Lambda^q(V)\)。组合因子 \(\frac{(p+q)!}{p!\,q!}\) 保证结合律成立。

路径 (b):商路径。 \(\Lambda(V) := T(V) / I\),其中 \(I\) 是由 \(\{v \otimes v : v \in V\}\) 生成的双边理想。\(v\) 在商中的像仍记为 \(v\),乘法记为 \(\wedge\)

两条路径在 \(\operatorname{char}(F) = 0\) 时给出同构的结果。在 \(\operatorname{char}(F) = 2\) 时,只有商路径 (b) 正确(因为 \(\operatorname{Alt}\) 不再是投影)。

§8.3 基本性质

性质 1\(v \wedge v = 0\) 对所有 \(v \in V\)

证明(商路径):由理想 \(I\) 的定义直接得到。

性质 2\(v \wedge w = -w \wedge v\)

证明:由 \((v+w) \wedge (v+w) = 0\) 展开得

\[ v \wedge v + v \wedge w + w \wedge v + w \wedge w = 0 \]
\[ 0 + v \wedge w + w \wedge v + 0 = 0 \]
\[ v \wedge w = -w \wedge v \]

性质 3(分级反交换律):若 \(\alpha \in \Lambda^p(V)\)\(\beta \in \Lambda^q(V)\),则

\[ \alpha \wedge \beta = (-1)^{pq}\, \beta \wedge \alpha \]

特别地,当 \(p\)\(q\) 都是奇数时,\(\alpha \wedge \beta = -\beta \wedge \alpha\)(反交换)。当至少一个是偶数时,\(\alpha \wedge \beta = \beta \wedge \alpha\)(交换)。

§8.4 为什么两种定义等价

\(\operatorname{char}(F) = 0\) 下,路径 (a) 和路径 (b) 给出同构的代数。直觉上:

  • 路径 (a) 从 \(V^{\otimes k}\) 内部出发,用投影 \(\operatorname{Alt}\) "挑出"反对称部分。
  • 路径 (b) 从 \(T(V)\) 出发,用商映射"压碎"对称部分。

同构映射是:\(\operatorname{Alt}\) 的像 \(\hookrightarrow V^{\otimes k} \twoheadrightarrow T(V)/I\)\(k\)-次分量。在 \(\operatorname{char} = 0\)\(\operatorname{Alt}\) 是投影,其像在商映射下同构到对应分量。

为什么 \(\operatorname{char} = 2\) 时路径 (a) 失败? 因为 \(\operatorname{Alt} = \frac{1}{k!}\sum \operatorname{sgn}(\sigma)\sigma\),当 \(\operatorname{char}(F) | k!\) 时,分母 \(k!\) 不可逆,\(\operatorname{Alt}\) 不再是投影。例如 \(\operatorname{char} = 2\)\(\operatorname{Alt}(v \otimes w) = \frac{1}{2}(v \otimes w - w \otimes v)\),而 \(\frac{1}{2}\)\(\mathbb{F}_2\) 中不存在。路径 (b) 的商构造不依赖特征,总是有效的。

阶段小结:两种定义各有优势——路径 (a) 的几何直觉更好(反对称化投影),路径 (b) 的代数适用范围更广(任意特征)。在特征零的实数域/复数域(机器人学的工作域)中,两者完全等价。

§8.5 可分解楔积的几何意义

定理\(v_1 \wedge v_2 \wedge \cdots \wedge v_k \neq 0\) 当且仅当 \(\{v_1, \ldots, v_k\}\) 线性无关。

证明:如果 \(v_1,\ldots,v_k\) 线性相关,不妨设 \(v_k = \sum_{i=1}^{k-1} c_i v_i\)。则

\[ v_1 \wedge \cdots \wedge v_k = v_1 \wedge \cdots \wedge v_{k-1} \wedge \left(\sum_{i=1}^{k-1} c_i v_i\right) = \sum_{i=1}^{k-1} c_i (v_1 \wedge \cdots \wedge v_{k-1} \wedge v_i) = 0 \]

因为每一项中 \(v_i\) 出现两次,\(v_i \wedge v_i = 0\)

反方向(线性无关 \(\Rightarrow\) 楔积非零)需要基扩充和对偶基技术,在 §10.2 证明。

几何直觉\(|v_1 \wedge v_2 \wedge \cdots \wedge v_k|\)(需要内积定义模长)是这 \(k\) 个向量张成的**\(k\)-维平行多面体的体积**。楔积为零等价于这些向量共面——"体积塌陷"。

⚠️ 常见陷阱

💡 概念误区 7:以为 \(v \wedge w = 0\) 意味着 \(v=0\)\(w=0\) 新手想法:像乘法一样,积为零则因子之一为零。 实际上\(v \wedge w = 0\) 当且仅当 \(v\)\(w\) 线性相关(即共线)。例如 \((2e_1) \wedge (3e_1) = 6(e_1 \wedge e_1) = 0\),但两个因子都不为零。

🧠 思维陷阱 5:符号是 \((-1)^{pq}\) 不是 \((-1)^{p+q}\) 新手想法\(\alpha \wedge \beta = (-1)^{p+q} \beta \wedge \alpha\)实际上:正确的是 \((-1)^{pq}\)。当 \(p=q=2\) 时,\((-1)^{pq} = (-1)^4 = +1\)(交换),而 \((-1)^{p+q} = (-1)^4 = +1\)——两者碰巧一致。但 \(p=1, q=3\)\((-1)^{pq} = (-1)^3 = -1\)\((-1)^{p+q} = (-1)^4 = +1\)——差一个符号!

练习

  1. (推导题)\(\mathbb{R}^4\) 中,验证 \(e_1 \wedge e_2 \wedge e_3 \wedge e_4 \neq 0\)\(e_1 \wedge e_2 \wedge (e_1+e_2) \wedge e_4 = 0\)
  2. (证明题) 证明分级反交换律:对可分解元素 \(\alpha = v_1 \wedge \cdots \wedge v_p\)\(\beta = w_1 \wedge \cdots \wedge w_q\),有 \(\alpha \wedge \beta = (-1)^{pq}\beta \wedge \alpha\)。(在草稿纸上完成。)

§8.6 楔积的结合律

定理:楔积满足结合律 \((\alpha \wedge \beta) \wedge \gamma = \alpha \wedge (\beta \wedge \gamma)\)

在商路径 (b) 中这是直接的——\(\Lambda(V)\) 继承了 \(T(V)\) 的结合乘法。在路径 (a) 中需要验证组合因子的选择使得 \(\operatorname{Alt}((\operatorname{Alt}(\alpha \otimes \beta)) \otimes \gamma) = \operatorname{Alt}(\alpha \otimes (\operatorname{Alt}(\beta \otimes \gamma)))\),这需要一些组合计算。

结合律意味着我们可以不加括号地写 \(v_1 \wedge v_2 \wedge \cdots \wedge v_k\)——运算顺序不影响结果。这与实数乘法的结合律类似,但楔积不满足交换律(只满足**分级**交换律)。


§9 外代数 \(\Lambda(V)\) 作为分次代数 ⭐⭐

§9.1 结构

\[ \Lambda(V) = \bigoplus_{k=0}^{n} \Lambda^k(V) \]

是**有限维分次代数**。\(\Lambda^0(V) = F\)(标量),\(\Lambda^1(V) = V\)(向量),\(\Lambda^k(V) = 0\)\(k > n = \dim V\)

总维数:

\[ \dim \Lambda(V) = \sum_{k=0}^{n} \binom{n}{k} = 2^n \]

类比:如果把 \(\{e_1,\ldots,e_n\}\) 看作 \(n\) 个"独立选择"(取或不取),\(\Lambda(V)\) 的基恰好由 \(\{e_1,\ldots,e_n\}\) 的所有子集标记——\(2^n\) 个。这与集合的幂集一一对应。像的部分:两者都是"从 \(n\) 个元素中选子集"。不像的部分:外代数中子集有序(\(e_1 \wedge e_2 = -e_2 \wedge e_1\)),幂集中子集无序。

§9.2 \(\mathbb{Z}_2\)-分级与超交换

\(\Lambda(V)\) 不仅是 \(\mathbb{Z}\)-分次的(按 \(k\) 分),还可以更粗糙地按奇偶性分为 \(\mathbb{Z}_2\)-分次:

\[ \Lambda(V) = \Lambda^{\text{even}}(V) \oplus \Lambda^{\text{odd}}(V) \]

其中 \(\Lambda^{\text{even}} = \Lambda^0 \oplus \Lambda^2 \oplus \Lambda^4 \oplus \cdots\)\(\Lambda^{\text{odd}} = \Lambda^1 \oplus \Lambda^3 \oplus \Lambda^5 \oplus \cdots\)

偶次元素之间**交换**:\(\alpha \wedge \beta = \beta \wedge \alpha\)\(\alpha, \beta \in \Lambda^{\text{even}}\))。这使得 \(\Lambda^{\text{even}}(V)\) 是一个交换子代数。

奇次元素之间**反交换**:\(\alpha \wedge \beta = -\beta \wedge \alpha\)\(\alpha, \beta \in \Lambda^{\text{odd}}\))。

在物理中,这种 \(\mathbb{Z}_2\)-分次结构对应**费米子代数**——费米子场算符满足反对易关系 \(\{a, b\} = ab + ba = 0\),这正是外代数的分级反交换律。

§9.3 下游预告:微分形式

\(\Lambda(V)\) 是纯代数的。在微分几何中,把 \(V\) 替换为余切空间 \(T^*_pM\),并让 \(p\) 遍历流形 \(M\) 的每一点,就得到**微分形式代数** \(\Omega^*(M) = \Gamma(\Lambda(T^*M))\)。外微分 \(d: \Omega^k \to \Omega^{k+1}\) 满足 Leibniz 规则 \(d(\alpha \wedge \beta) = d\alpha \wedge \beta + (-1)^p \alpha \wedge d\beta\)——这里的 \((-1)^p\) 正是分级反交换律的体现。


§10 \(\Lambda^k(V)\) 的基与维数 ⭐⭐

§10.1 基的构造

定理:给定 \(V\) 的基 \(\{e_1,\ldots,e_n\}\),则

\[ \{e_{i_1} \wedge e_{i_2} \wedge \cdots \wedge e_{i_k} : 1 \le i_1 < i_2 < \cdots < i_k \le n\} \]

\(\Lambda^k(V)\) 的基,\(\dim \Lambda^k(V) = \binom{n}{k}\)

张成性:由楔积的反对称性,任意 \(v_1 \wedge \cdots \wedge v_k\) 都可以展开为上述形式的线性组合(将每个 \(v_i\) 用基展开,利用 \(e_i \wedge e_i = 0\) 和反交换律整理为递增指标序列)。

线性无关:用与 §3.5 类似的对偶基技术。对每个递增指标序列 \(I = (i_1 < \cdots < i_k)\),构造对偶的多线性泛函 \(\omega_I(e_{j_1} \wedge \cdots \wedge e_{j_k}) = \delta_{I,J}\)。这些泛函把假设的线性关系 \(\sum c_I e_I = 0\) 中的每个系数 \(c_I\) 分离出来,证明都为零。

§10.2 分级反交换律的完整证明

定理:对 \(\alpha = v_1 \wedge \cdots \wedge v_p \in \Lambda^p(V)\)\(\beta = w_1 \wedge \cdots \wedge w_q \in \Lambda^q(V)\)

\[ \alpha \wedge \beta = (-1)^{pq}\, \beta \wedge \alpha \]

证明

\[ \alpha \wedge \beta = v_1 \wedge \cdots \wedge v_p \wedge w_1 \wedge \cdots \wedge w_q \]

\(w_1\) 逐次越过 \(v_p, v_{p-1}, \ldots, v_1\)(利用 \(a \wedge b = -b \wedge a\)),共 \(p\) 次换位,产生因子 \((-1)^p\)

\[ = (-1)^p\, w_1 \wedge v_1 \wedge \cdots \wedge v_p \wedge w_2 \wedge \cdots \wedge w_q \]

然后将 \(w_2\) 越过 \(v_1,\ldots,v_p\)\(p\) 次换位,因子 \((-1)^p\)),以此类推。\(q\)\(w_j\) 各移动 \(p\) 次,总符号为 \((-1)^{pq}\)

\[ = (-1)^{pq}\, w_1 \wedge w_2 \wedge \cdots \wedge w_q \wedge v_1 \wedge \cdots \wedge v_p = (-1)^{pq}\, \beta \wedge \alpha \]

对一般的(非可分解)\(\alpha, \beta\),由线性延拓得到相同结论。 \(\square\)

阶段小结:符号 \((-1)^{pq}\) 而不是 \((-1)^{p+q}\) 的原因是清楚的——每个 \(w_j\) 要越过**所有** \(p\)\(v_i\),共 \(q\) 次各 \(p\) 步,总步数 \(pq\)

§10.3 维数对偶性

\(\binom{n}{k} = \binom{n}{n-k}\)——这是一个组合恒等式,但它有深刻的几何意义:\(\Lambda^k(V)\)\(\Lambda^{n-k}(V)\) 维数相同,因此存在(非自然的)同构。当 \(V\) 配备内积和定向时,Hodge 星 \(*: \Lambda^k(V) \to \Lambda^{n-k}(V)\)(§17)给出**自然的**等距同构。

§10.4 Grassmannian 与 Pluecker 嵌入

Grassmannian \(\operatorname{Gr}(k,n)\)\(\mathbb{R}^n\) 中所有 \(k\) 维子空间的集合。它是一个光滑流形,维数为 \(k(n-k)\)

外代数给出 Grassmannian 的自然嵌入——Pluecker 嵌入

\[ \operatorname{Gr}(k,n) \hookrightarrow \mathbb{P}(\Lambda^k(\mathbb{R}^n)) \]

具体地,\(k\) 维子空间 \(W = \operatorname{span}\{v_1,\ldots,v_k\}\) 映射到 \([v_1 \wedge \cdots \wedge v_k] \in \mathbb{P}(\Lambda^k(\mathbb{R}^n))\)(射影化后的楔积)。

良定义性:不同的基 \(\{v_1',\ldots,v_k'\}\) 给出的楔积 \(v_1' \wedge \cdots \wedge v_k' = \det(P) \cdot v_1 \wedge \cdots \wedge v_k\)\(P\) 为基变换矩阵),在射影空间中是同一个点。

机器人学应用:Pluecker 坐标描述三维空间中的直线(\(\operatorname{Gr}(2,4)\) 的 Pluecker 嵌入到 \(\Lambda^2(\mathbb{R}^4)\))。Featherstone 的空间代数中,螺旋轴的表示与 Pluecker 坐标直接相关。

§10.5 关键例子:\(\Lambda^2(\mathbb{R}^3)\)

\(\dim \Lambda^2(\mathbb{R}^3) = \binom{3}{2} = 3\),恰好与 \(\dim \mathbb{R}^3 = 3\) 相同。基为 \(\{e_1 \wedge e_2,\ e_2 \wedge e_3,\ e_3 \wedge e_1\}\)。这个"维数巧合" \(\binom{n}{2} = n \iff n = 3\) 是叉积存在的唯一理由(§15)。

对比:\(\dim \Lambda^2(\mathbb{R}^4) = \binom{4}{2} = 6 \neq 4\),所以 \(\mathbb{R}^4\) 中**没有叉积**。六个独立的"旋转平面"对应 \(\mathfrak{so}(4)\) 的六维李代数。

⚠️ 常见陷阱

💡 概念误区 8:以为叉积在任何维度都存在 新手想法:叉积可以推广到 \(\mathbb{R}^n\)实际上:叉积 \(V \times V \to V\)(双线性反对称、值在 \(V\) 中)只在 \(n=3\)\(n=7\) 时存在。\(n=3\) 来自 \(\binom{3}{2}=3\)(上面解释的),\(n=7\) 来自八元数。本章只讨论 \(n=3\) 的情形。

练习

  1. (推导题) 写出 \(\Lambda^*(\mathbb{R}^3) = \Lambda^0 \oplus \Lambda^1 \oplus \Lambda^2 \oplus \Lambda^3\) 的所有基元素和维数。验证总维数 \(= 2^3 = 8\)
  2. (开放思考题) \(\Lambda^n(V)\) 是一维的(\(\binom{n}{n}=1\))。这个一维空间的非零元素代表什么几何对象?(提示:体积形式。)

第五部分:行列式的无坐标理论

上一部分建立了外代数。现在我们用它来彻底理解行列式——这是本章最令人满意的应用之一。

§11 行列式的外代数定义 ⭐⭐

§11.1 动机:行列式的"真正"定义

40_谱定理SVD与极分解.md 中我们用排列公式 \(\det(A) = \sum_\sigma \operatorname{sgn}(\sigma)\prod_i a_{i,\sigma(i)}\) 定义了行列式。这个定义可以用来计算,但有三个不满意之处:

  1. 它**依赖坐标**——需要选基才能写出矩阵 \(A\)
  2. 基独立性需要额外证明——不同基下计算得到相同结果,不是显然的。
  3. \(\det(AB) = \det(A)\det(B)\) 的**证明冗长**——需要组合论证。

外代数给出一个更优雅的定义,三个问题全部消失。

§11.2 定义

\(T: V \to V\) 是线性映射,\(\dim V = n\)\(T\) 诱导 \(\Lambda^n(T): \Lambda^n(V) \to \Lambda^n(V)\)

\[ \Lambda^n(T)(v_1 \wedge \cdots \wedge v_n) = T(v_1) \wedge \cdots \wedge T(v_n) \]

由于 \(\Lambda^n(V)\) 是**一维的**(\(\binom{n}{n}=1\)),\(\Lambda^n(T)\) 只能是某个标量的乘法:

\[ \Lambda^n(T)(\omega) = c \cdot \omega, \quad \forall \omega \in \Lambda^n(V) \]

定义 \(\det(T) := c\)。即 \(T(v_1) \wedge \cdots \wedge T(v_n) = \det(T) \cdot (v_1 \wedge \cdots \wedge v_n)\)

本质洞察:行列式是线性映射在最高外幂上的"放大因子"。\(|\det(T)|\) 是体积的放大率,\(\operatorname{sgn}(\det(T))\) 是定向的保持/反转。这个定义不需要选基——\(T\)\(V\) 就足够了。

§11.3 可操作度的外代数解释

Jacobian 的列 \(Je_1, \ldots, Je_n\) 的楔积给出

\[ Je_1 \wedge \cdots \wedge Je_n = \det(J) \cdot (e_1 \wedge \cdots \wedge e_n) \]

对非方形 \(J\)\(m \times n\), \(m < n\)),Yoshikawa 可操作度 \(w = \sqrt{\det(JJ^\top)}\) 是这 \(n\) 个列向量在 \(\mathbb{R}^m\) 中张成的 \(n\)-维子体积的 Gram 行列式平方根。奇异位形 \(\iff\) \(\det(J) = 0\) \(\iff\) 列的 \(n\)-楔消失 \(\iff\) 可操作性椭球塌陷。

这给出了奇异性的**几何解释**:在奇异位形处,末端执行器的速度能力在某个方向上"退化"——对应的体积(楔积的模)为零。

§11.4 与排列公式的一致性

取标准基 \(\{e_1,\ldots,e_n\}\)\(T(e_j) = \sum_i a_{ij}e_i\)。则

\[ T(e_1) \wedge \cdots \wedge T(e_n) = \left(\sum_{i_1} a_{i_1 1}e_{i_1}\right) \wedge \cdots \wedge \left(\sum_{i_n} a_{i_n n}e_{i_n}\right) \]

展开后,只有 \((i_1,\ldots,i_n)\)\(\{1,\ldots,n\}\) 的排列时项才不为零(否则有重复指标,楔积消失)。得到

\[ = \sum_{\sigma \in S_n} a_{\sigma(1),1} \cdots a_{\sigma(n),n} \cdot e_{\sigma(1)} \wedge \cdots \wedge e_{\sigma(n)} \]
\[ = \sum_{\sigma \in S_n} \operatorname{sgn}(\sigma) \cdot a_{\sigma(1),1} \cdots a_{\sigma(n),n} \cdot (e_1 \wedge \cdots \wedge e_n) \]

因此 \(\det(T) = \sum_\sigma \operatorname{sgn}(\sigma) \prod_i a_{\sigma(i),i}\),恢复了 Leibniz 公式。

阶段小结:排列公式不是行列式的**定义**,而是外代数定义在选定基之后的**坐标表达**。


§12 行列式的性质 ⭐⭐

§12.1 乘法性

定理\(\det(AB) = \det(A)\det(B)\)

证明\(\Lambda^n(AB) = \Lambda^n(A) \circ \Lambda^n(B) = (\det A \cdot \operatorname{id}) \circ (\det B \cdot \operatorname{id}) = (\det A \cdot \det B) \cdot \operatorname{id}\)

一维空间上两个标量乘法的合成等于标量之积——一行证明完毕

对比排列公式的乘法性证明,需要 Cauchy-Binet 公式或冗长的组合论证。外代数定义的威力在于:把深层性质变成直接推论。

§12.2 基本性质速查

性质 公式 外代数证明思路
乘法性 \(\det(AB) = \det(A)\det(B)\) \(\Lambda^n\) 的函子性
单位 \(\det(I) = 1\) \(\Lambda^n(\operatorname{id}) = \operatorname{id}\)
\(\det(A^{-1}) = (\det A)^{-1}\) 乘法性 + \(\det(I)=1\)
可逆性 \(A\) 可逆 \(\iff\) \(\det A \neq 0\) \(\Lambda^n(A)\) 可逆 \(\iff\) 非零标量
转置 \(\det(A^\top) = \det(A)\) 排列求和的对称性

§12.3 行列式与特征多项式

回填50_极小多项式与Jordan标准形.md 中,特征多项式 \(p_T(\lambda) = \det(\lambda I - T)\) 的系数其实是**外幂的迹**:

\[ p_T(\lambda) = \lambda^n - (\operatorname{tr} T)\lambda^{n-1} + \cdots + (-1)^k \operatorname{tr}(\Lambda^k T)\lambda^{n-k} + \cdots + (-1)^n \det(T) \]

其中 \(\operatorname{tr}(\Lambda^k T)\)\(T\)\(\Lambda^k(V)\) 上诱导映射的迹,等于 \(T\) 的所有 \(k \times k\) 主子式之和。这把特征多项式的"每个系数"都用外代数统一解释了。

⚠️ 常见陷阱

💡 概念误区 9:以为行列式只是一个"计算工具" 新手想法:行列式的用途就是判断矩阵是否可逆和解线性方程组。 实际上:行列式有深刻的几何意义——它是体积放大率与定向的合体。\(|\det(T)|\) 告诉你 \(T\) 把单位立方体变成了多大的平行多面体,\(\operatorname{sgn}(\det T)\) 告诉你定向是否翻转。这就是为什么 \(SO(n) = \{R \in O(n) : \det R = +1\}\)——正行列式意味着保持定向。

🧠 思维陷阱 6:以为外代数定义"更难"所以不实用 新手想法:排列公式可以直接算,外代数定义太抽象了。 实际上:抽象恰恰是威力所在。乘法性 \(\det(AB)=\det(A)\det(B)\) 用排列公式证明需要一整页,用外代数一行完成。基独立性用排列公式需要额外论证,用外代数是定义的直接推论。越是深层的性质,抽象定义越占优势。

练习

  1. (证明题) 用外代数定义证明:如果 \(T\) 有特征值 \(\lambda_1,\ldots,\lambda_n\)(计重数),则 \(\det(T) = \lambda_1 \cdots \lambda_n\)
  2. (推导题) 证明 \(\det(cA) = c^n \det(A)\),其中 \(c\) 是标量,\(A\)\(n \times n\) 矩阵。从外代数和从排列公式两种方式各给一个证明。

§12.4 Laplace 展开(按行/列展开)

行列式可以按任意一行或一列展开:

\[ \det(A) = \sum_{j=1}^{n} (-1)^{i+j} a_{ij} M_{ij} \]

其中 \(M_{ij}\) 是删去第 \(i\) 行第 \(j\) 列后的 \((n-1) \times (n-1)\) 子式的行列式。

从外代数角度看,这是**内积收缩** \(\iota_{e_i}\) 作用于 \(n\)-形式 \(e_1 \wedge \cdots \wedge e_n\) 的结果——把 \(n\)-形式"沿第 \(i\) 个方向收缩"得到 \((n-1)\)-形式,然后求值。

Schur 补公式:对分块矩阵 \(M = \begin{pmatrix} A & B \\ C & D \end{pmatrix}\)\(A\) 可逆),

\[ \det(M) = \det(A) \cdot \det(D - CA^{-1}B) \]

其中 \(S = D - CA^{-1}B\)\(D\) 关于 \(A\)Schur 补。这在 SLAM 的边缘化(marginalization)中至关重要——消去一组变量等价于计算 Schur 补,对应的行列式分解反映了条件概率的乘法律。

练习

  1. (推导题) 验证 Schur 补公式对 \(2 \times 2\) 分块矩阵 \(\begin{pmatrix} a & b \\ c & d \end{pmatrix}\) 成立(此时 \(A = (a)\), \(B = (b)\), \(C = (c)\), \(D = (d)\), Schur 补 \(= d - ca^{-1}b\))。

§13 行列式与体积、定向 ⭐⭐

§13.1 体积解释

\(\mathbb{R}^n\) 中平行多面体 \(P = \{t_1 v_1 + \cdots + t_n v_n : 0 \le t_i \le 1\}\)\(n\)-维体积为

\[ \operatorname{Vol}(P) = |\det[v_1 | \cdots | v_n]| \]

证明思路\(\det\) 是归一化的交替 \(n\)-线性函数(\(\det(e_1,\ldots,e_n) = 1\))。Lebesgue 测度给出的体积函数也是归一化的交替 \(n\)-线性函数(体积对向量双线性、交换两个向量翻转定向)。由 \(\Lambda^n(V)\) 的一维性(§10),两者至多差一个常数,归一化后相等。

§13.2 定向

定义\(\mathbb{R}^n\) 的一个**定向**(orientation)是 \(\Lambda^n(\mathbb{R}^n)\) 中非零元素的等价类(正倍数等价)。\(\Lambda^n(\mathbb{R}^n)\) 是一维的,所以恰好有两个定向(正和负)。

\(\det(T) > 0\) 意味着 \(T\) 保持定向\(\det(T) < 0\) 意味着 \(T\) 反转定向。这就是 \(SO(n) = \{A \in O(n) : \det A = +1\}\) 的含义——旋转保持定向,反射反转定向。

§13.3 配置流形上的体积

在机器人学中,行列式的体积解释直接关联到**配置空间的采样**。RRT(Rapidly-exploring Random Trees)等运动规划算法需要在配置空间 \(Q\) 上均匀采样。当 \(Q\) 是 Lie 群(如 \(SO(3)\), \(SE(3)\))时,"均匀"意味着相对于**左不变体积形式**(Haar 测度)。

\(SO(3)\) 来说,Haar 测度在轴角参数 \((\theta, \hat{n})\) 下的密度为

\[ d\mu = \frac{1-\cos\theta}{4\pi^2}\, d\theta\, dS^2 \]

其中 \(dS^2\) 是单位球面上的面积元。注意密度因子 \(\frac{1-\cos\theta}{4\pi^2}\) 不是常数——这反映了轴角参数不是"等距"参数化,度量张量的行列式(即体积元的 Jacobian)随 \(\theta\) 变化。

§13.4 变量替换公式

微积分中的变量替换公式

\[ \int_{\varphi(U)} f\, dx = \int_U (f \circ \varphi)|\det D\varphi|\, dx \]

中的 \(|\det D\varphi|\) 正是 \(\varphi\) 在每一点处的体积放大率——这是行列式几何意义的直接应用。在流形上,这将推广为微分形式的拉回和积分。

练习

  1. (推导题)\(v_1 = (1,2)\), \(v_2 = (3,1)\)。计算 \(v_1, v_2\) 张成的平行四边形面积。用 \(|v_1 \wedge v_2|\)(需要定义范数)和 \(|\det[v_1|v_2]|\) 两种方式验证一致。

§14 余因子矩阵与 Cramer 法则 ⭐⭐⭐

§14.1 伴随矩阵

定义\(n \times n\) 矩阵 \(A\) 的**伴随矩阵**(adjugate/classical adjoint)\(\operatorname{adj}(A)\) 定义为

\[ \operatorname{adj}(A)_{ij} = (-1)^{i+j} M_{ji} \]

其中 \(M_{ji}\)\(A\) 删去第 \(j\) 行第 \(i\) 列后的 \((n-1) \times (n-1)\) 子式的行列式(余子式)。注意转置:\(\operatorname{adj}(A)\)\((i,j)\) 元素用的是 \(A\)\((j,i)\) 余子式。

核心恒等式

\[ A \cdot \operatorname{adj}(A) = \operatorname{adj}(A) \cdot A = \det(A) \cdot I \]

§14.2 Cramer 法则

定理:若 \(Ax = b\)\(\det(A) \neq 0\),则

\[ x_j = \frac{\det(A_j)}{\det(A)} \]

其中 \(A_j\) 是将 \(A\) 的第 \(j\) 列替换为 \(b\) 所得的矩阵。

工程警示:Cramer 法则的计算复杂度为 \(O(n \cdot n!)\)(计算 \(n+1\) 个行列式),远逊于 LU 分解的 \(O(n^3)\)。它的价值是**理论性的**——用于隐函数定理的证明、符号微分等,而不是数值计算。

⚠️ 常见陷阱

🧠 思维陷阱 7:用 Cramer 法则做数值计算 新手想法\(x_j = \det(A_j)/\det(A)\) 很简洁,用它来解方程组。 实际上:数值计算中**永远不要**用 Cramer 法则。\(O(n!)\) 的复杂度意味着 \(n=20\) 时就需要 \(\sim 10^{18}\) 次运算。用 LU 分解(\(O(n^3)\))或迭代方法。

练习

  1. (推导题) 用核心恒等式 \(A \cdot \operatorname{adj}(A) = \det(A) \cdot I\) 推导 \(A^{-1} = \operatorname{adj}(A)/\det(A)\)(当 \(\det A \neq 0\))。

第六部分:楔积的几何应用

§15 叉积作为 \(\Lambda^2(\mathbb{R}^3)\) 的特殊情形 ⭐⭐

§15.1 维数偶然性

回顾 §10.3:\(\dim \Lambda^2(\mathbb{R}^3) = 3 = \dim \mathbb{R}^3\)。这个等式 \(\binom{n}{2} = n\) 只在 \(n=3\) 时成立(以及 \(n=0,1\) 的退化情形)。正是这个维数巧合使得我们可以定义一个"把两个向量变成一个向量"的运算——叉积。

\(\mathbb{R}^4\) 中,\(\dim \Lambda^2(\mathbb{R}^4) = 6 \neq 4\),所以没有类似的运算。如果有人告诉你"四维空间也有叉积",那一定不是通常意义上的叉积。

§15.2 叉积 \(=\) Hodge 星 \(\circ\) 楔积

给定标准内积和标准定向(\(e_1 \wedge e_2 \wedge e_3\) 为正定向),Hodge 星 \(*: \Lambda^2(\mathbb{R}^3) \to \Lambda^1(\mathbb{R}^3) = \mathbb{R}^3\) 由以下对应定义:

\[ *(e_1 \wedge e_2) = e_3, \quad *(e_2 \wedge e_3) = e_1, \quad *(e_3 \wedge e_1) = e_2 \]

定义\(u \times v := *(u \wedge v)\)

验证:设 \(u = u_1 e_1 + u_2 e_2 + u_3 e_3\)\(v = v_1 e_1 + v_2 e_2 + v_3 e_3\),则

\[ u \wedge v = (u_1 v_2 - u_2 v_1)(e_1 \wedge e_2) + (u_2 v_3 - u_3 v_2)(e_2 \wedge e_3) + (u_3 v_1 - u_1 v_3)(e_3 \wedge e_1) \]

施加 Hodge 星:

\[ u \times v = *(u \wedge v) = (u_2 v_3 - u_3 v_2)e_1 + (u_3 v_1 - u_1 v_3)e_2 + (u_1 v_2 - u_2 v_1)e_3 \]

这正是叉积的标准公式!

本质洞察:叉积不是一个"基本运算"——它是楔积(纯代数)后接 Hodge 星(依赖度量和定向)的复合。\(u \wedge v \in \Lambda^2(\mathbb{R}^3)\) 才是"真正的对象",它表示 \(u\)\(v\) 张成的平面(带面积和定向)。叉积 \(u \times v\) 是把这个平面的"法向量"取出来——这需要度量(定义"垂直")和定向(选择法向量的朝向)。

§15.3 角速度与帽映射

在机器人学中,角速度 \(\omega \in \mathbb{R}^3\) 通过**帽映射**(hat map)\(\hat{\cdot}: \mathbb{R}^3 \to \mathfrak{so}(3)\) 变为反对称矩阵:

\[ \hat{\omega} = \begin{pmatrix} 0 & -\omega_3 & \omega_2 \\ \omega_3 & 0 & -\omega_1 \\ -\omega_2 & \omega_1 & 0 \end{pmatrix} \]

满足 \(\hat{\omega}v = \omega \times v\)。从外代数角度看,帽映射就是 \(\mathbb{R}^3 \cong \Lambda^2(\mathbb{R}^3) \cong \mathfrak{so}(3)\) 的同构链。

\(SO(4)\)\(SE(3)\) 中这个"简便"失效——\(\dim \mathfrak{so}(4) = 6 \neq 4\)——转而用 Pluecker 坐标或伴随作用 \(\operatorname{ad}_\xi\)

⚠️ 常见陷阱

💡 概念误区 10:以为叉积是"坐标无关的" 新手想法:叉积只依赖两个向量,不依赖坐标系。 实际上:楔积 \(u \wedge v\) 是坐标无关的,但叉积 \(u \times v = *(u \wedge v)\) 需要 Hodge 星,而 Hodge 星依赖**度量和定向**。换一个度量(非欧几里得)或定向(左手系),叉积的值会变。

练习

  1. (推导题) 验证 \(|u \times v|^2 = |u|^2|v|^2 - (u \cdot v)^2\)(Lagrange 恒等式),从 \(u \times v = *(u \wedge v)\) 出发。
  2. (跨章综合题) 结合 30_内积空间 的 Gram-Schmidt 和本章的外代数,证明:\(n\) 个向量的 Gram 行列式 \(G = \det(\langle v_i, v_j \rangle)\) 等于 \(|v_1 \wedge \cdots \wedge v_n|^2\)

§16 内积(缩并)算子 \(\iota_v\) ⭐⭐⭐

§16.1 定义

\(v \in V\)内积算子(interior product 或 contraction)\(\iota_v: \Lambda^k(V) \to \Lambda^{k-1}(V)\) 在可分解元素上定义为:

\[ \iota_v(w_1 \wedge \cdots \wedge w_k) = \sum_{i=1}^{k} (-1)^{i-1} \langle v, w_i \rangle \cdot w_1 \wedge \cdots \wedge \hat{w}_i \wedge \cdots \wedge w_k \]

其中 \(\hat{w}_i\) 表示删去 \(w_i\)

§16.2 关键性质

  • 反导性(antiderivation):\(\iota_v(\alpha \wedge \beta) = \iota_v(\alpha) \wedge \beta + (-1)^p \alpha \wedge \iota_v(\beta)\)\(\alpha \in \Lambda^p\)
  • 幂零性\(\iota_v \circ \iota_v = 0\)
  • 反交换\(\iota_v \iota_w + \iota_w \iota_v = 0\)

§16.3 下游应用

Cartan 魔法公式\(\mathcal{L}_X = d \circ \iota_X + \iota_X \circ d\),把**李导数**(\(\mathcal{L}_X\))、外微分\(d\))、缩并\(\iota_X\))统一起来。这是几何控制理论的基石——判断一个系统是否沿某个方向"不变"。

§16.4 计算示例

\(\mathbb{R}^3\)(标准内积)中计算 \(\iota_{e_1}(e_1 \wedge e_2 \wedge e_3)\)

\[ \iota_{e_1}(e_1 \wedge e_2 \wedge e_3) = \langle e_1, e_1 \rangle(e_2 \wedge e_3) - \langle e_1, e_2 \rangle(e_1 \wedge e_3) + \langle e_1, e_3 \rangle(e_1 \wedge e_2) \]
\[ = 1 \cdot (e_2 \wedge e_3) - 0 + 0 = e_2 \wedge e_3 \]

再计算 \(\iota_{e_1}(e_2 \wedge e_3)\)

\[ \iota_{e_1}(e_2 \wedge e_3) = \langle e_1, e_2 \rangle e_3 - \langle e_1, e_3 \rangle e_2 = 0 - 0 = 0 \]

这验证了 \(\iota_{e_1} \circ \iota_{e_1} = 0\)(幂零性)。

向量分析中的对应:在 \(\mathbb{R}^3\) 中,\(\iota_v\) 对应的经典运算取决于作用对象的次数:

作用对象 \(\iota_v\) 的经典对应 结果
\(3\)-形式(体积元) \(v \cdot\) 体积元 \(2\)-形式(面积元)
\(2\)-形式 类似"点乘" \(1\)-形式
\(1\)-形式 \(v\) 与余向量配对 标量

练习

  1. (推导题)\(\Lambda^2(\mathbb{R}^3)\) 上验证 \(\iota_{e_1}(e_1 \wedge e_2 \wedge e_3) = e_2 \wedge e_3\)(假设标准内积),即 \(\iota_{e_1}\)\(3\)-形式"降"为 \(2\)-形式。
  2. (推导题) 计算 \(\iota_{e_1+e_2}(e_1 \wedge e_2)\)。利用 \(\iota\) 关于 \(v\) 的线性性简化计算。

§17 Hodge 星算子 ⭐⭐

§17.1 前提

Hodge 星需要两个额外结构:

  1. 非退化内积 \(\langle\cdot,\cdot\rangle\)(由 §2 的双线性型推广,不要求正定)。
  2. 定向:选定 \(\operatorname{vol} \in \Lambda^n(V)\),归一化为 \(\langle\operatorname{vol},\operatorname{vol}\rangle = \pm 1\)

§17.2 定义

定义\(*: \Lambda^k(V) \to \Lambda^{n-k}(V)\) 由以下条件唯一确定:

\[ \alpha \wedge *\beta = \langle \alpha, \beta \rangle_{\Lambda^k} \cdot \operatorname{vol}, \quad \forall \alpha \in \Lambda^k(V) \]

其中 \(\langle\cdot,\cdot\rangle_{\Lambda^k}\) 是由 \(V\) 的内积诱导的 \(\Lambda^k(V)\) 上的内积(Gram 行列式公式:\(\langle v_1 \wedge \cdots \wedge v_k, w_1 \wedge \cdots \wedge w_k \rangle = \det[\langle v_i,w_j \rangle]\))。

存在唯一性来自配对 \(\Lambda^k \times \Lambda^{n-k} \to \Lambda^n\) 的非退化性。

§17.3 标准正交基上的计算

\(\{e_1,\ldots,e_n\}\) 是标准正交基。对递增指标序列 \(I = (i_1 < \cdots < i_k)\),记 \(I^c\) 为其补集(也递增排列)。则

\[ *e_I = \operatorname{sgn}(I, I^c) \cdot e_{I^c} \]

其中 \(\operatorname{sgn}(I, I^c)\) 是把 \((I, I^c)\) 排列成 \((1,2,\ldots,n)\) 所需的置换的符号。

恒等式

\[ ** = (-1)^{k(n-k)} \cdot \operatorname{id} \quad \text{(Riemann 度量情形)} \]

广义签名 \((p,q)\) 时多一个 \((-1)^s\) 因子(\(s\) 为负号个数)。

§17.4 Hodge 星是等距

定理\(\langle *\omega, *\eta \rangle = \langle \omega, \eta \rangle\)

证明\(\langle *\omega, *\eta \rangle \cdot \operatorname{vol} = (*\omega) \wedge *(*\eta) = (-1)^{k(n-k)}(*\omega) \wedge \eta = (-1)^{k(n-k)} \eta \wedge (*\omega) \cdot (-1)^{(n-k)k} = \eta \wedge *\omega = \langle \eta, \omega \rangle \cdot \operatorname{vol} = \langle \omega, \eta \rangle \cdot \operatorname{vol}\)

§17.5 Maxwell 方程与端口 Hamilton 系统

在四维 Minkowski 时空中,电磁场张量 \(F \in \Lambda^2\) 和电流 \(J \in \Lambda^1\) 满足 Maxwell 方程的紧凑形式:

\[ dF = 0 \quad (\text{Bianchi 恒等式}), \quad d{*F} = {*J} \quad (\text{动力学方程}) \]

Hodge 星把拓扑约束(\(d\))与几何/度量约束(\(*\))分离。在软体/连续介质机器人中,van der Schaft-Maschke 的 Stokes-Dirac 结构把动力学写成 \(d\)\(*\) 的配对,保持能量守恒。

⚠️ 常见陷阱

💡 概念误区 11:以为 Hodge 星是纯代数的 新手想法\(*\) 只是一个代数运算,和楔积一样。 实际上:楔积 \(\wedge\) 是纯代数的(不需要度量),但 Hodge 星 \(*\) 需要**度量和定向**。换一个度量(如从欧几里得换到 Minkowski),\(*\) 的结果完全不同。这就是为什么 Maxwell 方程中 \(dF=0\) 是"拓扑的"(不依赖度量),而 \(d*F=*J\) 是"度量的"(依赖时空度量)。

练习

  1. (推导题)\(\mathbb{R}^4\)(标准度量),计算 \(*(e_1 \wedge e_2)\)。验证 \(**=+1\)(因为 \(k=2\), \(n=4\), \(k(n-k) = 4\))。
  2. (证明题) 证明在 \(\mathbb{R}^3\)(标准度量和定向)中,\(*(1) = e_1 \wedge e_2 \wedge e_3\)\(*(e_1 \wedge e_2 \wedge e_3) = 1\)

第七部分:指标语言与张量分析

前六部分用无坐标的方式建立了张量积和外代数。本部分引入物理学家和工程师常用的**指标记号**——它不是新理论,而是前面理论的坐标表达。

§18 指标记号与 Einstein 求和约定 ⭐⭐

§18.1 动机:为什么需要指标记号

无坐标的张量语言(\(T \in V \otimes V^*\)\(\Lambda^k(T)\))在理论推导中优雅且不易出错。但在具体计算中——尤其是涉及复杂张量缩并的动力学方程中——把所有东西写成无坐标形式会极其繁琐。指标记号是一种"坐标速记法",让复杂的张量运算变得可操作。

类比:无坐标语言就像自然语言(表达精确但冗长),指标记号就像数学符号(紧凑但需要学习语法规则)。像的部分:两者表达相同的内容。不像的部分:指标记号依赖基的选择(虽然最终结果不依赖),无坐标语言不依赖。

§18.2 上下指标约定

向量(逆变,上指标)\(v = v^i e_i\)(Einstein 约定:重复指标自动求和)。

余向量(协变,下指标)\(\alpha = \alpha_i e^i\)

Einstein 求和约定:重复出现的一对上下指标(称为**哑指标**)隐含求和。例如:

\[ \alpha_i v^i = \sum_{i=1}^n \alpha_i v^i = \alpha(v) \quad \text{(标量,不变量)} \]

关键规则:上下指标**必须配对**求和。两个上指标或两个下指标相乘不缩并——除非有度量张量升降指标(§19)。

§18.3 \((p,q)\)-型张量的指标表示

\((p,q)\)-型张量 \(T \in T^p_q(V)\) 在基 \(\{e_i\}\) 和对偶基 \(\{e^j\}\) 下表示为:

\[ T = T^{i_1 \cdots i_p}_{\ \ \ \ j_1 \cdots j_q}\ e_{i_1} \otimes \cdots \otimes e_{i_p} \otimes e^{j_1} \otimes \cdots \otimes e^{j_q} \]

基变换律:设新基 \(\tilde{e}_j = A^i_{\ j} e_i\)\(A\) 为基变换矩阵),则

  • 逆变分量:\(\tilde{v}^i = (A^{-1})^i_{\ j} v^j\)(与基**反**方向变换)
  • 协变分量:\(\tilde{\alpha}_j = A^i_{\ j} \alpha_i\)(与基**同**方向变换)
  • 一般 \((p,q)\) 张量:每个上指标贴 \(A^{-1}\),每个下指标贴 \(A\)

§18.4 指标记号的基本运算

张量乘积(外积):两个张量的分量直接相乘,指标并列。例如 \((p,0)\)-型张量 \(A^{i_1\cdots i_p}\)\((0,q)\)-型张量 \(B_{j_1 \cdots j_q}\) 的张量积是 \((p,q)\)-型张量 \(C^{i_1\cdots i_p}_{\ \ \ \ j_1\cdots j_q} = A^{i_1\cdots i_p} B_{j_1\cdots j_q}\)

缩并:令一对上下指标相等并求和。例如对 \((1,1)\)-型张量 \(T^i_{\ j}\),缩并得标量 \(T^i_{\ i} = \operatorname{tr}(T)\)

对称化与反对称化\(T^{(ij)} = \frac{1}{2}(T^{ij} + T^{ji})\)(对称部分),\(T^{[ij]} = \frac{1}{2}(T^{ij} - T^{ji})\)(反对称部分)。

具体计算示例:设 \(v^i = (3, 1)\), \(\alpha_j = (2, -1)\)。则 \(\alpha_i v^i = 2 \cdot 3 + (-1) \cdot 1 = 5\)(标量)。外积 \(v^i \alpha_j\)\(2 \times 2\) 矩阵:

\[ v^i \alpha_j = \begin{pmatrix} 3 \cdot 2 & 3 \cdot (-1) \\ 1 \cdot 2 & 1 \cdot (-1) \end{pmatrix} = \begin{pmatrix} 6 & -3 \\ 2 & -1 \end{pmatrix} \]

缩并 \(v^i \alpha_i = 6 + (-1) = 5\)——与内积一致。

§18.5 为什么区分上下指标至关重要

在欧几里得空间 + 正交基中,度量矩阵 \(g_{ij} = \delta_{ij}\)(单位阵),上指标和下指标在数值上没有区别。这容易让人以为"上下标只是书写习惯"。

但在以下情形中,混淆上下标会导致严重错误:

情形 后果
弯曲空间(广义相对论) \(g_{ij} \neq \delta_{ij}\)\(v^i \neq v_i\)
非正交基(关节空间) 质量矩阵 \(M_{ij} \neq \delta_{ij}\)
Minkowski 时空 \(g = \operatorname{diag}(-1,+1,+1,+1)\),混淆导致符号错误

本质洞察:上下标的区分不是"记号约定",而是反映了向量(推动/速度/逆变)与余向量(拉回/力/协变)的物理差异。在欧几里得空间中这个差异被正交基掩盖了,但在一般的流形上(配置空间、时空)它是本质的。

⚠️ 常见陷阱

💡 概念误区 12:以为 Einstein 求和中两个下标也可以缩并 新手想法\(a_i b_i\) 就是 \(\sum a_i b_i\)实际上:严格的 Einstein 约定要求一上一下配对。\(a_i b_i\) 在没有度量的情况下**没有意义**——你需要用度量把 \(b_i\) 升为 \(b^i\)(即 \(a_i g^{ij} b_j\))才能缩并。在欧几里得空间 \(g^{ij} = \delta^{ij}\),结果数值相同,但概念上是不同的运算。

🧠 思维陷阱 8:以为"逆变"意味着"变换方向相反"就结束了 新手想法:知道"逆变 \(=\) 与基反向变换"就够了。 实际上:更深层的理解是——逆变和协变反映的是张量的**函子性**。速度(逆变)在映射 \(\varphi: M \to N\) 下被**前推**(pushforward),力(协变)被**拉回**(pullback)。这在微分几何中有精确的范畴论意义。

练习

  1. (推导题) 在二维空间中,基 \(\{e_1,e_2\}\) 下向量 \(v = 3e_1 + 2e_2\)。新基 \(\tilde{e}_1 = e_1 + e_2\), \(\tilde{e}_2 = e_1 - e_2\)。求新基下的分量 \(\tilde{v}^i\)。验证 \(\tilde{v}^i \tilde{e}_i = v\)
  2. (推导题) 写出 \((1,1)\)-型张量 \(T^i_{\ j}\) 在基变换 \(\tilde{e}_k = A^i_{\ k} e_i\) 下的变换律。验证 \(\operatorname{tr}(T) = T^i_{\ i}\) 是基变换不变量。

§19 度量张量与指标升降 ⭐⭐

§19.1 度量张量

定义:度量张量 \(g\) 是一个 \((0,2)\)-型对称非退化张量:

\[ g = g_{ij}\, e^i \otimes e^j \]

在标准正交基中 \(g_{ij} = \delta_{ij}\)(欧几里得)或 \(g_{ij} = \eta_{ij}\)(Minkowski)。

逆度量 \(g^{ij}\) 满足 \(g^{ik}g_{kj} = \delta^i_{\ j}\)

§19.2 音乐同构

降指标(flat, \(\flat\)):\(v^i \mapsto v_i := g_{ij}v^j\)。将向量(\(V\) 中)变为余向量(\(V^*\) 中)。

升指标(sharp, \(\sharp\)):\(\alpha_i \mapsto \alpha^i := g^{ij}\alpha_j\)。将余向量变为向量。

这两个操作互逆:\(\sharp \circ \flat = \operatorname{id}\)

与 Riesz 表示的一致性:回顾 30_内积空间:Riesz 表示定理给出 \(V \cong V^*\)(通过内积)。\(\flat(v) = g(v, \cdot) = \langle v, \cdot \rangle\) 正是 Riesz 映射。指标语言中的升降操作就是 Riesz 同构的坐标表达。

§19.3 延拓到张量

度量 \(g\) 不仅作用于向量,还诱导所有张量空间上的内积。特别地:

\(\Lambda^k(V)\) 上的内积:由 Gram 行列式定义:

\[ \langle v_1 \wedge \cdots \wedge v_k, w_1 \wedge \cdots \wedge w_k \rangle = \det[\langle v_i, w_j \rangle] \]

这正是 §17 Hodge 星的定义所需要的内积。

\(T^p_q(V)\) 上的内积:通过 \(g\) 的逐分量作用定义。在指标语言中,\((p,q)\)-型张量 \(S\)\(T\) 的内积为

\[ \langle S, T \rangle = g_{i_1 j_1} \cdots g_{i_p j_p} g^{k_1 \ell_1} \cdots g^{k_q \ell_q} S^{i_1 \cdots i_p}_{\ \ \ \ k_1 \cdots k_q} T^{j_1 \cdots j_p}_{\ \ \ \ \ell_1 \cdots \ell_q} \]

即"所有上指标用 \(g\) 缩并,所有下指标用 \(g^{-1}\) 缩并"。

§19.4 Riemann 度量与配置空间

机器人质量矩阵 \(M(q) = (g_{ij}(q))\) 就是配置空间 \(Q\) 上的 Riemann 度量。 动能

\[ T = \frac{1}{2}g_{ij}(q)\dot{q}^i\dot{q}^j = \frac{1}{2}\dot{q}^\top M(q)\dot{q} \]

是"长度平方"的动力学版本。自由运动(无外力)的方程是**测地方程**:

\[ \ddot{q}^i + \Gamma^i_{jk}\dot{q}^j\dot{q}^k = 0 \]

其中 Christoffel 符号

\[ \Gamma^i_{jk} = \frac{1}{2}g^{i\ell}\left(\frac{\partial g_{\ell k}}{\partial q^j} + \frac{\partial g_{\ell j}}{\partial q^k} - \frac{\partial g_{jk}}{\partial q^\ell}\right) \]

是由度量唯一确定的 Levi-Civita 联络。Coriolis 项 \(C(q,\dot{q})\dot{q}\) 正是来自 Christoffel 符号。

应用视角:Slotine-Li 自适应控制利用 \(\dot{M} - 2C\) 的斜对称性——这个性质来自度量张量的"无挠性"(Levi-Civita 联络的对称性)。不理解度量张量,就无法从几何层面理解这个控制设计。

⚠️ 常见陷阱

💡 概念误区 13:以为"升降指标只是乘以 \(M\)" 新手想法:升降指标就是矩阵乘法,没什么深刻的。 实际上:升降指标改变了张量的**类型**——从向量变成余向量,或反之。在物理上,速度(逆变)和力矩(协变)是不同的物理量,虽然在标准基下数值相同。度量张量是"翻译"这两种语言的字典。

练习

  1. (推导题) 对度量 \(g = \begin{pmatrix} 1 & 1/2 \\ 1/2 & 1 \end{pmatrix}\),计算逆度量 \(g^{ij}\)。对向量 \(v = (v^1, v^2) = (1, 2)\),计算协变分量 \(v_i = g_{ij}v^j\)。验证 \(v_i v^i = g_{ij}v^i v^j\)

§20 张量缩并与迹 ⭐⭐

§20.1 缩并

\((p,q)\)-型张量,选择一对上下指标令其相等并求和(Einstein 约定自动完成),得到 \((p-1,q-1)\)-型张量。无坐标形式:缩并是求值映射 \(\operatorname{ev}: V \otimes V^* \to F\)\(v \otimes \varphi \mapsto \varphi(v)\))的自然延拓。

:对 \((1,1)\)-型张量 \(T^i_{\ j}\),缩并得标量 \(T^i_{\ i} = \operatorname{tr}(T)\)(迹)。

§20.2 迹的基不变性

\(\operatorname{Hom}(V,V) \cong V^* \otimes V\) 的同构下,迹 \(=\) 缩并唯一的指标对。基变换 \(\tilde{T}^i_{\ j} = (A^{-1})^i_{\ k} T^k_{\ \ell} A^\ell_{\ j}\)\(\tilde{T}^i_{\ i} = (A^{-1})^i_{\ k} T^k_{\ \ell} A^\ell_{\ i} = T^k_{\ \ell} \delta^\ell_k = T^k_{\ k}\),即 \(\operatorname{tr}(\tilde{T}) = \operatorname{tr}(T)\)

迹的基不变性是缩并的基本变换律的直接推论——不需要额外证明。

§20.3 缩并的坐标无关性

缩并的结果不依赖基的选择——这是因为缩并对应的是自然映射 \(\operatorname{ev}: V \otimes V^* \to F\)。"自然"在范畴论中有精确含义:\(\operatorname{ev}(v \otimes \varphi) = \varphi(v)\) 不需要选择任何基。

相对照地,"取第 \(i\) 个分量" \(v \mapsto v^i\) 不是自然的——它依赖基的选择。缩并之所以给出不变量,是因为上指标的非自然性和下指标的非自然性"相互抵消"了。

这个观察的推论是:任何由张量的缩并和张量积组合得到的标量表达式都是坐标不变的。这就是为什么 \(\operatorname{tr}(T)\)\(\det(T)\)\(T^{ij}S_{ij}\) 等等都不依赖基——它们都是缩并的结果。

§20.4 下游预告:Ricci 缩并

在 Riemann 几何中,Riemann 曲率张量 \(R^i_{\ jk\ell}\)\((1,3)\)-型张量。对第一和第三指标缩并得 \((0,2)\)-型的 Ricci 张量

\[ R_{j\ell} = R^i_{\ ji\ell} \]

进一步用度量缩并得**标量曲率** \(R = g^{j\ell}R_{j\ell}\)。这两步缩并是 Einstein 场方程 \(R_{j\ell} - \frac{1}{2}Rg_{j\ell} = 8\pi G T_{j\ell}\) 的左端——它把几何(曲率)与物质(能量-动量张量 \(T_{j\ell}\))联系起来。

在机器人学中,虽然我们通常不处理 Einstein 方程,但配置空间的曲率张量(通过质量矩阵 \(M(q)\) 定义的 Riemann 度量)确实影响运动规划——在正曲率区域,测地线(自由运动轨迹)趋于聚拢;在负曲率区域,测地线趋于发散。

§20.5 双缩并

\((0,2)\)-型张量 \(\sigma_{ij}\)\((2,0)\)-型张量 \(\varepsilon^{ij}\),双缩并 \(\sigma_{ij}\varepsilon^{ij}\) 是标量。物理中的"冒号积" \(\sigma : \varepsilon\)(应力-应变能密度)就是此运算。

§20.6 张量方程的指标运算

指标记号的强大之处在于复杂的张量方程可以系统地操作。以下是一些常见的指标操作模式:

模式 1:乘法后缩并。 \(A^i_{\ j} B^j_{\ k} = C^i_{\ k}\)(矩阵乘法的指标版本)。

模式 2:对称化。 \(S_{ij} = \frac{1}{2}(T_{ij} + T_{ji})\)(提取对称部分)。

模式 3:反对称化。 \(A_{ij} = \frac{1}{2}(T_{ij} - T_{ji})\)(提取反对称部分)。

模式 4:Levi-Civita 张量。 完全反对称张量 \(\varepsilon_{ijk}\)\(n=3\))满足 \(\varepsilon_{123} = 1\),置换任意两个指标变号。叉积可以写为 \((u \times v)^i = \varepsilon^{ijk}u_j v_k\)

模式 5:Kronecker \(\delta\) \(\delta^i_{\ j}\)\((1,1)\)-型张量,满足 \(\delta^i_{\ j}v^j = v^i\)(恒等映射)。

练习

  1. (推导题)\((2,1)\)-型张量 \(T^{ij}_{\ \ k}\),写出对 \((i,k)\) 缩并后的结果。它是什么类型的张量?
  2. (推导题) 用 Levi-Civita 张量 \(\varepsilon_{ijk}\) 和 Einstein 约定写出叉积 \((u \times v)^i = \varepsilon^{ijk}u_j v_k\)。验证这与分量公式 \((u \times v)_1 = u_2 v_3 - u_3 v_2\) 等一致。
  3. (证明题) 证明 \(\varepsilon^{ijk}\varepsilon_{imn} = \delta^j_m \delta^k_n - \delta^j_n \delta^k_m\)(Levi-Civita 恒等式)。这个恒等式在向量恒等式 \(a \times (b \times c) = b(a \cdot c) - c(a \cdot b)\) 的证明中至关重要。

第八部分:进阶代数

§21 对称代数 \(S(V)\) ⭐⭐⭐

§21.1 定义

对称代数是张量代数 \(T(V)\) 商掉交换关系后的结果:

\[ S(V) = T(V) / \langle v \otimes w - w \otimes v : v,w \in V \rangle \]

它是 \(V\) 生成的**自由交换代数**。

§21.2 与多项式环的同构

选定 \(V\) 的基 \(\{e_1,\ldots,e_n\}\) 后,\(S(V) \cong F[x_1,\ldots,x_n]\)(多项式环),通过 \(e_i \mapsto x_i\)

分级维数:\(\dim S^k(V) = \binom{n+k-1}{k}\)(长度为 \(k\) 的多项式的单项式个数)。

Poincare 级数:\(\sum_{k=0}^{\infty} \dim S^k(V) \cdot t^k = \frac{1}{(1-t)^n}\)

对比外代数的 Poincare 级数 \(\sum_{k=0}^{n} \dim \Lambda^k(V) \cdot t^k = (1+t)^n\)。一个是 \(1/(1-t)^n\),一个是 \((1+t)^n\)——在物理中对应**玻色子**(对称,可以占据同一状态)和**费米子**(反对称,Pauli 不相容原理)。

练习

  1. (开放思考题) 为什么对称代数 \(S(V)\) 是无穷维的(\(\dim S^k(V) > 0\) 对所有 \(k\)),而外代数 \(\Lambda(V)\) 是有限维的(\(\Lambda^k = 0\)\(k > n\))?用 \(v \wedge v = 0\)\(v \cdot v = v^2 \neq 0\) 给出直觉解释。

§22 Clifford 代数与 Spin 群 ⭐⭐⭐

§22.1 动机:量子化外代数

外代数 \(\Lambda(V)\) 满足 \(v \wedge v = 0\)(平方为零)。但如果向量有"长度"(二次型 \(q\)),我们可以修改这个关系为 \(v \cdot v = q(v) \cdot 1\)。这就是 Clifford 代数——它把度量信息编码进代数乘法中。

§22.2 定义

定义:给定二次型 \(q: V \to F\)Clifford 代数

\[ \operatorname{Cl}(V, q) = T(V) / \langle v \otimes v - q(v) \cdot 1 : v \in V \rangle \]
  • \(q \equiv 0\) 时,\(\operatorname{Cl}(V,0) = \Lambda(V)\)(外代数是 Clifford 代数的特例)。
  • \(q\) 非退化时,Clifford 代数"量子化"了外代数。

乘法关系:选择 \(q\)-正交基 \(\{e_1,\ldots,e_n\}\)\(q(e_i) = q_i\)),则

\[ e_i^2 = q_i, \quad e_i e_j = -e_j e_i \quad (i \neq j) \]

基和维数与外代数相同(\(2^n\) 维),但乘法不同。

§22.3 四元数作为 Clifford 代数

\(\operatorname{Cl}^+(3,0)\)\(\operatorname{Cl}(\mathbb{R}^3, |\cdot|^2)\) 的偶子代数)同构于四元数 \(\mathbb{H}\),通过

\[ i \leftrightarrow -e_2 e_3, \quad j \leftrightarrow -e_3 e_1, \quad k \leftrightarrow -e_1 e_2 \]

验证:\(i^2 = (-e_2 e_3)^2 = e_2 e_3 e_2 e_3 = -e_2 e_2 e_3 e_3 = -(+1)(+1) = -1\)。类似地 \(j^2 = k^2 = -1\)\(ij = k\) 等。

§22.4 对偶四元数与 \(SE(3)\)

四元数描述旋转 \(SO(3)\),而**对偶四元数**(dual quaternions)描述刚体运动 \(SE(3)\)(旋转+平移)。

对偶数是形如 \(a + \varepsilon b\) 的数,其中 \(\varepsilon^2 = 0\)\(\varepsilon\) 是"无穷小量",类似于 Taylor 展开的一阶项)。对偶四元数 \(\hat{q} = q + \varepsilon q'\)\(q\) 是旋转四元数,\(q'\) 编码平移信息。

表示方法 描述的群 参数数 约束数 自由度
四元数 \(q \in \mathbb{H}\), $ q =1$ \(SO(3)\) 4
对偶四元数 \(\hat{q}\) \(SE(3)\) 8 2 6
\(4 \times 4\) 齐次矩阵 \(SE(3)\) 16 10 6

对偶四元数在航天器姿态和位置控制中广泛使用(Han et al. 2008),因为它避免了齐次矩阵的冗余参数化,同时支持高效的插值(ScLERP)。

§22.5 Spin 群与双重覆盖

\(\operatorname{Spin}(n) \subseteq \operatorname{Cl}^+(n,0)\) 是 Clifford 代数偶子代数中的一个群,满足:

\[ \operatorname{Spin}(n) \xrightarrow{2:1} SO(n) \]

双重覆盖意味着 \(SO(n)\) 中的每个旋转对应 \(\operatorname{Spin}(n)\) 中的**两个**元素(\(q\)\(-q\))。

\(n=3\) 的具体情形\(\operatorname{Spin}(3) \cong SU(2) \cong\) 单位四元数。旋转 \(R \in SO(3)\) 对应单位四元数 \(q = \cos(\theta/2) + \sin(\theta/2)(n_1 i + n_2 j + n_3 k)\)\(-q\)

\[ R(v) = qvq^{-1} = (-q)v(-q)^{-1} \]

其中 \(v\) 视为纯虚四元数。

应用视角:四元数法(SLERP 插值、无万向锁姿态控制)、对偶四元数(\(SE(3)\) 的描述)、motor 代数(6-DOF 螺旋运动)——这些机器人学工具的数学本质都是 Clifford 代数。

⚠️ 常见陷阱

💡 概念误区 14:以为四元数"只是"另一种旋转表示 新手想法:四元数和旋转矩阵本质上一样,只是换了一种写法。 实际上:四元数 \(q\)\(-q\) 表示同一个旋转——这个 \(2:1\) 对应反映了 \(SO(3)\) 的基本群 \(\pi_1(SO(3)) = \mathbb{Z}/2\)。Spin 群 \(\operatorname{Spin}(3) \cong SU(2)\)\(SO(3)\) 的**万有覆盖**——它是单连通的。这个拓扑差异在控制中有实际后果:连续姿态控制不可避免地有"不连续点"(拓扑障碍),而在 \(SU(2)\) 上可以做全局连续控制。

🧠 思维陷阱 9:以为 Clifford 代数只是代数好奇心 新手想法\(\operatorname{Cl}(V,q)\) 太抽象了,实际用不到。 实际上:Clifford 代数统一了标量、向量、二向量、三向量等所有几何对象。在**几何代数**(Geometric Algebra)框架下,旋转、反射、投影、对偶都可以用 Clifford 乘法统一表达。Dorst-Fontijne-Mann 的 Geometric Algebra for Computer Science 和 Selig 的 Geometric Fundamentals of Robotics 展示了这些应用。

练习

  1. (推导题)\(\operatorname{Cl}(\mathbb{R}^2, |\cdot|^2)\) 中,验证 \(e_1 e_2\) 满足 \((e_1 e_2)^2 = -1\)。这意味着 \(\operatorname{Cl}(\mathbb{R}^2) \cong\)
  2. (跨章综合题) 结合 40_谱定理SVD与极分解.md 的极分解和本章的 Clifford 代数,解释为什么单位四元数参数化了 \(SU(2) \cong \operatorname{Spin}(3)\)。(提示:\(SU(2)\)\(\mathbb{R}^4\) 中的单位球 \(S^3\)。)

本章常见误解汇总

编号 误解 正确理解
1 多线性映射 \(=\) 线性映射 多线性是逐变量线性,严格强于整体线性
2 合同变换 \(=\) 相似变换 相似保特征值,合同保签名——两个不同不变量
3 \(v \otimes w\) 只是形式符号 蕴含商空间的全部双线性关系
4 所有张量都可分解为 \(v \otimes w\) 不可分解张量对应高秩映射(如单位阵)
5 Kronecker 积 \(=\) 张量积 Kronecker 积是张量积在选定基后的矩阵表示
6 \(V^{\otimes k}\) 总分解为对称+反对称 \(k \ge 3\) 时有更多不可约分量
7 \(v \wedge w = 0\) \(\Rightarrow\) \(v=0\)\(w=0\) 等价于 \(v,w\) 线性相关
8 叉积在任何维度都存在 只在 \(n=3\)\(n=7\)
9 行列式只是计算工具 它是体积放大率和定向的几何量
10 叉积是坐标无关的 楔积是,但叉积需要 Hodge 星(依赖度量和定向)
11 Hodge 星是纯代数运算 需要度量和定向
12 Einstein 约定中两个下标也可缩并 需一上一下配对(无度量时)
13 升降指标只是乘以矩阵 改变张量类型(向量 \(\leftrightarrow\) 余向量)
14 四元数只是另一种旋转表示 反映 \(SO(3)\) 的双重覆盖和拓扑性质

本章小结

符号表

符号 含义 首次出现
\(\operatorname{Mult}(V_1,\ldots,V_k;W)\) \(k\)-线性映射空间 §1.4
\(B: V \times V \to F\) 双线性型 §2.2
\((p,q,z)\) Sylvester 签名 §2.5
\(V \otimes W\) 张量积 §3.2
\(v \otimes w\) 简单张量 §3.4
\(\otimes_{\mathrm{Kr}}\) Kronecker 积 §4.2
\(T^p_q(V)\) \((p,q)\)-型张量空间 §5.4
\(\operatorname{Sym}^k(V)\) 对称 \(k\)-张量空间 §6.2
\(\Lambda^k(V)\) 反对称 \(k\)-张量空间(第 \(k\) 外幂) §6.2
\(T(V)\) 张量代数 §7.1
\(\alpha \wedge \beta\) 楔积 §8.2
\(\Lambda(V)\) 外代数 §9.1
\(\det(T)\) 行列式(外代数定义) §11.2
\(\operatorname{adj}(A)\) 伴随矩阵(经典) §14.1
\(u \times v\) 叉积 §15.2
\(\iota_v\) 内积(缩并)算子 §16.1
\(*\) Hodge 星算子 §17.2
\(v^i\), \(\alpha_i\) 逆变/协变分量 §18.2
\(g_{ij}\), \(g^{ij}\) 度量张量及其逆 §19.1
\(\flat\), \(\sharp\) 音乐同构(降/升指标) §19.2
\(\Gamma^i_{jk}\) Christoffel 符号 §19.3
\(S(V)\) 对称代数 §21.1
\(\operatorname{Cl}(V,q)\) Clifford 代数 §22.2
\(\operatorname{Spin}(n)\) Spin 群 §22.4

定理速查表

定理/公式 一句话说明 对应节
张量积泛性质 双线性映射 \(\leftrightarrow\) 张量积上的线性映射 §3.2
\(\dim(V \otimes W) = \dim V \cdot \dim W\) 张量积的维数是因子维数之积 §3.5
\(V^* \otimes W \cong \operatorname{Hom}(V,W)\) 线性映射空间是张量积 §3.7
Sylvester 惯性律 实对称双线性型的签名是基变换不变量 §2.5
\(\dim \Lambda^k(V) = \binom{n}{k}\) \(k\) 外幂的维数 §10.1
分级反交换律 \(\alpha \wedge \beta = (-1)^{pq}\beta \wedge \alpha\) §8.3
\(\det(T) = \Lambda^n(T)\) 的标量 行列式的无坐标定义 §11.2
\(\det(AB) = \det(A)\det(B)\) 乘法性,由 \(\Lambda^n\) 函子性一行证明 §12.1
\(u \times v = *(u \wedge v)\) 叉积 \(=\) 楔积 + Hodge 星 §15.2
Hodge 星是等距 \(\langle *\omega, *\eta \rangle = \langle \omega, \eta \rangle\) §17.4
\(\operatorname{Spin}(3) \cong SU(2)\) 单位四元数双重覆盖 \(SO(3)\) §22.4

知识点总表

编号 知识点 核心要点 对应节 难度
1 多线性映射 逐变量线性,维数乘法 §1 ⭐⭐
2 双线性型 合同变换,Sylvester 签名 §2 ⭐⭐
3 张量积构造 泛性质,自由空间/商空间 §3 ⭐⭐
4 Kronecker 积 张量积的矩阵表示 §4 ⭐⭐
5 张量空间 \(T^p_q(V)\) 逆变/协变秩 §5 ⭐⭐
6 对称/反对称分解 \(S_k\) 作用,\(\operatorname{Sym}^k\), \(\Lambda^k\) §6 ⭐⭐
7 张量代数 \(T(V)\) 自由结合代数 §7 ⭐⭐⭐
8 楔积 反对称乘积,\(v \wedge v = 0\) §8 ⭐⭐
9 外代数 \(\Lambda(V)\) 分次代数,\(\dim = 2^n\) §9 ⭐⭐
10 外幂的基与维数 \(\binom{n}{k}\),维数对偶性 §10 ⭐⭐
11 行列式(外代数) \(\Lambda^n\) 上的标量,无坐标 §11 ⭐⭐
12 行列式性质 乘法性一行证明 §12 ⭐⭐
13 体积与定向 $ \det $ = 体积放大率
14 Cramer 法则 理论价值,非数值 §14 ⭐⭐⭐
15 叉积 \(=\) 楔积 + Hodge 星 三维特有,维数偶然 §15 ⭐⭐
16 内积算子 \(\iota_v\) 反导性,Cartan 公式预告 §16 ⭐⭐⭐
17 Hodge 星 依赖度量和定向,等距 §17 ⭐⭐
18 Einstein 约定 上下指标配对缩并 §18 ⭐⭐
19 度量张量 升降指标,音乐同构 §19 ⭐⭐
20 缩并与迹 迹 = 缩并,基不变 §20 ⭐⭐
21 对称代数 \(S(V)\) 多项式环,玻色-费米对偶 §21 ⭐⭐⭐
22 Clifford 代数 四元数,Spin 群,双重覆盖 §22 ⭐⭐⭐

累积项目:本章新增模块

项目名称:手写张量计算库

本章为累积项目新增以下模块:

模块 功能 依赖
TensorProduct 两个向量空间的张量积计算 Ch1 基础结构
ExteriorAlgebra 楔积、外幂基计算 TensorProduct
Determinant 用外代数计算行列式 ExteriorAlgebra
HodgeStar Hodge 星算子 ExteriorAlgebra + Ch2 内积
IndexNotation 指标升降、缩并 TensorProduct + Ch2 内积

本章新增任务:实现 \(\Lambda^k(\mathbb{R}^n)\) 的基生成和楔积计算,用它验证 \(\det(AB) = \det(A)\det(B)\)


延伸阅读

入门级 ⭐: - Axler, Linear Algebra Done Right, 4th edition, Chapter 10 —— 外代数最友好的入门。 - Spivak, Calculus on Manifolds, §4 —— 微分形式视角的简洁处理。

核心级 ⭐⭐: - Roman, Advanced Linear Algebra (GTM 135), §11, §14--§16 —— 张量积和外代数的标准教材。 - Halmos, Finite-Dimensional Vector Spaces, §23--§33 —— 经典抽象处理。 - Conrad, "Tensor Products I/II" (lecture notes) —— 张量积泛性质最清晰的讲解。

进阶级 ⭐⭐⭐: - Greub, Multilinear Algebra —— 多线性代数的百科全书。 - Lang, Algebra (GTM 211), §XIII, §XVI, §XIX —— 代数视角的系统处理。 - Lee, Introduction to Smooth Manifolds, §11--§16 —— 流形上的张量和微分形式。 - Bowen-Wang, Introduction to Vectors and Tensors, Vol. 1--2 —— 工程导向的张量分析。

研究级 ⭐⭐⭐⭐: - Lawson-Michelsohn, Spin Geometry, Chapter 1 —— Clifford 代数和 Spin 群。 - Selig, Geometric Fundamentals of Robotics, Chapter 9--10 —— 机器人中的几何代数。 - Dorst-Fontijne-Mann, Geometric Algebra for Computer Science —— 计算机科学中的应用。


本章与后续章节的关系

后续章节 与本章的关系 本章哪个知识点为其铺垫
70_点集拓扑.md 度量空间的结构 §2(双线性型诱导的度量)
80_抽象代数.md 群、环、代数的例子 §7(张量代数)、§22(Clifford 代数)
第一层:微分几何 微分形式 \(\Omega^k(M)\)、度量张量 §8--§10(外代数)、§19(度量)
第一层:李群 \(\mathfrak{so}(3)\) 与帽映射 §15(叉积与 \(\Lambda^2\))、§22(Spin 群)
第一层:Riemann 几何 Christoffel 符号、测地方程 §19(度量张量)、§20(缩并)
第二层:几何控制 Cartan 魔法公式、端口 Hamilton §16(\(\iota_v\))、§17(Hodge 星)
第二层:动力学 质量矩阵、Coriolis 项 §19(Riemann 度量)

故障排查手册

症状 可能原因 排查步骤 相关章节
张量积维数算错 混淆 \(\dim(V \times W)\)\(\dim(V \otimes W)\) 1. 确认是加法还是乘法 2. 检查 \(\dim V \cdot \dim W\) §3.5
楔积符号算错 \((-1)^{pq}\) 写成 \((-1)^{p+q}\) 1. 逐步写出换位过程 2. 检查 \(p,q\) 的奇偶性 §8.3, §10.4
行列式乘法性证不出 用排列公式而非外代数 1. 回到 \(\Lambda^n\) 定义 2. 用函子性 §12.1
指标缩并结果类型错误 缩并了两个同类型指标 1. 检查一上一下配对 2. 需要度量时先升/降 §18, §20
Hodge 星计算结果符号错 忘记 \(\operatorname{sgn}(I,I^c)\) 1. 写出完整排列 2. 数换位次数 §17.3

研究实践建议

给初学者

  1. 先掌握 §1--§3(多线性映射、张量积构造、维数定理),这是全章的基础。不理解泛性质没关系——先记住"双线性 \(\leftrightarrow\) 线性"的对应,用几次自然就懂了。
  2. 外代数(§8--§12)是投入产出比最高的部分。行列式的外代数定义(§11)和乘法性的一行证明(§12)是"顿悟时刻"——一旦理解,对行列式的认识会永久升级。
  3. 指标记号(§18--§19)需要大量练习。理论上简单,但手算容易犯错。建议对照具体例子(\(2 \times 2\)\(3 \times 3\) 矩阵)做升降指标和缩并练习。
  4. Clifford 代数(§22)可以后看。如果你暂时不涉及四元数或 Spin 群,可以先跳过。

给有经验者

  1. 关注泛性质的范畴论视角(§3.2--§3.3)。泛性质是现代数学的基本工具——理解它在张量积中的应用,有助于理解其他代数构造(如局部化、完备化、诱导表示)。
  2. 深入 Hodge 星与 Maxwell 方程(§17.5)。Hodge 分解 \(\Omega^k = d\Omega^{k-1} \oplus d^*\Omega^{k+1} \oplus \mathcal{H}^k\)(精确形式+余精确形式+调和形式)是流形上 PDE 理论的核心。
  3. 探索几何代数在机器人学中的应用。Selig 的书展示了如何用 Clifford 代数统一处理旋转、平移、螺旋运动——比传统的齐次变换矩阵更优雅。

进一步学习路径

方向 下一步 本章基础
微分形式 Lee Smooth Manifolds Ch. 14--16 §8--§10, §16--§17
Riemann 几何 do Carmo Riemannian Geometry §19(度量张量)
辛几何/Hamilton 力学 Abraham-Marsden Foundations of Mechanics §2(辛形式), §17(Hodge 星)
代数拓扑 Hatcher Algebraic Topology §10(外幂的维数), §9(分次代数)
几何代数 Dorst et al. GA for CS §22(Clifford 代数)
表示论 Fulton-Harris Representation Theory §6(\(S_k\) 作用), §7(张量代数)

跨章综合练习

以下练习需要综合前几章(20_向量空间与线性变换30_内积空间与伴随算子40_谱定理SVD与极分解)和本章的知识。

  1. (综合题:SVD 与外代数)\(T: V \to W\) 的 SVD 为 \(T = U\Sigma V^*\),奇异值为 \(\sigma_1 \ge \cdots \ge \sigma_r > 0\)。证明 \(\Lambda^k(T)\) 的奇异值恰好是 \(\{\sigma_{i_1}\cdots\sigma_{i_k} : 1 \le i_1 < \cdots < i_k \le r\}\)。特别地,\(\Lambda^r(T)\) 的唯一奇异值是 \(\sigma_1\cdots\sigma_r = |\det(T)|\)(当 \(V=W\)\(r=n\) 时)。(在草稿纸上完成。需综合 §A2c 的 SVD 和本章 §11 的行列式定义。)

  2. (综合题:内积与 Hodge 星)\(V = \mathbb{R}^3\) 配标准内积。验证 Hodge 星将 \(1\)-形式的"梯度"、\(2\)-形式的"旋度"、\(3\)-形式的"散度"统一为外微分 \(d\) 的不同伪装。具体地:\(\nabla f = \sharp(df)\)\(\nabla \times F = \sharp(*d(\flat(F)))\)\(\nabla \cdot F = *d*(\flat(F))\)。这里 \(\flat\)\(\sharp\) 是 §19 的音乐同构。(需综合 §A2b 的内积、§17 的 Hodge 星、§19 的升降指标。)

  3. (综合题:四元数与极分解) 单位四元数 \(q \in SU(2)\) 通过 \(R(v) = qvq^{-1}\) 给出旋转。设 \(q = a + bi + cj + dk\),写出对应的 \(3 \times 3\) 旋转矩阵 \(R\) 的显式公式。然后用 40_谱定理SVD与极分解.md 的极分解验证:任意可逆 \(3 \times 3\) 矩阵 \(A = R|A|\) 中的 \(R\) 可以用单位四元数表示(当 \(\det(A)>0\) 时)。

  4. (综合题:Gram 行列式与 Yoshikawa 可操作度) 设机械臂 Jacobian \(J\)\(3 \times 6\) 矩阵。Yoshikawa 可操作度定义为 \(w = \sqrt{\det(JJ^\top)}\)。证明 \(w\) 等于 \(J\) 的六个列向量在 \(\mathbb{R}^3\) 中形成的"广义体积",并用 Gram 行列式公式 \(\det(JJ^\top) = \sum_{|I|=3} (\det J_I)^2\)\(J_I\)\(J\)\(3 \times 3\) 子矩阵)给出 \(w\) 的组合解释。


版本信息速查

工具/库 版本 用途
Eigen(C++) 3.4+ 矩阵运算、Kronecker 积验证
NumPy(Python) 1.24+ numpy.kron 计算 Kronecker 积
SymPy(Python) 1.12+ 符号张量积和楔积计算
manif(C++) 0.0.4+ Lie 群/Lie 代数运算(本章 §15 的帽映射)
SageMath 10.0+ 符号化外代数和张量积(教学验证)
Mathematica 14.0+ TensorProduct, WedgeProduct 函数

全章回顾:本章从线性跳到多线性,建立了张量积(§3)和外代数(§8--§10)两大代数工具。用外代数给出了行列式的无坐标定义(§11),一行证明了乘法性(§12),揭示了叉积的维数偶然性本质(§15)。通过指标记号(§18--§20)桥接了抽象代数与物理/工程的计算实践。最后以 Clifford 代数(§22)收尾,连接了四元数与 Spin 群。这些工具在下一层(微分几何、李群)中将"逐点黏在流形上",成为微分形式、联络和曲率的代数基础。

给读者的一句话:如果 A2a--A2d 是学会了"读写",那么 A2e 就是学会了"修辞"——同样的向量、矩阵、内积,在张量与外代数的视角下获得了内蕴、协变、几何化的新表达。掌握这套语言,机器人学的微分几何就不再神秘。