向量空间、线性变换与对偶空间¶

前置自测¶

📋 前置自测（答不出 $\geq 2$ 题 → 先回 §A1 复习集合论与数理逻辑）

Q1. 什么是域（field）？请写出域的三条核心公理（加法群、乘法群、分配律），并举一个"看起来像域但不是域"的例子。

Q2. 设 $\sim$ 是集合 $S$ 上的关系。写出等价关系的三条公理（自反、对称、传递）。$S/{\sim}$ 表示什么？为什么商集上的运算需要"良定义性验证"？

Q3. 陈述 Zorn 引理：如果偏序集 $(P, \leq)$ 满足什么条件，就能得出什么结论？它与选择公理（AC）的关系是什么？

Q4. 什么是 Kronecker delta $\delta_{ij}$？写出其定义。

Q5. 解释"单射""满射""双射"的含义，并说明在有限集上，单射与满射的关系。

本章目标¶

学完本章后，你应该能够：

**陈述并运用**向量空间的八条公理，判定给定集合是否构成向量空间
**掌握**子空间、直和、商空间的定义与基本性质，会计算维数公式
**理解**基与维数的理论基础，包括 Steinitz 替换引理和 Zorn 引理的角色
**定义**线性映射并证明其基本性质，包括核、像、秩-零度定理
**推导**矩阵表示与基变换公式，理解相似矩阵的不变量
**构建**对偶空间 $V^*$、对偶基和对偶映射 $T^t$ 的完整理论
区分 $V \cong V^*$（非自然、依赖基的选择）与 $V \cong V^{**}$（自然、由评估映射给出）的本质差异

本章知识导航¶

本章按**四幕结构**展开，共 25 个核心概念模块。四幕之间存在严格的依赖关系——每一幕只使用前面已铺好的工具：

幕	内容	核心概念	与后续的关系
第一幕：公理基础	§1-§5	域、向量空间公理、子空间、直和、商空间	为维数理论提供语言
第二幕：维数理论	§6-§11	线性组合、Steinitz 引理、基与维数、Zorn 引理	为线性变换提供坐标
第三幕：线性变换	§12-§18	线性映射、核/像、秩-零度、矩阵表示	为对偶理论提供变换
第四幕：对偶理论	§19-§25	对偶空间、对偶基、自然同构、零化子	直接通向李代数与动力学

推荐阅读路径：严格按幕的顺序阅读。第一幕和第二幕是地基——跳过它们会导致后续每个证明都看不懂。第三幕是核心工具箱。第四幕是本章最深刻的内容，也是通向微分几何和机器人动力学的桥梁。

第一幕: 公理基础           第二幕: 维数理论
§1(域) → §2(空间公理)      §6(线性组合) → §7(Steinitz)
  ↓         ↓                              ↓
§3(子空间) → §4(直和)      §8(基/维数) → §9(Zorn) → §10(基数)
  ↓                                        ↓
§5(商空间)                 §11(坐标/分类)
  ↓                           ↓
  └──────────→ 第三幕: 线性变换 ←──────────┘
               §12(定义) → §13(Hom/End) → §14(核/像)
                              ↓
               §15(秩-零度) → §16(同构定理) → §17(矩阵) → §18(不变子空间)
                              ↓
               第四幕: 对偶理论
               §19(V*) → §20(对偶基) → §21(无限维) → §22(V**)
                              ↓
               §23(自然性) → §24(对偶映射) → §25(零化子)

前置知识桥接¶

本章建立在 §A1（集合论与数理逻辑）的基础之上。回顾 §A1 的几个关键结论，它们将在本章反复使用：

域的构造（§A1.10）：我们在 §A1 中已经构造了 $\mathbb{Q}$、$\mathbb{R}$、$\mathbb{C}$，并验证了它们满足域的公理。本章将在一般域 $F$ 上展开理论，必要时指定 $F = \mathbb{R}$ 或 $\mathbb{C}$
Zorn 引理（§A1.9）：我们在 §A1 中已证明 Zorn 引理与选择公理（AC）等价。本章将在 §9 中用 Zorn 引理证明"任意向量空间有基"
等价关系与商集（§A1.5.4）：商空间 $V/W$ 的构造本质上是在向量空间上定义等价关系后取商集
基数理论（§A1.8）：Cantor 定理 $2^\kappa > \kappa$ 将在 §21 中解释为什么无限维空间的对偶空间"大得多"

如果跳过本章会怎样¶

无法理解李群与李代数：$\mathfrak{so}(3)$ 是一个向量空间，$\exp$ 映射是线性映射的推广。不懂向量空间公理，就无法理解为什么 $\mathfrak{so}(3)$ 上的加法和标量乘法有意义
无法理解机器人动力学中的对偶性：twist 和 wrench 分别住在 $\mathfrak{se}(3)$ 和 $\mathfrak{se}(3)^*$ 中。不懂对偶空间，就不知道 Jacobian 转置 $\tau = J^T \mathcal{F}$ 的数学本质

预计阅读时间¶

阅读方式	时间	适合谁
精读（含练习和推导）	12-15 小时	需要从零建立严格理解的读者
速读（跳过 §9-§10 和 §21 的无限维部分）	6-8 小时	有线性代数基础、重点学对偶理论的读者
速查（只看定理速查表和符号表）	30 分钟	遇到具体问题时回来查阅

符号约定¶

在开始正文之前，统一本章的符号约定。这些约定贯穿全章，遇到其他教材的不同记法时，请回来查阅此表。

符号	含义	备注
$F$	任意域	除非显式指定 $F = \mathbb{R}$ 或 $\mathbb{C}$
$V, W, U$	$F$-向量空间
$V^*$	对偶空间 $\mathrm{Hom}(V, F)$	Axler 记作 $V'$，本章用 $V^*$
$T^t$	对偶映射（转置）	Axler 记作 $T'$，本章用 $T^t$
$\ker T$	核（kernel）	Axler 记作 $\mathrm{null}\, T$
$\mathrm{im}\, T$	像（image）	Axler 记作 $\mathrm{range}\, T$
$\langle f, v \rangle$	对偶配对 $f(v)$	与机器人学中 $\langle \mathcal{F}, \mathcal{V} \rangle$ 一致
$\delta_{ij}$	Kronecker delta	$i=j$ 时为 $1$，否则为 $0$

第一幕：公理基础¶

第一幕的目标是建立向量空间理论的语言。我们从域的回顾出发，定义向量空间的八条公理，然后研究子空间、直和、商空间这三种"从已有空间构造新空间"的方式。这些构造是后续一切理论的基石。

§1 域的回顾与约定 ⭐¶

动机¶

为什么要从域开始？因为向量空间的定义中有两种"乘法"——向量之间的加法和标量与向量的乘法。这里的"标量"不是随意选择的数——它们必须来自一个具有良好代数结构的集合。这个集合就是**域**。

如果标量集合不构成域，会发生什么？考虑整数 $\mathbb{Z}$。如果我们用整数做标量，那么给定一个非零向量 $v$，我们能得到 $2v, 3v, -v$ 等，但**无法得到** $\frac{1}{2}v$——因为 $\frac{1}{2} \notin \mathbb{Z}$。这意味着许多基本操作（比如"把向量缩放到单位长度"）变得不可能。正是域中"每个非零元素都有乘法逆元"这一性质，保证了标量乘法的充分灵活性。

域的公理化定义¶

域（field）是一个集合 $F$，配备两个二元运算——加法 $+$ 和乘法 $\cdot$——以及两个特殊元素 $0_F$（加法单位元）和 $1_F$（乘法单位元，$1_F \neq 0_F$），满足：

$(F, +, 0_F)$ 构成**Abel 群**：加法结合、交换、有零元、有逆元
$(F \setminus \{0\}, \cdot, 1_F)$ 构成**Abel 群**：乘法结合、交换、有单位元、非零元素有逆元
分配律：$a(b + c) = ab + ac$ 对所有 $a, b, c \in F$ 成立

这三条公理的组织方式值得注意：前两条说的是 $F$ 在加法和乘法下各自具有"群结构"，第三条则把这两个结构"焊接"在一起。分配律是加法与乘法之间唯一的联系——如果没有它，加法和乘法就是两个互不相关的运算。

常用域与非例子¶

集合	是否为域	原因
$\mathbb{Q}$（有理数）	是	每个非零有理数 $p/q$ 的逆元为 $q/p$
$\mathbb{R}$（实数）	是	$\mathbb{Q}$ 的完备化，保持域性质
$\mathbb{C}$（复数）	是	$\mathbb{R}$ 的代数闭包
$\mathbb{F}_p$（$p$ 素数）	是	$\mathbb{Z}/p\mathbb{Z}$，Fermat 小定理保证逆元
$\mathbb{Z}$（整数）	否	$2$ 没有乘法逆元（$1/2 \notin \mathbb{Z}$）
$\mathbb{F}_4 = \mathbb{F}_{2^2}$	是	四元素域，$2 = 0$

特征（characteristic）：域 $F$ 的特征 $\mathrm{char}(F)$ 是使 $\underbrace{1 + 1 + \cdots + 1}_{p} = 0$ 成立的最小正整数 $p$；若不存在这样的 $p$，则 $\mathrm{char}(F) = 0$。

$\mathrm{char}(\mathbb{Q}) = \mathrm{char}(\mathbb{R}) = \mathrm{char}(\mathbb{C}) = 0$
$\mathrm{char}(\mathbb{F}_p) = p$
特征 $2$ 时 $-1 = 1$，这会导致某些二次型理论退化——但在机器人学中几乎不会遇到

机器人数学中域的选择¶

在 SLAM、运动规划和动力学计算中，标准选择是 $F = \mathbb{R}$，因为物理量（位移、速度、力等）都是实数。但有两个重要的例外：

**控制理论的频域分析**需要 $\mathbb{C}$：传递函数 $G(s)$ 中的 $s$ 是复数，极点和零点可能是复数。谱定理的完整陈述也需要在 $\mathbb{C}$ 上工作
**编码理论与组合优化**有时涉及有限域 $\mathbb{F}_p$，但在机器人学中罕见

本章尽量在一般域 $F$ 上展开理论。当结论只在 $\mathbb{R}$ 或 $\mathbb{C}$ 上成立时，会显式说明。

⚠️ 常见陷阱¶

💡 概念误区 1：混淆"整环"与"域"

错误想法：$\mathbb{Z}$ 没有零因子（$ab = 0 \Rightarrow a = 0$ 或 $b = 0$），所以它是域。

实际上：没有零因子只说明 $\mathbb{Z}$ 是**整环**（integral domain），域还要求非零元素有乘法逆元。$\mathbb{Z}$ 缺少这一条：$2 \in \mathbb{Z}$ 没有乘法逆元。

为什么重要：如果在 $\mathbb{Z}$ 上定义"向量空间"，得到的是**模**（module）而非向量空间。模的理论远比向量空间复杂——例如，模不一定有基。

🧠 思维陷阱 1：认为"实数就够了，不需要抽象的域"

新手想法：机器人学用的都是实数，为什么要在一般域 $F$ 上建立理论？

实际上：在一般域上工作的好处是**看清哪些性质依赖域的特殊结构**。例如，"对称矩阵的特征值都是实数"在 $\mathbb{R}$ 上成立，但这里用到了 $\mathbb{R}$ 的有序性——在一般域上不成立。区分"通用结论"和"特殊结论"是数学成熟度的标志。

正确思维：先在 $F$ 上建立通用理论，再根据需要添加 $F = \mathbb{R}$ 或 $F = \mathbb{C}$ 的特殊结论。

练习¶

练习 1.1（⭐）. 证明：有限域的特征必为素数。（提示：若 $\mathrm{char}(F) = n = ab$，考虑 $(1 + 1 + \cdots)$ 的因子分解。）

练习 1.2（⭐⭐）. 证明 $\mathbb{C}$ 不是有序域。（提示：假设存在全序 $<$ 满足域的有序公理，考虑 $i^2 = -1$ 导致的矛盾。）

§2 向量空间的公理化定义 ⭐¶

动机¶

我们已经熟悉了 $\mathbb{R}^2$ 和 $\mathbb{R}^3$ 中的向量——它们可以相加、可以被实数缩放，满足平行四边形法则。但在数学和工程中，我们会遇到大量"看起来不像箭头但行为像向量"的对象：多项式可以相加和缩放、矩阵可以相加和缩放、连续函数可以相加和缩放。向量空间的公理化定义要回答的问题是：什么样的集合配上什么样的运算，就"足够像" $\mathbb{R}^n$ 以至于 $\mathbb{R}^n$ 中的所有线性代数结论都自动成立？

如果不公理化会怎样¶

如果我们只在 $\mathbb{R}^n$ 中做线性代数，每次遇到新的"向量般"的对象（多项式空间、矩阵空间、函数空间），都需要从头验证所有定理。公理化的意义在于：一次证明，处处适用。只要验证新对象满足八条公理，所有在抽象向量空间中证明的定理自动适用。

类比：这就像编程中的接口（interface）。向量空间公理定义了一个"接口"，任何实现了这个接口的具体数据结构（$\mathbb{R}^n$、多项式、矩阵等）都可以使用所有基于该接口编写的"算法"（定理）。这个类比在"接口定义行为契约"这一点上是准确的，但**不像**的地方在于：编程接口可以有多种不等价的实现，而有限维向量空间本质上只有一种（$F^n$，见分类定理 §11）。

历史注记¶

向量空间的公理化始于 Peano（1888）的 Calcolo geometrico，但现代形式由 Weyl（1918）的 Raum, Zeit, Materie 和 Banach（1920s）的工作确立。有趣的是，Peano 的定义比现在的标准版本更广——他允许非交换的标量乘法。

定义与八条公理¶

定义. 设 $F$ 为域。一个 $F$-向量空间（vector space over $F$）是一个集合 $V$（其元素称为**向量**），配备两个运算：

向量加法 $+: V \times V \to V$
标量乘法 $\cdot: F \times V \to V$

满足以下八条公理：

编号	公理	直觉
V1	$(u + v) + w = u + (v + w)$	加法结合律
V2	$u + v = v + u$	加法交换律
V3	$\exists\, 0_V \in V: 0_V + v = v$	存在零向量
V4	$\forall v, \exists (-v): v + (-v) = 0_V$	存在加法逆元
V5	$a(bv) = (ab)v$	标量乘法结合律
V6	$1_F \cdot v = v$	标量乘法单位元
V7	$a(u + v) = au + av$	标量对向量分配律
V8	$(a + b)v = av + bv$	向量对标量分配律

阶段小结：公理 V1-V4 说的是 $(V, +)$ 构成一个 Abel 群（与域定义中加法群的要求完全类同）。公理 V5-V8 描述了标量乘法如何与加法"兼容"。注意 V5 中等号左边的 $b$ 乘 $v$ 是标量乘法（$F \times V \to V$），而 $a$ 乘 $bv$ 也是标量乘法；等号右边的 $ab$ 是域中的乘法（$F \times F \to F$）。

更精炼地说：$F$-向量空间就是 Abel 群 $(V, +)$ 配上域 $F$ 的一个满足 V5-V8 的**标量作用**。

从公理推出的基本性质¶

以下性质**不是额外的公理**，而是从八条公理中严格推出的。这种推导训练对理解公理体系的"力量"至关重要。

命题 2.1. $0_F \cdot v = 0_V$ 对所有 $v \in V$ 成立。

证明. 我们需要证明 $0_F \cdot v$ 是加法中的零元素。

\[0_F \cdot v = (0_F + 0_F) \cdot v = 0_F \cdot v + 0_F \cdot v \quad \text{(V8)}\]

两边加上 $-(0_F \cdot v)$（公理 V4 保证逆元存在）：

\[0_V = 0_F \cdot v \quad \square\]

注意这个证明中每一步用了哪条公理：V8（分配律）和 V4（逆元的存在性）。如果没有 V4，我们无法"两边消去" $0_F \cdot v$。

命题 2.2. $(-1_F) \cdot v = -v$ 对所有 $v \in V$ 成立。

证明.

\[v + (-1_F) \cdot v = 1_F \cdot v + (-1_F) \cdot v = (1_F + (-1_F)) \cdot v = 0_F \cdot v = 0_V\]

第一个等号用了 V6，第二个用了 V8，第三个用了域中 $1 + (-1) = 0$，第四个用了命题 2.1。由加法逆元的唯一性（Abel 群的性质），得 $(-1_F) \cdot v = -v$。 $\square$

命题 2.3. $a \cdot 0_V = 0_V$ 对所有 $a \in F$ 成立。

证明. $a \cdot 0_V = a \cdot (0_V + 0_V) = a \cdot 0_V + a \cdot 0_V$（V7），两边消去得 $0_V = a \cdot 0_V$。 $\square$

命题 2.4. 若 $av = 0_V$，则 $a = 0_F$ 或 $v = 0_V$。

证明. 设 $a \neq 0_F$。由于 $F$ 是域，$a$ 有乘法逆元 $a^{-1}$。则：

\[v = 1_F \cdot v = (a^{-1} a) \cdot v = a^{-1} \cdot (av) = a^{-1} \cdot 0_V = 0_V\]

这里用到了 V6、V5 和命题 2.3。 $\square$

这条性质的证明揭示了**为什么标量必须来自域而非一般环**：我们需要非零标量的乘法逆元来"除以" $a$。如果标量来自环（如 $\mathbb{Z}$），这个命题就不成立——$2 \cdot v = 0$ 不能推出 $v = 0$（在 $\mathbb{Z}/4\mathbb{Z}$ 上的模中，$2 \cdot 2 = 0$ 但 $2 \neq 0$）。

基本例子¶

例 2.1（$F^n$：标准 $n$ 维向量空间）. 集合 $F^n = \{(a_1, \ldots, a_n) : a_i \in F\}$，加法和标量乘法逐分量定义。八条公理的验证直接从 $F$ 的域公理继承。

例 2.2（$F[x]_{\leq n}$：次数 $\leq n$ 的多项式）. 加法是多项式相加，标量乘法是系数逐项缩放。这是一个 $(n+1)$ 维向量空间——基为 $\{1, x, x^2, \ldots, x^n\}$。

例 2.3（$M_{m \times n}(F)$：矩阵空间）. $m \times n$ 矩阵在逐项加法和标量乘法下构成 $mn$ 维向量空间。

例 2.4（$\mathcal{C}([0,1], \mathbb{R})$：连续函数空间）. 连续函数的点态加法和标量乘法满足八条公理。这是一个**无限维**向量空间——任何有限个连续函数都不能张成所有连续函数。

例 2.5（零空间 $\{0_V\}$）. 唯一的 $0$ 维向量空间。它的唯一元素是零向量。

非例子¶

理解什么**不是**向量空间同样重要——它帮助我们理解每条公理的必要性。

非例 2.1. $\mathbb{Z}$ 不是 $\mathbb{Z}$-向量空间，因为 $\mathbb{Z}$ 不是域。（但 $\mathbb{Z}$ 是 $\mathbb{Z}$-模。）

非例 2.2. $\mathbb{R}^2$ 配上非标准标量乘法 $a \odot (x, y) := (ax, 0)$ 不满足公理 V6：$1 \odot (x, y) = (x, 0) \neq (x, y)$（当 $y \neq 0$ 时）。

非例 2.3（令人惊讶的正例）. 正实数 $\mathbb{R}_{>0}$ 配上运算 $u \oplus v := uv$（普通乘法）和 $a \odot v := v^a$（指数运算），构成 $\mathbb{R}$-向量空间。

验证：$a \odot (u \oplus v) = (uv)^a = u^a v^a = (a \odot u) \oplus (a \odot v)$（V7 成立）。零向量是 $1$（因为 $u \oplus 1 = u \cdot 1 = u$）。逆元是 $u^{-1}$（因为 $u \oplus u^{-1} = u \cdot u^{-1} = 1$）。

本质洞察：向量空间的结构与集合的"表面"运算无关，只取决于公理是否满足。$\mathbb{R}_{>0}$ 与 $\mathbb{R}$（配上标准运算）同构——同构映射是对数函数 $\log: (\mathbb{R}_{>0}, \cdot, \text{exp}) \to (\mathbb{R}, +, \cdot)$。

⚠️ 常见陷阱¶

💡 概念误区 2：混淆 $0_V$（零向量）与 $0_F$（域中的零）

错误想法：零向量和零标量是"同一个零"。

实际上：$0_V \in V$ 和 $0_F \in F$ 是完全不同的对象，住在不同的集合中。命题 2.1（$0_F \cdot v = 0_V$）恰好把它们联系起来，但它们**不是同一个东西**。

为什么重要：在 $V = M_{2 \times 2}(\mathbb{R})$ 中，$0_V$ 是 $2 \times 2$ 零矩阵，而 $0_F = 0 \in \mathbb{R}$。

🧠 思维陷阱 2：认为"只要加法和标量乘法有定义，就是向量空间"

新手想法：$\mathbb{R}^2$ 上的任何加法和标量乘法都给出向量空间。

实际上：八条公理中的每一条都是独立的约束。非例 2.2 展示了一个满足 V1-V5、V7-V8 但不满足 V6 的例子。

正确做法：每次验证向量空间时，必须逐条检查八条公理。一条不满足就不是向量空间。

练习¶

练习 2.1（⭐）. 证明零向量 $0_V$ 是唯一的。（提示：设有两个零向量 $0$ 和 $0'$，考虑 $0 + 0'$。）

练习 2.2（⭐⭐）. 验证 $\mathbb{R}_{>0}$ 配上非例 2.3 中的运算确实满足全部八条公理。特别地，明确指出零向量和每个元素的逆元。

练习 2.3（⭐⭐）. 设 $V = \{f : \mathbb{R} \to \mathbb{R} \mid f(0) = 1\}$，配上点态乘法（$(f \oplus g)(x) := f(x)g(x)$）和指数标量乘法（$(a \odot f)(x) := f(x)^a$）。这是 $\mathbb{R}$-向量空间吗？如果是，零向量是什么？

§3 子空间与格运算 ⭐¶

动机¶

在 $\mathbb{R}^3$ 中，过原点的直线和过原点的平面有什么共同点？它们都是 $\mathbb{R}^3$ 的"子向量空间"——在继承的加法和标量乘法下，自身构成向量空间。子空间的概念允许我们在一个大的向量空间内部研究较小的结构。

但子空间的概念远不止于此。子空间的**交**和**和**给出了从已有子空间构造新子空间的方式——这构成了一个**格**（lattice）结构，它是理解维数公式和直和分解的关键。

子空间的定义与判定¶

定义 3.1. 设 $V$ 为 $F$-向量空间。$V$ 的非空子集 $W$ 称为**子空间**（subspace），记作 $W \leq V$，若 $W$ 在 $V$ 的加法和标量乘法下自身构成 $F$-向量空间。

直接验证八条公理过于繁琐。好消息是，大部分公理从 $V$ 自动继承——我们只需检查运算的封闭性：

定理 3.2（子空间判定定理）. $W \subseteq V$ 是子空间当且仅当： 1. $W \neq \emptyset$（通常通过验证 $0_V \in W$） 2. 对所有 $u, v \in W$ 和 $a \in F$，$au + v \in W$（加法和标量乘法封闭性的一步合并）

证明. 条件 2 包含了两个封闭性：取 $a = 1$ 得加法封闭，取 $v = 0$ 得标量乘法封闭。取 $a = -1, v = u$ 得逆元封闭。其余公理（结合律、交换律等）从 $V$ 继承，因为 $W$ 中的运算就是 $V$ 中运算的限制。 $\square$

为什么条件 1 不能省略？因为空集 $\emptyset$ 满足条件 2（"真空真"——没有元素需要检查），但 $\emptyset$ 不是向量空间（没有零向量）。

平凡子空间：每个向量空间 $V$ 都有两个**平凡子空间**——$\{0_V\}$ 和 $V$ 本身。

子空间的交¶

定理 3.3. 设 $\{W_i\}_{i \in I}$ 是 $V$ 的一族子空间。则 $\bigcap_{i \in I} W_i$ 是 $V$ 的子空间。

证明. (i) $0_V \in W_i$ 对每个 $i$ 成立（每个 $W_i$ 是子空间），所以 $0_V \in \bigcap W_i$，交非空。(ii) 设 $u, v \in \bigcap W_i$，$a \in F$。对每个 $i$，$u, v \in W_i$，由 $W_i$ 的子空间性质得 $au + v \in W_i$。因此 $au + v \in \bigcap W_i$。 $\square$

关键反面：两个子空间的**并一般不是子空间**。

反例. 在 $\mathbb{R}^2$ 中，设 $W_1 = \{(x, 0) : x \in \mathbb{R}\}$（$x$-轴）和 $W_2 = \{(0, y) : y \in \mathbb{R}\}$（$y$-轴）。$(1, 0) \in W_1$ 且 $(0, 1) \in W_2$，但 $(1, 0) + (0, 1) = (1, 1) \notin W_1 \cup W_2$。

什么时候并是子空间？ 当且仅当一个包含另一个：$W_1 \cup W_2$ 是子空间 $\Leftrightarrow$ $W_1 \subseteq W_2$ 或 $W_2 \subseteq W_1$。

子空间的和¶

既然并不是子空间，我们需要一种"从两个子空间生成新子空间"的方式。这就是**子空间的和**。

定义 3.4. 设 $W_1, W_2 \leq V$。它们的**和**定义为：

\[W_1 + W_2 := \{w_1 + w_2 : w_1 \in W_1, w_2 \in W_2\}\]

命题 3.5. $W_1 + W_2$ 是包含 $W_1 \cup W_2$ 的**最小子空间**。

证明. 首先验证 $W_1 + W_2$ 是子空间：$0 = 0 + 0 \in W_1 + W_2$；若 $u = w_1 + w_2, v = w_1' + w_2'$，则 $au + v = (aw_1 + w_1') + (aw_2 + w_2') \in W_1 + W_2$。其次，$W_1 \subseteq W_1 + W_2$（取 $w_2 = 0$），同理 $W_2 \subseteq W_1 + W_2$。最后，任何包含 $W_1 \cup W_2$ 的子空间 $U$ 必然包含所有 $w_1 + w_2$（因为 $U$ 对加法封闭），因此 $W_1 + W_2 \subseteq U$。 $\square$

维数公式¶

定理 3.6（子空间和的维数公式）. 设 $V$ 有限维，$W_1, W_2 \leq V$。则：

\[\dim(W_1 + W_2) = \dim W_1 + \dim W_2 - \dim(W_1 \cap W_2)\]

证明思路. 取 $W_1 \cap W_2$ 的基 $\{u_1, \ldots, u_k\}$。将其分别扩展为 $W_1$ 的基 $\{u_1, \ldots, u_k, v_1, \ldots, v_r\}$ 和 $W_2$ 的基 $\{u_1, \ldots, u_k, w_1, \ldots, w_s\}$。然后证明 $\{u_1, \ldots, u_k, v_1, \ldots, v_r, w_1, \ldots, w_s\}$ 是 $W_1 + W_2$ 的基。张成性是直接的；线性独立性需要一些技巧——关键步骤是：若 $\sum a_i u_i + \sum b_j v_j + \sum c_l w_l = 0$，则 $\sum c_l w_l = -\sum a_i u_i - \sum b_j v_j \in W_1$，但 $\sum c_l w_l \in W_2$，所以 $\sum c_l w_l \in W_1 \cap W_2$，因此可以用 $u_i$ 表出，再利用线性独立性得到所有系数为零。

\[\dim(W_1 + W_2) = k + r + s = (k + r) + (k + s) - k = \dim W_1 + \dim W_2 - \dim(W_1 \cap W_2)\]

类比：这是集合论中容斥原理 $|A \cup B| = |A| + |B| - |A \cap B|$ 的线性代数版本。相似之处在于"减去重复计算的部分"；**不像**的地方在于：集合的并用 $\cup$，而子空间的"并"用 $+$（因为并一般不是子空间）。

⚠️ 常见陷阱¶

💡 概念误区 3：混淆子空间的"和"与集合的"并"

错误想法：$W_1 + W_2 = W_1 \cup W_2$。

实际上：$W_1 \cup W_2 \subseteq W_1 + W_2$，但通常是严格包含。$W_1 + W_2$ 还包含所有"一个来自 $W_1$、一个来自 $W_2$"的和。

正确理解：$W_1 + W_2$ 是包含 $W_1 \cup W_2$ 的最小子空间，它"填补"了并中缺少的元素。

🧠 思维陷阱 3：看到"子空间判定"就只检查加法和标量乘法封闭

新手想法：只要加法封闭 + 标量乘法封闭就是子空间。

实际上：还需要 $W \neq \emptyset$。最简单的做法是检查 $0_V \in W$。如果连 $0_V$ 都不在 $W$ 中，那么 $W$ 肯定不是子空间（因为子空间必须包含零向量）。

练习¶

练习 3.1（⭐）. 证明：$\{(x, y, z) \in \mathbb{R}^3 : x + 2y - z = 0\}$ 是 $\mathbb{R}^3$ 的子空间，求其维数。

练习 3.2（⭐⭐）. 设 $V = \mathbb{R}^3$，$W_1 = \mathrm{span}\{(1,0,1), (0,1,0)\}$，$W_2 = \mathrm{span}\{(1,1,0), (0,0,1)\}$。计算 $\dim(W_1 + W_2)$ 和 $\dim(W_1 \cap W_2)$，验证维数公式。

补空间选择的工程意义¶

在机器人学中，补空间的选择对应于"如何分解运动"。例如：

对于冗余机械臂，关节速度空间 $\mathbb{R}^n$ 可以分解为 $\ker J \oplus U$，其中 $\ker J$ 是零空间运动（不影响末端），$U$ 是某个补空间（影响末端的运动）
不同的补空间 $U$ 对应不同的**伪逆**选择。最小范数伪逆 $J^+ = J^T(JJ^T)^{-1}$ 选择的是 $\ker J$ 的**正交补**（需要内积，属于 A2b 的内容）
加权伪逆 $J_W^+ = W^{-1}J^T(JW^{-1}J^T)^{-1}$ 选择的是关于权重矩阵 $W$ 的"正交"补——不同的 $W$ 对应不同的补空间选择

这个例子说明：补空间的选择不是数学上的无关紧要的细节，而是工程中的核心设计决策。"用哪个伪逆"实际上就是"选哪个补空间"。

§4 直和 ⭐⭐¶

动机¶

子空间的和 $W_1 + W_2$ 中的每个元素都可以写成 $w_1 + w_2$（$w_i \in W_i$）的形式，但这种分解一般**不唯一**。例如在 $V = \mathbb{R}^2$ 中，$W_1 = \mathbb{R}^2 = W_2$，则每个 $v$ 都有无穷多种分解 $v = w_1 + (v - w_1)$。

什么时候分解是唯一的？这正是**直和**的概念。直和是线性代数中最重要的分解工具——它说的是"把一个空间干净地拆成互不干扰的部分"。

内直和的三种等价定义¶

定理 4.1. 设 $W_1, W_2 \leq V$。以下三个条件等价：

(i) $V = W_1 + W_2$ 且 $W_1 \cap W_2 = \{0\}$

(ii) 每个 $v \in V$ 可以**唯一**地写成 $v = w_1 + w_2$，$w_i \in W_i$

(iii) $V = W_1 + W_2$ 且 $\dim V = \dim W_1 + \dim W_2$（有限维）

满足以上条件时，记 $V = W_1 \oplus W_2$，称 $V$ 是 $W_1$ 和 $W_2$ 的**内直和**（internal direct sum）。

证明 (i)$\Rightarrow$(ii). 设 $v = w_1 + w_2 = w_1' + w_2'$。则 $w_1 - w_1' = w_2' - w_2 \in W_1 \cap W_2 = \{0\}$，所以 $w_1 = w_1'$，$w_2 = w_2'$。

证明 (ii)$\Rightarrow$(i). $V = W_1 + W_2$ 由假设直接得到。若 $v \in W_1 \cap W_2$，则 $v = v + 0 = 0 + v$ 给出两种分解。唯一性要求 $v = 0$。

证明 (i)$\Leftrightarrow$(iii). 由维数公式：$\dim V = \dim W_1 + \dim W_2 - \dim(W_1 \cap W_2)$。$W_1 \cap W_2 = \{0\}$ 当且仅当 $\dim(W_1 \cap W_2) = 0$，即 $\dim V = \dim W_1 + \dim W_2$。 $\square$

阶段小结：条件 (i) 是最容易在实践中验证的（检查交是否为零）。条件 (ii) 是直和最本质的意义（唯一分解）。条件 (iii) 是有限维时最方便的数值判据。

外直和¶

定义 4.2. 给定 $V_1, V_2$（可以来自不同的向量空间），**外直和**定义为：

\[V_1 \oplus_{\mathrm{ext}} V_2 := \{(v_1, v_2) : v_i \in V_i\}\]

配上逐分量运算：$(v_1, v_2) + (v_1', v_2') := (v_1 + v_1', v_2 + v_2')$，$a(v_1, v_2) := (av_1, av_2)$。

内直和与外直和的桥梁：若 $V = W_1 \oplus_{\mathrm{int}} W_2$，则映射 $(w_1, w_2) \mapsto w_1 + w_2$ 给出 $W_1 \oplus_{\mathrm{ext}} W_2 \cong V$ 的同构。

补空间¶

定义 4.3. 设 $W \leq V$。子空间 $U \leq V$ 称为 $W$ 的**补空间**（complement），若 $V = W \oplus U$。

存在性：在有限维中，补空间总存在——将 $W$ 的基扩展到 $V$ 的基，扩展部分张成的子空间就是一个补空间。

不唯一性：补空间一般**不唯一**。例如在 $\mathbb{R}^2$ 中，$W = \{(x, 0) : x \in \mathbb{R}\}$（$x$-轴）的补空间可以是**任何**不与 $x$-轴重合的过原点直线——$y$-轴是一个补，但 $y = x$ 这条直线也是一个补。

反事实推理：如果补空间是唯一的，会发生什么？那么 $\mathbb{R}^2$ 中的 $x$-轴就有唯一的"正交"方向——但"正交"需要内积的概念（§A2b 的内容）。在没有内积的纯向量空间中，没有"正交"这回事，所以所有方向都是平等的补空间。补空间的不唯一性恰好反映了向量空间中没有内积这一事实。

⚠️ 常见陷阱¶

💡 概念误区 4：混淆直和 $V = W_1 \oplus W_2$ 和 $V = W_1 + W_2$

错误想法：只要 $V = W_1 + W_2$ 就写成 $V = W_1 \oplus W_2$。

实际上：直和需要额外条件 $W_1 \cap W_2 = \{0\}$。例如 $V = W + W = W$ 对任何 $W$ 成立，但 $V = W \oplus W$ 只在 $W = \{0\}$ 时成立。

后果：不检查交集条件就声称直和，会导致维数计算错误和分解不唯一。

🧠 思维陷阱 4：认为商空间 $V/W$ 和补空间 $U$ 是"一回事"

新手想法：既然 $U \cong V/W$，那 $V/W$ 就是 $U$。

实际上：$V/W$ 是一个由等价类组成的**唯一确定**的对象，而补空间 $U$ 是**不唯一**的。它们同构但不相等。$V/W$ 的定义不依赖任何选择；补空间的选择需要"选一组基并扩展"。

正确理解：$V/W$ 是"压掉 $W$ 后剩下的抽象信息"；$U$ 是 $V$ 中一个具体的子空间，恰好装载了同样多的信息。

练习¶

练习 4.1（⭐⭐）. 在 $\mathbb{R}^3$ 中，设 $W = \{(x, y, 0) : x, y \in \mathbb{R}\}$（$xy$-平面）。找出三个不同的补空间 $U_1, U_2, U_3$。

练习 4.2（⭐⭐）. 证明：若 $V = W_1 \oplus W_2 \oplus W_3$（三个子空间的直和），则 $W_j \cap (W_i + W_k) = \{0\}$ 对每个 $j$ 成立。这个条件比两两交为零（$W_i \cap W_j = \{0\}$）更强吗？给出例子说明。

§5 商空间与典范投影 ⭐⭐¶

动机¶

设你站在 $\mathbb{R}^3$ 中，面前有一个过原点的平面 $W$。你想"忽略" $W$ 方向的信息，只关心"离 $W$ 有多远"。怎么做？把所有"差一个 $W$ 中的向量"的点视为同一个点。这就是商空间 $V/W$ 的直觉：把 $W$ "压扁"成一个点。

类比：商空间就像地图上的等高线。每条等高线上的所有点被视为"同一个点"（它们的海拔相同）。等高线本身就是"平行于 $W$ 的平移"。地图上每个"等高线"的集合就是商空间中的一个元素。这个类比在"把同一类的元素视为一点"这个层面上是准确的，但**不像**的地方是：等高线之间的"距离"涉及度量，而商空间是纯代数概念，没有距离。

如果没有商空间会怎样¶

没有商空间，秩-零度定理的"优雅证明"就无法给出。当然可以用基扩展法直接证明（§15 证明一），但商空间证法（§15 证明二）揭示了一个更深刻的图景：$V/\ker T \cong \mathrm{im}\, T$（第一同构定理）。这个图景在后续的群论、环论、模论中反复出现——它是代数学的核心范式。

历史注记¶

商空间的概念来自 Noether（1927）在群论和环论中推广的同构定理。她的洞察是：商结构是理解态射（映射）最自然的语言。

陪集与等价关系¶

定义 5.1. 设 $W \leq V$。定义关系 $v \sim_W u$ 当且仅当 $v - u \in W$。

命题 5.2. $\sim_W$ 是等价关系。

证明.

自反：$v - v = 0 \in W$（$W$ 是子空间，包含 $0$）
对称：$v - u \in W \Rightarrow u - v = -(v - u) \in W$（$W$ 对标量乘法封闭，$-1 \in F$）
传递：$v - u \in W, u - w \in W \Rightarrow v - w = (v - u) + (u - w) \in W$（$W$ 对加法封闭）

每一步都用到了 $W$ 的子空间性质。如果 $W$ 只是一个普通子集（不是子空间），这些性质一般不成立。 $\square$

等价类 $[v] = v + W := \{v + w : w \in W\}$ 称为**陪集**（coset）。几何上，$v + W$ 是"平行于 $W$、通过 $v$ 的仿射子空间"。

商空间的构造¶

定义 5.3. 商空间 $V/W$ 是所有陪集的集合：$V/W := \{v + W : v \in V\}$。

在 $V/W$ 上定义运算：

加法：$(u + W) + (v + W) := (u + v) + W$
标量乘法：$a(v + W) := (av) + W$

良定义性验证（这是商空间构造中最关键的步骤）：

运算定义在陪集上，但我们使用了代表元 $u, v$ 来计算。如果选不同的代表元，结果会一样吗？

设 $u_1 + W = u_2 + W$（即 $u_1 - u_2 \in W$）且 $v_1 + W = v_2 + W$（即 $v_1 - v_2 \in W$）。则：

\[(u_1 + v_1) - (u_2 + v_2) = (u_1 - u_2) + (v_1 - v_2) \in W\]

因此 $(u_1 + v_1) + W = (u_2 + v_2) + W$。加法良定义。标量乘法的良定义性类似验证。

为什么良定义性验证如此重要？ 如果运算不良定义，那么同一个陪集用不同代表元计算会得到不同结果——这是灾难性的。在数学中，只要运算定义涉及"代表元的选择"，就**必须验证良定义性**。

**$V/W$ 的零向量**是 $0 + W = W$ 本身。

维数公式¶

定理 5.4. 设 $V$ 有限维。则 $\dim(V/W) = \dim V - \dim W$。

证明. 取 $W$ 的基 $\{w_1, \ldots, w_k\}$，扩展为 $V$ 的基 $\{w_1, \ldots, w_k, v_1, \ldots, v_m\}$。

断言：$\{v_1 + W, \ldots, v_m + W\}$ 是 $V/W$ 的基。

张成性. 任取 $v \in V$，$v = \sum a_i w_i + \sum b_j v_j$。则 $v + W = \sum b_j (v_j + W)$（因为 $\sum a_i w_i \in W$，被 $+W$ "吸收"了）。

线性独立性. 设 $\sum b_j (v_j + W) = 0 + W$，即 $\sum b_j v_j \in W$。则 $\sum b_j v_j = \sum c_i w_i$，即 $\sum b_j v_j - \sum c_i w_i = 0$。由 $V$ 的基的线性独立性，所有 $b_j = 0$（和 $c_i = 0$）。

因此 $\dim(V/W) = m = (k + m) - k = \dim V - \dim W$。 $\square$

直觉：商空间"压掉"了 $W$ 的 $k$ 个维度，剩下 $n - k$ 个维度。

典范投影¶

定义 5.5. 典范投影（canonical projection）$\pi: V \to V/W$ 定义为 $\pi(v) := v + W$。

性质： - $\pi$ 是**线性映射**：$\pi(au + v) = (au + v) + W = a(u + W) + (v + W) = a\pi(u) + \pi(v)$ - $\pi$ 是**满射**：对任意 $v + W \in V/W$，$\pi(v) = v + W$ - $\ker \pi = W$：$\pi(v) = 0 + W \Leftrightarrow v \in W$

泛性质（universal property）：若 $T: V \to U$ 是线性映射且 $W \subseteq \ker T$，则存在**唯一**的线性映射 $\bar{T}: V/W \to U$ 使 $T = \bar{T} \circ \pi$。

V ---T---> U
|          ^
pi |   exists! T_bar
|          |
V/W -------+

$\bar{T}$ 的定义：$\bar{T}(v + W) := T(v)$。良定义性：若 $v_1 + W = v_2 + W$，则 $v_1 - v_2 \in W \subseteq \ker T$，所以 $T(v_1) = T(v_2)$。

⚠️ 常见陷阱¶

💡 概念误区 5：忘记验证良定义性

错误做法：定义 $V/W$ 上的运算后直接使用，不验证运算不依赖代表元的选择。

后果：如果 $W$ 不是子空间而只是普通子集，良定义性可能**失败**。例如，取 $V = \mathbb{R}$，$S = \{0, 1\}$（不是子空间），定义 $x \sim y$ 当 $x - y \in S$。这不是等价关系（$1 \sim 0$ 且 $0 \sim (-1)$，但 $1 \not\sim (-1)$ 因为 $2 \notin S$），所以"商"根本不存在。

正确做法：每次在商结构上定义运算时，必须验证良定义性。这是一个需要养成习惯的步骤。

🧠 思维陷阱 5：把商空间想象成"子空间"

新手想法：$V/W$ 是 $V$ 的一部分。

实际上：$V/W$ 的元素是**陪集**（$V$ 的子集），不是 $V$ 的向量。$V/W$ 是一个全新的向量空间，其维数为 $\dim V - \dim W$。虽然每个补空间 $U$ 都与 $V/W$ 同构（$U \cong V/W$），但 $V/W$ 本身**不住在** $V$ 里面。

练习¶

练习 5.1（⭐⭐）. 设 $V = \mathbb{R}^3$，$W = \{(x, y, 0) : x, y \in \mathbb{R}\}$。描述 $V/W$ 的元素（几何上是什么？），并验证 $\dim V/W = 1$。

练习 5.2（⭐⭐⭐）. 证明典范投影的泛性质：若 $T: V \to U$ 且 $W \subseteq \ker T$，则存在唯一的 $\bar{T}: V/W \to U$ 使 $T = \bar{T} \circ \pi$。（提示：先定义 $\bar{T}$，再验证良定义、线性、唯一性。）

商空间与补空间的微妙关系¶

商空间 $V/W$ 和补空间 $U$（使 $V = W \oplus U$）是**同构的**（$U \cong V/W$），但有一个关键区别： - 商空间是唯一确定的——它只依赖 $V$ 和 $W$，不需要任何选择 - 补空间不唯一——需要选择如何"切分"$V$

类比：这就像"海拔"和"具体位置"的关系。$V/W$ 只记录"海拔"（相对于 $W$ 的"高度"），不关心你在同一海拔线上的具体位置。补空间 $U$ 相当于选择一条"垂直线"（从每个海拔线上挑一个代表点），但这条"垂直线"不是唯一的——你可以选择任何与 $W$ 横截的方向。这个类比的边界在于：真正的"海拔"是一维的，而 $V/W$ 可以是多维的。

在 Banach 空间（无限维赋范线性空间）中，情况更加微妙：闭子空间不一定有闭的补空间。这意味着拓扑向量空间中 $V \cong W \oplus V/W$ 的分裂不一定成立，这与有限维的情况形成鲜明对比。

⚠️ 常见陷阱（第一幕：公理基础）¶

💡 概念误区：认为"向量"就是"箭头"或"数组"

新手想法："向量就是 $(x, y, z)$ 这样的数组，或者空间中的箭头。"

实际上：向量空间是一个**公理化概念**——任何满足八条公理的集合都是向量空间。连续函数空间 $\mathcal{C}([0,1], \mathbb{R})$、多项式空间 $F[x]$、矩阵空间 $M_{m \times n}(F)$ 都是向量空间，但它们的"向量"既不是箭头也不是数组。甚至正实数 $\mathbb{R}_{>0}$ 配上"乘法作为加法"和"指数作为标量乘法"也能构成向量空间！

为什么重要：在机器人数学中，我们经常需要处理函数空间（如控制信号空间）、李代数（如 $\mathfrak{se}(3)$）等"非直觉"的向量空间。如果心智模型局限于 $\mathbb{R}^n$，就会在这些场景中失去方向。

🧠 思维陷阱：混淆"子空间"和"子集"

新手想法："$\{(x, y) \in \mathbb{R}^2 : x^2 + y^2 \leq 1\}$（单位圆盘）是 $\mathbb{R}^2$ 的子空间。"

实际上：子空间必须对加法和标量乘法封闭，且包含零向量。单位圆盘包含零向量，但 $(1, 0) + (0, 1) = (1, 1)$ 不在圆盘内，所以它不是子空间。$\mathbb{R}^2$ 的子空间只有三种：$\{0\}$、过原点的直线、$\mathbb{R}^2$ 本身。

正确思维：子空间是"过原点的平直几何对象"——直线、平面、超平面，不能弯曲，不能平移。

💡 概念误区：认为商空间 $V/W$ 是"从 $V$ 中去掉 $W$"

新手想法："$V/W$ 就是 $V$ 去掉 $W$ 中的元素剩下的东西。"

实际上：$V/W$ 的元素是**陪集** $v + W = \{v + w : w \in W\}$，即平行于 $W$ 的仿射子空间。$V/W$ 不是 $V$ 的子集，而是一个全新的向量空间，其维数等于 $\dim V - \dim W$。直觉上，商空间是"把 $W$ 方向压成一个点"后得到的空间。

为什么重要：商空间在同构定理（$V/\ker T \cong \mathrm{im}\, T$）中扮演核心角色，也是构造 $\mathbb{Z}$（从 $\mathbb{N} \times \mathbb{N}$ 商掉等价关系）的线性代数类比。

本质洞察：向量空间的八条公理看似繁琐，但它们精确捕捉了"线性结构"的本质——加法的可交换群结构加上标量的相容作用。任何满足这些公理的对象都自动继承所有线性代数的定理（基的存在、维数不变、秩-零度等）。这就是公理化方法的力量：一次证明，处处适用。

练习（第一幕）¶

（证明题） 从向量空间公理出发，证明零向量的唯一性：若 $0_1$ 和 $0_2$ 都是加法零元，则 $0_1 = 0_2$。在草稿纸上写出完整推导。
（推导题） 证明 $\mathbb{R}_{>0}$（正实数集）配上 $a \oplus b := ab$（乘法作为"加法"）和 $\lambda \odot a := a^\lambda$（指数作为"标量乘法"）构成 $\mathbb{R}$-向量空间。逐条验证八条公理。
（开放思考题） 设 $V = W_1 \oplus W_2$。$W_1$ 的补空间唯一吗？在 $\mathbb{R}^2$ 中，取 $W_1 = \{(x, 0) : x \in \mathbb{R}\}$，找出所有可能的补空间 $W_2$，并说明为什么补空间的选择在机器人数学中对应于"坐标系的选择"。

第一幕到此结束。我们已经建立了向量空间理论的基本语言：域、向量空间公理、子空间、直和、商空间。下一幕将在这个语言的基础上建立维数理论——回答"向量空间有多大？"这个核心问题。

第二幕：维数理论¶

第二幕的目标是回答一个根本性的问题：如何量化一个向量空间的"大小"？ 答案是**维数**——基中元素的个数。但"维数良定义"这一看似显然的事实，其证明需要精巧的技术（Steinitz 替换引理）。对于无限维空间，甚至需要集合论的重型工具（Zorn 引理）。

§6 线性组合、张成、线性相关与独立 ⭐¶

动机¶

在 $\mathbb{R}^3$ 中，三个向量 $(1,0,0)$、$(0,1,0)$、$(0,0,1)$ 可以"生成"整个空间——任何向量 $(a,b,c)$ 都可以写成 $a(1,0,0) + b(0,1,0) + c(0,0,1)$。但三个向量 $(1,0,0)$、$(2,0,0)$、$(0,1,0)$ 中，第二个是第一个的倍数——它是"多余的"。

线性组合、张成和线性独立的概念精确地回答了两个问题： 1. 给定一些向量，它们能"到达"空间中的哪些点？（张成） 2. 其中是否有"多余的"向量？（线性独立性）

线性组合与张成¶

定义 6.1. 向量 $v_1, \ldots, v_n \in V$ 的**线性组合**（linear combination）是形如 $a_1 v_1 + a_2 v_2 + \cdots + a_n v_n$ 的表达式，其中 $a_i \in F$。

定义 6.2. 子集 $S \subseteq V$ 的**张成**（span）定义为 $S$ 中元素的所有有限线性组合的集合：

\[\mathrm{span}(S) := \left\{\sum_{i=1}^{n} a_i v_i : n \in \mathbb{N},\, a_i \in F,\, v_i \in S\right\}\]

约定 $\mathrm{span}(\emptyset) := \{0\}$。

命题 6.3. $\mathrm{span}(S)$ 是包含 $S$ 的**最小子空间**。

线性相关与线性独立¶

定义 6.4. 向量 $v_1, \ldots, v_n$ 称为**线性相关**（linearly dependent），若存在不全为零的标量 $a_1, \ldots, a_n \in F$ 使得 $a_1 v_1 + \cdots + a_n v_n = 0$。

定义 6.5. 向量 $v_1, \ldots, v_n$ 称为**线性独立**（linearly independent），若 $a_1 v_1 + \cdots + a_n v_n = 0$ 只有平凡解 $a_1 = \cdots = a_n = 0$。

线性独立是线性相关的**否命题**：不存在非平凡零表示。

对无限集 $S$：$S$ 线性独立当且仅当 $S$ 的每个**有限子集**线性独立。这个"有限性"在 §9 中的 Zorn 引理论证中扮演关键角色。

基本性质¶

含零向量的集合必线性相关：$1 \cdot 0_V = 0_V$，系数 $1 \neq 0$
两个向量线性相关 $\Leftrightarrow$ 一个是另一个的标量倍
线性独立集的子集仍线性独立
线性相关引理（Axler 2.19）：若 $(v_1, \ldots, v_m)$ 线性相关且 $v_1 \neq 0$，则某个 $v_j$（$j \geq 2$）可以从前面的向量线性表出，且去掉 $v_j$ 后张成不变

⚠️ 常见陷阱¶

💡 概念误区 6：混淆"线性独立"和"正交"

错误想法：线性独立的向量一定互相垂直。

实际上：线性独立是纯代数概念，不需要内积。$(1, 0)$ 和 $(1, 1)$ 线性独立但不正交。正交向量一定线性独立，但反过来不成立。

为什么重要：在没有内积的向量空间（如多项式空间 $F[x]$）中，"正交"没有意义，但"线性独立"仍有意义。

🧠 思维陷阱 6：用行列式判定线性独立性后就停止思考

新手想法：判定线性独立性 = 算行列式。

实际上：行列式只适用于 $n$ 个 $n$ 维向量的情况。对于一般情况（$m$ 个向量在 $n$ 维空间中，$m \neq n$），需要回到定义或用秩来判定。

正确思维：线性独立性是一个关于"零表示是否唯一"的逻辑命题，行列式只是有限维方阵的一个计算工具。

练习¶

练习 6.1（⭐）. 在 $\mathbb{R}[x]_{\leq 2}$ 中，判断 $\{1, 1+x, 1+x+x^2\}$ 是否线性独立。

练习 6.2（⭐⭐）. 证明线性相关引理（Axler 2.19）。

Steinitz 引理的历史与多种证明路径¶

Ernst Steinitz 在 1913 年的论文 Bedingt konvergente Reihen und konvexe Systeme 中首次建立了这个引理的一般形式。不同教材使用不同的证明策略：

证明路径	教材	特点
直接归纳（对 $m$ 归纳）	[HK], [FIS]	最经典，技术细节清晰
线性相关引理	[Axler]	不直接使用 Steinitz 名称，但本质等价
行阶梯形论证	许多工科教材	通过矩阵化简，计算导向

如果不这样做（反事实推理）：如果没有 Steinitz 替换引理，我们就无法证明"维数是良定义的"——即不同的基可能有不同的大小。整个有限维线性代数的大厦建立在"维数是不变量"这个事实之上。可以说，Steinitz 引理是有限维线性代数中**最重要的单一引理**。

§7 Steinitz 替换引理 ⭐⭐¶

动机¶

Steinitz 替换引理是维数理论的基石。它回答了一个直觉上"显然"但证明起来并不简单的问题：如果一个向量空间有一组张成集（$n$ 个向量），那么任何线性独立集的大小不超过 $n$。

如果没有 Steinitz 引理，我们就无法证明"维数的良定义性"——即同一个向量空间的任意两组基有相同个数的元素。

历史注记¶

Ernst Steinitz 在 1913 年的论文 Bedingt konvergente Reihen und konvexe Systeme 中证明了这个引理。虽然原始论文讨论的是条件收敛级数，但其中的替换技术成为了线性代数的标准工具。

引理陈述与完整证明¶

引理 7.1（Steinitz 替换引理）. 设 $\{w_1, \ldots, w_n\}$ 张成 $V$，$\{u_1, \ldots, u_m\}$ 线性独立。则 $m \leq n$，且可以用 $u_i$ 替换某些 $w_j$ 使得 $\{u_1, \ldots, u_m, w_{j_1}, \ldots, w_{j_{n-m}}\}$ 仍张成 $V$。

证明（对 $m$ 归纳）.

基础步（$m = 0$）：无需替换，结论平凡成立。

归纳步：设对 $m - 1$ 成立。由归纳假设，已替换得到 $\{u_1, \ldots, u_{m-1}, w_{j_1}, \ldots, w_{j_{n-m+1}}\}$ 张成 $V$。

由于此集合张成 $V$，$u_m$ 可以表示为：

\[u_m = \sum_{i=1}^{m-1} a_i u_i + \sum_{l=1}^{n-m+1} b_l w_{j_l}\]

关键断言：至少有一个 $b_l \neq 0$。

反证法. 若所有 $b_l = 0$，则 $u_m = \sum_{i=1}^{m-1} a_i u_i$，即 $u_m$ 是 $u_1, \ldots, u_{m-1}$ 的线性组合。这意味着 $\{u_1, \ldots, u_m\}$ 线性相关——与假设矛盾。

设 $b_{l_0} \neq 0$。从上式解出 $w_{j_{l_0}}$：

\[w_{j_{l_0}} = b_{l_0}^{-1}\left(u_m - \sum_{i=1}^{m-1} a_i u_i - \sum_{l \neq l_0} b_l w_{j_l}\right)\]

这里用到了 $b_{l_0} \neq 0$，因此 $b_{l_0}^{-1}$ 存在（$F$ 是域！）。

用 $u_m$ 替换 $w_{j_{l_0}}$，新集合 $\{u_1, \ldots, u_m, w_{j_1}, \ldots, \hat{w}_{j_{l_0}}, \ldots, w_{j_{n-m+1}}\}$ 仍张成 $V$（因为被替换的 $w_{j_{l_0}}$ 可以由新集合中的元素线性表出）。

替换后集合大小为 $m + (n - m + 1 - 1) = n$，其中恰好 $m$ 个 $u_i$ 和 $n - m$ 个 $w_j$。归纳完成。

特别地，$m \leq n$（否则在某步中 $n - m + 1 = 0$，$u_m$ 只由 $u_1, \ldots, u_{m-1}$ 表出，矛盾独立性）。 $\square$

注意证明中 $b_{l_0}^{-1}$ 的存在依赖于 $F$ 是域。这是向量空间理论比模论更简洁的根本原因——域中非零元素可以"除"，环中不行。

核心推论¶

推论 7.2. 线性独立集的大小 $\leq$ 张成集的大小。

推论 7.3. 有限维空间的任意两组基大小相同。（证明：设两组基分别有 $m$ 和 $n$ 个元素。一组是独立集，另一组是张成集，由推论 7.2 得 $m \leq n$ 且 $n \leq m$。）

推论 7.4. 有限张成集可以削减为基；线性独立集可以扩展为基。

⚠️ 常见陷阱¶

💡 概念误区 7：认为 Steinitz 引理"显然成立"不需要证明

新手想法：独立向量不超过张成向量的个数，这不是常识吗？

实际上：这个"常识"的严格证明需要域的性质（非零元素可逆）和精心设计的归纳。在**模**上（标量来自环），类似的陈述**不成立**——自由模的秩不一定良定义。

练习¶

练习 7.1（⭐⭐）. 在 Steinitz 引理的证明中，明确指出哪一步用到了"$F$ 是域"这一条件。如果 $F$ 是环（如 $\mathbb{Z}$），证明会在哪一步失败？

§8 基与维数（有限维）⭐¶

基的三种等价定义¶

定理 8.1. 以下三个条件对 $B \subseteq V$ 等价：

$B$ 是**极大**线性独立集（不能再添加任何向量而保持独立）
$B$ 是**极小**张成集（去掉任何一个向量就不再张成 $V$）
$B$ 线性独立且张成 $V$

维数（dimension）的定义：$\dim_F V := |B|$，其中 $B$ 是 $V$ 的任意基。由推论 7.3，维数不依赖基的选择。

维数的基本性质¶

性质	说明
$\dim F^n = n$	标准基 $e_1, \ldots, e_n$
$\dim F[x]_{\leq n} = n + 1$	基 $\{1, x, \ldots, x^n\}$
$\dim M_{m \times n}(F) = mn$	基 $\{E_{ij}\}$，$E_{ij}$ 是 $(i,j)$ 位置为 $1$ 其余为 $0$ 的矩阵
$W \leq V \Rightarrow \dim W \leq \dim V$	独立集不超过基的大小
$W \leq V, \dim W = \dim V \Rightarrow W = V$	有限维的特殊性质

本质洞察：维数是向量空间的**唯一完全不变量**（在同构意义下）。两个有限维 $F$-向量空间同构当且仅当维数相同。这意味着**有限维向量空间的分类问题被维数完全解决了**——这在代数学中是罕见的简洁。

基的扩展与削减¶

定理 8.2（扩展定理）. 设 $V$ 有限维。$V$ 中任何线性独立集都可以扩展为 $V$ 的一组基。

证明. 设 $S = \{v_1, \ldots, v_k\}$ 线性独立，$\{w_1, \ldots, w_n\}$ 是 $V$ 的一组基（张成集）。由 Steinitz 引理，$k \leq n$，且可以用 $v_i$ 替换某些 $w_j$，得到 $\{v_1, \ldots, v_k, w_{j_1}, \ldots, w_{j_{n-k}}\}$ 仍张成 $V$。

断言：这个新集合也线性独立。

这需要验证：原来的 $n$ 个向量替换后仍有 $n$ 个，张成 $n$ 维空间的 $n$ 个向量必然线性独立（否则可以删掉一个而仍然张成，得到 $n-1$ 个向量张成 $n$ 维空间，与 Steinitz 引理矛盾）。 $\square$

定理 8.3（削减定理）. 设 $V$ 有限维。$V$ 的任何张成集都可以削减为一组基。

证明思路. 从张成集中逐步删除"多余的"向量（即可以由其余向量线性表出的向量），直到剩下的向量线性独立为止。线性相关引理（§6）保证每步都能找到可删除的向量。

阶段小结：扩展定理和削减定理是基的两种构造方式——从"太小"（独立但不张成）扩展，或从"太大"（张成但不独立）削减。两者的共同终点是基——恰到好处的集合。

维数与子空间的关系¶

维数给出了子空间之间的偏序关系的量化描述。以下两个结果在实践中经常使用：

命题 8.4. 设 $V$ 有限维，$W \leq V$。则：

(a) $\dim W \leq \dim V$

(b) $\dim W = \dim V \Rightarrow W = V$

证明. (a) $W$ 的基是 $V$ 中的线性独立集，由 Steinitz 引理不超过 $V$ 的基的大小。

(b) 设 $\dim W = n = \dim V$。$W$ 的基 $\{w_1, \ldots, w_n\}$ 是 $V$ 中的 $n$ 个线性独立向量。但 $V$ 的维数为 $n$，所以任何 $n$ 个线性独立向量必然张成 $V$（否则可以扩展为 $n+1$ 个独立向量，与维数矛盾）。因此 $\mathrm{span}\{w_1, \ldots, w_n\} = V$，即 $W = V$。 $\square$

反事实推理：命题 8.4(b) 在无限维中**不成立**。考虑 $V = F[x]$（所有多项式），$W = xF[x]$（无常数项的多项式）。两者的 Hamel 基分别为 $\{1, x, x^2, \ldots\}$ 和 $\{x, x^2, x^3, \ldots\}$，基数都是 $\aleph_0$。但 $W \subsetneq V$（常数多项式 $1 \notin W$）。有限维的特殊性在于：维数是一个**有限数**，所以"等维"是一个很强的约束。

⚠️ 常见陷阱¶

💡 概念误区 8：认为"$\dim W = \dim V$ 蕴含 $W = V$"在无限维也成立

实际上：在无限维中，$\dim W = \dim V$（作为基数相等）并不蕴含 $W = V$。例如 $V = F[x]$（所有多项式），$W = xF[x]$（常数项为零的多项式）。两者维数都是 $\aleph_0$，但 $W \subsetneq V$。

🧠 思维陷阱 8：认为基的选择对向量空间的"本质"有影响

新手想法：标准基 $\{e_1, \ldots, e_n\}$ 是 $\mathbb{R}^n$ 的"正确"基。

实际上：所有基都是平等的。标准基只是**一种**选择，它的特殊性仅仅在于计算上的方便。选择不同的基就像选择不同的坐标系——同一个向量有不同的坐标表示，但向量本身没有改变。

正确理解：向量空间的本质结构（维数、子空间、线性映射的核/像等）不依赖基的选择。依赖基的量（如坐标、矩阵表示）只是计算工具。

练习¶

练习 8.1（⭐）. 求向量空间 $\{A \in M_{n \times n}(\mathbb{R}) : A^T = A\}$（对称矩阵空间）的维数。给出一组基。

练习 8.2（⭐⭐，跨章综合）. 设 $V = \mathbb{R}[x]_{\leq 3}$（次数 $\leq 3$ 的多项式），$W = \{p \in V : p(1) = 0\}$。(a) 证明 $W$ 是 $V$ 的子空间。(b) 求 $\dim W$。(c) 利用 §5 的维数公式求 $\dim(V/W)$。(d) 给出 $V/W$ 的一组基。

练习 8.3（⭐⭐）. 设 $V = M_{2 \times 2}(\mathbb{R})$，$W = \{A \in V : \mathrm{tr}(A) = 0\}$（迹为零的矩阵）。(a) 证明 $W$ 是子空间。(b) 求 $\dim W$ 和一组基。(c) 找出 $W$ 的一个补空间 $U$（使 $V = W \oplus U$）。

§9 Zorn 引理与 Hamel 基 ⭐⭐⭐¶

动机¶

在有限维空间中，基的存在性是"显然的"——从一个张成集出发，逐步删除多余向量即可。但在无限维空间中（如 $\mathcal{C}([0,1], \mathbb{R})$），没有有限的张成集可供删减。我们需要一个更强大的工具来保证基的存在性——这就是 Zorn 引理。

反事实推理：如果没有 Zorn 引理（等价地，没有选择公理），会怎样？Blass（1984）证明了一个惊人的结果："每个向量空间有基"与选择公理等价。这意味着在没有 AC 的 ZF 集合论中，存在没有基的向量空间。这是一个深刻的集合论结果——基的存在性不是"免费的"，它需要选择公理作为代价。

Hamel 基的定义¶

定义 9.1. 向量空间 $V$ 的 **Hamel 基**是一个线性独立且张成 $V$ 的子集 $B \subseteq V$，其中"张成"要求每个 $v \in V$ 都是 $B$ 中元素的**有限**线性组合。

类比：Hamel 基与泛函分析中的 **Schauder 基**的区别：Schauder 基允许无穷级数 $v = \sum_{i=1}^{\infty} a_i e_i$（需要拓扑收敛），而 Hamel 基只允许有限和。这个类比在"都是生成集"这一点上相似，但**不像**的是：Hamel 基是纯代数概念，Schauder 基需要拓扑结构。在有限维空间中，两者一致。

任意向量空间有基（Zorn 引理证明）¶

定理 9.2. 每个向量空间都有 Hamel 基。

证明. 回顾 §A1.9 中的 Zorn 引理：若偏序集 $(P, \leq)$ 中每条链都有上界，则 $P$ 有极大元。

设 $\mathcal{P} = \{S \subseteq V : S \text{ 线性独立}\}$，按包含关系 $\subseteq$ 偏序。

验证 Zorn 引理的条件：设 $\{S_\alpha\}_{\alpha \in A}$ 是 $\mathcal{P}$ 中的一条链（即对任意 $\alpha, \beta$，$S_\alpha \subseteq S_\beta$ 或 $S_\beta \subseteq S_\alpha$）。

令 $U = \bigcup_{\alpha} S_\alpha$。我们需要证明 $U$ 线性独立。

设 $v_1, \ldots, v_n \in U$，$a_1 v_1 + \cdots + a_n v_n = 0$。每个 $v_i$ 属于某个 $S_{\alpha_i}$。由于 $\{S_\alpha\}$ 是链，$\{S_{\alpha_1}, \ldots, S_{\alpha_n}\}$ 中有一个最大的，设为 $S_{\alpha_0}$。则 $v_1, \ldots, v_n \in S_{\alpha_0}$。由于 $S_{\alpha_0}$ 线性独立，$a_1 = \cdots = a_n = 0$。

关键：这个论证用到了线性独立是"有限性质"——只需检查有限子集。如果"独立"的定义涉及无限和，这个论证就会失败。

由 Zorn 引理，$\mathcal{P}$ 有极大元 $M$。

断言：$M$ 张成 $V$。

反证法. 若存在 $v \notin \mathrm{span}(M)$，则 $M \cup \{v\}$ 仍线性独立（因为 $v$ 不能由 $M$ 中的元素线性表出）。这与 $M$ 的极大性矛盾。

因此 $M$ 是线性独立且张成 $V$ 的集合，即 Hamel 基。 $\square$

⚠️ 常见陷阱¶

🧠 思维陷阱 9：认为无限维空间的基可以"写出来"

新手想法：$\mathcal{C}([0,1], \mathbb{R})$ 的 Hamel 基是什么？能列出来吗？

实际上：$\mathcal{C}([0,1], \mathbb{R})$ 的 Hamel 基的存在性依赖选择公理，无法构造性地给出。我们知道它存在，但永远无法"写出"它的所有元素。

正确理解：Zorn 引理保证的是**存在性**，不提供构造方法。这是纯存在性证明的典型例子。

💡 概念误区 9：混淆 Hamel 基和 Schauder 基

错误想法：$\{1, x, x^2, \ldots\}$ 是 $\mathcal{C}([0,1], \mathbb{R})$ 的基。

实际上：多项式在 $\mathcal{C}([0,1], \mathbb{R})$ 中稠密（Weierstrass 逼近定理），但这是拓扑意义上的稠密（无穷级数逼近），不是代数意义上的张成（有限线性组合）。$\{1, x, x^2, \ldots\}$ 的有限线性组合只能生成多项式，不能生成所有连续函数。

练习¶

练习 9.1（⭐⭐⭐）. 用 Zorn 引理证明：任何线性独立集都可以扩展为基。（提示：把 Zorn 引理用到"包含给定独立集的线性独立集"的偏序集上。）

§10-§11 基数不变性与坐标映射 ⭐⭐¶

§10 处理无限维空间中维数的良定义性（任意两组基等势），§11 建立坐标映射和分类定理。由于这两节高度技术性且在机器人学中较少直接使用，这里给出核心结论。

定理 10.1（基数不变性）. 无限维 $F$-向量空间 $V$ 的任意两组 Hamel 基具有相同的基数。

定理 11.1（分类定理）. 两个有限维 $F$-向量空间同构当且仅当维数相同。每个 $n$ 维 $F$-向量空间同构于 $F^n$。

坐标映射 $[\cdot]_\mathcal{B}: V \to F^n$，$v = \sum a_i v_i \mapsto (a_1, \ldots, a_n)$，是**依赖基的选择**的同构。换基就换坐标。

⚠️ 常见陷阱¶

💡 概念误区 10：认为"$V$ 同构于 $F^n$"意味着 $V$ 就是 $F^n$

错误想法：既然所有 $n$ 维空间都同构于 $F^n$，那它们都是一样的。

实际上：同构说的是"结构相同"，但同构映射**不唯一**——每组基给出一个不同的同构。不同的同构给出不同的坐标表示。$F^n$ 是一个"标准模型"，但多项式空间、矩阵空间等有各自自然的结构，不应把它们都"强制"视为 $F^n$。

练习¶

练习 11.1（⭐⭐，跨章综合）. 设 $V = \mathbb{R}[x]_{\leq 2}$，$\mathcal{B}_1 = (1, x, x^2)$，$\mathcal{B}_2 = (1, 1+x, 1+x+x^2)$。(a) 写出 $p(x) = 3 + 2x + x^2$ 在 $\mathcal{B}_1$ 和 $\mathcal{B}_2$ 下的坐标。(b) 写出从 $\mathcal{B}_1$ 到 $\mathcal{B}_2$ 的基变换矩阵。（这为 §17 做准备。）

⚠️ 常见陷阱（第二幕：维数理论）¶

💡 概念误区：认为"有限维"和"无限维"的基理论本质相同

新手想法："有限维时基的存在性和唯一性（基数意义）已经证明了，无限维应该'推广'一下就行。"

实际上：有限维的基存在性靠的是 Steinitz 替换引理（纯有限归纳），完全不需要选择公理。无限维的基存在性靠的是 Zorn 引理，而 Zorn 引理等价于选择公理（AC）。Blass 1984 证明了"每个向量空间有基"$\Leftrightarrow$ AC，这意味着无限维基的存在性是一个**本质上更深**的结果，不是有限维的"简单推广"。在没有 AC 的 ZF 中，确实存在没有基的向量空间。

为什么重要：这个区别在泛函分析中至关重要。Hamel 基（代数基，要求有限线性组合）和 Schauder 基（拓扑基，允许无穷级数）是完全不同的概念。$\ell^2$ 有 Schauder 基 $\{e_n\}$，但其 Hamel 基不可数且无法显式写出。

🧠 思维陷阱：认为"基的选择不影响数学结论"

新手想法："反正所有基都等价，选哪个都一样。"

实际上：虽然维数（基的大小）是不变量，但**具体的基的选择**会深刻影响计算和表示。同一个线性映射在不同基下的矩阵表示是**相似矩阵**（$B = P^{-1}AP$），虽然它们有相同的迹、行列式、特征多项式，但计算效率可能天差地别。选择好的基（如特征基、Jordan 基、奇异值分解的基）是线性代数的核心技能。

正确思维：基是"坐标系"——结论不依赖坐标系（坐标无关的事实），但计算的简洁性强烈依赖坐标系的选择。

本质洞察：Steinitz 替换引理的核心思想是：如果你有一组线性独立向量（"自由人"）和一组张成向量（"冗余覆盖"），那么自由人的数量不超过覆盖的数量，而且你可以用自由人逐步替换覆盖中的冗余元素而不改变张成性。这不是一个孤立的技术引理，而是**有限维线性代数的心脏**——维数的良定义、基的扩展定理、基的削减定理，全部从它推出。

练习（第二幕）¶

（推导题） 用 Steinitz 替换引理证明：若 $V$ 有一组大小为 $n$ 的基，则 $V$ 的任何线性独立集大小 $\leq n$。在草稿纸上写出完整归纳证明。
（证明题） 用 Zorn 引理证明：$\mathbb{R}$ 作为 $\mathbb{Q}$-向量空间有一组基（称为 Hamel 基）。明确指出证明中哪一步使用了 Zorn 引理，以及 Zorn 引理的条件（链有上界）如何验证。
（跨章综合题） 结合 A1 §A1.8 的 Cantor 定理和本章的维数理论，证明：$\mathbb{R}$ 作为 $\mathbb{Q}$-向量空间的 Hamel 基是不可数的。（提示：若 Hamel 基可数，则 $\mathbb{R}$ 可数——与 Cantor 定理矛盾。）

第二幕到此结束。我们已经建立了维数理论：基的存在性、维数的良定义性、坐标与分类。上面解决了"向量空间有多大"的问题，但还没有回答"向量空间之间的映射有什么结构"——这正是第三幕的主题。

第三幕：线性变换¶

第三幕的目标是研究向量空间之间的**结构保持映射**——线性映射。这是线性代数的核心引擎：矩阵、秩、行列式、特征值等概念都是线性映射的不同侧面。

机器人数学中的关键例子¶

线性映射	定义域	值域	说明
Jacobian $J(\theta)$	关节速度空间 $\mathbb{R}^n$	末端执行器速度空间 $\mathbb{R}^6$	将关节速度映射为末端速度
$\mathrm{ad}_X: \mathfrak{g} \to \mathfrak{g}$	李代数	李代数	伴随表示，$\mathrm{ad}_X(Y) = [X, Y]$
惯性张量 $\mathcal{I}: \mathbb{R}^3 \to \mathbb{R}^3$	角速度空间	角动量空间	将角速度映射为角动量

注意：Jacobian $J(\theta)$ 严格来说不是一个固定的线性映射，而是一个**依赖配置 $\theta$ 的线性映射族**。对于固定的 $\theta_0$，$J(\theta_0)$ 是一个线性映射。这种"逐点线性"的结构在微分几何中形式化为**切映射** $T_\theta f: T_\theta Q \to T_{f(\theta)} SE(3)$。

§12 线性映射的定义与基本性质 ⭐¶

动机¶

向量空间是"静态的"对象——它描述了一个集合的结构。但数学和工程的力量来自**变换**：旋转、投影、微分、积分。这些变换有什么共同特征？它们都保持线性结构——即 $T(au + bv) = aT(u) + bT(v)$。线性映射的概念抽象出了这一共性。

定义¶

定义 12.1. 设 $V, W$ 为 $F$-向量空间。映射 $T: V \to W$ 称为**线性映射**（linear map），若对所有 $u, v \in V$，$a, b \in F$：

\[T(au + bv) = aT(u) + bT(v)\]

等价地，$T(u + v) = T(u) + T(v)$ 且 $T(av) = aT(v)$。

定理 12.2（线性映射由基的像完全确定）. 设 $\mathcal{B} = \{v_1, \ldots, v_n\}$ 是 $V$ 的基。对 $W$ 中任意 $w_1, \ldots, w_n$，存在唯一的线性映射 $T: V \to W$ 使 $T(v_i) = w_i$。

证明. 存在性：定义 $T\left(\sum a_i v_i\right) := \sum a_i w_i$。由于 $\mathcal{B}$ 是基，每个 $v \in V$ 有唯一的表示 $v = \sum a_i v_i$，所以 $T$ 是良定义的函数。线性验证直接。唯一性：若 $T'$ 也满足 $T'(v_i) = w_i$，则对任意 $v = \sum a_i v_i$，$T'(v) = T'(\sum a_i v_i) = \sum a_i T'(v_i) = \sum a_i w_i = T(v)$。 $\square$

这个定理的意义：线性映射的自由度恰好等于维数。一旦指定了基的像（$n$ 个自由选择），线性映射就被完全确定了。

基本例子¶

映射	定义	线性性来源
零映射 $0: V \to W$	$v \mapsto 0_W$	$0(au+bv) = 0 = a \cdot 0 + b \cdot 0$
恒等映射 $\mathrm{id}_V$	$v \mapsto v$	平凡
投影 $\pi_1: V_1 \oplus V_2 \to V_1$	$(v_1, v_2) \mapsto v_1$	逐分量线性
求导 $D: F[x]_{\leq n} \to F[x]_{\leq n-1}$	$p \mapsto p'$	$(ap + bq)' = ap' + bq'$
矩阵左乘 $L_A: F^n \to F^m$	$x \mapsto Ax$	$A(ax+by) = aAx + bAy$

线性映射的基本性质¶

命题 12.3. 设 $T: V \to W$ 线性。则：

(a) $T(0_V) = 0_W$

(b) $T(-v) = -T(v)$ 对所有 $v \in V$

(c) $T\left(\sum_{i=1}^{n} a_i v_i\right) = \sum_{i=1}^{n} a_i T(v_i)$（有限线性组合的保持）

证明. (a) $T(0_V) = T(0_F \cdot v) = 0_F \cdot T(v) = 0_W$。(b) $T(-v) = T((-1) \cdot v) = (-1) \cdot T(v) = -T(v)$。(c) 对 $n$ 归纳即可。 $\square$

性质 (a) 特别重要：线性映射必须把零映射到零。这是判定"非线性"的最快方法——如果 $T(0) \neq 0$，$T$ 一定不是线性映射。

命题 12.4（线性映射保持子空间）. 设 $T: V \to W$ 线性。

(a) 若 $S \leq V$，则 $T(S) := \{T(s) : s \in S\} \leq W$

(b) 若 $U \leq W$，则 $T^{-1}(U) := \{v \in V : T(v) \in U\} \leq V$

证明. (a) $T(S)$ 非空（$T(0_V) = 0_W \in T(S)$）。对 $T(s_1), T(s_2) \in T(S)$，$a T(s_1) + T(s_2) = T(as_1 + s_2) \in T(S)$。(b) 类似。 $\square$

线性映射的复合与逆¶

命题 12.5. 若 $T: V \to W$ 和 $S: W \to U$ 都是线性的，则 $S \circ T: V \to U$ 也是线性的。

命题 12.6. 若 $T: V \to W$ 是双射线性映射，则 $T^{-1}: W \to V$ 也是线性的。

证明. 设 $w_1, w_2 \in W$，$a \in F$。设 $T(v_i) = w_i$。则 $T(av_1 + v_2) = aT(v_1) + T(v_2) = aw_1 + w_2$。因此 $T^{-1}(aw_1 + w_2) = av_1 + v_2 = aT^{-1}(w_1) + T^{-1}(w_2)$。 $\square$

这个命题非常重要：它说明**线性同构**（双射线性映射）的逆也是线性的。在群论中，群同态的逆不一定是同态（除非是双射的），所以线性映射的这个性质并不"显然"。

⚠️ 常见陷阱¶

💡 概念误区 12：认为所有函数都是线性映射

错误想法：$f(x) = x + 1$ 是 $\mathbb{R} \to \mathbb{R}$ 的线性映射。

实际上：$f(0) = 1 \neq 0$。线性映射必须把零映射到零：$T(0) = T(0 \cdot v) = 0 \cdot T(v) = 0$。$f(x) = x + 1$ 是**仿射映射**，不是线性映射。

🧠 思维陷阱 12：混淆"线性函数"和"线性映射"

新手想法：$y = 2x + 3$ 是线性函数，所以 $T(x) = 2x + 3$ 是线性映射。

实际上：在微积分中，"线性函数"指的是图像为直线的函数（$y = mx + b$）。在线性代数中，"线性映射"要求 $T(0) = 0$ 且保持加法和标量乘法。只有 $b = 0$ 时（即 $T(x) = mx$），微积分的"线性函数"才是线性代数的"线性映射"。

练习¶

练习 12.1（⭐）. 验证求导算子 $D: \mathbb{R}[x]_{\leq 3} \to \mathbb{R}[x]_{\leq 2}$ 是线性映射。写出 $D$ 在标准基 $\{1, x, x^2, x^3\}$ 和 $\{1, x, x^2\}$ 下的矩阵表示。

练习 12.2（⭐⭐）. 设 $V = \mathcal{C}([0,1], \mathbb{R})$，定义 $T(f)(x) = \int_0^x f(t) dt$。证明 $T$ 是线性映射。$T$ 是单射吗？满射吗？

End(V) 的代数结构深入¶

$\mathrm{End}(V)$ 是一个**非交换代数**——$S \circ T \neq T \circ S$，除非在特殊情况下。这个非交换性是线性代数与初等代数的根本区别：

交换子（commutator）$[S, T] := S \circ T - T \circ S$ 度量"不交换程度"
交换子满足 Jacobi 恒等式：$[X, [Y, Z]] + [Y, [Z, X]] + [Z, [X, Y]] = 0$
因此 $(\mathrm{End}(V), [\cdot, \cdot])$ 构成**李代数** $\mathfrak{gl}(V)$——这是李群理论的代数起点
在基下，$\mathrm{End}(V) \cong M_n(F)$（$n \times n$ 矩阵代数），$\mathrm{GL}(V) \cong \mathrm{GL}_n(F)$（可逆矩阵群），$\mathfrak{gl}(V) \cong \mathfrak{gl}_n(F)$（全体矩阵配交换子括号）

在机器人学中，李代数 $\mathfrak{se}(3) \subset \mathfrak{gl}_4(\mathbb{R})$ 描述刚体的瞬时速度（twist），而李群 $SE(3) \subset \mathrm{GL}_4(\mathbb{R})$ 描述刚体的位姿（齐次变换矩阵）。$\mathrm{End}(V)$ 和 $\mathrm{GL}(V)$ 就是这些结构的抽象原型。

§13 Hom(V,W) 作为向量空间 ⭐⭐¶

动机¶

我们已经知道单个线性映射的性质。但所有线性映射的**集合**也有丰富的结构——它自身构成一个向量空间。这个观察把"线性映射"从工具提升为对象，允许我们对映射本身做线性代数。

Hom(V,W) 的向量空间结构¶

定义 13.1. $\mathrm{Hom}(V, W) := \{T: V \to W \mid T \text{ 线性}\}$，配上逐点运算：

$(S + T)(v) := S(v) + T(v)$
$(aT)(v) := a \cdot T(v)$

命题 13.2. $\mathrm{Hom}(V, W)$ 是 $F$-向量空间，且 $\dim \mathrm{Hom}(V, W) = \dim V \cdot \dim W$（有限维）。

证明思路. 通过选择 $V$ 和 $W$ 的基，建立同构 $\mathrm{Hom}(V, W) \cong M_{m \times n}(F)$（§17 的矩阵表示），后者的维数为 $mn$。

End(V) 与 GL(V)¶

定义 13.3. - $\mathrm{End}(V) := \mathrm{Hom}(V, V)$——自同态空间，配上复合运算 $\circ$ 构成 $F$-代数 - $\mathrm{GL}(V) := \{T \in \mathrm{End}(V) : T \text{ 可逆}\}$——一般线性群

$\mathrm{GL}(V)$ 在复合下构成**群**——这是后续李群理论（$GL(n, \mathbb{R})$ 作为李群）的起点。

⚠️ 常见陷阱¶

💡 概念误区 13：认为 $\mathrm{End}(V)$ 上的乘法（复合）是交换的

错误想法：$S \circ T = T \circ S$ 对所有 $S, T \in \mathrm{End}(V)$。

实际上：矩阵乘法不交换（$AB \neq BA$ 一般情况），复合也不交换。$\mathrm{End}(V)$ 是非交换代数。

练习¶

练习 13.1（⭐⭐）. 计算 $\dim \mathrm{Hom}(\mathbb{R}^3, \mathbb{R}^2)$。在标准基下，给出 $\mathrm{Hom}(\mathbb{R}^3, \mathbb{R}^2)$ 的一组基（它们是什么样的矩阵？）。

核与像的几何直觉¶

核 $\ker T$ 是被 $T$ "压平"的方向——所有这些方向上的运动经过 $T$ 后消失为零。像 $\mathrm{im}\, T$ 是 $T$ 能"到达"的空间——所有可能的输出值。在机器人学的 Jacobian 分析中，$\ker J$ 是**自运动流形**（self-motion manifold）的切空间，$\mathrm{im}\, J$ 是末端执行器的**可达速度空间**。当 $\mathrm{rank}(J) < \min(\dim V, \dim W)$ 时，机器人处于**奇异位形**——某些方向的末端速度不可达。

§14 核、像、秩、零度 ⭐¶

定义¶

定义 14.1. 设 $T: V \to W$ 线性。

核（kernel）：$\ker T := \{v \in V : T(v) = 0_W\}$
像（image）：$\mathrm{im}\, T := \{T(v) : v \in V\}$
秩（rank）：$\mathrm{rank}(T) := \dim(\mathrm{im}\, T)$
零度（nullity）：$\mathrm{null}(T) := \dim(\ker T)$

命题 14.2. $\ker T \leq V$ 且 $\mathrm{im}\, T \leq W$。

命题 14.3. $T$ 单射 $\Leftrightarrow$ $\ker T = \{0\}$。

证明. ($\Rightarrow$) $T(v) = 0 = T(0) \Rightarrow v = 0$（单射）。($\Leftarrow$) $T(u) = T(v) \Rightarrow T(u-v) = 0 \Rightarrow u - v \in \ker T = \{0\} \Rightarrow u = v$。 $\square$

本质洞察：核衡量了线性映射"丢失信息"的程度。$\ker T = \{0\}$ 意味着 $T$ 没有丢失任何信息（单射）；$\ker T$ 越大，$T$ 丢失的信息越多。秩-零度定理（§15）精确量化了这种信息损失。

核和像的计算方法¶

在实际计算中，给定矩阵 $A \in M_{m \times n}(F)$（即 $T = L_A: F^n \to F^m$）：

求核：解齐次方程组 $Ax = 0$。通过行化简（高斯消元）得到阶梯形，自由变量对应核的基向量。

求像：$\mathrm{im}\, T = \mathrm{span}\{A$ 的列向量$\}$。行化简后，主元列对应的**原始列向量**构成像的基。

为什么像的基用原始列而非化简后的列？ 行化简改变了列空间（列之间的线性关系不变，但具体的列向量变了）。化简后的主元列告诉你**哪些**原始列是独立的，但基应该用原始列。

例 14.1. 设 $A = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \end{pmatrix}$。

行化简：$\begin{pmatrix} 1 & 2 & 3 \\ 0 & 0 & 0 \end{pmatrix}$。

$\ker T$：$x_1 = -2x_2 - 3x_3$，核的基为 $\{(-2, 1, 0), (-3, 0, 1)\}$，$\mathrm{null}(T) = 2$
$\mathrm{im}\, T$：只有第一列是主元列，像的基为 $\{(1, 2)\}$，$\mathrm{rank}(T) = 1$
验证：$\mathrm{rank} + \mathrm{null} = 1 + 2 = 3 = n$

单射、满射与维数的关系¶

命题 14.4. 设 $T: V \to W$ 线性，$V$ 有限维。

性质	等价条件	维数条件
$T$ 单射	$\ker T = \{0\}$	$\mathrm{null}(T) = 0$
$T$ 满射	$\mathrm{im}\, T = W$	$\mathrm{rank}(T) = \dim W$
$T$ 双射	单射 + 满射	$\dim V = \dim W$ 且 $\ker T = \{0\}$

不是 X 而是 Y：单射性不是"$T$ 把不同的向量映到不同的像"（这是定义的字面重述），而是"$T$ 不丢失信息"（$\ker T = \{0\}$ 意味着没有向量被"压缩"到零）。这种理解更深刻——它直接连接到秩-零度定理中的"信息守恒"。

⚠️ 常见陷阱¶

💡 概念误区 14：混淆 $\ker T$（线性映射的核）和零空间 $\mathrm{Null}(A)$（矩阵的零空间）

实际上：它们是同一个东西的不同面目。$\ker T = \mathrm{Null}([T]_\mathcal{B}^\mathcal{C})$。但要注意：$\ker T$ 是 $V$ 的子空间（坐标无关），$\mathrm{Null}(A)$ 是 $F^n$ 的子空间（依赖基的选择）。

🧠 思维陷阱 14：认为秩就是"非零行的个数"

新手想法：$\mathrm{rank}(A)$ = 行化简后非零行的个数。

实际上：这是秩的一种**计算方法**，不是定义。秩的定义是像空间的维数 $\dim(\mathrm{im}\, T)$。"非零行个数"之所以等于秩，是因为行化简不改变行空间，而行秩等于列秩。理解定义而非仅记住计算方法，在推广到更一般的代数结构时至关重要。

练习¶

练习 14.1（⭐）. 求求导映射 $D: \mathbb{R}[x]_{\leq 3} \to \mathbb{R}[x]_{\leq 2}$ 的核和像。计算秩和零度。

练习 14.2（⭐⭐）. 设 $T: M_{2 \times 2}(\mathbb{R}) \to M_{2 \times 2}(\mathbb{R})$，$T(A) = A - A^T$（取反对称部分的两倍）。求 $\ker T$ 和 $\mathrm{im}\, T$，验证秩-零度定理。（提示：$\ker T$ 恰好是对称矩阵空间。）

§15 秩-零度定理 ⭐⭐¶

动机¶

核和像分别衡量了线性映射"丢失"和"保留"的信息量。秩-零度定理说的是：丢失的 + 保留的 = 总共的。这是线性代数最重要的定理之一。

定理陈述¶

定理 15.1（秩-零度定理，又称线性映射基本定理）. 设 $T: V \to W$ 线性，$V$ 有限维。则：

\[\dim V = \mathrm{rank}(T) + \mathrm{null}(T) = \dim(\mathrm{im}\, T) + \dim(\ker T)\]

证明一：基扩展法¶

取 $\ker T$ 的基 $\{u_1, \ldots, u_k\}$，扩展为 $V$ 的基 $\{u_1, \ldots, u_k, v_1, \ldots, v_m\}$。

断言：$\{T(v_1), \ldots, T(v_m)\}$ 是 $\mathrm{im}\, T$ 的基。

张成性. 任取 $w \in \mathrm{im}\, T$，$w = T(v)$ 其中 $v = \sum a_i u_i + \sum b_j v_j$。则：

\[w = T(v) = \sum a_i \underbrace{T(u_i)}_{=0} + \sum b_j T(v_j) = \sum b_j T(v_j)\]

线性独立性. 设 $\sum c_j T(v_j) = 0$，即 $T\left(\sum c_j v_j\right) = 0$，即 $\sum c_j v_j \in \ker T$。

因此 $\sum c_j v_j = \sum d_i u_i$，即 $\sum c_j v_j - \sum d_i u_i = 0$。由 $\{u_1, \ldots, u_k, v_1, \ldots, v_m\}$ 的线性独立性，所有 $c_j = 0$（和 $d_i = 0$）。

因此 $\mathrm{rank}(T) = m = (k + m) - k = \dim V - \mathrm{null}(T)$。 $\square$

证明二：商空间法¶

构造 $\bar{T}: V/\ker T \to W$，$\bar{T}(v + \ker T) := T(v)$。

良定义：$v_1 + \ker T = v_2 + \ker T \Rightarrow v_1 - v_2 \in \ker T \Rightarrow T(v_1) = T(v_2)$
单射：$\bar{T}(v + \ker T) = 0 \Rightarrow T(v) = 0 \Rightarrow v \in \ker T \Rightarrow v + \ker T = 0_{V/\ker T}$
$\mathrm{im}\, \bar{T} = \mathrm{im}\, T$

因此 $\bar{T}$ 给出同构 $V/\ker T \cong \mathrm{im}\, T$（这就是第一同构定理）。

取维数：$\dim V - \dim \ker T = \dim(V/\ker T) = \dim \mathrm{im}\, T$。 $\square$

两种证明的比较：证明一更"计算性"——直接构造基。证明二更"概念性"——揭示了秩-零度定理背后的同构 $V/\ker T \cong \mathrm{im}\, T$。后者在代数学中更具普适性：群论、环论中的同构定理都遵循同样的模式。

推论¶

推论 15.2. 设 $\dim V = \dim W = n$，$T: V \to W$ 线性。则：

\[T \text{ 单射} \Leftrightarrow T \text{ 满射} \Leftrightarrow T \text{ 双射}\]

证明. 单射 $\Leftrightarrow \mathrm{null}(T) = 0 \Leftrightarrow \mathrm{rank}(T) = n \Leftrightarrow \mathrm{im}\, T = W \Leftrightarrow$ 满射。 $\square$

反事实推理：这个推论在无限维时**不成立**。考虑右移算子 $R: F[x] \to F[x]$，$R(p(x)) = xp(x)$。$R$ 是单射（$xp = xq \Rightarrow p = q$），但不是满射（常数多项式不在 $\mathrm{im}\, R$ 中）。有限维的特殊性在于：$\dim V = n$ 是一个**有限数**，所以 $\mathrm{rank} + \mathrm{null} = n$ 构成了一个"零和博弈"。

⚠️ 常见陷阱¶

🧠 思维陷阱 15：在无限维空间中使用推论 15.2

新手想法：单射线性算子必然是满射的。

实际上：只在有限维时成立。无限维空间中存在单射但不满射（右移）和满射但不单射（左移）的线性算子。

练习¶

练习 15.1（⭐⭐）. 设 $T: \mathbb{R}^4 \to \mathbb{R}^3$ 的矩阵表示为 $A = \begin{pmatrix} 1 & 2 & 0 & 1 \\ 0 & 0 & 1 & 3 \\ 1 & 2 & 1 & 4 \end{pmatrix}$。求 $\ker T$、$\mathrm{im}\, T$、$\mathrm{rank}(T)$、$\mathrm{null}(T)$，验证秩-零度定理。

练习 15.2（⭐⭐⭐）. 用商空间法重新证明秩-零度定理，并明确写出同构 $\bar{T}: V/\ker T \to \mathrm{im}\, T$ 的定义和所有验证步骤。

§16 同构定理 ⭐⭐¶

第一同构定理¶

定理 16.1（第一同构定理）. 设 $T: V \to W$ 线性。则：

\[V / \ker T \cong \mathrm{im}\, T\]

同构由 $\bar{T}(v + \ker T) := T(v)$ 给出。已在 §15.3 证明。

第二、第三同构定理¶

定理 16.2（第二同构定理）. 设 $W_1, W_2 \leq V$。则 $W_1 / (W_1 \cap W_2) \cong (W_1 + W_2) / W_2$。

定理 16.3（第三同构定理）. 设 $W_1 \leq W_2 \leq V$。则 $(V/W_1) / (W_2/W_1) \cong V/W_2$。

这三个同构定理在群论和环论中也有完全平行的版本——它们是代数学的"通用模式"。

练习¶

练习 16.1（⭐⭐⭐）. 通过定义恰当的线性映射并应用第一同构定理来证明第二同构定理。（提示：考虑 $T: W_1 \to (W_1 + W_2)/W_2$，$T(w_1) = w_1 + W_2$。）

§17 矩阵表示、基变换、相似 ⭐⭐¶

矩阵表示¶

定义 17.1. 设 $\mathcal{B} = (v_1, \ldots, v_n)$ 为 $V$ 的有序基，$\mathcal{C} = (w_1, \ldots, w_m)$ 为 $W$ 的有序基。$T: V \to W$ 的**矩阵表示** $[T]_\mathcal{B}^\mathcal{C}$ 定义为：第 $j$ 列是 $T(v_j)$ 在基 $\mathcal{C}$ 下的坐标。

\[T(v_j) = \sum_{i=1}^{m} a_{ij} w_i \quad \Longrightarrow \quad [T]_\mathcal{B}^\mathcal{C} = (a_{ij})_{m \times n}\]

矩阵乘法的来源¶

定理 17.2. $[S \circ T]_\mathcal{B}^\mathcal{E} = [S]_\mathcal{C}^\mathcal{E} \cdot [T]_\mathcal{B}^\mathcal{C}$。

本质洞察：矩阵乘法的定义不是任意的——它恰好使"矩阵表示"成为一个**保持复合的映射**（即同态/函子）。"$AB$ 的第 $(i,j)$ 元素是第 $i$ 行和第 $j$ 列的点积"这个看似神秘的公式，其实就是复合映射的坐标表示。

基变换公式¶

定理 17.3. 设 $\mathcal{B}, \mathcal{B}'$ 是 $V$ 的两组基，$P := [\mathrm{id}_V]_{\mathcal{B}'}^\mathcal{B}$（基变换矩阵）。则对 $T \in \mathrm{End}(V)$：

\[[T]_{\mathcal{B}'} = P^{-1} [T]_\mathcal{B}\, P\]

相似矩阵：$A \sim B \iff \exists P \in GL_n(F),\, B = P^{-1}AP$。相似矩阵是同一个线性算子在不同基下的矩阵表示。

相似不变量¶

相似变换 $A \mapsto P^{-1}AP$ 不改变的量称为**相似不变量**：

不变量	公式/性质
迹 $\mathrm{tr}(A)$	$\mathrm{tr}(P^{-1}AP) = \mathrm{tr}(A)$，因为 $\mathrm{tr}(AB) = \mathrm{tr}(BA)$
行列式 $\det(A)$	$\det(P^{-1}AP) = \det(A)$
秩 $\mathrm{rank}(A)$	秩是像空间的维数，不依赖基
特征多项式	前瞻至 §A2c/A2d

⚠️ 常见陷阱¶

💡 概念误区 17：混淆 $P^{-1}AP$ 和 $PAP^{-1}$

错误想法：基变换公式是 $[T]_{\mathcal{B}'} = P [T]_\mathcal{B}\, P^{-1}$。

实际上：取决于 $P$ 的定义方向。本章约定 $P = [\mathrm{id}]_{\mathcal{B}'}^\mathcal{B}$（从新基到旧基），此时公式为 $P^{-1} [T]_\mathcal{B}\, P$。一些教材用相反的约定，公式就变成 $P [T]_\mathcal{B}\, P^{-1}$。关键是保持一致。

🧠 思维陷阱 17：认为"相似矩阵是相同的矩阵"

新手想法：$A \sim B$ 就是 $A = B$。

实际上：$A$ 和 $B$ 可以看起来完全不同，但它们表示同一个线性算子。相似不变量（迹、行列式、秩等）相同，但矩阵元素一般不同。

矩阵表示与坐标的关系¶

矩阵表示的核心等式是：

\[[T(v)]_\mathcal{C} = [T]_\mathcal{B}^\mathcal{C} \cdot [v]_\mathcal{B}\]

即**像的坐标 = 矩阵 $\times$ 原象的坐标**。这个等式把抽象的线性映射"翻译"成了矩阵乘法——后者可以交给计算机处理。

证明. 设 $v = \sum_j x_j v_j$（$x_j$ 是 $v$ 在基 $\mathcal{B}$ 下的坐标），$T(v_j) = \sum_i a_{ij} w_i$。则：

\[T(v) = T\left(\sum_j x_j v_j\right) = \sum_j x_j T(v_j) = \sum_j x_j \sum_i a_{ij} w_i = \sum_i \left(\sum_j a_{ij} x_j\right) w_i\]

因此 $[T(v)]_\mathcal{C}$ 的第 $i$ 个分量是 $\sum_j a_{ij} x_j$——这正是矩阵乘法 $A \cdot x$ 的第 $i$ 个分量。 $\square$

基变换的完整推导¶

基变换公式 $[T]_{\mathcal{B}'} = P^{-1}[T]_\mathcal{B} P$ 的完整推导如下。

设 $\mathcal{B}$ 和 $\mathcal{B}'$ 是 $V$ 的两组基。基变换矩阵 $P$ 定义为恒等映射 $\mathrm{id}_V: V \to V$ 在基 $\mathcal{B}'$（域）和 $\mathcal{B}$（陪域）下的矩阵：

\[P = [\mathrm{id}_V]_{\mathcal{B}'}^{\mathcal{B}}\]

$P$ 的第 $j$ 列是 $\mathcal{B}'$ 的第 $j$ 个基向量 $v_j'$ 在基 $\mathcal{B}$ 下的坐标。

由定理 17.2（矩阵乘法 = 复合映射的矩阵表示）：

\[[T]_{\mathcal{B}'}^{\mathcal{B}'} = [\mathrm{id}_V]_{\mathcal{B}}^{\mathcal{B}'} \cdot [T]_{\mathcal{B}}^{\mathcal{B}} \cdot [\mathrm{id}_V]_{\mathcal{B}'}^{\mathcal{B}} = P^{-1} [T]_\mathcal{B} P\]

这里 $[\mathrm{id}_V]_{\mathcal{B}}^{\mathcal{B}'} = ([\mathrm{id}_V]_{\mathcal{B}'}^{\mathcal{B}})^{-1} = P^{-1}$（恒等映射在交换基方向后取逆）。

类比：基变换公式 $B = P^{-1}AP$ 可以理解为"先把新坐标翻译成旧坐标（$P$），再用旧基下的矩阵做变换（$A$），最后把结果翻译回新坐标（$P^{-1}$）"。这就像在两种语言之间做翻译：先翻译成共同语言，做运算，再翻译回来。类似的地方在于"两次坐标转换夹着核心操作"这个模式；**不像**的是：语言翻译可能有歧义，而坐标变换是精确的同构。

练习¶

练习 17.1（⭐⭐）. 设 $T: \mathbb{R}^2 \to \mathbb{R}^2$ 在标准基下的矩阵为 $A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix}$。在基 $\mathcal{B}' = ((1,1), (1,-1))$ 下，$T$ 的矩阵是什么？

练习 17.2（⭐⭐）. 证明迹是相似不变量：$\mathrm{tr}(P^{-1}AP) = \mathrm{tr}(A)$。（提示：先证明 $\mathrm{tr}(AB) = \mathrm{tr}(BA)$ 对任意方阵成立，然后应用到 $\mathrm{tr}((P^{-1}A)P) = \mathrm{tr}(P(P^{-1}A))$。）

相似不变量的系统分类¶

不变量	定义	是否完全分类？	说明
迹 $\mathrm{tr}(A)$	对角元素之和	否	不同矩阵可以有相同的迹
行列式 $\det(A)$	有向体积缩放因子	否	不同矩阵可以有相同的行列式
秩 $\mathrm{rank}(A)$	像的维数	否	只刻画核与像的维数
特征多项式 $\chi_T(\lambda)$	$\det(\lambda I - A)$	否（一般域）	不能区分 Jordan 块结构
极小多项式 $m_T(\lambda)$	零化 $T$ 的最低次首一多项式	否	与特征多项式一起仍不够
Jordan 标准形	代数闭域上的完全规范形	是（代数闭域）	完全分类相似等价类
有理标准形	任意域上的完全规范形	是	完全分类相似等价类

本质洞察：相似不变量回答的核心问题是："怎样判断两个矩阵是否代表**同一个**线性映射（只是基不同）？" 迹和行列式是"弱不变量"——必要但不充分。Jordan 标准形（或有理标准形）是"完全不变量"——两个矩阵相似当且仅当它们有相同的标准形。这就像"指纹"——迹和行列式是"身高体重"（可以有同样身高体重的不同人），Jordan 标准形是"指纹"（唯一确定）。

§18 不变子空间 ⭐⭐¶

动机¶

给定 $T \in \mathrm{End}(V)$，如果能找到一个子空间 $W$ 使得 $T$ "不把 $W$ 中的向量弹出 $W$"，那么 $T$ 在 $W$ 上的行为可以独立研究。如果能把 $V$ 分解为 $T$-不变子空间的直和 $V = W_1 \oplus \cdots \oplus W_k$，则 $T$ 的矩阵变成块对角形——大大简化分析。这就是不变子空间的动机。

定义 18.1. $W \leq V$ 是 $T \in \mathrm{End}(V)$ 的**不变子空间**（invariant subspace），若 $T(W) \subseteq W$。

基本例子：$\{0\}$、$V$、$\ker T$、$\mathrm{im}\, T$ 都是 $T$-不变的。

定理 18.2. 若 $V = W_1 \oplus \cdots \oplus W_k$ 且每个 $W_i$ 是 $T$-不变的，则存在基使 $[T] = \mathrm{diag}(A_1, \ldots, A_k)$，其中 $A_i = [T|_{W_i}]$。

"找到好的不变子空间分解"="化简矩阵"——这是线性代数的中心问题。后续的特征空间（§A2c）和广义特征空间（§A2d）都是特殊的不变子空间。

不变子空间的例子与非例子¶

例 18.1. 设 $T: \mathbb{R}^2 \to \mathbb{R}^2$ 是逆时针旋转 $90°$，矩阵为 $A = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}$。

$\{0\}$ 和 $\mathbb{R}^2$ 是 $T$-不变的（总是如此）
**没有**非平凡的 $T$-不变子空间。因为 $\mathbb{R}^2$ 中的一维子空间就是过原点的直线，但旋转 $90°$ 把任何直线变成另一条直线（不是自身）
这说明不是所有算子都有非平凡不变子空间（至少在 $\mathbb{R}$ 上）

例 18.2. 设 $T: \mathbb{R}^3 \to \mathbb{R}^3$ 的矩阵为 $A = \begin{pmatrix} 2 & 0 & 0 \\ 0 & 3 & 0 \\ 0 & 0 & 3 \end{pmatrix}$（对角矩阵）。

每个坐标轴 $\mathrm{span}\{e_i\}$ 都是一维不变子空间。$\mathrm{span}\{e_2, e_3\}$ 是二维不变子空间。$V = \mathrm{span}\{e_1\} \oplus \mathrm{span}\{e_2, e_3\}$ 给出了不变子空间的直和分解。

理论-工程桥接：在机器人学中，不变子空间的概念出现在控制理论的**可控性分解**中。系统 $\dot{x} = Ax + Bu$ 中，可控子空间是 $A$ 的不变子空间，把系统分解为可控部分和不可控部分——这正是不变子空间直和分解的工程应用。

为什么不变子空间重要¶

寻找不变子空间等价于"简化矩阵"。如果 $V = W_1 \oplus W_2$ 且两个子空间都是 $T$-不变的，则在适当基下 $T$ 的矩阵是块对角的：

\[[T] = \begin{pmatrix} A_1 & 0 \\ 0 & A_2 \end{pmatrix}\]

这意味着 $T$ 在 $W_1$ 和 $W_2$ 上的行为可以**独立分析**。$n \times n$ 矩阵的问题被分解为两个更小矩阵的问题。

"找到好的不变子空间分解"="化简矩阵"——这是线性代数的中心问题。后续章节中： - 特征空间（§A2c）是特殊的不变子空间，对应对角化 - 广义特征空间（§A2d）是更精细的不变子空间，对应 Jordan 标准形 - 不变子空间的**不存在**（如实数域上旋转的情况）迫使我们转向复数域

⚠️ 常见陷阱¶

💡 概念误区 18：认为"每个算子都能分解为一维不变子空间的直和"

实际上：一维不变子空间对应特征向量。旋转矩阵 $\begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}$ 在 $\mathbb{R}$ 上没有特征值，因此没有一维不变子空间。这是引入 $\mathbb{C}$（代数闭域）的动机之一。

🧠 思维陷阱 18：认为不变子空间分解等于对角化

新手想法：如果 $V = W_1 \oplus W_2$ 且都 $T$-不变，那 $T$ 就对角化了。

实际上：块对角化不等于对角化。$T$ 在 $W_1$ 上的限制 $T|_{W_1}$ 可能本身不能对角化——例如 $A_1$ 可能是一个 Jordan 块。对角化要求**每个块都是** $1 \times 1$ 的——即要求每个不变子空间都是一维的。

练习¶

练习 18.1（⭐⭐）. 设 $T: \mathbb{R}^3 \to \mathbb{R}^3$ 在标准基下的矩阵为 $A = \begin{pmatrix} 2 & 0 & 0 \\ 0 & 1 & 1 \\ 0 & 0 & 1 \end{pmatrix}$。找出所有 $T$-不变子空间。（提示：先找特征值和特征向量。）

练习 18.2（⭐⭐⭐）. 证明：$\ker T^k$（$k = 1, 2, 3, \ldots$）都是 $T$-不变子空间。证明 $\ker T \subseteq \ker T^2 \subseteq \ker T^3 \subseteq \cdots$。（这个递增链在后续 Jordan 标准形理论中扮演核心角色。）

不变子空间在机器人学中的意义¶

不变子空间的概念在机器人学中有直接应用：

数学概念	机器人学对应	说明
$T$-不变子空间 $W$	动力学系统的不变流形	系统状态一旦进入 $W$，将永远留在 $W$ 内
块对角化	解耦控制	将多自由度系统分解为独立子系统
$\ker T$ 作为不变子空间	零空间/零动力学	系统的"内部运动模式"
$\mathrm{im}\, T$ 作为不变子空间	可达空间	系统能够到达的状态集

如果不这样做（反事实推理）：不寻找不变子空间分解，我们面对的是一个 $n \times n$ 的"全耦合"矩阵——所有分量相互作用，分析和计算都极其困难。找到好的不变子空间分解，就是把大问题拆成若干独立的小问题。这正是对角化（或 Jordan 标准形、Schur 分解）的核心动机。

§A2a.18.3 不可约算子与不变子空间问题¶

🟣 进阶

知识点¶

$T \in \mathrm{End}(V)$ 称为**不可约的**（irreducible）如果 $V$ 没有非平凡的 $T$-不变子空间
有限维代数闭域（如 $\mathbb{C}$）上，不可约算子只有 $1$ 维的不变子空间（由特征向量张成）
不变子空间问题（Invariant Subspace Problem）：是否每个 Hilbert 空间上的有界算子都有非平凡闭不变子空间？这是泛函分析的一个著名开放问题（Enflo 1987 给出了 Banach 空间上的反例，但 Hilbert 空间情形至今未解决）

⚠️ 常见陷阱（第三幕：线性变换）¶

💡 概念误区：认为"矩阵就是线性映射"

新手想法："线性映射和矩阵是一回事，只是不同的说法。"

实际上：矩阵是线性映射在**选定了定义域和值域的有序基之后**的坐标表示。同一个线性映射 $T: V \to W$ 在不同的基下有不同的矩阵表示。矩阵是**依赖坐标系**的对象，而线性映射是**坐标无关**的对象。把矩阵等同于线性映射，就像把"北京在上海的西北方向 1068 公里处"等同于"北京"——前者依赖于参考点（上海）和坐标系，后者是一个独立于坐标系的地理实体。

为什么重要：在机器人学中，Jacobian 矩阵 $J(\theta)$ 的数值取决于关节角度的参数化方式和参考坐标系的选择。但 Jacobian 所代表的线性映射（从关节速度空间到末端执行器速度空间）是坐标无关的物理量。混淆两者会导致坐标系变换时出错。

🧠 思维陷阱：在有限维等维空间之间，忘记"单射 $\Leftrightarrow$ 满射 $\Leftrightarrow$ 双射"

新手想法："证明 $T: V \to V$ 可逆需要同时验证单射和满射。"

实际上：当 $\dim V = \dim W < \infty$ 时，秩-零度定理保证：$T$ 单射 $\Leftrightarrow$ $\ker T = \{0\}$ $\Leftrightarrow$ $\mathrm{rank}(T) = \dim V$ $\Leftrightarrow$ $T$ 满射 $\Leftrightarrow$ $T$ 双射。只需验证其中任何一个条件。但在**无限维**中这个等价性**失效**：左移位算子 $L: (a_1, a_2, a_3, \ldots) \mapsto (a_2, a_3, \ldots)$ 是满射但不是单射，右移位算子 $R: (a_1, a_2, \ldots) \mapsto (0, a_1, a_2, \ldots)$ 是单射但不是满射。

正确思维：有限维的"好性质"来自维数的有限性约束。无限维时需要额外小心。

💡 概念误区：认为"秩-零度定理只是一个维数等式"

新手想法："$\dim V = \mathrm{rank}(T) + \mathrm{null}(T)$，就是一个数值关系。"

实际上：秩-零度定理的深层含义是**结构分解**——$V$ 可以分成两部分：$\ker T$（被 $T$ 压成零的部分）和 $\ker T$ 的一个补空间（被 $T$ 同构映射到 $\mathrm{im}\, T$ 的部分）。商空间证法（§A2a.15.3）揭示了更深层的结构：$V/\ker T \cong \mathrm{im}\, T$（第一同构定理）。这不只是维数相等，而是**空间本身同构**。

为什么重要：在机器人学中，Jacobian 的零空间 $\ker J$ 对应冗余自由度（不影响末端执行器运动的关节速度方向），$\mathrm{im}\, J$ 对应可达的末端速度方向。秩-零度定理说这两部分的维数之和等于关节数——这就是"冗余度 + 任务空间维数 = 关节自由度"。

练习（第三幕）¶

（推导题） 设 $T: \mathbb{R}^4 \to \mathbb{R}^3$ 的矩阵表示（在标准基下）为 $A = \begin{pmatrix} 1 & 2 & 0 & 1 \\ 0 & 0 & 1 & 3 \\ 1 & 2 & 1 & 4 \end{pmatrix}$。求 $\ker T$ 的一组基和 $\mathrm{im}\, T$ 的一组基，验证秩-零度定理 $\dim \mathbb{R}^4 = \mathrm{rank}(T) + \mathrm{null}(T)$。在草稿纸上完成。
（证明题） 用第一同构定理证明：设 $T: V \to W$ 是满射线性映射，则 $V/\ker T \cong W$。明确构造同构映射 $\bar{T}: V/\ker T \to W$ 并验证它是良定义的、线性的、双射的。
（开放思考题） 设 $V = \mathbb{R}^6$（关节速度空间），$W = \mathbb{R}^6$（末端执行器速度空间），$T = J(\theta)$（Jacobian）。当机器人处于奇异位形时，$\mathrm{rank}(J) < 6$。用秩-零度定理解释：(a) 奇异位形下哪些末端速度方向不可达？(b) 冗余关节运动的维数是多少？

第三幕到此结束。我们已经建立了线性变换的完整理论：定义、核/像、秩-零度定理、矩阵表示、基变换、不变子空间。下面进入本章最深刻的第四幕——对偶理论。

第四幕：对偶理论¶

第四幕的目标是建立对偶空间 $V^*$ 的理论。对偶性是线性代数中最优雅、最深刻的概念之一——它揭示了"测量"和"被测量"之间的对称关系。在机器人学中，twist 与 wrench、速度与力、协方差矩阵与信息矩阵之间的对偶关系，都是这个理论的直接应用。

对偶配对的多维直觉¶

在 $\mathbb{R}^n$ 中，对偶配对 $\langle f, v \rangle = f(v)$ 就是**点积**（在标准基下）。但对偶配对比点积更基本——它不需要"长度"和"角度"的概念（不需要内积），只需要线性结构。

类比：对偶配对就像"温度计"和"温度场"的关系。温度场 $v$（向量）描述空间中每一点的温度分布，温度计 $f$（线性泛函）在某个位置"读出"一个数值 $f(v)$。不同的温度计（不同的 $f$）在同一个温度场上读出不同的数值。温度计不需要知道温度场的"大小"（不需要内积），只需要线性地读出温度。这个类比的边界在于：真实的温度计是非线性的，而 $f \in V^*$ 要求严格线性。

对偶配对在优化中的角色¶

在凸优化中，Lagrange 对偶理论的核心就是对偶配对。原问题的决策变量 $x \in V$，对偶变量（Lagrange 乘子）$\lambda \in V^*$。Lagrange 函数 $L(x, \lambda) = f(x) + \langle \lambda, g(x) \rangle$ 中的 $\langle \lambda, g(x) \rangle$ 就是对偶配对。强对偶性意味着"在原空间找最优"和"在对偶空间找最优"给出相同的答案——这是 $V$ 和 $V^*$ 的深层对称性。

§19 对偶空间 V* 与对偶配对 ⭐⭐¶

动机¶

考虑一个具体问题：你有一个三维空间中的力 $\mathbf{F}$ 和一个速度 $\mathbf{v}$。它们的配对 $\mathbf{F} \cdot \mathbf{v}$ 给出**功率**（一个标量）。但这里有一个微妙的问题：力和速度**住在不同的空间里**吗？

在朴素的理解中，力和速度都是 $\mathbb{R}^3$ 中的向量。但当我们考虑坐标变换时，它们的行为不同——速度按 $v' = Rv$ 变换，而力按 $F' = (R^{-1})^T F = R F$（在正交基下 $R^{-1} = R^T$ 所以看不出区别）。在非正交坐标系中，区别就明显了：速度是**逆变**（contravariant）量，力是**协变**（covariant）量。

对偶空间的概念精确地把这种区别形式化：力住在速度空间的**对偶空间**中。

如果不区分 $V$ 和 $V^*$ 会怎样¶

在正交坐标系中，$V$ 和 $V^*$ 通过内积自然等同，所以不区分也没问题。但一旦： - 使用非正交坐标（如广义坐标 $q_i$） - 在不同参考系之间变换（如机器人学中的 body frame 和 spatial frame） - 处理李群上的动力学

区分 $V$ 和 $V^*$ 就变得至关重要。混淆它们会导致**坐标变换公式出错**。

定义¶

定义 19.1. 线性泛函（linear functional）是从向量空间到标量域的线性映射 $f: V \to F$。

定义 19.2. $V$ 的**对偶空间**（dual space）是所有线性泛函的集合：

\[V^* := \mathrm{Hom}(V, F)\]

由 §13 的结果，$V^*$ 自身是一个 $F$-向量空间。

定义 19.3. 对偶配对（canonical pairing）$\langle \cdot, \cdot \rangle: V^* \times V \to F$，定义为 $\langle f, v \rangle := f(v)$。

对偶配对的几何意义¶

线性泛函 $f \in V^*$ 可以理解为一种"测量"——它把向量映射到标量，衡量向量在某个"方向"上的"分量"。

$f$ 的核 $\ker f$ 是 $V$ 中的一个**超平面**（codimension-1 子空间）。不同的 $f$ 对应不同的超平面——即不同的"切片方向"。

类比（机器人学）：在机器人学中，twist $\mathcal{V} \in \mathfrak{se}(3)$ 是速度（住在李代数中），wrench $\mathcal{F} \in \mathfrak{se}(3)^*$ 是力/力矩（住在对偶李代数中）。它们的配对 $\langle \mathcal{F}, \mathcal{V} \rangle = \mathbf{m} \cdot \boldsymbol{\omega} + \mathbf{f} \cdot \mathbf{v}$ 是瞬时**功率**——一个标量，不依赖参考系的选择。这个类比在"配对给出标量"这一点上完全准确；**不像**的地方在于 $\mathfrak{se}(3)$ 不是普通向量空间而是李代数，有额外的 Lie 括号结构。

⚠️ 常见陷阱¶

💡 概念误区 19：认为 $V^*$ 和 $V$ "没有区别"

错误想法：在有限维中 $\dim V^* = \dim V$，所以 $V^* = V$。

实际上：$V^*$ 和 $V$ 维数相同意味着它们**同构**，但同构需要**选择一组基**才能建立。换一组基，同构就不同。$V^*$ 和 $V$ 是两个**不同的向量空间**——它们的元素有不同的物理含义（速度 vs 力）和不同的变换规律（逆变 vs 协变）。

为什么重要：在机器人学中，twist 和 wrench 的变换规律不同——twist 按 $\mathrm{Ad}_T$ 变换，wrench 按 $\mathrm{Ad}_T^{-T}$ 变换。混淆它们会导致动力学方程写错。

🧠 思维陷阱 19：跳过对偶空间直接学内积空间

新手想法：有了内积就能把力和速度放在同一个空间里，不需要对偶空间。

实际上：内积提供了 $V \cong V^*$ 的**一个特定**同构（Riesz 表示定理），但这个同构**依赖内积的选择**。在不同的度量下（如不同的惯性张量），同一个 wrench 对应不同的 twist。对偶空间的概念是**先于内积**的——它告诉你力和速度的关系不需要度量就能表述（通过功率配对）。

练习¶

练习 19.1（⭐⭐）. 设 $V = \mathbb{R}^3$，$f(x_1, x_2, x_3) = 2x_1 - x_2 + 3x_3$。(a) 验证 $f \in V^*$。(b) 求 $\ker f$（描述为 $\mathbb{R}^3$ 中的超平面）。(c) 计算 $\langle f, (1, 2, 3) \rangle$。

§20 对偶基（有限维）⭐⭐¶

动机¶

在 $V$ 中选一组基 $\mathcal{B} = (v_1, \ldots, v_n)$ 后，$V^*$ 中有没有与之"配套"的自然基？答案是肯定的——对偶基 $(f_1, \ldots, f_n)$，定义为"第 $i$ 个对偶基向量只测量第 $i$ 个坐标分量"。

对偶基的构造¶

定义 20.1. 设 $\mathcal{B} = (v_1, \ldots, v_n)$ 是 $V$ 的基。对偶基 $(f_1, \ldots, f_n)$ 由以下条件唯一确定：

\[f_i(v_j) = \delta_{ij} = \begin{cases} 1 & \text{if } i = j \\ 0 & \text{if } i \neq j \end{cases}\]

$f_i$ 的存在性由定理 12.2 保证——线性映射由基的像唯一确定，所以只需指定 $f_i$ 在基 $v_1, \ldots, v_n$ 上的值为 $\delta_{i1}, \ldots, \delta_{in}$。

定理 20.2. $(f_1, \ldots, f_n)$ 是 $V^*$ 的基。特别地，$\dim V^* = \dim V$。

证明.

线性独立：设 $\sum a_i f_i = 0$，即 $\left(\sum a_i f_i\right)(v) = 0$ 对所有 $v \in V$。取 $v = v_j$：

\[0 = \sum_{i} a_i f_i(v_j) = \sum_{i} a_i \delta_{ij} = a_j\]

所以所有 $a_j = 0$。

张成：对任意 $f \in V^*$，构造 $g = \sum_{i=1}^{n} f(v_i) f_i$。对任意 $v_j$：

\[g(v_j) = \sum_{i} f(v_i) f_i(v_j) = \sum_{i} f(v_i) \delta_{ij} = f(v_j)\]

由于 $f$ 和 $g$ 在基上的值相同，由线性映射的唯一性（定理 12.2），$f = g = \sum f(v_i) f_i$。

因此 $(f_1, \ldots, f_n)$ 线性独立且张成 $V^*$，是 $V^*$ 的基。 $\square$

重要警告：这个证明在**无限维时失效**。张成部分的"$\sum f(v_i) f_i$"变成无穷和——但 Hamel 基要求有限线性组合。§21 将解释这一失效的深刻后果。

⚠️ 常见陷阱¶

💡 概念误区 20：认为对偶基不依赖原始基的选择

错误想法：$V^*$ 有一个"自然的"基。

实际上：对偶基 $(f_1, \ldots, f_n)$ 完全依赖 $\mathcal{B} = (v_1, \ldots, v_n)$ 的选择。换一组基 $\mathcal{B}'$，对偶基也会改变。$V^*$ 没有"天然的"基——正如 $V$ 本身也没有。

🧠 思维陷阱 20：混淆对偶基和标准基

新手想法：$\mathbb{R}^n$ 的对偶基就是标准基 $e_1, \ldots, e_n$。

实际上：$\mathbb{R}^n$ 的对偶空间 $(\mathbb{R}^n)^*$ 与 $\mathbb{R}^n$ 同构但不相等。标准基的对偶基是 $f_i(x_1, \ldots, x_n) = x_i$（投影到第 $i$ 个坐标），这是 $(\mathbb{R}^n)^*$ 中的元素（线性泛函），不是 $\mathbb{R}^n$ 中的向量。

练习¶

练习 20.1（⭐⭐）. 设 $V = \mathbb{R}^2$，$\mathcal{B} = ((1,1), (1,-1))$。明确写出对偶基 $f_1, f_2$（作为 $\mathbb{R}^2 \to \mathbb{R}$ 的线性函数）。

练习 20.2（⭐⭐）. 证明：若 $\mathcal{B}'$ 是另一组基，$\mathcal{B}^{*\prime}$ 是其对偶基，则从 $\mathcal{B}^*$ 到 $\mathcal{B}^{*\prime}$ 的基变换矩阵是从 $\mathcal{B}$ 到 $\mathcal{B}'$ 的基变换矩阵的**逆转置** $(P^{-1})^T$。

两类基的对照表¶

方面	Hamel 基（代数基）	Schauder 基（拓扑基）
组合类型	有限线性组合	无穷级数（需要拓扑收敛）
存在条件	需要 AC（Zorn 引理）	需要拓扑结构，不一定存在
大小	可以是任意基数	至多可数（可分空间中）
对偶	代数对偶 $V^$，$\dim V^ > \dim V$	连续对偶 $V'$，可能 $V \cong V'$
典型例子	$\mathbb{R}$ 的 $\mathbb{Q}$-Hamel 基（不可数，不可构造）	$\ell^2$ 的标准基 $\{e_n\}_{n=1}^\infty$
实用性	纯理论工具	工程中广泛使用（Fourier 展开等）

类比：Hamel 基就像"用有限多块砖可以精确拼出任何向量"——但在无限维空间中，需要无穷多块砖，而且我们无法具体描述这些砖是什么。Schauder 基则像"用无穷多块越来越小的砖逐渐逼近任何向量"——每一步只是近似，但极限是精确的。两者的区别在于"精确的有限拼接"vs"近似的无穷逼近"。

§21 对偶空间的无限维行为 ⭐⭐⭐¶

动机¶

§20 证明了 $\dim V^* = \dim V$（有限维）。在无限维中，情况发生了戏剧性的变化——$V^*$ 比 $V$ "大得多"。这不是一个技术细节，而是揭示了有限维线性代数和无限维分析之间的**根本断裂**。

Erdos-Kaplansky 定理¶

定理 21.1（Erdos-Kaplansky）. 设 $V$ 是域 $F$ 上的无限维向量空间，$\dim V = \kappa$（无限基数）。则：

\[\dim V^* = |F|^\kappa\]

当 $F$ 无限且 $\kappa \geq \aleph_0$ 时，由 Cantor 定理 $|F|^\kappa > \kappa$。

推论：无限维时 $\dim V^* > \dim V$，所以 $V \not\cong V^*$。

直觉：$V$ 的元素是"有限支撑"的——每个向量是基元素的**有限**线性组合。$V^*$ 的元素是"任意支撑"的——一个线性泛函可以在基的**每个**元素上取非零值。"任意支撑"的函数远比"有限支撑"的向量多得多。

Hamel 基 vs Schauder 基¶

概念	Hamel 基	Schauder 基
线性组合	有限和	无穷级数（拓扑收敛）
需要拓扑？	否	是
对偶	代数对偶 $V^*$	连续对偶 $V'$
$V \cong V'$？	否（$\dim V^* > \dim V$）	可能（如 Hilbert 空间 Riesz 定理）

本章只讨论**代数对偶** $V^*$。拓扑对偶留给后续泛函分析。

⚠️ 常见陷阱¶

💡 概念误区 21：混淆代数对偶 $V^*$ 和连续对偶 $V'$

错误想法：$V^*$ 和 $V'$ 是同一个东西。

实际上：在有限维时它们一致（所有线性映射都自动连续）。在无限维时，$V' \subsetneq V^*$——连续线性泛函只是所有线性泛函的一小部分。Hilbert 空间中 $V \cong V'$（Riesz 定理），但 $V \not\cong V^*$。

练习¶

练习 21.1（⭐⭐⭐）. 设 $V = \mathbb{R}[x]$（所有多项式），$F = \mathbb{R}$。构造一个线性泛函 $f \in V^*$ 使得 $f(x^n) \neq 0$ 对**所有** $n$。解释为什么 $f$ 不在对偶基的张成中（即 $f$ 不能表示为对偶基元素的**有限**线性组合）。

自反空间的概念（预告）¶

在泛函分析中，一个赋范线性空间 $V$ 称为**自反的**（reflexive）如果评估映射 $\mathrm{ev}: V \to V^{**}$ 是满射（因而是等距同构）。注意这里的 $V^{**}$ 是**连续**二次对偶。

空间	自反？	原因
有限维空间	是	维数相等，$\mathrm{ev}$ 自动满射
$L^p$ ($1 < p < \infty$)	是	经典结果，$(L^p)^* = L^q$，$1/p + 1/q = 1$
$L^1$	否	$(L^1)^* = L^\infty$，$(L^\infty)^* \supsetneq L^1$
$\ell^1$	否	$(\ell^1)^* = \ell^\infty$，但 $(\ell^\infty)^* \neq \ell^1$
Hilbert 空间	是	Riesz 表示定理给出 $H \cong H^*$

自反性在最优控制理论中很重要：当状态空间是自反 Banach 空间时，许多最优控制问题的解的存在性可以通过弱紧性论证得到。非自反空间中可能出现"解存在但不可达"的病态情况。

§22 二次对偶 V** 与评估映射 ⭐⭐¶

动机¶

$V^*$ 是 $V$ 的对偶空间。$V^{**} := (V^*)^*$ 是对偶的对偶——二次对偶空间。惊人的是，$V$ 和 $V^{**}$ 之间存在一个**不依赖基的选择**的自然同构。这个观察引出了数学中"自然性"的概念——范畴论的起源。

评估映射的定义¶

定义 22.1. 评估映射 $\mathrm{ev}: V \to V^{**}$ 定义为：对每个 $v \in V$，$\mathrm{ev}_v \in V^{**}$ 是 $V^*$ 上的线性泛函：

\[\mathrm{ev}_v(f) := f(v) \quad \text{对所有 } f \in V^*\]

即 $\mathrm{ev}_v$ 是"在 $v$ 处求值"这个操作——它接受一个线性泛函 $f$，返回 $f$ 在 $v$ 处的值。

命题 22.2. $\mathrm{ev}: V \to V^{**}$ 是线性映射。

证明. $\mathrm{ev}_{au+bv}(f) = f(au + bv) = af(u) + bf(v) = a \cdot \mathrm{ev}_u(f) + b \cdot \mathrm{ev}_v(f)$。 $\square$

ev 是单射¶

定理 22.3. $\mathrm{ev}: V \to V^{**}$ 是单射。

证明. 需证：若 $\mathrm{ev}_v = 0$（即 $f(v) = 0$ 对所有 $f \in V^*$），则 $v = 0$。

反证法：设 $v \neq 0$。将 $\{v\}$ 扩展为基 $\{v, v_2, v_3, \ldots\}$（有限维用 Steinitz，无限维用 Zorn 引理）。定义 $f \in V^*$ 使 $f(v) = 1$，$f(v_i) = 0$ 对所有 $i \geq 2$。则 $\mathrm{ev}_v(f) = f(v) = 1 \neq 0$，矛盾。 $\square$

有限维时 ev 是同构¶

定理 22.4. 有限维时，$\mathrm{ev}: V \to V^{**}$ 是同构。

证明. $\dim V^{**} = \dim V^* = \dim V$（由 §20）。单射 + 等维 $\Rightarrow$ 双射。 $\square$

无限维时 $\mathrm{ev}$ 仍单射但**不满射**——$\dim V^{**} = |F|^{|F|^\kappa} > |F|^\kappa > \kappa = \dim V$。

⚠️ 常见陷阱¶

💡 概念误区 22：认为 $V \cong V^*$ 和 $V \cong V^{**}$ 的质量相同

错误想法：两者都是有限维的同构，没有本质区别。

实际上：$V \cong V^*$ 需要**选择一组基**（或等价地，选择一个内积）才能建立。换基就换同构。$V \cong V^{**}$（通过 $\mathrm{ev}$）的定义**不依赖任何选择**——它是"自然"的。§23 将精确解释"自然"的含义。

为什么重要：在机器人学中，$V \cong V^*$ 依赖惯性张量的选择——不同的惯性张量给出不同的 twist-wrench 对应。$V \cong V^{**}$ 则是帧无关的。

练习¶

练习 22.1（⭐⭐）. 在 $V = \mathbb{R}^2$ 中，取标准基 $\mathcal{B} = (e_1, e_2)$。(a) 写出对偶基 $(f_1, f_2)$。(b) 写出 $V^{**}$ 的基（$V^*$ 的对偶基）。(c) 明确计算 $\mathrm{ev}_{(3,5)}$（作为 $V^*$ 上的线性泛函），验证它等于 $3f_1^* + 5f_2^*$（其中 $f_i^*$ 是 $V^{**}$ 中 $(f_1, f_2)$ 的对偶基）。

§23 自然同构 vs 非自然同构 ⭐⭐⭐¶

动机¶

§22 建立了两个同构：$V \cong V^*$（选基后）和 $V \cong V^{**}$（通过 $\mathrm{ev}$）。它们的质量为什么不同？"自然"究竟是什么意思？这个问题的回答催生了范畴论——20 世纪数学最重要的语言之一。

"自然"意味着什么（直觉）¶

$V \cong V^*$：需要**选择一组基**才能建立；不同的基给出不同的同构；没有"最好的"选择。

$V \cong V^{**}$：$\mathrm{ev}$ 的定义 $\mathrm{ev}_v(f) = f(v)$ 对**所有向量空间 $V$ 同时成立**，不需要任何选择。

直觉上，"自然"≈"与所有线性映射相容"≈"在所有向量空间上同时、一致地定义"。

范畴论最小词汇¶

为了精确表达"自然"，我们需要范畴论的最小词汇（只引入"刚好够用"的定义）：

概念	定义	例子
范畴	对象 + 态射 + 复合 + 恒等	$\mathbf{Vect}_F$：对象 = $F$-向量空间，态射 = 线性映射
协变函子	范畴间保结构的映射，保持方向	$\mathrm{Id}: \mathbf{Vect}_F \to \mathbf{Vect}_F$
反变函子	范畴间保结构的映射，反转方向	$(-)^: V \mapsto V^$，$T \mapsto T^t$（方向反转！）
自然变换	两个函子之间的"系统性对应"	$\mathrm{ev}: \mathrm{Id} \Rightarrow (-)^{**}$

ev 是自然变换¶

命题 23.1. $\mathrm{ev}: \mathrm{Id} \Rightarrow (-)^{**}$ 是自然变换。

具体含义：对任何线性映射 $T: V \to W$，以下方阵**交换**：

V ──ev_V──→ V**
│             │
T↓            ↓T**
│             │
W ──ev_W──→ W**

即 $T^{**} \circ \mathrm{ev}_V = \mathrm{ev}_W \circ T$。

证明. 对任意 $v \in V$，$g \in W^*$：

\[\left(T^{**}(\mathrm{ev}_V(v))\right)(g) = \mathrm{ev}_V(v)(T^t g) = (T^t g)(v) = g(T(v))\]

\[\left(\mathrm{ev}_W(T(v))\right)(g) = g(T(v))\]

两者相等。 $\square$

为什么 V ≅ V* 不是自然的¶

$(-)^*$ 是**反变**函子（$T \mapsto T^t$ 反转方向），而 $\mathrm{Id}$ 是**协变**函子。它们的**方差不同**——不存在自然变换 $\mathrm{Id} \Rightarrow (-)^*$。

本质洞察：任何 $V \to V^*$ 的同构都需要"在每个 $V$ 上单独做选择"（选基或选内积），无法全局一致。这不是我们"还没找到"自然同构——Eilenberg-Mac Lane（1945）证明了它**根本不存在**。自然性的不可能性是范畴论层面的结构性障碍。

机器人学中的意义¶

数学概念	机器人学对应
$V \cong V^{**}$（自然）	twist 的 double-dual 识别是帧无关的
$V \cong V^*$（非自然）	twist ↔ wrench 的转换需要惯性张量 $G_b$

在不同参考系之间切换时，自然的对应**不需要额外信息**，而非自然的对应需要指定一个度量（惯性张量）。

⚠️ 常见陷阱¶

💡 概念误区 23：认为"自然"只是"方便"的意思

实际上："自然"在范畴论中有精确的数学含义——自然变换要求特定的交换图成立。它不是美学判断，而是结构性约束。

🧠 思维陷阱 23：认为引入内积后 $V \cong V^*$ 就变成"自然的"了

实际上：引入内积后 $V \cong V^*$ 的同构是确定的（Riesz 定理），但它**依赖内积的选择**。换一个内积，同构就不同。只有当我们把"内积"也纳入结构（考虑内积空间的范畴），$V \cong V^*$ 才是自然的——但这时我们已经改变了讨论的范畴。

练习¶

练习 23.1（⭐⭐⭐）. 验证 $\mathrm{ev}$ 的自然性：取 $V = W = \mathbb{R}^2$，$T = \begin{pmatrix} 1 & 2 \\ 0 & 1 \end{pmatrix}$。用标准基明确计算 $T^{**} \circ \mathrm{ev}_V$ 和 $\mathrm{ev}_W \circ T$，验证它们相等。

§24 对偶映射（转置）⭐⭐¶

动机¶

给定线性映射 $T: V \to W$，它自然诱导了一个"反方向"的映射 $T^t: W^* \to V^*$——这就是**对偶映射**。在矩阵层面，$T^t$ 的矩阵恰好是 $T$ 的矩阵的转置。

定义¶

定义 24.1. 设 $T: V \to W$ 线性。对偶映射（dual map / transpose）$T^t: W^* \to V^*$ 定义为：

\[T^t(g) := g \circ T \quad \text{即} \quad (T^t g)(v) = g(T(v))\]

注意方向**反转**：$T: V \to W$ 诱导 $T^t: W^* \to V^*$。这正是 $(-)^*$ 是反变函子的原因。

基本性质¶

$T^t$ 是线性映射
$(S \circ T)^t = T^t \circ S^t$（反转顺序）
$(\mathrm{id}_V)^t = \mathrm{id}_{V^*}$
$(aT)^t = a T^t$

对偶映射的矩阵表示¶

定理 24.2. 设 $\mathcal{B}, \mathcal{C}$ 分别是 $V, W$ 的基，$\mathcal{B}^*, \mathcal{C}^*$ 是对偶基。则：

\[[T^t]_{\mathcal{C}^*}^{\mathcal{B}^*} = \left([T]_\mathcal{B}^\mathcal{C}\right)^{\top}\]

即对偶映射的矩阵是原映射矩阵的**转置**。

证明. 设 $[T]_\mathcal{B}^\mathcal{C} = (a_{ij})$，即 $T(v_j) = \sum_{i} a_{ij} w_i$。则：

\[(T^t(g_j))(v_l) = g_j(T(v_l)) = g_j\left(\sum_{i} a_{il} w_i\right) = a_{jl}\]

另一方面，若 $T^t(g_j) = \sum_{k} b_{kj} f_k$，则 $(T^t(g_j))(v_l) = b_{lj}$。

因此 $b_{lj} = a_{jl}$，即 $[T^t]$ 的第 $(l,j)$ 元素等于 $[T]$ 的第 $(j,l)$ 元素——这就是矩阵转置。 $\square$

术语警示¶

对偶映射 $T^t$（纯代数，无需内积）$\neq$ 伴随算子 $T^\dagger$（需要内积，§A2b 的内容）

概念	需要内积？	矩阵表示	机器人学含义
对偶映射 $T^t: W^* \to V^*$	否	矩阵转置 $A^T$	Jacobian 转置 $\tau = J^T \mathcal{F}$（虚功原理）
伴随算子 $T^\dagger: W \to V$	是	共轭转置 $A^*$	需要度量张量

在正交基下两者的矩阵恰好都是转置（因为 $A^T = A^*$ 对实正交基成立），但这是正交基的特殊性质，不是一般结论。

反事实推理：如果不区分 $T^t$ 和 $T^\dagger$，会发生什么？在机器人学中，$\tau = J^T \mathcal{F}$ 是由虚功原理得出的**精确等式**，不需要任何度量假设。如果把 $J^T$ 理解为"伴随"，就会错误地认为这个等式依赖内积——进而在非正交坐标下写出错误的公式。

⚠️ 常见陷阱¶

💡 概念误区 24：混淆"对偶映射"和"伴随算子"

错误想法：$T^t$ 和 $T^\dagger$ 是同一个东西。

实际上：$T^t$ 是纯代数概念（$V^* \leftarrow W^*$），$T^\dagger$ 需要内积空间结构。只有在正交基下，两者的矩阵碰巧一致。

为什么重要：在广义坐标系（如关节空间）中，Jacobian 的转置映射 $J^T$ 是对偶映射（无需度量），而 Jacobian 的伴随 $J^\dagger$（如果定义）需要关节空间的度量张量。机器人静力学用的是 $J^T$，不是 $J^\dagger$。

🧠 思维陷阱 24："转置"的三重歧义

"转置"一词在不同语境下的含义： 1. 矩阵转置：$A^T$，行列互换 2. 对偶映射：$T^t: W^* \to V^*$，纯代数 3. 在某些书中（如 Axler）用 $T'$ 表示对偶映射，避免与矩阵转置混淆

正确做法：本章用 $T^t$ 表示对偶映射，$A^T$ 表示矩阵转置。它们通过定理 24.2 联系起来。

练习¶

练习 24.1（⭐⭐）. 设 $T: \mathbb{R}^3 \to \mathbb{R}^2$，$T(x_1, x_2, x_3) = (x_1 + x_2, x_2 + x_3)$。(a) 写出 $T$ 在标准基下的矩阵 $A$。(b) 写出 $T^t$ 在对偶标准基下的矩阵，验证它是 $A^T$。(c) 解释 $T^t$ 的方向为什么是 $(\mathbb{R}^2)^* \to (\mathbb{R}^3)^*$。

§25 零化子与维数公式 ⭐⭐¶

动机¶

子空间 $W \leq V$ 的**零化子** $W^\circ$ 是 $V^*$ 中"在 $W$ 上为零"的所有线性泛函的集合。零化子是对偶理论中最有力的工具之一——它连接了 $V$ 中的子空间结构和 $V^*$ 中的子空间结构。

定义¶

定义 25.1. 设 $W \leq V$。$W$ 的**零化子**（annihilator）：

\[W^\circ := \{f \in V^* : f(w) = 0,\, \forall w \in W\} = \{f \in V^* : W \subseteq \ker f\}\]

$W^\circ$ 是 $V^*$ 的子空间（封闭性的验证直接）。

维数公式¶

定理 25.2（有限维）. $\dim W + \dim W^\circ = \dim V$。

证明（直接法）. 取 $W$ 的基 $(w_1, \ldots, w_k)$ 扩展为 $V$ 的基 $(w_1, \ldots, w_k, v_1, \ldots, v_m)$，其中 $m = n - k$。设 $(f_1, \ldots, f_k, g_1, \ldots, g_m)$ 是对偶基。

断言：$W^\circ = \mathrm{span}\{g_1, \ldots, g_m\}$。

"$\supseteq$"：$g_l(w_j) = \delta_{(k+l),j} = 0$（因为 $k+l > k \geq j$），所以 $g_l \in W^\circ$。

"$\subseteq$"：设 $f = \sum a_i f_i + \sum b_l g_l \in W^\circ$。对每个 $w_j$：$0 = f(w_j) = a_j$。所以 $f = \sum b_l g_l$。

因此 $\dim W^\circ = m = n - k = \dim V - \dim W$。 $\square$

双零化子¶

定理 25.3（有限维）. 在 $V \cong V^{**}$（通过 $\mathrm{ev}$）的识别下，$W^{\circ\circ} = W$。

即"零化子的零化子还原为原来的子空间"——对偶的**对合性**（involutivity）。

核与像的对偶关系¶

定理 25.4. 设 $T: V \to W$ 线性（有限维）。则：

关系	公式	直觉
$\ker T^t = (\mathrm{im}\, T)^\circ$	在 $\mathrm{im}\, T$ 上为零的泛函 = $T^t$ 杀掉的泛函
$\mathrm{im}\, T^t = (\ker T)^\circ$	$T^t$ 的像 = 在 $\ker T$ 上为零的泛函
$\mathrm{rank}(T^t) = \mathrm{rank}(T)$	行秩 = 列秩的概念证明

关系 1 的证明.

\[g \in \ker T^t \iff T^t(g) = 0 \iff g \circ T = 0 \iff g|_{\mathrm{im}\, T} = 0 \iff g \in (\mathrm{im}\, T)^\circ\]

关系 3 的推导.

\[\mathrm{rank}(T^t) = \dim W^* - \dim \ker T^t = \dim W - \dim(\mathrm{im}\, T)^\circ = \dim W - (\dim W - \mathrm{rank}(T)) = \mathrm{rank}(T)\]

本质洞察：$\mathrm{rank}(T) = \mathrm{rank}(T^t)$ 就是"行秩等于列秩"的**概念层面**的证明。传统的证明通过行化简计算，掩盖了这个等式的深层原因。对偶理论揭示了它的本质：行空间是列空间的零化子的零化子，维数公式保证两者维数相等。

机器人学中的对偶总结¶

抽象概念	机器人实例
对偶配对 $\langle f, v \rangle$	功率 $= \langle \text{wrench}, \text{twist} \rangle$
对偶映射 $T^t: W^* \to V^*$	Jacobian 转置 $\tau = J^T \mathcal{F}$
零化子 $W^\circ$	约束力 / 互易旋量（reciprocal screws）
自然同构 $V \cong V^{**}$	帧无关的 twist $\leftrightarrow$ double-dual twist 识别
非自然 $V \cong V^*$	需要惯性张量 $G_b$ 才能 twist $\leftrightarrow$ wrench
协方差 $\Sigma$ vs 信息矩阵 $\Lambda$	SLAM 中 $\Sigma \in V \otimes V$，$\Lambda \in V^* \otimes V^*$

⚠️ 常见陷阱¶

💡 概念误区 25：混淆零化子 $W^\circ \subseteq V^*$ 和正交补 $W^\perp \subseteq V$

错误想法：$W^\circ$ 和 $W^\perp$ 是一回事。

实际上：$W^\circ$ 住在 $V^*$ 中（线性泛函的空间），$W^\perp$ 住在 $V$ 中（向量空间本身）。定义 $W^\perp$ 需要内积，定义 $W^\circ$ 不需要。在有内积的情况下，Riesz 定理给出 $V \cong V^*$，此时 $W^\circ$ 和 $W^\perp$ 对应。

为什么重要：在没有内积的纯向量空间中（如李代数 $\mathfrak{g}$ 上的对偶），只有 $W^\circ$，没有 $W^\perp$。

🧠 思维陷阱 25：认为"行秩=列秩"是计算性的结论

新手想法：行秩=列秩只需要做行化简就能证明。

实际上：行化简证明了这个等式，但掩盖了**为什么**这个等式成立。对偶理论给出了概念性的解释：行秩是 $\mathrm{rank}(T^t)$，列秩是 $\mathrm{rank}(T)$，两者相等是因为 $\ker T^t = (\mathrm{im}\, T)^\circ$ 加上维数公式。

练习¶

练习 25.1（⭐⭐）. 设 $V = \mathbb{R}^3$，$W = \mathrm{span}\{(1,0,0), (0,1,0)\}$。求 $W^\circ$（作为 $V^*$ 的子空间），验证 $\dim W + \dim W^\circ = \dim V$。

练习 25.2（⭐⭐⭐，跨章综合）. 设 $T: \mathbb{R}^4 \to \mathbb{R}^3$。已知 $\dim \ker T = 2$。(a) 求 $\mathrm{rank}(T)$（用秩-零度定理）。(b) 求 $\dim \ker T^t$（用 $\ker T^t = (\mathrm{im}\, T)^\circ$ 和维数公式）。(c) 求 $\dim \mathrm{im}\, T^t$（用对偶映射的秩-零度定理）。验证 $\mathrm{rank}(T) = \mathrm{rank}(T^t)$。

⚠️ 常见陷阱（第四幕：对偶理论）¶

💡 概念误区：混淆"对偶映射 $T^t$"（纯代数）和"伴随算子 $T^\dagger$"（需要内积）

新手想法："$T^t$ 和 $T^\dagger$ 是一回事，都是'转置'。"

实际上：对偶映射 $T^t: W^* \to V^*$ 由 $T^t(g) = g \circ T$ 定义，是**纯代数对象**，不需要任何内积结构。伴随算子 $T^\dagger: W \to V$ 由 $\langle T^\dagger w, v \rangle_V = \langle w, Tv \rangle_W$ 定义，需要内积（或更一般地，需要非退化双线性形式）。在正交基下，$T^t$ 的矩阵是 $A^T$（转置），$T^\dagger$ 的矩阵是 $\bar{A}^T$（共轭转置）。两者在实数域 + 正交基下恰好一致，但这是特殊情况，不是一般规律。

为什么重要：在机器人学中，Jacobian 转置 $\tau = J^T \mathcal{F}$ 是**对偶映射**（虚功原理，不需要内积）。如果错误地将其理解为"伴随算子"，就会在非正交坐标系下出错。

🧠 思维陷阱：认为 $V \cong V^*$ 和 $V \cong V^{**}$ 是"同一种同构"

新手想法："有限维时 $\dim V = \dim V^* = \dim V^{**}$，所以它们都'一样'。"

实际上：$V \cong V^*$ 依赖于**基的选择**（或等价地，内积的选择）——换一组基就得到不同的同构。$V \cong V^{**}$ 通过评估映射 $\mathrm{ev}_v(f) = f(v)$ 定义，这个映射的定义**不依赖任何选择**。范畴论的精确表述是：$\mathrm{ev}$ 是自然变换 $\mathrm{Id} \Rightarrow (-)^{**}$，而不存在从 $\mathrm{Id}$ 到 $(-)^*$ 的自然变换（因为方差不同：一个协变，一个反变）。

为什么重要：在物理学中，"自然同构"对应"坐标无关的物理量"。twist 和"twist 的 double dual"之间的识别是坐标无关的，但 twist 和 wrench 之间的转换需要惯性张量（相当于选一个"内积"）——这就是 $V \cong V^{**}$（自然）vs $V \cong V^*$（非自然）的物理含义。

💡 概念误区：在无限维中仍认为 $V \cong V^*$

新手想法："对偶空间和原空间'应该一样大'。"

实际上：Erdos-Kaplansky 定理告诉我们，无限维时 $\dim V^* = |F|^{\dim V} > \dim V$（由 Cantor 定理）。因此无限维时 $V \not\cong V^*$，甚至 $V \not\cong V^{**}$（评估映射 $\mathrm{ev}$ 仍然是单射，但不再是满射）。"$V^*$ 中的泛函太多了"——它们包含无穷多个"有限支撑向量无法到达的"泛函。

正确思维：有限维线性代数的许多"好性质"（$\dim V = \dim V^*$、$V \cong V^{**}$、单射 $\Leftrightarrow$ 满射）都是有限维的特殊恩赐。在函数空间中工作时，需要区分代数对偶 $V^*$ 和拓扑对偶 $V'$（仅取连续线性泛函），后者可能满足 $V \cong V'$（如 Hilbert 空间的 Riesz 表示定理）。

本质洞察：对偶空间 $V^*$ 的本质是"测量空间"——$V^*$ 的每个元素是一种"测量 $V$ 中向量的方式"。对偶配对 $\langle f, v \rangle = f(v)$ 就是"用测量方式 $f$ 测量向量 $v$ 得到的数值"。在机器人学中，速度（twist）是"运动状态"，力（wrench）是"测量运动状态的方式"——它们的配对 $\langle \mathcal{F}, \mathcal{V} \rangle$ 给出功率（一个标量）。这就是为什么 twist 住在 $V$ 而 wrench 住在 $V^*$。

练习（第四幕）¶

（推导题） 设 $V = \mathbb{R}^3$，基 $\mathcal{B} = (e_1, e_2, e_3)$（标准基）。写出对偶基 $(f_1, f_2, f_3)$ 的显式表达式。验证 $f_i(e_j) = \delta_{ij}$。然后对向量 $v = 2e_1 - 3e_2 + e_3$，计算 $f_1(v), f_2(v), f_3(v)$，解释"对偶基提取坐标分量"的含义。
（证明题） 证明零化子维数公式 $\dim W + \dim W^\circ = \dim V$（有限维）。使用同构法：定义限制映射 $\rho: V^* \to W^*$，$\rho(f) = f|_W$，证明 $\ker \rho = W^\circ$ 且 $\rho$ 满射，然后用秩-零度定理。在草稿纸上完成。
（跨章综合题） 设 $T: V \to W$ 线性。证明 $\ker T^t = (\mathrm{im}\, T)^\circ$ 和 $\mathrm{rank}(T^t) = \mathrm{rank}(T)$。然后解释：在矩阵语言中，这就是"行秩 = 列秩"的**概念证明**（不需要行化简，只需要对偶理论）。

本章常见误解汇总¶

误解	正确理解
域和整环没有区别	域要求非零元素有乘法逆元，整环不要求
零向量和零标量是同一个零	$0_V \in V$ 和 $0_F \in F$ 是不同集合中的不同对象
子空间的并是子空间	一般不是；并的"修正"是子空间的和 $W_1 + W_2$
商空间 $V/W$ 是 $V$ 的子空间	$V/W$ 是等价类的集合，不住在 $V$ 里
维数只是一个数，不需要证明良定义	需要 Steinitz 引理来证明任意两组基大小相同
无限维空间的基可以写出来	Hamel 基的存在性依赖选择公理，一般不可构造
线性独立 = 正交	线性独立不需要内积，正交需要
单射线性映射一定满射	只在有限维等维时成立
$V \cong V^*$ 是自然的	需要选基；$V \cong V^{**}$ 才是自然的
对偶映射 $T^t$ = 伴随算子 $T^\dagger$	$T^t$ 不需要内积，$T^\dagger$ 需要
零化子 $W^\circ$ = 正交补 $W^\perp$	$W^\circ \subseteq V^*$，$W^\perp \subseteq V$；后者需要内积
行秩=列秩只是计算结论	对偶理论给出概念性解释

本章小结¶

符号表¶

符号	含义	首次出现
$F$	域（标量的来源）	§1
$V, W, U$	$F$-向量空间	§2
$0_V$	零向量	§2
$W \leq V$	$W$ 是 $V$ 的子空间	§3
$W_1 + W_2$	子空间的和	§3
$W_1 \oplus W_2$	直和	§4
$V/W$	商空间	§5
$\pi: V \to V/W$	典范投影	§5
$\mathrm{span}(S)$	$S$ 的张成	§6
$\dim V$	$V$ 的维数	§8
$T: V \to W$	线性映射	§12
$\mathrm{Hom}(V,W)$	线性映射空间	§13
$\mathrm{End}(V)$	自同态空间	§13
$\mathrm{GL}(V)$	一般线性群	§13
$\ker T$	核	§14
$\mathrm{im}\, T$	像	§14
$\mathrm{rank}(T)$	秩	§14
$[T]_\mathcal{B}^\mathcal{C}$	$T$ 在基 $\mathcal{B}, \mathcal{C}$ 下的矩阵	§17
$V^*$	对偶空间	§19
$\langle f, v \rangle$	对偶配对	§19
$(f_1, \ldots, f_n)$	对偶基	§20
$V^{**}$	二次对偶空间	§22
$\mathrm{ev}_v$	评估映射	§22
$T^t: W^* \to V^*$	对偶映射	§24
$W^\circ$	零化子	§25

定理速查表¶

定理/公式	一句话说明	对应节
子空间判定定理	非空 + $au + v \in W$	§3
维数公式 $\dim(W_1+W_2)$	$= \dim W_1 + \dim W_2 - \dim(W_1 \cap W_2)$	§3
内直和三种等价条件	和 + 交为零 = 唯一分解 = 维数相加	§4
$\dim(V/W) = \dim V - \dim W$	商掉 $W$ 的维度	§5
Steinitz 替换引理	独立集 $\leq$ 张成集	§7
维数良定义性	任意两组基大小相同	§8
每个向量空间有基	Zorn 引理	§9
线性映射由基的像确定	基的泛性质	§12
秩-零度定理	$\dim V = \mathrm{rank}(T) + \mathrm{null}(T)$	§15
第一同构定理	$V/\ker T \cong \mathrm{im}\, T$	§16
基变换公式	$[T]_{\mathcal{B}'} = P^{-1}[T]_\mathcal{B} P$	§17
$\dim V^* = \dim V$（有限维）	对偶基是 $V^*$ 的基	§20
$\dim V^* =	F	^\kappa > \kappa$（无限维）
$\mathrm{ev}: V \hookrightarrow V^{**}$（单射，有限维时同构）	评估映射是自然的	§22
$[T^t] = [T]^T$	对偶映射的矩阵 = 原矩阵的转置	§24
$\dim W + \dim W^\circ = \dim V$	零化子维数公式	§25
$\ker T^t = (\mathrm{im}\, T)^\circ$	核-像的对偶关系	§25
$\mathrm{rank}(T^t) = \mathrm{rank}(T)$	行秩 = 列秩	§25

知识点总表¶

编号	知识点	核心要点	对应节	难度
1	域的定义与例子	加法群 + 乘法群 + 分配律	§1	⭐
2	向量空间八条公理	Abel 群 + 标量作用	§2	⭐
3	子空间判定	非空 + 封闭性	§3	⭐
4	维数公式（和/交）	容斥原理的线性代数版本	§3	⭐⭐
5	直和（内/外）	唯一分解	§4	⭐⭐
6	商空间	陪集 + 良定义性	§5	⭐⭐
7	线性独立/相关	零表示的唯一性	§6	⭐
8	Steinitz 替换引理	独立集 $\leq$ 张成集	§7	⭐⭐
9	基与维数	极大独立集 = 极小张成集	§8	⭐
10	Zorn 引理 → 基存在	AC 的等价形式	§9	⭐⭐⭐
11	坐标与分类定理	$V \cong F^n$	§11	⭐⭐
12	线性映射定义	保加法 + 保标量乘法	§12	⭐
13	Hom(V,W)	线性映射的空间结构	§13	⭐⭐
14	核、像、秩、零度	信息丢失与保留	§14	⭐
15	秩-零度定理	丢失 + 保留 = 总共	§15	⭐⭐
16	同构定理	$V/\ker T \cong \mathrm{im}\, T$	§16	⭐⭐
17	矩阵表示与基变换	$P^{-1}AP$	§17	⭐⭐
18	不变子空间	块对角化的基础	§18	⭐⭐
19	对偶空间 $V^*$	线性泛函的空间	§19	⭐⭐
20	对偶基	$f_i(v_j) = \delta_{ij}$	§20	⭐⭐
21	无限维 $\dim V^* > \dim V$	Erdos-Kaplansky	§21	⭐⭐⭐
22	二次对偶与 ev	$V \hookrightarrow V^{**}$，有限维时同构	§22	⭐⭐
23	自然 vs 非自然同构	范畴论最小词汇	§23	⭐⭐⭐
24	对偶映射 $T^t$	反转方向，矩阵为转置	§24	⭐⭐
25	零化子与维数公式	$\dim W + \dim W^\circ = \dim V$	§25	⭐⭐

累积项目：本章新增模块¶

项目：手写线性代数核心库

本章新增模块：向量空间基础和对偶空间

项目进度：
Ch1（集合论）: 集合、关系、函数的基本数据结构
Ch2（本章）:   新增 → VectorSpace 类（公理验证）
                     → SubspaceChecker（子空间判定）
                     → LinearMap 类（核、像、秩计算）
                     → DualSpace 类（对偶基、对偶映射）
                     → QuotientSpace 类（陪集运算）
Ch3（内积空间）: 待续 → 正交补、Gram-Schmidt、伴随算子

本章项目任务（在草稿纸上完成）：

用 $\mathbb{R}^3$ 的标准基和一组非标准基，手动计算基变换矩阵 $P$ 和 $P^{-1}$，验证 $[T]_{\mathcal{B}'} = P^{-1}[T]_\mathcal{B} P$
对 $V = \mathbb{R}^3$，$W = \mathrm{span}\{(1,0,1)\}$，手动构造 $V/W$，验证 $\dim V/W = 2$
对 $T: \mathbb{R}^3 \to \mathbb{R}^2$ 的一个具体矩阵，手动计算 $\ker T$、$\mathrm{im}\, T$、$T^t$ 的矩阵、$(\mathrm{im}\, T)^\circ$，验证 $\ker T^t = (\mathrm{im}\, T)^\circ$

延伸阅读¶

教材¶

教材	定位	难度	推荐章节
Axler, Linear Algebra Done Right (4th ed, 2024)	现代本科标准	⭐⭐	§1-3（完整覆盖本章内容）
Hoffman & Kunze, Linear Algebra (2nd ed, 1971)	经典过渡教材	⭐⭐⭐	§3.5-3.7（对偶讲得最全面）
Halmos, Finite-Dimensional Vector Spaces (1958)	优雅极简经典	⭐⭐⭐	§13-17（"先讲对偶再讲矩阵"）
Roman, Advanced Linear Algebra (GTM 135, 3rd ed)	研究生标准参考	⭐⭐⭐⭐	Ch3（无限维对偶最佳参考）

博客与在线资源¶

资源	内容	难度
Math3ma, "What is a Natural Transformation?"	自然变换的直觉讲解	⭐⭐
K. Conrad, "Infinite-Dimensional Dual Spaces"	Erdos-Kaplansky 的详细证明	⭐⭐⭐

论文¶

论文	内容	难度
Eilenberg & Mac Lane (1945), Trans. AMS 58	范畴论的创立；自然变换的原始定义	⭐⭐⭐⭐
Blass (1984), Contemporary Mathematics 31	"每个向量空间有基" $\Leftrightarrow$ AC	⭐⭐⭐⭐

本章与后续章节的关系¶

后续章节	与本章的关系	本章哪个知识点为其铺垫
§A2b 内积空间	正交补 $W^\perp$ 是零化子 $W^\circ$ 在有内积时的"化身"	§4（直和）、§19-20（$V^*$ 和对偶基）、§24（$T^t$ vs $T^\dagger$）
§A2c 谱定理/SVD	特征空间是不变子空间，谱分解是直和	§4（直和）、§18（不变子空间）
§A2d Jordan 标准形	广义特征空间是不变子空间	§5（商空间用于递归分析）、§18（不变子空间）
§A2e 张量积/外代数	$V^* \otimes W \cong \mathrm{Hom}(V,W)$，张量是多重线性泛函	§13（$\mathrm{Hom}(V,W)$）、§19（$V^*$）
第一层微分流形/李群	切余空间 $T_p^* M$ 是切空间的对偶	§19-25（整个对偶理论）

🔧 故障排查手册¶

症状	可能原因	排查步骤	相关章节
验证子空间时发现"应该成立"的封闭性不成立	集合不是子空间（如忘记检查 $0 \in W$）	1. 检查零向量是否在集合中 2. 用具体反例测试封闭性 3. 检查条件是否齐次（$ax + by = c$ 中 $c \neq 0$ 不是子空间）	§3
维数公式 $\dim(W_1 + W_2)$ 计算结果与实际不符	基的扩展步骤有误，或误判了 $W_1 \cap W_2$	1. 独立验算 $\dim W_1$、$\dim W_2$、$\dim(W_1 \cap W_2)$ 2. 检查 $W_1 \cap W_2$ 是否正确（解齐次方程组） 3. 验证 $W_1 + W_2$ 的基确实张成且独立	§3, §7
秩-零度定理验证不通过	核或像的基计算有误	1. 用行化简独立计算 $\mathrm{rank}(A)$ 2. 解 $Ax = 0$ 得到核的基 3. 验证核的基确实在核中（代入检查） 4. 检查 $\mathrm{rank} + \mathrm{null} = n$	§14, §15
对偶映射矩阵不是转置	对偶基的顺序或定义有误	1. 重新检查对偶基 $f_i(v_j) = \delta_{ij}$ 是否成立 2. 确认矩阵表示的基是否匹配（$[T^t]$ 用的是对偶基） 3. 检查是否混淆了 $[T^t]_{\mathcal{C}^}^{\mathcal{B}^}$ 和 $[T^t]_{\mathcal{B}^}^{\mathcal{C}^}$	§20, §24
零化子维数与预期不符	基的扩展或对偶基的构造有误	1. 独立验证 $\dim W$（找 $W$ 的基） 2. 验证 $\dim W + \dim W^\circ = \dim V$ 3. 检查零化子中的泛函确实在 $W$ 上为零	§25

研究实践建议¶

给新手的建议¶

先掌握有限维：§9-§10（Zorn 引理/无限维）和 §21（Erdos-Kaplansky）的内容可以在第一遍阅读时跳过。有限维的理论已经覆盖了机器人学中 90% 以上的应用场景
多做练习：线性代数的理论看起来"简单"，但真正理解需要动手计算。每个定理至少手动验证一个 $\mathbb{R}^3$ 中的例子
区分三对容易混淆的概念：子空间的和 vs 并、商空间 vs 补空间、对偶映射 vs 伴随算子。把这三对概念的区别记牢，可以避免后续章节中大量的困惑

给有经验者的建议¶

关注对偶理论：如果你已经熟悉基、维数、秩-零度定理，直接从 §19 开始深读。对偶理论是通向微分几何和力学的关键桥梁
理解"自然性"：§23 中的自然变换概念看起来是"纯数学的抽象"，但它直接决定了机器人学中哪些量是帧无关的（自然的）、哪些需要额外结构（非自然的）
思考无限维：即使机器人学主要用有限维，理解有限维与无限维的区别（如 $\dim V^* > \dim V$、单射不蕴含满射）能加深对有限维理论的理解——知道一个结论在什么条件下失效，比知道它在什么条件下成立更重要
对偶与优化的联系：Lagrange 对偶问题中的对偶变量 $\lambda$ 正是约束流形切空间的对偶空间中的元素。理解了 $V^*$ 和零化子 $W^\circ$ 的概念，就能从几何角度理解 KKT 条件——$\nabla f$ 必须落在约束的法空间（即 $W^\circ$）中

版本信息速查¶

参考教材	版本	说明
Axler, LADR	4th ed, 2024	免费在线版本，最新更新
Hoffman & Kunze	2nd ed, 1971	经典不变版本
Roman, Advanced Linear Algebra	3rd ed, GTM 135	研究生标准
Halmos, FDVS	1958	经典名著，风格独特

符号	含义	备注
\(F\)	任意域	除非显式指定 \(F = \mathbb{R}\) 或 \(\mathbb{C}\)
\(V, W, U\)	\(F\)-向量空间
\(V^*\)	对偶空间 \(\mathrm{Hom}(V, F)\)	Axler 记作 \(V'\)，本章用 \(V^*\)
\(T^t\)	对偶映射（转置）	Axler 记作 \(T'\)，本章用 \(T^t\)
\(\ker T\)	核（kernel）	Axler 记作 \(\mathrm{null}\, T\)
\(\mathrm{im}\, T\)	像（image）	Axler 记作 \(\mathrm{range}\, T\)
\(\langle f, v \rangle\)	对偶配对 \(f(v)\)	与机器人学中 \(\langle \mathcal{F}, \mathcal{V} \rangle\) 一致
\(\delta_{ij}\)	Kronecker delta	\(i=j\) 时为 \(1\)，否则为 \(0\)

集合	是否为域	原因
\(\mathbb{Q}\)（有理数）	是	每个非零有理数 \(p/q\) 的逆元为 \(q/p\)
\(\mathbb{R}\)（实数）	是	\(\mathbb{Q}\) 的完备化，保持域性质
\(\mathbb{C}\)（复数）	是	\(\mathbb{R}\) 的代数闭包
\(\mathbb{F}_p\)（\(p\) 素数）	是	\(\mathbb{Z}/p\mathbb{Z}\)，Fermat 小定理保证逆元
\(\mathbb{Z}\)（整数）	否	\(2\) 没有乘法逆元（\(1/2 \notin \mathbb{Z}\)）
\(\mathbb{F}_4 = \mathbb{F}_{2^2}\)	是	四元素域，\(2 = 0\)

性质	说明
\(\dim F^n = n\)	标准基 \(e_1, \ldots, e_n\)
\(\dim F[x]_{\leq n} = n + 1\)	基 \(\{1, x, \ldots, x^n\}\)
\(\dim M_{m \times n}(F) = mn\)	基 \(\{E_{ij}\}\)，\(E_{ij}\) 是 \((i,j)\) 位置为 \(1\) 其余为 \(0\) 的矩阵
\(W \leq V \Rightarrow \dim W \leq \dim V\)	独立集不超过基的大小
\(W \leq V, \dim W = \dim V \Rightarrow W = V\)	有限维的特殊性质

映射	定义	线性性来源
零映射 \(0: V \to W\)	\(v \mapsto 0_W\)	\(0(au+bv) = 0 = a \cdot 0 + b \cdot 0\)
恒等映射 \(\mathrm{id}_V\)	\(v \mapsto v\)	平凡
投影 \(\pi_1: V_1 \oplus V_2 \to V_1\)	\((v_1, v_2) \mapsto v_1\)	逐分量线性
求导 \(D: F[x]_{\leq n} \to F[x]_{\leq n-1}\)	\(p \mapsto p'\)	\((ap + bq)' = ap' + bq'\)
矩阵左乘 \(L_A: F^n \to F^m\)	\(x \mapsto Ax\)	\(A(ax+by) = aAx + bAy\)

性质	等价条件	维数条件
\(T\) 单射	\(\ker T = \{0\}\)	\(\mathrm{null}(T) = 0\)
\(T\) 满射	\(\mathrm{im}\, T = W\)	\(\mathrm{rank}(T) = \dim W\)
\(T\) 双射	单射 + 满射	\(\dim V = \dim W\) 且 \(\ker T = \{0\}\)

编号	公理	直觉
V1	\((u + v) + w = u + (v + w)\)	加法结合律
V2	\(u + v = v + u\)	加法交换律
V3	\(\exists\, 0_V \in V: 0_V + v = v\)	存在零向量
V4	\(\forall v, \exists (-v): v + (-v) = 0_V\)	存在加法逆元
V5	\(a(bv) = (ab)v\)	标量乘法结合律
V6	\(1_F \cdot v = v\)	标量乘法单位元
V7	\(a(u + v) = au + av\)	标量对向量分配律
V8	\((a + b)v = av + bv\)	向量对标量分配律

证明路径	教材	特点
直接归纳（对 \(m\) 归纳）	[HK], [FIS]	最经典，技术细节清晰
线性相关引理	[Axler]	不直接使用 Steinitz 名称，但本质等价
行阶梯形论证	许多工科教材	通过矩阵化简，计算导向

线性映射	定义域	值域	说明
Jacobian \(J(\theta)\)	关节速度空间 \(\mathbb{R}^n\)	末端执行器速度空间 \(\mathbb{R}^6\)	将关节速度映射为末端速度
\(\mathrm{ad}_X: \mathfrak{g} \to \mathfrak{g}\)	李代数	李代数	伴随表示，\(\mathrm{ad}_X(Y) = [X, Y]\)
惯性张量 \(\mathcal{I}: \mathbb{R}^3 \to \mathbb{R}^3\)	角速度空间	角动量空间	将角速度映射为角动量

不变量	公式/性质
迹 \(\mathrm{tr}(A)\)	\(\mathrm{tr}(P^{-1}AP) = \mathrm{tr}(A)\)，因为 \(\mathrm{tr}(AB) = \mathrm{tr}(BA)\)
行列式 \(\det(A)\)	\(\det(P^{-1}AP) = \det(A)\)
秩 \(\mathrm{rank}(A)\)	秩是像空间的维数，不依赖基
特征多项式	前瞻至 §A2c/A2d

数学概念	机器人学对应	说明
\(T\)-不变子空间 \(W\)	动力学系统的不变流形	系统状态一旦进入 \(W\)，将永远留在 \(W\) 内
块对角化	解耦控制	将多自由度系统分解为独立子系统
\(\ker T\) 作为不变子空间	零空间/零动力学	系统的"内部运动模式"
\(\mathrm{im}\, T\) 作为不变子空间	可达空间	系统能够到达的状态集

空间	自反？	原因
有限维空间	是	维数相等，\(\mathrm{ev}\) 自动满射
\(L^p\) (\(1 < p < \infty\))	是	经典结果，\((L^p)^* = L^q\)，\(1/p + 1/q = 1\)
\(L^1\)	否	\((L^1)^* = L^\infty\)，\((L^\infty)^* \supsetneq L^1\)
\(\ell^1\)	否	\((\ell^1)^* = \ell^\infty\)，但 \((\ell^\infty)^* \neq \ell^1\)
Hilbert 空间	是	Riesz 表示定理给出 \(H \cong H^*\)

概念	定义	例子
范畴	对象 + 态射 + 复合 + 恒等	\(\mathbf{Vect}_F\)：对象 = \(F\)-向量空间，态射 = 线性映射
协变函子	范畴间保结构的映射，保持方向	\(\mathrm{Id}: \mathbf{Vect}_F \to \mathbf{Vect}_F\)
反变函子	范畴间保结构的映射，反转方向	\((-)^: V \mapsto V^\)，\(T \mapsto T^t\)（方向反转！）
自然变换	两个函子之间的"系统性对应"	\(\mathrm{ev}: \mathrm{Id} \Rightarrow (-)^{**}\)

数学概念	机器人学对应
\(V \cong V^{**}\)（自然）	twist 的 double-dual 识别是帧无关的
\(V \cong V^*\)（非自然）	twist ↔ wrench 的转换需要惯性张量 \(G_b\)

概念	需要内积？	矩阵表示	机器人学含义
对偶映射 \(T^t: W^* \to V^*\)	否	矩阵转置 \(A^T\)	Jacobian 转置 \(\tau = J^T \mathcal{F}\)（虚功原理）
伴随算子 \(T^\dagger: W \to V\)	是	共轭转置 \(A^*\)	需要度量张量

关系	公式	直觉
\(\ker T^t = (\mathrm{im}\, T)^\circ\)	在 \(\mathrm{im}\, T\) 上为零的泛函 = \(T^t\) 杀掉的泛函
\(\mathrm{im}\, T^t = (\ker T)^\circ\)	\(T^t\) 的像 = 在 \(\ker T\) 上为零的泛函
\(\mathrm{rank}(T^t) = \mathrm{rank}(T)\)	行秩 = 列秩的概念证明

抽象概念	机器人实例
对偶配对 \(\langle f, v \rangle\)	功率 \(= \langle \text{wrench}, \text{twist} \rangle\)
对偶映射 \(T^t: W^* \to V^*\)	Jacobian 转置 \(\tau = J^T \mathcal{F}\)
零化子 \(W^\circ\)	约束力 / 互易旋量（reciprocal screws）
自然同构 \(V \cong V^{**}\)	帧无关的 twist \(\leftrightarrow\) double-dual twist 识别
非自然 \(V \cong V^*\)	需要惯性张量 \(G_b\) 才能 twist \(\leftrightarrow\) wrench
协方差 \(\Sigma\) vs 信息矩阵 \(\Lambda\)	SLAM 中 \(\Sigma \in V \otimes V\)，\(\Lambda \in V^* \otimes V^*\)

定理/公式	一句话说明	对应节
子空间判定定理	非空 + \(au + v \in W\)	§3
维数公式 \(\dim(W_1+W_2)\)	\(= \dim W_1 + \dim W_2 - \dim(W_1 \cap W_2)\)	§3
内直和三种等价条件	和 + 交为零 = 唯一分解 = 维数相加	§4
\(\dim(V/W) = \dim V - \dim W\)	商掉 \(W\) 的维度	§5
Steinitz 替换引理	独立集 \(\leq\) 张成集	§7
维数良定义性	任意两组基大小相同	§8
每个向量空间有基	Zorn 引理	§9
线性映射由基的像确定	基的泛性质	§12
秩-零度定理	\(\dim V = \mathrm{rank}(T) + \mathrm{null}(T)\)	§15
第一同构定理	\(V/\ker T \cong \mathrm{im}\, T\)	§16
基变换公式	\([T]_{\mathcal{B}'} = P^{-1}[T]_\mathcal{B} P\)	§17
\(\dim V^* = \dim V\)（有限维）	对偶基是 \(V^*\) 的基	§20
$\dim V^* =	F	^\kappa > \kappa$（无限维）
\(\mathrm{ev}: V \hookrightarrow V^{**}\)（单射，有限维时同构）	评估映射是自然的	§22
\([T^t] = [T]^T\)	对偶映射的矩阵 = 原矩阵的转置	§24
\(\dim W + \dim W^\circ = \dim V\)	零化子维数公式	§25
\(\ker T^t = (\mathrm{im}\, T)^\circ\)	核-像的对偶关系	§25
\(\mathrm{rank}(T^t) = \mathrm{rank}(T)\)	行秩 = 列秩	§25

后续章节	与本章的关系	本章哪个知识点为其铺垫
§A2b 内积空间	正交补 \(W^\perp\) 是零化子 \(W^\circ\) 在有内积时的"化身"	§4（直和）、§19-20（\(V^*\) 和对偶基）、§24（\(T^t\) vs \(T^\dagger\)）
§A2c 谱定理/SVD	特征空间是不变子空间，谱分解是直和	§4（直和）、§18（不变子空间）
§A2d Jordan 标准形	广义特征空间是不变子空间	§5（商空间用于递归分析）、§18（不变子空间）
§A2e 张量积/外代数	\(V^* \otimes W \cong \mathrm{Hom}(V,W)\)，张量是多重线性泛函	§13（\(\mathrm{Hom}(V,W)\)）、§19（\(V^*\)）
第一层微分流形/李群	切余空间 \(T_p^* M\) 是切空间的对偶	§19-25（整个对偶理论）

症状	可能原因	排查步骤	相关章节
验证子空间时发现"应该成立"的封闭性不成立	集合不是子空间（如忘记检查 \(0 \in W\)）	1. 检查零向量是否在集合中 2. 用具体反例测试封闭性 3. 检查条件是否齐次（\(ax + by = c\) 中 \(c \neq 0\) 不是子空间）	§3
维数公式 \(\dim(W_1 + W_2)\) 计算结果与实际不符	基的扩展步骤有误，或误判了 \(W_1 \cap W_2\)	1. 独立验算 \(\dim W_1\)、\(\dim W_2\)、\(\dim(W_1 \cap W_2)\) 2. 检查 \(W_1 \cap W_2\) 是否正确（解齐次方程组） 3. 验证 \(W_1 + W_2\) 的基确实张成且独立	§3, §7
秩-零度定理验证不通过	核或像的基计算有误	1. 用行化简独立计算 \(\mathrm{rank}(A)\) 2. 解 \(Ax = 0\) 得到核的基 3. 验证核的基确实在核中（代入检查） 4. 检查 \(\mathrm{rank} + \mathrm{null} = n\)	§14, §15
对偶映射矩阵不是转置	对偶基的顺序或定义有误	1. 重新检查对偶基 \(f_i(v_j) = \delta_{ij}\) 是否成立 2. 确认矩阵表示的基是否匹配（\([T^t]\) 用的是对偶基） 3. 检查是否混淆了 \([T^t]_{\mathcal{C}^}^{\mathcal{B}^}\) 和 \([T^t]_{\mathcal{B}^}^{\mathcal{C}^}\)	§20, §24
零化子维数与预期不符	基的扩展或对偶基的构造有误	1. 独立验证 \(\dim W\)（找 \(W\) 的基） 2. 验证 \(\dim W + \dim W^\circ = \dim V\) 3. 检查零化子中的泛函确实在 \(W\) 上为零	§25