向量空间、线性变换与对偶空间¶
前置自测¶
📋 前置自测(答不出 \(\geq 2\) 题 → 先回 §A1 复习集合论与数理逻辑)
Q1. 什么是域(field)?请写出域的三条核心公理(加法群、乘法群、分配律),并举一个"看起来像域但不是域"的例子。
Q2. 设 \(\sim\) 是集合 \(S\) 上的关系。写出等价关系的三条公理(自反、对称、传递)。\(S/{\sim}\) 表示什么?为什么商集上的运算需要"良定义性验证"?
Q3. 陈述 Zorn 引理:如果偏序集 \((P, \leq)\) 满足什么条件,就能得出什么结论?它与选择公理(AC)的关系是什么?
Q4. 什么是 Kronecker delta \(\delta_{ij}\)?写出其定义。
Q5. 解释"单射""满射""双射"的含义,并说明在有限集上,单射与满射的关系。
本章目标¶
学完本章后,你应该能够:
- **陈述并运用**向量空间的八条公理,判定给定集合是否构成向量空间
- **掌握**子空间、直和、商空间的定义与基本性质,会计算维数公式
- **理解**基与维数的理论基础,包括 Steinitz 替换引理和 Zorn 引理的角色
- **定义**线性映射并证明其基本性质,包括核、像、秩-零度定理
- **推导**矩阵表示与基变换公式,理解相似矩阵的不变量
- **构建**对偶空间 \(V^*\)、对偶基和对偶映射 \(T^t\) 的完整理论
- 区分 \(V \cong V^*\)(非自然、依赖基的选择)与 \(V \cong V^{**}\)(自然、由评估映射给出)的本质差异
本章知识导航¶
本章按**四幕结构**展开,共 25 个核心概念模块。四幕之间存在严格的依赖关系——每一幕只使用前面已铺好的工具:
| 幕 | 内容 | 核心概念 | 与后续的关系 |
|---|---|---|---|
| 第一幕:公理基础 | §1-§5 | 域、向量空间公理、子空间、直和、商空间 | 为维数理论提供语言 |
| 第二幕:维数理论 | §6-§11 | 线性组合、Steinitz 引理、基与维数、Zorn 引理 | 为线性变换提供坐标 |
| 第三幕:线性变换 | §12-§18 | 线性映射、核/像、秩-零度、矩阵表示 | 为对偶理论提供变换 |
| 第四幕:对偶理论 | §19-§25 | 对偶空间、对偶基、自然同构、零化子 | 直接通向李代数与动力学 |
推荐阅读路径:严格按幕的顺序阅读。第一幕和第二幕是地基——跳过它们会导致后续每个证明都看不懂。第三幕是核心工具箱。第四幕是本章最深刻的内容,也是通向微分几何和机器人动力学的桥梁。
第一幕: 公理基础 第二幕: 维数理论
§1(域) → §2(空间公理) §6(线性组合) → §7(Steinitz)
↓ ↓ ↓
§3(子空间) → §4(直和) §8(基/维数) → §9(Zorn) → §10(基数)
↓ ↓
§5(商空间) §11(坐标/分类)
↓ ↓
└──────────→ 第三幕: 线性变换 ←──────────┘
§12(定义) → §13(Hom/End) → §14(核/像)
↓
§15(秩-零度) → §16(同构定理) → §17(矩阵) → §18(不变子空间)
↓
第四幕: 对偶理论
§19(V*) → §20(对偶基) → §21(无限维) → §22(V**)
↓
§23(自然性) → §24(对偶映射) → §25(零化子)
前置知识桥接¶
本章建立在 §A1(集合论与数理逻辑)的基础之上。回顾 §A1 的几个关键结论,它们将在本章反复使用:
- 域的构造(§A1.10):我们在 §A1 中已经构造了 \(\mathbb{Q}\)、\(\mathbb{R}\)、\(\mathbb{C}\),并验证了它们满足域的公理。本章将在一般域 \(F\) 上展开理论,必要时指定 \(F = \mathbb{R}\) 或 \(\mathbb{C}\)
- Zorn 引理(§A1.9):我们在 §A1 中已证明 Zorn 引理与选择公理(AC)等价。本章将在 §9 中用 Zorn 引理证明"任意向量空间有基"
- 等价关系与商集(§A1.5.4):商空间 \(V/W\) 的构造本质上是在向量空间上定义等价关系后取商集
- 基数理论(§A1.8):Cantor 定理 \(2^\kappa > \kappa\) 将在 §21 中解释为什么无限维空间的对偶空间"大得多"
如果跳过本章会怎样¶
- 无法理解李群与李代数:\(\mathfrak{so}(3)\) 是一个向量空间,\(\exp\) 映射是线性映射的推广。不懂向量空间公理,就无法理解为什么 \(\mathfrak{so}(3)\) 上的加法和标量乘法有意义
- 无法理解机器人动力学中的对偶性:twist 和 wrench 分别住在 \(\mathfrak{se}(3)\) 和 \(\mathfrak{se}(3)^*\) 中。不懂对偶空间,就不知道 Jacobian 转置 \(\tau = J^T \mathcal{F}\) 的数学本质
预计阅读时间¶
| 阅读方式 | 时间 | 适合谁 |
|---|---|---|
| 精读(含练习和推导) | 12-15 小时 | 需要从零建立严格理解的读者 |
| 速读(跳过 §9-§10 和 §21 的无限维部分) | 6-8 小时 | 有线性代数基础、重点学对偶理论的读者 |
| 速查(只看定理速查表和符号表) | 30 分钟 | 遇到具体问题时回来查阅 |
符号约定¶
在开始正文之前,统一本章的符号约定。这些约定贯穿全章,遇到其他教材的不同记法时,请回来查阅此表。
| 符号 | 含义 | 备注 |
|---|---|---|
| \(F\) | 任意域 | 除非显式指定 \(F = \mathbb{R}\) 或 \(\mathbb{C}\) |
| \(V, W, U\) | \(F\)-向量空间 | |
| \(V^*\) | 对偶空间 \(\mathrm{Hom}(V, F)\) | Axler 记作 \(V'\),本章用 \(V^*\) |
| \(T^t\) | 对偶映射(转置) | Axler 记作 \(T'\),本章用 \(T^t\) |
| \(\ker T\) | 核(kernel) | Axler 记作 \(\mathrm{null}\, T\) |
| \(\mathrm{im}\, T\) | 像(image) | Axler 记作 \(\mathrm{range}\, T\) |
| \(\langle f, v \rangle\) | 对偶配对 \(f(v)\) | 与机器人学中 \(\langle \mathcal{F}, \mathcal{V} \rangle\) 一致 |
| \(\delta_{ij}\) | Kronecker delta | \(i=j\) 时为 \(1\),否则为 \(0\) |
第一幕:公理基础¶
第一幕的目标是建立向量空间理论的语言。我们从域的回顾出发,定义向量空间的八条公理,然后研究子空间、直和、商空间这三种"从已有空间构造新空间"的方式。这些构造是后续一切理论的基石。
§1 域的回顾与约定 ⭐¶
动机¶
为什么要从域开始?因为向量空间的定义中有两种"乘法"——向量之间的加法和标量与向量的乘法。这里的"标量"不是随意选择的数——它们必须来自一个具有良好代数结构的集合。这个集合就是**域**。
如果标量集合不构成域,会发生什么?考虑整数 \(\mathbb{Z}\)。如果我们用整数做标量,那么给定一个非零向量 \(v\),我们能得到 \(2v, 3v, -v\) 等,但**无法得到** \(\frac{1}{2}v\)——因为 \(\frac{1}{2} \notin \mathbb{Z}\)。这意味着许多基本操作(比如"把向量缩放到单位长度")变得不可能。正是域中"每个非零元素都有乘法逆元"这一性质,保证了标量乘法的充分灵活性。
域的公理化定义¶
域(field)是一个集合 \(F\),配备两个二元运算——加法 \(+\) 和乘法 \(\cdot\)——以及两个特殊元素 \(0_F\)(加法单位元)和 \(1_F\)(乘法单位元,\(1_F \neq 0_F\)),满足:
- \((F, +, 0_F)\) 构成**Abel 群**:加法结合、交换、有零元、有逆元
- \((F \setminus \{0\}, \cdot, 1_F)\) 构成**Abel 群**:乘法结合、交换、有单位元、非零元素有逆元
- 分配律:\(a(b + c) = ab + ac\) 对所有 \(a, b, c \in F\) 成立
这三条公理的组织方式值得注意:前两条说的是 \(F\) 在加法和乘法下各自具有"群结构",第三条则把这两个结构"焊接"在一起。分配律是加法与乘法之间唯一的联系——如果没有它,加法和乘法就是两个互不相关的运算。
常用域与非例子¶
| 集合 | 是否为域 | 原因 |
|---|---|---|
| \(\mathbb{Q}\)(有理数) | 是 | 每个非零有理数 \(p/q\) 的逆元为 \(q/p\) |
| \(\mathbb{R}\)(实数) | 是 | \(\mathbb{Q}\) 的完备化,保持域性质 |
| \(\mathbb{C}\)(复数) | 是 | \(\mathbb{R}\) 的代数闭包 |
| \(\mathbb{F}_p\)(\(p\) 素数) | 是 | \(\mathbb{Z}/p\mathbb{Z}\),Fermat 小定理保证逆元 |
| \(\mathbb{Z}\)(整数) | 否 | \(2\) 没有乘法逆元(\(1/2 \notin \mathbb{Z}\)) |
| \(\mathbb{F}_4 = \mathbb{F}_{2^2}\) | 是 | 四元素域,\(2 = 0\) |
特征(characteristic):域 \(F\) 的特征 \(\mathrm{char}(F)\) 是使 \(\underbrace{1 + 1 + \cdots + 1}_{p} = 0\) 成立的最小正整数 \(p\);若不存在这样的 \(p\),则 \(\mathrm{char}(F) = 0\)。
- \(\mathrm{char}(\mathbb{Q}) = \mathrm{char}(\mathbb{R}) = \mathrm{char}(\mathbb{C}) = 0\)
- \(\mathrm{char}(\mathbb{F}_p) = p\)
- 特征 \(2\) 时 \(-1 = 1\),这会导致某些二次型理论退化——但在机器人学中几乎不会遇到
机器人数学中域的选择¶
在 SLAM、运动规划和动力学计算中,标准选择是 \(F = \mathbb{R}\),因为物理量(位移、速度、力等)都是实数。但有两个重要的例外:
- **控制理论的频域分析**需要 \(\mathbb{C}\):传递函数 \(G(s)\) 中的 \(s\) 是复数,极点和零点可能是复数。谱定理的完整陈述也需要在 \(\mathbb{C}\) 上工作
- **编码理论与组合优化**有时涉及有限域 \(\mathbb{F}_p\),但在机器人学中罕见
本章尽量在一般域 \(F\) 上展开理论。当结论只在 \(\mathbb{R}\) 或 \(\mathbb{C}\) 上成立时,会显式说明。
⚠️ 常见陷阱¶
💡 概念误区 1:混淆"整环"与"域"
错误想法:\(\mathbb{Z}\) 没有零因子(\(ab = 0 \Rightarrow a = 0\) 或 \(b = 0\)),所以它是域。
实际上:没有零因子只说明 \(\mathbb{Z}\) 是**整环**(integral domain),域还要求非零元素有乘法逆元。\(\mathbb{Z}\) 缺少这一条:\(2 \in \mathbb{Z}\) 没有乘法逆元。
为什么重要:如果在 \(\mathbb{Z}\) 上定义"向量空间",得到的是**模**(module)而非向量空间。模的理论远比向量空间复杂——例如,模不一定有基。
🧠 思维陷阱 1:认为"实数就够了,不需要抽象的域"
新手想法:机器人学用的都是实数,为什么要在一般域 \(F\) 上建立理论?
实际上:在一般域上工作的好处是**看清哪些性质依赖域的特殊结构**。例如,"对称矩阵的特征值都是实数"在 \(\mathbb{R}\) 上成立,但这里用到了 \(\mathbb{R}\) 的有序性——在一般域上不成立。区分"通用结论"和"特殊结论"是数学成熟度的标志。
正确思维:先在 \(F\) 上建立通用理论,再根据需要添加 \(F = \mathbb{R}\) 或 \(F = \mathbb{C}\) 的特殊结论。
练习¶
练习 1.1(⭐). 证明:有限域的特征必为素数。(提示:若 \(\mathrm{char}(F) = n = ab\),考虑 \((1 + 1 + \cdots)\) 的因子分解。)
练习 1.2(⭐⭐). 证明 \(\mathbb{C}\) 不是有序域。(提示:假设存在全序 \(<\) 满足域的有序公理,考虑 \(i^2 = -1\) 导致的矛盾。)
§2 向量空间的公理化定义 ⭐¶
动机¶
我们已经熟悉了 \(\mathbb{R}^2\) 和 \(\mathbb{R}^3\) 中的向量——它们可以相加、可以被实数缩放,满足平行四边形法则。但在数学和工程中,我们会遇到大量"看起来不像箭头但行为像向量"的对象:多项式可以相加和缩放、矩阵可以相加和缩放、连续函数可以相加和缩放。向量空间的公理化定义要回答的问题是:什么样的集合配上什么样的运算,就"足够像" \(\mathbb{R}^n\) 以至于 \(\mathbb{R}^n\) 中的所有线性代数结论都自动成立?
如果不公理化会怎样¶
如果我们只在 \(\mathbb{R}^n\) 中做线性代数,每次遇到新的"向量般"的对象(多项式空间、矩阵空间、函数空间),都需要从头验证所有定理。公理化的意义在于:一次证明,处处适用。只要验证新对象满足八条公理,所有在抽象向量空间中证明的定理自动适用。
类比:这就像编程中的接口(interface)。向量空间公理定义了一个"接口",任何实现了这个接口的具体数据结构(\(\mathbb{R}^n\)、多项式、矩阵等)都可以使用所有基于该接口编写的"算法"(定理)。这个类比在"接口定义行为契约"这一点上是准确的,但**不像**的地方在于:编程接口可以有多种不等价的实现,而有限维向量空间本质上只有一种(\(F^n\),见分类定理 §11)。
历史注记¶
向量空间的公理化始于 Peano(1888)的 Calcolo geometrico,但现代形式由 Weyl(1918)的 Raum, Zeit, Materie 和 Banach(1920s)的工作确立。有趣的是,Peano 的定义比现在的标准版本更广——他允许非交换的标量乘法。
定义与八条公理¶
定义. 设 \(F\) 为域。一个 \(F\)-向量空间(vector space over \(F\))是一个集合 \(V\)(其元素称为**向量**),配备两个运算:
- 向量加法 \(+: V \times V \to V\)
- 标量乘法 \(\cdot: F \times V \to V\)
满足以下八条公理:
| 编号 | 公理 | 直觉 |
|---|---|---|
| V1 | \((u + v) + w = u + (v + w)\) | 加法结合律 |
| V2 | \(u + v = v + u\) | 加法交换律 |
| V3 | \(\exists\, 0_V \in V: 0_V + v = v\) | 存在零向量 |
| V4 | \(\forall v, \exists (-v): v + (-v) = 0_V\) | 存在加法逆元 |
| V5 | \(a(bv) = (ab)v\) | 标量乘法结合律 |
| V6 | \(1_F \cdot v = v\) | 标量乘法单位元 |
| V7 | \(a(u + v) = au + av\) | 标量对向量分配律 |
| V8 | \((a + b)v = av + bv\) | 向量对标量分配律 |
阶段小结:公理 V1-V4 说的是 \((V, +)\) 构成一个 Abel 群(与域定义中加法群的要求完全类同)。公理 V5-V8 描述了标量乘法如何与加法"兼容"。注意 V5 中等号左边的 \(b\) 乘 \(v\) 是标量乘法(\(F \times V \to V\)),而 \(a\) 乘 \(bv\) 也是标量乘法;等号右边的 \(ab\) 是域中的乘法(\(F \times F \to F\))。
更精炼地说:\(F\)-向量空间就是 Abel 群 \((V, +)\) 配上域 \(F\) 的一个满足 V5-V8 的**标量作用**。
从公理推出的基本性质¶
以下性质**不是额外的公理**,而是从八条公理中严格推出的。这种推导训练对理解公理体系的"力量"至关重要。
命题 2.1. \(0_F \cdot v = 0_V\) 对所有 \(v \in V\) 成立。
证明. 我们需要证明 \(0_F \cdot v\) 是加法中的零元素。
两边加上 \(-(0_F \cdot v)\)(公理 V4 保证逆元存在):
注意这个证明中每一步用了哪条公理:V8(分配律)和 V4(逆元的存在性)。如果没有 V4,我们无法"两边消去" \(0_F \cdot v\)。
命题 2.2. \((-1_F) \cdot v = -v\) 对所有 \(v \in V\) 成立。
证明.
第一个等号用了 V6,第二个用了 V8,第三个用了域中 \(1 + (-1) = 0\),第四个用了命题 2.1。由加法逆元的唯一性(Abel 群的性质),得 \((-1_F) \cdot v = -v\)。 \(\square\)
命题 2.3. \(a \cdot 0_V = 0_V\) 对所有 \(a \in F\) 成立。
证明. \(a \cdot 0_V = a \cdot (0_V + 0_V) = a \cdot 0_V + a \cdot 0_V\)(V7),两边消去得 \(0_V = a \cdot 0_V\)。 \(\square\)
命题 2.4. 若 \(av = 0_V\),则 \(a = 0_F\) 或 \(v = 0_V\)。
证明. 设 \(a \neq 0_F\)。由于 \(F\) 是域,\(a\) 有乘法逆元 \(a^{-1}\)。则:
这里用到了 V6、V5 和命题 2.3。 \(\square\)
这条性质的证明揭示了**为什么标量必须来自域而非一般环**:我们需要非零标量的乘法逆元来"除以" \(a\)。如果标量来自环(如 \(\mathbb{Z}\)),这个命题就不成立——\(2 \cdot v = 0\) 不能推出 \(v = 0\)(在 \(\mathbb{Z}/4\mathbb{Z}\) 上的模中,\(2 \cdot 2 = 0\) 但 \(2 \neq 0\))。
基本例子¶
例 2.1(\(F^n\):标准 \(n\) 维向量空间). 集合 \(F^n = \{(a_1, \ldots, a_n) : a_i \in F\}\),加法和标量乘法逐分量定义。八条公理的验证直接从 \(F\) 的域公理继承。
例 2.2(\(F[x]_{\leq n}\):次数 \(\leq n\) 的多项式). 加法是多项式相加,标量乘法是系数逐项缩放。这是一个 \((n+1)\) 维向量空间——基为 \(\{1, x, x^2, \ldots, x^n\}\)。
例 2.3(\(M_{m \times n}(F)\):矩阵空间). \(m \times n\) 矩阵在逐项加法和标量乘法下构成 \(mn\) 维向量空间。
例 2.4(\(\mathcal{C}([0,1], \mathbb{R})\):连续函数空间). 连续函数的点态加法和标量乘法满足八条公理。这是一个**无限维**向量空间——任何有限个连续函数都不能张成所有连续函数。
例 2.5(零空间 \(\{0_V\}\)). 唯一的 \(0\) 维向量空间。它的唯一元素是零向量。
非例子¶
理解什么**不是**向量空间同样重要——它帮助我们理解每条公理的必要性。
非例 2.1. \(\mathbb{Z}\) 不是 \(\mathbb{Z}\)-向量空间,因为 \(\mathbb{Z}\) 不是域。(但 \(\mathbb{Z}\) 是 \(\mathbb{Z}\)-模。)
非例 2.2. \(\mathbb{R}^2\) 配上非标准标量乘法 \(a \odot (x, y) := (ax, 0)\) 不满足公理 V6:\(1 \odot (x, y) = (x, 0) \neq (x, y)\)(当 \(y \neq 0\) 时)。
非例 2.3(令人惊讶的正例). 正实数 \(\mathbb{R}_{>0}\) 配上运算 \(u \oplus v := uv\)(普通乘法)和 \(a \odot v := v^a\)(指数运算),构成 \(\mathbb{R}\)-向量空间。
验证:\(a \odot (u \oplus v) = (uv)^a = u^a v^a = (a \odot u) \oplus (a \odot v)\)(V7 成立)。零向量是 \(1\)(因为 \(u \oplus 1 = u \cdot 1 = u\))。逆元是 \(u^{-1}\)(因为 \(u \oplus u^{-1} = u \cdot u^{-1} = 1\))。
本质洞察:向量空间的结构与集合的"表面"运算无关,只取决于公理是否满足。\(\mathbb{R}_{>0}\) 与 \(\mathbb{R}\)(配上标准运算)同构——同构映射是对数函数 \(\log: (\mathbb{R}_{>0}, \cdot, \text{exp}) \to (\mathbb{R}, +, \cdot)\)。
⚠️ 常见陷阱¶
💡 概念误区 2:混淆 \(0_V\)(零向量)与 \(0_F\)(域中的零)
错误想法:零向量和零标量是"同一个零"。
实际上:\(0_V \in V\) 和 \(0_F \in F\) 是完全不同的对象,住在不同的集合中。命题 2.1(\(0_F \cdot v = 0_V\))恰好把它们联系起来,但它们**不是同一个东西**。
为什么重要:在 \(V = M_{2 \times 2}(\mathbb{R})\) 中,\(0_V\) 是 \(2 \times 2\) 零矩阵,而 \(0_F = 0 \in \mathbb{R}\)。
🧠 思维陷阱 2:认为"只要加法和标量乘法有定义,就是向量空间"
新手想法:\(\mathbb{R}^2\) 上的任何加法和标量乘法都给出向量空间。
实际上:八条公理中的每一条都是独立的约束。非例 2.2 展示了一个满足 V1-V5、V7-V8 但不满足 V6 的例子。
正确做法:每次验证向量空间时,必须逐条检查八条公理。一条不满足就不是向量空间。
练习¶
练习 2.1(⭐). 证明零向量 \(0_V\) 是唯一的。(提示:设有两个零向量 \(0\) 和 \(0'\),考虑 \(0 + 0'\)。)
练习 2.2(⭐⭐). 验证 \(\mathbb{R}_{>0}\) 配上非例 2.3 中的运算确实满足全部八条公理。特别地,明确指出零向量和每个元素的逆元。
练习 2.3(⭐⭐). 设 \(V = \{f : \mathbb{R} \to \mathbb{R} \mid f(0) = 1\}\),配上点态乘法(\((f \oplus g)(x) := f(x)g(x)\))和指数标量乘法(\((a \odot f)(x) := f(x)^a\))。这是 \(\mathbb{R}\)-向量空间吗?如果是,零向量是什么?
§3 子空间与格运算 ⭐¶
动机¶
在 \(\mathbb{R}^3\) 中,过原点的直线和过原点的平面有什么共同点?它们都是 \(\mathbb{R}^3\) 的"子向量空间"——在继承的加法和标量乘法下,自身构成向量空间。子空间的概念允许我们在一个大的向量空间内部研究较小的结构。
但子空间的概念远不止于此。子空间的**交**和**和**给出了从已有子空间构造新子空间的方式——这构成了一个**格**(lattice)结构,它是理解维数公式和直和分解的关键。
子空间的定义与判定¶
定义 3.1. 设 \(V\) 为 \(F\)-向量空间。\(V\) 的非空子集 \(W\) 称为**子空间**(subspace),记作 \(W \leq V\),若 \(W\) 在 \(V\) 的加法和标量乘法下自身构成 \(F\)-向量空间。
直接验证八条公理过于繁琐。好消息是,大部分公理从 \(V\) 自动继承——我们只需检查运算的封闭性:
定理 3.2(子空间判定定理). \(W \subseteq V\) 是子空间当且仅当: 1. \(W \neq \emptyset\)(通常通过验证 \(0_V \in W\)) 2. 对所有 \(u, v \in W\) 和 \(a \in F\),\(au + v \in W\)(加法和标量乘法封闭性的一步合并)
证明. 条件 2 包含了两个封闭性:取 \(a = 1\) 得加法封闭,取 \(v = 0\) 得标量乘法封闭。取 \(a = -1, v = u\) 得逆元封闭。其余公理(结合律、交换律等)从 \(V\) 继承,因为 \(W\) 中的运算就是 \(V\) 中运算的限制。 \(\square\)
为什么条件 1 不能省略?因为空集 \(\emptyset\) 满足条件 2("真空真"——没有元素需要检查),但 \(\emptyset\) 不是向量空间(没有零向量)。
平凡子空间:每个向量空间 \(V\) 都有两个**平凡子空间**——\(\{0_V\}\) 和 \(V\) 本身。
子空间的交¶
定理 3.3. 设 \(\{W_i\}_{i \in I}\) 是 \(V\) 的一族子空间。则 \(\bigcap_{i \in I} W_i\) 是 \(V\) 的子空间。
证明. (i) \(0_V \in W_i\) 对每个 \(i\) 成立(每个 \(W_i\) 是子空间),所以 \(0_V \in \bigcap W_i\),交非空。(ii) 设 \(u, v \in \bigcap W_i\),\(a \in F\)。对每个 \(i\),\(u, v \in W_i\),由 \(W_i\) 的子空间性质得 \(au + v \in W_i\)。因此 \(au + v \in \bigcap W_i\)。 \(\square\)
关键反面:两个子空间的**并一般不是子空间**。
反例. 在 \(\mathbb{R}^2\) 中,设 \(W_1 = \{(x, 0) : x \in \mathbb{R}\}\)(\(x\)-轴)和 \(W_2 = \{(0, y) : y \in \mathbb{R}\}\)(\(y\)-轴)。\((1, 0) \in W_1\) 且 \((0, 1) \in W_2\),但 \((1, 0) + (0, 1) = (1, 1) \notin W_1 \cup W_2\)。
什么时候并是子空间? 当且仅当一个包含另一个:\(W_1 \cup W_2\) 是子空间 \(\Leftrightarrow\) \(W_1 \subseteq W_2\) 或 \(W_2 \subseteq W_1\)。
子空间的和¶
既然并不是子空间,我们需要一种"从两个子空间生成新子空间"的方式。这就是**子空间的和**。
定义 3.4. 设 \(W_1, W_2 \leq V\)。它们的**和**定义为:
命题 3.5. \(W_1 + W_2\) 是包含 \(W_1 \cup W_2\) 的**最小子空间**。
证明. 首先验证 \(W_1 + W_2\) 是子空间:\(0 = 0 + 0 \in W_1 + W_2\);若 \(u = w_1 + w_2, v = w_1' + w_2'\),则 \(au + v = (aw_1 + w_1') + (aw_2 + w_2') \in W_1 + W_2\)。其次,\(W_1 \subseteq W_1 + W_2\)(取 \(w_2 = 0\)),同理 \(W_2 \subseteq W_1 + W_2\)。最后,任何包含 \(W_1 \cup W_2\) 的子空间 \(U\) 必然包含所有 \(w_1 + w_2\)(因为 \(U\) 对加法封闭),因此 \(W_1 + W_2 \subseteq U\)。 \(\square\)
维数公式¶
定理 3.6(子空间和的维数公式). 设 \(V\) 有限维,\(W_1, W_2 \leq V\)。则:
证明思路. 取 \(W_1 \cap W_2\) 的基 \(\{u_1, \ldots, u_k\}\)。将其分别扩展为 \(W_1\) 的基 \(\{u_1, \ldots, u_k, v_1, \ldots, v_r\}\) 和 \(W_2\) 的基 \(\{u_1, \ldots, u_k, w_1, \ldots, w_s\}\)。然后证明 \(\{u_1, \ldots, u_k, v_1, \ldots, v_r, w_1, \ldots, w_s\}\) 是 \(W_1 + W_2\) 的基。张成性是直接的;线性独立性需要一些技巧——关键步骤是:若 \(\sum a_i u_i + \sum b_j v_j + \sum c_l w_l = 0\),则 \(\sum c_l w_l = -\sum a_i u_i - \sum b_j v_j \in W_1\),但 \(\sum c_l w_l \in W_2\),所以 \(\sum c_l w_l \in W_1 \cap W_2\),因此可以用 \(u_i\) 表出,再利用线性独立性得到所有系数为零。
类比:这是集合论中容斥原理 \(|A \cup B| = |A| + |B| - |A \cap B|\) 的线性代数版本。相似之处在于"减去重复计算的部分";**不像**的地方在于:集合的并用 \(\cup\),而子空间的"并"用 \(+\)(因为并一般不是子空间)。
⚠️ 常见陷阱¶
💡 概念误区 3:混淆子空间的"和"与集合的"并"
错误想法:\(W_1 + W_2 = W_1 \cup W_2\)。
实际上:\(W_1 \cup W_2 \subseteq W_1 + W_2\),但通常是严格包含。\(W_1 + W_2\) 还包含所有"一个来自 \(W_1\)、一个来自 \(W_2\)"的和。
正确理解:\(W_1 + W_2\) 是包含 \(W_1 \cup W_2\) 的最小子空间,它"填补"了并中缺少的元素。
🧠 思维陷阱 3:看到"子空间判定"就只检查加法和标量乘法封闭
新手想法:只要加法封闭 + 标量乘法封闭就是子空间。
实际上:还需要 \(W \neq \emptyset\)。最简单的做法是检查 \(0_V \in W\)。如果连 \(0_V\) 都不在 \(W\) 中,那么 \(W\) 肯定不是子空间(因为子空间必须包含零向量)。
练习¶
练习 3.1(⭐). 证明:\(\{(x, y, z) \in \mathbb{R}^3 : x + 2y - z = 0\}\) 是 \(\mathbb{R}^3\) 的子空间,求其维数。
练习 3.2(⭐⭐). 设 \(V = \mathbb{R}^3\),\(W_1 = \mathrm{span}\{(1,0,1), (0,1,0)\}\),\(W_2 = \mathrm{span}\{(1,1,0), (0,0,1)\}\)。计算 \(\dim(W_1 + W_2)\) 和 \(\dim(W_1 \cap W_2)\),验证维数公式。
§4 直和 ⭐⭐¶
动机¶
子空间的和 \(W_1 + W_2\) 中的每个元素都可以写成 \(w_1 + w_2\)(\(w_i \in W_i\))的形式,但这种分解一般**不唯一**。例如在 \(V = \mathbb{R}^2\) 中,\(W_1 = \mathbb{R}^2 = W_2\),则每个 \(v\) 都有无穷多种分解 \(v = w_1 + (v - w_1)\)。
什么时候分解是唯一的?这正是**直和**的概念。直和是线性代数中最重要的分解工具——它说的是"把一个空间干净地拆成互不干扰的部分"。
内直和的三种等价定义¶
定理 4.1. 设 \(W_1, W_2 \leq V\)。以下三个条件等价:
(i) \(V = W_1 + W_2\) 且 \(W_1 \cap W_2 = \{0\}\)
(ii) 每个 \(v \in V\) 可以**唯一**地写成 \(v = w_1 + w_2\),\(w_i \in W_i\)
(iii) \(V = W_1 + W_2\) 且 \(\dim V = \dim W_1 + \dim W_2\)(有限维)
满足以上条件时,记 \(V = W_1 \oplus W_2\),称 \(V\) 是 \(W_1\) 和 \(W_2\) 的**内直和**(internal direct sum)。
证明 (i)\(\Rightarrow\)(ii). 设 \(v = w_1 + w_2 = w_1' + w_2'\)。则 \(w_1 - w_1' = w_2' - w_2 \in W_1 \cap W_2 = \{0\}\),所以 \(w_1 = w_1'\),\(w_2 = w_2'\)。
证明 (ii)\(\Rightarrow\)(i). \(V = W_1 + W_2\) 由假设直接得到。若 \(v \in W_1 \cap W_2\),则 \(v = v + 0 = 0 + v\) 给出两种分解。唯一性要求 \(v = 0\)。
证明 (i)\(\Leftrightarrow\)(iii). 由维数公式:\(\dim V = \dim W_1 + \dim W_2 - \dim(W_1 \cap W_2)\)。\(W_1 \cap W_2 = \{0\}\) 当且仅当 \(\dim(W_1 \cap W_2) = 0\),即 \(\dim V = \dim W_1 + \dim W_2\)。 \(\square\)
阶段小结:条件 (i) 是最容易在实践中验证的(检查交是否为零)。条件 (ii) 是直和最本质的意义(唯一分解)。条件 (iii) 是有限维时最方便的数值判据。
外直和¶
定义 4.2. 给定 \(V_1, V_2\)(可以来自不同的向量空间),**外直和**定义为:
配上逐分量运算:\((v_1, v_2) + (v_1', v_2') := (v_1 + v_1', v_2 + v_2')\),\(a(v_1, v_2) := (av_1, av_2)\)。
内直和与外直和的桥梁:若 \(V = W_1 \oplus_{\mathrm{int}} W_2\),则映射 \((w_1, w_2) \mapsto w_1 + w_2\) 给出 \(W_1 \oplus_{\mathrm{ext}} W_2 \cong V\) 的同构。
补空间¶
定义 4.3. 设 \(W \leq V\)。子空间 \(U \leq V\) 称为 \(W\) 的**补空间**(complement),若 \(V = W \oplus U\)。
存在性:在有限维中,补空间总存在——将 \(W\) 的基扩展到 \(V\) 的基,扩展部分张成的子空间就是一个补空间。
不唯一性:补空间一般**不唯一**。例如在 \(\mathbb{R}^2\) 中,\(W = \{(x, 0) : x \in \mathbb{R}\}\)(\(x\)-轴)的补空间可以是**任何**不与 \(x\)-轴重合的过原点直线——\(y\)-轴是一个补,但 \(y = x\) 这条直线也是一个补。
反事实推理:如果补空间是唯一的,会发生什么?那么 \(\mathbb{R}^2\) 中的 \(x\)-轴就有唯一的"正交"方向——但"正交"需要内积的概念(§A2b 的内容)。在没有内积的纯向量空间中,没有"正交"这回事,所以所有方向都是平等的补空间。补空间的不唯一性恰好反映了向量空间中没有内积这一事实。
⚠️ 常见陷阱¶
💡 概念误区 4:混淆直和 \(V = W_1 \oplus W_2\) 和 \(V = W_1 + W_2\)
错误想法:只要 \(V = W_1 + W_2\) 就写成 \(V = W_1 \oplus W_2\)。
实际上:直和需要额外条件 \(W_1 \cap W_2 = \{0\}\)。例如 \(V = W + W = W\) 对任何 \(W\) 成立,但 \(V = W \oplus W\) 只在 \(W = \{0\}\) 时成立。
后果:不检查交集条件就声称直和,会导致维数计算错误和分解不唯一。
🧠 思维陷阱 4:认为商空间 \(V/W\) 和补空间 \(U\) 是"一回事"
新手想法:既然 \(U \cong V/W\),那 \(V/W\) 就是 \(U\)。
实际上:\(V/W\) 是一个由等价类组成的**唯一确定**的对象,而补空间 \(U\) 是**不唯一**的。它们同构但不相等。\(V/W\) 的定义不依赖任何选择;补空间的选择需要"选一组基并扩展"。
正确理解:\(V/W\) 是"压掉 \(W\) 后剩下的抽象信息";\(U\) 是 \(V\) 中一个具体的子空间,恰好装载了同样多的信息。
练习¶
练习 4.1(⭐⭐). 在 \(\mathbb{R}^3\) 中,设 \(W = \{(x, y, 0) : x, y \in \mathbb{R}\}\)(\(xy\)-平面)。找出三个不同的补空间 \(U_1, U_2, U_3\)。
练习 4.2(⭐⭐). 证明:若 \(V = W_1 \oplus W_2 \oplus W_3\)(三个子空间的直和),则 \(W_j \cap (W_i + W_k) = \{0\}\) 对每个 \(j\) 成立。这个条件比两两交为零(\(W_i \cap W_j = \{0\}\))更强吗?给出例子说明。
§5 商空间与典范投影 ⭐⭐¶
动机¶
设你站在 \(\mathbb{R}^3\) 中,面前有一个过原点的平面 \(W\)。你想"忽略" \(W\) 方向的信息,只关心"离 \(W\) 有多远"。怎么做?把所有"差一个 \(W\) 中的向量"的点视为同一个点。这就是商空间 \(V/W\) 的直觉:把 \(W\) "压扁"成一个点。
类比:商空间就像地图上的等高线。每条等高线上的所有点被视为"同一个点"(它们的海拔相同)。等高线本身就是"平行于 \(W\) 的平移"。地图上每个"等高线"的集合就是商空间中的一个元素。这个类比在"把同一类的元素视为一点"这个层面上是准确的,但**不像**的地方是:等高线之间的"距离"涉及度量,而商空间是纯代数概念,没有距离。
如果没有商空间会怎样¶
没有商空间,秩-零度定理的"优雅证明"就无法给出。当然可以用基扩展法直接证明(§15 证明一),但商空间证法(§15 证明二)揭示了一个更深刻的图景:\(V/\ker T \cong \mathrm{im}\, T\)(第一同构定理)。这个图景在后续的群论、环论、模论中反复出现——它是代数学的核心范式。
历史注记¶
商空间的概念来自 Noether(1927)在群论和环论中推广的同构定理。她的洞察是:商结构是理解态射(映射)最自然的语言。
陪集与等价关系¶
定义 5.1. 设 \(W \leq V\)。定义关系 \(v \sim_W u\) 当且仅当 \(v - u \in W\)。
命题 5.2. \(\sim_W\) 是等价关系。
证明.
- 自反:\(v - v = 0 \in W\)(\(W\) 是子空间,包含 \(0\))
- 对称:\(v - u \in W \Rightarrow u - v = -(v - u) \in W\)(\(W\) 对标量乘法封闭,\(-1 \in F\))
- 传递:\(v - u \in W, u - w \in W \Rightarrow v - w = (v - u) + (u - w) \in W\)(\(W\) 对加法封闭)
每一步都用到了 \(W\) 的子空间性质。如果 \(W\) 只是一个普通子集(不是子空间),这些性质一般不成立。 \(\square\)
等价类 \([v] = v + W := \{v + w : w \in W\}\) 称为**陪集**(coset)。几何上,\(v + W\) 是"平行于 \(W\)、通过 \(v\) 的仿射子空间"。
商空间的构造¶
定义 5.3. 商空间 \(V/W\) 是所有陪集的集合:\(V/W := \{v + W : v \in V\}\)。
在 \(V/W\) 上定义运算:
- 加法:\((u + W) + (v + W) := (u + v) + W\)
- 标量乘法:\(a(v + W) := (av) + W\)
良定义性验证(这是商空间构造中最关键的步骤):
运算定义在陪集上,但我们使用了代表元 \(u, v\) 来计算。如果选不同的代表元,结果会一样吗?
设 \(u_1 + W = u_2 + W\)(即 \(u_1 - u_2 \in W\))且 \(v_1 + W = v_2 + W\)(即 \(v_1 - v_2 \in W\))。则:
因此 \((u_1 + v_1) + W = (u_2 + v_2) + W\)。加法良定义。标量乘法的良定义性类似验证。
为什么良定义性验证如此重要? 如果运算不良定义,那么同一个陪集用不同代表元计算会得到不同结果——这是灾难性的。在数学中,只要运算定义涉及"代表元的选择",就**必须验证良定义性**。
**\(V/W\) 的零向量**是 \(0 + W = W\) 本身。
维数公式¶
定理 5.4. 设 \(V\) 有限维。则 \(\dim(V/W) = \dim V - \dim W\)。
证明. 取 \(W\) 的基 \(\{w_1, \ldots, w_k\}\),扩展为 \(V\) 的基 \(\{w_1, \ldots, w_k, v_1, \ldots, v_m\}\)。
断言:\(\{v_1 + W, \ldots, v_m + W\}\) 是 \(V/W\) 的基。
张成性. 任取 \(v \in V\),\(v = \sum a_i w_i + \sum b_j v_j\)。则 \(v + W = \sum b_j (v_j + W)\)(因为 \(\sum a_i w_i \in W\),被 \(+W\) "吸收"了)。
线性独立性. 设 \(\sum b_j (v_j + W) = 0 + W\),即 \(\sum b_j v_j \in W\)。则 \(\sum b_j v_j = \sum c_i w_i\),即 \(\sum b_j v_j - \sum c_i w_i = 0\)。由 \(V\) 的基的线性独立性,所有 \(b_j = 0\)(和 \(c_i = 0\))。
因此 \(\dim(V/W) = m = (k + m) - k = \dim V - \dim W\)。 \(\square\)
直觉:商空间"压掉"了 \(W\) 的 \(k\) 个维度,剩下 \(n - k\) 个维度。
典范投影¶
定义 5.5. 典范投影(canonical projection)\(\pi: V \to V/W\) 定义为 \(\pi(v) := v + W\)。
性质: - \(\pi\) 是**线性映射**:\(\pi(au + v) = (au + v) + W = a(u + W) + (v + W) = a\pi(u) + \pi(v)\) - \(\pi\) 是**满射**:对任意 \(v + W \in V/W\),\(\pi(v) = v + W\) - \(\ker \pi = W\):\(\pi(v) = 0 + W \Leftrightarrow v \in W\)
泛性质(universal property):若 \(T: V \to U\) 是线性映射且 \(W \subseteq \ker T\),则存在**唯一**的线性映射 \(\bar{T}: V/W \to U\) 使 \(T = \bar{T} \circ \pi\)。
\(\bar{T}\) 的定义:\(\bar{T}(v + W) := T(v)\)。良定义性:若 \(v_1 + W = v_2 + W\),则 \(v_1 - v_2 \in W \subseteq \ker T\),所以 \(T(v_1) = T(v_2)\)。
⚠️ 常见陷阱¶
💡 概念误区 5:忘记验证良定义性
错误做法:定义 \(V/W\) 上的运算后直接使用,不验证运算不依赖代表元的选择。
后果:如果 \(W\) 不是子空间而只是普通子集,良定义性可能**失败**。例如,取 \(V = \mathbb{R}\),\(S = \{0, 1\}\)(不是子空间),定义 \(x \sim y\) 当 \(x - y \in S\)。这不是等价关系(\(1 \sim 0\) 且 \(0 \sim (-1)\),但 \(1 \not\sim (-1)\) 因为 \(2 \notin S\)),所以"商"根本不存在。
正确做法:每次在商结构上定义运算时,必须验证良定义性。这是一个需要养成习惯的步骤。
🧠 思维陷阱 5:把商空间想象成"子空间"
新手想法:\(V/W\) 是 \(V\) 的一部分。
实际上:\(V/W\) 的元素是**陪集**(\(V\) 的子集),不是 \(V\) 的向量。\(V/W\) 是一个全新的向量空间,其维数为 \(\dim V - \dim W\)。虽然每个补空间 \(U\) 都与 \(V/W\) 同构(\(U \cong V/W\)),但 \(V/W\) 本身**不住在** \(V\) 里面。
练习¶
练习 5.1(⭐⭐). 设 \(V = \mathbb{R}^3\),\(W = \{(x, y, 0) : x, y \in \mathbb{R}\}\)。描述 \(V/W\) 的元素(几何上是什么?),并验证 \(\dim V/W = 1\)。
练习 5.2(⭐⭐⭐). 证明典范投影的泛性质:若 \(T: V \to U\) 且 \(W \subseteq \ker T\),则存在唯一的 \(\bar{T}: V/W \to U\) 使 \(T = \bar{T} \circ \pi\)。(提示:先定义 \(\bar{T}\),再验证良定义、线性、唯一性。)
第一幕到此结束。我们已经建立了向量空间理论的基本语言:域、向量空间公理、子空间、直和、商空间。下一幕将在这个语言的基础上建立维数理论——回答"向量空间有多大?"这个核心问题。
第二幕:维数理论¶
第二幕的目标是回答一个根本性的问题:如何量化一个向量空间的"大小"? 答案是**维数**——基中元素的个数。但"维数良定义"这一看似显然的事实,其证明需要精巧的技术(Steinitz 替换引理)。对于无限维空间,甚至需要集合论的重型工具(Zorn 引理)。
§6 线性组合、张成、线性相关与独立 ⭐¶
动机¶
在 \(\mathbb{R}^3\) 中,三个向量 \((1,0,0)\)、\((0,1,0)\)、\((0,0,1)\) 可以"生成"整个空间——任何向量 \((a,b,c)\) 都可以写成 \(a(1,0,0) + b(0,1,0) + c(0,0,1)\)。但三个向量 \((1,0,0)\)、\((2,0,0)\)、\((0,1,0)\) 中,第二个是第一个的倍数——它是"多余的"。
线性组合、张成和线性独立的概念精确地回答了两个问题: 1. 给定一些向量,它们能"到达"空间中的哪些点?(张成) 2. 其中是否有"多余的"向量?(线性独立性)
线性组合与张成¶
定义 6.1. 向量 \(v_1, \ldots, v_n \in V\) 的**线性组合**(linear combination)是形如 \(a_1 v_1 + a_2 v_2 + \cdots + a_n v_n\) 的表达式,其中 \(a_i \in F\)。
定义 6.2. 子集 \(S \subseteq V\) 的**张成**(span)定义为 \(S\) 中元素的所有有限线性组合的集合:
约定 \(\mathrm{span}(\emptyset) := \{0\}\)。
命题 6.3. \(\mathrm{span}(S)\) 是包含 \(S\) 的**最小子空间**。
线性相关与线性独立¶
定义 6.4. 向量 \(v_1, \ldots, v_n\) 称为**线性相关**(linearly dependent),若存在不全为零的标量 \(a_1, \ldots, a_n \in F\) 使得 \(a_1 v_1 + \cdots + a_n v_n = 0\)。
定义 6.5. 向量 \(v_1, \ldots, v_n\) 称为**线性独立**(linearly independent),若 \(a_1 v_1 + \cdots + a_n v_n = 0\) 只有平凡解 \(a_1 = \cdots = a_n = 0\)。
线性独立是线性相关的**否命题**:不存在非平凡零表示。
对无限集 \(S\):\(S\) 线性独立当且仅当 \(S\) 的每个**有限子集**线性独立。这个"有限性"在 §9 中的 Zorn 引理论证中扮演关键角色。
基本性质¶
- 含零向量的集合必线性相关:\(1 \cdot 0_V = 0_V\),系数 \(1 \neq 0\)
- 两个向量线性相关 \(\Leftrightarrow\) 一个是另一个的标量倍
- 线性独立集的子集仍线性独立
- 线性相关引理(Axler 2.19):若 \((v_1, \ldots, v_m)\) 线性相关且 \(v_1 \neq 0\),则某个 \(v_j\)(\(j \geq 2\))可以从前面的向量线性表出,且去掉 \(v_j\) 后张成不变
⚠️ 常见陷阱¶
💡 概念误区 6:混淆"线性独立"和"正交"
错误想法:线性独立的向量一定互相垂直。
实际上:线性独立是纯代数概念,不需要内积。\((1, 0)\) 和 \((1, 1)\) 线性独立但不正交。正交向量一定线性独立,但反过来不成立。
为什么重要:在没有内积的向量空间(如多项式空间 \(F[x]\))中,"正交"没有意义,但"线性独立"仍有意义。
🧠 思维陷阱 6:用行列式判定线性独立性后就停止思考
新手想法:判定线性独立性 = 算行列式。
实际上:行列式只适用于 \(n\) 个 \(n\) 维向量的情况。对于一般情况(\(m\) 个向量在 \(n\) 维空间中,\(m \neq n\)),需要回到定义或用秩来判定。
正确思维:线性独立性是一个关于"零表示是否唯一"的逻辑命题,行列式只是有限维方阵的一个计算工具。
练习¶
练习 6.1(⭐). 在 \(\mathbb{R}[x]_{\leq 2}\) 中,判断 \(\{1, 1+x, 1+x+x^2\}\) 是否线性独立。
练习 6.2(⭐⭐). 证明线性相关引理(Axler 2.19)。
§7 Steinitz 替换引理 ⭐⭐¶
动机¶
Steinitz 替换引理是维数理论的基石。它回答了一个直觉上"显然"但证明起来并不简单的问题:如果一个向量空间有一组张成集(\(n\) 个向量),那么任何线性独立集的大小不超过 \(n\)。
如果没有 Steinitz 引理,我们就无法证明"维数的良定义性"——即同一个向量空间的任意两组基有相同个数的元素。
历史注记¶
Ernst Steinitz 在 1913 年的论文 Bedingt konvergente Reihen und konvexe Systeme 中证明了这个引理。虽然原始论文讨论的是条件收敛级数,但其中的替换技术成为了线性代数的标准工具。
引理陈述与完整证明¶
引理 7.1(Steinitz 替换引理). 设 \(\{w_1, \ldots, w_n\}\) 张成 \(V\),\(\{u_1, \ldots, u_m\}\) 线性独立。则 \(m \leq n\),且可以用 \(u_i\) 替换某些 \(w_j\) 使得 \(\{u_1, \ldots, u_m, w_{j_1}, \ldots, w_{j_{n-m}}\}\) 仍张成 \(V\)。
证明(对 \(m\) 归纳).
基础步(\(m = 0\)):无需替换,结论平凡成立。
归纳步:设对 \(m - 1\) 成立。由归纳假设,已替换得到 \(\{u_1, \ldots, u_{m-1}, w_{j_1}, \ldots, w_{j_{n-m+1}}\}\) 张成 \(V\)。
由于此集合张成 \(V\),\(u_m\) 可以表示为:
关键断言:至少有一个 \(b_l \neq 0\)。
反证法. 若所有 \(b_l = 0\),则 \(u_m = \sum_{i=1}^{m-1} a_i u_i\),即 \(u_m\) 是 \(u_1, \ldots, u_{m-1}\) 的线性组合。这意味着 \(\{u_1, \ldots, u_m\}\) 线性相关——与假设矛盾。
设 \(b_{l_0} \neq 0\)。从上式解出 \(w_{j_{l_0}}\):
这里用到了 \(b_{l_0} \neq 0\),因此 \(b_{l_0}^{-1}\) 存在(\(F\) 是域!)。
用 \(u_m\) 替换 \(w_{j_{l_0}}\),新集合 \(\{u_1, \ldots, u_m, w_{j_1}, \ldots, \hat{w}_{j_{l_0}}, \ldots, w_{j_{n-m+1}}\}\) 仍张成 \(V\)(因为被替换的 \(w_{j_{l_0}}\) 可以由新集合中的元素线性表出)。
替换后集合大小为 \(m + (n - m + 1 - 1) = n\),其中恰好 \(m\) 个 \(u_i\) 和 \(n - m\) 个 \(w_j\)。归纳完成。
特别地,\(m \leq n\)(否则在某步中 \(n - m + 1 = 0\),\(u_m\) 只由 \(u_1, \ldots, u_{m-1}\) 表出,矛盾独立性)。 \(\square\)
注意证明中 \(b_{l_0}^{-1}\) 的存在依赖于 \(F\) 是域。这是向量空间理论比模论更简洁的根本原因——域中非零元素可以"除",环中不行。
核心推论¶
推论 7.2. 线性独立集的大小 \(\leq\) 张成集的大小。
推论 7.3. 有限维空间的任意两组基大小相同。(证明:设两组基分别有 \(m\) 和 \(n\) 个元素。一组是独立集,另一组是张成集,由推论 7.2 得 \(m \leq n\) 且 \(n \leq m\)。)
推论 7.4. 有限张成集可以削减为基;线性独立集可以扩展为基。
⚠️ 常见陷阱¶
💡 概念误区 7:认为 Steinitz 引理"显然成立"不需要证明
新手想法:独立向量不超过张成向量的个数,这不是常识吗?
实际上:这个"常识"的严格证明需要域的性质(非零元素可逆)和精心设计的归纳。在**模**上(标量来自环),类似的陈述**不成立**——自由模的秩不一定良定义。
练习¶
练习 7.1(⭐⭐). 在 Steinitz 引理的证明中,明确指出哪一步用到了"\(F\) 是域"这一条件。如果 \(F\) 是环(如 \(\mathbb{Z}\)),证明会在哪一步失败?
§8 基与维数(有限维)⭐¶
基的三种等价定义¶
定理 8.1. 以下三个条件对 \(B \subseteq V\) 等价:
- \(B\) 是**极大**线性独立集(不能再添加任何向量而保持独立)
- \(B\) 是**极小**张成集(去掉任何一个向量就不再张成 \(V\))
- \(B\) 线性独立且张成 \(V\)
维数(dimension)的定义:\(\dim_F V := |B|\),其中 \(B\) 是 \(V\) 的任意基。由推论 7.3,维数不依赖基的选择。
维数的基本性质¶
| 性质 | 说明 |
|---|---|
| \(\dim F^n = n\) | 标准基 \(e_1, \ldots, e_n\) |
| \(\dim F[x]_{\leq n} = n + 1\) | 基 \(\{1, x, \ldots, x^n\}\) |
| \(\dim M_{m \times n}(F) = mn\) | 基 \(\{E_{ij}\}\),\(E_{ij}\) 是 \((i,j)\) 位置为 \(1\) 其余为 \(0\) 的矩阵 |
| \(W \leq V \Rightarrow \dim W \leq \dim V\) | 独立集不超过基的大小 |
| \(W \leq V, \dim W = \dim V \Rightarrow W = V\) | 有限维的特殊性质 |
本质洞察:维数是向量空间的**唯一完全不变量**(在同构意义下)。两个有限维 \(F\)-向量空间同构当且仅当维数相同。这意味着**有限维向量空间的分类问题被维数完全解决了**——这在代数学中是罕见的简洁。
基的扩展与削减¶
定理 8.2(扩展定理). 设 \(V\) 有限维。\(V\) 中任何线性独立集都可以扩展为 \(V\) 的一组基。
证明. 设 \(S = \{v_1, \ldots, v_k\}\) 线性独立,\(\{w_1, \ldots, w_n\}\) 是 \(V\) 的一组基(张成集)。由 Steinitz 引理,\(k \leq n\),且可以用 \(v_i\) 替换某些 \(w_j\),得到 \(\{v_1, \ldots, v_k, w_{j_1}, \ldots, w_{j_{n-k}}\}\) 仍张成 \(V\)。
断言:这个新集合也线性独立。
这需要验证:原来的 \(n\) 个向量替换后仍有 \(n\) 个,张成 \(n\) 维空间的 \(n\) 个向量必然线性独立(否则可以删掉一个而仍然张成,得到 \(n-1\) 个向量张成 \(n\) 维空间,与 Steinitz 引理矛盾)。 \(\square\)
定理 8.3(削减定理). 设 \(V\) 有限维。\(V\) 的任何张成集都可以削减为一组基。
证明思路. 从张成集中逐步删除"多余的"向量(即可以由其余向量线性表出的向量),直到剩下的向量线性独立为止。线性相关引理(§6)保证每步都能找到可删除的向量。
阶段小结:扩展定理和削减定理是基的两种构造方式——从"太小"(独立但不张成)扩展,或从"太大"(张成但不独立)削减。两者的共同终点是基——恰到好处的集合。
维数与子空间的关系¶
维数给出了子空间之间的偏序关系的量化描述。以下两个结果在实践中经常使用:
命题 8.4. 设 \(V\) 有限维,\(W \leq V\)。则:
(a) \(\dim W \leq \dim V\)
(b) \(\dim W = \dim V \Rightarrow W = V\)
证明. (a) \(W\) 的基是 \(V\) 中的线性独立集,由 Steinitz 引理不超过 \(V\) 的基的大小。
(b) 设 \(\dim W = n = \dim V\)。\(W\) 的基 \(\{w_1, \ldots, w_n\}\) 是 \(V\) 中的 \(n\) 个线性独立向量。但 \(V\) 的维数为 \(n\),所以任何 \(n\) 个线性独立向量必然张成 \(V\)(否则可以扩展为 \(n+1\) 个独立向量,与维数矛盾)。因此 \(\mathrm{span}\{w_1, \ldots, w_n\} = V\),即 \(W = V\)。 \(\square\)
反事实推理:命题 8.4(b) 在无限维中**不成立**。考虑 \(V = F[x]\)(所有多项式),\(W = xF[x]\)(无常数项的多项式)。两者的 Hamel 基分别为 \(\{1, x, x^2, \ldots\}\) 和 \(\{x, x^2, x^3, \ldots\}\),基数都是 \(\aleph_0\)。但 \(W \subsetneq V\)(常数多项式 \(1 \notin W\))。有限维的特殊性在于:维数是一个**有限数**,所以"等维"是一个很强的约束。
⚠️ 常见陷阱¶
💡 概念误区 8:认为"\(\dim W = \dim V\) 蕴含 \(W = V\)"在无限维也成立
实际上:在无限维中,\(\dim W = \dim V\)(作为基数相等)并不蕴含 \(W = V\)。例如 \(V = F[x]\)(所有多项式),\(W = xF[x]\)(常数项为零的多项式)。两者维数都是 \(\aleph_0\),但 \(W \subsetneq V\)。
🧠 思维陷阱 8:认为基的选择对向量空间的"本质"有影响
新手想法:标准基 \(\{e_1, \ldots, e_n\}\) 是 \(\mathbb{R}^n\) 的"正确"基。
实际上:所有基都是平等的。标准基只是**一种**选择,它的特殊性仅仅在于计算上的方便。选择不同的基就像选择不同的坐标系——同一个向量有不同的坐标表示,但向量本身没有改变。
正确理解:向量空间的本质结构(维数、子空间、线性映射的核/像等)不依赖基的选择。依赖基的量(如坐标、矩阵表示)只是计算工具。
练习¶
练习 8.1(⭐). 求向量空间 \(\{A \in M_{n \times n}(\mathbb{R}) : A^T = A\}\)(对称矩阵空间)的维数。给出一组基。
练习 8.2(⭐⭐,跨章综合). 设 \(V = \mathbb{R}[x]_{\leq 3}\)(次数 \(\leq 3\) 的多项式),\(W = \{p \in V : p(1) = 0\}\)。(a) 证明 \(W\) 是 \(V\) 的子空间。(b) 求 \(\dim W\)。(c) 利用 §5 的维数公式求 \(\dim(V/W)\)。(d) 给出 \(V/W\) 的一组基。
练习 8.3(⭐⭐). 设 \(V = M_{2 \times 2}(\mathbb{R})\),\(W = \{A \in V : \mathrm{tr}(A) = 0\}\)(迹为零的矩阵)。(a) 证明 \(W\) 是子空间。(b) 求 \(\dim W\) 和一组基。(c) 找出 \(W\) 的一个补空间 \(U\)(使 \(V = W \oplus U\))。
§9 Zorn 引理与 Hamel 基 ⭐⭐⭐¶
动机¶
在有限维空间中,基的存在性是"显然的"——从一个张成集出发,逐步删除多余向量即可。但在无限维空间中(如 \(\mathcal{C}([0,1], \mathbb{R})\)),没有有限的张成集可供删减。我们需要一个更强大的工具来保证基的存在性——这就是 Zorn 引理。
反事实推理:如果没有 Zorn 引理(等价地,没有选择公理),会怎样?Blass(1984)证明了一个惊人的结果:"每个向量空间有基"与选择公理等价。这意味着在没有 AC 的 ZF 集合论中,存在没有基的向量空间。这是一个深刻的集合论结果——基的存在性不是"免费的",它需要选择公理作为代价。
Hamel 基的定义¶
定义 9.1. 向量空间 \(V\) 的 **Hamel 基**是一个线性独立且张成 \(V\) 的子集 \(B \subseteq V\),其中"张成"要求每个 \(v \in V\) 都是 \(B\) 中元素的**有限**线性组合。
类比:Hamel 基与泛函分析中的 **Schauder 基**的区别:Schauder 基允许无穷级数 \(v = \sum_{i=1}^{\infty} a_i e_i\)(需要拓扑收敛),而 Hamel 基只允许有限和。这个类比在"都是生成集"这一点上相似,但**不像**的是:Hamel 基是纯代数概念,Schauder 基需要拓扑结构。在有限维空间中,两者一致。
任意向量空间有基(Zorn 引理证明)¶
定理 9.2. 每个向量空间都有 Hamel 基。
证明. 回顾 §A1.9 中的 Zorn 引理:若偏序集 \((P, \leq)\) 中每条链都有上界,则 \(P\) 有极大元。
设 \(\mathcal{P} = \{S \subseteq V : S \text{ 线性独立}\}\),按包含关系 \(\subseteq\) 偏序。
验证 Zorn 引理的条件:设 \(\{S_\alpha\}_{\alpha \in A}\) 是 \(\mathcal{P}\) 中的一条链(即对任意 \(\alpha, \beta\),\(S_\alpha \subseteq S_\beta\) 或 \(S_\beta \subseteq S_\alpha\))。
令 \(U = \bigcup_{\alpha} S_\alpha\)。我们需要证明 \(U\) 线性独立。
设 \(v_1, \ldots, v_n \in U\),\(a_1 v_1 + \cdots + a_n v_n = 0\)。每个 \(v_i\) 属于某个 \(S_{\alpha_i}\)。由于 \(\{S_\alpha\}\) 是链,\(\{S_{\alpha_1}, \ldots, S_{\alpha_n}\}\) 中有一个最大的,设为 \(S_{\alpha_0}\)。则 \(v_1, \ldots, v_n \in S_{\alpha_0}\)。由于 \(S_{\alpha_0}\) 线性独立,\(a_1 = \cdots = a_n = 0\)。
关键:这个论证用到了线性独立是"有限性质"——只需检查有限子集。如果"独立"的定义涉及无限和,这个论证就会失败。
由 Zorn 引理,\(\mathcal{P}\) 有极大元 \(M\)。
断言:\(M\) 张成 \(V\)。
反证法. 若存在 \(v \notin \mathrm{span}(M)\),则 \(M \cup \{v\}\) 仍线性独立(因为 \(v\) 不能由 \(M\) 中的元素线性表出)。这与 \(M\) 的极大性矛盾。
因此 \(M\) 是线性独立且张成 \(V\) 的集合,即 Hamel 基。 \(\square\)
⚠️ 常见陷阱¶
🧠 思维陷阱 9:认为无限维空间的基可以"写出来"
新手想法:\(\mathcal{C}([0,1], \mathbb{R})\) 的 Hamel 基是什么?能列出来吗?
实际上:\(\mathcal{C}([0,1], \mathbb{R})\) 的 Hamel 基的存在性依赖选择公理,无法构造性地给出。我们知道它存在,但永远无法"写出"它的所有元素。
正确理解:Zorn 引理保证的是**存在性**,不提供构造方法。这是纯存在性证明的典型例子。
💡 概念误区 9:混淆 Hamel 基和 Schauder 基
错误想法:\(\{1, x, x^2, \ldots\}\) 是 \(\mathcal{C}([0,1], \mathbb{R})\) 的基。
实际上:多项式在 \(\mathcal{C}([0,1], \mathbb{R})\) 中稠密(Weierstrass 逼近定理),但这是拓扑意义上的稠密(无穷级数逼近),不是代数意义上的张成(有限线性组合)。\(\{1, x, x^2, \ldots\}\) 的有限线性组合只能生成多项式,不能生成所有连续函数。
练习¶
练习 9.1(⭐⭐⭐). 用 Zorn 引理证明:任何线性独立集都可以扩展为基。(提示:把 Zorn 引理用到"包含给定独立集的线性独立集"的偏序集上。)
§10-§11 基数不变性与坐标映射 ⭐⭐¶
§10 处理无限维空间中维数的良定义性(任意两组基等势),§11 建立坐标映射和分类定理。由于这两节高度技术性且在机器人学中较少直接使用,这里给出核心结论。
定理 10.1(基数不变性). 无限维 \(F\)-向量空间 \(V\) 的任意两组 Hamel 基具有相同的基数。
定理 11.1(分类定理). 两个有限维 \(F\)-向量空间同构当且仅当维数相同。每个 \(n\) 维 \(F\)-向量空间同构于 \(F^n\)。
坐标映射 \([\cdot]_\mathcal{B}: V \to F^n\),\(v = \sum a_i v_i \mapsto (a_1, \ldots, a_n)\),是**依赖基的选择**的同构。换基就换坐标。
⚠️ 常见陷阱¶
💡 概念误区 10:认为"\(V\) 同构于 \(F^n\)"意味着 \(V\) 就是 \(F^n\)
错误想法:既然所有 \(n\) 维空间都同构于 \(F^n\),那它们都是一样的。
实际上:同构说的是"结构相同",但同构映射**不唯一**——每组基给出一个不同的同构。不同的同构给出不同的坐标表示。\(F^n\) 是一个"标准模型",但多项式空间、矩阵空间等有各自自然的结构,不应把它们都"强制"视为 \(F^n\)。
练习¶
练习 11.1(⭐⭐,跨章综合). 设 \(V = \mathbb{R}[x]_{\leq 2}\),\(\mathcal{B}_1 = (1, x, x^2)\),\(\mathcal{B}_2 = (1, 1+x, 1+x+x^2)\)。(a) 写出 \(p(x) = 3 + 2x + x^2\) 在 \(\mathcal{B}_1\) 和 \(\mathcal{B}_2\) 下的坐标。(b) 写出从 \(\mathcal{B}_1\) 到 \(\mathcal{B}_2\) 的基变换矩阵。(这为 §17 做准备。)
第二幕到此结束。我们已经建立了维数理论:基的存在性、维数的良定义性、坐标与分类。上面解决了"向量空间有多大"的问题,但还没有回答"向量空间之间的映射有什么结构"——这正是第三幕的主题。
第三幕:线性变换¶
第三幕的目标是研究向量空间之间的**结构保持映射**——线性映射。这是线性代数的核心引擎:矩阵、秩、行列式、特征值等概念都是线性映射的不同侧面。
§12 线性映射的定义与基本性质 ⭐¶
动机¶
向量空间是"静态的"对象——它描述了一个集合的结构。但数学和工程的力量来自**变换**:旋转、投影、微分、积分。这些变换有什么共同特征?它们都保持线性结构——即 \(T(au + bv) = aT(u) + bT(v)\)。线性映射的概念抽象出了这一共性。
定义¶
定义 12.1. 设 \(V, W\) 为 \(F\)-向量空间。映射 \(T: V \to W\) 称为**线性映射**(linear map),若对所有 \(u, v \in V\),\(a, b \in F\):
等价地,\(T(u + v) = T(u) + T(v)\) 且 \(T(av) = aT(v)\)。
定理 12.2(线性映射由基的像完全确定). 设 \(\mathcal{B} = \{v_1, \ldots, v_n\}\) 是 \(V\) 的基。对 \(W\) 中任意 \(w_1, \ldots, w_n\),存在唯一的线性映射 \(T: V \to W\) 使 \(T(v_i) = w_i\)。
证明. 存在性:定义 \(T\left(\sum a_i v_i\right) := \sum a_i w_i\)。由于 \(\mathcal{B}\) 是基,每个 \(v \in V\) 有唯一的表示 \(v = \sum a_i v_i\),所以 \(T\) 是良定义的函数。线性验证直接。唯一性:若 \(T'\) 也满足 \(T'(v_i) = w_i\),则对任意 \(v = \sum a_i v_i\),\(T'(v) = T'(\sum a_i v_i) = \sum a_i T'(v_i) = \sum a_i w_i = T(v)\)。 \(\square\)
这个定理的意义:线性映射的自由度恰好等于维数。一旦指定了基的像(\(n\) 个自由选择),线性映射就被完全确定了。
基本例子¶
| 映射 | 定义 | 线性性来源 |
|---|---|---|
| 零映射 \(0: V \to W\) | \(v \mapsto 0_W\) | \(0(au+bv) = 0 = a \cdot 0 + b \cdot 0\) |
| 恒等映射 \(\mathrm{id}_V\) | \(v \mapsto v\) | 平凡 |
| 投影 \(\pi_1: V_1 \oplus V_2 \to V_1\) | \((v_1, v_2) \mapsto v_1\) | 逐分量线性 |
| 求导 \(D: F[x]_{\leq n} \to F[x]_{\leq n-1}\) | \(p \mapsto p'\) | \((ap + bq)' = ap' + bq'\) |
| 矩阵左乘 \(L_A: F^n \to F^m\) | \(x \mapsto Ax\) | \(A(ax+by) = aAx + bAy\) |
线性映射的基本性质¶
命题 12.3. 设 \(T: V \to W\) 线性。则:
(a) \(T(0_V) = 0_W\)
(b) \(T(-v) = -T(v)\) 对所有 \(v \in V\)
(c) \(T\left(\sum_{i=1}^{n} a_i v_i\right) = \sum_{i=1}^{n} a_i T(v_i)\)(有限线性组合的保持)
证明. (a) \(T(0_V) = T(0_F \cdot v) = 0_F \cdot T(v) = 0_W\)。(b) \(T(-v) = T((-1) \cdot v) = (-1) \cdot T(v) = -T(v)\)。(c) 对 \(n\) 归纳即可。 \(\square\)
性质 (a) 特别重要:线性映射必须把零映射到零。这是判定"非线性"的最快方法——如果 \(T(0) \neq 0\),\(T\) 一定不是线性映射。
命题 12.4(线性映射保持子空间). 设 \(T: V \to W\) 线性。
(a) 若 \(S \leq V\),则 \(T(S) := \{T(s) : s \in S\} \leq W\)
(b) 若 \(U \leq W\),则 \(T^{-1}(U) := \{v \in V : T(v) \in U\} \leq V\)
证明. (a) \(T(S)\) 非空(\(T(0_V) = 0_W \in T(S)\))。对 \(T(s_1), T(s_2) \in T(S)\),\(a T(s_1) + T(s_2) = T(as_1 + s_2) \in T(S)\)。(b) 类似。 \(\square\)
线性映射的复合与逆¶
命题 12.5. 若 \(T: V \to W\) 和 \(S: W \to U\) 都是线性的,则 \(S \circ T: V \to U\) 也是线性的。
命题 12.6. 若 \(T: V \to W\) 是双射线性映射,则 \(T^{-1}: W \to V\) 也是线性的。
证明. 设 \(w_1, w_2 \in W\),\(a \in F\)。设 \(T(v_i) = w_i\)。则 \(T(av_1 + v_2) = aT(v_1) + T(v_2) = aw_1 + w_2\)。因此 \(T^{-1}(aw_1 + w_2) = av_1 + v_2 = aT^{-1}(w_1) + T^{-1}(w_2)\)。 \(\square\)
这个命题非常重要:它说明**线性同构**(双射线性映射)的逆也是线性的。在群论中,群同态的逆不一定是同态(除非是双射的),所以线性映射的这个性质并不"显然"。
⚠️ 常见陷阱¶
💡 概念误区 12:认为所有函数都是线性映射
错误想法:\(f(x) = x + 1\) 是 \(\mathbb{R} \to \mathbb{R}\) 的线性映射。
实际上:\(f(0) = 1 \neq 0\)。线性映射必须把零映射到零:\(T(0) = T(0 \cdot v) = 0 \cdot T(v) = 0\)。\(f(x) = x + 1\) 是**仿射映射**,不是线性映射。
🧠 思维陷阱 12:混淆"线性函数"和"线性映射"
新手想法:\(y = 2x + 3\) 是线性函数,所以 \(T(x) = 2x + 3\) 是线性映射。
实际上:在微积分中,"线性函数"指的是图像为直线的函数(\(y = mx + b\))。在线性代数中,"线性映射"要求 \(T(0) = 0\) 且保持加法和标量乘法。只有 \(b = 0\) 时(即 \(T(x) = mx\)),微积分的"线性函数"才是线性代数的"线性映射"。
练习¶
练习 12.1(⭐). 验证求导算子 \(D: \mathbb{R}[x]_{\leq 3} \to \mathbb{R}[x]_{\leq 2}\) 是线性映射。写出 \(D\) 在标准基 \(\{1, x, x^2, x^3\}\) 和 \(\{1, x, x^2\}\) 下的矩阵表示。
练习 12.2(⭐⭐). 设 \(V = \mathcal{C}([0,1], \mathbb{R})\),定义 \(T(f)(x) = \int_0^x f(t) dt\)。证明 \(T\) 是线性映射。\(T\) 是单射吗?满射吗?
§13 Hom(V,W) 作为向量空间 ⭐⭐¶
动机¶
我们已经知道单个线性映射的性质。但所有线性映射的**集合**也有丰富的结构——它自身构成一个向量空间。这个观察把"线性映射"从工具提升为对象,允许我们对映射本身做线性代数。
Hom(V,W) 的向量空间结构¶
定义 13.1. \(\mathrm{Hom}(V, W) := \{T: V \to W \mid T \text{ 线性}\}\),配上逐点运算:
- \((S + T)(v) := S(v) + T(v)\)
- \((aT)(v) := a \cdot T(v)\)
命题 13.2. \(\mathrm{Hom}(V, W)\) 是 \(F\)-向量空间,且 \(\dim \mathrm{Hom}(V, W) = \dim V \cdot \dim W\)(有限维)。
证明思路. 通过选择 \(V\) 和 \(W\) 的基,建立同构 \(\mathrm{Hom}(V, W) \cong M_{m \times n}(F)\)(§17 的矩阵表示),后者的维数为 \(mn\)。
End(V) 与 GL(V)¶
定义 13.3. - \(\mathrm{End}(V) := \mathrm{Hom}(V, V)\)——自同态空间,配上复合运算 \(\circ\) 构成 \(F\)-代数 - \(\mathrm{GL}(V) := \{T \in \mathrm{End}(V) : T \text{ 可逆}\}\)——一般线性群
\(\mathrm{GL}(V)\) 在复合下构成**群**——这是后续李群理论(\(GL(n, \mathbb{R})\) 作为李群)的起点。
⚠️ 常见陷阱¶
💡 概念误区 13:认为 \(\mathrm{End}(V)\) 上的乘法(复合)是交换的
错误想法:\(S \circ T = T \circ S\) 对所有 \(S, T \in \mathrm{End}(V)\)。
实际上:矩阵乘法不交换(\(AB \neq BA\) 一般情况),复合也不交换。\(\mathrm{End}(V)\) 是非交换代数。
练习¶
练习 13.1(⭐⭐). 计算 \(\dim \mathrm{Hom}(\mathbb{R}^3, \mathbb{R}^2)\)。在标准基下,给出 \(\mathrm{Hom}(\mathbb{R}^3, \mathbb{R}^2)\) 的一组基(它们是什么样的矩阵?)。
§14 核、像、秩、零度 ⭐¶
定义¶
定义 14.1. 设 \(T: V \to W\) 线性。
- 核(kernel):\(\ker T := \{v \in V : T(v) = 0_W\}\)
- 像(image):\(\mathrm{im}\, T := \{T(v) : v \in V\}\)
- 秩(rank):\(\mathrm{rank}(T) := \dim(\mathrm{im}\, T)\)
- 零度(nullity):\(\mathrm{null}(T) := \dim(\ker T)\)
命题 14.2. \(\ker T \leq V\) 且 \(\mathrm{im}\, T \leq W\)。
命题 14.3. \(T\) 单射 \(\Leftrightarrow\) \(\ker T = \{0\}\)。
证明. (\(\Rightarrow\)) \(T(v) = 0 = T(0) \Rightarrow v = 0\)(单射)。(\(\Leftarrow\)) \(T(u) = T(v) \Rightarrow T(u-v) = 0 \Rightarrow u - v \in \ker T = \{0\} \Rightarrow u = v\)。 \(\square\)
本质洞察:核衡量了线性映射"丢失信息"的程度。\(\ker T = \{0\}\) 意味着 \(T\) 没有丢失任何信息(单射);\(\ker T\) 越大,\(T\) 丢失的信息越多。秩-零度定理(§15)精确量化了这种信息损失。
核和像的计算方法¶
在实际计算中,给定矩阵 \(A \in M_{m \times n}(F)\)(即 \(T = L_A: F^n \to F^m\)):
求核:解齐次方程组 \(Ax = 0\)。通过行化简(高斯消元)得到阶梯形,自由变量对应核的基向量。
求像:\(\mathrm{im}\, T = \mathrm{span}\{A\) 的列向量\(\}\)。行化简后,主元列对应的**原始列向量**构成像的基。
为什么像的基用原始列而非化简后的列? 行化简改变了列空间(列之间的线性关系不变,但具体的列向量变了)。化简后的主元列告诉你**哪些**原始列是独立的,但基应该用原始列。
例 14.1. 设 \(A = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \end{pmatrix}\)。
行化简:\(\begin{pmatrix} 1 & 2 & 3 \\ 0 & 0 & 0 \end{pmatrix}\)。
- \(\ker T\):\(x_1 = -2x_2 - 3x_3\),核的基为 \(\{(-2, 1, 0), (-3, 0, 1)\}\),\(\mathrm{null}(T) = 2\)
- \(\mathrm{im}\, T\):只有第一列是主元列,像的基为 \(\{(1, 2)\}\),\(\mathrm{rank}(T) = 1\)
- 验证:\(\mathrm{rank} + \mathrm{null} = 1 + 2 = 3 = n\)
单射、满射与维数的关系¶
命题 14.4. 设 \(T: V \to W\) 线性,\(V\) 有限维。
| 性质 | 等价条件 | 维数条件 |
|---|---|---|
| \(T\) 单射 | \(\ker T = \{0\}\) | \(\mathrm{null}(T) = 0\) |
| \(T\) 满射 | \(\mathrm{im}\, T = W\) | \(\mathrm{rank}(T) = \dim W\) |
| \(T\) 双射 | 单射 + 满射 | \(\dim V = \dim W\) 且 \(\ker T = \{0\}\) |
不是 X 而是 Y:单射性不是"\(T\) 把不同的向量映到不同的像"(这是定义的字面重述),而是"\(T\) 不丢失信息"(\(\ker T = \{0\}\) 意味着没有向量被"压缩"到零)。这种理解更深刻——它直接连接到秩-零度定理中的"信息守恒"。
⚠️ 常见陷阱¶
💡 概念误区 14:混淆 \(\ker T\)(线性映射的核)和零空间 \(\mathrm{Null}(A)\)(矩阵的零空间)
实际上:它们是同一个东西的不同面目。\(\ker T = \mathrm{Null}([T]_\mathcal{B}^\mathcal{C})\)。但要注意:\(\ker T\) 是 \(V\) 的子空间(坐标无关),\(\mathrm{Null}(A)\) 是 \(F^n\) 的子空间(依赖基的选择)。
🧠 思维陷阱 14:认为秩就是"非零行的个数"
新手想法:\(\mathrm{rank}(A)\) = 行化简后非零行的个数。
实际上:这是秩的一种**计算方法**,不是定义。秩的定义是像空间的维数 \(\dim(\mathrm{im}\, T)\)。"非零行个数"之所以等于秩,是因为行化简不改变行空间,而行秩等于列秩。理解定义而非仅记住计算方法,在推广到更一般的代数结构时至关重要。
练习¶
练习 14.1(⭐). 求求导映射 \(D: \mathbb{R}[x]_{\leq 3} \to \mathbb{R}[x]_{\leq 2}\) 的核和像。计算秩和零度。
练习 14.2(⭐⭐). 设 \(T: M_{2 \times 2}(\mathbb{R}) \to M_{2 \times 2}(\mathbb{R})\),\(T(A) = A - A^T\)(取反对称部分的两倍)。求 \(\ker T\) 和 \(\mathrm{im}\, T\),验证秩-零度定理。(提示:\(\ker T\) 恰好是对称矩阵空间。)
§15 秩-零度定理 ⭐⭐¶
动机¶
核和像分别衡量了线性映射"丢失"和"保留"的信息量。秩-零度定理说的是:丢失的 + 保留的 = 总共的。这是线性代数最重要的定理之一。
定理陈述¶
定理 15.1(秩-零度定理,又称线性映射基本定理). 设 \(T: V \to W\) 线性,\(V\) 有限维。则:
证明一:基扩展法¶
取 \(\ker T\) 的基 \(\{u_1, \ldots, u_k\}\),扩展为 \(V\) 的基 \(\{u_1, \ldots, u_k, v_1, \ldots, v_m\}\)。
断言:\(\{T(v_1), \ldots, T(v_m)\}\) 是 \(\mathrm{im}\, T\) 的基。
张成性. 任取 \(w \in \mathrm{im}\, T\),\(w = T(v)\) 其中 \(v = \sum a_i u_i + \sum b_j v_j\)。则:
线性独立性. 设 \(\sum c_j T(v_j) = 0\),即 \(T\left(\sum c_j v_j\right) = 0\),即 \(\sum c_j v_j \in \ker T\)。
因此 \(\sum c_j v_j = \sum d_i u_i\),即 \(\sum c_j v_j - \sum d_i u_i = 0\)。由 \(\{u_1, \ldots, u_k, v_1, \ldots, v_m\}\) 的线性独立性,所有 \(c_j = 0\)(和 \(d_i = 0\))。
因此 \(\mathrm{rank}(T) = m = (k + m) - k = \dim V - \mathrm{null}(T)\)。 \(\square\)
证明二:商空间法¶
构造 \(\bar{T}: V/\ker T \to W\),\(\bar{T}(v + \ker T) := T(v)\)。
- 良定义:\(v_1 + \ker T = v_2 + \ker T \Rightarrow v_1 - v_2 \in \ker T \Rightarrow T(v_1) = T(v_2)\)
- 单射:\(\bar{T}(v + \ker T) = 0 \Rightarrow T(v) = 0 \Rightarrow v \in \ker T \Rightarrow v + \ker T = 0_{V/\ker T}\)
- \(\mathrm{im}\, \bar{T} = \mathrm{im}\, T\)
因此 \(\bar{T}\) 给出同构 \(V/\ker T \cong \mathrm{im}\, T\)(这就是第一同构定理)。
取维数:\(\dim V - \dim \ker T = \dim(V/\ker T) = \dim \mathrm{im}\, T\)。 \(\square\)
两种证明的比较:证明一更"计算性"——直接构造基。证明二更"概念性"——揭示了秩-零度定理背后的同构 \(V/\ker T \cong \mathrm{im}\, T\)。后者在代数学中更具普适性:群论、环论中的同构定理都遵循同样的模式。
推论¶
推论 15.2. 设 \(\dim V = \dim W = n\),\(T: V \to W\) 线性。则:
证明. 单射 \(\Leftrightarrow \mathrm{null}(T) = 0 \Leftrightarrow \mathrm{rank}(T) = n \Leftrightarrow \mathrm{im}\, T = W \Leftrightarrow\) 满射。 \(\square\)
反事实推理:这个推论在无限维时**不成立**。考虑右移算子 \(R: F[x] \to F[x]\),\(R(p(x)) = xp(x)\)。\(R\) 是单射(\(xp = xq \Rightarrow p = q\)),但不是满射(常数多项式不在 \(\mathrm{im}\, R\) 中)。有限维的特殊性在于:\(\dim V = n\) 是一个**有限数**,所以 \(\mathrm{rank} + \mathrm{null} = n\) 构成了一个"零和博弈"。
⚠️ 常见陷阱¶
🧠 思维陷阱 15:在无限维空间中使用推论 15.2
新手想法:单射线性算子必然是满射的。
实际上:只在有限维时成立。无限维空间中存在单射但不满射(右移)和满射但不单射(左移)的线性算子。
练习¶
练习 15.1(⭐⭐). 设 \(T: \mathbb{R}^4 \to \mathbb{R}^3\) 的矩阵表示为 \(A = \begin{pmatrix} 1 & 2 & 0 & 1 \\ 0 & 0 & 1 & 3 \\ 1 & 2 & 1 & 4 \end{pmatrix}\)。求 \(\ker T\)、\(\mathrm{im}\, T\)、\(\mathrm{rank}(T)\)、\(\mathrm{null}(T)\),验证秩-零度定理。
练习 15.2(⭐⭐⭐). 用商空间法重新证明秩-零度定理,并明确写出同构 \(\bar{T}: V/\ker T \to \mathrm{im}\, T\) 的定义和所有验证步骤。
§16 同构定理 ⭐⭐¶
第一同构定理¶
定理 16.1(第一同构定理). 设 \(T: V \to W\) 线性。则:
同构由 \(\bar{T}(v + \ker T) := T(v)\) 给出。已在 §15.3 证明。
第二、第三同构定理¶
定理 16.2(第二同构定理). 设 \(W_1, W_2 \leq V\)。则 \(W_1 / (W_1 \cap W_2) \cong (W_1 + W_2) / W_2\)。
定理 16.3(第三同构定理). 设 \(W_1 \leq W_2 \leq V\)。则 \((V/W_1) / (W_2/W_1) \cong V/W_2\)。
这三个同构定理在群论和环论中也有完全平行的版本——它们是代数学的"通用模式"。
练习¶
练习 16.1(⭐⭐⭐). 通过定义恰当的线性映射并应用第一同构定理来证明第二同构定理。(提示:考虑 \(T: W_1 \to (W_1 + W_2)/W_2\),\(T(w_1) = w_1 + W_2\)。)
§17 矩阵表示、基变换、相似 ⭐⭐¶
矩阵表示¶
定义 17.1. 设 \(\mathcal{B} = (v_1, \ldots, v_n)\) 为 \(V\) 的有序基,\(\mathcal{C} = (w_1, \ldots, w_m)\) 为 \(W\) 的有序基。\(T: V \to W\) 的**矩阵表示** \([T]_\mathcal{B}^\mathcal{C}\) 定义为:第 \(j\) 列是 \(T(v_j)\) 在基 \(\mathcal{C}\) 下的坐标。
矩阵乘法的来源¶
定理 17.2. \([S \circ T]_\mathcal{B}^\mathcal{E} = [S]_\mathcal{C}^\mathcal{E} \cdot [T]_\mathcal{B}^\mathcal{C}\)。
本质洞察:矩阵乘法的定义不是任意的——它恰好使"矩阵表示"成为一个**保持复合的映射**(即同态/函子)。"\(AB\) 的第 \((i,j)\) 元素是第 \(i\) 行和第 \(j\) 列的点积"这个看似神秘的公式,其实就是复合映射的坐标表示。
基变换公式¶
定理 17.3. 设 \(\mathcal{B}, \mathcal{B}'\) 是 \(V\) 的两组基,\(P := [\mathrm{id}_V]_{\mathcal{B}'}^\mathcal{B}\)(基变换矩阵)。则对 \(T \in \mathrm{End}(V)\):
相似矩阵:\(A \sim B \iff \exists P \in GL_n(F),\, B = P^{-1}AP\)。相似矩阵是同一个线性算子在不同基下的矩阵表示。
相似不变量¶
相似变换 \(A \mapsto P^{-1}AP\) 不改变的量称为**相似不变量**:
| 不变量 | 公式/性质 |
|---|---|
| 迹 \(\mathrm{tr}(A)\) | \(\mathrm{tr}(P^{-1}AP) = \mathrm{tr}(A)\),因为 \(\mathrm{tr}(AB) = \mathrm{tr}(BA)\) |
| 行列式 \(\det(A)\) | \(\det(P^{-1}AP) = \det(A)\) |
| 秩 \(\mathrm{rank}(A)\) | 秩是像空间的维数,不依赖基 |
| 特征多项式 | 前瞻至 §A2c/A2d |
⚠️ 常见陷阱¶
💡 概念误区 17:混淆 \(P^{-1}AP\) 和 \(PAP^{-1}\)
错误想法:基变换公式是 \([T]_{\mathcal{B}'} = P [T]_\mathcal{B}\, P^{-1}\)。
实际上:取决于 \(P\) 的定义方向。本章约定 \(P = [\mathrm{id}]_{\mathcal{B}'}^\mathcal{B}\)(从新基到旧基),此时公式为 \(P^{-1} [T]_\mathcal{B}\, P\)。一些教材用相反的约定,公式就变成 \(P [T]_\mathcal{B}\, P^{-1}\)。关键是保持一致。
🧠 思维陷阱 17:认为"相似矩阵是相同的矩阵"
新手想法:\(A \sim B\) 就是 \(A = B\)。
实际上:\(A\) 和 \(B\) 可以看起来完全不同,但它们表示同一个线性算子。相似不变量(迹、行列式、秩等)相同,但矩阵元素一般不同。
矩阵表示与坐标的关系¶
矩阵表示的核心等式是:
即**像的坐标 = 矩阵 \(\times\) 原象的坐标**。这个等式把抽象的线性映射"翻译"成了矩阵乘法——后者可以交给计算机处理。
证明. 设 \(v = \sum_j x_j v_j\)(\(x_j\) 是 \(v\) 在基 \(\mathcal{B}\) 下的坐标),\(T(v_j) = \sum_i a_{ij} w_i\)。则:
因此 \([T(v)]_\mathcal{C}\) 的第 \(i\) 个分量是 \(\sum_j a_{ij} x_j\)——这正是矩阵乘法 \(A \cdot x\) 的第 \(i\) 个分量。 \(\square\)
基变换的完整推导¶
基变换公式 \([T]_{\mathcal{B}'} = P^{-1}[T]_\mathcal{B} P\) 的完整推导如下。
设 \(\mathcal{B}\) 和 \(\mathcal{B}'\) 是 \(V\) 的两组基。基变换矩阵 \(P\) 定义为恒等映射 \(\mathrm{id}_V: V \to V\) 在基 \(\mathcal{B}'\)(域)和 \(\mathcal{B}\)(陪域)下的矩阵:
\(P\) 的第 \(j\) 列是 \(\mathcal{B}'\) 的第 \(j\) 个基向量 \(v_j'\) 在基 \(\mathcal{B}\) 下的坐标。
由定理 17.2(矩阵乘法 = 复合映射的矩阵表示):
这里 \([\mathrm{id}_V]_{\mathcal{B}}^{\mathcal{B}'} = ([\mathrm{id}_V]_{\mathcal{B}'}^{\mathcal{B}})^{-1} = P^{-1}\)(恒等映射在交换基方向后取逆)。
类比:基变换公式 \(B = P^{-1}AP\) 可以理解为"先把新坐标翻译成旧坐标(\(P\)),再用旧基下的矩阵做变换(\(A\)),最后把结果翻译回新坐标(\(P^{-1}\))"。这就像在两种语言之间做翻译:先翻译成共同语言,做运算,再翻译回来。类似的地方在于"两次坐标转换夹着核心操作"这个模式;**不像**的是:语言翻译可能有歧义,而坐标变换是精确的同构。
练习¶
练习 17.1(⭐⭐). 设 \(T: \mathbb{R}^2 \to \mathbb{R}^2\) 在标准基下的矩阵为 \(A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix}\)。在基 \(\mathcal{B}' = ((1,1), (1,-1))\) 下,\(T\) 的矩阵是什么?
练习 17.2(⭐⭐). 证明迹是相似不变量:\(\mathrm{tr}(P^{-1}AP) = \mathrm{tr}(A)\)。(提示:先证明 \(\mathrm{tr}(AB) = \mathrm{tr}(BA)\) 对任意方阵成立,然后应用到 \(\mathrm{tr}((P^{-1}A)P) = \mathrm{tr}(P(P^{-1}A))\)。)
§18 不变子空间 ⭐⭐¶
动机¶
给定 \(T \in \mathrm{End}(V)\),如果能找到一个子空间 \(W\) 使得 \(T\) "不把 \(W\) 中的向量弹出 \(W\)",那么 \(T\) 在 \(W\) 上的行为可以独立研究。如果能把 \(V\) 分解为 \(T\)-不变子空间的直和 \(V = W_1 \oplus \cdots \oplus W_k\),则 \(T\) 的矩阵变成块对角形——大大简化分析。这就是不变子空间的动机。
定义 18.1. \(W \leq V\) 是 \(T \in \mathrm{End}(V)\) 的**不变子空间**(invariant subspace),若 \(T(W) \subseteq W\)。
基本例子:\(\{0\}\)、\(V\)、\(\ker T\)、\(\mathrm{im}\, T\) 都是 \(T\)-不变的。
定理 18.2. 若 \(V = W_1 \oplus \cdots \oplus W_k\) 且每个 \(W_i\) 是 \(T\)-不变的,则存在基使 \([T] = \mathrm{diag}(A_1, \ldots, A_k)\),其中 \(A_i = [T|_{W_i}]\)。
"找到好的不变子空间分解"="化简矩阵"——这是线性代数的中心问题。后续的特征空间(§A2c)和广义特征空间(§A2d)都是特殊的不变子空间。
不变子空间的例子与非例子¶
例 18.1. 设 \(T: \mathbb{R}^2 \to \mathbb{R}^2\) 是逆时针旋转 \(90°\),矩阵为 \(A = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}\)。
- \(\{0\}\) 和 \(\mathbb{R}^2\) 是 \(T\)-不变的(总是如此)
- **没有**非平凡的 \(T\)-不变子空间。因为 \(\mathbb{R}^2\) 中的一维子空间就是过原点的直线,但旋转 \(90°\) 把任何直线变成另一条直线(不是自身)
- 这说明不是所有算子都有非平凡不变子空间(至少在 \(\mathbb{R}\) 上)
例 18.2. 设 \(T: \mathbb{R}^3 \to \mathbb{R}^3\) 的矩阵为 \(A = \begin{pmatrix} 2 & 0 & 0 \\ 0 & 3 & 0 \\ 0 & 0 & 3 \end{pmatrix}\)(对角矩阵)。
每个坐标轴 \(\mathrm{span}\{e_i\}\) 都是一维不变子空间。\(\mathrm{span}\{e_2, e_3\}\) 是二维不变子空间。\(V = \mathrm{span}\{e_1\} \oplus \mathrm{span}\{e_2, e_3\}\) 给出了不变子空间的直和分解。
理论-工程桥接:在机器人学中,不变子空间的概念出现在控制理论的**可控性分解**中。系统 \(\dot{x} = Ax + Bu\) 中,可控子空间是 \(A\) 的不变子空间,把系统分解为可控部分和不可控部分——这正是不变子空间直和分解的工程应用。
为什么不变子空间重要¶
寻找不变子空间等价于"简化矩阵"。如果 \(V = W_1 \oplus W_2\) 且两个子空间都是 \(T\)-不变的,则在适当基下 \(T\) 的矩阵是块对角的:
这意味着 \(T\) 在 \(W_1\) 和 \(W_2\) 上的行为可以**独立分析**。\(n \times n\) 矩阵的问题被分解为两个更小矩阵的问题。
"找到好的不变子空间分解"="化简矩阵"——这是线性代数的中心问题。后续章节中: - 特征空间(§A2c)是特殊的不变子空间,对应对角化 - 广义特征空间(§A2d)是更精细的不变子空间,对应 Jordan 标准形 - 不变子空间的**不存在**(如实数域上旋转的情况)迫使我们转向复数域
⚠️ 常见陷阱¶
💡 概念误区 18:认为"每个算子都能分解为一维不变子空间的直和"
实际上:一维不变子空间对应特征向量。旋转矩阵 \(\begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}\) 在 \(\mathbb{R}\) 上没有特征值,因此没有一维不变子空间。这是引入 \(\mathbb{C}\)(代数闭域)的动机之一。
🧠 思维陷阱 18:认为不变子空间分解等于对角化
新手想法:如果 \(V = W_1 \oplus W_2\) 且都 \(T\)-不变,那 \(T\) 就对角化了。
实际上:块对角化不等于对角化。\(T\) 在 \(W_1\) 上的限制 \(T|_{W_1}\) 可能本身不能对角化——例如 \(A_1\) 可能是一个 Jordan 块。对角化要求**每个块都是** \(1 \times 1\) 的——即要求每个不变子空间都是一维的。
练习¶
练习 18.1(⭐⭐). 设 \(T: \mathbb{R}^3 \to \mathbb{R}^3\) 在标准基下的矩阵为 \(A = \begin{pmatrix} 2 & 0 & 0 \\ 0 & 1 & 1 \\ 0 & 0 & 1 \end{pmatrix}\)。找出所有 \(T\)-不变子空间。(提示:先找特征值和特征向量。)
练习 18.2(⭐⭐⭐). 证明:\(\ker T^k\)(\(k = 1, 2, 3, \ldots\))都是 \(T\)-不变子空间。证明 \(\ker T \subseteq \ker T^2 \subseteq \ker T^3 \subseteq \cdots\)。(这个递增链在后续 Jordan 标准形理论中扮演核心角色。)
第三幕到此结束。我们已经建立了线性变换的完整理论:定义、核/像、秩-零度定理、矩阵表示、基变换、不变子空间。下面进入本章最深刻的第四幕——对偶理论。
第四幕:对偶理论¶
第四幕的目标是建立对偶空间 \(V^*\) 的理论。对偶性是线性代数中最优雅、最深刻的概念之一——它揭示了"测量"和"被测量"之间的对称关系。在机器人学中,twist 与 wrench、速度与力、协方差矩阵与信息矩阵之间的对偶关系,都是这个理论的直接应用。
§19 对偶空间 V* 与对偶配对 ⭐⭐¶
动机¶
考虑一个具体问题:你有一个三维空间中的力 \(\mathbf{F}\) 和一个速度 \(\mathbf{v}\)。它们的配对 \(\mathbf{F} \cdot \mathbf{v}\) 给出**功率**(一个标量)。但这里有一个微妙的问题:力和速度**住在不同的空间里**吗?
在朴素的理解中,力和速度都是 \(\mathbb{R}^3\) 中的向量。但当我们考虑坐标变换时,它们的行为不同——速度按 \(v' = Rv\) 变换,而力按 \(F' = (R^{-1})^T F = R F\)(在正交基下 \(R^{-1} = R^T\) 所以看不出区别)。在非正交坐标系中,区别就明显了:速度是**逆变**(contravariant)量,力是**协变**(covariant)量。
对偶空间的概念精确地把这种区别形式化:力住在速度空间的**对偶空间**中。
如果不区分 \(V\) 和 \(V^*\) 会怎样¶
在正交坐标系中,\(V\) 和 \(V^*\) 通过内积自然等同,所以不区分也没问题。但一旦: - 使用非正交坐标(如广义坐标 \(q_i\)) - 在不同参考系之间变换(如机器人学中的 body frame 和 spatial frame) - 处理李群上的动力学
区分 \(V\) 和 \(V^*\) 就变得至关重要。混淆它们会导致**坐标变换公式出错**。
定义¶
定义 19.1. 线性泛函(linear functional)是从向量空间到标量域的线性映射 \(f: V \to F\)。
定义 19.2. \(V\) 的**对偶空间**(dual space)是所有线性泛函的集合:
由 §13 的结果,\(V^*\) 自身是一个 \(F\)-向量空间。
定义 19.3. 对偶配对(canonical pairing)\(\langle \cdot, \cdot \rangle: V^* \times V \to F\),定义为 \(\langle f, v \rangle := f(v)\)。
对偶配对的几何意义¶
线性泛函 \(f \in V^*\) 可以理解为一种"测量"——它把向量映射到标量,衡量向量在某个"方向"上的"分量"。
\(f\) 的核 \(\ker f\) 是 \(V\) 中的一个**超平面**(codimension-1 子空间)。不同的 \(f\) 对应不同的超平面——即不同的"切片方向"。
类比(机器人学):在机器人学中,twist \(\mathcal{V} \in \mathfrak{se}(3)\) 是速度(住在李代数中),wrench \(\mathcal{F} \in \mathfrak{se}(3)^*\) 是力/力矩(住在对偶李代数中)。它们的配对 \(\langle \mathcal{F}, \mathcal{V} \rangle = \mathbf{m} \cdot \boldsymbol{\omega} + \mathbf{f} \cdot \mathbf{v}\) 是瞬时**功率**——一个标量,不依赖参考系的选择。这个类比在"配对给出标量"这一点上完全准确;**不像**的地方在于 \(\mathfrak{se}(3)\) 不是普通向量空间而是李代数,有额外的 Lie 括号结构。
⚠️ 常见陷阱¶
💡 概念误区 19:认为 \(V^*\) 和 \(V\) "没有区别"
错误想法:在有限维中 \(\dim V^* = \dim V\),所以 \(V^* = V\)。
实际上:\(V^*\) 和 \(V\) 维数相同意味着它们**同构**,但同构需要**选择一组基**才能建立。换一组基,同构就不同。\(V^*\) 和 \(V\) 是两个**不同的向量空间**——它们的元素有不同的物理含义(速度 vs 力)和不同的变换规律(逆变 vs 协变)。
为什么重要:在机器人学中,twist 和 wrench 的变换规律不同——twist 按 \(\mathrm{Ad}_T\) 变换,wrench 按 \(\mathrm{Ad}_T^{-T}\) 变换。混淆它们会导致动力学方程写错。
🧠 思维陷阱 19:跳过对偶空间直接学内积空间
新手想法:有了内积就能把力和速度放在同一个空间里,不需要对偶空间。
实际上:内积提供了 \(V \cong V^*\) 的**一个特定**同构(Riesz 表示定理),但这个同构**依赖内积的选择**。在不同的度量下(如不同的惯性张量),同一个 wrench 对应不同的 twist。对偶空间的概念是**先于内积**的——它告诉你力和速度的关系不需要度量就能表述(通过功率配对)。
练习¶
练习 19.1(⭐⭐). 设 \(V = \mathbb{R}^3\),\(f(x_1, x_2, x_3) = 2x_1 - x_2 + 3x_3\)。(a) 验证 \(f \in V^*\)。(b) 求 \(\ker f\)(描述为 \(\mathbb{R}^3\) 中的超平面)。(c) 计算 \(\langle f, (1, 2, 3) \rangle\)。
§20 对偶基(有限维)⭐⭐¶
动机¶
在 \(V\) 中选一组基 \(\mathcal{B} = (v_1, \ldots, v_n)\) 后,\(V^*\) 中有没有与之"配套"的自然基?答案是肯定的——对偶基 \((f_1, \ldots, f_n)\),定义为"第 \(i\) 个对偶基向量只测量第 \(i\) 个坐标分量"。
对偶基的构造¶
定义 20.1. 设 \(\mathcal{B} = (v_1, \ldots, v_n)\) 是 \(V\) 的基。对偶基 \((f_1, \ldots, f_n)\) 由以下条件唯一确定:
\(f_i\) 的存在性由定理 12.2 保证——线性映射由基的像唯一确定,所以只需指定 \(f_i\) 在基 \(v_1, \ldots, v_n\) 上的值为 \(\delta_{i1}, \ldots, \delta_{in}\)。
定理 20.2. \((f_1, \ldots, f_n)\) 是 \(V^*\) 的基。特别地,\(\dim V^* = \dim V\)。
证明.
线性独立:设 \(\sum a_i f_i = 0\),即 \(\left(\sum a_i f_i\right)(v) = 0\) 对所有 \(v \in V\)。取 \(v = v_j\):
所以所有 \(a_j = 0\)。
张成:对任意 \(f \in V^*\),构造 \(g = \sum_{i=1}^{n} f(v_i) f_i\)。对任意 \(v_j\):
由于 \(f\) 和 \(g\) 在基上的值相同,由线性映射的唯一性(定理 12.2),\(f = g = \sum f(v_i) f_i\)。
因此 \((f_1, \ldots, f_n)\) 线性独立且张成 \(V^*\),是 \(V^*\) 的基。 \(\square\)
重要警告:这个证明在**无限维时失效**。张成部分的"\(\sum f(v_i) f_i\)"变成无穷和——但 Hamel 基要求有限线性组合。§21 将解释这一失效的深刻后果。
⚠️ 常见陷阱¶
💡 概念误区 20:认为对偶基不依赖原始基的选择
错误想法:\(V^*\) 有一个"自然的"基。
实际上:对偶基 \((f_1, \ldots, f_n)\) 完全依赖 \(\mathcal{B} = (v_1, \ldots, v_n)\) 的选择。换一组基 \(\mathcal{B}'\),对偶基也会改变。\(V^*\) 没有"天然的"基——正如 \(V\) 本身也没有。
🧠 思维陷阱 20:混淆对偶基和标准基
新手想法:\(\mathbb{R}^n\) 的对偶基就是标准基 \(e_1, \ldots, e_n\)。
实际上:\(\mathbb{R}^n\) 的对偶空间 \((\mathbb{R}^n)^*\) 与 \(\mathbb{R}^n\) 同构但不相等。标准基的对偶基是 \(f_i(x_1, \ldots, x_n) = x_i\)(投影到第 \(i\) 个坐标),这是 \((\mathbb{R}^n)^*\) 中的元素(线性泛函),不是 \(\mathbb{R}^n\) 中的向量。
练习¶
练习 20.1(⭐⭐). 设 \(V = \mathbb{R}^2\),\(\mathcal{B} = ((1,1), (1,-1))\)。明确写出对偶基 \(f_1, f_2\)(作为 \(\mathbb{R}^2 \to \mathbb{R}\) 的线性函数)。
练习 20.2(⭐⭐). 证明:若 \(\mathcal{B}'\) 是另一组基,\(\mathcal{B}^{*\prime}\) 是其对偶基,则从 \(\mathcal{B}^*\) 到 \(\mathcal{B}^{*\prime}\) 的基变换矩阵是从 \(\mathcal{B}\) 到 \(\mathcal{B}'\) 的基变换矩阵的**逆转置** \((P^{-1})^T\)。
§21 对偶空间的无限维行为 ⭐⭐⭐¶
动机¶
§20 证明了 \(\dim V^* = \dim V\)(有限维)。在无限维中,情况发生了戏剧性的变化——\(V^*\) 比 \(V\) "大得多"。这不是一个技术细节,而是揭示了有限维线性代数和无限维分析之间的**根本断裂**。
Erdos-Kaplansky 定理¶
定理 21.1(Erdos-Kaplansky). 设 \(V\) 是域 \(F\) 上的无限维向量空间,\(\dim V = \kappa\)(无限基数)。则:
当 \(F\) 无限且 \(\kappa \geq \aleph_0\) 时,由 Cantor 定理 \(|F|^\kappa > \kappa\)。
推论:无限维时 \(\dim V^* > \dim V\),所以 \(V \not\cong V^*\)。
直觉:\(V\) 的元素是"有限支撑"的——每个向量是基元素的**有限**线性组合。\(V^*\) 的元素是"任意支撑"的——一个线性泛函可以在基的**每个**元素上取非零值。"任意支撑"的函数远比"有限支撑"的向量多得多。
Hamel 基 vs Schauder 基¶
| 概念 | Hamel 基 | Schauder 基 |
|---|---|---|
| 线性组合 | 有限和 | 无穷级数(拓扑收敛) |
| 需要拓扑? | 否 | 是 |
| 对偶 | 代数对偶 \(V^*\) | 连续对偶 \(V'\) |
| \(V \cong V'\)? | 否(\(\dim V^* > \dim V\)) | 可能(如 Hilbert 空间 Riesz 定理) |
本章只讨论**代数对偶** \(V^*\)。拓扑对偶留给后续泛函分析。
⚠️ 常见陷阱¶
💡 概念误区 21:混淆代数对偶 \(V^*\) 和连续对偶 \(V'\)
错误想法:\(V^*\) 和 \(V'\) 是同一个东西。
实际上:在有限维时它们一致(所有线性映射都自动连续)。在无限维时,\(V' \subsetneq V^*\)——连续线性泛函只是所有线性泛函的一小部分。Hilbert 空间中 \(V \cong V'\)(Riesz 定理),但 \(V \not\cong V^*\)。
练习¶
练习 21.1(⭐⭐⭐). 设 \(V = \mathbb{R}[x]\)(所有多项式),\(F = \mathbb{R}\)。构造一个线性泛函 \(f \in V^*\) 使得 \(f(x^n) \neq 0\) 对**所有** \(n\)。解释为什么 \(f\) 不在对偶基的张成中(即 \(f\) 不能表示为对偶基元素的**有限**线性组合)。
§22 二次对偶 V** 与评估映射 ⭐⭐¶
动机¶
\(V^*\) 是 \(V\) 的对偶空间。\(V^{**} := (V^*)^*\) 是对偶的对偶——二次对偶空间。惊人的是,\(V\) 和 \(V^{**}\) 之间存在一个**不依赖基的选择**的自然同构。这个观察引出了数学中"自然性"的概念——范畴论的起源。
评估映射的定义¶
定义 22.1. 评估映射 \(\mathrm{ev}: V \to V^{**}\) 定义为:对每个 \(v \in V\),\(\mathrm{ev}_v \in V^{**}\) 是 \(V^*\) 上的线性泛函:
即 \(\mathrm{ev}_v\) 是"在 \(v\) 处求值"这个操作——它接受一个线性泛函 \(f\),返回 \(f\) 在 \(v\) 处的值。
命题 22.2. \(\mathrm{ev}: V \to V^{**}\) 是线性映射。
证明. \(\mathrm{ev}_{au+bv}(f) = f(au + bv) = af(u) + bf(v) = a \cdot \mathrm{ev}_u(f) + b \cdot \mathrm{ev}_v(f)\)。 \(\square\)
ev 是单射¶
定理 22.3. \(\mathrm{ev}: V \to V^{**}\) 是单射。
证明. 需证:若 \(\mathrm{ev}_v = 0\)(即 \(f(v) = 0\) 对所有 \(f \in V^*\)),则 \(v = 0\)。
反证法:设 \(v \neq 0\)。将 \(\{v\}\) 扩展为基 \(\{v, v_2, v_3, \ldots\}\)(有限维用 Steinitz,无限维用 Zorn 引理)。定义 \(f \in V^*\) 使 \(f(v) = 1\),\(f(v_i) = 0\) 对所有 \(i \geq 2\)。则 \(\mathrm{ev}_v(f) = f(v) = 1 \neq 0\),矛盾。 \(\square\)
有限维时 ev 是同构¶
定理 22.4. 有限维时,\(\mathrm{ev}: V \to V^{**}\) 是同构。
证明. \(\dim V^{**} = \dim V^* = \dim V\)(由 §20)。单射 + 等维 \(\Rightarrow\) 双射。 \(\square\)
无限维时 \(\mathrm{ev}\) 仍单射但**不满射**——\(\dim V^{**} = |F|^{|F|^\kappa} > |F|^\kappa > \kappa = \dim V\)。
⚠️ 常见陷阱¶
💡 概念误区 22:认为 \(V \cong V^*\) 和 \(V \cong V^{**}\) 的质量相同
错误想法:两者都是有限维的同构,没有本质区别。
实际上:\(V \cong V^*\) 需要**选择一组基**(或等价地,选择一个内积)才能建立。换基就换同构。\(V \cong V^{**}\)(通过 \(\mathrm{ev}\))的定义**不依赖任何选择**——它是"自然"的。§23 将精确解释"自然"的含义。
为什么重要:在机器人学中,\(V \cong V^*\) 依赖惯性张量的选择——不同的惯性张量给出不同的 twist-wrench 对应。\(V \cong V^{**}\) 则是帧无关的。
练习¶
练习 22.1(⭐⭐). 在 \(V = \mathbb{R}^2\) 中,取标准基 \(\mathcal{B} = (e_1, e_2)\)。(a) 写出对偶基 \((f_1, f_2)\)。(b) 写出 \(V^{**}\) 的基(\(V^*\) 的对偶基)。(c) 明确计算 \(\mathrm{ev}_{(3,5)}\)(作为 \(V^*\) 上的线性泛函),验证它等于 \(3f_1^* + 5f_2^*\)(其中 \(f_i^*\) 是 \(V^{**}\) 中 \((f_1, f_2)\) 的对偶基)。
§23 自然同构 vs 非自然同构 ⭐⭐⭐¶
动机¶
§22 建立了两个同构:\(V \cong V^*\)(选基后)和 \(V \cong V^{**}\)(通过 \(\mathrm{ev}\))。它们的质量为什么不同?"自然"究竟是什么意思?这个问题的回答催生了范畴论——20 世纪数学最重要的语言之一。
"自然"意味着什么(直觉)¶
\(V \cong V^*\):需要**选择一组基**才能建立;不同的基给出不同的同构;没有"最好的"选择。
\(V \cong V^{**}\):\(\mathrm{ev}\) 的定义 \(\mathrm{ev}_v(f) = f(v)\) 对**所有向量空间 \(V\) 同时成立**,不需要任何选择。
直觉上,"自然"≈"与所有线性映射相容"≈"在所有向量空间上同时、一致地定义"。
范畴论最小词汇¶
为了精确表达"自然",我们需要范畴论的最小词汇(只引入"刚好够用"的定义):
| 概念 | 定义 | 例子 |
|---|---|---|
| 范畴 | 对象 + 态射 + 复合 + 恒等 | \(\mathbf{Vect}_F\):对象 = \(F\)-向量空间,态射 = 线性映射 |
| 协变函子 | 范畴间保结构的映射,保持方向 | \(\mathrm{Id}: \mathbf{Vect}_F \to \mathbf{Vect}_F\) |
| 反变函子 | 范畴间保结构的映射,反转方向 | \((-)^*: V \mapsto V^*\),\(T \mapsto T^t\)(方向反转!) |
| 自然变换 | 两个函子之间的"系统性对应" | \(\mathrm{ev}: \mathrm{Id} \Rightarrow (-)^{**}\) |
ev 是自然变换¶
命题 23.1. \(\mathrm{ev}: \mathrm{Id} \Rightarrow (-)^{**}\) 是自然变换。
具体含义:对任何线性映射 \(T: V \to W\),以下方阵**交换**:
即 \(T^{**} \circ \mathrm{ev}_V = \mathrm{ev}_W \circ T\)。
证明. 对任意 \(v \in V\),\(g \in W^*\):
两者相等。 \(\square\)
为什么 V ≅ V* 不是自然的¶
\((-)^*\) 是**反变**函子(\(T \mapsto T^t\) 反转方向),而 \(\mathrm{Id}\) 是**协变**函子。它们的**方差不同**——不存在自然变换 \(\mathrm{Id} \Rightarrow (-)^*\)。
本质洞察:任何 \(V \to V^*\) 的同构都需要"在每个 \(V\) 上单独做选择"(选基或选内积),无法全局一致。这不是我们"还没找到"自然同构——Eilenberg-Mac Lane(1945)证明了它**根本不存在**。自然性的不可能性是范畴论层面的结构性障碍。
机器人学中的意义¶
| 数学概念 | 机器人学对应 |
|---|---|
| \(V \cong V^{**}\)(自然) | twist 的 double-dual 识别是帧无关的 |
| \(V \cong V^*\)(非自然) | twist ↔ wrench 的转换**需要惯性张量** \(G_b\) |
在不同参考系之间切换时,自然的对应**不需要额外信息**,而非自然的对应需要指定一个度量(惯性张量)。
⚠️ 常见陷阱¶
💡 概念误区 23:认为"自然"只是"方便"的意思
实际上:"自然"在范畴论中有精确的数学含义——自然变换要求特定的交换图成立。它不是美学判断,而是结构性约束。
🧠 思维陷阱 23:认为引入内积后 \(V \cong V^*\) 就变成"自然的"了
实际上:引入内积后 \(V \cong V^*\) 的同构是确定的(Riesz 定理),但它**依赖内积的选择**。换一个内积,同构就不同。只有当我们把"内积"也纳入结构(考虑内积空间的范畴),\(V \cong V^*\) 才是自然的——但这时我们已经改变了讨论的范畴。
练习¶
练习 23.1(⭐⭐⭐). 验证 \(\mathrm{ev}\) 的自然性:取 \(V = W = \mathbb{R}^2\),\(T = \begin{pmatrix} 1 & 2 \\ 0 & 1 \end{pmatrix}\)。用标准基明确计算 \(T^{**} \circ \mathrm{ev}_V\) 和 \(\mathrm{ev}_W \circ T\),验证它们相等。
§24 对偶映射(转置)⭐⭐¶
动机¶
给定线性映射 \(T: V \to W\),它自然诱导了一个"反方向"的映射 \(T^t: W^* \to V^*\)——这就是**对偶映射**。在矩阵层面,\(T^t\) 的矩阵恰好是 \(T\) 的矩阵的转置。
定义¶
定义 24.1. 设 \(T: V \to W\) 线性。对偶映射(dual map / transpose)\(T^t: W^* \to V^*\) 定义为:
注意方向**反转**:\(T: V \to W\) 诱导 \(T^t: W^* \to V^*\)。这正是 \((-)^*\) 是反变函子的原因。
基本性质¶
- \(T^t\) 是线性映射
- \((S \circ T)^t = T^t \circ S^t\)(反转顺序)
- \((\mathrm{id}_V)^t = \mathrm{id}_{V^*}\)
- \((aT)^t = a T^t\)
对偶映射的矩阵表示¶
定理 24.2. 设 \(\mathcal{B}, \mathcal{C}\) 分别是 \(V, W\) 的基,\(\mathcal{B}^*, \mathcal{C}^*\) 是对偶基。则:
即对偶映射的矩阵是原映射矩阵的**转置**。
证明. 设 \([T]_\mathcal{B}^\mathcal{C} = (a_{ij})\),即 \(T(v_j) = \sum_{i} a_{ij} w_i\)。则:
另一方面,若 \(T^t(g_j) = \sum_{k} b_{kj} f_k\),则 \((T^t(g_j))(v_l) = b_{lj}\)。
因此 \(b_{lj} = a_{jl}\),即 \([T^t]\) 的第 \((l,j)\) 元素等于 \([T]\) 的第 \((j,l)\) 元素——这就是矩阵转置。 \(\square\)
术语警示¶
对偶映射 \(T^t\)(纯代数,无需内积)\(\neq\) 伴随算子 \(T^\dagger\)(需要内积,§A2b 的内容)
| 概念 | 需要内积? | 矩阵表示 | 机器人学含义 |
|---|---|---|---|
| 对偶映射 \(T^t: W^* \to V^*\) | 否 | 矩阵转置 \(A^T\) | Jacobian 转置 \(\tau = J^T \mathcal{F}\)(虚功原理) |
| 伴随算子 \(T^\dagger: W \to V\) | 是 | 共轭转置 \(A^*\) | 需要度量张量 |
在正交基下两者的矩阵恰好都是转置(因为 \(A^T = A^*\) 对实正交基成立),但这是正交基的特殊性质,不是一般结论。
反事实推理:如果不区分 \(T^t\) 和 \(T^\dagger\),会发生什么?在机器人学中,\(\tau = J^T \mathcal{F}\) 是由虚功原理得出的**精确等式**,不需要任何度量假设。如果把 \(J^T\) 理解为"伴随",就会错误地认为这个等式依赖内积——进而在非正交坐标下写出错误的公式。
⚠️ 常见陷阱¶
💡 概念误区 24:混淆"对偶映射"和"伴随算子"
错误想法:\(T^t\) 和 \(T^\dagger\) 是同一个东西。
实际上:\(T^t\) 是纯代数概念(\(V^* \leftarrow W^*\)),\(T^\dagger\) 需要内积空间结构。只有在正交基下,两者的矩阵碰巧一致。
为什么重要:在广义坐标系(如关节空间)中,Jacobian 的转置映射 \(J^T\) 是对偶映射(无需度量),而 Jacobian 的伴随 \(J^\dagger\)(如果定义)需要关节空间的度量张量。机器人静力学用的是 \(J^T\),不是 \(J^\dagger\)。
🧠 思维陷阱 24:"转置"的三重歧义
"转置"一词在不同语境下的含义: 1. 矩阵转置:\(A^T\),行列互换 2. 对偶映射:\(T^t: W^* \to V^*\),纯代数 3. 在某些书中(如 Axler)用 \(T'\) 表示对偶映射,避免与矩阵转置混淆
正确做法:本章用 \(T^t\) 表示对偶映射,\(A^T\) 表示矩阵转置。它们通过定理 24.2 联系起来。
练习¶
练习 24.1(⭐⭐). 设 \(T: \mathbb{R}^3 \to \mathbb{R}^2\),\(T(x_1, x_2, x_3) = (x_1 + x_2, x_2 + x_3)\)。(a) 写出 \(T\) 在标准基下的矩阵 \(A\)。(b) 写出 \(T^t\) 在对偶标准基下的矩阵,验证它是 \(A^T\)。(c) 解释 \(T^t\) 的方向为什么是 \((\mathbb{R}^2)^* \to (\mathbb{R}^3)^*\)。
§25 零化子与维数公式 ⭐⭐¶
动机¶
子空间 \(W \leq V\) 的**零化子** \(W^\circ\) 是 \(V^*\) 中"在 \(W\) 上为零"的所有线性泛函的集合。零化子是对偶理论中最有力的工具之一——它连接了 \(V\) 中的子空间结构和 \(V^*\) 中的子空间结构。
定义¶
定义 25.1. 设 \(W \leq V\)。\(W\) 的**零化子**(annihilator):
\(W^\circ\) 是 \(V^*\) 的子空间(封闭性的验证直接)。
维数公式¶
定理 25.2(有限维). \(\dim W + \dim W^\circ = \dim V\)。
证明(直接法). 取 \(W\) 的基 \((w_1, \ldots, w_k)\) 扩展为 \(V\) 的基 \((w_1, \ldots, w_k, v_1, \ldots, v_m)\),其中 \(m = n - k\)。设 \((f_1, \ldots, f_k, g_1, \ldots, g_m)\) 是对偶基。
断言:\(W^\circ = \mathrm{span}\{g_1, \ldots, g_m\}\)。
"\(\supseteq\)":\(g_l(w_j) = \delta_{(k+l),j} = 0\)(因为 \(k+l > k \geq j\)),所以 \(g_l \in W^\circ\)。
"\(\subseteq\)":设 \(f = \sum a_i f_i + \sum b_l g_l \in W^\circ\)。对每个 \(w_j\):\(0 = f(w_j) = a_j\)。所以 \(f = \sum b_l g_l\)。
因此 \(\dim W^\circ = m = n - k = \dim V - \dim W\)。 \(\square\)
双零化子¶
定理 25.3(有限维). 在 \(V \cong V^{**}\)(通过 \(\mathrm{ev}\))的识别下,\(W^{\circ\circ} = W\)。
即"零化子的零化子还原为原来的子空间"——对偶的**对合性**(involutivity)。
核与像的对偶关系¶
定理 25.4. 设 \(T: V \to W\) 线性(有限维)。则:
| 关系 | 公式 | 直觉 |
|---|---|---|
| \(\ker T^t = (\mathrm{im}\, T)^\circ\) | 在 \(\mathrm{im}\, T\) 上为零的泛函 = \(T^t\) 杀掉的泛函 | |
| \(\mathrm{im}\, T^t = (\ker T)^\circ\) | \(T^t\) 的像 = 在 \(\ker T\) 上为零的泛函 | |
| \(\mathrm{rank}(T^t) = \mathrm{rank}(T)\) | 行秩 = 列秩的概念证明 |
关系 1 的证明.
关系 3 的推导.
本质洞察:\(\mathrm{rank}(T) = \mathrm{rank}(T^t)\) 就是"行秩等于列秩"的**概念层面**的证明。传统的证明通过行化简计算,掩盖了这个等式的深层原因。对偶理论揭示了它的本质:行空间是列空间的零化子的零化子,维数公式保证两者维数相等。
机器人学中的对偶总结¶
| 抽象概念 | 机器人实例 |
|---|---|
| 对偶配对 \(\langle f, v \rangle\) | 功率 \(= \langle \text{wrench}, \text{twist} \rangle\) |
| 对偶映射 \(T^t: W^* \to V^*\) | Jacobian 转置 \(\tau = J^T \mathcal{F}\) |
| 零化子 \(W^\circ\) | 约束力 / 互易旋量(reciprocal screws) |
| 自然同构 \(V \cong V^{**}\) | 帧无关的 twist \(\leftrightarrow\) double-dual twist 识别 |
| 非自然 \(V \cong V^*\) | 需要惯性张量 \(G_b\) 才能 twist \(\leftrightarrow\) wrench |
| 协方差 \(\Sigma\) vs 信息矩阵 \(\Lambda\) | SLAM 中 \(\Sigma \in V \otimes V\),\(\Lambda \in V^* \otimes V^*\) |
⚠️ 常见陷阱¶
💡 概念误区 25:混淆零化子 \(W^\circ \subseteq V^*\) 和正交补 \(W^\perp \subseteq V\)
错误想法:\(W^\circ\) 和 \(W^\perp\) 是一回事。
实际上:\(W^\circ\) 住在 \(V^*\) 中(线性泛函的空间),\(W^\perp\) 住在 \(V\) 中(向量空间本身)。定义 \(W^\perp\) 需要内积,定义 \(W^\circ\) 不需要。在有内积的情况下,Riesz 定理给出 \(V \cong V^*\),此时 \(W^\circ\) 和 \(W^\perp\) 对应。
为什么重要:在没有内积的纯向量空间中(如李代数 \(\mathfrak{g}\) 上的对偶),只有 \(W^\circ\),没有 \(W^\perp\)。
🧠 思维陷阱 25:认为"行秩=列秩"是计算性的结论
新手想法:行秩=列秩只需要做行化简就能证明。
实际上:行化简证明了这个等式,但掩盖了**为什么**这个等式成立。对偶理论给出了概念性的解释:行秩是 \(\mathrm{rank}(T^t)\),列秩是 \(\mathrm{rank}(T)\),两者相等是因为 \(\ker T^t = (\mathrm{im}\, T)^\circ\) 加上维数公式。
练习¶
练习 25.1(⭐⭐). 设 \(V = \mathbb{R}^3\),\(W = \mathrm{span}\{(1,0,0), (0,1,0)\}\)。求 \(W^\circ\)(作为 \(V^*\) 的子空间),验证 \(\dim W + \dim W^\circ = \dim V\)。
练习 25.2(⭐⭐⭐,跨章综合). 设 \(T: \mathbb{R}^4 \to \mathbb{R}^3\)。已知 \(\dim \ker T = 2\)。(a) 求 \(\mathrm{rank}(T)\)(用秩-零度定理)。(b) 求 \(\dim \ker T^t\)(用 \(\ker T^t = (\mathrm{im}\, T)^\circ\) 和维数公式)。(c) 求 \(\dim \mathrm{im}\, T^t\)(用对偶映射的秩-零度定理)。验证 \(\mathrm{rank}(T) = \mathrm{rank}(T^t)\)。
本章常见误解汇总¶
| 误解 | 正确理解 |
|---|---|
| 域和整环没有区别 | 域要求非零元素有乘法逆元,整环不要求 |
| 零向量和零标量是同一个零 | \(0_V \in V\) 和 \(0_F \in F\) 是不同集合中的不同对象 |
| 子空间的并是子空间 | 一般不是;并的"修正"是子空间的和 \(W_1 + W_2\) |
| 商空间 \(V/W\) 是 \(V\) 的子空间 | \(V/W\) 是等价类的集合,不住在 \(V\) 里 |
| 维数只是一个数,不需要证明良定义 | 需要 Steinitz 引理来证明任意两组基大小相同 |
| 无限维空间的基可以写出来 | Hamel 基的存在性依赖选择公理,一般不可构造 |
| 线性独立 = 正交 | 线性独立不需要内积,正交需要 |
| 单射线性映射一定满射 | 只在有限维等维时成立 |
| \(V \cong V^*\) 是自然的 | 需要选基;\(V \cong V^{**}\) 才是自然的 |
| 对偶映射 \(T^t\) = 伴随算子 \(T^\dagger\) | \(T^t\) 不需要内积,\(T^\dagger\) 需要 |
| 零化子 \(W^\circ\) = 正交补 \(W^\perp\) | \(W^\circ \subseteq V^*\),\(W^\perp \subseteq V\);后者需要内积 |
| 行秩=列秩只是计算结论 | 对偶理论给出概念性解释 |
本章小结¶
符号表¶
| 符号 | 含义 | 首次出现 |
|---|---|---|
| \(F\) | 域(标量的来源) | §1 |
| \(V, W, U\) | \(F\)-向量空间 | §2 |
| \(0_V\) | 零向量 | §2 |
| \(W \leq V\) | \(W\) 是 \(V\) 的子空间 | §3 |
| \(W_1 + W_2\) | 子空间的和 | §3 |
| \(W_1 \oplus W_2\) | 直和 | §4 |
| \(V/W\) | 商空间 | §5 |
| \(\pi: V \to V/W\) | 典范投影 | §5 |
| \(\mathrm{span}(S)\) | \(S\) 的张成 | §6 |
| \(\dim V\) | \(V\) 的维数 | §8 |
| \(T: V \to W\) | 线性映射 | §12 |
| \(\mathrm{Hom}(V,W)\) | 线性映射空间 | §13 |
| \(\mathrm{End}(V)\) | 自同态空间 | §13 |
| \(\mathrm{GL}(V)\) | 一般线性群 | §13 |
| \(\ker T\) | 核 | §14 |
| \(\mathrm{im}\, T\) | 像 | §14 |
| \(\mathrm{rank}(T)\) | 秩 | §14 |
| \([T]_\mathcal{B}^\mathcal{C}\) | \(T\) 在基 \(\mathcal{B}, \mathcal{C}\) 下的矩阵 | §17 |
| \(V^*\) | 对偶空间 | §19 |
| \(\langle f, v \rangle\) | 对偶配对 | §19 |
| \((f_1, \ldots, f_n)\) | 对偶基 | §20 |
| \(V^{**}\) | 二次对偶空间 | §22 |
| \(\mathrm{ev}_v\) | 评估映射 | §22 |
| \(T^t: W^* \to V^*\) | 对偶映射 | §24 |
| \(W^\circ\) | 零化子 | §25 |
定理速查表¶
| 定理/公式 | 一句话说明 | 对应节 |
|---|---|---|
| 子空间判定定理 | 非空 + \(au + v \in W\) | §3 |
| 维数公式 \(\dim(W_1+W_2)\) | \(= \dim W_1 + \dim W_2 - \dim(W_1 \cap W_2)\) | §3 |
| 内直和三种等价条件 | 和 + 交为零 = 唯一分解 = 维数相加 | §4 |
| \(\dim(V/W) = \dim V - \dim W\) | 商掉 \(W\) 的维度 | §5 |
| Steinitz 替换引理 | 独立集 \(\leq\) 张成集 | §7 |
| 维数良定义性 | 任意两组基大小相同 | §8 |
| 每个向量空间有基 | Zorn 引理 | §9 |
| 线性映射由基的像确定 | 基的泛性质 | §12 |
| 秩-零度定理 | \(\dim V = \mathrm{rank}(T) + \mathrm{null}(T)\) | §15 |
| 第一同构定理 | \(V/\ker T \cong \mathrm{im}\, T\) | §16 |
| 基变换公式 | \([T]_{\mathcal{B}'} = P^{-1}[T]_\mathcal{B} P\) | §17 |
| \(\dim V^* = \dim V\)(有限维) | 对偶基是 \(V^*\) 的基 | §20 |
| $\dim V^* = | F | ^\kappa > \kappa$(无限维) |
| \(\mathrm{ev}: V \hookrightarrow V^{**}\)(单射,有限维时同构) | 评估映射是自然的 | §22 |
| \([T^t] = [T]^T\) | 对偶映射的矩阵 = 原矩阵的转置 | §24 |
| \(\dim W + \dim W^\circ = \dim V\) | 零化子维数公式 | §25 |
| \(\ker T^t = (\mathrm{im}\, T)^\circ\) | 核-像的对偶关系 | §25 |
| \(\mathrm{rank}(T^t) = \mathrm{rank}(T)\) | 行秩 = 列秩 | §25 |
知识点总表¶
| 编号 | 知识点 | 核心要点 | 对应节 | 难度 |
|---|---|---|---|---|
| 1 | 域的定义与例子 | 加法群 + 乘法群 + 分配律 | §1 | ⭐ |
| 2 | 向量空间八条公理 | Abel 群 + 标量作用 | §2 | ⭐ |
| 3 | 子空间判定 | 非空 + 封闭性 | §3 | ⭐ |
| 4 | 维数公式(和/交) | 容斥原理的线性代数版本 | §3 | ⭐⭐ |
| 5 | 直和(内/外) | 唯一分解 | §4 | ⭐⭐ |
| 6 | 商空间 | 陪集 + 良定义性 | §5 | ⭐⭐ |
| 7 | 线性独立/相关 | 零表示的唯一性 | §6 | ⭐ |
| 8 | Steinitz 替换引理 | 独立集 \(\leq\) 张成集 | §7 | ⭐⭐ |
| 9 | 基与维数 | 极大独立集 = 极小张成集 | §8 | ⭐ |
| 10 | Zorn 引理 → 基存在 | AC 的等价形式 | §9 | ⭐⭐⭐ |
| 11 | 坐标与分类定理 | \(V \cong F^n\) | §11 | ⭐⭐ |
| 12 | 线性映射定义 | 保加法 + 保标量乘法 | §12 | ⭐ |
| 13 | Hom(V,W) | 线性映射的空间结构 | §13 | ⭐⭐ |
| 14 | 核、像、秩、零度 | 信息丢失与保留 | §14 | ⭐ |
| 15 | 秩-零度定理 | 丢失 + 保留 = 总共 | §15 | ⭐⭐ |
| 16 | 同构定理 | \(V/\ker T \cong \mathrm{im}\, T\) | §16 | ⭐⭐ |
| 17 | 矩阵表示与基变换 | \(P^{-1}AP\) | §17 | ⭐⭐ |
| 18 | 不变子空间 | 块对角化的基础 | §18 | ⭐⭐ |
| 19 | 对偶空间 \(V^*\) | 线性泛函的空间 | §19 | ⭐⭐ |
| 20 | 对偶基 | \(f_i(v_j) = \delta_{ij}\) | §20 | ⭐⭐ |
| 21 | 无限维 \(\dim V^* > \dim V\) | Erdos-Kaplansky | §21 | ⭐⭐⭐ |
| 22 | 二次对偶与 ev | \(V \hookrightarrow V^{**}\),有限维时同构 | §22 | ⭐⭐ |
| 23 | 自然 vs 非自然同构 | 范畴论最小词汇 | §23 | ⭐⭐⭐ |
| 24 | 对偶映射 \(T^t\) | 反转方向,矩阵为转置 | §24 | ⭐⭐ |
| 25 | 零化子与维数公式 | \(\dim W + \dim W^\circ = \dim V\) | §25 | ⭐⭐ |
累积项目:本章新增模块¶
项目:手写线性代数核心库
本章新增模块:向量空间基础和对偶空间
项目进度:
Ch1(集合论): 集合、关系、函数的基本数据结构
Ch2(本章): 新增 → VectorSpace 类(公理验证)
→ SubspaceChecker(子空间判定)
→ LinearMap 类(核、像、秩计算)
→ DualSpace 类(对偶基、对偶映射)
→ QuotientSpace 类(陪集运算)
Ch3(内积空间): 待续 → 正交补、Gram-Schmidt、伴随算子
本章项目任务(在草稿纸上完成):
- 用 \(\mathbb{R}^3\) 的标准基和一组非标准基,手动计算基变换矩阵 \(P\) 和 \(P^{-1}\),验证 \([T]_{\mathcal{B}'} = P^{-1}[T]_\mathcal{B} P\)
- 对 \(V = \mathbb{R}^3\),\(W = \mathrm{span}\{(1,0,1)\}\),手动构造 \(V/W\),验证 \(\dim V/W = 2\)
- 对 \(T: \mathbb{R}^3 \to \mathbb{R}^2\) 的一个具体矩阵,手动计算 \(\ker T\)、\(\mathrm{im}\, T\)、\(T^t\) 的矩阵、\((\mathrm{im}\, T)^\circ\),验证 \(\ker T^t = (\mathrm{im}\, T)^\circ\)
延伸阅读¶
教材¶
| 教材 | 定位 | 难度 | 推荐章节 |
|---|---|---|---|
| Axler, Linear Algebra Done Right (4th ed, 2024) | 现代本科标准 | ⭐⭐ | §1-3(完整覆盖本章内容) |
| Hoffman & Kunze, Linear Algebra (2nd ed, 1971) | 经典过渡教材 | ⭐⭐⭐ | §3.5-3.7(对偶讲得最全面) |
| Halmos, Finite-Dimensional Vector Spaces (1958) | 优雅极简经典 | ⭐⭐⭐ | §13-17("先讲对偶再讲矩阵") |
| Roman, Advanced Linear Algebra (GTM 135, 3rd ed) | 研究生标准参考 | ⭐⭐⭐⭐ | Ch3(无限维对偶最佳参考) |
博客与在线资源¶
| 资源 | 内容 | 难度 |
|---|---|---|
| Math3ma, "What is a Natural Transformation?" | 自然变换的直觉讲解 | ⭐⭐ |
| K. Conrad, "Infinite-Dimensional Dual Spaces" | Erdos-Kaplansky 的详细证明 | ⭐⭐⭐ |
论文¶
| 论文 | 内容 | 难度 |
|---|---|---|
| Eilenberg & Mac Lane (1945), Trans. AMS 58 | 范畴论的创立;自然变换的原始定义 | ⭐⭐⭐⭐ |
| Blass (1984), Contemporary Mathematics 31 | "每个向量空间有基" \(\Leftrightarrow\) AC | ⭐⭐⭐⭐ |
本章与后续章节的关系¶
| 后续章节 | 与本章的关系 | 本章哪个知识点为其铺垫 |
|---|---|---|
| §A2b 内积空间 | 正交补 \(W^\perp\) 是零化子 \(W^\circ\) 在有内积时的"化身" | §4(直和)、§19-20(\(V^*\) 和对偶基)、§24(\(T^t\) vs \(T^\dagger\)) |
| §A2c 谱定理/SVD | 特征空间是不变子空间,谱分解是直和 | §4(直和)、§18(不变子空间) |
| §A2d Jordan 标准形 | 广义特征空间是不变子空间 | §5(商空间用于递归分析)、§18(不变子空间) |
| §A2e 张量积/外代数 | \(V^* \otimes W \cong \mathrm{Hom}(V,W)\),张量是多重线性泛函 | §13(\(\mathrm{Hom}(V,W)\))、§19(\(V^*\)) |
| 第一层 微分流形/李群 | 切余空间 \(T_p^* M\) 是切空间的对偶 | §19-25(整个对偶理论) |
🔧 故障排查手册¶
| 症状 | 可能原因 | 排查步骤 | 相关章节 |
|---|---|---|---|
| 验证子空间时发现"应该成立"的封闭性不成立 | 集合不是子空间(如忘记检查 \(0 \in W\)) | 1. 检查零向量是否在集合中 2. 用具体反例测试封闭性 3. 检查条件是否齐次(\(ax + by = c\) 中 \(c \neq 0\) 不是子空间) | §3 |
| 维数公式 \(\dim(W_1 + W_2)\) 计算结果与实际不符 | 基的扩展步骤有误,或误判了 \(W_1 \cap W_2\) | 1. 独立验算 \(\dim W_1\)、\(\dim W_2\)、\(\dim(W_1 \cap W_2)\) 2. 检查 \(W_1 \cap W_2\) 是否正确(解齐次方程组) 3. 验证 \(W_1 + W_2\) 的基确实张成且独立 | §3, §7 |
| 秩-零度定理验证不通过 | 核或像的基计算有误 | 1. 用行化简独立计算 \(\mathrm{rank}(A)\) 2. 解 \(Ax = 0\) 得到核的基 3. 验证核的基确实在核中(代入检查) 4. 检查 \(\mathrm{rank} + \mathrm{null} = n\) | §14, §15 |
| 对偶映射矩阵不是转置 | 对偶基的顺序或定义有误 | 1. 重新检查对偶基 \(f_i(v_j) = \delta_{ij}\) 是否成立 2. 确认矩阵表示的基是否匹配(\([T^t]\) 用的是对偶基) 3. 检查是否混淆了 \([T^t]_{\mathcal{C}^*}^{\mathcal{B}^*}\) 和 \([T^t]_{\mathcal{B}^*}^{\mathcal{C}^*}\) | §20, §24 |
| 零化子维数与预期不符 | 基的扩展或对偶基的构造有误 | 1. 独立验证 \(\dim W\)(找 \(W\) 的基) 2. 验证 \(\dim W + \dim W^\circ = \dim V\) 3. 检查零化子中的泛函确实在 \(W\) 上为零 | §25 |
研究实践建议¶
给新手的建议¶
- 先掌握有限维:§9-§10(Zorn 引理/无限维)和 §21(Erdos-Kaplansky)的内容可以在第一遍阅读时跳过。有限维的理论已经覆盖了机器人学中 90% 以上的应用场景
- 多做练习:线性代数的理论看起来"简单",但真正理解需要动手计算。每个定理至少手动验证一个 \(\mathbb{R}^3\) 中的例子
- 区分三对容易混淆的概念:子空间的和 vs 并、商空间 vs 补空间、对偶映射 vs 伴随算子。把这三对概念的区别记牢,可以避免后续章节中大量的困惑
给有经验者的建议¶
- 关注对偶理论:如果你已经熟悉基、维数、秩-零度定理,直接从 §19 开始深读。对偶理论是通向微分几何和力学的关键桥梁
- 理解"自然性":§23 中的自然变换概念看起来是"纯数学的抽象",但它直接决定了机器人学中哪些量是帧无关的(自然的)、哪些需要额外结构(非自然的)
- 思考无限维:即使机器人学主要用有限维,理解有限维与无限维的区别(如 \(\dim V^* > \dim V\)、单射不蕴含满射)能加深对有限维理论的理解——知道一个结论在什么条件下失效,比知道它在什么条件下成立更重要
- 对偶与优化的联系:Lagrange 对偶问题中的对偶变量 \(\lambda\) 正是约束流形切空间的对偶空间中的元素。理解了 \(V^*\) 和零化子 \(W^\circ\) 的概念,就能从几何角度理解 KKT 条件——\(\nabla f\) 必须落在约束的法空间(即 \(W^\circ\))中
版本信息速查¶
| 参考教材 | 版本 | 说明 |
|---|---|---|
| Axler, LADR | 4th ed, 2024 | 免费在线版本,最新更新 |
| Hoffman & Kunze | 2nd ed, 1971 | 经典不变版本 |
| Roman, Advanced Linear Algebra | 3rd ed, GTM 135 | 研究生标准 |
| Halmos, FDVS | 1958 | 经典名著,风格独特 |