diff --git "a/\344\271\240\351\242\230\345\217\202\350\200\203\347\255\224\346\241\210/\344\270\223\351\242\230/5 \347\272\277\346\200\247\346\230\240\345\260\204.tex" "b/\344\271\240\351\242\230\345\217\202\350\200\203\347\255\224\346\241\210/\344\270\223\351\242\230/5 \347\272\277\346\200\247\346\230\240\345\260\204.tex" index 41b5d08..51f88fb 100644 --- "a/\344\271\240\351\242\230\345\217\202\350\200\203\347\255\224\346\241\210/\344\270\223\351\242\230/5 \347\272\277\346\200\247\346\230\240\345\260\204.tex" +++ "b/\344\271\240\351\242\230\345\217\202\350\200\203\347\255\224\346\241\210/\344\270\223\351\242\230/5 \347\272\277\346\200\247\346\230\240\345\260\204.tex" @@ -288,7 +288,7 @@ \section*{5 线性映射} a + bc_2 + cc_2^2 = d_2 \\ a + bc_3 + cc_3^3 = d_3 \end{cases} \] - 方程组是关于未知元 $ a, b, c $ 的三元线性非齐次方程组,其中 $ c_1, c_2, c_3 $ 是互异的实常数. 用高斯消元法,易将其增广矩阵变换为下列阶梯形矩阵,即 + 方程组是关于未知元 $ a, b, c $ 的三元线性非齐次方程组,其中 $ c_1, c_2, c_3 $ 是互异的实常数. 用高斯-若当消元法,易将其增广矩阵变换为下列阶梯形矩阵,即 \begin{align} % TODO 增广矩阵 & \begin{pmatrix} 1 & c_1 & c_1^2 & \Bigm| & d_1 \\ diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/1 \351\242\204\345\244\207\347\237\245\350\257\206.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/1 \351\242\204\345\244\207\347\237\245\350\257\206.tex" index 2fdb12f..c27b773 100644 --- "a/\350\256\262\344\271\211/\344\270\223\351\242\230/1 \351\242\204\345\244\207\347\237\245\350\257\206.tex" +++ "b/\350\256\262\344\271\211/\344\270\223\351\242\230/1 \351\242\204\345\244\207\347\237\245\350\257\206.tex" @@ -1,12 +1,27 @@ \chapter{预备知识} -线性代数作为大学的第一门数学课,预修要求并不高. 我们默认读者具有基本的高中数学知识,因此关于集合、映射以及向量的基本知识我们不在此赘述. 这一讲我们将从基本代数结构开始,以便后续线性空间的引入,然后我们将介绍本书中常见的概念——等价类和最常用的算法之一——高斯消元法. +线性代数作为大学的第一门数学课,预修要求并不高. 我们默认读者具有高中数学基础,因此关于集合、映射、向量的基本常识我们不在此赘述. 接下来我们将介绍基本代数结构,以便后续线性空间的引入,然后我们将介绍本书中常见的概念——等价类和最常用的算法之一——高斯-若当消元法. \section{基本代数结构} -我们选择从基本代数结构谈起,因为在以往的实践中我们深切地体会到直接引入线性空间的跳跃. 因此我们希望从更具象的例子开始,首先引入``代数结构''这一基本概念,然后在下一节中自然地引出线性空间的定义. +我们选择从基本代数结构谈起,因为在以往的实践中我们深切地体会到直接引入线性空间的跳跃. 因此我们希望从更具象的例子开始,首先引入``代数结构''这一基本概念,然后在下一节中自然地引出线性空间的定义. 为了接下来定义的方便,我们首先介绍集合的笛卡尔积运算: -我们首先考察一个简单的例子:实数集$\mathbf{R}$,它是一个集合. 在初中我们便知道,在$\mathbf{R}$上我们可以定义加法和乘法两种运算. 本质而言,运算是一种映射(或者更通俗而言,函数): +\begin{definition}{笛卡尔积}{笛卡尔积} \index{dikaerji@笛卡尔积 (Cartesian product)} + 设$A$和$B$是两个非空集合,我们把集合 + \[A \times B = \{(a,b) \mid a \in A, b \in B\}\] + 称为集合 $A$ 和 $B$ 的\term{笛卡尔积}. 如果 $A = B$,我们也可以简记为 $A^2$. +\end{definition} + +笛卡尔积的定义是非常直观的,它实际上就是两个集合中的元素两两组合构成的有序对全体. 我们来看一些简单的例子: + +\begin{example}{}{} + \begin{enumerate} + \item 若 $A = \{1,2\}$,$B = \{3,4\}$,则 $A \times B=\{(1,3),(1,4),(2,3),(2,4)\}$; + \item 若 $A = B = \mathbf{R}$,则根据定义,$A \times B$ 的元素是形如 $(a,b)$ 的有序对,其中 $a, b \in \mathbf{R}$. 从几何上不难看出,我们可以将 $\mathbf{R} \times \mathbf{R}$ 视为二维平面上的点集(可以简记为 $\mathbf{R}^2$),其中的元素 $(a,b)$ 对应于平面上的一个点,这一点的横坐标为 $a$,纵坐标为 $b$. + \end{enumerate} +\end{example} + +在介绍完笛卡尔积的定义后,我们开始考察一个简单的例子:实数集$\mathbf{R}$,它是一个集合. 在初中我们便知道,在$\mathbf{R}$上我们可以定义加法和乘法两种运算. 本质而言,运算是一种映射(或者更通俗而言,函数): \begin{center} \begin{tabular}{rrcl} @@ -17,35 +32,7 @@ \section{基本代数结构} \end{tabular} \end{center} -上面的定义中出现了一个新的记号,即两个集合之间出现了乘号,这实际上是集合的笛卡尔积运算,定义如下: - -\begin{definition}{笛卡尔积}{} \index{dikaerji@笛卡尔积 (Cartesian product)} - 设$A$和$B$是两个非空集合,我们把集合 - \[A\times B=\{(a,b) \mid a\in A, b\in B\}\] - 称为集合$A$和$B$的\term{笛卡尔积}. -\end{definition} - -\begin{definition}{$n$ 元笛卡尔积}{} - 设 $A_i~(1\leqslant i\leqslant n)$ 是一族集合,我们把集合 - \[ - \prod_{i=1}^n A_i = \{(a_1, a_2, \cdots, a_n) \mid a_i\in A_i\} - \] - 称为集族 $\{A_i\}$ 的 \term{$n$ 元笛卡尔积}. 特别地,当所有的 $A_i$ 都为集合 $A$ 时,记 - \[ - A^n = \prod_{i=1}^n A = \{(a_1, a_2, \cdots, a_n) \mid a_i \in A\} - \] - 为集合 $A$ 的 $n$ 次\term{笛卡尔幂}. 为了和后文的矩阵记号保持一致,严格来说 $\mathbf{R}^n$ 中的符号应当是沿竖向书写的,或者横向书写时添加转置符号,例如 - \[ - \begin{pmatrix} - 1 \\ 2 \\ 3 - \end{pmatrix} = (1, 2, 3)^{\mathrm{T}} \in \mathbf{R}^3 - \] - 但是本书中为了简便性起见,书写时有时会省去右上角的转置符号,因此可能表达行向量或者列向量的含义,请读者在阅读时注意甄别. -\end{definition} - -因此我们很容易理解$\mathbf{R}\times\mathbf{R}$作为集合长什么样,它的元素是形如$(a,b)$的有序对,其中$a,b\in\mathbf{R}$. 事实上,我们可以将$\mathbf{R}\times\mathbf{R}$看作平面上的点集,其中的元素$(a,b)$对应于平面上的一个点,这一点的横坐标为$a$,纵坐标为$b$. 类似地,空间中的点可以用三个实数来表示,也就是形如 $(x, y, z)$ 的有序对,其中 $x,y,z\in\mathbf{R}$. 也就是说,$\mathbf{R}^3$ 表示的是空间中的点集,在这种情况下我们有时会用``空间''来代指集合,而用``点''来代指集合的元素. - -我们回到运算的映射表示,我们发现$+$和$\times$都以实数的有序对作为函数的自变量,函数值也是一个实数. 或许读者看到这里还是对运算的定义有些许迷茫,但如果我们回忆映射的基本定义$f\colon A\to B$表示给$A$中的任意元素$a$指派一个$B$中的元素$f(a)$,并将加法乘法写成$+(2,3)=5$,$\times(2,3)=6$,想必就会恍然大悟:$+$和$\times$实际上就是函数名,函数做的事情就是输入两个自变量然后进行加法/乘法运算得到结果,并把这个结果指派给自变量作为函数值. +因此 $+$ 和 $\times$ 都以实数的有序对作为函数的自变量,函数值也是一个实数. 或许读者看到这里还是对运算的定义有些许迷茫,但如果我们回忆映射的基本定义 $f \colon A \to B$ 表示给 $A$ 中的任意元素 $a$ 指派一个 $B$ 中的元素 $f(a)$,并将加法乘法写成 $+(2,3) = 5$,$\times(2,3) = 6$,想必就会恍然大悟:$+$ 和 $\times$ 实际上就是函数名,函数做的事情就是输入两个自变量然后进行加法/乘法运算得到结果,并把这个结果指派给自变量作为函数值. 在上述讨论中,我们所做的事情很简单,就是给定一个集合,然后在这一集合的元素之间定义运算. 实际上这就是代数系统的定义: \begin{definition}{代数系统}{} \index{daishuxitong@代数系统 (algebraic system)} @@ -106,61 +93,78 @@ \section{基本代数结构} 事实上,在很多集合上我们不仅可以定义一种运算,也可以定义两种甚至更多运算,在代数结构中我们仅讨论最多两种运算的情况. 事实上,我们最开始的实数集合定义加法和乘法的例子便可以引入一个新的代数结构——域: \begin{definition}{域}{} \index{yu@域 (field)} - 我们称代数系统$\langle F\colon+,\circ\rangle$为一个\term{域},如果 + 我们称代数系统 $\langle F\colon+,\circ\rangle$ 为一个\term{域},如果 \begin{enumerate} - \item $\langle F\colon+\rangle$是交换群,其单位元记作0; + \item $\langle F\colon+\rangle$ 是交换群,其单位元记作0; - \item $\langle F\setminus\{0\}\colon\circ\rangle$是交换群; + \item $\langle F\setminus\{0\}\colon\circ\rangle$ 是交换群; - \item 运算$\circ$对$+$满足左、右分配律,即 + \item 运算 $\circ$ 对 $+$ 满足左、右分配律,即 \begin{gather*} - a\circ(b+c)=a\circ b+a\circ c \\ - (b+c)\circ a=b\circ a+c\circ a + a \circ (b + c) = a \circ b + a \circ c \\ + (b + c) \circ a = b \circ a + c \circ a \end{gather*} \end{enumerate} \end{definition} -显然,实数域$\mathbf{R}$上定义一般的实数加法和乘法后构成一个域. 实际上我们熟悉的例如有理数、实数等集合关于一般的加法和乘法运算都构成域,因此我们会经常使用``有理数域''、``实数域''等说法. 我们称数集对数的加法和乘法构成的域为数域,注意此处运算的定义必须是数学分析中定义的数的加法和乘法,不能是自定义的运算. +显然,实数域 $\mathbf{R}$ 上定义一般的实数加法和乘法后构成一个域. 实际上我们熟悉的例如有理数、实数等集合关于一般的加法和乘法运算都构成域,因此我们会经常使用``有理数域''、``实数域''等说法. 我们称数集对数的加法和乘法构成的域为数域,注意此处运算的定义必须是数学分析中定义的数的加法和乘法,不能是自定义的运算. + \begin{theorem}{}{} 关于数域,我们有如下两个结论: \begin{enumerate} - \item 数集$F$对数的加法和乘法构成数域的充要条件为:$F$包含0,1且对数的加、减、乘、除(除数不为0)运算封闭; + \item 数集 $F$ 对数的加法和乘法构成数域的充要条件为:$F$ 包含 $0,1$ 且对数的加、减、乘、除(除数不为 $0$)运算封闭; - \item 任何数域都包含有理数域$\mathbf{Q}$,即$\mathbf{Q}$是最小的数域. + \item 任何数域都包含有理数域 $\mathbf{Q}$,即 $\mathbf{Q}$ 是最小的数域. \end{enumerate} \end{theorem} -上述定理的证明可见教材46页. 事实上,如果加法和乘法的定义不是数的加法和乘法,我们可以定义除了数域之外的域,我们将在本讲介绍完等价类的概念后给出这样的例子. +\begin{proof} +\begin{enumerate} + \item + \item +\end{enumerate} +\end{proof} + +事实上,如果加法和乘法的定义不是数的加法和乘法,我们可以定义除了数域之外的域,我们将在本讲介绍完等价类的概念后给出这样的例子. + +除此之外,有一个细节需要强调. 根据 $\langle F\setminus\{0\}\colon\circ\rangle$ 是交换群,我们知道 $\circ$ 满足交换律,故不难发现上述定义的左、右分配律实际上是可以互相推导的,这里将它们都列举出来是因为接下来我们要引入的代数结构——环——对 $\circ$ 运算的要求有所降低,不一定能保证交换律成立,但也有广泛的应用: -当然,还有一种代数结构对于$\circ$运算的要求有所降低,但也有广泛的应用,这就是环: -\begin{definition}{环}{} \index{huan@环 (ring)} - 我们称代数系统$\langle R\colon+,\circ\rangle$为一个\term{环},如果 +\begin{definition}{环}{环的定义} \index{huan@环 (ring)} + 我们称代数系统 $\langle R\colon+,\circ\rangle$ 为一个\term{环},如果 \begin{enumerate} - \item $\langle R\colon+\rangle$是交换群,其单位元记作0; + \item $\langle R\colon+\rangle$ 是交换群,其单位元记作 $0$; - \item $\langle R\colon\circ\rangle$是幺半群; + \item $\langle R\colon\circ\rangle$ 是幺半群; - \item 运算$\circ$对$+$满足左、右分配律,即 + \item 运算 $\circ$ 对 $+$ 满足左、右分配律,即 \begin{gather*} - a\circ(b+c)=a\circ b+a\circ c \\ - (b+c)\circ a=b\circ a+c\circ a + a \circ (b + c) = a \circ b + a \circ c \\ + (b + c) \circ a = b \circ a + c \circ a \end{gather*} \end{enumerate} - 若进一步每个非$0$($+$运算单位元)元素关于$\circ$都有逆元,则称之为\term{除环}\index{huan!chu@除环 (division ring)}. 另外,若上述定义中$\circ$运算满足交换律,则称为\term{交换环}\index{huan!jiaohuan@交换环 (commutative ring)},结合上述除环和交换环两个定义,我们可以发现,交换除环即为域. + 若进一步每个非 $0$($+$ 运算单位元)元素关于 $\circ$ 都有逆元,则称之为\term{除环}\index{huan!chu@除环 (division ring)}. 另外,若上述定义中 $\circ$ 运算满足交换律,则称为\term{交换环}\index{huan!jiaohuan@交换环 (commutative ring)},结合上述除环和交换环两个定义,我们可以发现,交换除环即为域. \end{definition} \begin{example}{}{} 利用定义验证下述关于代数系统的结论: \begin{enumerate} - \item 整数集$\mathbf{Z}$对整数的加法和乘法构成一个交换环,但不是域; + \item 整数集 $\mathbf{Z}$ 对整数的加法和乘法构成一个交换环,但不是域; - \item 设$C[a,b]$是闭区间$[a,b]$上的连续函数的集合;它对函数的加法和乘法构成一个环; + \item 设 $C[a,b]$ 是闭区间 $[a,b]$ 上的连续函数的集合;它对函数的加法和乘法构成一个环; - \item 设$\mathbf{Q}(\sqrt{2})=\{a+b\sqrt{2} \mid a,b\in\mathbf{Q}\}$,则$\mathbf{Q}(\sqrt{2})$是一个数域. + \item 设 $\mathbf{Q}(\sqrt{2})=\{a + b\sqrt{2} \mid a, b \in \mathbf{Q}\}$,则 $\mathbf{Q}(\sqrt{2})$ 是一个数域. \end{enumerate} \end{example} +\begin{proof} +\begin{enumerate} + \item + \item + \item +\end{enumerate} +\end{proof} + 我想大部分读者都会对抽象出代数结构的原因表示不解,如果这个问题无法解答,我想在下一章直接引入抽象的线性空间更会引发同学们对于``学了这个有什么用''的怀疑. 我们可以举一些不那么贴切但具象的例子来说明这其中的意义. 读者高中阶段想必大都经受过解析几何的摧残,大家在拿到题目时总会首先观察到题目属于``定点''、``定值''或是``极值''等问题,大家将自动与自己做题的经验或技巧匹配用于解答这几类问题. 同理,在研究一个特定的代数系统(例如定义了加法和乘法的实数域)的性质时,我们可以首先将其归类为群、环或是域等,然后我们只需要利用群环域各自的性质来研究这个代数系统的性质,而不需要再去研究这个代数系统的具体定义. 在这一过程中我们找到了一个模型,即将一个孤立的问题转化为了对一个更广泛的问题的研究,正如将解决上千道解析几何问题转化为研究几种作为模型的题目的解法. 这一``寻找模型''的思想在将来的学习生活中我们将经常遇见,在实际中例如投资股票时我们可以将投资转化为提高投资组合的期望收益而尽力降低方差(风险)的求取极值的问题,在理论中,例如在计算理论的学习中我们会将各种各样不同的计算机架构抽象成图灵机模型,这在可计算性的研究中是最基础的模型. 对于这类抽象问题感兴趣的同学不妨可以选择数学科学学院的抽象代数等课程,或是阅读本讲义的``后继''教程\href{https://frightenedfoxcn.github.io/notes/series/alg-for-cs/}{《写给计算机系学生的代数》}作进一步的了解. 事实上,对于对理论感兴趣的同学,抽象代数将是必不可少的基础课程,它将是密码学、量子计算、计算理论以及编程语言理论等诸多领域的必要基础. 当然,这段描述因为涉及的知识容量较大,大概无法说服每一个读者. 但我们会在学习线性空间、线性映射的过程中不断重复这些思想,直到读者具备的知识容量足够时,一定能领会其中的奥妙. @@ -193,7 +197,7 @@ \section{复数域的引入} \[(\vec{e}_1+\vec{e}_2)\circ(\vec{e}_1-\vec{e}_2)=\vec{e}_1-\vec{e}_2\circ\vec{e}_2=(1-x,-y).\] 由$|\vec{e}_1+\vec{e}_2|=|\vec{e}_1-\vec{e}_2|=\sqrt{2}$以及长度可乘性可得 \[4=|(\vec{e}_1+\vec{e}_2)\circ(\vec{e}_1-\vec{e}_2)|^2=(1-x)^2+y^2.\] - 由此求出$x=-1,\enspace y=0$. 这说明 + 结合 $x^2+y^2=1$ 求出$x=-1,\enspace y=0$. 这说明 \[\vec{e}_2\circ\vec{e}_2=-\vec{e}_1.\] 由此得乘法的定义$\vec{u}\circ\vec{v}=(ac-bd)\vec{e}_1+(ad+bc)\vec{e}_2$,即 \[(a,b)\circ(c,d)=(ac-bd,ad+bc).\] @@ -205,29 +209,24 @@ \section{复数域的引入} 在\autoref{thm:复数乘法构造} 赋予的乘法下,$\langle\mathbf{R}^2\colon+,\circ\rangle$称为复数域$\mathbf{C}$. 我们自然地将$\vec{e}_1$合理简记为1,同时$\vec{e}_2$简记为$\i$,因为此时$(a,b)$即为$a+b\i$,并且利用$\vec{e}_2^2=-\vec{e}_1$可知$\i^2=-1$,这与我们熟知的虚数单位的定义是统一的. 这一代数表示引入的相关概念,如实部、虚部、纯虚数,以及复数四则运算法则在高中阶段大家都已熟知,在此不再赘述. 非零复数$z=x+y\i$也可写为极坐标的形式,即$z=|z|(\cos\theta+\i\sin\theta)$,其中$|z|=\sqrt{x^2+y^2}$为复数的平面表示的模长,$\theta\in\mathbf{R}$为连接原点与$z$的有向线段与$x$轴正方向的夹角(在相差$2\pi$整数倍的意义下唯一). 我们称$\theta$为复数$z$的辐角. 关于复数的模长我们有经典的三角不等式: + \begin{theorem}{}{} - 设$z,w\in\mathbf{C}$,则有$|z+w|\leqslant|z|+|w|$. + 设 $z, w \in \mathbf{C}$,则有 $|z + w| \leqslant |z| + |w|$. \end{theorem} -这一定理的几何意义是非常显然的,我们将$z$和$w$放在平面直角坐标系中观察就可以明白这就是经典三角不等式的复数版本. 等号成立的条件也显而易见,即$z$和$w$要么至少一个为0,要么都非零且$z$和$w$位于从原点出发的同一条射线上. 按照我们给出的定义,这个式子是不言自明的,我们需要证明的反而是一些大家在高中时就已经熟知的结果,例如: +这一定理的几何意义是非常显然的,我们将 $z$ 和 $w$ 放在平面直角坐标系中观察就可以明白这就是经典三角不等式的复数版本,此处证明略去. 等号成立的条件也显而易见,即 $z$ 和 $w$ 要么至少一个为 $0$,要么都非零且 $z$ 和 $w$ 位于从原点出发的同一条射线上. 除此之外还有一些大家在高中时就已经熟知的结果,例如: \begin{theorem}{}{} 设$z = (a, b) \in \mathbf{C}$,称 $\overline{z} = (a, -b)$ 为 $z$ 的共轭复数,则 $\overline{z} z = |z|^2$ \end{theorem} -严格的证明如下: - -\begin{proof} - 首先验证 $z$ 和 $\overline{z}$ 具备相同的长度,然后由长度可乘性得到. -\end{proof} - -这样定义的复数域的所有性质都和高中所学是完全一致的,此后我们默认读者具有足够的基础知识,不在此赘述. +直接计算即可证明这一结论. 总而言之,如上定义的复数域的所有性质都和高中所学是完全一致的,因为无论代数计算还是几何表示都完全一致,因此此后我们默认读者具有足够的基础知识,不再赘述一些基本常识. \section{等价关系} -我们时常需要讨论集合中元素之间的关系. 例如直线间的平行、垂直、相交,或是数之间的大于、等于、小于关系.``关系''在我们的讲义中将会多次出现,因此我们很有必要在此形式化定义这一概念,并强调其中一类特定的关系——等价关系. +我们时常需要讨论集合中元素之间的关系. 例如直线间的平行、垂直、相交,或是数之间的大于、等于、小于关系. ``关系''在我们的讲义中将会多次出现,因此我们很有必要在此形式化定义这一概念,并强调其中一类特定的关系——等价关系. -我们首先从(二元)关系这一概念入手. 实际上,这里的二元关系和日常生活中的关系是紧密相连的,例如在父子关系中如果将全人类作为谈论的背景集合,那么$(\text{小头爸爸}, \text{大头儿子})$这一有序二元组是符合这一关系的,但$(\text{章鱼哥}, \text{海绵宝宝})$显然不符合. 因此我们可以将父子关系看作笛卡尔积集合$\text{人类}\times\text{人类}$的子集. 更一般化的,集合$A$中的关系可以由$A\times A$的子集 +我们首先从(二元)关系入手. 实际上,这里的二元关系和日常生活中的关系是紧密相连的,例如在父子关系中如果将全人类作为谈论的背景集合,那么$(\text{小头爸爸}, \text{大头儿子})$这一有序二元组是符合这一关系的,但$(\text{章鱼哥}, \text{海绵宝宝})$显然不符合. 因此我们可以将父子关系看作笛卡尔积集合$\text{人类}\times\text{人类}$的子集. 更一般化的,集合$A$中的关系可以由$A\times A$的子集 \[\{(a,b) \mid a,b\in A, \enspace a\,R\,b\}\] 来刻画,其中$R$是这个关系本身(实质上是两个元素之间的某种性质),例如之前讨论的父子关系,或是数学中的大于、小于或同余等. 事实上,反过来,由$A\times A$的子集可以确定一个关系,例如我把全世界所有的父子组合放在这个集合中,那么这个集合就定义了人类中的父子关系. \begin{example}{}{} @@ -279,13 +278,17 @@ \section{等价关系} 设$R$是集合$A$的等价关系,则由所有不同的等价类构成的子集族$\{\overline{a}\}$是$A$的分划. 反之,我们也可以基于分划在$A$中定义等价关系. \end{theorem} -证明这一定理需要一个引理: +为了证明这一定理,我们首先需要一个引理: \begin{lemma}{}{} 设$R$是集合$A$的等价关系,$a,b\in A$,则$\overline{a}=\overline{b}\iff a\,R\,b$. \end{lemma} -这一引理说明$a$和$b$等价当且仅当它们等价类相同,或者说在同一个等价类中,相信根据等价类的定义这是很显然的结论. +这一引理说明 $a$ 和 $b$ 等价当且仅当它们所在的等价类相同,或者说在同一个等价类中,相信根据等价类的定义这是很显然的结论. + +\begin{proof} + +\end{proof} -这一引理还有一个重要的推论: +根据这一引理,我们可以迅速得到一个重要的推论,即等价类要么相等要么不相交: \begin{corollary}{}{等价类的性质} 设$R$是集合$A$的等价关系,$a,b\in A$,则下面二者必成立其一: \begin{enumerate} @@ -294,7 +297,16 @@ \section{等价关系} \item $\overline{a}=\overline{b}$. \end{enumerate} \end{corollary} -即等价类要么相等要么不相交,这一结论也是非常自然的,且由这一结论我们很容易证明\autoref{thm:等价类的性质}. 如果对这些定理的证明细节感兴趣的读者可以参看教材第5页的定理1.1和1.2. + +\begin{proof} + +\end{proof} + +由这一结论我们便可以很容易地完成\autoref{thm:等价类的性质}的证明: + +\begin{proof} + +\end{proof} 进一步此我们可以定义商集的概念: \begin{definition}{商集}{} \index{shangji@商集 (quotient set)} @@ -311,19 +323,24 @@ \section{等价关系} 在$\mathbf{Z}_n$上我们仍然希望它可以继承$\mathbf{Z}$上的加法和乘法运算,因为这是整数作为环结构最重要的两种运算(减法就是加上相反数,除法无法在整数集合定义,因为会带来非整数的有理数). 我们首先定义对加法运算的继承: \[\overline{a}\oplus\overline{b}=\overline{a+b}.\] - 它的含义是$a$对应的等价类与$b$对应的等价类的和就是$a$和$b$的和对应的等价类,因此这样的定义是自然地``继承''了$\mathbf{Z}$上的加法运算. 举个例子,当$n=3$时,$\overline{1}+\overline{2}=\overline{1+2}=\overline{3}=\overline{0}$. 要注意的是,这里$a$和$b$并不一定要在$0$到$n-1$之间,因为事实上$\overline{a}=\overline{kn+a}\enspace(k\in\mathbf{Z})$. 我们只需对$a$,$b$以及$a+b$对$n$取模就可以将它们控制在$0$到$n-1$之间且表示的是同一个运算表达式(因为本质上只是我们选取了同一个等价类的不同代表元素进行计算,例如$n=3$时,$\overline{1}\oplus\overline{2}=\overline{4}\oplus\overline{8}=\overline{0}$),这被称为是等价关系与加法的相容性,我们在这个例子之后将详细讨论. + 它的含义是$a$对应的等价类与$b$对应的等价类的和就是$a$和$b$的和对应的等价类,因此这样的定义是自然地``继承''了$\mathbf{Z}$上的加法运算. 举个例子,当$n=3$时,$\overline{1}+\overline{2}=\overline{1+2}=\overline{3}=\overline{0}$. - 接下来我们需要定义乘法$\circ$,同样是一个自然的定义,即$\overline{a}\circ\overline{b}=\overline{ab}$. 读者不妨自行验证它与等价关系的相容性. 我们很容易验证$\forall n\in\mathbf{Z}$且$n\geqslant 2$,$\langle \mathbf{Z}_n\colon\oplus,\circ\rangle$构成一个含幺交换环. 教材43页例8和45页例3中有详细的证明,因为较为显然此处从略. 我们要讨论的是何时$\langle \mathbf{Z}_n\colon\oplus,\circ\rangle$构成域,由此我们便构造了一个非数域的域,并且元素个数是有限的. + 接下来我们需要定义乘法$\circ$,同样是一个自然的定义,即$\overline{a}\circ\overline{b}=\overline{ab}$. 我们很容易验证$\forall n\in\mathbf{Z}$且$n\geqslant 2$,$\langle \mathbf{Z}_n\colon\oplus,\circ\rangle$构成一个含幺交换环(因为较为显然此处从略). 我们要讨论的是何时$\langle \mathbf{Z}_n\colon\oplus,\circ\rangle$构成域,由此我们便构造了一个非数域的域(因为集合的元素不是数,是等价类),并且元素个数是有限的. - 我们这里可以给出结论:$\langle \mathbf{Z}_n\colon\oplus,\circ\rangle$是域当且仅当$n$是素数. 这一结论的证明需要一些数论的知识,我们放在习题中供感兴趣的同学证明. 如果一个域中只有有限个元素,这样的 $\mathbf{Z}_n$ 称为有限域. 可以证明对于任何一个域,要么自然数集是其一个子集,此时我们称域的特征为 $0$,例如之前介绍的数域(有理数域、实数域、复数域等),要么它包含了某个 $\mathbf{Z}_p$,这时我们称域的特征为 $p$. 本书中没有特别说明时均假设域的特征为 $0$,即我们总是可以找到任意多有限个的不同整数. + 我们这里可以给出结论:$\langle \mathbf{Z}_n\colon\oplus,\circ\rangle$是域当且仅当$n$是素数. 这一结论的证明需要一些数论的知识,我们放在习题中供感兴趣的同学证明. 实际上,如果一个域中只有有限个元素,这样的 $\mathbf{Z}_n$ 称为有限域. 可以证明对于任何一个域,要么自然数集是其一个子集,此时我们称域的\term{特征}为 $0$,例如之前介绍的数域(有理数域、实数域、复数域等),要么它包含了某个 $\mathbf{Z}_p$,这时我们称域的特征为 $p$. 本书中没有特别说明时均假设域的特征为 $0$,即我们总是可以找到任意多有限个的不同整数. \end{example} -然而,这里我们会遇到一个很常见的问题,即上面定义的加法和乘法,真的是``合理''的吗?具体来说,令$R$表示上例中模$n$同余的等价关系,则 -\begin{enumerate} - \item 若$a\,R\,b$,$c\,R\,d$,则是否有$\overline{a}\oplus\overline{c}=\overline{b}\oplus\overline{d}$; - \item 若$a\,R\,b$,$c\,R\,d$,则是否有$\overline{a}\circ\overline{c}=\overline{b}\circ\overline{d}$? -\end{enumerate} -如果不是,那么$\mathbf{Z}_n$上定义的加法和乘法将不再是一个本讲开头所说的映射. 我们以加法为例展开讨论,实际上乘法同理. 因为$a\,R\,b$表明$\overline{a}=\overline{b}$,$c\,R\,d$表明$\overline{c}=\overline{d}$,因此如果$\mathbf{Z}_n$上的加法是一个映射$\oplus(x,y)\colon\mathbf{Z}_n\to \mathbf{Z}_n$,那么必须有$\oplus(\overline{a},\overline{c})=\oplus(\overline{b},\overline{d})$,否则两个相同的元素的加法会得到不同的元素,也就是说加法可以把同一组元素映到多个值,那么显然不再是一个映射,乘法也是同理. 当然,很幸运的是,上面的定义保证了这一``合理性'',我们事实上在上例中已经给出了这一合理性的例子:$n=3$时,$\overline{1}=\overline{4},\enspace\overline{2}=\overline{8}$,并且$\overline{1}\oplus\overline{2}=\overline{0}=\overline{4}\oplus\overline{8}$,这里加法仍然满足映射的条件. 当然我们可以给出更严谨的一般性证明,在此之前我们先给这一``合理''的性质一个更规范的定义: +上面的定义看起来非常简单而美好,但我们遗漏了一个重要的细节没有讨论:上面定义的加法和乘法,真的是``合理''的吗?. 我们都知道 $n = 3$ 时,$\overline{1} = \overline{124}$,$\overline{2} = \overline{365}$,然而在定义加法和乘法的时候,我们并没有检验 +\begin{gather} \label{eq:模加法和乘法相容的例子} + \overline{1} \oplus \overline{2} = \overline{124} \oplus \overline{365} \\ + \overline{1} \circ \overline{2} = \overline{124} \circ \overline{365} +\end{gather} +是否成立. 更一般地,令 $R$ 表示模 $n$ 同余的等价关系,若 $a\,R\,b$,$c\,R\,d$,是否有 +\begin{gather*} + \overline{a} \oplus \overline{c} = \overline{b} \oplus \overline{d} \\ + \overline{a} \circ \overline{c} = \overline{b} \circ \overline{d} +\end{gather*} +成立?我们先不讨论在模 $n$ 同余的等价关系中上述等式是否成立(我们后面会证明的确是成立的),而是先来看一下违反这一性质会带来什么后果,从而理解这一要求的含义是什么. 事实上,违反这一性质会使得 $\mathbf{Z}_n$ 上定义的加法和乘法不再是一个本讲开头所说的映射. 我们以加法为例展开讨论(乘法同理). 因为 $a\,R\,b$ 表明 $\overline{a} = \overline{b}$,$c\,R\,d$ 表明 $\overline{c} = \overline{d}$,因此如果 $\mathbf{Z}_n$ 上的加法是一个映射 $\oplus(x,y) \colon \mathbf{Z}_n \to \mathbf{Z}_n$,那么必须有 $\oplus(\overline{a},\overline{c}) = \oplus(\overline{b},\overline{d})$,否则两个完全一致的等价类的加法会得到不同的等价类,也就是说加法可以把同一组元素映到多个值,那么显然不再是一个映射,乘法也是同理. 当然,很幸运的是,上面的定义保证了这一``合理性'',例如前面给出的\autoref{eq:模加法和乘法相容的例子},$\overline{1} \oplus \overline{2} = \overline{0} = \overline{124} \oplus \overline{365}$,这里加法仍然满足映射的条件. 当然我们可以给出更严谨的一般性证明,在此之前我们先给这一``合理''的性质一个更规范的定义: \begin{definition}{}{} 设$A$是一个集合,$R$是$A$上的一个等价关系,若$A$上有二元运算$+$,且我们在$A/R$上以如下自然的方式继承了$A$上的$\oplus$运算: \[\overline{a}\oplus\overline{b}=\overline{a+b},\enspace\forall a,b\in A,\] @@ -341,62 +358,215 @@ \section{等价关系} 我们只证明加法的相容性,乘法的相容性留作练习. 设$a\,R\,b$,$c\,R\,d$,则可以设$b=a+kn$,$d=c+ln$,其中$k,l\in\mathbf{Z}$,则$\overline{b}\oplus\overline{d}=\overline{b+d}=\overline{a+c+(k+l)n}=\overline{a+c}=\overline{a}\oplus\overline{c}$,故$\oplus$与$R$相容. \end{proof} -\section{高斯消元法} +\section{高斯-若当消元法} + +线性代数这一学科起源于对线性方程组解的研究,而高斯-若当消元法是最基础的求解线性方程组的方法,是之后章节的重要的基础. + +那么什么是线性方程组呢?在小学阶段我们便已经知道:含有未知数的等式称为方程. 那时我们只接触了一元一次方程,即形如 $ax = b$ 的方程,其中 $a, b$ 是已知的常数,$x$ 是未知数. 现在我们将未知数增多,将形如: +\[a_1x_1 + a_2x_2 + \cdots + a_nx_n = b\] +的方程称为线性方程,其中 $a_1, a_2, \cdots, a_n, b$ 是已知的常数,$x_1, x_2, \cdots, x_n$ 是未知数,未知量的个数 $n$ 称为方程的``元数''. + +实际上,所谓``线性''实际上就是各个未知数都是一次的并且未知量之间只有加减运算,例如方程 +\[2x_1 + 3x_2 + x_3 +5x_4 = 5\] +是线性方程,但 +\[2x_1 + 3x_2^2 + x_3 + 5x_4 = 5\] +和 +\[2x_1 + 3\sqrt{x_2x_3} + 5x_4 = 5\] +都不是线性方程,因为 $x_2^2$ 不是一次式,$\sqrt{x_2x_3}$ 中 $x_2$ 和 $x_3$ 之间是乘法运算. 实际上,这里的``线性''是非常符合直觉的,例如线性方程 $ax + by = c$ 代表平面上的直线,而非线性方程 $x_1x_2 = 1$ 代表双曲线(是曲线);线性方程 $ax + by + cz = d$ 是平面方程,而 $ax^2 + by^2 +cz^2 = d$ 是曲面方程. 请注意,这里``线性''的定义与直观与``线性代数''中的``线性''含义一致,因此在此后的学习中,我们遇见``线性''这一名词时,脑海中的定义——一次式的加减组合和直观——直线、平面都是将类似的. + +进一步地,一组线性方程的集合称为线性方程组. 我们给出正式定义如下: + +\begin{definition}{线性方程组}{线性方程组} + 一般地,一个由 $m$ 个线性方程组成的 $n$ 元(即变量数为 $n$)线性方程组可以表示为: + \[ \begin{cases} + \begin{aligned} + a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n & = b_1 \\ + a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n & = b_2 \\ + & \vdotswithin{=} \\ + a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n & = b_m + \end{aligned} + \end{cases} \] +\end{definition} + +我们的目标是求解线性方程组,所谓线性方程组的解也就是找到一组满足所有方程的所有未知数的值. 考虑最简单的二元一次方程组: +\[ \begin{cases} + \begin{aligned} + a_{11}x_1+a_{12}x_2 & = b_1 \\ + a_{21}x_1+a_{22}x_2 & = b_2 + \end{aligned} +\end{cases} \] +从几何上这就相当于求解两条直线的交点,因此解的情况可能有如下三种: +\begin{itemize} + \item 两直线相交于一点,此时方程组有唯一解; + \item 两直线平行且不重合,此时方程组无解; + \item 两直线重合,此时方程组有无穷多解. +\end{itemize} + +本节介绍高斯-若当消元法的目标在于,提供一种系统的方法,通过一系列的变换将线性方程组化为更简单的形式,从而得到方程组属于有唯一解、无解还是无穷解的情况,并求出有解情况下的解. 在开始介绍高斯-若当消元法之前,我们先引入一些基本的概念. + +\subsection{$n$ 元向量与矩阵的定义} + +高中阶段我们已经学习了平面向量和空间向量,其中平面向量是两个实数元素构成的有序对,空间向量是三个实数元素构成的有序对,因此我们分别称其为二元实向量和三元实向量. 我们可以将向量的概念进一步推广,我们需要借助如下定义进行推广: -高斯消元法是一种求解线性方程组的方法,我们先从一个简单的例子开始: +\begin{definition}{$n$ 元笛卡尔积}{} + 设 $A_i~(1\leqslant i\leqslant n)$ 是一族集合,我们把集合 + \[ + \prod_{i=1}^n A_i = \{(a_1, a_2, \cdots, a_n) \mid a_i\in A_i\} + \] + 称为集族 $\{A_i\}$ 的 \term{$n$ 元笛卡尔积}. 特别地,当所有的 $A_i$ 都为集合 $A$ 时,记 + \[ + A^n = \prod_{i=1}^n A = \{(a_1, a_2, \cdots, a_n) \mid a_i \in A\} + \] + 为集合 $A$ 的 $n$ 次\term{笛卡尔幂}. +\end{definition} -\begin{example}{}{高斯消元法引入} +不难看出这一定义就是将\autoref{def:笛卡尔积}中定义的两个集合之间的笛卡尔积推广到 $n$ 个集合之间的笛卡尔积. 根据笛卡尔幂的定义,此前提到的二维平面点集 $\mathbf{R} \times \mathbf{R}$ 简记为 $\mathbf{R}^2$ 也是符合这一定义的. 类似地,$\mathbf{R}^3$ 表示的是三维空间中的点集,空间中的点可以用三个实数来表示,也就是形如 $(x, y, z)$ 的有序对,其中 $x, y, z \in \mathbf{R}$,在这种情况下我们有时会用``空间''来代指集合,而用``点''来代指集合的元素. + +一般地,如果是 $n$ 个 $\mathbf{R}$ 进行笛卡尔积,我们便得到了集合 $\mathbf{R}^n$,其中的元素是由 $n$ 个实数组成的有序对,记为 $(x_1, x_2, \cdots, x_n)$,其中 $x_i \in \mathbf{R}$,这样的有序对我们称之为\term{ $n$ 元实向量}(如果类似定义 $\mathbf{C}^n$ 中的元素则称为 $n$ 元复向量). 其中的 $x_i$ 称为向量的第 $i$ 个分量. 如果 $n$ 个分量都为 $0$,我们称这个向量为\term{零向量}. + +为了使后文的记号不会使人迷惑,我们必须在此强调一个记号问题. 严格来说 $\mathbf{R}^n$ 中的符号应当是沿竖向书写的(即应当是\term{列向量}),或者横向书写(即写成\term{行向量}的形式)时在右上角添加 $\mathrm{T}$ 作为上标,例如 +\[ +\begin{pmatrix} + 1 \\ 2 \\ 3 +\end{pmatrix} = (1, 2, 3)^{\mathrm{T}} \in \mathbf{R}^3 +\] +这个上标我们称之为\term{转置}符号,下面定义矩阵之后我们会给出转置的严格定义. 需要注意的是,本书中为了简便以及节省空间起见,书写时有时会省去右上角的转置符号,因此可能表达行向量或者列向量的含义,请读者在阅读时注意甄别. 但注意只要是 $\mathbf{R}^n$ 中的元素,它们严格来说都应当写成列向量,行向量表达的严格含义在\nameref{chap:对偶空间}一章中会给出解释. + +下面我们可以给出 $n$ 元向量的加法和数乘的定义,这就是中学阶段平面向量、空间向量加法和数乘(数量积)运算的自然推广. 对于任意的 $n$ 元向量 $(x_1, x_2, \cdots, x_n)^\mathrm{T}$ 和 $(y_1, y_2, \cdots, y_n)^\mathrm{T}$,以及任意的实数 $k$,我们定义: +\begin{gather*} + (x_1, x_2, \cdots, x_n)^\mathrm{T} + (y_1, y_2, \cdots, y_n)^\mathrm{T} = (x_1+y_1, x_2+y_2, \cdots, x_n+y_n)^\mathrm{T} \\ + k(x_1, x_2, \cdots, x_n)^\mathrm{T} = (kx_1, kx_2, \cdots, kx_n)^\mathrm{T} +\end{gather*} + +接下来我们定义矩阵的相关概念,这能使得我们之后的讨论更加方便. + +\begin{definition}{矩阵}{} + 域 $\mathbf{F}$ 中的 $m \times n$ 个元素 $a_{ij} \enspace (i = 1,\ldots,m, \enspace j=1,\ldots,n)$ 排成 $m$ 行 $n$ 列的矩形数表,称为域 $\mathbf{F}$ 上的一个 $m\times n$ 矩阵,记作 + \[A = \begin{pmatrix} + a_{11} & a_{12} & \cdots & a_{1n} \\ + a_{21} & a_{22} & \cdots & a_{2n} \\ + \vdots & \vdots & \ddots & \vdots \\ + a_{m1} & a_{m2} & \cdots & a_{mn} + \end{pmatrix}\] + 或简记为 $(a_{ij})_{m \times n}$,其中 $a_{ij}$ 表示矩阵 $A$ 的第 $i$ 行第 $j$ 列的元素. +\end{definition} + +因此矩阵直观来看就是一个二维的数表. 此前我们提到的 $\mathbf{R}^n$ 中的元素($n$ 元列向量)就可以视为一个 $n \times 1$ 的矩阵,$n$ 元行向量则可以视为一个 $1 \times n$ 的矩阵. 接下来是此前提到过的转置的正式定义: + +\begin{definition}{矩阵的转置}{} + 设 $A = (a_{ij})_{m \times n}$,则 $A$ 的\term{转置矩阵}\index{zhuanzhi@转置 (transpose)}是一个 $n \times m$ 矩阵,记作 $A^\mathrm{T}$,它的第 $k$ 行正好是 $A$ 的第 $k$ 列($k = 1,2,\ldots,n$);它的第 $r$ 列正好是 $A$ 的第 $r$ 行($r = 1,2,\ldots,m$). +\end{definition} + +根据定义,矩阵的转置等价于第 $i$ 行第 $j$ 列的元素变成转置后矩阵的第 $j$ 行第 $i$ 列的元素. 我们来看一个简单的例子,设 $A = \begin{pmatrix}1 & 2 & 3 & 4 \\ 5 & 6 & 7 & 8 \\ 9 & 10 & 11 & 12\end{pmatrix}$,则 $A^\mathrm{T} = \begin{pmatrix}1 & 5 & 9 \\ 2 & 6 & 10 \\ 3 & 7 & 11 \\ 4 & 8 & 12\end{pmatrix}$. 除此之外,此前列向量等于行向量的转置不难验证也是符合这一定义的. + +事实上,在求转置的时候,我们只需要把第一行保持顺序变成第一列,第二行保持顺序变成第二列,以此类推. 因为这样第一行第 $i$ 列的元素就变成了第 $i$ 行第一列的元素,符合转置的要求,其它行的元素也是类似的,从上面的例子也能看出这一点. + +\subsection{高斯-若当消元法} + +有了上述的基础之后,接下来便可以开始介绍高斯-若当消元法的具体操作. 我们先从一个简单的例子开始体会其基本思想: + +\begin{example}{}{高斯-若当消元法引入} 求解线性方程组 \begin{numcases}{} - x_1+3x_2+x_3 & =2 \\ - 3x_1+4x_2+2x_3 & =9 \\ - -x_1-5x_2+4x_3 & =10 + 3x_1+2x_2+x_3 = 39 \label{eq:高斯消元引入1} \\ + 2x_1+3x_2+x_3 = 34 \label{eq:高斯消元引入2} \\ + x_1+2x_2+3x_3 = 26 \label{eq:高斯消元引入3} \end{numcases} - 将方程$(1)$分别乘以$-3$和$1$加到方程$(2)$,$(3)$上消去两个方程中的$(1)$,得 + 将方程\eqref{eq:高斯消元引入3}分别乘以 $-3$ 和 $-2$ 加到方程\eqref{eq:高斯消元引入1}、\eqref{eq:高斯消元引入2}上消去两个方程中的 $x_1$,得 \begin{numcases}{} - -5x_2-x_3=3 \\ - -2x_2+5x_3=12 + -4x_2-8x_3=-39 \label{eq:高斯消元引入4} \\ + -x_2-5x_3=-18 \label{eq:高斯消元引入5} \end{numcases} - 再将方程$(5)$乘以$-\dfrac{5}{2}$加到方程$(4)$上消去$x_2$可知$x_3=2$,依次代回$(4)$,$(1)$可知$x_1=3$,$x_2=-1$,$x_3=2$. + 再将方程\eqref{eq:高斯消元引入5}乘以 $-4$ 加到方程\eqref{eq:高斯消元引入4}上消去 $x_2$ 可知 $x_3 = \dfrac{11}{4}$,最后依次代回\eqref{eq:高斯消元引入4}和\eqref{eq:高斯消元引入1}可知依次解出 $x_2 = \dfrac{17}{4}$ 以及 $x_1 = \dfrac{37}{4}$. \end{example} -可以看出,求解线性方程组无非是通过加、减、乘等尽可能地减少每个方程中未知数的个数,即消元.在上面的例子中,通过几次消元后,我们得到了一个更简单的方程组 +可以看出,求解线性方程组无非是通过加、减、乘等尽可能地减少每个方程中未知数的个数,即消元. 这样的消元思想我们中学阶段就已经知道,只是我们没有系统地总结出来应用于更多个多元的线性方程组上. 事实上,这样的思想最早出现在中国古代数学著作《九章算术》中,相关内容在大约公元前 150 年就出现了. 在古代,方程这一词中的``方''为并列、对等,``程''表示以“算筹”列成竖式的计算过程. 实际上,上面的方程对应于九章算术上的原文: -\begin{numcases}{} - x_1+3x_2+x_3=2 \\ - -5x_2-x_3=3 \\ - x_3=2 -\end{numcases} +\begin{quote} + \kaishu + 今有上禾三秉,中禾二秉,下禾一秉,实三十九斗;上禾二秉,中禾三秉,下禾一秉,实三十四斗;上禾一秉,中禾二秉,下禾三秉,实二十六斗. 问上、中、下禾实一秉各几何? +\end{quote} -回代本质上是为了得到一个更简单的方程组 +在欧洲,牛顿(Newton)最先发现了这种方法. 在 1670 年,牛顿写道他所知晓的所有代数教科书都缺少求解方程组的方法,而他随后补充了这一部分. 在牛顿离开学术生涯很久以后,剑桥大学才在 1707 年最终以 \textit{Arithmetica Univeralis} 的标题出版了他的笔记. 这些笔记被广泛复制,在 18 世纪末成为了代数课本的标准内容. 1810 年,高斯(Gauss)在预测谷神星轨道时引入了高斯消元法,这是种系统性的线性方程组解法,后来这种记法被手算员们广泛应用于解决最小二乘问题. 他在对天体轨道建模时处理了 12 个方程对应 6 个未知变量的情况. 他已经清楚地了解方程组有无穷解,唯一解还是无解的条. 后来这一算法由于对历史的混淆在 1950 年代被以高斯命名,称之为``高斯消元法''. -\begin{numcases}{} - x_1=3 \\ - x_2=-1 \\ - x_3=2 -\end{numcases}. +1888年,德国数学家若当(Jordan)发现了这种高斯消元法的变体(具体的变化在介绍完高斯-若当消元法后会给出). 然而,相同的方法也出现在克莱森(Clasen)在同年出版的文章中. 若当与克莱森有可能是各自独立地发现了高斯-若当消元法. -下面我们将这种方法一般化. -一般的,对于一个由$m$个方程组成的$n$元(即变量数为$n$)线性方程组 +下面我们将详细介绍高斯-若当消元法这一系统的解线性方程组的方法. 我们将由 $m$ 个方程组成的 $n$ 元线性方程组的一般形式再次写下: \[ \begin{cases} \begin{aligned} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n & = b_1 \\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n & = b_2 \\ & \vdotswithin{=} \\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n & = b_m \end{aligned} \end{cases} \] -将其系数按照如下的方式排列,称其为一个矩阵 -\[\begin{pmatrix} +将其系数按照如下的方式排列,可以得到一个矩阵,称其为该线性方程组的\term{系数矩阵},记为 +\[A = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix}\] -且记$\vec{b}=(b_1,b_2,\ldots,b_m)^\mathrm{T}$,若$\vec{b}=\vec{0}$则称此方程为齐次线性方程组,否则为非齐次线性方程组. 再将$n$个未知量记为$n$元列向量$X=(x_1,x_2,\ldots,x_n)^\mathrm{T}$,我们便可以把方程组简记为$AX=\vec{b}$. - -令$\vec{\beta}_i=(a_{1i},a_{2i},\ldots,a_{mi})^\mathrm{T}$,即方程组系数矩阵的某一列,则方程组还可以记为$x_1\vec{\beta}_1+x_2\vec{\beta}_2+\cdots+x_n\vec{\beta}_n=\vec{b}$\phantomsection\label{线性方程的向量表示},这一形式将在之后多次见到. +且记 $\vec{b} = (b_1,b_2,\ldots,b_m)^\mathrm{T}$,若 $\vec{b} = \vec{0}$ 则称此方程为\term{齐次线性方程组},否则为\term{非齐次线性方程组}. 再将 $n$ 个未知量记为 $n$ 元列向量 $X = (x_1,x_2,\ldots,x_n)^\mathrm{T}$,我们便可以把方程组简记为 +\begin{equation} \label{eq:线性方程组的矩阵表示} + AX = \vec{b} +\end{equation} +展开写就是,$\forall (x_1,x_2,\ldots,x_n)^\mathrm{T} \in \mathbf{R}^n$,有 +\[\begin{pmatrix} + a_{11} & a_{12} & \cdots & a_{1n} \\ + a_{21} & a_{22} & \cdots & a_{2n} \\ + \vdots & \vdots & \ddots & \vdots \\ + a_{m1} & a_{m2} & \cdots & a_{mn} + \end{pmatrix} \begin{pmatrix} + x_1 \\ x_2 \\ \vdots \\ x_n + \end{pmatrix} = \begin{pmatrix} + b_1 \\ b_2 \\ \vdots \\ b_m + \end{pmatrix} = \begin{pmatrix} + a_{11} x_1 + a_{12} x_2 + \cdots + a_{1n} x_n \\ + a_{21} x_1 + a_{22} x_2 + \cdots + a_{2n} x_n \\ + \cdots\\ + a_{m1} x_1 + a_{m2} x_2 + \cdots + a_{mn} x_n + \end{pmatrix} +\] + +我们将在\nameref{sec:矩阵乘法}一节中发现,这就是矩阵乘法的一个特殊情况,但在这里我们只需要记住这一运算规则即可,也就是一个矩阵左乘一个列向量是如何进行的. 为了让这个规则看起来更加清晰,根据 $n$ 元向量的运算规则,我们可以做如下变换: +\[\begin{pmatrix} + a_{11} x_1 + a_{12} x_2 + \cdots + a_{1n} x_n \\ + a_{21} x_1 + a_{22} x_2 + \cdots + a_{2n} x_n \\ + \cdots\\ + a_{m1} x_1 + a_{m2} x_2 + \cdots + a_{mn} x_n +\end{pmatrix} = x_1 \begin{pmatrix} + a_{11} \\ a_{21} \\ \vdots \\ a_{m1} +\end{pmatrix} + x_2 \begin{pmatrix} + a_{12} \\ a_{22} \\ \vdots \\ a_{m2} +\end{pmatrix} + \cdots + x_n \begin{pmatrix} + a_{1n} \\ a_{2n} \\ \vdots \\ a_{mn} +\end{pmatrix} = \vec{b}\] +令 $\vec{\beta}_i = (a_{1i},a_{2i},\ldots,a_{mi})^\mathrm{T}$,即方程组系数矩阵 $A$ 的某一列,则方程组可以简记为 +\begin{equation} \label{eq:线性方程的向量表示} + x_1\vec{\beta}_1 + x_2\vec{\beta}_2 + \cdots + x_n\vec{\beta}_n = \vec{b} +\end{equation} +结合\eqref{eq:线性方程组的矩阵表示} 和 \eqref{eq:线性方程的向量表示},我们可以得到矩阵左乘列向量的清晰的运算规则,即 +\begin{equation} \label{eq:矩阵左乘列向量} + AX = x_1\vec{\beta}_1 + x_2\vec{\beta}_2 + \cdots + x_n\vec{\beta}_n +\end{equation} +其中 $x_i$ 是列向量 $X$ 的第 $i$ 个分量,$\vec{\beta}_i$ 是系数矩阵 $A$ 的第 $i$ 列. 我们使用带数值的例子来练习一下这一运算规则: +\[ + \begin{pmatrix} + 1 & 2 & 3 \\ 4 & 5 & 6 + \end{pmatrix} \begin{pmatrix} + 7 \\ 8 \\ 9 + \end{pmatrix} = 7 \begin{pmatrix} + 1 \\ 4 + \end{pmatrix} + 8 \begin{pmatrix} + 2 \\ 5 + \end{pmatrix} + 9 \begin{pmatrix} + 3 \\ 6 + \end{pmatrix} = \begin{pmatrix} + 50 \\ 122 + \end{pmatrix} +\] 在以上的记号下,我们定义几个概念: @@ -406,7 +576,7 @@ \section{高斯消元法} 简化阶梯矩阵:阶梯矩阵中每个主元素所在列的其余元素全为$0$. -有了这些定义,我们可以将解线性方程组的过程转化为矩阵的初等行变换. 高斯消元法的一般步骤如下: +有了这些定义,我们可以将解线性方程组的过程转化为矩阵的初等行变换. 高斯-若当消元法的一般步骤如下: \begin{center} 线性方程组$\overset{1}{\longrightarrow}$增广矩阵$\overset{2}{\longrightarrow}$阶梯矩阵$\overset{3}{\longrightarrow}$(行)简化阶梯矩阵$\overset{4}{\longrightarrow}$解 \end{center} @@ -421,33 +591,23 @@ \section{高斯消元法} \item \label{item:1:解方程组} 我们分三种情况讨论: \begin{enumerate} - \item 有唯一解:没有全零行,最后一个主元素的行号与系数矩阵的列数相等,且行简化阶梯矩阵对角线上全为1,其余元素均为0,此时可以直接写出解.前面的例子就属于这种情况. + \item 有唯一解:没有全零行,最后一个主元素的行号与系数矩阵的列数相等,且简化阶梯矩阵对角线上全为1,其余元素均为0,此时可以直接写出解.前面的例子就属于这种情况. \item 无解:出现矛盾方程,即系数为0的行的行末元素不为0,此时直接写无解即可; - \item 有无穷解:非上述情况. 此时设出自由未知量将其令为$k_1,k_2,\ldots$,然后代入增广矩阵对应的方程组即可. 注意选取自由未知量时,选取没有主元素出现的列对应的未知量会与标准答案更贴近,当然选择其他作为自由未知量也可以.例如如果最后得到的简化阶梯矩阵是 - \[\begin{pmatrix} - 1 & 1 & 0 & 2 \\ - 0 & 0 & 1 & -1 - \end{pmatrix}\] - 则解为$\vec{X}=(x_1,x_2,x_3)^\mathrm{T}=(2,0,-1)^\mathrm{T}+k(1,-1,0)^\mathrm{T}$. + \item 有无穷解:非上述情况. 此时设出自由未知量将其令为$k_1,k_2,\ldots$,然后代入增广矩阵对应的方程组即可. 注意选取自由未知量时,选取没有主元素出现的列对应的未知量是更常见的做法,当然选择其他作为自由未知量也可以. \end{enumerate} \end{enumerate} -高斯消元法是线性代数中最常用的算法之一,是之后解决大量问题所需要掌握的基本方法,同时也是考试中一定会考察的内容,无论是单独一个大题考察,还是嵌入在其它问题中. -注意考试中单独考察解方程时,时间充足时建议将过程写完整,标明初等行变换的具体步骤,并且至少写出阶梯矩阵和行简化阶梯矩阵. 除此之外,需要保证计算中尽量减少错误,时间充足可以解完方程后将答案代入进行检查. - -需要强调的是,不要认为本节内容很简单就放过了,实际上如果长期不计算高斯消元法很容易陷入眼高手低的窘境,因此希望各位同学熟悉高斯消元法的基本步骤并熟练应用. - - +实际上,``高斯消元法''指代消元到阶梯形矩阵之前的过程,经过若当改进的``高斯-若当消元法''指代消元到简化阶梯矩阵的过程. 根据前面我们给出的例子,显然高斯-若当消元法中得到的简化阶梯矩阵对于判断解的情况以及写出解的目标更简单. -从高斯消元法开始,我们正式进入线性代数的学习. 实际上,上述 \ref*{item:1:解方程组} 中关于方程组解的情况的讨论我们是浮于表面,是基于算法最后得到的矩阵的形式进行的讨论,但事实上,这背后蕴含着更深刻的意义. 我们将会在接下来的十余个章节中讲述线性代数中的核心概念,并在\nameref{chap:朝花夕拾}中回过头来重新审视线性方程组解的问题. 相信在那时,经历十余章各式抽象概念和运算技巧的洗礼后再来回味这一问题的你,定有``守得云开见月明''之感,对线性代数的理解也会更深一层. +从高斯-若当消元法开始,我们正式进入线性代数的学习. 实际上,上述\ref*{item:1:解方程组}中关于方程组解的情况的讨论我们是浮于表面,是基于算法最后得到的矩阵的形式进行的讨论,但事实上,这背后蕴含着更深刻的意义. 我们将会在接下来的十余个章节中讲述线性代数中的核心概念,并在\nameref{chap:朝花夕拾}中回过头来重新审视线性方程组解的问题. 相信在那时,经历十余章各式抽象概念和运算技巧的洗礼后再来回味这一问题的你,定有``守得云开见月明''之感,对线性代数的理解也会更深一层. \begin{summary} 本讲为了后续章节讲述方便引入了一些基本概念和算法. 尽管这是一门面向理工科应用的数学课,但我们仍然希望以最自然的方式引入概念,而非填鸭式地轰炸,因此我们首先从大家最熟悉的实数集合开始,讨论在集合上定义运算的方法:我们逐步加强条件,引入了三种基本的代数结构——群、环和域,并且给出了一些例子,并简单讨论了定义代数系统的意义. 事实上,下一讲开始要介绍的线性空间也是一种特殊的代数结构,因此首先引入代数结构对于我们自然展开接下来的讨论有很大的帮助,不至于让读者觉得非常突兀. - 接下来我们也从域的定义入手,构造了$\mathbf{R}^2$上的乘法运算使其构成了一个域,并且我们发现这里的定义与高中学习的复数乘法是完全一致的. 之后我们引入了等价关系的概念,这一概念在后续的讲义中将会多次出现,其重要意义就是将一个集合划分成了几个等价的区域. 最后我们讨论了高斯消元法的一般步骤,这是我们接下来解决线性空间中各类问题绕不开的算法. + 接下来我们也从域的定义入手,构造了$\mathbf{R}^2$上的乘法运算使其构成了一个域,并且我们发现这里的定义与高中学习的复数乘法是完全一致的. 之后我们引入了等价关系的概念,这一概念在后续的讲义中将会多次出现,其重要意义就是将一个集合划分成了几个等价的区域. 最后我们讨论了高斯-若当消元法的一般步骤,这是我们接下来解决线性空间中各类问题绕不开的算法. \end{summary} diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/9 \347\237\251\351\230\265\350\277\220\347\256\227\350\277\233\351\230\266.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/10 \347\237\251\351\230\265\350\277\220\347\256\227\350\277\233\351\230\266.tex" similarity index 99% rename from "\350\256\262\344\271\211/\344\270\223\351\242\230/9 \347\237\251\351\230\265\350\277\220\347\256\227\350\277\233\351\230\266.tex" rename to "\350\256\262\344\271\211/\344\270\223\351\242\230/10 \347\237\251\351\230\265\350\277\220\347\256\227\350\277\233\351\230\266.tex" index 5d6a83c..9b44bf1 100644 --- "a/\350\256\262\344\271\211/\344\270\223\351\242\230/9 \347\237\251\351\230\265\350\277\220\347\256\227\350\277\233\351\230\266.tex" +++ "b/\350\256\262\344\271\211/\344\270\223\351\242\230/10 \347\237\251\351\230\265\350\277\220\347\256\227\350\277\233\351\230\266.tex" @@ -671,6 +671,7 @@ \subsection{分块矩阵求逆} 初看这一公式想必一定会发出``这么复杂的公式为什么有用''的感叹. 事实上,我们考虑$r$比$n$小很多的情况,那么这个时候对$R$和$R^{-1}+YA^{-1}X$求逆会更容易,因为它们的阶数会低很多,计算量也小很多. 考虑极端情况,若$x$和$y$是非零列向量,取$X=x$,$Y=y^\mathrm{T}$,$R=(1)$,且满足$1+y^\mathrm{T}A^{-1}x\neq 0$,我们可以得到Sherman-Morrison-Woodbury公式的一个特殊情形(称为Sherman-Morrison公式): \[(A+xy^\mathrm{T})^{-1}=A^{-1}-(1+y^\mathrm{T}A^{-1}x)^{-1}A^{-1}xy^\mathrm{T}A^{-1}.\] +这也称为``秩 1 校正'',因为 $xy^\mathrm{T}$ 是一个秩 1 矩阵,在最优化理论中是常见的. \subsection{分块矩阵与数学归纳法} @@ -764,11 +765,11 @@ \subsection{分块矩阵与数学归纳法} \item 倍乘变换:只会改变对角线元素,因此不改变下三角性质; \item 倍加变换:必须是上方的行乘以非零数加到下方的行,这样才不会改变下三角性质. \end{enumerate} -基于此我们便可以得到矩阵的$LU$分解并基于此很顺利地解出方程——在例子中我们很明显地体会到了三阶矩阵对于解方程的便捷性的提升,我们只需要从未知数少的方程往未知数多的方程逐步求解即可. 更重要的是,$LU$分解的求解过程中对于方程$Ax=b$中的$b$完全没有做任何变换,这大大节省了高斯消元法法中的一个重要的计算量来源,并且求解$LU$分解的过程也仅仅是初等变换,相对于高斯消元法没有多余的步骤,因此在解决如下问题时: +基于此我们便可以得到矩阵的$LU$分解并基于此很顺利地解出方程——在例子中我们很明显地体会到了三阶矩阵对于解方程的便捷性的提升,我们只需要从未知数少的方程往未知数多的方程逐步求解即可. 更重要的是,$LU$分解的求解过程中对于方程$Ax=b$中的$b$完全没有做任何变换,这大大节省了高斯-若当消元法法中的一个重要的计算量来源,并且求解$LU$分解的过程也仅仅是初等变换,相对于高斯-若当消元法没有多余的步骤,因此在解决如下问题时: \begin{gather*} Ax=b_1 \\ Ax=b_2 \\ \cdots \\ Ax=b_n \end{gather*} -当$n$很大时,如果利用$LU$分解,我们只需对$A$做一次分解,就可以解出所有方程,但高斯消元法则需要每个方程都和每个$b_i(i=1,2,\ldots,n)$构成增广矩阵一起消元,计算量会增大许多. +当$n$很大时,如果利用$LU$分解,我们只需对$A$做一次分解,就可以解出所有方程,但高斯-若当消元法则需要每个方程都和每个$b_i(i=1,2,\ldots,n)$构成增广矩阵一起消元,计算量会增大许多. \section{矩阵方程} diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/12 \350\241\214\345\210\227\345\274\217.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/11 \350\241\214\345\210\227\345\274\217.tex" similarity index 100% rename from "\350\256\262\344\271\211/\344\270\223\351\242\230/12 \350\241\214\345\210\227\345\274\217.tex" rename to "\350\256\262\344\271\211/\344\270\223\351\242\230/11 \350\241\214\345\210\227\345\274\217.tex" diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/13 \346\234\235\350\212\261\345\244\225\346\213\276.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/12 \346\234\235\350\212\261\345\244\225\346\213\276.tex" similarity index 96% rename from "\350\256\262\344\271\211/\344\270\223\351\242\230/13 \346\234\235\350\212\261\345\244\225\346\213\276.tex" rename to "\350\256\262\344\271\211/\344\270\223\351\242\230/12 \346\234\235\350\212\261\345\244\225\346\213\276.tex" index ee61fee..e94b0cd 100644 --- "a/\350\256\262\344\271\211/\344\270\223\351\242\230/13 \346\234\235\350\212\261\345\244\225\346\213\276.tex" +++ "b/\350\256\262\344\271\211/\344\270\223\351\242\230/12 \346\234\235\350\212\261\345\244\225\346\213\276.tex" @@ -59,6 +59,13 @@ \subsection{齐次线性方程组解的一般理论} 实际上在前面的讨论中,无论是\nameref{thm:有解条件}的结论,都与列向量组成的线性空间有关,仿佛从未出现过行向量有关的定理. 事实上,我们将在未来讨论了内积空间正交性后展开对行向量空间的讨论,现在囿于概念上的缺乏无法叙述相关定理. +\begin{theorem}{}{基础解系是基} + 设$AX=\vec{0}$的基础解系为$X_1,\ldots,X_{n-r}$,则$X_1,\ldots,X_{n-r}$线性无关. +\end{theorem} +\begin{proof} + +\end{proof} + \subsection{非齐次线性方程组解的一般理论} 回顾\autoref{ex:常见子空间} 中的讨论我们发现,非齐次线性方程组的解不构成线性空间,但我们可以尝试将其与齐次线性方程组解空间联系起来研究. 对于非齐次线性方程组 @@ -209,7 +216,7 @@ \section{理论应用} \end{enumerate} \end{proof} -实际上,我们解决此类问题,很多时候等式都需要拆为小于等于和大于等于同时成立进行证明,经常利用维数公式变形的齐次线性方程组解的一般理论,将问题转化为对像与核空间的研究,然后利用包含关系(复杂的题目可能涉及子空间交与和的维数公式)以及已知的简单秩不等式进行证明. 可能部分题目较为困难,但至少请掌握上面例题中的情况. +实际上,我们解决此类问题,很多时候等式都需要拆为小于等于和大于等于同时成立进行证明,经常利用维数公式变形的齐次线性方程组解的一般理论,将问题转化为对像与核空间的研究,然后利用包含关系(复杂的题目可能涉及子空间交与和的维数公式)以及已知的简单秩不等式进行证明. 可能部分题目较为困难,但至少请掌握上面例题中的情况. 接下来我们讨论伴随矩阵的秩的问题,这一例题的结论和证明都非常重要: \begin{example}{}{伴随矩阵的秩} 设$A^*$为矩阵$A$的伴随矩阵,证明: \[r(A^*)=\begin{cases} @@ -229,6 +236,33 @@ \section{理论应用} \end{enumerate} \end{proof} +接下来是一个利用\nameref{thm:线性空间维数公式}以及\nameref{thm:线性映射基本定理}中``设小扩大''的思想解决的问题: +\begin{example}{}{维数公式技巧例题} + 已知$A,B$分别是数域$\mathbf{F}$上的$l \times k$和$k \times n$矩阵,$X$是$n \times 1$的列向量. 证明:所有满足$ABX=0$的$BX$构成一个线性空间$V$,且$\dim V = r(B) - r(AB)$. +\end{example} + +\begin{proof} + $V$是线性空间只需要说明其中元素关于加法数乘封闭即可,因为这样$V$就是$\mathbf{F}^k$的子空间. 这一证明非常基本,我们在此略过. + + 记$V_1=\{X\mid BX=0\},\enspace V_2=\{X\mid ABX=0\}$,则$V_1\subseteq V_2$,因为$\forall X\in V_1$,有$BX=0$,因此$ABX=A0=0$,即$X\in V_2$,因此$V_1\subseteq V_2$. 利用``设小扩大''的思想,取$V_1$的一组基$\alpha_1,\ldots,\alpha_r$,则可以扩充为$V_2$的一组基,记为$\alpha_1,\ldots,\alpha_r,\alpha_{r+1},\ldots,\alpha_m$,则$r=n-r(B)$,$s=n-r(AB)$,于是 + \begin{align*} + V & =\{BX\mid ABX=0\} \\ + & =\spa(B\alpha_1,\ldots,B\alpha_r,B\alpha_{r+1},\ldots,B\alpha_m) \\ + & =\spa(B\alpha_{r+1},\ldots,B\alpha_m). + \end{align*} + 下面证明$B\alpha_{r+1},\ldots,B\alpha_m$线性无关. 为此,设 + \[c_{r+1}B\alpha_{r+1}+\cdots+c_mB\alpha_m=0,\] + 则 + \[B(c_{r+1}\alpha_{r+1}+\cdots+c_m\alpha_m)=0,\] + 因此$c_{r+1}\alpha_{r+1}+\cdots+c_m\alpha_m\in V_1$,因此存在$c_1,\ldots,c_r$使得 + \[c_{r+1}\alpha_{r+1}+\cdots+c_m\alpha_n=c_1\alpha_1+\cdots+c_r\alpha_r,\] + 即 + \[c_{r+1}\alpha_{r+1}+\cdots+c_m\alpha_m-c_1\alpha_1-\cdots-c_r\alpha_r=0.\] + 由于$\alpha_1,\ldots,\alpha_m$线性无关,因此 + \[c_{r+1}=\cdots=c_m=c_1=c_2=\cdots=c_r=0,\] + 因此$B\alpha_{r+1},\ldots,B\alpha_m$线性无关,因此$V$的维数为$s-r=(n-r(AB))-(n-r(B))=r(B)-r(AB)$,得证. +\end{proof} + \section{线性方程组拓展题型} 本节我们将介绍与线性方程组有关的一些题型,可能与高中数学讨论``题型''的学习风格有些类似. 需要注意的是,除了含参问题外,其余问题我们都将分别从齐次和非齐次两个方面进行讨论,给出问题的一般解法. 但实际上这里给出的解法并非能直接套用到所有的题目中,在习题中我们会遇到更多特别的题目. 因此更重要的应当是理解解题思路,而不是死记硬背解题方法. @@ -237,7 +271,7 @@ \subsection{含参数的线性方程组问题} 此类问题一般考察对于含参数的线性方程组,参数取值如何时有解/无解/有唯一解等. 本质而言,\nameref{thm:有解条件}完全可以解决这一问题. -事实上,利用\autoref{thm:方程组解} 在有解情况下只需计算行列式判断非常方便,但判断无解需要利用\nameref{thm:有解条件},其中线性相关性的判断通常仍然需要我们对系数矩阵进行高斯消元法. 我们来看一个简单的例子: +事实上,利用\autoref{thm:方程组解} 在有解情况下只需计算行列式判断非常方便,但判断无解需要利用\nameref{thm:有解条件},其中线性相关性的判断通常仍然需要我们对系数矩阵进行高斯-若当消元法. 我们来看一个简单的例子: \begin{example}{}{} 当$k$取何值时,方程组: \[\begin{cases} @@ -246,7 +280,7 @@ \subsection{含参数的线性方程组问题} 有唯一解、无解、有无穷多解?在有解的情况下,求出方程组的全部解. \end{example} \begin{solution} - 对于有无解的区别,我们一般都考虑直接使用高斯消元法. 由高斯消元法有(省略中间步骤直接得到阶梯矩阵): + 对于有无解的区别,我们一般都考虑直接使用高斯-若当消元法. 由高斯-若当消元法有(省略中间步骤直接得到阶梯矩阵): \[\begin{pmatrix} 1 & 1 & k & 4 \\ -1 & k & 1 & k^2 \\ @@ -937,6 +971,18 @@ \subsection{线性方程组反问题} 由$r(A)=m$可知,$A$的$m$个行向量($A^\mathrm{T}$的$m$个列向量)线性无关,它们是方程组$CX=0$的一个基础解系. 由$CA^\mathrm{T}=O$和$n-r(C)=m$,得$r(C)=n-m$. 因此,由$CA^\mathrm{T}B^\mathrm{T}=C(BA^\mathrm{T})=O$,可知$(BA)^\mathrm{T}$的$m$个行向量线性无关,它们也是$CX=0$的一个基础解系. \end{answer} + \item 设$A$是数域$\mathbf{F}$上的一个$n$阶可逆方阵,$A$的前$r$个行向量组成的矩阵为$B$,后$n-r$个行向量组成的矩阵为$C$,$n$元线性方程组$BX=0$与$CX=0$的解空间分别为$V_1,V_2$. 证明:$\mathbf{F}^n=V_1\oplus V_2$. + \begin{answer} + 先记$W=V_1+V_2$,若$\alpha\in V_1\cap V_2$,则$B\alpha=C\alpha=0$,所以 + \[A\alpha=\begin{pmatrix} + B \\ + C + \end{pmatrix}\alpha=0,\] + 由于$A$可逆,因此$\alpha=0$,即$V_1\cap V_2=\{0\}$,因此$V_1+V_2$是直和,因此只需证$W=\mathbf{F}^n$即可. 事实上,我们知道$r(B)=r,r(C)=n-r$,因此$\dim V_1=n-r,\enspace \dim V_2=n-(n-r)=r$,所以 + \[\dim W=\dim V_1+\dim V_2=n-r+r=n=\dim \mathbf{F}^n,\] + 又$W=V_1\oplus V_2\subseteq \mathbf{F}^n$,因此$W=\mathbf{F}^n$,故得证. + \end{answer} + \item 设$A$是$n$阶矩阵,且$A_{11}\neq 0$,证明:方程组$AX=\vec{b}$($\vec{b}$为非零向量)有无穷多解的充要条件为$A^*\vec{b}=\vec{0}$. \begin{answer} 必要性:设$AX=b$有无穷多解,则$r(A)=latex, every path/.style={thick}, ->-/.style={ + decoration={markings, mark=at position .4 with {\arrow{>}}}, postaction={decorate} + }} + \draw[->] (0, 0) -- (0, 2) node[above] {$y$}; + \draw[->] (0, 0) -- (2, 0) node[right] {$x$}; + \draw (0,0) coordinate (O) + (0.5, 1.5) coordinate (A) + (1.5,0.5) coordinate (B); + \draw node[above] at (A) {$A$} + node[below left] at (A) {$\boldsymbol{\alpha}$} + node[below] at (B) {$B$}; + \draw[->] (O) -- (A); + \draw[->] (O) -- (B) + node[pos=.5, below] {$\boldsymbol{\alpha}'$}; + \draw[->] (A) -- (B) + node[pos=.35, above=3pt] {$C$}; + \draw[->-] (O) -- (1.6, 1.6) + node[pos=.4, below right] {$\boldsymbol{\omega}$} + node[below right] {$L$}; + \draw node[below left] at (O) {$O$}; + \end{tikzpicture} + \end{center} +\end{example} + +\begin{proof} + 事实上,设直线 $L$ 的某个方向的单位向量为$\omega$,则$\vec{OC}=(\alpha,\omega)\omega$,其中$(\alpha,\omega)$为向量$\alpha$和$\omega$的内积,对于刚接触内积的读者来说,这可能并不是这么显然,但是稍加思考,我们发现这是很自然的,因为$\vec{OC}$是$\vec{OA}$在$\omega$方向上的投影,而求一个向量在另一个向量上的投影,我们高中时已经见了无数遍了,不妨设$\vec{OA}$与$\omega$的夹角为$\theta$,则$\vec{OC}=\vert\alpha \vert cos\theta\omega$,又 + \[ + \vert\alpha \vert\cos\theta=\vert\alpha \vert\dfrac{\alpha\cdot\omega}{\vert \alpha\vert\cdot\vert\omega\vert}=\dfrac{(\alpha,\omega)}{\vert\omega\vert}. + \] + 代入单位向量模为$1$即可,不过是把我们高中的知识稍加变形罢了. 于是我们有 + + \[ + \varphi(\alpha)=\alpha'=\vec{OB}=\vec{OA}+2\vec{AC}= \alpha + 2(\vec{OC}-\alpha)=-\alpha+2(\alpha,\omega)\omega. + \] + + 接下来验证 $\varphi$ 是 $\mathbf{R}^2$ 上的一个线性变换也很简单,我们留给读者自行验证. + + 不过还有一个值得一提的地方\\ + 如果设 $\alpha = (x,y),\omega =(\cos \theta,\sin \theta)$,则 + \begin{align*} + \varphi(x,y)&=(-x,-y)+2(x\cos\theta+y\sin\theta)(\cos \theta,\sin \theta)\\ + &=(-x + 2x \cos^2 \theta + 2y \sin \theta \cos \theta, -y + 2x \sin \theta \cos \theta + 2y^2 \sin^2 \theta)\\ + &=(x \cos 2\theta + y \sin 2\theta, x \sin 2\theta - y \cos 2\theta). + \end{align*} + 不难发现,这与旋转变换实质上是同一个东西,镜面变换不过是旋转了2倍的夹角罢了. +\end{proof} + \begin{summary} \end{summary} diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/23 \347\272\277\346\200\247\344\273\243\346\225\260\344\270\216\345\207\240\344\275\225.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/22 \347\272\277\346\200\247\344\273\243\346\225\260\344\270\216\345\207\240\344\275\225.tex" similarity index 100% rename from "\350\256\262\344\271\211/\344\270\223\351\242\230/23 \347\272\277\346\200\247\344\273\243\346\225\260\344\270\216\345\207\240\344\275\225.tex" rename to "\350\256\262\344\271\211/\344\270\223\351\242\230/22 \347\272\277\346\200\247\344\273\243\346\225\260\344\270\216\345\207\240\344\275\225.tex" diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/24 \344\272\214\346\254\241\345\236\213.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/23 \344\272\214\346\254\241\345\236\213.tex" similarity index 100% rename from "\350\256\262\344\271\211/\344\270\223\351\242\230/24 \344\272\214\346\254\241\345\236\213.tex" rename to "\350\256\262\344\271\211/\344\270\223\351\242\230/23 \344\272\214\346\254\241\345\236\213.tex" diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/11 \345\244\232\351\207\215\347\272\277\346\200\247\346\230\240\345\260\204\344\270\216\345\274\240\351\207\217\347\232\204\350\256\241\347\256\227.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/24 \345\244\232\351\207\215\347\272\277\346\200\247\346\230\240\345\260\204\344\270\216\345\274\240\351\207\217\347\232\204\350\256\241\347\256\227.tex" similarity index 100% rename from "\350\256\262\344\271\211/\344\270\223\351\242\230/11 \345\244\232\351\207\215\347\272\277\346\200\247\346\230\240\345\260\204\344\270\216\345\274\240\351\207\217\347\232\204\350\256\241\347\256\227.tex" rename to "\350\256\262\344\271\211/\344\270\223\351\242\230/24 \345\244\232\351\207\215\347\272\277\346\200\247\346\230\240\345\260\204\344\270\216\345\274\240\351\207\217\347\232\204\350\256\241\347\256\227.tex" diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/3 \346\234\211\351\231\220\347\273\264\347\272\277\346\200\247\347\251\272\351\227\264.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/3 \346\234\211\351\231\220\347\273\264\347\272\277\346\200\247\347\251\272\351\227\264.tex" index 1d5d4ed..4fb2f26 100644 --- "a/\350\256\262\344\271\211/\344\270\223\351\242\230/3 \346\234\211\351\231\220\347\273\264\347\272\277\346\200\247\347\251\272\351\227\264.tex" +++ "b/\350\256\262\344\271\211/\344\270\223\351\242\230/3 \346\234\211\351\231\220\347\273\264\347\272\277\346\200\247\347\251\272\351\227\264.tex" @@ -428,6 +428,38 @@ \subsection{基与维数} 对于线性空间$\mathbf{C}(\mathbf{C})$中的任一向量 $a + b\i$,其总可以被向量 $\alpha = 1$表示,数乘系数为 $\lambda = a + b\i$,所以$\mathbf{C}(\mathbf{C})$维数为1;对于线性空间$\mathbf{C}(\mathbf{R})$,向量组 $\alpha = 1, \beta = \i$线性无关,且任一向量 $u = a + b\i = a·\alpha + b·\beta$,可被 $\alpha, \beta$表示,所以$\mathbf{C}(\mathbf{R})$维数为2. \end{proof} +\begin{example}{}{线性方程组的解的维数} + 设 $V_1, V_2$ 分别是 $\mathbf{R}$ 上齐次线性方程组 $x_1 = x_2 = \cdots = x_n = 0$ 和 $x_1 + x_2 + \cdots + x_n = 0$ 的解空间,求 $V_1, V_2$ 的基与维数. +\end{example} + +在\autoref{ex:常见子空间}的\ref{item:2:常见子空间:3}中我们已经知道,齐次线性方程组的所有解构成一个线性空间(即解空间),这一例子就是希望读者能够通过求解基和维数的进一步理解解空间的基本结构. + +\begin{solution} + 直接求解两个线性方程组. $V_1$ 对应的线性方程组我们只需要将连等号拆开成多个方程即可: + \[\begin{cases} + x_1 - x_2 = 0, \\ + x_2 - x_3 = 0, \\ + \cdots \\ + x_{n-1} - x_n = 0. + \end{cases}\] + 其它的方程例如 $x_1 - x_3 = 0$ 等都可以由这些方程表示出来,因此消元过程中会被直接消去,我们只需要求解上述方程组即可. 很容易看出方程组的解为 + \[(x_1,x_2,\cdots,x_n)^\mathrm{T} = k(1,1,\ldots,1)^\mathrm{T}\] + 其中 $k\in\mathbf{R}$,根据线性扩张的定义, + \[V_1 = \spa\{(1,1,\ldots,1)\}\] + 所以 $V_1$ 的一组基为 $(1,1,\ldots,1)$,$\dim V_1 = 1$. 接下来是 $V_2$,它对应的线性方程组的解可以直接写出为 + \begin{align*} + &\quad\ (x_1,x_2,\ldots,x_n)^\mathrm{T} \\ + &= k_1(-1,1,0,\ldots,0)^\mathrm{T} + k_2(-1,0,1,\ldots,0)^\mathrm{T} + \cdots + k_{n-1}(-1,0,\ldots,0,1)^\mathrm{T} + \end{align*} + 其中 $k_1,k_2,\ldots,k_{n-1}\in\mathbf{R}$,根据线性扩张的定义 + \[V_2 = \spa\{(-1,1,0,\ldots,0)^\mathrm{T},(-1,0,1,\ldots,0)^\mathrm{T},\ldots,(-1,0,\ldots,0,1)^\mathrm{T}\}\] + 并且这些向量都是线性无关的,故而我们得到 $V_2$ 的一组基为 + \[(-1,1,0,\ldots,0)^\mathrm{T},(-1,0,1,\ldots,0)^\mathrm{T},\ldots,(-1,0,\ldots,0,1)^\mathrm{T},\] + 进一步有 $\dim V_2 = n - 1$. +\end{solution} + +我们发现,上述齐次线性方程组的解空间实际上就是由基础解系作为一组基张成的线性空间,因为上述方程的基础解系是线性无关向量组. 事实上这一结论是具有一般性的,即任意齐次线性方程组的解空间都可以由基础解系作为一组基张成,这一结论我们会在\nameref{chap:朝花夕拾}一讲中给出证明. + \begin{example}{}{} 证明:$1,(x-5)^2,(x-5)^3$是$\mathbf{R}[x]_4$的子空间$U$的一组基,其中$U$定义为 \[U=\{p\in\mathbf{R}[x]_4 \mid p'(5)=0\}.\] @@ -542,7 +574,7 @@ \subsection{极大线性无关组的求法} 1 & 0 & 1 & 0 & 0 & 0 \\ 1 & 3 & 0 & 1 & 0 & 0 \\ 0 & 1 & 0 & 0 & 1 & 0 \\ - 0 & 2 & 0 & 0 & 0 & 1 + 0 & 1 & 0 & 0 & 0 & 1 \end{pmatrix} \xLongrightarrow{\text{初等行变换}} \begin{pmatrix} @@ -574,9 +606,7 @@ \section{向量的坐标} \begin{enumerate} \item \hypertarget{基底的矩阵写法}若向量$\alpha$在基$\beta_1,\beta_2,\ldots,\beta_n$下的坐标为$\alpha_B=(a_1,a_2,\ldots,a_n)$,则我们也可以写为 \[\alpha=(\beta_1, \beta_2, \ldots, \beta_n)\begin{pmatrix} a_1 \\ a_2 \\ \vdots \\ a_n \end{pmatrix}\] - 实际上我们在学习矩阵乘法后就会意识到这一记号是很自然的,因为这样的表示就等价于 - \[\alpha=a_1\beta_1+a_2\beta_2+\cdots+a_n\beta_n,\] - 但当前没有学习矩阵乘法,因此我们只能将其视为一种记号. + 这一记号与\autoref{eq:矩阵左乘列向量}中给出的规则是一致的. \item 回顾坐标的定义,事实上取向量的坐标相当于将一个$n$维线性空间$V$中的元素$\alpha$转化为$\mathbf{F}^n$中的元素$\alpha_B$. 因此我们可以将求向量坐标的过程视为一个映射$\varphi$,即从原线性空间$V(\mathbf{F})$到$\mathbf{F}^n$的坐标映射,那么我们很容易看到以下结果: \begin{enumerate} @@ -815,6 +845,11 @@ \section{向量的坐标} \end{enumerate} \end{answer} + \item 求解子空间 $V_1 = \{(a,0,b) \mid a,b \in \mathbf{R}\}$ 和 $V_2 = \{(a,2a,b) \mid a,b \in \mathbf{R}\}$ 的基和维数. + \begin{answer} + + \end{answer} + \item 证明:$B=\{1,x-a,(x-a)^2\}\enspace(a\neq 0)$是$\mathbf{R}[x]_3$的一组基,并求$\mathbf{R}[x]_3$的自然基$\{1,x,x^2\}$中每个向量关于基$B$的坐标. \begin{answer} 只需证明 $B$ 线性无关即可. $\lambda_1+\lambda_2(x_a)+\lambda_3(x-a)^2$求导,增加方程数得到 @@ -912,7 +947,8 @@ \section{向量的坐标} 只需证明 $\alpha_r$ 可以被 $\alpha_1,\ldots,\alpha_{r-1},\beta$ 表示即可. 由于 $\beta$ 是 $\alpha_1,\ldots,\alpha_{r-1}$ 的线性组合,若 $\lambda_r=0$,则 $\beta$ 是 $\alpha_1,\ldots,\alpha_{r-1}$ 的线性组合. 这与条件矛盾. 因此 $\alpha_r=-\vspace{1ex}\dfrac 1{\lambda_r}(\lambda_1\alpha_1+\cdots+\lambda_{r-1}\alpha_{r-1}-\beta)$,则这两组向量等价. $\spa(\alpha_1,\ldots,\alpha_{r-1},\alpha_r)=\spa(\alpha_1,\ldots,\alpha_{r-1},\beta)$ 得证. \end{answer} - \item 设$\mathbf{R}^+$是所有正实数组成的集合,加法和数乘定义如下: + \item \label{item:3:正实数线性空间} + 设$\mathbf{R}^+$是所有正实数组成的集合,加法和数乘定义如下: \[ \forall a,b \in \mathbf{R}_+,\enspace k\in \mathbf{R}\colon\enspace a\oplus b = ab,\enspace k\odot a = a^k \] 则 $\mathbf{R}^+$关于这一加法和数乘构成一个实线性空间. 求$\mathbf{R}^+$的一组基. \begin{answer} diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/4 \347\272\277\346\200\247\347\251\272\351\227\264\347\232\204\350\277\220\347\256\227.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/4 \347\272\277\346\200\247\347\251\272\351\227\264\347\232\204\350\277\220\347\256\227.tex" index 1d76806..3f87161 100644 --- "a/\350\256\262\344\271\211/\344\270\223\351\242\230/4 \347\272\277\346\200\247\347\251\272\351\227\264\347\232\204\350\277\220\347\256\227.tex" +++ "b/\350\256\262\344\271\211/\344\270\223\351\242\230/4 \347\272\277\346\200\247\347\251\272\351\227\264\347\232\204\350\277\220\347\256\227.tex" @@ -52,48 +52,48 @@ \section{线性空间的交、并、和} \begin{itemize} \item - 由于 $W_1, W_2$ 都是 $V$ 的子空间,零向量 $\mathbf{0} \in W_1$ 且 $\mathbf{0} \in W_2$。因此,$\mathbf{0} \in W_1 \cap W_2$。 + 由于 $W_1, W_2$ 都是 $V$ 的子空间,零向量 $\mathbf{0} \in W_1$ 且 $\mathbf{0} \in W_2$. 因此,$\mathbf{0} \in W_1 \cap W_2$. \item - 对于任意的 $x, y \in W_1 \cap W_2$,有 $x \in W_1$ 且 $x \in W_2$,$y \in W_1$ 且 $y \in W_2$。 - 由于 $W_1$ 和 $W_2$ 都是 $V$ 的子空间,所以 $x + y \in W_1$ 且 $x + y \in W_2$。 - 因此,$x + y \in W_1 \cap W_2$。 + 对于任意的 $x, y \in W_1 \cap W_2$,有 $x \in W_1$ 且 $x \in W_2$,$y \in W_1$ 且 $y \in W_2$. + 由于 $W_1$ 和 $W_2$ 都是 $V$ 的子空间,所以 $x + y \in W_1$ 且 $x + y \in W_2$. + 因此,$x + y \in W_1 \cap W_2$. \item - 对于任意的 $x \in W_1 \cap W_2$ 和任意的标量 $\lambda \in \mathbf{F}$,有 $x \in W_1$ 且 $x \in W_2$。 - 由于 $W_1$ 和 $W_2$ 都是 $V$ 的子空间,所以 $\lambda x \in W_1$ 且 $\lambda x \in W_2$。 - 因此,$\lambda x \in W_1 \cap W_2$。 + 对于任意的 $x \in W_1 \cap W_2$ 和任意的标量 $\lambda \in \mathbf{F}$,有 $x \in W_1$ 且 $x \in W_2$. + 由于 $W_1$ 和 $W_2$ 都是 $V$ 的子空间,所以 $\lambda x \in W_1$ 且 $\lambda x \in W_2$. + 因此,$\lambda x \in W_1 \cap W_2$. \end{itemize} - 所以 $W_1 \cap W_2$ 是 $V$ 的子空间。 + 所以 $W_1 \cap W_2$ 是 $V$ 的子空间. 下证$W_1 + W_2$ 是 $V$ 的子空间: \begin{itemize} \item - 由于 $W_1$ 和 $W_2$ 是 $V$ 的子空间,$\mathbf{0} \in W_1$ 且 $\mathbf{0} \in W_2$。 - 因此,$\mathbf{0} = \mathbf{0} + \mathbf{0} \in W_1 + W_2$。 + 由于 $W_1$ 和 $W_2$ 是 $V$ 的子空间,$\mathbf{0} \in W_1$ 且 $\mathbf{0} \in W_2$. + 因此,$\mathbf{0} = \mathbf{0} + \mathbf{0} \in W_1 + W_2$. \item - 对于任意的 $u_1, u_2 \in W_1 + W_2$,存在 $x_1, x_2 \in W_1$ 和 $y_1, y_2 \in W_2$,使得 $u_1 = x_1 + y_1$,$u_2 = x_2 + y_2$。 + 对于任意的 $u_1, u_2 \in W_1 + W_2$,存在 $x_1, x_2 \in W_1$ 和 $y_1, y_2 \in W_2$,使得 $u_1 = x_1 + y_1$,$u_2 = x_2 + y_2$. 则 $$ u_1 + u_2 = (x_1 + y_1) + (x_2 + y_2) = (x_1 + x_2) + (y_1 + y_2). $$ 由于 $W_1$ 和 $W_2$ 是 $V$ 的子空间,$x_1 + x_2 \in W_1$ 且 $y_1 + y_2 \in W_2$, - 因此,$u_1 + u_2 \in W_1 + W_2$。 + 因此,$u_1 + u_2 \in W_1 + W_2$. \item - 对于任意的 $u \in W_1 + W_2$ 和标量 $\lambda \in \mathbf{F}$,存在 $x \in W_1$ 和 $y \in W_2$,使得 $u = x + y$。 + 对于任意的 $u \in W_1 + W_2$ 和标量 $\lambda \in \mathbf{F}$,存在 $x \in W_1$ 和 $y \in W_2$,使得 $u = x + y$. 则 $$ \lambda u = \lambda (x + y) = \lambda x + \lambda y. $$ 由于 $W_1$ 和 $W_2$ 是 $V$ 的子空间,$\lambda x \in W_1$ 且 $\lambda y \in W_2$, - 因此,$\lambda u \in W_1 + W_2$。 + 因此,$\lambda u \in W_1 + W_2$. \end{itemize} - 因此,$W_1 + W_2$ 也是 $V$ 的子空间。 + 因此,$W_1 + W_2$ 也是 $V$ 的子空间. \end{proof} 我们只在此证明定理的前两条,第三条我们留作习题供读者练习,因为在考试中有出现过. 前两条还可以进行推广,即$V$的有限个子空间的交与和仍然是$V$的子空间. @@ -162,13 +162,26 @@ \section{线性空间的交、并、和} 我们不难发现,两个线性空间的和的求法就是将两个空间的基合并后求极大线性无关组,而交的求法则更具技巧性. 当然这里使用的是简单的向量空间的例子,如果是一般的线性空间,则可以先转化为基下的坐标然后使用上面的方法求解. +当然我们也可以将前面定义的交、并、和的概念推广到有限个子空间的情况,即 +\begin{definition}{}{} + 设 $W_1,W_2,\ldots,W_s$ 是线性空间 $V(\mathbf{F})$ 的 $s$ 个子空间,则 + \begin{align*} + W_1 \cap W_2 \cap \cdots \cap W_s & =\{\alpha \mid \alpha\in W_1 \text{~且~} \alpha\in W_2 \text{~且~} \cdots \text{~且~} \alpha\in W_s\} \\ + W_1 \cup W_2 \cup \cdots \cup W_s & =\{\alpha \mid \alpha\in W_1 \text{~或~} \alpha\in W_2 \text{~或~} \cdots \text{~或~} \alpha\in W_s\} \\ + W_1 + W_2 + \cdots + W_s & =\{\alpha_1+\alpha_2+\cdots+\alpha_s \mid \alpha_1\in W_1,\enspace\alpha_2\in W_2,\enspace\cdots,\enspace\alpha_s\in W_s\} + \end{align*} + 分别称为 $W_1,W_2,\ldots,W_s$ 的交、并、和. +\end{definition} + \section{覆盖定理} +本节我们希望探究一个经典问题,即数域上的线性空间是否可以被有限个子空间的并覆盖,下面的覆盖定理就是对这一问题的回答: + \begin{theorem}{覆盖定理}{覆盖定理} \index{fugaidingli@覆盖定理} - 设$V_1,V_2,\ldots,V_s$是线性空间$V$的$s$个非平凡子空间,证明:$V$中至少存在一个向量不属于$V_1,V_2,\ldots,V_s$中的任何一个,即$V_1 \cup V_2 \cup \cdots \cup V_s\subsetneq V$. + 设 $V_1,V_2,\ldots,V_s$ 是数域 $\mathbf{F}$ 上线性空间 $V(\mathbf{F})$ 的 $s$ 个非平凡子空间,证明:$V$ 中至少存在一个向量不属于 $V_1,V_2,\ldots,V_s$ 中的任何一个,即 $V_1 \cup V_2 \cup \cdots \cup V_s\subsetneq V$. \end{theorem} -覆盖定理表明任何一个线性空间都不能被自身有限个非平凡子空间通过并得到. 初看可能有些不够自然,但我们可以从简单的几何意义获得直观的理解:有限条直线的并不可能是一个平面. 下面我们利用数学归纳法进行证明. +覆盖定理表明任何一个数域 $\mathbf{F}$ 上的线性空间都不能被自身有限个非平凡子空间通过并得到. 初看可能有些不够自然,但我们可以从简单的几何意义获得直观的理解:有限条直线的并不可能是一个平面. 下面我们利用数学归纳法进行证明. \begin{proof} \begin{enumerate} @@ -189,11 +202,13 @@ \section{覆盖定理} \section{维数公式} +一个很自然的问题是,两个子空间的和的维数与两个子空间的维数之间是否有关系. 事实上,我们有如下重要的结果: + \begin{theorem}{线性空间维数公式}{线性空间维数公式} 设$W_1,W_2$是线性空间$V(\mathbf{F})$的两个子空间,则 \[\dim W_1+\dim W_2=\dim(W_1+W_2)+\dim(W_1\cap W_2).\] \end{theorem} -上式称为子空间的维数公式,区别于下一专题中的线性映射基本定理的维数公式. 这一定理的证明思想非常重要,因此此处我们给出证明. +上式称为子空间的维数公式,区别于下一专题中的线性映射基本定理的维数公式. 初看这一结论可能会想起中学阶段就已熟知的集合的``容斥原理'',因此记忆上的难度并不大,当然这只是形式上的类似,毕竟这里是研究子空间集合的维数之间的关联,而非集合元素个数的关联. 这一定理的证明思想非常重要,因此我们给出详细的证明. \begin{proof} 设$\dim W_1=s,\enspace \dim W_2=t,\enspace \dim(W_1\cap W_2)=r$. 设$W_1\cap W_2$的一组基为$\alpha_1,\alpha_2,\ldots,\alpha_r$,则可以扩充为$W_1$的一组基,记为$\alpha_1,\alpha_2,\ldots,\alpha_r,\beta_1,\ldots,\beta_{s-r}$;也可以扩充为$W_2$的一组基,记为$\alpha_1,\alpha_2,\ldots,\alpha_r,\gamma_1,\ldots,\gamma_{t-r}$. 则我们有 @@ -215,32 +230,7 @@ \section{维数公式} 由于$\alpha_1,\ldots,\alpha_r,\gamma_1,\ldots,\gamma_{t-r}$是$W_2$的基,因此\autoref{eq:4:维数公式证明3} 所有系数都为0,即$c_1=\cdots=c_{t-r}=d_1=\cdots=d_r=0$. 代入\autoref{eq:4:维数公式证明2} 后,由于$\alpha_1,\ldots,\alpha_r,\beta_1,\ldots,\beta_{s-r}$是$W_1$的基,因此可得$a_1=\cdots=a_r=b_1=\cdots=b_{s-r}=0$,因此,代入\autoref{eq:4:维数公式证明1} 后可知$\alpha_1,\ldots,\alpha_r,\beta_1,\ldots,\beta_{s-r},\gamma_1,\ldots,\gamma_{t-r}$必定线性无关(因为根据前述证明所有系数只能为0),故得证. \end{proof} -总结而言,这一定理证明用到的思想就是``设小扩大''. 我们设出最小空间$V_1\cap V_2$的基,然后分别扩充为$V_1$和$V_2$的基,然后观察要证明的等式和已知的联系,然后利用\autoref{eq:4:维数公式证明2} 构造等式两边属于不同空间的向量这一技巧即可. 下面是一个证明思想类似的例子,需要用到矩阵的相关知识,暂未学到的同学可以先略过本题: -\begin{example}{}{} - 已知$A,B$分别是数域$\mathbf{F}$上的$l \times k$和$k \times n$矩阵,$X$是$n \times 1$的列向量. 证明:所有满足$ABX=0$的$BX$构成一个线性空间$V$,且$\dim V = r(B) - r(AB)$. -\end{example} - -\begin{proof} - $V$是线性空间只需要说明其中元素关于加法数乘封闭即可,因为这样$V$就是$\mathbf{F}^k$的子空间. 这一证明非常基本,我们在此略过. - - 记$V_1=\{X\mid BX=0\},\enspace V_2=\{X\mid ABX=0\}$,则$V_1\subseteq V_2$,因为$\forall X\in V_1$,有$BX=0$,因此$ABX=A0=0$,即$X\in V_2$,因此$V_1\subseteq V_2$. 利用``设小扩大''的思想,取$V_1$的一组基$\alpha_1,\ldots,\alpha_r$,则可以扩充为$V_2$的一组基,记为$\alpha_1,\ldots,\alpha_r,\alpha_{r+1},\ldots,\alpha_m$,则$r=n-r(B)$,$s=n-r(AB)$,于是 - \begin{align*} - V & =\{BX\mid ABX=0\} \\ - & =\spa(B\alpha_1,\ldots,B\alpha_r,B\alpha_{r+1},\ldots,B\alpha_m) \\ - & =\spa(B\alpha_{r+1},\ldots,B\alpha_m). - \end{align*} - 下面证明$B\alpha_{r+1},\ldots,B\alpha_m$线性无关. 为此,设 - \[c_{r+1}B\alpha_{r+1}+\cdots+c_mB\alpha_m=0,\] - 则 - \[B(c_{r+1}\alpha_{r+1}+\cdots+c_m\alpha_m)=0,\] - 因此$c_{r+1}\alpha_{r+1}+\cdots+c_m\alpha_m\in V_1$,因此存在$c_1,\ldots,c_r$使得 - \[c_{r+1}\alpha_{r+1}+\cdots+c_m\alpha_n=c_1\alpha_1+\cdots+c_r\alpha_r,\] - 即 - \[c_{r+1}\alpha_{r+1}+\cdots+c_m\alpha_m-c_1\alpha_1-\cdots-c_r\alpha_r=0.\] - 由于$\alpha_1,\ldots,\alpha_m$线性无关,因此 - \[c_{r+1}=\cdots=c_m=c_1=c_2=\cdots=c_r=0,\] - 因此$B\alpha_{r+1},\ldots,B\alpha_m$线性无关,因此$V$的维数为$s-r=(n-r(AB))-(n-r(B))=r(B)-r(AB)$,得证. -\end{proof} +总结而言,这一定理证明用到的思想就是``设小扩大''. 我们设出最小空间$V_1\cap V_2$的基,然后分别扩充为$V_1$和$V_2$的基,然后观察要证明的等式和已知的联系,然后利用\autoref{eq:4:维数公式证明2} 构造等式两边属于不同空间的向量这一技巧即可. 这一``设小扩大''的技巧我们之后还会很多见,例如\autoref{thm:线性映射基本定理}以及\autoref{ex:维数公式技巧例题}. \section{线性空间的直和} @@ -255,7 +245,7 @@ \section{线性空间的直和} \begin{theorem}{}{直和等价命题} 对于子空间$W_1,W_2$,下列命题等价: \begin{enumerate} - \item $W_1+W_2$是直和,即$W_1 \cap W_2=\{0\}$; + \item $W_1+W_2$是直和,即$W_1 \cap W_2=\{\vec{0}\}$; \item $W_1+W_2$中的每个向量$\alpha$的分解式$\alpha=\alpha_1+\alpha_2\enspace(\alpha_1\in W_1,\enspace\alpha_2\in W_2)$唯一; @@ -268,66 +258,60 @@ \section{线性空间的直和} 定理的证明是基本的. \begin{proof} 上述命题等价,只需证明 (1) $\implies$ (2) $\implies$ (3) $\implies$ (4) $\implies$ (1). - - 先证 (1) $\implies$ (2): 设 $W_1 + W_2$ 中的 $\alpha$ 有两个分解式 - $$ - \alpha = \alpha_1 + \alpha_2 = \beta_1 + \beta_2, \quad \alpha_1, \beta_1 \in W_1, \ \alpha_2, \beta_2 \in W_2, - $$ - 则 $\alpha_1 - \beta_1 = \beta_2 - \alpha_2 \in W_1 \cap W_2 = \{\mathbf{0}\}$,于是得 $\beta_1 = \alpha_1, \beta_2 = \alpha_2$,故 $\alpha$ 的分解式是唯一的。 - - 其次证 (2) $\implies$ (3): 由 $W_1 + W_2$ 中零向量的分解式唯一性以及 $0 = 0 + 0$,立即得命题 (3) 成立. - - 再证 (3) $\implies$ (4): 由命题 (3) 可推出 $W_1 \cap W_2 = \{\mathbf{0}\}$,因为若 $W_1 \cap W_2 \ne \{\mathbf{0}\}$,则存在 $0 \ne a \in W_1 \cap W_2$,使得 $0 = \alpha + (-\alpha)$,(其中 $\alpha \in W_1, -\alpha \in W_2$),这与命题 (3) 相矛盾。再根据维数公式 就得命题 (4)。 - - 最后由命题 (4) 及维数公式 立即得命题 (1) 成立. + \begin{enumerate} + \item 先证 (1) $\implies$ (2): 设 $W_1 + W_2$ 中的 $\alpha$ 有两个分解式 + $$ + \alpha = \alpha_1 + \alpha_2 = \beta_1 + \beta_2, \quad \alpha_1, \beta_1 \in W_1, \ \alpha_2, \beta_2 \in W_2, + $$ + 则 $\alpha_1 - \beta_1 = \beta_2 - \alpha_2 \in W_1 \cap W_2 = \{\mathbf{0}\}$,于是得 $\beta_1 = \alpha_1, \beta_2 = \alpha_2$,故 $\alpha$ 的分解式是唯一的. + \item 其次证 (2) $\implies$ (3): 由 $W_1 + W_2$ 中零向量的分解式唯一性以及 $\vec{0} = \vec{0} + \vec{0}$,立即得命题 (3) 成立. + \item 再证 (3) $\implies$ (4): 由命题 (3) 可推出 $W_1 \cap W_2 = \{\mathbf{0}\}$,因为若 $W_1 \cap W_2 \ne \{\mathbf{0}\}$,则存在 $\vec{0} \ne a \in W_1 \cap W_2$,使得 $\vec{0} = \alpha + (-\alpha)$,(其中 $\alpha \in W_1, -\alpha \in W_2$),这与命题 (3) 相矛盾. 再根据维数公式 就得命题 (4). + \item 最后由命题 (4) 及维数公式 立即得命题 (1) 成立. + \end{enumerate} \end{proof} 在实际运用中我们要非常熟悉这些等价条件,因为都可能使用到. -我们也可以定义有限个子空间的直和,即$V=W_1\oplus W_2\oplus\cdots\oplus W_n \iff W_i \cap \sum\limits_{j \neq i}W_j=\{0\}$,即每个子空间与其余子空间的和的交都是$\{0\}$. 等价命题也是上述定理的推广,例如唯一分解、$\vec{0}$的分解以及维数公式推广,此处不再赘述. 除此之外,我们还有一个与多空间直和相关的定理: +我们也可以定义有限个子空间的直和,即$V=W_1\oplus W_2\oplus\cdots\oplus W_n \iff W_i \cap \sum\limits_{j \neq i}W_j=\{\vec{0}\}$,即每个子空间与其余子空间的和的交都是$\{\vec{0}\}$. 等价命题也是上述定理的推广,例如唯一分解、$\vec{0}$的分解以及维数公式推广,此处不再赘述. 除此之外,我们还有一个与多空间直和相关的定理: \begin{theorem}{}{多空间直和} 若$V=V_1\oplus V_2,\enspace V_1=V_{11}\oplus\cdots\oplus V_{1s},\enspace V_2=V_{21}\oplus\cdots\oplus V_{2t}$,则 \[V=V_{11}\oplus\cdots\oplus V_{1s}\oplus V_{21}\oplus\cdots\oplus V_{2t}\] \end{theorem} -这一定理的证明是很简单的,实际上利用零向量分解唯一即可. 进一步地,我们可以定义无穷个子空间的直和,推广\autoref{thm:直和等价命题}的 $2$,无穷个子空间的直和结果中的元素也可以表达为每个子空间的元素之和,但我们需要额外要求和式中只有有限项非零. 直观地,这其实是为了保证和式的收敛性. +这一定理的证明是很简单的,实际上利用零向量分解唯一即可,这里不再赘述. 进一步地,我们可以定义无穷个子空间的直和,推广\autoref{thm:直和等价命题}的 $2$,无穷个子空间的直和结果中的元素也可以表达为每个子空间的元素之和,但我们需要额外要求和式中只有有限项非零. 直观地,这其实是为了保证和式的收敛性. -在习题中我们证明直和一般有两种思路,一种是先证和,再证直和,我们来看一个例子(没有学到矩阵的可以先略过): +在习题中我们证明直和一般有两种思路,一种是先证和,再证直和,我们来看一个例子: \begin{example}{}{} - 数域$\mathbf{F}$上所有$n$阶方阵组成的线性空间$V=\mathbf{M}_n(\mathbf{F})$,$V_1$表示所有对称矩阵组成的集合,$V_2$表示所有反对称矩阵组成的集合. 证明:$V_1,V_2$都是$V$的子空间,且$V=V_1\oplus V_2$. + 考虑 $\mathbf{R}$上(即定义在实数域上)的所有实值函数(即取值于实数域)构成的集合 $\mathbf{R}^\mathbf{R} = \{f \mid f: \mathbf{R} \to \mathbf{R}\}$. 函数 $f: \mathbf{R} \to \mathbf{R}$ 被称为偶函数,若 $f(-x) = f(x)$ 对所有 $x \in \mathbf{R}$ 成立;函数 $f: \mathbf{R} \to \mathbf{R}$ 被称为奇函数,若 $f(-x) = -f(x)$ 对所有 $x \in \mathbf{R}$ 成立. 令 $V_e$ 代表 $\mathbf{R}$ 上的实值(函数取值于实数域)偶函数构成的集合,$V_o$ 代表 $\mathbf{R}$ 上的实值奇函数构成的集合,证明:$\mathbf{R}^\mathbf{R} = V_e \oplus V_o$. \end{example} \begin{proof} - 首先证明和. 事实上,对于任意矩阵$A\in V$,有 - \[A=B+C,\enspace B=\frac{1}{2}(A+A^T),\enspace C=\frac{1}{2}(A-A^T),\] - 其中$B$是对称矩阵,$C$是反对称矩阵,即$B\in V_1$,$C\in V_2$,因此$V_1+V_2=V$(因为$V$中任意元素都可以写成$V_1$和$V_2$元素和的形式,根据和的定义可知成立). - - 下面证明直和. 我们有如下三种方法: \begin{enumerate} - \item 利用零向量分解唯一:设$O$是$n$阶零矩阵,设$O=B+C$,其中$B$是对称矩阵,$C$是反对称矩阵. 由于$B$是对称矩阵,因此$B^T=B$,由于$C$是反对称矩阵,因此$C^T=-C$,因此 - \[O=O^T=(B+C)^T=B^T+C^T=B-C\] - 解得$B=C=O$,因此零向量分解唯一,故直和得证; - - \item 利用$V_1\cap V_2=\{0\}$:设$A\in V_1\cap V_2$,则$A=A^T=-A$,因此$A=-A$,即$A=O$,因此$V_1\cap V_2=\{0\}$,故直和得证; + \item 首先我们证明 $\mathbf{R}^\mathbf{R} = V_e + V_o$,因为 $V_e + V_o \subseteq \mathbf{R}^\mathbf{R}$ 是显然的,所以只需证明 $\mathbf{R}^\mathbf{R} \subseteq V_e + V_o$ 即可,即证明任意实值函数 $f: \mathbf{R} \to \mathbf{R}$ 都可以表示为一个偶函数与一个奇函数之和. 令 $f: \mathbf{R} \to \mathbf{R}$ 为任意实值函数,定义 + \[ f_e(x) = \frac{f(x) + f(-x)}{2}, \quad f_o(x) = \frac{f(x) - f(-x)}{2}, \] + 根据定义不难验证 $f_e(x)$ 为偶函数,$f_o(x)$ 为奇函数,且 $f(x) = f_e(x) + f_o(x)$ 对任意 $x \in \mathbf{R}$ 成立,故任意实值函数 $f$ 都可以表示为一个偶函数与一个奇函数之和,故 $\mathbf{R}^\mathbf{R} = V_e + V_o$ 成立. + \item 再证明和为直和,我们有很多种证明方式,对应于直和等价条件的前三条,最后一条因为 $\mathbf{R}^\mathbf{R}$ 显然是无限维空间,因此不能使用. - \item 利用$\dim V_1+\dim V_2=\dim V$:这一方法较为复杂,我们简单阐述思想. 设$E_{ij}$是第$i$行第$j$列元素为1,其余元素为0的矩阵,则$V$的一组基为$E_{ij},\enspace i,j=1,2,\ldots,n$,$V_1$的一组基为$E_{ij}+E_{ji},\enspace i 2)$ 是线性空间$V$的$m$个非平凡子空间,证明:$V$ 中存在一个同时不属于任何一个$V_i(1 \leqslant i \leqslant m)$的向量.并在$\mathbf{R}^3$ 中举一例. \begin{answer}\label{eg:4:A:5} - \textbf{证:} (归纳法)当 $r=2$ 时由上题知成立. - 假设 $r = k-1$ 时也成立, 即存在 $\alpha \in V$ - 使得 $\alpha$ 同时不属于 $V_i (i=1,2,\ldots,k-1)$ + \textbf{证:} (归纳法)当 $r=2$ 时由上题知成立. + 假设 $r = k-1$ 时也成立, 即存在 $\alpha \in V$ + 使得 $\alpha$ 同时不属于 $V_i (i=1,2,\ldots,k-1)$ 下面证明 $r=k$ 时也成立. 显然当此 $\alpha \notin V_k$ 则 $\alpha$ 即为所求. 若 $\alpha \in V_k$, 由于 $V_k$ 是 $V$ 的真子空间, 故有 $\beta \notin V_k$, 易知对任意 $V_i (i=1,2,\ldots,k-1)$ 都至多有一个 $k_i$, 使得 $\beta + k_i \alpha \notin V_i; i=1,2,\ldots,k-1$, 我们取异于 $k_i$ 的数 $k$, 则必有 $\beta + k \alpha \notin V_i; i=1,2,\ldots,k-1$. 又由于 $\alpha \in V_k, \beta \notin V_k$ 故有 $\beta + k \alpha \notin V_k$, 故 $\beta + k \alpha \notin V_k (i = 1,2,\dots,k)$. - \end{answer} + \end{answer} \end{exgroup} \begin{exgroup} @@ -661,10 +647,10 @@ \subsection{仿射子集与商空间} 0 & 0 & 0 & 0 \end{pmatrix}\] 则解向量$u_1=\left(\dfrac {3}{17},\dfrac{19}{17},1,0\right)^T,u_2=\left(\dfrac{13}{17},-\dfrac{20}{17},0,1\right)^T$. $u_1,u_2$是$V_1\cap V_2$的基,则其维数为2. - + \item 易得$\dim V_1=2,\dim V_2=2$,则由维数公式$\dim (V_1+V_2)=\dim V_1+\dim V_2-\dim (V_1\cap V_2)= 2$又$V_1\cap V_2\subseteq V_1+V_2$,且二者维数相等. 则$V_1\cap V_2=V_1+V_2$,亦即$V_1=V_2$. 所以$V_1+V_2$的基也是$u_1,u_2$,同$V_1\cap V_2$. \end{enumerate} - \end{answer} + \end{answer} \item 设$W_1,W_2$是线性空间$V(\mathbf{F})$的两个子空间. 证明以下命题等价: \begin{enumerate} \item $W_1 \cup W_2$为$V$ 的子空间; @@ -682,36 +668,14 @@ \subsection{仿射子集与商空间} (2) (3) 的等价性留待读者自行验证,与证明 (1) (2) 等价是基本一致的. \end{answer} - \item 设\[W_1=\left\{\begin{pmatrix} - x & -x \\ y & z - \end{pmatrix} \;\middle|\; x,y,z\in \mathbf{F} \right\},W_2=\left\{\begin{pmatrix} - a & b \\ -a & c - \end{pmatrix} \;\middle|\; a,b,c\in \mathbf{F} \right\}.\] - - \begin{enumerate} - \item 证明:$W_1,W_2$是$\mathbf{M}_2(\mathbf{F})$的子空间,并求$\dim W_1,\dim W_2,\dim(W_1+W_2),\dim(W_1\cap W_2)$; - - \item 求$W_1\cap W_2$的一组基,并求$A=\begin{pmatrix} - 3 & -3 \\ -3 & 1 - \end{pmatrix}$关于这组基的坐标. - \end{enumerate} - + \item 证明:每个 $n$ 维空间均可以表示为 $n$ 个一维子空间的直和. \begin{answer} + 我们很自然地想到,可以任取 $n$ 维空间 $V$ 的一组基 $\alpha_1,\alpha_2,\ldots,\alpha_n$,然后取 $V_i = \spa(\alpha_i)$. 如果 $V = V_1 \oplus V_2 \oplus \cdots \oplus V_n$,我们就成功地为每个 $n$ 维空间找到了写成 $n$ 个一维子空间直和的分解形式. 下面我们来证明这一构造的正确性: \begin{enumerate} - \item 只需证明 $W_1$ 封闭即可. 对于 $A=\begin{pmatrix}x & -x \\ y & z\end{pmatrix},A'=\begin{pmatrix} x' & -x' \\ y' & z' \end{pmatrix}$ 有 $\lambda A+\mu A'=\begin{pmatrix} - \lambda x+\mu x' & -(\lambda x+\mu x') \\ - \lambda y+\mu y & \lambda z+\mu z - \end{pmatrix}$,则$W_1$封闭,$W_1$是$\mathbf{M}_2(\mathbf{F})$的子空间. $W_2$同理可证. - - \item $W_1$的基:$B_1=\begin{pmatrix}1&-1\\0&0\end{pmatrix},B_2=\begin{pmatrix}0&0\\1&0\end{pmatrix},B_3=\begin{pmatrix}0&0\\0&1\end{pmatrix}$. - - $W_2$的基:$B_1=\begin{pmatrix}1&0\\-1&0\end{pmatrix},B_2=\begin{pmatrix}0&1\\0&0\end{pmatrix},B_3=\begin{pmatrix}0&0\\0&1\end{pmatrix}$. - - 则$\dim W_1=3,\dim W_2=3$. 要求$\dim (W_1+W_2)$,只需求$B_1,B_2,\ldots ,B_6$的极大无关组即可. 可知 $B_1,B_2,B_3,B_4$是极大线性无关组. $\dim(W_1+W_2)=4$. 根据维数公式$\dim (W_1\cap W_2)=\dim W_1+\dim W_2-\dim (W_1+W_2)=2$. - - \item $W_1\cap W_2=\left\{\begin{pmatrix}x&-x\\-x&y\end{pmatrix} \mid x,y\in \mathbf{F}\right\}$. 则一组基为$E_1=\begin{pmatrix}1&-1\\-1&0\end{pmatrix},E_2=\begin{pmatrix}0&0\\0&1\end{pmatrix}$. $A$ 的坐标即为 $(3,1)$. - \end{enumerate} - \end{answer} + \item + \item + \end{enumerate} + \end{answer} \item 设$V$是域$\mathbf{F}$上的$n$维线性空间,$\alpha_1,\alpha_2,\ldots,\alpha_n$是$V$的一组基,且 \begin{gather*} @@ -728,9 +692,9 @@ \subsection{仿射子集与商空间} \begin{answer} \begin{enumerate} \item 显然$V_2\subseteq V$,只需证明$V_2$封闭即可. 对于$v=k_1\alpha_1+\cdots+k_n\alpha_n,v'=k_1'\alpha_1+\cdots+k_n'\alpha_n$. $\lambda v+\mu v'=(\lambda k_1+\mu k_1')\alpha_1+\cdots+(\lambda k_n+\mu k'_n)\alpha_n$,因此 $\lambda v+\mu v'\in V_2\in V_2$,$V_2$ 封闭,则$V_2$是$V$的子空间. - + \item 设$W=V_1+V_2$. 对任意 $v\in V_1,v=\lambda \alpha_1+2\lambda\alpha_2+\cdots+n\lambda\alpha_n$,则 $\lambda+2\dfrac{\lambda}2+\allowbreak\cdots+n\dfrac{\lambda}n=n\lambda$,因此当$v\ne 0$时,$v\not\in v_2$,则 $V_1\cap V_2=\{0\}$,有$W=V_1\oplus V_2$. - + 下证$W=V$,易得$\dim V_1=1$. 对于$V_2$,写成坐标形式,则其是一个方程组的解空间,系数矩阵 $A=\begin{pmatrix} 1 & \frac 12 & \cdots & \frac 1n \\ 0 & & & \\ @@ -741,83 +705,25 @@ \subsection{仿射子集与商空间} \end{enumerate} \end{answer} - \item 设$\mathbf{F}$为数域,$V_1=\{A\in\mathbf{F}^{n\times n} \mid A^\mathrm{T}=A\},\enspace - V_2=\{A\in\mathbf{F}^{n\times n} \mid A^\mathrm{T}=-A\},\enspace V_3=\{A\in\mathbf{F}^{n\times n} \mid A\text{~为上三角矩阵}\}$. + \item 完成以下三个问题: \begin{enumerate} - \item 证明:$V_1,V_2,V_3$都是$\mathbf{F}^{n\times n}$的子空间; - - \item 证明:$\mathbf{F}^{n\times n}=V_1+V_3$但不为直和,$\mathbf{F}^{n\times n}=V_2\oplus V_3$. + \item 设 $U = \{(x,x,y,y) \mid x,y\in \mathbf{F}\}$,求 $\mathbf{F}^4$ 的一个子空间 $W$,使得 $\mathbf{F}^4 = U \oplus W$. + \item 设 $U = \{(x,y,x+y,x-y,2x) \mid x,y\in \mathbf{F}\}$,求 $\mathbf{F}^5$ 的一个子空间 $W$,使得 $\mathbf{F}^5 = U \oplus W$. + \item 设 $U = \{(x,y,x+y,x-y,2x) \mid x,y\in \mathbf{F}\}$,求 $\mathbf{F}^5$ 的三个都不为 $\{\vec{0}\}$ 的子空间 $W_1,W_2,W_3$,使得 $\mathbf{F}^5 = U \oplus W_1 \oplus W_2 \oplus W_3$. \end{enumerate} + \begin{answer} - \begin{answer} - \begin{enumerate} - \item 只需证明 $V_1,V_2,V_3$ 的封闭性,以 $V_3$ 为例,$\forall A,B\in V_3$,有 $A=\begin{pmatrix} - a_{11} & \cdots & a_{1n} \\ - 0 & \cdots & 0 \\ - \vdots & & \vdots \\ - 0 & \cdots & a_{nn} - \end{pmatrix},B=\begin{pmatrix} - b_{11} & \cdots & b_{1n} \\ - 0 & \cdots & 0 \\ - \vdots & & \vdots \\ - 0 & \cdots & b_{nn} - \end{pmatrix}$,则 $\lambda A+\mu B=\begin{pmatrix} - \lambda a_{11}+\mu b_{11} & \cdots & a\lambda a_{1n}+\mu b_{1n} \\ - \vdots & & \vdots \\ - 0 & \cdots & \lambda a_{nn}+\mu b_{nn} - \end{pmatrix}$,$V_3$ 封闭得证. 其余 $V_1,V_2$ 也同理可证.(通过之后的学习会了解$V_1$对称矩阵、$V_2$反对称矩阵的更多性质) - - \item $\forall A\in \mathbf{F}^{n\times n},A=\begin{pmatrix} - a_{11} & \cdots & a_{1n} \\ - \vdots & & \vdots \\ - a_{n1} & \cdots & a_{nn} - \end{pmatrix}$,总可将$A$写成 $\begin{pmatrix} - a_{11} & a_{21} & \cdots & a_{n1} \\ - \vdots & & & \vdots \\ - a_{n1} & \cdots & \cdots & a_{nn} - \end{pmatrix}+\begin{pmatrix} - a0 & a_{12}-a_{21} & \cdots & a_{1n}-a_{n1} \\ - \vdots & & & \vdots \\ - a_{n1} & \cdots & \cdots & a_{nn} - \end{pmatrix}$ 的形式. 又左边矩阵属于 $V_1$,右边矩阵属于 $V_3$,则$\mathbf{F}^{n \times n}=V_1+V_3$. 但对于 $I=\begin{pmatrix} - 1 & \cdots & 0 \\ - \vdots & & \vdots \\ - 0 & \cdots & 1 - \end{pmatrix} $ $,I \in V_1$且$I \in V_3$,则$V_1\cap V_3\ne\{0\}$,不是直和. 总可将$A$写成 $A_1+A_2$ 的形式,其中 - \[A_1=\begin{pmatrix} - 0 & -a_{21} & \cdots & -a_{n1} \\ - a_{21} & & & \vdots \\ - \vdots & & & \vdots \\ - a_{n1} & \cdots & a_{n(n-1)} & 0 - \end{pmatrix},A_2=\begin{pmatrix} - a_{11} & \cdots & a_{1n}+a_{n1} \\ - \vdots & & \vdots \\ - 0 & \cdots & a_{nn} - \end{pmatrix},\] - $A_1\in V_2,A_2\in V_3,\mathbf{F}^{n\times n}=V_2+V_3$. 又对于 $\forall B\in V_2\cap V_3$, $B$ 是反对称的. 并且 $B$ 是上三角的. 综合可得 $B=0$. 因此 $V_2\cap V_3=\{0\}$,$F_{n\times n}=V_2\oplus V_3$ 得证. - \end{enumerate} - \end{answer} + \end{answer} \item 已知$V_1,V_2$是有限维线性空间$V$的子空间,且$\dim(V_1+V_2)=\dim(V_1 \cap V_2)+1$. 证明:要么$V_1 \subseteq V_2$,要么$V_2 \subseteq V_1$. \begin{answer} \begin{enumerate} \item 法一:反证法. 如果$\exists v_1\in V_1,v_1\not\in V_2$,且 $\exists v_2\in V_2,v_2\not\in V_1$,则有 $v_1,v_2\not \in V_1\cap V_2$ 并且 $v_1,v_2$ 线性无关. 设 $A=\{\alpha_1,\ldots ,\alpha_n\}$是 $V_1\cap V_2$的基. 由基扩张,设$B=\{\alpha_1,\ldots ,\alpha_n,\alpha_{n+1},\ldots ,\alpha_{n+k}\}$是$V_1+V_2$的基. 由于$v_1,v_2$不在$V_1\cap V_2$中,因此$A$无法表出$v_1,v_2$. 则$\alpha_1,\ldots ,\alpha_n,v_1,v_2$ 线性无关. 又$v_1,v_2\in V_1+V_2$,则$\alpha_1,\ldots ,\alpha_n,v_1,v_2$可由$\alpha_1,\ldots ,\alpha_{n+k}$ 线性表出. 由定理 $3.3$ 得 $n+2\leqslant n+k$,即 $\dim (V_1+V_2)\ge\dim (V_1\cap V_2)+2$,这与条件矛盾. 因此,$\forall v_1\in V_1,v_1\in V_2$ 或 $\forall v_2\in V_2,v_2\in V_1$. 即 $V_1\subseteq V_2$ 或 $V_2\subseteq V_1$,得证. - - \item 法二:维数公式. $\dim V_1+\dim V_2=\dim (V_1+V_2)+\dim (V_1\cap V_2)=2\dim (V_1\cap V_2)+1$,即 $(\dim V_1-\dim (V_1\cap V_2))+ (\dim V_2-\dim (V_1\cap V_2))=1$. 于是,要么 $\dim V_1-\dim (V_1\cap V_2)=0$,要么 $\dim V_2-\dim (V_1\cap V_2)=0$,即 $V_1\subseteq V_2$ 或 $V_2\subseteq V_1$,得证. - \end{enumerate} - \end{answer} - \item 证明:和$\sum\limits_{i=1}^{s}V_i$为直和的充要条件是$V_i \cap \sum\limits_{j=1}^{i-1}V_j=\{0\},\enspace i=1,2,\ldots,s$. - \begin{answer} - \begin{enumerate} - \item 充分性:已知 $V_i\cap \displaystyle\sum_{j=1}^{i-1}V_j=\{0\}$. 设 $0=\alpha_1+\cdots+\alpha_s,\alpha_i\in V_i$,则 $\alpha_s=0,\alpha_1+\cdots+\alpha_{s-1}=0$,则$\alpha_s=0,\alpha_1+\cdots+\alpha_{s-1}=0$. 递推可得 $\alpha_s=\alpha_{s-1}=\cdots=\alpha_1=0$,因此零向量分解唯一. $\displaystyle\sum_{i=1}^sV_i$ 是直和. - - \item 必要性:$\displaystyle\sum_{i=1}^sV_i$ 是直和,则两两相交均为 $\{0\}$,则 $V_i\cap \displaystyle\sum_{j=1}^{i-1}V_j=\{0\}$. + \item 法二:维数公式. $\dim V_1+\dim V_2=\dim (V_1+V_2)+\dim (V_1\cap V_2)=2\dim (V_1\cap V_2)+1$,即 $(\dim V_1-\dim (V_1\cap V_2))+ (\dim V_2-\dim (V_1\cap V_2))=1$. 于是,要么 $\dim V_1-\dim (V_1\cap V_2)=0$,要么 $\dim V_2-\dim (V_1\cap V_2)=0$,即 $V_1\subseteq V_2$ 或 $V_2\subseteq V_1$,得证. \end{enumerate} - \end{answer} - \item 判断下列说法是否正确: \begin{enumerate} @@ -832,55 +738,54 @@ \subsection{仿射子集与商空间} \item 错误,反例:设 $V_1,V_2,V_3$ 是平面$K$上三条过原点$O$的不重合直线,则$V\subseteq K=V_1+V_2$,但$V\cap V_1=\{0\},V\cap V_2=\{0\}$,$V\ne (V\cap V_1)+(V\cap V_2)$. \end{enumerate} \end{answer} - \item 设$V$为有限维线性空间,$V_1$为其非零子空间. 证明:存在唯一的子空间$V_2$,使得$V=V_1\oplus V_2$的充要条件为$V_1=V_2$. + \item 设$V$为有限维线性空间,$V_1$为其非零子空间. 证明:存在唯一的子空间$V_2$,使得$V=V_1\oplus V_2$的充要条件为$V_1=V$. \begin{answer} - \begin{enumerate} - \item 充分性:显然,若$V_1=V_2$,则$V_1^c=V_2=\empty$ 是唯一的. - - \item 必要性:反证法,如果$V_1\ne V_2$,即$V_1\not\subseteqq V$. 设$V_1$的基是$\alpha_1,\ldots ,\alpha_m$,将其扩张为$V$的基$\alpha_1,\ldots ,\alpha_m,\alpha_{m+1},\ldots ,\alpha_n$. 则$V=V_1\oplus \spa(\alpha_{m+1},\ldots ,\alpha_n)$,$=V_1\oplus \spa(\alpha_{m+1}+\alpha_ 1,\alpha_{m+2},\ldots ,\alpha_n)$. 又$\spa(\alpha_{m+1},\ldots ,\alpha_n)\ne \spa(\alpha_{m+1}+\alpha_1,\ldots,\alpha_n)$, 矛盾,则$V_1=V$得证. - \end{enumerate} + \end{answer} + \item 设$A_1$和$A_2$均为$V$的仿射子集,证明:$A_1\cap A_2$是$V$的仿射子集或空集(可推广至任意交). \begin{answer} 设$A,B$为$V$的仿射子集,若$A,B$交于一点$v$,则令$\{0\}$为子空间,此时$A \cap B = v+\{0\} $,仍然是子空间,若至少有两点$u,v \in A \cap B$,则$ \forall u,v \in A \cap B$,我们 \begin{align*} \lambda u + (1-\lambda)v \in A \\ \lambda u + (1-\lambda)v \in B\\ - \lambda u + (1-\lambda)v \in A \cap B + \lambda u + (1-\lambda)v \in A \cap B \end{align*} 故A,B的交集是仿射子集. - 空集的情况显然不必多说。 + 空集的情况显然不必多说. \end{answer} \end{exgroup} \begin{exgroup} - \item 设$V$是域$\mathbf{F}$上的$n$阶对称矩阵关于矩阵加法和数乘运算构成的线性空间,令 - \[U=\{A\in V \mid \tr(A)=0\},\enspace W=\{\lambda E \mid \lambda\in\mathbf{F}\}.\] - \begin{enumerate} - \item 证明:$U,W$为$V$的子空间; - - \item 分别求$U,W$的一组基和维数; + \item 设$W_0,W_1,W_2,\ldots,W_s$是线性空间$V$的$s+1$个非平凡子空间,且$W_0 \subseteq W_1 \cup W_2 \cup \cdots \cup W_s$. 证明:必存在$i$使得$W_0\subseteq W_i$. + \begin{answer} + 由前 $B$ 组第 8 题的证明可知 $W_0=(W_1\cap W_2)\cup\cdots\cup(W_s\cap W_0)$. 由于$W_1\cap W_2\cdots W_s\cap W_0$都是$W_0$的子空间,根据覆盖定理,必存在$i$,使得$W_0=W_i\cap W_0$,即 $W_0\subseteq W_i$ 得证. + \end{answer} - \item 证明:$V=U\oplus W$. - \end{enumerate} + \item 受三个有限集之并集的元素数量公式的启发,你可能会这样猜测:如果 $V_1,V_2,V_3$ 是一有限维向量空间的子空间,那么有 + \begin{align*} + \dim(V_1+V_2+V_3) =\ &\dim V_1+\dim V_2+\dim V_3 \\ + &-\dim(V_1\cap V_2)-\dim(V_1\cap V_3)-\dim(V_2\cap V_3) \\ + &+\dim(V_1\cap V_2\cap V_3). + \end{align*} + 解释一下为什么这样猜测,然后证明以上公式或给出一反例. \begin{answer} - 注:$\tr$是矩阵的迹,定义为矩阵对角元素之和. - \begin{enumerate} - \item 根据定义可知$\tr$是线性的,有 $\tr(\lambda A+\mu B)=\lambda\tr(A)+\mu\tr(B)=0$,则$U$是封闭的,又$W$封闭是显然的,则 $U,W$ 是 $V$ 的子空间. - - \item 对于$W$,基为$\{E\}$,$\dim W=1$. 对于$u$,设$E_{ij}$是 $a_{ij}=1$,其余元素为0的$n$阶方阵. 则由于$u$是对称矩阵,在非对角线元素上,$u$的基包含$E_{12}+E_{21},E_{13}+E_{31},\ldots ,E_{(n-1)n}+E_{n(n-1)}$. 对于对角线元素 $a_{11}+\cdots +a_{nn}=0$. 方程解为 - \[\begin{pmatrix}a_{11}\\ \vdots\\ a_{nn} \end{pmatrix}=k_1\begin{pmatrix}1 \\ -1 \\ 0\\ \vdots \\0 \end{pmatrix}=k_2\begin{pmatrix}1 \\ 0 \\ -1\\ \vdots \\0 \end{pmatrix}+\cdots+k_{n-1}\begin{pmatrix}1 \\ 0 \\ 0\\ \vdots \\-1 \end{pmatrix}.\] - 则还有$n-1$个基$E_{11}-E_{22},E_{11}-E_{33},\ldots ,E_{11}-E_{nn}$. 故 $\dim U=\dfrac{n^2-n}2+n-2=\dfrac{n^2+n-2}2$. - - \item 设$V'=U+W$. 先证明直和,即$U\cap W=\{0\}$. 这是显然的,因为$\tr(\lambda E)=n\lambda$,仅当 $\lambda=0$ 时 $\lambda E\in U$ 即 $U\cap W=\{0\}$得证. 又$\dim U+\dim W=\dim V'=n=\dim V$,则$V=V'=U\oplus W$得证. - \end{enumerate} + \end{answer} - \item 设$W_0,W_1,W_2,\ldots,W_s$是线性空间$V$的$s+1$个非平凡子空间,且$W_0 \subseteq W_1 \cup W_2 \cup \cdots \cup W_s$. 证明:必存在$i$使得$W_0\subseteq W_i$. + \item 证明:如果 $V_1,V_2,V_3$ 是一有限维向量空间的子空间,那么 + \begin{align*} + &\dim(V_1+V_2+V_3) \\ + &= \dim V_1+\dim V_2+\dim V_3 \\ + &-\dfrac{\dim(V_1\cap V_2)+\dim(V_1\cap V_3)+\dim(V_2\cap V_3)}{3} \\ + &+\dfrac{\dim((V_1 + V_2) \cap V_3) - \dim((V_1 + V_3) \cap V_2) + \dim((V_2 + V_3) \cap V_1)}{3}. + \end{align*} + + 注:以上公式可能显得有点奇怪,因为右边看着不像一个整数. \begin{answer} - 由前 $B$ 组第 8 题的证明可知 $W_0=(W_1\cap W_2)\cup\cdots\cup(W_s\cap W_0)$. 由于$W_1\cap W_2\cdots W_s\cap W_0$都是$W_0$的子空间,根据覆盖定理,必存在$i$,使得$W_0=W_i\cap W_0$,即 $W_0\subseteq W_i$ 得证. + \end{answer} - + \item 设$v_1,\ldots,v_m\in V$. 令 \[A=\{\lambda_1v_1+\cdots+\lambda_mv_m \mid \lambda_1,\ldots,\lambda_m\in\mathbf{F}\text{~且~}\lambda_1+\cdots+\lambda_m=1\}.\] 证明: @@ -894,34 +799,34 @@ \subsection{仿射子集与商空间} \begin{answer} \begin{enumerate} \item 对于 $v=\lambda_1 v_1+\cdots+\lambda_m v_m\in A$ 和 $w=\eta_1 v_1+\cdots+\eta_m v_m\in A$, 且 $\lambda_1,\cdots,\lambda_m\in \mathbf{F}$, $\lambda_1+\cdots+\lambda_m=1$ , $\eta_1,\cdots,\eta_m\in \mathbf{F}$, $\eta_1+\cdots+\eta_m=1$. 对于任意的$\lambda\in \mathbf{F}$, 我们有 - \begin{align*} - \lambda v+(1-\lambda) w=\sum_{i=1}^m(\lambda\lambda_i+(1-\lambda)\eta_i)v_i. - \end{align*} - 注意到 + \begin{align*} + \lambda v+(1-\lambda) w=\sum_{i=1}^m(\lambda\lambda_i+(1-\lambda)\eta_i)v_i. + \end{align*} + 注意到 \[ \sum_{i=1}^m(\lambda\lambda_i+(1-\lambda)\eta_i)=\lambda\sum_{i=1}^m\lambda_i+(1-\lambda)\sum_{i=1}^n\eta_i=\lambda+(1-\lambda)=1, \] 我们有$\lambda v+(1-\lambda) w\in A$. 故 $A$ 是 $V$ 的一个仿射子集 - \item 我们使用数学归纳法来证明,对于任意 $V$ 的仿射子集 $W$ ,其包含$v_1$, $\cdots$, $v_m$$k\le m$, + \item 我们使用数学归纳法来证明,对于任意 $V$ 的仿射子集 $W$ ,其包含$v_1$, $\cdots$, $v_m$$k\le m$, 如果 $\lambda_1+\cdots+\lambda_k=1$, 我们有 \[ \sum_{j=1}^k\lambda_jv_j\in W. \] - - 当$k=1$ 和 $k=2$ 时,结论是显然的. - 假设 $k$ 时成立, - 接下来对于 $k+1$ ($k+1\leqslant m$). - 我们假设$\lambda_1+\cdots+\lambda_{k+1}=1$. + + 当$k=1$ 和 $k=2$ 时,结论是显然的. + 假设 $k$ 时成立, + 接下来对于 $k+1$ ($k+1\leqslant m$). + 我们假设$\lambda_1+\cdots+\lambda_{k+1}=1$. 若 $\lambda_{k+1}=1$, 那么\[\sum_{j=1}^{k+1}\lambda_jv_j=v_{k+1}\in W.\] 若$\lambda_{k+1}\ne 1$,那么\[ \frac{1}{1-\lambda_{k+1}}(\lambda_1+\cdots+\lambda_k)=1. \] 由归纳假设,我们有\[ \frac{1}{1-\lambda_{k+1}}(\lambda_1v_1+\cdots+\lambda_kv_k)\in W. \] 也有 \[ (1-a_{k+1})\left(\frac{1}{1-\lambda_{k+1}}(\lambda_1v_1+\cdots+\lambda_kv_k)\right)+a_{k+1}v_{k+1}\in W, \] 即 \[ \lambda_1v_1+\cdots+\lambda_{k+1}v_{k+1}\in W. \] - 故而 $\lambda_1,\cdots,\lambda_m\in \mathbf{F}$, $\lambda_1+\cdots+\lambda_m=1$, + 故而 $\lambda_1,\cdots,\lambda_m\in \mathbf{F}$, $\lambda_1+\cdots+\lambda_m=1$, \[\lambda_1 v_1+\cdots+\lambda_m v_m\in W,\]有$A\subset W$. \item 注意到$\lambda_1+\cdots+\lambda_m=1$, 我们有\[ \lambda_1 v_1+\cdots+\lambda_m v_m=v_1+\lambda_2(v_2-v_1)+\cdots+\lambda_m(v_m-v_1). \]所以 $A\subset v_1+\spa(v_2-v_1,\cdots,v_m-v_1)$. 类似的,对于任意\[v\in v_1+\spa(v_2-v_1,\cdots,v_m-v_1),\]$v$ 可以被写为 \[ v_1+\sum_{i=2}^m \lambda_i(v_i-v_1)=(1-\lambda_2-\cdots-\lambda_m)v_1+\sum_{i=2}^m \lambda_i v_i \] 对于 $\lambda_2$, $\cdots$, $\lambda_m\in \mathbf{F}$. 注意到\[ (1-\lambda_2-\cdots-\lambda_m)+\sum_{i=2}^m \lambda_i=1, \] - 可以推出 $v_1+\spa(v_2-v_1,\cdots,v_m-v_1)\subset A$. + 可以推出 $v_1+\spa(v_2-v_1,\cdots,v_m-v_1)\subset A$. 因此\[A=v_1+\spa(v_2-v_1,\cdots,v_m-v_1).\] $v=v_1,U=\spa(v_2-v_1,\cdots,v_m-v_1)$, 有 $\dim U\le m-1$ - \end{enumerate} + \end{enumerate} \end{answer} \item (加强的覆盖定理) 设 $A_1, A_2, \ldots, A_n$ 是域 $\mathbf{F}$ 上向量空间 $V$ 的仿射子集,证明 $A_1\cup A_2\cup \cdots \cup A_n$ 不能覆盖 $V$,即存在 $\alpha \in V$ 但是 $\forall 1\leqslant i\leqslant n, \alpha \notin A_n$ \end{exgroup} diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/5 \347\272\277\346\200\247\346\230\240\345\260\204.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/5 \347\272\277\346\200\247\346\230\240\345\260\204.tex" index 5c98389..cf15170 100644 --- "a/\350\256\262\344\271\211/\344\270\223\351\242\230/5 \347\272\277\346\200\247\346\230\240\345\260\204.tex" +++ "b/\350\256\262\344\271\211/\344\270\223\351\242\230/5 \347\272\277\346\200\247\346\230\240\345\260\204.tex" @@ -79,7 +79,7 @@ \subsection{线性映射举例} 相信看到这里,我们便能逐渐理解线性性在数学中的基础地位. 很多时候一些初看有些抽象的概念,当我们将其与学过的知识联系时,便会真切地体会到一种相通的美感. 事实上很多时候学习过程就是如此,当我们知识储量不断上升的时候,我们会不断发现很多宝贵的思想跨越学科,凝聚着人类智慧的结晶,这种感觉是非常美妙的. 更重要的是,一旦我们知道它们是线性映射之后,我们便可以用之后我们将要讨论的所有线性映射相关的性质来研究它们,这便是一个抽象的概念给我们带来的力量. -接下来希望读者阅读以下例子,其中第1题是为了让读者熟悉线性映射定义的验证,这在考试中也是常见的. 第2题中旋转变换在之后有很多的应用场景,其几何意义能帮助我们理解很多内容. 第3题的镜面变换在内积空间中会详细介绍,第4题的投影变换将在幂等矩阵中我们会再次提及. +接下来希望读者阅读以下例子,其中第1题是为了让读者熟悉线性映射定义的验证,这在考试中也是常见的. 第2题中旋转变换在之后有很多的应用场景,其几何意义能帮助我们理解很多内容. 第3题的镜面变换在内积空间中会进一步讨论,第4题的投影变换将在幂等矩阵中我们会再次提及. \begin{example}{}{} @@ -165,8 +165,6 @@ \subsection{线性映射举例} \end{example} - - \begin{solution} \begin{enumerate} \item 读者易根据线性映射的定义自行验证 @@ -198,26 +196,7 @@ \subsection{线性映射举例} \] 故 \( r_{\theta} \) 是 \( \mathbf{R}^2 \) 上的一个线性变换. - \item 事实上,设直线 $L$ 的某个方向的单位向量为$\omega$,则$\vec{OC}=(\alpha,\omega)\omega$,其中$(\alpha,\omega)$为向量$\alpha$和$\omega$的内积,对于刚接触内积的读者来说,这可能并不是这么显然,但是稍加思考,我们发现这是很自然的,因为$\vec{OC}$是$\vec{OA}$在$\omega$方向上的投影,而求一个向量在另一个向量上的投影,我们高中时已经见了无数遍了,不妨设$\vec{OA}$与$\omega$的夹角为$\theta$,则$\vec{OC}=\vert\alpha \vert cos\theta\omega$,又 - \[ - \vert\alpha \vert\cos\theta=\vert\alpha \vert\dfrac{\alpha\cdot\omega}{\vert \alpha\vert\cdot\vert\omega\vert}=\dfrac{(\alpha,\omega)}{\vert\omega\vert}. - \] - 代入单位向量模为$1$即可,不过是把我们高中的知识稍加变形罢了. 于是我们有 - - \[ - \varphi(\alpha)=\alpha'=\vec{OB}=\vec{OA}+2\vec{AC}= \alpha + 2(\vec{OC}-\alpha)=-\alpha+2(\alpha,\omega)\omega. - \] - - 接下来验证 $\varphi$ 是 $\mathbf{R}^2$ 上的一个线性变换也很简单,我们留给读者自行验证. - - 不过还有一个值得一提的地方\\ - 如果设 $\alpha = (x,y),\omega =(\cos \theta,\sin \theta)$,则 - \begin{align*} - \varphi(x,y)&=(-x,-y)+2(x\cos\theta+y\sin\theta)(\cos \theta,\sin \theta)\\ - &=(-x + 2x \cos^2 \theta + 2y \sin \theta \cos \theta, -y + 2x \sin \theta \cos \theta + 2y^2 \sin^2 \theta)\\ - &=(x \cos 2\theta + y \sin 2\theta, x \sin 2\theta - y \cos 2\theta). - \end{align*} - 不难发现,这与旋转变换实质上是同一个东西,镜面变换不过是旋转了2倍的夹角罢了. + \item 证明涉及内积的知识,我们放在\autoref{ex:镜像变换}中讨论. \item 读者可以自行验证. \end{enumerate} @@ -319,71 +298,73 @@ \subsection{线性映射的基本运算} \end{gather*} \end{definition} +不难验证,这样定义的线性映射加法和数乘的结果仍然是线性映射: +\begin{proof} +\begin{enumerate} + \item 首先证明加法,直接验证即可: + \begin{align*} + (\sigma + \tau)(\lambda_1 \alpha_1 + \lambda_2 \alpha_2) & = \sigma(\lambda_1 \alpha_1 + \lambda_2 \alpha_2) + \tau(\lambda_1 \alpha_1 + \lambda_2 \alpha_2) \\ + & = \lambda_1 \sigma(\alpha_1) + \lambda_2 \sigma(\alpha_2) + \lambda_1 \tau(\alpha_1) + \lambda_2 \tau(\alpha_2) \\ + & = \lambda_1 (\sigma(\alpha_1) + \tau(\alpha_1)) + \lambda_2 (\sigma(\alpha_2) + \tau(\alpha_2)) \\ + &= \lambda_1 (\sigma+\tau)(\alpha_1) + \lambda_2 (\sigma+\tau)(\alpha_2). + \end{align*} + + \item 再证明数乘,同样直接验证即可: + \begin{align*} + (\lambda \sigma)(\lambda_1 \alpha_1 + \lambda_2 \alpha_2) & = \lambda \sigma(\lambda_1 \alpha_1 + \lambda_2 \alpha_2) \\ + & = \lambda (\lambda_1 \sigma(\alpha_1) + \lambda_2 \sigma(\alpha_2)) \\ + & = \lambda_1 (\lambda \sigma(\alpha_1)) + \lambda_2 (\lambda \sigma(\alpha_2)) \\ + & = \lambda_1 (\lambda \sigma)(\alpha_1) + \lambda_2 (\lambda \sigma)(\alpha_2). + \end{align*} +\end{enumerate} +\end{proof} + +进一步地,线性空间 $V_1(\mathbf{F})$ 到 $V_2(\mathbf{F})$ 的所有线性映射 $\mathcal{L}(V_1,V_2)$ 关于上面定义的加法和数乘构成线性空间: + \begin{theorem}{}{线性映射全体构成线性空间} $\mathcal{L}(V_1,V_2)$与上述定义的线性映射加法和数乘构成域$\mathbf{F}$上的线性空间. \end{theorem} -下面讨论线性映射的复合. 设$\sigma \in \mathcal{L}(V_1,V_2),\enspace\tau \in \mathcal{L}(V_2,V_3)$,则$\tau\sigma$是$\mathcal{L}(V_1,V_3)$中的元素,且$\tau\sigma(\alpha)=\tau(\sigma(\alpha)),\enspace\forall \alpha \in V_1$. -\begin{theorem}{}{} - 上述定义的映射$\tau\sigma$是线性映射. -\end{theorem} -注意:在上述定义中一定注意$\sigma$和$\tau$的顺序,我们需要先使用$\sigma$将$V_1$中的元素映射到$V_2$,然后再用外层的$\tau$将这个结果映射到$V_3$. +实际上,前面我们证明的线性映射加法和数乘的结果仍然是线性映射,就是线性映射的加法和数乘的封闭性,因此我们只需证明线性映射的加法和数乘满足线性空间的 8 条性质即可. 事实上这是非常显然的,我们只需注意 $\mathcal{L}(V_1,V_2)$ 中的零元就是零映射 $\theta$(将 $V_1$ 中的任意元素都映射到 $V_2$ 中的零元)即可,因此我们不再赘述. -下面定义逆映射. 如果可逆映射$\sigma:V_1 \to V_2$的逆映射为$\sigma^{-1}$,则有$\sigma^{-1}\sigma=I_{V_1}$且$\sigma\sigma^{-1}=I_{V_2}$. 其中$I_{V}$的含义为$V$上的恒等映射,即$I_V(\alpha)=\alpha,\enspace \forall \alpha \in V$. -\begin{theorem}{}{} - 上述定义的逆映射$\sigma^{-1}$为线性映射. -\end{theorem} +下面讨论线性映射的其它运算. 首先是复合运算. 设$\sigma \in \mathcal{L}(V_1,V_2),\enspace\tau \in \mathcal{L}(V_2,V_3)$,则$\tau\sigma$是$\mathcal{L}(V_1,V_3)$中的元素,且$\tau\sigma(\alpha)=\tau(\sigma(\alpha)),\enspace\forall \alpha \in V_1$. -上述三个定理的证明是非常基本的,在阅读详细的证明之前,读者可以先自行尝试,如果不会证明则说明对于线性空间和线性映射的定义熟悉程度仍需提高,因为这里的证明都只需要机械地套用定义. +\begin{theorem}{}{复合映射是线性映射} + 上述定义的映射 $\tau\sigma$ 是线性映射. +\end{theorem} -\begin{proof} +注意:在上述定义中一定注意$\sigma$和$\tau$的顺序,我们需要先使用$\sigma$将$V_1$中的元素映射到$V_2$,然后再用外层的$\tau$将这个结果映射到$V_3$. -如果 $\sigma_1$ 和 $\sigma_2$ 分别是线性空间 $V_1(F)$ 到 $V_2(F)$ 和 $V_2(F)$ 到 $V_3(F)$ 的线性映射,那么 -\[ -(\sigma_2 \circ \sigma_1)(\lambda \alpha + \mu \beta) = \sigma_2(\sigma_1(\lambda \alpha + \mu \beta)) = \sigma_2(\lambda (\sigma_1(\alpha))) + \mu_1(\sigma_1(\beta)) -\] -\[ -= \lambda (\sigma_2(\sigma_1(\alpha))) + \mu (\sigma_2(\sigma_1(\beta))) = \lambda(\sigma_2(\sigma_1)(\alpha)) + \mu (\sigma_2(\sigma_1)(\beta)), -\] -所以 $\sigma_2\sigma_1$ 是 $V_1$ 到 $V_3$ 的线性映射. +接下来定义线性映射的逆运算,也就是定义逆映射. 如果可逆映射$\sigma:V_1 \to V_2$的逆映射为$\sigma^{-1}$,则有$\sigma^{-1}\sigma=I_{V_1}$且$\sigma\sigma^{-1}=I_{V_2}$. 其中$I_{V}$的含义为$V$上的恒等映射,即$I_V(\alpha)=\alpha,\enspace \forall \alpha \in V$. -如果可逆线性映射 $\sigma: V_1 \to V_2$ 的逆映射为 $\sigma^{-1}: V_2 \to V_1$,那么 -\[ -\sigma^{-1} \circ \sigma = I_{V_1}, \quad \text{且} \quad \sigma \circ \sigma^{-1} = I_{V_2}, -\] -于是对于$ \forall \ \beta_1,\beta_2 \in V_2$和任意的标量 $\lambda_1, \lambda_2 \in F$,有 -\[ -\sigma^{-1}(\lambda_1 \beta_1 + \lambda_2 \beta_2) = -\sigma^{-1}\left[ \lambda_1(\sigma \sigma^{-1})(\beta_1)+\lambda_2(\sigma \sigma^{-1})(\beta_2)\right] -\] -\[ -= \sigma^{-1}(\lambda_1 \sigma(\sigma^{-1}(\beta_1)) + \lambda_2 \sigma(\sigma^{-1}(\beta_2)))\\ -\] -\[ -= \lambda_1 \sigma^{-1}(\beta_1) + \lambda_2 \sigma^{-1}(\beta_2) -\] -所以 $\sigma^{-1}$ 是线性的. - -这样我们就证明了后面两个定理 +\begin{theorem}{}{逆映射是线性映射} + 上述定义的逆映射 $\sigma^{-1}$ 为线性映射. +\end{theorem} -我们把线性空间 $V_1(F)$ 到 $V_2(F)$ 的所有线性映射组成的集合记作 $L(V_1,V_2)$.下面根据我们之前定义的数乘运算,可以说明这个集合也是一个线性空间 +\autoref{thm:复合映射是线性映射}和\autoref{thm:逆映射是线性映射}的证明是非常基本的,在阅读详细的证明之前,读者可以先自行尝试,如果不会证明则说明对于线性空间和线性映射的定义熟悉程度仍需提高,因为这里的证明都只需要机械地套用定义. -对 $(\sigma + \tau)(\lambda_1 a_1 + \lambda_2 a_2)$ 有 -\[ -(\sigma + \tau)(\lambda_1 a_1 + \lambda_2 a_2) = \sigma(\lambda_1 a_1 + \lambda_2 a_2) + \tau(\lambda_1 a_1 + \lambda_2 a_2) -\] -\[ -= \lambda_1 \sigma(a_1) + \lambda_2 \sigma(a_2) + \lambda_1 \tau(a_1) + \lambda_2 \tau(a_2) -\] -\[ -= \lambda_1 (\sigma(a_1) + \tau(a_1)) + \lambda_2 (\sigma(a_2) + \tau(a_2)), -\] -即 -\[ -(\sigma + \tau)(\lambda_1 a_1 + \lambda_2 a_2) = \lambda_1(\sigma(a_1) + \tau(a_1)) + \lambda_2(\sigma(a_2) + \tau(a_2)). -\] +\begin{proof} +\begin{enumerate} + \item 如果 $\sigma_1$ 和 $\sigma_2$ 分别是线性空间 $V_1(F)$ 到 $V_2(F)$ 和 $V_2(F)$ 到 $V_3(F)$ 的线性映射,那么 + \begin{align*} + (\sigma_2 \circ \sigma_1)(\lambda \alpha + \mu \beta) & = \sigma_2(\sigma_1(\lambda \alpha + \mu \beta)) \\ + & = \sigma_2(\lambda (\sigma_1(\alpha))) + \mu_1(\sigma_1(\beta)) \\ + & = \lambda (\sigma_2(\sigma_1)(\alpha)) + \mu (\sigma_2(\sigma_1)(\beta)), + \end{align*} + 所以 $\sigma_2\sigma_1$ 是 $V_1$ 到 $V_3$ 的线性映射. -因此 $L (V_1,V_2)$ 对上述定义的加法和数乘运算构成了 $F$ 上的一个线性空间 + \item 如果可逆线性映射 $\sigma: V_1 \to V_2$ 的逆映射为 $\sigma^{-1}: V_2 \to V_1$,那么 + \[ + \sigma^{-1} \circ \sigma = I_{V_1}, \quad \text{且} \quad \sigma \circ \sigma^{-1} = I_{V_2}, + \] + 于是对于$ \forall \ \beta_1,\beta_2 \in V_2$和任意的标量 $\lambda_1, \lambda_2 \in F$,有 + \begin{align*} + \sigma^{-1}(\lambda_1 \beta_1 + \lambda_2 \beta_2) & = \sigma^{-1}\left[ \lambda_1(\sigma \sigma^{-1})(\beta_1)+\lambda_2(\sigma \sigma^{-1})(\beta_2)\right] \\ + &= \sigma^{-1}(\lambda_1 \sigma(\sigma^{-1}(\beta_1)) + \lambda_2 \sigma(\sigma^{-1}(\beta_2))) \\ + & = \lambda_1 \sigma^{-1}(\beta_1) + \lambda_2 \sigma^{-1}(\beta_2), + \end{align*} + 所以 $\sigma^{-1}$ 是线性的. +\end{enumerate} \end{proof} \section{线性映射的像与核} @@ -445,9 +426,7 @@ \section{线性映射的像与核} \begin{itemize} \item 首先求像空间. 取出发空间$\mathbf{R}^3$的一组基$B=\{(1,0,0)^{\color{lightgray}\mathrm{T}},(0,1,0)^{\color{lightgray}\mathrm{T}},(0,0,1)^{\color{lightgray}\mathrm{T}}\}$,则 \begin{align*} - \im \sigma - &=\sigma(\mathbf{R}^3) - &=\spa( + \im \sigma &=\sigma(\mathbf{R}^3) = \spa( \sigma(1,0,0)^{\color{lightgray}\mathrm{T}}, \sigma(0,1,0)^{\color{lightgray}\mathrm{T}}, \sigma(0,0,1)^{\color{lightgray}\mathrm{T}} @@ -1078,19 +1057,19 @@ \subsection{自然同构} \label{subsec:自然同构} \begin{exgroup} \item 设$\sigma: V_1\to V_2$是线性映射. 证明:$\sigma(W_1)$和$\sigma^{-1}(W_2)$分别是$V_2$和$V_1$的子空间. - + \begin{answer} $\sigma(W_1)$是$V_2$的子空间. $\forall v_1,v_2\in\sigma(W_1)$,$\exists w_1,w_2\in W_1$使得$\sigma(w_1)=v_1$,$\sigma(w_2)=v_2$,因此 \[\sigma(w_1+w_2)=\sigma(w_1)+\sigma(w_2)=v_1+v_2\in\sigma(W_1),\] \[\sigma(\lambda w_1)=\lambda\sigma(w_1)=\lambda v_1\in\sigma(W_1),\] 因此$\sigma(W_1)$是$V_2$的子空间. - + $\sigma^{-1}(W_2)$是$V_1$的子空间. $\forall v_1,v_2\in\sigma^{-1}(W_2)$,$\sigma(v_1),\sigma(v_2)\in W_2$,因此 \[\sigma(v_1+v_2)=\sigma(v_1)+\sigma(v_2)\in W_2,\] \[\sigma(\lambda v_1)=\lambda\sigma(v_1)\in W_2,\] 因此$v_1+v_2\in\sigma^{-1}(W_2)$,$\lambda v_1\in\sigma^{-1}(W_2)$,因此$\sigma^{-1}(W_2)$是$V_1$的子空间. \end{answer} - + \item 设$\sigma,\tau \in \mathcal{L}(V,V)$且$\sigma^2=\sigma$,$\tau^2=\tau$. 证明: \begin{enumerate} \item $\sigma^k=\sigma$(幂等变换); @@ -1102,7 +1081,7 @@ \subsection{自然同构} \label{subsec:自然同构} \begin{answer} \begin{enumerate} \item 使用数学归纳法证明即可. - + \item 由 $ (\sigma + \tau)^2 = \sigma + \tau $, \[ (\sigma + \tau)^2 = \sigma^2 + + \sigma \tau + \tau \sigma + \tau^2 = \sigma + \tau \] 得 @@ -1125,7 +1104,7 @@ \subsection{自然同构} \label{subsec:自然同构} \end{equation} 由\autoref{eq:5:A:2:1} 与\autoref{eq:5:A:2:4} 得 \[ \sigma \tau = \theta \] - + \item 若 $ \sigma \tau = \tau \sigma $,则 \begin{align*} & (\sigma + \tau - \sigma \tau)^2 \\ @@ -1133,7 +1112,7 @@ \subsection{自然同构} \label{subsec:自然同构} ={} & \sigma + \tau + 2 \sigma \tau - \sigma \tau \sigma - \sigma \tau - \sigma \tau - \tau \sigma - \sigma \tau + \sigma \tau \\ ={} & \sigma + \tau - \sigma \tau \end{align*} - \end{enumerate} + \end{enumerate} \end{answer} \item 是否存在$\mathbf{R}^3$到$\mathbf{R}^2$的线性映射$\sigma$使得$\sigma(1,-1,1)=(1,0)$,$\sigma(1,1,1)=(0,1)$? @@ -1253,7 +1232,7 @@ \subsection{自然同构} \label{subsec:自然同构} & = ((x_1 - x_2) - (x_1 + x_2), (x_1 - x_2) + (x_1 + x_2)) \\ & = (-2 x_2, 2 x_1) \end{align*} - + \item $ \sigma $ 可逆的充分必要条件是存在线性变换 $ \tau $ 使得 $ \sigma \tau = I $. 于是,$ \forall \alpha \in \mathbf{R}^2 $,令 $ (\tau \sigma)(\alpha) = \alpha $,即 \[ (\tau \sigma)(x_1, x_2) = \tau(x_1 - x_2, x_1 + x_2) = \tau(y_1, y_2) = (x_1, x_2) \] 解得 @@ -1263,14 +1242,14 @@ \subsection{自然同构} \label{subsec:自然同构} \end{gather*} 所以 \[ \tau(x_1, x_2) = \sigma^{-1}(x_1, x_2) = \left(\frac{x_1 + x_2}{2}, \frac{x_1 - x_2}{2}\right) \] - + \item 当 $ \xi = \theta $ 时,显然满足 $ \xi \tau = \theta $. 当 $ \xi \neq \theta $ 时, \[ \xi \tau(x_1, x_2) = \xi(x_1 - x_2, x_2 - x_1) = (0, 0) \] 记 $ y_1 = x_1 - x_2,\enspace y_2 = x_2 - x_1 $. 由于 $ y_1 + y_2 = 0 $, \[ \tau(y_1, y_2) = (y_1 + y_2, y_1 + y_2) \] 即 $ \tau(x_1, x_2) = (x_1 + x_2, x_1 + x_2) $ 满足 $ \xi \tau = \theta $. \end{enumerate} - + \end{answer} \item 已知$\mathbf{R}^3$上的两个线性变换$\sigma,\tau$为: @@ -1293,7 +1272,7 @@ \subsection{自然同构} \label{subsec:自然同构} \im \theta & = \spa(\vec{e}_1) \\ \ker \theta & = \spa(\vec{e}_1, \vec{e}_2) \end{align*} - + \item \begin{gather*} (\sigma \tau)(x_1, x_2, x_3) = \sigma(x_1 + x_2 + x_3, x_1 - x_2, 0) = (0, 0, 0) \\ r(\sigma \tau) = 0 @@ -1310,7 +1289,7 @@ \subsection{自然同构} \label{subsec:自然同构} 方法 2:由 $ \tau \sigma \neq \theta $ 知 \[ 1 \leqslant r(\tau \sigma) \leqslant \min\{r(\tau), r(\sigma)\} = 1 \] 因此 $ r(\tau \sigma) = 1 $. - + \begin{gather*} \begin{aligned} (\sigma + \tau)(x_1, x_2, x_3) & = \sigma(x_1, x_2, x_3) + \tau(x_1, x_2, x_3) \\ @@ -1319,7 +1298,7 @@ \subsection{自然同构} \label{subsec:自然同构} \end{aligned} \\ r(\sigma + \tau) = r\{(1, 1, 0), (1, -1, 0), (2, 0, 0)\} = 2 \end{gather*} - + \item \begin{gather*} \begin{aligned} \im \tau & = \spa((1, 1, 0), (1, -1, 0), (2, 0, 0)) \\ @@ -1382,7 +1361,7 @@ \subsection{自然同构} \label{subsec:自然同构} & = k_1 p_1'(x) + k_2 p_2'(x) = k_1 \sigma(p_1) + k_2 \sigma(p_2) \end{align*} 因此 $ \sigma $ 是 $ \mathbf{R}[x]_n $ 上的线性变换. - + \item \begin{gather*} \begin{aligned} \im \sigma & = \spa(\sigma(1), \sigma(x), \sigma(x^2), \ldots, \sigma(x^{n - 1})) \\ @@ -1392,9 +1371,9 @@ \subsection{自然同构} \label{subsec:自然同构} r(\sigma) = n - 1 \end{gather*} 可知 $ \sigma $ 不是单射,因此不可逆. - + \item 由 $ \sigma(p(x)) = 0 $ 可知 $ p(x) = c $(常数). 因此 $ \ker \sigma = \spa(1),\enspace \dim \ker \sigma = 1 $. - + \item \begin{gather*} r(\sigma) + \dim \ker \sigma = (n - 1) + 1 = n \\ \im \sigma + \ker \sigma = \spa(1, x, \ldots, x^{n - 2}) = \im \sigma \neq \mathbf{R}[x]_n @@ -1421,19 +1400,19 @@ \subsection{自然同构} \label{subsec:自然同构} \ker \sigma = \spa(\vec{e}_1 - \vec{e}_2) \\ \im \sigma \cap \ker \sigma = \{\vec{0}\} \end{gather*} - + \item 可能. 例如 $ \sigma(x, y, z) = (x - y, x - y, x - y) $. \begin{gather*} \im \sigma = \spa((1, 1, 1)) \\ \ker \sigma = \spa((1, 1, 1), (1, 1, 0)) \\ \im \sigma \subseteq \ker \sigma \end{gather*} - + \item 可能. 例如 $ \sigma(x, y) = (x - y, x - y) $. \begin{gather*} \im \sigma = \ker \sigma = \spa((1, 1)) \end{gather*} - + \item 可能. 例如 $ \sigma(x, y) = (x, x - y) $. \begin{gather*} \im \sigma = \mathbf{R}^2 \\ @@ -1457,9 +1436,9 @@ \subsection{自然同构} \label{subsec:自然同构} \begin{answer} \begin{enumerate} \item 错误. 一个反例为 $ \sigma(x_1, x_2) = (x_1 - x_2, x_1 - x_2) $,则 $ \im \sigma + \ker \sigma = \spa((1, 1)) $. - + \item 正确. $ \im \sigma + \ker \sigma \subseteq V $,此时 $ \dim(\im \sigma + \ker \sigma) = \dim \im \sigma + \dim \ker \sigma - 0 = \dim V $,所以 $ \im \sigma + \ker \sigma = V $. - + \item \label{item:6:B:2:3} 错误. $ \forall \alpha \in V $ 有 \[ (\sigma_1 + \sigma_2)(\alpha) = \sigma_1(\alpha) + \sigma_2(\alpha) \in \sigma_1(V) + \sigma_2(V) \] @@ -1478,7 +1457,7 @@ \subsection{自然同构} \label{subsec:自然同构} (\sigma_1 + \sigma_2)(\vec{e}_2) = (\sigma_1 + \sigma_2)(\vec{e}_3) = \vec{e}_2 + \vec{e}_3 \\ (\sigma_1 + \sigma_2)(V) = \spa(\vec{e}_1, \vec{e}_2 + \vec{e}_3) \neq \mathbf{R}^3 \end{gather*} - + \item 错误. $ (I - \sigma)(V) + \sigma(V) \subseteq V $,等号不一定成立,原因同 \ref*{item:6:B:2:3},此时只需将 $ I - \sigma $ 视作 $ \sigma_1 $,将 $ \sigma $ 视作 $ \sigma_2 $. \end{enumerate} \end{answer} @@ -1543,7 +1522,7 @@ \subsection{自然同构} \label{subsec:自然同构} a + bc_2 + cc_2^2 = d_2 \\ a + bc_3 + cc_3^3 = d_3 \end{cases} \] - 方程组是关于未知元 $ a, b, c $ 的三元线性非齐次方程组,其中 $ c_1, c_2, c_3 $ 是互异的实常数. 用高斯消元法,易将其增广矩阵变换为下列阶梯形矩阵,即 + 方程组是关于未知元 $ a, b, c $ 的三元线性非齐次方程组,其中 $ c_1, c_2, c_3 $ 是互异的实常数. 用高斯-若当消元法,易将其增广矩阵变换为下列阶梯形矩阵,即 \begin{align} % TODO 增广矩阵 & \begin{pmatrix} 1 & c_1 & c_1^2 & \Bigm| & d_1 \\ @@ -1563,7 +1542,7 @@ \subsection{自然同构} \label{subsec:自然同构} \item 设$\sigma$和$\tau$分别为有限维线性空间$U\to V$和$V\to W$的线性映射,证明 \[\dim\ker\sigma+\dim(\im\sigma\cap\ker\tau)=\dim\ker(\tau\sigma).\] - + \begin{answer} 我们先观察等式的右边,在 $\ker \tau \sigma$中的元素 $u$,会满足 $\tau \sigma (u) = 0 $,仔细想想什么元素会满足这个式子 \begin{itemize} @@ -1587,7 +1566,7 @@ \subsection{自然同构} \label{subsec:自然同构} $ \mathcal{L}(V, V) $ 是 $ n^2 $ 维线性空间,其中 $ n^2 + 1 $ 个元素 $ I, \sigma, \sigma^2, \ldots, \sigma^{n^2} $ 线性相关,即 $ \exists a_i\enspace (i = 1, 2, \ldots, n^2) $ 使得 \[ a_0 I + a_1 \sigma + \ldots + a_{n^2} \sigma^{n^2} = \theta \] 于是 $ \exists p(x) = a_0 + a_1 x + \ldots + a_{n^2} x^{n^2} \in \mathbf{F}[x] $ 使得 $ p(\sigma) = \theta $. - + \item 必要性:设有一常数项不为 0 的多项式 \[ p(x) = a_0 + a_1 x + \cdots + a_k x^k \qquad a_0 \neq 0 \] 满足 @@ -1596,25 +1575,25 @@ \subsection{自然同构} \label{subsec:自然同构} \[ \sigma(a_1 I + a_2 \sigma + \cdots + a_k \sigma^{k - 1}) = -a_0 I \] 因此 \[ \sigma^{-1} = -a_0^{-1} (a_1 I + a_2 \sigma + \cdots + a_k \sigma^{k - 1}) \] - + 充分性:由 \ref*{item:5:C:1:1} 可知存在次数 $ k \leqslant n^2 $ 的多项式 \[ p(x) = a_0 + a_1 x + a_2 x^2 + \cdots + a_k x^k \] 满足 \[ p(\sigma) = a_0 I + a_1 \sigma + \cdots + a_k \sigma^k = \theta \] 若 $ a_0 \neq 0 $,则 $ p(x) $ 即为所求多项式. - + 若 $ a_0 = a_1 = \cdots = a_{i - 1} = 0,\enspace a_i \neq 0 $,即 \[ a_i I + a_{i + 1} \sigma + \cdots + a_k \sigma^{k - i} = \theta \] 于是 \[ P(x) = a_i + a_{i + 1} x + \cdots + a_k x^{k - i} \qquad a_i \neq 0 \] 为所求的多项式. \end{enumerate} - \end{answer} + \end{answer} \item 已知$\sigma_1,\sigma_2,\ldots,\sigma_s$是线性空间$V$上的$s$个两两不同的线性变换,证明:在$V$中必存在向量$\alpha$使得$\sigma_1(\alpha),\sigma_2(\alpha),\ldots,\sigma_s(\alpha)$也两两不同. \begin{answer} $\alpha \in V$使得$\sigma_i(\alpha) \neq \sigma_j(\alpha)$当且仅当$\alpha \notin \ker(\sigma_i - \sigma_j)$,我们可以只考虑该核空间不是零空间的情况,因为我们所取出的$\alpha$显然不可能是零, - 又因为我们的线性映射是两两不相同的,所以该核空间一定是一个真子空间,对于$m$个非平凡子空间,我们总可以取到一个不属于任意一个这些子空间的向量(相关的习题在第四章A组第5题已经给出)\autoref{eg:4:A:5},这样我们就找到了所需要的$\alpha$ - \end{answer} + 又因为我们的线性映射是两两不相同的,所以该核空间一定是一个真子空间,对于$m$个非平凡子空间,我们总可以取到一个不属于任意一个这些子空间的向量(相关的习题在第四章A组第5题已经给出)\autoref{eg:4:A:5},这样我们就找到了所需要的$\alpha$ + \end{answer} \item 设$V$是一个$n$维线性空间,$V=W_1\oplus W_2,\enspace\sigma\in \mathcal{L}(V,V)$. 证明:$\sigma$可逆$\iff V=\sigma(W_1)+\sigma(W_2)$. \begin{answer} 证明:必要性:$ \forall \alpha \in V $,由 $ \sigma $ 可逆,存在唯一的 $ \beta \in V $ 使得 $ \sigma(\beta) = \alpha $ 且 $ \beta = \beta_1 + \beta_2 $,其中 $ \beta_1 \in W_1 $,$ \beta_2 \in W_2 $. 于是 @@ -1686,7 +1665,7 @@ \subsection{自然同构} \label{subsec:自然同构} \sigma(\alpha) = \sigma(\beta - \sigma(\beta)) = \sigma(\beta) - \sigma^2(\beta) \end{gather*} 而由于 $ \sigma^2 = \sigma $,所以 $ \sigma(\alpha) = \vec{0} $,于是 $ \alpha \in \ker \sigma $,因此 $ (I - \sigma)(V) \subseteq \ker \sigma $. - + \item 利用 $ r(\sigma + \tau) \leqslant r(\sigma) + r(\tau) $ 和 $ r(\sigma) + \dim \ker \sigma = n $,由 \ref*{item:6:C:4:1} 可得 \begin{equation} \label{eq:5:C:6:2:1} r(I - \sigma) + r(\sigma) \leqslant n @@ -1698,7 +1677,7 @@ \subsection{自然同构} \label{subsec:自然同构} 于是由\autoref{eq:5:C:6:2:1} 和\autoref{eq:5:C:6:2:2} 即可得到 $ r(I - \sigma) + r(\sigma) = n $. \end{enumerate} \end{answer} - + \item 已知$V$为有限维线性空间,$\sigma\in \mathcal{L}(V,V)$,且$\sigma^2=\theta$(零映射). 证明: \begin{enumerate} @@ -1712,10 +1691,10 @@ \subsection{自然同构} \label{subsec:自然同构} $ \forall \alpha \in \im \sigma,\enspace \exists \beta \in V $ 使得 $ \sigma(\beta) = \alpha $. 由 $ \sigma^2 = \theta $ 可得 $ \sigma(\alpha) = \sigma^2(\beta) = \vec{0} $,因此 $ \alpha \in \ker \sigma $,从而 $ \im \sigma \subseteq \ker \sigma $. 于是我们得到 \[ n = \dim \im \sigma + \dim \ker \sigma \geqslant 2 \dim \im \sigma \] 即 $ \dim \im \sigma \leqslant \dfrac{n}{2} $. - + \item 由 \ref*{item:5:C:7:1} 可知,方程组 $ AX = \vec{0} $ 的基础解系含有 $ n - r(A) = \dim \ker \sigma \geqslant \dfrac{n}{2} $ 个解向量,所以结论成立. \end{enumerate} - + \end{answer} \end{exgroup} \end{exercise} diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/10 \345\257\271\345\201\266\347\251\272\351\227\264.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/6 \345\257\271\345\201\266\347\251\272\351\227\264.tex" similarity index 100% rename from "\350\256\262\344\271\211/\344\270\223\351\242\230/10 \345\257\271\345\201\266\347\251\272\351\227\264.tex" rename to "\350\256\262\344\271\211/\344\270\223\351\242\230/6 \345\257\271\345\201\266\347\251\272\351\227\264.tex" diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/6 \347\272\277\346\200\247\346\230\240\345\260\204\347\237\251\351\230\265\350\241\250\347\244\272.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/7 \347\272\277\346\200\247\346\230\240\345\260\204\347\237\251\351\230\265\350\241\250\347\244\272.tex" similarity index 94% rename from "\350\256\262\344\271\211/\344\270\223\351\242\230/6 \347\272\277\346\200\247\346\230\240\345\260\204\347\237\251\351\230\265\350\241\250\347\244\272.tex" rename to "\350\256\262\344\271\211/\344\270\223\351\242\230/7 \347\272\277\346\200\247\346\230\240\345\260\204\347\237\251\351\230\265\350\241\250\347\244\272.tex" index 9b76d6a..1064c7f 100644 --- "a/\350\256\262\344\271\211/\344\270\223\351\242\230/6 \347\272\277\346\200\247\346\230\240\345\260\204\347\237\251\351\230\265\350\241\250\347\244\272.tex" +++ "b/\350\256\262\344\271\211/\344\270\223\351\242\230/7 \347\272\277\346\200\247\346\230\240\345\260\204\347\237\251\351\230\265\350\241\250\347\244\272.tex" @@ -2,9 +2,10 @@ \chapter{线性映射矩阵表示} 在上一讲的讨论中我们定义了线性映射的基本概念与性质,以及线性映射像空间与核空间之间的关联,引出了我们目前为止最核心的概念——同构. 同构使得我们研究的抽象层次更上一层,而本讲将在这抽象的制高点获得最具象的表达形式——矩阵,介绍线性映射矩阵表示的定义,以及这一定义下线性映射与矩阵的一一对应关系,从而使得我们后续的研究都可以基于具象的矩阵. -\section{线性映射矩阵表示} +\section{引入:基本思想与工具} + +如何将抽象的线性映射与具象的由数字构成的矩阵联系起来?这似乎不是一个很直接的过程,因此本节我们将从最简单的情况出发,并引入一些必要的工具,便于读者接受线性映射矩阵表示的正式定义. 我们首先回顾矩阵的定义. 最开始我们在高斯消元时引入了矩阵作为符号简化和方程组求解的工具,我们回顾当时给出的矩阵定义: -最开始我们在高斯消元时引入了矩阵作为符号简化和方程组求解的工具,严格地来说,我们之前的定义是: \begin{definition}{}{} 域$\mathbf{F}$中的$m\times n$个元素$a_{ij}\enspace(i=1,\ldots,m,\enspace j=1,\ldots,n)$排成$m$行$n$列的矩形数表,称为域$\mathbf{F}$上的一个$m\times n$矩阵,记作 \[A=\begin{pmatrix} @@ -16,23 +17,15 @@ \section{线性映射矩阵表示} 或简记为$(a_{ij})_{m\times n}$,其中$a_{ij}$表示矩阵$A$的第$i$行第$j$列的元素. \end{definition} -但是笔者将会在下文用不同的方式引出一种新的定义. 为了探究线性映射的性质,我们需要先研究一些特殊案例,然后从特殊到一般,矩阵就是对特殊案例——$\mathbf{F}^n$ 这样空间的研究. 不妨先考察 $\mathbf{F}^n\to\mathbf{F}^m$ 的线性映射,其可以写成 $y = \sigma(x)$,其中 $x\in\mathbf{F}^n, y\in\mathbf{F}^m$. 我们给出如下结论: +从这一定义来看,矩阵就是一堆数字的排列组合. 为了将矩阵与线性映射建立联系,我们自然地想到同样由``一些数字''构成的线性空间之间的线性映射,即 $\mathbf{F}^n \to \mathbf{F}^m$ 的线性映射,然后从这一特殊情况出发得到一般的关联. + +考察一个 $\mathbf{F}^n \to \mathbf{F}^m$ 的线性映射 $y = \sigma(x)$,其中 $x\in\mathbf{F}^n, y\in\mathbf{F}^m$. 我们不难得到如下结论: \begin{lemma}{}{} - 设 - \begin{align*} - \sigma \colon \mathbf{F}^n &\to \mathbf{F}^m \\ - x = (x_1, \cdots, x_n) & \mapsto y = (y_1, \cdots, y_m) - \end{align*} - 是线性映射,则映射具有形式,称矩阵 $(a_{ij})_{m\times n}$ 为线性映射 $\sigma\colon\mathbf{F}^n\to\mathbf{F}^m$ 的标准表示 - \begin{align*} - y_1 &= a_{11} x_1 + a_{12} x_2 + \cdots + a_{1n} x_n \\ - y_2 &= a_{21} x_1 + a_{22} x_2 + \cdots + a_{2n} x_n \\ - & \cdots\\ - y_m &= a_{m1} x_1 + a_{m2} x_2 + \cdots + a_{mn} x_n - \end{align*} + 任意的 $\mathbf{F}^n \to \mathbf{F}^m$ 的线性映射 $y = \sigma(x)$ 都可以写成 $y = Ax$ 的形式,其中 $A$ 是一个 $m \times n$ 的矩阵,并且这样的矩阵是唯一的. \end{lemma} + \begin{proof} - 考虑 $\sigma$ 在 $\mathbf{F}^n$ 的标准基底 $e_1, e_2, \ldots, e_n$ 上的值,设 + 对于一个线性映射,我们通常可以从一组基上的表现来研究. 考虑 $\sigma$ 在 $\mathbf{F}^n$ 的自然基 $e_1, e_2, \ldots, e_n$ 上的值,设 \[ \sigma(e_1) = \begin{pmatrix} a_{11} \\ a_{21} \\ \vdots \\ a_{m1} \end{pmatrix}, \sigma(e_2) = \begin{pmatrix} a_{12} \\ a_{22} \\ \vdots \\ a_{m2} \end{pmatrix}, @@ -56,6 +49,8 @@ \section{线性映射矩阵表示} \end{align*} \end{proof} +称矩阵 $(a_{ij})_{m\times n}$ 为线性映射 $\sigma\colon\mathbf{F}^n\to\mathbf{F}^m$ 的标准表示. + 不难发现这里的 $a_{ij}$ 项实际上反映了输入的第 $j$ 项对输出的第 $i$ 项有多少权重,而只要确定了这 $m\times n$ 个权重,我们就得到了一个 $\mathbf{F}^n\to\mathbf{F}^m$ 的线性映射. 换言之,$\mathcal{L}(\mathbf{F}^n, \mathbf{F}^m)$ 和这些权重是一一对应的,于是一个映射可以等价地被记为一个矩阵,它接受一个 $\mathbf{F}^n$ 的向量,返回一个 $\mathbf{F}^m$ 的向量,由于标准基的存在,所以我们有同构 $\mathcal{L}(\mathbf{F}^n, \mathbf{F}^m) \cong \mathbf{F}^{m\times n}$ 后面不再区分 $\mathbf{F}^{m\times n}$ 和 $\mathcal{L}(\mathbf{F}^n, \mathbf{F}^m)$. \[ A = \begin{pmatrix} @@ -88,7 +83,7 @@ \section{线性映射矩阵表示} \end{pmatrix} \] -回顾第一章对线性方程的两种表示,一种是写成若干条方程,从行看去,每一行反映了输出的一项如何由输入线性组合得来. 另一种是像\autoref{线性方程的向量表示}中一样写成一条向量方程 $x_1\beta_1 + x_2\beta_2 + \cdots + x_n\beta_n = 0$,从列看去,每一列反映了输入的每一项会对输出产生怎么样的影响. +回顾第一章对线性方程的两种表示,一种是写成若干条方程,从行看去,每一行反映了输出的一项如何由输入线性组合得来. 另一种是像\eqref{eq:线性方程的向量表示}中一样写成一条向量方程 $x_1\beta_1 + x_2\beta_2 + \cdots + x_n\beta_n = 0$,从列看去,每一列反映了输入的每一项会对输出产生怎么样的影响. 我们注意到虽然证明过程中我们假设了 $\sigma(e_j) = (a_{1j}, a_{2j}, \ldots, a_{mj})^{\mathrm{T}}$,但是即使把矩阵的列改成任意向量空间 $V$ 中的向量而非 $\mathbf{R}^m$ 中的向量也并不改变论证的有效性,也就是说矩阵的列完全可以被替换为任意向量空间中的元素,这样我们也就得到了 $\mathbf{R}^n \to V$ 的映射的一般表示方法——写成长度为 $n$ 的一行,每列分别是一个向量,例如当 $V = \mathbf{R}[x]_4$ 时,我们可以写出 \[ @@ -99,11 +94,22 @@ \section{线性映射矩阵表示} 我们可以将上面的运算称作使用 $\mathbf{F}^n$ 中向量的系数对一个向量组做线性组合. 特别地,由于基底也是一个向量组,当 $A$ 作为 $n$ 维向量空间 $V$ 的一个基底时,它作为 $\mathbf{F}^n\to V$ 的同构将坐标映射到空间中对应的点,和将点映射到坐标的坐标映射 $V\to\mathbf{F}^n$ 互为逆映射. 如果回顾\hyperlink{基底的矩阵写法}{基底的矩阵写法}我们便会发现前面的符号和此处达成了统一. -我们有一些常用的矩阵,例如零矩阵,即所有元素均为0的矩阵,通常记为$O$;单位矩阵也十分常见,它表示对角线上元素为1,其余元素为0的矩阵,通常记为$E$(若已知阶数为$n$也可特别记为$E_n$)其第 $j$ 列恰好为标准基底中的 $e_j$. +我们有一些常用的矩阵,例如零矩阵,即所有元素均为0的矩阵,通常记为$O$;单位矩阵也十分常见,它表示对角线上元素为1,其余元素为0的矩阵,通常记为$E$(若已知阶数为$n$也可特别记为$E_n$)其第 $j$ 列恰好为自然基中的 $e_j$. 除此之外,我们通常记域$\mathbf{F}$上的$m\times n$矩阵全体为$\mathbf{F}^{m\times n}$或$\mathbf{M}_{m\times n}(\mathbf{F})$. 当$m=n$时矩阵称为方阵,域$\mathbf{F}$上全体$n$阶矩阵(或称$n$阶方阵)记为$\mathbf{F}^{n\times n}$或$\mathbf{M}_n(\mathbf{F})$. -在了解矩阵的定义之后,我们可以引入线性映射矩阵表示的概念. 经过前面大量的关于坐标同构的铺垫之后,想必读者对于如何将抽象的映射转化为矩阵有一个大致的思路,将一般的向量空间同构到我们熟悉的 $\mathbf{F}^n$,然后就可以得到矩阵表示. 但是在这之前笔者认为需要带读者了解交换图的基本工具 +在了解矩阵的定义之后,我们可以引入线性映射矩阵表示的概念. 经过前面大量的关于坐标同构的铺垫之后,想必读者对于如何将抽象的映射转化为矩阵有一个大致的思路,将一般的向量空间同构到我们熟悉的 $\mathbf{F}^n$,然后就可以得到矩阵表示. 但是在这之前笔者认为需要带读者了解交换图的基本工具: + +\begin{definition}{交换图}{} + 我们首先定义什么是一个\term{图(diagram)}. 一个图可以视为以一个代数结构(例如线性空间)为顶点,以某种映射(例如线性映射)为边的图,例如: + \begin{center} + \begin{tikzcd} + V_1 \arrow[r, "\sigma_1"] \arrow[rd, "\sigma_3"'] & V_2 \arrow[d, "\sigma_2"] \\ + & V_3 + \end{tikzcd} + \end{center} + 如果我们称一个图是\term{交换的(commutative)},则意味着对于图中的任意两个顶点间的任意两条有向路径,路径上映射的复合结果相同. 例如上图中,我们考察从$V_1$到$V_3$的两条路径,则如果$\sigma_2\circ\sigma_1=\sigma_3$,这个图是交换的. +\end{definition} 我们把空间抽象出来称为一个节点,空间之间的函数用箭头来表示,例如,如果有映射 $\psi\colon V_1 \to V_2, \sigma\colon V_2 \to V_3$,那么我们可以绘制交换图 \[ @@ -123,7 +129,9 @@ \section{线性映射矩阵表示} 从图中我们可以读出 $\sigma\circ(\rho\circ\psi) = (\sigma\circ\rho)\circ\psi$,即映射复合的结合律. 自此,构造出指定的映射就可以图形化地表示成在图上画箭头,只要能够找到两个节点之间的一条通路,就能够通过映射的复合构造出一个映射. -接下来回到一般的线性映射. 我们知道一个 $\mathbf{F}$ 上的 $m\times n$ 矩阵可以作为一个 $\mathbf{F}^n\to\mathbf{R}^m$ 的映射,所以矩阵对应的应该是从 $\mathbf{F}^n$ 指向 $\mathbf{F}^m$ 的箭头. 一个向量组可以作为一个 $\mathbf{F}^n\to V$ 的映射,所以一个 $n$ 元向量组对应一条 $\mathbf{F}^n$ 指向 $V$ 的箭头. 对于基底这种特殊的向量组,其特性是可逆,于是在 $\mathbf{F}^n\to V$ 外可以另外添加一条反向的箭头表示坐标映射. 不妨设 $V_1$ 是 $\mathbf{F}$ 上的 $n$ 维向量空间,而 $V_2$ 是 $\mathbf{F}$ 上的 $m$ 维向量空间. 为了把映射 $\sigma\colon V_1\to V_2$ 用矩阵表示,我们需要先取两个基底:$B_1 = (\varepsilon_1, \varepsilon_2, \ldots, \varepsilon_n)\colon \mathbf{F}^n\to V_1$ 和 $B_2 = (\alpha_1, \alpha_2, \ldots, \alpha_m)\colon\mathbf{F}^m\to V_2$. 根据上面的两组基和一个映射画出交换图 +\section{线性映射矩阵表示} + +接下来回到一般的线性映射. 我们知道一个 $\mathbf{F}$ 上的 $m\times n$ 矩阵可以作为一个 $\mathbf{F}^n \to \mathbf{F}^m$ 的映射,所以矩阵对应的应该是从 $\mathbf{F}^n$ 指向 $\mathbf{F}^m$ 的箭头. 一个向量组可以作为一个 $\mathbf{F}^n\to V$ 的映射,所以一个 $n$ 元向量组对应一条 $\mathbf{F}^n$ 指向 $V$ 的箭头. 对于基底这种特殊的向量组,其特性是可逆,于是在 $\mathbf{F}^n\to V$ 外可以另外添加一条反向的箭头表示坐标映射. 不妨设 $V_1$ 是 $\mathbf{F}$ 上的 $n$ 维向量空间,而 $V_2$ 是 $\mathbf{F}$ 上的 $m$ 维向量空间. 为了把映射 $\sigma\colon V_1\to V_2$ 用矩阵表示,我们需要先取两个基底:$B_1 = (\varepsilon_1, \varepsilon_2, \ldots, \varepsilon_n)\colon \mathbf{F}^n\to V_1$ 和 $B_2 = (\alpha_1, \alpha_2, \ldots, \alpha_m)\colon\mathbf{F}^m\to V_2$. 根据上面的两组基和一个映射画出交换图 \[ \tikzcdset{arrow style=tikz, diagrams={>=stealth}} \begin{tikzcd} @@ -576,8 +584,6 @@ \subsection{同构的说明} \end{pmatrix},\] 事实上,我们很容易验证这样的常用基的确是线性空间$\mathbf{F}^{m\times n}$的一组基,因为它们显然是线性无关的,且张成整个空间(请读者自行验证),然后我们也知道这样的常用基中矩阵有$m\times n$个,由此我们也得到了$\dim\mathcal{L}(V_1,V_2)=mn$. 当然我们还可以有另一种理解方式,如果读者已经学习过编程中二维数组的概念,事实上二维数组在计算机中的存储形式是一行存完接着马上存下一行,因此事实上我们可以将二维数组看作是一个长为$m\times n$的一维数组(方法就是第一行写完后在同一行马上接着写第二行元素,写完后在同一行接着写第三行元素,依此类推),因此我们也可以理解为$\mathbf{F}^{m\times n}$和$\mathbf{F}^{mn}$是没有区别的(容易验证是同构的),因此$\dim\mathbf{F}^{m\times n}=mn$. -\section{线性映射与矩阵的进一步讨论} - \begin{summary} 在上一讲同构中我们已经知道,两个(有限维)线性空间中的元素是向量还是多项式还是函数并不是核心差别,只要它们维数相同,我们就可以遮蔽掉元素的差别——因为它们都可以通过坐标映射同构于 $\mathbf{F}^n$,因此一切线性空间在坐标作用下都变成了向量空间,变成了最直观的可以用一个一个数字写出来的向量,而本讲我们正基于此将所有无论多么抽象的线性映射也表示成能用一个一个数字写出来的东西,即所谓的矩阵. 我们利用坐标映射将之前抽象的线性空间和线性映射转化为具象的数字表达,使得我们之后的研究更加具体. @@ -605,7 +611,7 @@ \section{线性映射与矩阵的进一步讨论} & & & 1 & a_n \end{pmatrix} \] 是 $ T $ 关于基 $ B $ 的表示矩阵. - + $ T $ 是同构 $ \iff T $ 是双射 $ \iff r(T) = n $,满秩. 所以当 $ a_1 \neq 0 $ 时,$ r(T) = n $ 满秩,此时 $ T $ 是同构映射. \end{answer} @@ -617,11 +623,11 @@ \section{线性映射与矩阵的进一步讨论} \item 设$f=1+2x+3x^2$,求$\sigma(f)$. \end{enumerate} - + \begin{answer} \begin{enumerate} \item 只需要证明$f_1,f_2,f_3$是线性无关的即可,事实上,这也十分显然(考虑其在$1,x,x^2$下的坐标表示线性无关),想必读者可以自行证明 - + \item 方法一:设 $ (\sigma(f_1), \sigma(f_2), \sigma(f_3)) = (f_1, f_2, f_3) A $,则由 \[ (\sigma(f_1), \sigma(f_2), \sigma(f_3)) = (1, x, x^2) \begin{pmatrix} 2 & 0 & 1 \\ @@ -660,7 +666,7 @@ \section{线性映射与矩阵的进一步讨论} -1 & -1 & -1 \end{pmatrix} \end{align*} - + 方法二:通过待定系数法解方程组 \[ \begin{cases} \sigma(f_1) = -f_1 + 3 f_2 - f_3 \\ @@ -673,7 +679,7 @@ \section{线性映射与矩阵的进一步讨论} 3 & 2 & 3 \\ -1 & -1 & -1 \end{pmatrix} \] - + \item \begin{align*} \sigma(f) & = \sigma\left((1, x, x^2) \begin{pmatrix} 1 \\ 2 \\ 3 \end{pmatrix}\right)= \sigma\left((f_1, f_2, f_3) @@ -704,7 +710,7 @@ \section{线性映射与矩阵的进一步讨论} \begin{pmatrix} -4 \\ 3 \\ 2 \end{pmatrix} \\ & = 2x^2 + 3x - 4 \end{align*} - + 或也可采用待定系数法求出 $ f = -2 f_1 + 3 f_2 $,所以 $ \sigma(f) = -2 \sigma(f_1) + 3 \sigma(f_2) = 2x^2 + 3x - 4 $. \end{enumerate} \end{answer} @@ -731,9 +737,9 @@ \section{线性映射与矩阵的进一步讨论} & = k_1 \varphi(X) + k_2 \varphi(Y) \end{align*} 所以 $ \varphi $ 是 $ \mathbf{M}_2(\mathbf{R}) $ 上的线性映射. - + \item 证明:易知 $ B $ 可逆. 当 $ \lambda = -1 $ 时,$ A $ 可逆. 故 $ \varphi $ 可逆,$ \varphi^{-1}(X) = A^{-1} X B^{-1} $. - + \item $ \lambda = -1 $ 时,取 $ V $ 的一组基 $ \alpha_1 = \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix}, \alpha_2 = \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix}, \alpha_3 = \begin{pmatrix} 0 & 0 \\ 1 & 0 \end{pmatrix}, \alpha_4 = \begin{pmatrix} 0 & 0 \\ 0 & 1 \end{pmatrix} $,有 \begin{gather*} \begin{aligned} @@ -743,14 +749,14 @@ \section{线性映射与矩阵的进一步讨论} \ker \sigma = \spa\left(\begin{pmatrix} 2 & -3 \\ 0 & 1 \end{pmatrix}, \begin{pmatrix} 1 & 0 \\ 1 & 0 \end{pmatrix}\right) \end{gather*} (步骤略,答案不唯一) - + \item 取 $ \begin{pmatrix} 1 & 2 \\ -1 & -2 \end{pmatrix}, \begin{pmatrix} -1 & -1 \\ 1 & 1 \end{pmatrix}, \alpha_3, \alpha_4 $ 即可. 此时矩阵为$ \begin{pmatrix} 2 & -2 & -1 & 0 \\ 4 & -2 & 0 & 1 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{pmatrix} $. (答案不唯一) - \end{enumerate} + \end{enumerate} \end{answer} \item 设矩阵空间$\mathbf{R}^{2\times 2}$的子空间为 @@ -803,7 +809,7 @@ \section{线性映射与矩阵的进一步讨论} d = 0 \end{cases} \implies f(x) = t(x^3 - x) \] 故 $ N(T) = \spa(x^3 - x) $. - + 求像空间,取 $ \mathbf{R}[x]_4 $ 的自然基 $ 1, x, x^2, x^3 $. \[ \begin{matrix} T(1) = \begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix} & T(x) = \begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix} \\ @@ -821,7 +827,7 @@ \section{线性映射与矩阵的进一步讨论} \implies{} & k_1 = k_2 = k_3 = 0 \end{align*} 故 $ T(1), T(x), T(x^2) $ 线性无关. 故 $ R(T) = \spa\left(\begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix}, \begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix}, \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\right) $. - + \item 我们只需要将$2 \times 2$矩阵的第二列拼到第一列下方就可以变为我们熟悉的列向量形式,所以其矩阵表示也是简单的 \[ T(1,x,x^2,x^3)=(e_1,e_2,e_3,e_4)\begin{pmatrix} @@ -845,7 +851,7 @@ \section{线性映射与矩阵的进一步讨论} \item 证明:$\xi_1,\xi_2,\xi_3$线性无关. \end{enumerate} - + \begin{answer} \begin{enumerate} \item 对非齐次线性方程组$AX=\xi_1$,\\ @@ -935,14 +941,14 @@ \section{线性映射与矩阵的进一步讨论} \begin{answer} 证明:\begin{enumerate} \item 由于 $ \ker \sigma = \im \sigma $,由 $ \dim \im \sigma + \dim \ker \sigma = \dim V $ 可得. - + \item 设 $ \beta_1, \ldots, \beta_n $ 为 $ V $ 的一组基,则 \[ \im \sigma = \spa(\sigma(\beta_1), \ldots, \sigma(\beta_n)) = \ker \sigma \] 设 $ \sigma(\beta_1), \ldots, \sigma(\beta_{\frac{n}{2}}) $ 为 $ \im \sigma $ 的基,则可以证明 \[ \sigma(\beta_1), \ldots, \sigma(\beta_{\frac{n}{2}}), \beta_1, \ldots, \beta_{\frac{n}{2}} \] 线性无关,且 $ \sigma $ 在此基下的矩阵即为所求的形式. \end{enumerate} - + \end{answer} \end{exgroup} diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/7 \347\237\251\351\230\265\350\277\220\347\256\227\345\237\272\347\241\200.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/8 \347\237\251\351\230\265\350\277\220\347\256\227\345\237\272\347\241\200.tex" similarity index 84% rename from "\350\256\262\344\271\211/\344\270\223\351\242\230/7 \347\237\251\351\230\265\350\277\220\347\256\227\345\237\272\347\241\200.tex" rename to "\350\256\262\344\271\211/\344\270\223\351\242\230/8 \347\237\251\351\230\265\350\277\220\347\256\227\345\237\272\347\241\200.tex" index 9d4bea8..f430148 100644 --- "a/\350\256\262\344\271\211/\344\270\223\351\242\230/7 \347\237\251\351\230\265\350\277\220\347\256\227\345\237\272\347\241\200.tex" +++ "b/\350\256\262\344\271\211/\344\270\223\351\242\230/8 \347\237\251\351\230\265\350\277\220\347\256\227\345\237\272\347\241\200.tex" @@ -2,23 +2,27 @@ \chapter{矩阵运算基础} 上一节我们将前面逐步搭建的线性空间与线性映射的抽象转变为具象的表达——矩阵——这是我们上一节最后内容总结中提到的利用坐标映射同构到最简单的向量空间的优越性的体现. 从本讲起的三讲内容中,我们的目光都会聚焦于具象的矩阵,但我们的视角时常会结合线性映射同步进行. 本讲我们首先介绍矩阵的基本运算的定义(及其与线性映射的关联)、性质与基本技巧,之后我们会在此基础上从线性映射的秩出发定义矩阵的秩,得到第一个重要的矩阵标准形——相抵标准形. 最后我们会更进一步加强运算技巧,介绍一些在解题或者是实际应用中常用的矩阵运算技巧. -\section{矩阵乘法} +\section{矩阵乘法} \label{sec:矩阵乘法} \subsection{矩阵乘法的定义与基本性质} 我们在前文证明过线性映射的复合仍然是线性映射,当我们写出 $(\tau{\color{lightgray}\circ}\sigma)(\alpha) = \tau(\sigma(\alpha))$ 时我们通过映射复合定义了映射的乘法(只有这样才能在形式上说结合律成立). 于是矩阵作为一种特殊的映射,其乘法应当继承自矩阵的复合,我们注意到映射 $\tau\sigma$ 能够存在的条件是 $\tau$ 的出发空间和 $\sigma$ 的到达空间相同,即两个映射可以通过一个公共的中间空间``连接''起来 + \[ \tikzcdset{arrow style=tikz, diagrams={>=stealth}} \begin{tikzcd} - V_1 \arrow[r, "\sigma"] \arrow[rr, bend right, "\tau{\color{lightgray}{}\circ{}}\sigma"'] & V_2 \arrow[r, "\tau"] & V_3 + V_1 \arrow[r, "\sigma"] \arrow[rd, "\tau \circ \sigma"'] & V_2 \arrow[d, "\tau"] \\ + & V_3 \end{tikzcd} \] 我们假设读者已经熟知映射的相乘即复合,在后文中我们将会省去映射复合的符号 ${\color{lightgray}\circ}$. 那么将 $V_1, V_2, V_3$ 分别替换为我们熟悉的 $\mathbf{F}^n, \mathbf{F}^m, \mathbf{F}^p$,我们就理应能够将 $p\times m$ 和 $m\times n$ 的两个矩阵相乘 + \[ \tikzcdset{arrow style=tikz, diagrams={>=stealth}} \begin{tikzcd} - \mathbf{F}^n \arrow[r, "B"] \arrow[rr, bend right, "AB"'] & \mathbf{F}^m \arrow[r, "A"] & \mathbf{F}^p + \mathbf{F}^n \arrow[r, "B"] \arrow[rd, "AB"'] & \mathbf{F}^m \arrow[d, "A"] \\ + & \mathbf{F}^p \end{tikzcd} \] @@ -106,12 +110,8 @@ \subsection{矩阵乘法的定义与基本性质} \item 则 $\tau\sigma \in L(V_1,V_3)$ 关于基 $B_1$ 和 $B_3$ 的矩阵 $C=(c_{ij})_{p\times n}$ 中第 $j$ 列元素 $c_{1j},c_{2j},\ldots,c_{pj}$ 是 $\tau\sigma(\varepsilon_j)$ 在基 $B_3$ 下的坐标. 于是有: \begin{align*} - \tau\sigma(\varepsilon_j) - &=\tau(\sigma(\varepsilon_j)) - &=\tau\left(\sum_{k=1}^{m}b_{kj}\zeta_k\right) \\ - &=\sum_{k=1}^{m}b_{kj}\tau(\zeta_k) \\ - &=\sum_{k=1}^{m}b_{kj}\left(\sum_{i=1}^{p}a_{ik}\eta_i\right) \\ - &=\sum_{i=1}^{p}\left(\sum_{k=1}^{m}a_{ik}b_{kj}\right)\eta_i + \tau\sigma(\varepsilon_j) &= \tau(\sigma(\varepsilon_j)) \\ + &= \tau\left(\sum_{k=1}^{m}b_{kj}\zeta_k\right) = \sum_{k=1}^{m}b_{kj}\tau(\zeta_k) = \sum_{k=1}^{m}b_{kj}\left(\sum_{i=1}^{p}a_{ik}\eta_i\right) = \sum_{i=1}^{p}\left(\sum_{k=1}^{m}a_{ik}b_{kj}\right)\eta_i \end{align*} 即得:$c_{ij}=a_{i1}b_{1j}+a_{i2}b_{2j}+\cdots+a_{im}b_{mj}$. 换言之,表示矩阵的乘积等于乘积(复合)的表示矩阵,这也可以通过映射的复合得到简单的验证 @@ -119,61 +119,29 @@ \subsection{矩阵乘法的定义与基本性质} \mathbf{M}_{\color{lightgray} B_2, B_3} (\tau) \mathbf{M}_{\color{lightgray} B_1, B_2} (\sigma) &= (B_3^{-1} \tau B_2) (B_2^{-1} \sigma B_1) \\ &= B_3^{-1} \tau (B_2 B_2^{-1}) \sigma B_1 \\ - &= B_3^{-1} (\tau \sigma) B_1 \\ - &= \mathbf{M}_{\color{lightgray} B_1, B_3} (\tau \sigma) + &= B_3^{-1} (\tau \circ \sigma) B_1 \\ + &= \mathbf{M}_{\color{lightgray} B_1, B_3} (\tau \circ \sigma) \end{align*} - 如果从交换图的视角看,我们可以通过绘制箭头简单地看出,根据映射复合构造出的三个表示矩阵显然满足 $\mathbf{M}_{\color{lightgray} B_2, B_3} (\tau) \mathbf{M}_{\color{lightgray} B_1, B_2} (\sigma) = \mathbf{M}_{\color{lightgray} B_1, B_3} (\tau \sigma)$: + 如果从交换图的视角看,我们可以通过绘制箭头简单地看出,根据映射复合构造出的三个表示矩阵显然满足 $\mathbf{M}_{\color{lightgray} B_2, B_3} (\tau) \mathbf{M}_{\color{lightgray} B_1, B_2} (\sigma) = \mathbf{M}_{\color{lightgray} B_1, B_3} (\tau \circ \sigma)$: \[ \tikzcdset{arrow style=tikz, diagrams={>=stealth}} \begin{tikzcd} - V_1 - \arrow[rr, "\sigma"] - \arrow[rrrr, bend left, "\tau\sigma"] - \arrow[d, shift left, lightgray, "B_1^{-1}"] - && V_2 - \arrow[rr, "\tau"] - \arrow[d, shift left, lightgray, "B_2^{-1}"] - && V_3 - \arrow[d, shift left, lightgray, "B_3^{-1}"] - \\ \mathbf{F}^n - \arrow[u, shift left, "B_1"] - \arrow[rrrr, bend right, "\mathbf{M}_{\color{lightgray} B_1, B_3} (\tau\sigma)"'] - \arrow[rr, "\mathbf{M}_{\color{lightgray} B_1, B_2} (\sigma)"'] - && \mathbf{F}^m - \arrow[u, shift left, "B_2"] - \arrow[rr, "\mathbf{M}_{\color{lightgray} B_2, B_3} (\tau)"'] - && \mathbf{F}^p - \arrow[u, shift left, "B_3"] + & V_1 \arrow[rrr, "\sigma"] \arrow[rrrdd, near start, "\tau \circ \sigma"] & & & V_2 \arrow[dd, "\tau"] \\ + \mathbf{F}^n \arrow[rrr, "\mathbf{M}_{\color{lightgray} B_1, B_2} (\sigma)", crossing over] \arrow[ru, leftrightarrow] \arrow[rrrdd, "\mathbf{M}_{\color{lightgray} B_1, B_3} (\tau \circ \sigma)", swap] & & & \mathbf{F}^m \arrow[dd, "\mathbf{M}_{\color{lightgray} B_2, B_3} (\tau)", crossing over, swap] \arrow[ru, leftrightarrow] \\ + & & & & V_3 \\ + & & & \mathbf{F}^p \arrow[ru, leftrightarrow] \end{tikzcd} \] - 但是需要注意的是,这要求在两个映射矩阵表示的基底选择中,$V_2$ 选取的基底是相同的,否则这个过程就会失败,基底不同时我们就无法写出 $\mathbf{M}(\tau)\mathbf{M}(\sigma) = \mathbf{M}(\tau\sigma)$ + 但是需要注意的是,这要求在两个映射矩阵表示的基底选择中,$V_2$ 选取的基底是相同的,否则这个过程就会失败,基底不同时我们就无法写出 $\mathbf{M}_{\color{lightgray} B_2, B_3}(\tau)\mathbf{M}_{\color{lightgray} B_1, B'_2}(\sigma) = \mathbf{M}_{\color{lightgray} B_1, B_3}(\tau\sigma)$ \[ \tikzcdset{arrow style=tikz, diagrams={>=stealth}} \begin{tikzcd} - & V_1 - \arrow[rd, "\sigma"] - \arrow[rr, "\tau\sigma"] - \arrow[dl, shift left, lightgray, "B_1^{-1}"] - && V_3 - \arrow[dr, shift left, lightgray, "B_3^{-1}"] - \\ \mathbf{F}^n - \arrow[ur, shift left, "B_1"] - \arrow[rrrr, bend right=90, "\mathbf{M}_{\color{lightgray} B_1, B_3} (\tau\sigma)"'] - \arrow[rd, "\mathbf{M}_{\color{lightgray} B_1, B_2} (\sigma)"'] - && V_2 - \arrow[ur, "\tau"] - \arrow[dl, shift left, lightgray, "B_2^{-1}"] - \arrow[dr, shift left, lightgray, "(B_2')^{-1}"] - && \mathbf{F}^p - \arrow[ul, shift left, "B_3"] - \\ & \mathbf{F}^m - \arrow[ur, shift left, "B_2"] - \arrow[rr, dashed, "?"'] - && \mathbf{F}^m - \arrow[ul, shift left, "B_2'"] - \arrow[ur, "\mathbf{M}_{\color{lightgray} B_2', B_3} (\tau)"'] + & V_1 \arrow[rrrr, "\sigma"] \arrow[rrrrdd, near start, "\tau \circ \sigma"] & \quad & & & V_2 \arrow[dd, "\tau"] \arrow[dddlllll, leftrightarrow] \\ + \mathbf{F}^n \arrow[rrrr, "\mathbf{M}_{\color{lightgray} B_1, B_2} (\sigma)", crossing over] \arrow[dd] \arrow[ru, leftrightarrow] \arrow[rrrrdd, "\mathbf{M}_{\color{lightgray} B_1, B_3} (\tau \circ \sigma)", swap, near end, crossing over] & & \quad & & \mathbf{F}^m \arrow[dd, "\mathbf{M}_{\color{lightgray} B_2, B_3} (\tau)", crossing over, swap] \arrow[ru, leftrightarrow] \\ + & & & & & V_3 \\ + \mathbf{F}^m \arrow[rrrr] & & & & \mathbf{F}^p \arrow[ru, leftrightarrow] \end{tikzcd} \] \end{enumerate} @@ -253,7 +221,7 @@ \subsection{矩阵乘法的定义与基本性质} 在本节最后,我们有四个非常重要的问题需要仔细探讨: \begin{enumerate} - \item 在有了矩阵乘法的定义后,高斯消元法中我们将线性方程组简记为$AX=b$实际上是相当自然的,除此之外,我们将向量坐标表示为列向量的形式,例如将向量 $v$ 对基 $\alpha$ 分解 + \item 在有了矩阵乘法的定义后,高斯-若当消元法中我们将线性方程组简记为$AX=b$实际上是相当自然的,除此之外,我们将向量坐标表示为列向量的形式,例如将向量 $v$ 对基 $\alpha$ 分解 \[v=(\alpha_1,\alpha_2,\ldots,\alpha_n)\begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}\] @@ -577,7 +545,7 @@ \subsection{逆矩阵的求解(基本方法I)} \end{example} \begin{solution} - 以 $A$ 为系数矩阵的非齐次线性方程组 $AX=b$,对于任意的 $b=(b_1,b_2,b_3)$,可以用高斯消元法将其增广矩阵 + 以 $A$ 为系数矩阵的非齐次线性方程组 $AX=b$,对于任意的 $b=(b_1,b_2,b_3)$,可以用高斯-若当消元法将其增广矩阵 \[(A,b)=\left(\begin{array}{ccc:c} 1 & -1 & 1 & b_1 \\ @@ -681,7 +649,7 @@ \subsection{基本定义与性质} \end{pmatrix}$. \end{solution} -关于转置我们还有一个重要的例题需要读者掌握: +关于转置我们有一个重要的例题需要读者掌握: \begin{example}{}{转置求幂} 设$\alpha=(1,-1,2)^\mathrm{T},\enspace\beta=(3,1,-2)^\mathrm{T},\enspace A=\alpha\beta^\mathrm{T}$,求$A^n$. \end{example} @@ -694,6 +662,27 @@ \subsection{基本定义与性质} 事实上,在将来讲解矩阵运算技巧时我们还会大量运用本题的技巧,因此请读者务必重视本题. 除此之外,此前的所有矩阵运算我们都介绍了它们在线性映射中的对应,转置具备一定的特殊性,因为转置后的矩阵行列数交换,这意味着原先的线性映射出发空间和到达空间的维数交换,这使得对它的解读会更加复杂,我们需要以将来对偶空间的语言来讨论. +\begin{example}{}{} + 数域$\mathbf{F}$上所有$n$阶方阵组成的线性空间$V=\mathbf{M}_n(\mathbf{F})$,$V_1$表示所有对称矩阵组成的集合,$V_2$表示所有反对称矩阵组成的集合. 证明:$V_1,V_2$都是$V$的子空间,且$V=V_1\oplus V_2$. +\end{example} + +\begin{proof} + 首先证明和. 事实上,对于任意矩阵$A\in V$,有 + \[A=B+C,\enspace B=\frac{1}{2}(A+A^T),\enspace C=\frac{1}{2}(A-A^T),\] + 其中$B$是对称矩阵,$C$是反对称矩阵,即$B\in V_1$,$C\in V_2$,因此$V_1+V_2=V$(因为$V$中任意元素都可以写成$V_1$和$V_2$元素和的形式,根据和的定义可知成立). + + 下面证明直和. 我们有如下三种方法: + \begin{enumerate} + \item 利用零向量分解唯一:设$O$是$n$阶零矩阵,设$O=B+C$,其中$B$是对称矩阵,$C$是反对称矩阵. 由于$B$是对称矩阵,因此$B^T=B$,由于$C$是反对称矩阵,因此$C^T=-C$,因此 + \[O=O^T=(B+C)^T=B^T+C^T=B-C\] + 解得$B=C=O$,因此零向量分解唯一,故直和得证; + + \item 利用$V_1\cap V_2=\{0\}$:设$A\in V_1\cap V_2$,则$A=A^T=-A$,因此$A=-A$,即$A=O$,因此$V_1\cap V_2=\{0\}$,故直和得证; + + \item 利用$\dim V_1+\dim V_2=\dim V$:这一方法较为复杂,我们简单阐述思想. 设$E_{ij}$是第$i$行第$j$列元素为1,其余元素为0的矩阵,则$V$的一组基为$E_{ij},\enspace i,j=1,2,\ldots,n$,$V_1$的一组基为$E_{ij}+E_{ji},\enspace i