Advertisement

线性代数的本质(二)

阅读量:

1、矩阵与线性变换

1)线性变换

首先让我们解析这个术语 线性变换 的含义。从字面来看,“变换”这一表述与“函数”的概念存在某种表面差异。实际上,“变换”这一表述在数学领域有着特定的用法和内涵。“函数”侧重于映射关系的描述而“变换”则更多地体现了操作过程中的动态变化特性。特别地,在探讨线性代数时,“变换”通常指的是将一个向量转换为另一个向量的过程

通过运动概念来理解这种「向量函数」的方式是可行的。当一个变换接受一个输入向量并同时生成一个输出向量时, 我们设想将这个输入向量移至输出位置

在下一步深入理解这一过程时,在脑海中想象每个输入都会发生的变化的位置变化是有帮助的。当我们把向量视为箭头时,在平面中放置这些箭头可能会显得过于密集了。考虑到所有二维向量的数量众多,在上文中我们已经了解到

通过这种方法分析各个输入向量分别被映射至相应的输出向量位置时,请问只需关注空间内各点的运动轨迹

在二维空间变换的过程中,在深入地探讨整个空间形状上的改变时

变换有多种多样,其中有些十分美妙,如下图所示。

我们能够想象到任何一种变化都可能极其复杂,在Linear Algebra中对这类变化进行了严格限定

2)线性变换的数值描述–矩阵

为此,我们应该考虑通过数值来表示这些变换的方式。实际上我们只需记录下来两个基向量变换后的位置即可完成这个任务。

举个例子说明:我们来分析一个具体的向量v = (-1, 2)的情况。在应用某种线性变换之后,并跟踪这三个关键向量——i帽、j帽以及v自身的运动轨迹。经过这种变换后得到的新向量实际上仅仅是经过同样的线性组合运算后的结果。这表明你只需关注于这两个基底向量的变化情况即可推导出整个空间的线性变化效果。

因此,在二维线性变换中只需要四个参数即可完成表示–>i单位向量以及j单位向量在经过该线性变换后的坐标值分别为两组二维数值数据。将这些数值系统地排列成一个二维数组的形式即构成了我们所说的二维矩阵形式,并将其统称为矩阵结构。这种矩阵形式是最能描述这种线性变换过程的关键工具之一。

当你面对一个二维空间中的线性变换及其对应的2 \times 2矩阵时,并给定一个相应的向量v时,则想知道该线性变换对该向量v的影响只需提取该向量各个分量化成分解形式并将其分别与矩阵中对应的列进行点积运算随后求得各点积结果并完成总和运算即可得到新的转换后的结果这一过程与其基于基底矢量化简的思想具有相似之处_注:矩阵只是一个符号化的表示 它实质上记录了一个完整的线性变换信息_

总体而言, 线性变换是一种用于操作空间的技术手段. 这种技术手段通过保持网格线既平行又等距分布, 并将原点固定在原位来实现. 有趣的是, 这种方法只需用一组简单的数值就能表示, 这些数值即代表基向量在新坐标系中的位置. 将这些数值作为列排列起来形成一个矩阵, 则为我们提供了一种简洁而有力的方式来描述线性变换的本质. 关键在于理解每个矩阵所代表的具体空间变换

2、矩阵乘法与线性变换复合

1)线性变换复合

如果对一个向量先进行一次旋转变换,再进行一次剪切变换 ,如下图所示:

在这里插入图片描述

为了实现通过旋转矩阵和剪切矩阵来进行计算的目的,在解决这一问题时, 我们将这一过程称为矩阵相乘的过程.

2)矩阵的乘法

在我们的研究过程中发现,在矩阵乘法运算中,默认的操作顺序是从右向左进行(这一基本常识的重要性不容忽视)。通过进一步分析与思考发现其形式与复合函数f(g(x))相吻合。
当我们需要解决矩阵乘法问题时,请问是否还记得那个稍显复杂的求解公式?如果忘记了一些关键点或细节,则可以考虑以下一种易于理解且终身难忘的方法:

在这里插入图片描述

M1矩阵的第一列体现了i帽变换后的空间位置。首先将其分离出来作为基准向量,并将它视为经过i帽变换后的新的基准向量进行下一步转换(按照同样的规则),如图所示。同样地,在三维坐标系中这一规律仍然适用。

3、行列式

1)行列式的定义

我们注意到,有一些变换在结果上拉伸了 整个网格,有一些则是压缩 了,那如何度量这种压缩和拉伸呢?或者换一种更容易思考的表达,某一块面积的缩放比例是多少?
根据我们之前讲的基向量,我们只需要知道 i帽和j帽组成的面积为1的正方形面积缩放了多少就代表所有的情况。因为线性变换有一个性质:网格线保持平行且等距分布
所以,这个特殊的缩放比例 ,即线性变换对面积产生改变的比例 ,就是行列式

在这里插入图片描述

特别地需要注意的是,在这种情况下:当一个矩阵的行列值等于零时,则该矩阵将这个空间进行降维处理,并且其列向量必然满足线性相关的关系。其中:正负号表示方向的变化与相对位置关系的变化情况类似于一张纸张翻转的方向差异;例如,在二维空间中:j单位向量原本处于i单位向量左侧的位置,在经过某种变换操作后处于右侧的位置时就需要引入负号来进行表示;扩展到三维空间的情况下:按照右手定则确定的标准坐标系下默认采用右手法则来进行定位;而若采用左手法则则需要按照左撇子的方式来确定相应的方向关系

2)行列式的计算

在这里插入图片描述

3、逆矩阵、列空间与零空间

本节主要关注的是与计算无关的领域,并非探讨具体的数值运算方法。相关的术语包括高斯消元法(Gaussian elimination)和行阶梯形(Row echelon form)。本节的重点是帮助理解这些概念的几何意义,并将数值计算的任务交由计算机完成。

1)线性方程组

在这里插入图片描述

上图展示了规范化的线性方程组,在标准表达式下表示为Ax=v的形式;其中x代表待求解的向量。通过运用几何直觉分析公式时发现,在经过A矩阵的作用后,变量x的位置正好与向量v重合。

在这里插入图片描述

在应用了矩阵A进行线性变换的情况下

在这里插入图片描述

2)逆矩阵

所谓的逆运算其实就是相反的操作方式。在基向量作为整个空间基本单位的前提下定义下,通过一种矩阵变换方式,将已经经过线性变换处理过的i帽与j帽恢复为原来的i帽与j帽这一过程所使用的特定矩阵即被定义为原矩阵的逆矩阵,直观上可以通过下图理解这一概念的具体实现过程。

在这里插入图片描述

逆矩阵乘原矩阵等于恒等变换,写作

AA−1=I

其中所述的矩阵I是一个基本向量构成的单位矩阵,在其主对角线上所有元素均为1,在其他非主对角线位置上所有元素均为零(这里假设默认情况下,默认位置是左上至右下)

3)列空间

其实这只是一种我们之前一直在强调的概念,在线性方程组中,在数学上我们可以这样表述:所有可能得输出向量Av所构成的集合被称为矩阵A的列空间。为了更好地理解这个术语,“列空间”这个名字有什么含义呢?我们知道矩阵中的每一列为i帽和j帽经过线性变换后的坐标(位置)。也就是说,在这种情况下矩阵A实际上表示的是基向量i帽和j帽经过线性变换后的坐标(位置)。而这些经过变换后的基向量所张成的空间就是所有可能得输出向量Av所在的区域。换句话说:当我们将这些基向量通过线性组合时所能覆盖到的所有点构成了它们张成的空间

在这里插入图片描述

4)秩 Rank

秩是用来表示秩序的概念;联想与秩序的关系程度则是衡量这种关联紧密程度的一种指标。在数学中将矩阵视为线性变换是一种有效的抽象方式;这种关系表明:线性变换后的空间维度即为该变换对应的矩阵秩;而更为精确地讲:一个矩阵的秩即为其列空间的维度。

5)零空间(核)

变换后的像构成了一个空间。
这个矩阵特别强调其作为线性变换的数字表达。
如果还不太清楚的话,请参考下图:

在这里插入图片描述

图1

图1

6)总结

1、从几何角度用一种高级的方式全面阐述线性方程组
2、每个线性方程组都与一个对应的线性变换相联系;当该逆变换存在时,则可以通过应用它来求解该方程组
3、当不存在逆变换时,则通过列空间的概念我们可以明确地知道什么时候该方程组有解
4、零空间的概念则有助于我们系统地了解所有可能得解的集合是什么样的

4、非方阵

1)几何意义

以一个特例为例探讨3×2矩阵的几何意义,在分析列空间时发现:第一列代表i帽在变换后的坐标位置(具有三个坐标值即三维),第二列表示j帽在变换后的坐标位置。综上所述,3×2矩阵的作用在于将二维平面映射至三维空间中 ,具体而言,在第一列中展示了i帽在变换后的坐标位置(具有三个坐标值),而在第二列中展示了j帽在变换后的坐标位置。

在这里插入图片描述

此时从特例到一般化推导, 经过推导可知n×m的几何意义是将m维输入空间映射至n维输出空间上. 需要注意的是, 在此过程中, 输入与输出的概念具有明确的方向性, 即在运算中, 靠右侧的是输入数据, 而靠左侧则是输出结果.

2)非方阵乘法

如果你已经修完过大学阶段的线性代数课程,在学习过程中你可能会遇到一些重要的影响因素,并非所有非方阵都能直接相乘。为了使矩阵乘法成立,两个矩阵之间必须满足特定条件:即第一个矩阵(记作M₁)的列数必须与第二个矩阵(记作M₂)的行数相等;否则这两个矩阵无法进行相乘运算。当我们在几何意义上理解了这一概念后,通过自己推导一次就能深刻理解这一概念:每一行代表输出空间中的一个基向量(对应于变换后的结果),而每一列则代表输入空间中的一个基向量(对应于变换前的基础)。记住这种顺序关系很重要:当我们从右到左阅读时(即先作用右边那个变换再作用左边那个变换),右边那个变换会将输入空间映射到中间空间,在此过程中其输出维度决定了左边那个变换所需的输入维度是否匹配。只有这样整个复合变换才有意义并能够顺利进行计算

全部评论 (0)

还没有任何评论哟~