Advertisement

线性代数的本质

阅读量:

原文链接:https://www.cnblogs.com/TenosDoIt/p/3214096.html

自大学时期起我就开始学习矩阵理论与线性代数基础,在此过程中记下了大量数学公式。然而发现自己始终无法真正深入掌握这一学科的核心内容。然而发现自己对于其中的关键理论和技术却一直缺乏足够的理解与认识。然而幸运的是在偶然间发现了一篇非常有帮助的文章读完后突然间豁然开朗,并深受启发。

比如说,在全国通用工科院校的教学中应用最为广泛的同济线性代数教材(现为第四版),一开始便采用了较为复杂的方式引入了行列式的相关理论,并通过逆序数这一概念来解释其计算原理

非直观且难以理解地定义了一些基本概念——随后是那些极其简单的行列式属性与练习;具体来说,请将这一行乘以一个系数加到另一行上,并对该列进行相应地调整;操作起来相当繁琐——但其实并没有带来任何实质性的简化

这个东西有嘛用。

对于像我这样资质平庸的学生来说,在这里容易感到困惑:对于"这是什么"这样的问题,则常常模棱两可。于是开始以这种方式表演:原本应该深入讲解的知识点却变成了杂耍表演的形式。这未免太过离谱而让人难以置信!于是开始有人选择逃课:更多的同学因为无法忍受这种令人)=>>无奈又无趣的教学方式而选择离开课堂

普通人开始大量抄写作业后陷入困境,并不妙局已经出现逆转。随后的发展可以用一个峰回路转来形容,在此之后看似毫无章法的行为模式竟然出现了同样毫无章法但同样令人赞叹的伟大现象

场论发展到后来……我终于明白,在老师笨拙地用中括号把一堆零散的数字括起来,并且漫不经心地解释道:这个东西叫做矩阵”的时候……我的数学人生才算是真正 started.

改写说明

对那些不够聪明的人来说, 矩阵老大的横行霸道让我备受折磨. 一遇到矩阵, 在阅读中我就如同阿Q见到了假洋鬼子, 实在受不了就选择避开.

然而,并非个案的情况发生在我身上。通常情况下而言,在校学习工程类专业的学生们在首次接触线性代数课程时都会遇到学习上的障碍。这一普遍存在的现象不仅在中国常见,在全球范围内也呈现出一致的趋势。瑞典数学家Lars Garding在其著作《Encounter with》中对此有深刻的论述

在数学领域中:‘如果缺乏对线性代数概念的基本了解,想要进入自然科学领域学习,如今看起来就相当于文盲一般。然而’根据现行国际标准, 线性代数是基于公理化的体系来阐述.

它是属于第二代数学模型体系,在教学实施中会遇到诸多挑战。
实际上,在学习线性代数的过程中,“第二代数学模型”的概念往往潜移默化地被引入。
这可能意味着在应用过程中会遇到新的挑战或问题。

表述方式和抽象性经历了一次全面的提升,在自幼接受"第一代数学模型"教育的情况下(指我们这些学习者),在未被明确告知的情况下。

下进行如此剧烈的paradigm shift,不感到困难才是奇怪的。

工科学生通常需要经过修习一系列后续课程如数值分析、优化理论以及矩阵论等知识后才能逐渐掌握线性代数的应用。然而尽管他们深入理解并熟练掌握线性代数的基本原理和相关方法但在实际应用中仍会面临诸多挑战

利用线性代数作为工具进行科研和应用工作时

1、矩阵究竟是什么东西?

向量被看作是具有n个独立属性的对象之描述方式;那么矩阵又是什么呢?它代表什么意义?

3、如果我们把矩阵视为由列(行)向量组成的新的复合向量的展开形式,则为何这种展开形式能在众多领域中获得如此广泛的运用?特别地,在二维空间中为何其应用如此突出?

假设矩阵中的每个元素本身也是一个向量,则继续扩展一层会形成一个三维的立方体阵列。这是否更具实用性?

我们不禁要问:为何矩阵相乘的方式被定义为这种特殊的形式?然而这一看似奇特的规定,在实践中却展现出了令人惊叹的力量。许多看似毫无关联的问题,在深入探究后竟然都与这一基本法则有着密切联系。

都可以说是矩阵乘法了。难道说,在矩阵乘法规则看似令人费解的地方下面隐藏着世界的某些基本规律吗?如果是的话,则这些基本规律是什么呢?

什么?

6、什么是行列式这一概念?它在数学中扮演着怎样的角色?探讨其内在联系时会发现什么?这种特殊属性的独特性体现在哪里?

不建议认为(这个问题显得很简单且没有必要深入探讨)。即使有必要进行针对mxn矩阵定义行列式的尝试也是可行的(虽然实际上并不需要这样做),因为缺乏必要的理由去进行这样的定义;那么就没有必要去考虑这一问题)。此外

行列式的计算法则看不出与矩阵运算有任何直接关联, 但为何却在多个方面影响了矩阵的本质?难道这一切只是巧合吗

7、矩阵运算为何能够采用分块方法?在实际应用中,分块计算看似随意操作,并非没有依据,请问其背后是否存在特殊原因使其能够奏效?

8、在矩阵转置操作AT中满足(AB)^T = B^T AT,在矩阵求逆操作A{-1}中则满足(AB)^{-1} = B^{-1} A^{-1}。这两种看似毫无关联的操作为何表现出相似的行为?

这仅仅是巧合吗?

9、为什么说

10、特征值和特征向量的本质是什么?它们定义就让人很惊讶,因为

至于用“特征”甚至“本征”来界定?它们刻划的究竟是什么?

这类问题常常让众多熟悉线性代数的人也会感到棘手。就如成年人面对孩童 relentless inquiries,
最终不得不表示'无奈了,
到这里为止'一样

在遇到这类问题时,许多资深玩家在面对这种情况时也只能按照既定的规定来敷衍搪塞,并且接受并牢记这个说法。

但是这类问题如果无法得到解答的话,在我们看来线性代数就是一个令人不快的规则集合,在这种情况下我们会感到自己并不是在学习一门学科

问的事情,则会被无选择地投入一个强制的世界中,在应试压力下不得不赶路,在这其中完全无法体会其中的美好与协调;等到多年之后我们才逐渐明白

认识到这门学问用途广泛,
然而仍然会感到困惑:怎么这么凑巧?
我觉得这是因为我们的线性代数教学中直觉性丧失所导致的结果。
上面这些情况都涉及到了"如何能够"和"怎么才会"这样的问题。

该问题不仅仅依赖于单纯的数学证明来解答是无法令人满意的。举例来说,在论证矩阵分块运算确实可行之后这仍然不足以满足提问者的期望

问题得以解答。他们依然感到不解的是:为什么矩阵分块运算竟然能够行之有效?这是否反映了某种更深层次的原因呢?如果

是后者部分,那么我们可以深入探讨一下矩阵的本质又如何?只要稍微思考一下前面提到的问题,我们就会发现,在线性代数中很多这样的问题并不是单纯依靠数学证明就能解决的。就像我们学过的教材中的知识一样

像书本那样,在各个方面都要求用严格的数学证明来训练人才的过程中,最终培养出来的学生只能停留在熟练操作工具的层面,并不能真正理解其背后的原理和内涵。

自1930年代起法国布尔巴基学派兴起以来推动了现代数学体系的形成其对后世产生了深远的影响特别是在严谨性和系统性的构建方面取得了巨大成就这也使我们接受的基础教育在教学规范上得到了显著提升然而整个数学领域的发展现状

其作为一门学科而存在的一系列争议性特征,在传统数学教学模式中对直觉思维能力的关注程度较低。许多数学家倾向于将直观理解与高度形式化的理论体系对立起来,并因此舍弃了对直觉思维能力的培养这一关键环节。值得注意的是,在我的观点中

本人在内的很多人都对此提出了质疑,并不认为直觉性与抽象性之间一定存在冲突。特别是在数学教育领域以及相关的教材编写中,我们旨在促进学生的直觉发展,并以此为基础来提高他们的理解能力。

那些抽象概念之间相互关联,并深入地探索并进而理解其本质。相反地, 若过于追求形式上的严格性, 学生将如同被困在单调乏味的知识框架中的小动物一般, 变成枯燥无味的规则奴隶。

就有关线性代数中提及的一些直观性问题。虽然经历了两年多的时间,并且每隔一段时间就会有几次持续性的深入思考。因而不得不研读了包括国内外经典著作在内的多本教材中的相关内容。

深入学习和理解理论书籍中包括了许多经典著作例如前苏联的优秀著作《数学:它的内容方法和意义》以及龚昇教授所著的《线性代数五讲》还有之前所提到的经典教材《Encounter with Mathematics》

(《数学概观》)以及Thomas A. Garrity的《数学拾遗》都给了我很大的帮助。然而即便如此,在这个主题上我也经历过几次自我否定。例如先前思考

一些心得曾发表于个人博客中,但经过反复思考后发现这些观点多存在偏差。因此决定将自己当前的理解系统性地整理并详细记录下来,一方面是为了巩固自身的认识,另一方面则是希望通过深入分析逐步完善自己的理论体系。

现在对这个主题的理解较为完善了。可以将其整理出来与他人分享意见、交流想法。同时,在未来深入研究后可能会推翻现有结论或者理论基础。那么目前所写的这个snapshot就可能被取代或者替代掉。

也是很有意义的。

线性空间

今天开始探讨一下对线性空间与矩阵的几个核心概念的理解。这些内容大部分都是基于个人理解和整理出来的,并且基本是自己思考的结果。可能存在不足之处,希望能得到指正吗?

希望做到直觉,也就是说能把数学背后说的实质问题说出来。

首先介绍空间(spatial concept),它是现代数学的基础之一。它起源于拓扑学领域,并逐渐发展出多种不同的空间类别。通过逐步拓展和完善这些基本概念和定义体系,在理论研究中能够衍生出许多具有特殊性质的空间结构。线性空间作为其中较为基础的一种结构形式,在实际应用中发挥着重要作用。如果深入探讨的话,在这一领域内会遇到许多复杂而有趣的理论问题需要进一步研究和探索

在内建立起了范数体系后就形成了赋范线性空间这一概念,在这种空间中如果具备完备性就可以称为巴那赫空间;在赋予角度概念的基础上则形成了内积空间这一结构;若这种内积空间还具备完备性就可以进一步发展为希尔伯特空间这一体系。

就得到了Hilbert空间。总体而言,在数学中存在多种类型的'空间'。如果你想要了解某类特定空间的数学定义,则通常会遵循这样的结构:在一个给定的集合上所赋予的概念,并满足一些基本属性或条件。

就可以被称为空间。这未免有些奇怪吗?为何要用"空间"来称呼这些集合呢?大家将了解其实这其中的道理非常合理哦!我们普通人最熟悉的"空间"是什么呢?毫无疑问

我们所处的空间中(基于牛顿时空理论)有一个三维存在。从数学角度来看待它的话,则属于三维欧几里得空间。暂且搁置这些细节吧,在探索我们熟悉的空间领域之前

间有些什么最基本的特点。仔细想想我们就会知道,这个三维的空间:

1.由很多(实际上是无穷多个)位置点组成;

2.这些点之间存在相对的关系;

3.可以在空间中定义长度、角度;

这个空间能够容纳各种运动形式,在本节中我们讨论的这种运动特指从一点向另一点进行转换的过程,并非微积分学中所讨论的'连续性'型的运动

在这些性质中, 最关键的是第四条. 第一条和第二条只是构成基础, 不具备独特性. 在讨论数学问题时, 必须建立一个集合, 大多数情况下都需要在此基础上展开.

上定义一些结构(关系),即建立一些结构(关系)。并非仅仅拥有这些就可以构成空间。而Theorem 1中的第3项具有特别的重要性。其他空间不具备这一特征。更不是关键属性。只有Theorem 1中的第四项才是构成拓扑学中核心要素的空间本质。这表明仅需满足第四项即可成为拓扑学中的空间

包含运动作为其核心特性的是空间的本质。认识到这一点后,则能够将我们的三维空间认知得以被拓展至其他任何一种空间。事实上,在任何一种空间中都必须能够包容并支持其内部发生的各种现象。

这种遵循一定规则的行为模式在运动学领域具有特殊意义。(观察发现)在特定的空间结构下通常会伴随有相应的变化行为。(例如,在拓扑学框架内)其内部结构特征往往与对应的连续映射特性相一致。(如欧几里得空间中的几何形状变化)而在线性代数框架下,则对应出现由向量经过均匀缩放、平移或旋转变换所生成的新向量集合。(进一步地,在仿射几何学的研究范围内)则对应出现具有仿射不变性质的变化行为。

实际这些变换本质上都是对应空间内允许进行的运动形式的表现。也就是说只要理解到'空间'是一个容纳特定运动的对象集合而'变换'则决定了该空间内相应运动的具体规定 下面我们将

让我们深入探讨线性空间的概念。在线性代数中对线性空间的定义均有阐述然而鉴于此我们无需纠结于其具体的定义因为这是一个抽象的空间概念所以两个核心问题亟需解决即:

在数学中, 空间被定义为一个由特定对象构成的集合. 在这一概念框架下, 线性空间作为一种特殊的数学结构, 其核心特征同样体现在其元素构成上. 那么在线性代数中, 这样的元素具有哪些共同特征? 或者换句话说, 在这种结构下, 它们之间是否存在某些本质属性?

2.线性空间中的运动如何表述的?也就是,线性变换是如何表示的?

首先解答第一个问题,在处理这个问题时,并不需要拐弯抹角地去思考或解决它;可以直接给出答案:在线性空间中任意一个对象都可以表示为基向量的线性组合。

采用向量形式来表达。常见的向量空间我不打算深入讨论。举例说明不太常见的情况:

1、

何一个这样的多项式都可以表达为一组n+1维向量,其中的每一个分量

那组基具有线性无关性就满足了这个条件。需要用到后续涉及的概念因此无需在此赘述仅作简要提及

基于魏尔斯特拉斯定理,在次数不超过n的所有多项式函数中总能找到一个使得它与该连续函数之间的差值为零的最优解;换句话说这一结果表明我们可以将问题转化为L1范数的形式进行求解;后续的内容将围绕这一结果展开讨论

用再重复了。

所以说, __ 向量是很厉害的,只要你找到合适的基,用向量可以表示线性空间里任何一个对象。这里头大有文章,因为向量表面上只是一列数,但是其实由于它的

有序性存在的情况下,在程序设计中数组之所以最基本但也最为强大无比的原因在于此

这是另一个问题了,这里就不说了。

针对第二个问题作出解答,请注意此问题回答将涉及到底层的一个关键概念,在讨论这一现象时我们将其定义为一种特定的行为模式 即在线性空间中发生的移动行为 我们将其称为线性变换 换句话说 从一点发生移动行为所引发的变化过程即被定义为一种映射关系 这种映射关系具有明确的数学表述形式

到任意一个其他点都可以由一种线性变换来实现的问题很有意思在线性空间一旦选定一组基之后不仅可以用一个向量来描述任一点的位置其坐标由该组基中的相应坐标系表示出来

We can discuss any object in the space and represent any transformation in the space using matrices. The method is to multiply it by the matrix representing that transformation.

该向量表征的对象,在选定线性空间中的基底后, 向量表征该对象, 矩阵表征该对象所发生的运动, 通过矩阵与向量相乘作用于该对象上施加相应的运动. 确实如此, 从本质上说, 矩阵的本质在于描述这一过程中的变换.

当有人询问你未来时,请明确告知他们:矩阵所描述的就是运动的本质特征。

可真有意思的很呢!向量本身就是一种特殊的n×1矩阵呀!这确实非常奇妙呀!单个空间里的物体与运动居然可以用相似的形式来表示呀!难道这就是巧合嘛!如果

或许是巧合吧?可以说是上天眷顾的 coincidence!换句话说,在线性代数中许多特别神奇的性质都与这个 coincidence 直接相关。

接着深入理解矩阵:之前有人指出:'矩阵是运动的描述';似乎大家对此意见一致;不过我认为很快会有数学背景的网友过来纠正这个观点:因为运动这个概念,在数学中被广泛使用;尤其是线性代数领域中对变换的研究与之密切相关

在数学与物理领域中紧密相连的是微积分这一核心工具。我们在学习微积分的过程中经常会遇到这样的情况:经常有学生机械地解释说初等数学主要是研究固定数值(常量)的规律,并侧重于静态问题的研究;而高等数学则涉及变量之间的关系及其变化规律的研究。

关于运动的数学学科,在人们的日常生活中广泛传播着这门知识

因为这篇文章没有涉及微积分的内容,所以我就不深入讨论了.对于对微积分感兴趣的朋友,我可以推荐齐民友教授的《重温微积分》一书.正是通过阅读这本书的开头部分,我才真正理解了"高等数学是"

为什么研究" motion "这一概念的数学表述具有合理性?不过在我这篇《理解矩阵》的文章中对' motion '的概念做了不同的定义,在本文章中对'motion'这一术语进行了重新诠释。
例如,在本时刻处于A点的位置.

通过一次"过程"很快地跳跃到B点,在这种情况下,并没有跳过A点与B点之间的任何中间任何一点。这样的"过程"或者"跳跃"违背了我们通常的理解。然而有一点需要注意的是

熟悉量子物理的人都会立刻指出:当如电子这样的粒子从一个能级跃迁到另一个能级时会瞬间完成这一过程。这表明自然界确实存在这样的现象。

除了运动现象本身之外,在宏观层面上我们是不易察觉其存在的。

矩阵在线性空间中体现为转换的表现。

阐述这件事。一提这件事大家立刻就能明白。所谓的变换其实就是空间里从一个点(元素/对象)到另一个点(元素/对象)的转换。例如,在仿射空间中

空间里从一个点到另一个点的跃迁。

顺便提一下,在仿射空间与向量空间这对密切相关的概念之间存在紧密联系。对于从事计算机图形学的人来说,尽管描述一个三维对象仅需三维向量即可完成定位与缩放操作(仅需),但为了实现复杂的变换操作(如平移),所有的计算机图形学变换矩阵都必须设计成4x4的维度(都为)

其原因在于,在计算机图形学中的图形变换实际上是基于仿射空间进行操作的。
许多教材中常常用"为了使用中方便"来解释这一现象……其实不然……真正的原因是……

在该过程中而不是在传统的欧几里得向量空间中进行。想象一下,在欧几里得向量空间中一个被平行移动后的向量仍然保持不变;然而,在现实世界中等长的两个平行线段显然不能被视为同一实体。

在计算机图形学中存在一个生存空间可被视为仿射空间。其矩阵表示本质上就是4×4维的。如对相关知识感兴趣的朋友可参考《计算机图形学——几何工具算法详解》

如果我们将"掌握"换成更具体的动词动作"深入理解"的话,在线性代数中就出现了这样的定义:"矩阵就被定义为一种能够对向量进行线性变换的数据结构"这样的表述更加具体且富有操作性

这句话表明教材中通常会这样表述:在一个线性空间V中选择一组基后(即选定一组基后),就可以通过矩阵的形式来表示对应的线性变换T的作用效果(即可以用矩阵表示)。因此我们需要明确地界定什么是线性变换以及什么是基

如何选定一组基?我们可以定义一种变换T,并规定该变换满足以下条件:对于给定的线性空间V中的任意两个不同的对象x和y以及任意实数a和b,在变换T的作用下有T(ax + by) = aT(x) + bT(y)成立。

对于满足 T(ax + by) = aT(x) + bT(y) 的算子 T, 即称这样的算子 T 为线性变换. 定义按照这样的形式陈述, 然而仅凭定义难以获得直观的理解. 那么这种线性算子到底具有什么样的特性? 我们之前讨论过这些变化特征

涉及空间中一点向另一点转换的过程(operation),而在线性代数中,则描述为从线性空间V中的任一点经过映射到达W中的对应位置的行为(activity)。这种说法揭示了一个关键概念(idea),即通过映射关系实现了不同空间之间的联系(connection)。

改写说明

任何一个变换都必然是线性变换,并且可以用一个非奇异矩阵来表示。任何一个非奇异矩阵所表示的变换必然是线性变换。

可能会有疑问的人

一种映射方法,并为了探讨这种映射的相关性质以及线性变换的核与像等核心概念所涉及的知识体系需要具备一定的理论基础。

以下我们主要研究应用最广泛的线性变换类型,在同一个线性空间中的线性变换。换句话说,在所提及的矩阵中,默认情况下都是非奇异的方阵。

掌握一门学问的关键在于抓住核心知识,并能快速形成对该学科的整体认知。无需一开始就深究细节问题及特殊情形。

什么是基呢?这个问题在后面还有很长一段要详细阐述,在这里我们可以把基当作线性空间中的坐标系来看待.需要注意的是,这里所说的"坐标系"并不是指坐标的数值本身,而是指一个整体的概念框架.换句话说,它是一个'对立矛盾统一体',既包含了明确的结构又包含潜在的可能性.

好文:这样做的意义在于它为后续研究提供了清晰的基础框架。随后我们来正式定义矩阵:矩阵可视为描述线性空间内发生线性变换的一种方式,在此过程中每一行每一列都承载着特定的信息

说明:这一过程的关键在于通过数学语言准确刻画事物之间的关系

在内容中一旦选定一组基向量作为基准,则无论哪一个线性变换总能对应到一个唯一的矩阵表示。理解这句话的核心在于明确将'线性变换'与其'其矩阵表示'区分开来。

不要混淆以下两种概念:一种是该对象本身(object),另一种是对该对象的描述(description)。类似于我们熟悉的一种编程范式中的面向对象编程体系中,在这种架构下:每一个实例(instance)都可以被多个引用(references)或引用者访问(accessors),而这些引用(references)可以被赋予不同的名称(names),但它们都指向同一个实例(instance)。

个事物。如果还不形象的话,则不妨采用一种较为直白的类比:比如一头猪,在你想要对其拍照时,默认选定一个镜头位置即可。

这张图片可以视为这头猪的一个图像描述,并非全面展示其特征。由于采用不同的拍摄角度对这头猪进行拍摄,则能获取多张不同效果的照片来呈现其多面形象。

这些由相机拍摄所得的照片都是对这只猪的描绘;然而它们又都不完全等同于这只猪本身。类似地,在线性变换中选择一组基底后,则可以找到对应的矩阵表示来进行描述。

线性映射。
更换一组基底将导致对应地产生一个新的矩阵。
所有这些矩阵都属于这个相同的线性映射的表示方法,并且每一个这样的表示都不等于该线性映射本身。

那么这就提出了一个问题:如果我能获取到两幅图像(无论是照片还是绘制图),如何确定这两幅图像所呈现的对象是否为同一物体?同样的道理,在面对两个数据矩阵时(比如在数据分析中),如何判断这两个数据矩阵所代表的对象是否一致?

这个方法很有效。
该种方式具有显著的效果。
这个方法很有效。
该种方式具有显著的效果。
这个方法很有效。
该种方式具有显著的效果。
这个方法很有效。
该种方式具有显著的效果.
这个方法很有效.
该种方式具有显著的效果.
这个方法很有效.

一个性质如下:如果矩阵A和B都是同一线性变换在不同基下的表示(这是因为它们选择了不同的基底),那么必然存在一个可逆矩阵P使得P^{-1}AP = B成立。

个非奇异矩阵P,使得A、B之间满足这样的关系:

一个线性变换可用不同矩阵来描述。依据此定义,则同一动物不同角度的照片可被视为相似图像。虽略显通俗易懂,但不失简洁明了。而在上式中所涉及的矩阵P具有以下性质:

实际上是以A矩阵为基础的一组基与以B矩阵为基础的一组基之间存在一种变换关系

对于这一结论而言,在论证过程中我们可以采用一种直观且直接的方法进行论证(而非那种从形式上出发的传统证明方式)。假如有机会的话,在未来的文章中我会补充这一论证过程。这一发现具有重要意义。

原来的这一族相似矩阵实际上都是同一线性变换的不同数学表达啊!难怪如此重要!在工科类研究生课程中通常会教授矩阵论与矩阵分析等相关知识,其中涵盖了多种类型的相似变换方法。比如像这样的情况:

在处理类似标准型以及对角化等过程时, 都必须满足这样的条件: 即变换后得到的新矩阵必须与原来的那个矩阵形式上相似. 那么为什么要采取这样的要求呢? 因为如果不这样做, 则无法保证变换前后这两个矩阵能够保持一致的关系.

是描述同一个线性变换的。

显然,在讨论线性变换的不同矩阵表示时,并非所有表示方法都是等价的。其中某些表示方法在性质上要优于其他方法。这种差异使得不同的数学工具能够更好地揭示问题的本质特征。这很容易理解,在不同角度下拍摄同一物体的照片之间也存在显著差别

有人认为存在美与丑之分。由此可见,相似变换是一种方法论工具,在工程应用中可以将较为陈旧或不太美观的技术方案转化为较为现代化且更为优雅的设计方案,并且能够使得这两个方案都能表示同一个技术原理或规律。这也就意味着,在工程实践中选择合适的数学表达方式不仅能够提升效率、简化运算过程还能显著提高结果的质量和可靠性。

描述这一面基本上已经阐述清楚。然而事情并非如此简单地说来着或者说事实上线性代数还有比这更为奇妙的性质那就是矩阵不仅可以用作线性变换的描述工具而且还可以用作

基底的概念阐述。矩阵作为一种变换工具不仅能够将线性空间中的任意一点映射至另一空间中,同样地该矩阵还可以实现从一个坐标系到另一个坐标系的转换关系。

基底的概念阐述。矩阵作为一种变换工具不仅能够将线性空间中的任意一点映射至另一空间中同样地该矩阵还可以实现从一个坐标系到另一个坐标系的转换关系

离开之前,并不是说要完全放弃所有的可能性。此外,在处理变换点与变换坐标系时所展现出的效果往往令人印象深刻,在探索线性代数中的奥秘往往令人着迷。一旦掌握这些概念后,则能够更加直观地理解其中的核心思想与内在联系。

、直觉。

首先来总结一下前面部分的一些主要结论:

1.首先有空间,空间可以容纳对象运动的。一种空间对应一类对象。

2.有一种空间叫线性空间,线性空间是容纳向量对象运动的。

3.运动是瞬时的,因此也被称为变换。

4.矩阵是线性空间中运动(变换)的描述。

5.矩阵与向量相乘,就是实施运动(变换)的过程。

同一个变换在用不同的坐标系来表示时会得到不同的矩阵形式然而这些矩阵虽然不同但却具有相同的内在特性因此我们可以得出结论它们的本征值是相同的

下面让我们聚焦注意力到一个焦点上,从而改变了我们对矩阵的传统认识.我们知道,在其中的核心元素就是向量.

向量是这么表示的:

无需过分智能, 我们就能识别出矩阵是由一组向量组成的. 特别值得注意的是,在n维线性空间中, 方阵是由n个对应的n维列向量构成的. 在本节中, 我们仅限于讨论这个n阶非奇异方阵的情况.

其本质在于掌握它是通向矩阵世界的核心钥匙,在这个关键点上投入精力至关重要。可以说它是基本情况,在这种情况下相比起来其他的矩阵都显得意外, 都可以被视为麻烦, 都都堪称令人头疼的麻烦, 完全不必过分在意这些非主流情况, 完全不必过分在意这些非主流情况, 完全不必过分在意这些非主流情况, 完全不必过分在意这些非主流情况, 完全不必过分在意这些非主流情况, 完全不必过分在意这些非主流情况, 完全不必过分在意这些非主流情况, 完全不必过分在意这些非主流情况, 完全不必过分在意这些非主要的情况

无需过分关注旁枝末节的问题。遗憾的是,在我国大多数教材中都将核心内容深藏在细节之中,在未经深入思考的情况下就难以理解其精髓从而令人感到迷茫困惑。例如数学分析课程其核心理念是建立在极限理论之上的对其基本思想必须透彻掌握才能真正掌握这门学科的基本方法和解题技巧。

这个方法被称为线性组合的概念,它被定义为一个对象表示为无穷多个合理选择的对象的加权和的形式。这一概念贯穿始终并构成数学分析的核心内容。然而,在教科书中这一关键观点被完全忽视了,因此学生只能被动接受而不深入理解其中的道理

研读吉米多维奇著作的同时,
积累了许多应对难题的技巧,
熟记各类特殊情形,
特别注意两种主要类型的间断点,
研究特殊的可导性和可积性要求(谁还记得关于柯西准则以及迪里克雷条件等的具体细节呢?)
当期末考试结束时,

完全遗忘了。
说老实话,
不如着重强调这个关键点,
根深蒂固地记在脑海里。
不要忘记其他事情,
遇到问题时,
实在不行还得翻翻数学手册,
实在是没有必要为了 minor 的事情而烦恼。

回归正题, 如果一个向量集合中的任何两个向量之间都是线性无关的情况, 那么它们可作为度量该线性空间的一组基底, 从而实际上形成了一个坐标系体系

在坐标轴上,并成为了该坐标轴上的基本度量单位(长度为1)。现在到了关键的一刻。似乎矩阵是由一组向量构成的。如果说矩阵是非奇异的话,则这个特性将导致其行列式不等于零

只考虑这种情况),那么组成这个矩阵的那一组向量也就线性无关了,并且能够构成度量线性空间的一个坐标系。结论就是说矩阵描述了一个坐标系。慢着!

你嚷嚷起来了,“你这个骗子!你不是说过,矩阵就是运动吗?怎么这会矩阵又是坐标系了?”嗯,所以我说到了关键的一步。我并没有骗人,之所以矩阵又是运动,

又引入了新的概念——坐标系?这是因为"运动相当于坐标系转换"这一关键论断的缘故。然而,请您稍等一下——这个说法其实并不完全正确。我只想让您留下深刻的印象而已。正确的说法应该是:"物体的几何变换相当于坐标系的转换"

这表明在固定坐标系下进行对象变换等同于将该物体视为其自身坐标系的变化;换句话说,则意味着‘运动是相对的’

让我们思考如何完成同一变换的目标,并举个例子:将坐标系中的点从(x_0,y_0)转换至位置(x_1,y_1)。你可以采用两种不同的方法来实现这一目标:第一种方法是保持坐标系不变,并将该点移动到新的位置;第二种方法则是保持该点的位置不变,并通过改变坐标系来达到目标。

在坐标系中进行缩放操作时,默认情况下将x轴和y轴各自的长度分别缩放到原来的一半和三分之一。这样一来,在图形上观察到的效果就是点的位置从原始的位置移动到了(2,3)处。然而由于这种调整的方式不同,则点的位置也随之发生了变化。

结果一致,在第一种方法中

该变换成为向量b。而从第二种方法来看,矩阵M定义了一个坐标系,也可称为其自身。因此,方程Ma=b的意思是:存在一个向量a满足方程,在坐标系M下它被表示为向量b

计算得到的结果向量为a,则当采用单位矩阵对应的坐标系进行度量时(即当基向量构成一个单位矩阵的形式时),该向量在此坐标系下的度量结果为b。这种处理方法的本质上等价于将空间基向量化为正交且归一化的状态

这种情形下具有相同的性质。我希望你能深入理解这一点,在整篇文章中占据核心地位。鉴于此原因,在坐标系M的意义下,请注意以下内容:当我们将坐标系M放置于向量a之前时,请特别关注其变换规律与应用方法。

按照M坐标系的形式进行标记,则可认为这相当于声明一个关于向量a的存在方式;即表明存在这样一个向量,在其所在的M坐标系中被测量并获得对应的结果值a;可以说这里是这样的情况:在M坐标系下测量得到的结果用符号a表示

它在其他坐标系下进行测量时,则会得到不同的结果。为了使表达更加清晰明确,请将M置于前面。这即是该向量在此坐标系下进行测量所获得的结果。

那么我们再来看那个空旷的向量B:B看起来好几遍都不明白它的含义时才意识到它并不是单纯的B而是指IB具体来说就是在通常所说的单位直角坐标系I中存在这样一个向量

度量结果为\mathbf{b}。”而M\mathbf{a}=I\mathbf{b}换言之即是说:“以M坐标系下的向量\mathbf{a}与以I坐标系下的向量\mathbf{b}所表示的本体而言,两者本质上是一体的。”这哪里是什么乘法运算呢?

本质上就是身份识别的一种体现吧?从这种角度来看待向量时会发现它所承载的意义更加丰富多样。向量作为一种数学概念确实存在但它要想被应用到实际分析中就必须借助适当的工具来进行描述和计算。

计算所得的结果(各个坐标轴上的分量依次排列)则组成了我们平常用以描述的空间中的一个点;根据你所选取的不同坐标系(基底),得出的结果会呈现不同的空间位置关系

同一个向量,在采用不同的坐标系时会表现出不同的表达方式。按照道理来说,在每次表达一个向量时都应该说明所使用的坐标系以避免歧义和误解。表

用于表示的方式即记作\text{Ma}的具体含义是什么呢?具体来说,在由\text{M}矩阵定义的坐标系下测量得出的结果向量为\text{a}

当我们回顾变换问题时,我之前提到,“在固定坐标系下对一个对象进行变换等价于让该物体所处的坐标系进行相应的反向变换”。在这里面,“固定的对象”我们已经确定为那个向量。然而,在这种情况下,“固定的坐标系”的属性如何变化呢?

变换呢?怎么会没注意到呢?让我详细说明一下吧:首先有方程Ma=Ib,在这个基础上我要把矩阵M转换为单位矩阵I。具体来说,在等式两边左乘一次逆矩阵(即M⁻¹),这样左边就变成了单位矩阵I了。换句话说,在这里我们假设有一个坐标系组存在,并且我们希望将它转换到一个新的坐标系组。

它乘以一个M-1矩阵后变为单位矩阵I。这样看来,在I坐标系中进行测量一下就能得到结果b。如果你现在就开始动手实践画图示意图吧。比如绘制一下相关图形来辅助理解这个过程。

此坐标系是以x轴为基准的度量单位为2、以y轴为基准的度量单位为3所构成的一个坐标系统,在上述所设定的坐标系统中,该点在此坐标系下的位置对应于笛卡尔坐标的(2,3)位置。

办法,就是把原来那个坐标系:

那个向量现在就变成了(2, 3)了。 怎么能够让“

下面我们得出一个重要的结论:"实现坐标系变换的方式即为将表示该坐标的矩阵与表征该变换过程之矩阵相乘。"再次强调之下可知,通过这样的运算方式能够将复杂的三维空间转换转化为简洁明了的效果

然而,在施加运动的对象不再是矢量而是一个坐标系时,请再次思考之前提到的关键结论:矩阵MxN实际上表示为坐标系N基于运动M的基础上进行定义。

经过这样的变换结果,
另一方面将M视为N的一个前缀,
同时作为N的环境描述,
那么就是说,
在M坐标系下进行度量时,
存在另一个称为N的关系。
而当将其置于I坐标系中进行度量时,
其关系得以明确。

果为坐标系MxN。

在这里,我已经阐述了一般人在学习线性代数时所遇到的一个主要问题及其背后的原因。具体来说,在这样的运算体系下矩阵乘法得以保持代数性质的一致性。换句话说,在这种定义下矩阵乘法能够保持重要的数学性质。

_1.以变换的角度来看,在进行M变换操作时作用于坐标系N时的操作就是相当于将构成该坐标系N的所有向量分别应用M变换。

2.从坐标系的观点看,在M坐标系中表现为N的另一个坐标系,这也归结为,对

关于为什么矩阵乘以向量采用这样的规定方式,则是因为存在某个在M空间中被测量为a的特定向量子体,在试图恢复其在I空间中的真实形态时,则需要分别将其与M空间中每一个基底元素进行内积计算才能获得完整的重建信息

此将此结论之演算付诸兴趣之辈吧。此番综合所述,则矩阵运算不得不如此规定也。因而是非那等牵强附会之说自然不复存在。

关于矩阵定义的描述非常准确:矩阵是由m行n列的数构成的一个数学对象。基本上就是这样。

理解矩阵(一)

理解矩阵(一)

我对这篇文章的自己做的总结:

都以建立一个集合为基础;在这一过程中设定一系列的概念与法则,则形成了某种空间;‘包含运动(变换)的本质即为该空间的核心’。

在空间中进行的运动如果被定义为线性变换,则称其为线性空间;同样地,在拓扑学中进行的变换则被称为拓扑空间;而仿射变换则被归类为仿射空间。通常所指的空间具有以下三个核心属性:

(1)空间中点的表示形式

(2)空间中点的相对关系

(3)空间中点的运动形式

4、向量空间相对于线性空间还要满足内积的定义;

5、所谓相似矩阵,就是同一个线性变换的不同的描述矩阵;

3、线性空间两个最基本特征

空间中点的坐标表达式:任取其中的一个元素x属于V,在选定一组基底的情况下,通过赋予x对应的坐标值的方式就可以将其表示为向量;

(2)空间中点运动的表现形式:在线性代数中所指的变换(与微积分中的连续变化不同的是,在这里我们讨论的是瞬间完成的变化过程),都可以用矩阵的形式表示;从数学上来说,矩阵的本质就是用来描述这种运动变化的过程。

继续深入,“运动具有相对性 ” ,物体的变化等价于坐标系的变化 ,为了表示这一现象,“向量作为数学实体存在 ” 时需要借助特定的参考系统;对于表达式 M*a=b ,其意义可理解为 同一个参考系内,向量a通过变换M移动至b的位置 ;另一种理解方式则是 在同一参考框架(如A)内进行操作后得到的结果b仍位于该框架下

而我们学习过的矩阵论的一些知识实际上就是在探讨各种变换及其内在特性

全部评论 (0)

还没有任何评论哟~