有趣的微积分历史——wsdchong
有趣的微积分历史
前言
观听完考研张宇老师的课程后感到十分着迷,并开始详细记录所涉及的部分内容。随后整理了其中一部分相关的内容,并发现对于这些内容的具体研究与分析则较为浅尝辄止。若感兴趣深入了解相关内容,则可以通过查阅相关文献资料进一步研究
以后有时间再校对、排版、补充一番。
按时间以及篇章内容顺序。
前半部分是听张宇老师课 ,回忆的一部分。
后半部分是看**《数理统计学简史》**写的零散摘要。
数学史好有意思。吃数学史的瓜。
牛顿、莱布尼兹、伯努利、洛必达的瓜
拉格朗日、柯西的瓜
卡尔.皮尔逊等人的两代人之间存在激烈的争论。(此消彼长)
文章目录
-
有趣的微积分历史
-
- 前言
- 微积分部分
-
- 积分
- 中值定理
-
探讨概率论的基本概念
-
-
概率论的发展历程
-
数理统计学的重要里程碑
-
贝叶斯学说的理论框架
-
难题待解的现象类比
- 结尾
-
微积分部分
积分
牛顿(1642–1726):万有引力,微积分。
莱布尼兹(1646-1716):张宇老师眼馋莱布尼茨纪念馆的莱布尼兹手稿。
伯努利:牛顿-莱布尼兹之后,,微积分第一人。伯努利大数定律。
洛必达(1661-1704):洛必达法则。富二代。
泰勒(1685-1731):泰勒公式
高斯(1777-1855):高斯公式,数学王子
格林(1783-1841):格林公式
阿贝尔(1802-1829):阿贝尔定理,享年27岁。
黎曼(1826-1866):黎曼积分、定积分。有名的数学分析大师。
中值定理
费马:1601-1665,提出费马大定理
数学家罗尔于1652年至1719年间出生,在专攻代数方程领域期间未掌握微积分理论与其争论并指出微积分理论存在不足之处临终前曾表示微积分值得商榷后人因此建立了罗尔定理
欧拉(1707-1783):拉格朗日的老师。师生故事感人。数学史上的传奇人物,28岁得眼病。
拉格朗日先生(1736-1813),欧拉的学生,具有法国国籍的人,在移居于俄罗斯后对俄国近代数学的发展起到了重要作用。拉格朗日中值定理
法国数学家柯西(1789-1857)曾受教于拉格朗日,并建议让其在青少年时期避免接触高等数学。后则开始系统地指导他学习。他的重要贡献之一是中值定理。
从概数史讲概数
内容涉及《数据挖掘中所需的概率论与数理统计知识》一书中所述的相关知识以及《数理统计学简史(陈希孺)》一书的内容。
概率论历史人物和关键事件
- 惠更新:在1657年出版了《机遇的计算论著》(即《机遇的规律》),被视为概率论领域的开创新里程碑。基于公平赌博结果的一条公理出发点推导出有关数学期望的基本理论框架,并与牛顿在科学贡献上具有同等重要性。
- 伯努利(1654-1705):其作品《推测术》于1713年问世。该著作不仅对惠更新提出的掷骰子等赌博事件的概率计算进行了深入研究与系统阐述,并首次提出并证明了著名的"大数定律"原理;这标志着概率论作为独立学科的确立过程。
- 棣莫弗:于1718年出版了《机遇论》,并在随后于1733年成功导出二项分布趋近于正态分布的概率密度函数模型;首次提出了中心极限定理的核心思想。
- 拉普拉斯:其巨著《概率论分析理论》于1812年正式发布;在同一时期(即1780年),拉普拉斯已经得出了中心极限定理的一般性表述。
- 贝叶斯(1701-1761):其遗作《机遇理论中问题之解》为解决贝叶斯推断问题奠定了基础;该理论方法能够从已知结果反推原因发生的概率问题。
- 勒让德:于1805年首次提出并阐述了最小二乘法这一重要数据拟合方法。
- 高斯:其在天文学研究基础上于1809年系统性地导出了误差服从正态分布的概率模型结论。
- 海根:主张元误差学说并最终导致统计学家们普遍认同误差值符合正态分布这一现象。
概率论与数理统计的核心是微积分。正态分布的概率密度函数涉及了关于定积分的概念。探讨最小二乘法问题其解题思路时涉及了基本概念。
伯努利的大数定律与德莫根-拉普拉斯中心极限定理都以二项分布为核心研究对象,在概率论发展史的一个重要阶段中是当时概率论中的唯一核心分布模型
数理统计的历史人物和关键事件
大数据集与其对应的较小规模的数据群之间的对比研究。
卡尔·皮尔逊主导的传统统计学方法与其倡导的现代统计分析思路之间的理论探讨。
为应对受人工控制试验条件下的数据统计分析难题而诞生的。从1908年开始,并在随后的20年至30年间达到了鼎盛时期。具体来说,则是由Student(威廉·赛德曼)、费舍尔和奈曼三位杰出学者主导的研究工作推动完成并取得突破性进展。
在统计学发展的早期历史中(Mark I统计),无论是社会领域还是生物领域的统计数据都是以大规模、未经人工干预的方式获取的(Mark II统计)。这些数据所采用的方法均以拉普拉斯中心极限定理为基础进行处理(Mark III统计),最终得出的结果均为正态分布(Mark IV统计)。简而言之,在此阶段的研究工作主要集中在大样本数据分析问题上(Mark V统计)。
到了20世纪初(Mark VI统计),随着科学研究逐渐转向实验条件的人工控制环境(Mark VII统计),由此产生的试验数据开始成为新的研究热点(Mark VIII统计)。由于这类数据通常数量有限(Mark IX统计),传统的基于近似正态分布的方法不再适用(Mark X统计),这促使研究者们转向小样本数据分析问题的研究方向(Mark XI统计)。
这一领域的开创性研究是由戈塞特发起并以笔名Student提出的t分布理论(Goosset's t-distribution)(标记II);而随后的主要推动者则是费歇尔先生:他不仅提出了F分布理论(标记III),还系统地发展了方差分析方法论,并成功将其应用于农业试验等多个实际场景中。(标记IV)
在数理统计学中存在三种重要的分布,在解决众多关键的统计推断问题中发挥重要作用。由于这三种分布在解决众多关键的统计推断问题中发挥重要作用,在20世纪头20年间(即1936年至1955年间),概率论中的研究重点主要集中在相关回归分析上,并且这一领域与多元正态分析密切相关。然而这些重要分布在多元正态分析中并不起关键作用,在根本上源于高斯线性模型的概率密度函数的存在。
χ²分布被用作描述统计量的一种分布形式,在线性模型中基于最小二乘法所得残差平方和的分布性质最早被提出
从误差论的角度来看,在多维正态纳入线性统计模型的发展历程中,
- 第一阶段(19世纪初至19世纪末):主要代表人物包括高斯、拉普拉斯和勒让德等学者。
该阶段的核心为误差论逐步融入统计数据分析的过程。- 第二阶段(19世纪末至20世纪初):这一时期的主要发展脉络可归因于卡尔·皮尔逊的贡献。
其研究重点转向多元正态分布与线性统计模型之间的内在联系,
并将研究重心集中于相关性和回归分析。- 第三阶段(起始于1922年):这一发展时期的主要特征是由费歇尔奠定基础。
该阶段的研究重点回归至自变量被视为非随机且离散化的处理方式,
而其核心问题则聚焦于如何将方差分析方法应用于实验设计领域的发展之中
掌握这个模型发展脉络的同时,基本上了解了统计学从19世纪初开始的发展主流。
1936年去世后的一段时间里,在英国统计学界掀起了一场关于假设检验方法的激烈争论。
然而,在1937年时, 费歇尔还发表了一篇题为《论皮尔逊教授及矩法》的文章, 指出皮尔逊将过多精力用于"用矩来拟合曲线"的方法, 认为这种方法会严重影响学生们对其他相关材料的学习, 如小样本分析、方差分析以及估计理论等, 这一点后来被普遍认为是一种浪费时间的做法。
从这场争论的结果来看, 费歇尔似乎取得了胜利地位。然而, 如果我们仅仅比较两种方法而不深入探讨两人的理论体系, 那么一个更为公正的观点是: 二者各有其适用的领域。
在非参数领域中, 极大似然估计通常不适用, 但矩估计却能顺利运用起来。然而, 极大似然估计的一个主要优点是其渐近方差最小化特性, 因此大多数统计学家普遍认为极大似然估计要优于矩估计。
由于关系到他的整个理论体系的一致性问题, 皮尔逊一直无法接受小样本方法论小组提出的那些观点。
近代意义下的假设检验问题最早可追溯至奈曼与爱根·皮尔逊(1895-1980)在20世纪20至30年代所作出的重要贡献。就其实用效果而言,则是由卡尔·皮尔逊与费舍尔这两位学术大师引领发展的。
贝叶斯学派
20世纪上半叶复活,20世纪下半叶全盛。
从小样本研究转向大样本研究
贝叶斯学说在其漫长的发展历程中一度陷入沉寂。随后,在20世纪上半叶,在一些学者的努力下终于重获新生,并迎来了全盛时期。在此期间发挥重要作用的关键人物包括杰弗里斯,在他1939年出版的经典著作《概率论》中奠定了贝叶斯学派的基础;以及萨凡奇于1954年出版的《统计推断》,也是贝叶斯统计领域的重要文献之一。然而,在理论与思辨方面表现突出的是前两位学者,《概率论》与《统计推断》,而林德来的著作则更加注重实际应用,在应用领域产生了更为深远的影响。
贝叶斯学派在20世纪上半叶发展受阻的主要原因之一是受到像费歇尔、奈曼这类重要统计学家的反对
- 奈曼本人从未参与频率学派与贝叶斯学派之间的辩论。然而费歇尔却不然他与杰弗里斯在20世纪30年代通过撰写论文一应一答的形式展开了长时间辩论由于费歇尔当时在统计学界占据主导地位而杰弗里斯并非一名实用主义统计学家因此费歇尔的观点对许多学者产生了重要影响。
- 另外20世纪上半叶正是频率学派大展宏图的时代发现了许多具有广泛应用价值且效力显著的统计方法在这种情况下数学家们自然不会考虑转向其他研究方向。
从20世纪中期开始, 频率统计学派的发展逐渐面临一系列挑战. 其理论体系日益复杂, 导致创新成果逐渐缩减. 针对小样本数据的有效方法进展缓慢, 从而转向大样本数据分析成为主流研究方向之一. 在这一背景下, 贝叶斯统计凭借其简单的操作步骤以及在解释上的某些合理性和科学性, 引发了广泛的应用领域内的不满情绪. 尽管如此, 贝叶斯统计仍然凭借其简单易行的操作流程和在解释上的某些合理性和科学性赢得了大量实际应用者的青睐. 值得一提的是, 这种新思路的出现不仅改变了传统的频率学派研究范式, 还进一步导致部分原本属于传统频率学派的学者也转向贝叶斯学派.
吃瓜
- 卡尔.皮尔逊(1857-1936):统计学权威,一枝独秀(9世纪末到20世纪20年代初期)。大样本的数理统计的巅峰,体系核心是矩法。在大样本的数理统计上大放异彩。
- 哥色特(笔名student):1876年出生,1907年在 皮尔逊那里学习和研究统计学。他着重关心由认为实验下所得的少量数据的统计分析问题,在当时这是一个全新的课题。而当时统计学占主导地位的卡尔.皮尔逊学派强调由自然观察得到的大量数据的统计处理。这一研究的成果就是让他名垂统计学史册的论文《均值的或然误差》。后又研究出t分布,被统计界尊为小样本理论的开创者。为人谦逊,人缘好,人不在江湖,但江湖处处都是哥的传说。是卡尔.皮尔逊的朋友。和费歇尔经常书信往来。1925年奈曼去找卡尔.皮尔逊未遇,student给予他帮助。并且奈曼与费歇尔的初次见面也是student介绍的。爱根.皮尔逊也是和其经常书信往来。
- 费歇尔(1890-1962):与卡尔.皮尔逊争锋相对。将眼光放在小样本的数理统计上,继卡尔.皮尔逊之后的统计学大佬。是20世纪成就最大的统计学家,是以卡尔.皮尔逊为代表的旧统计学 ,朝向以他为代表的新统计学 的转变中的关键人物。1912年费歇尔研究student的《均值的或然误差》,发现了其中的推导漏洞,于是和student联系,这也开始了两人长达二十余年的友谊。1914年一战,费歇尔弃笔从戎,但视力不好,此后五年的职业是中学教师,期间萌生了一种思想,发展农业,为此他还短时期内运营过一个小型农场。1919年接受达尔文一位亲戚的介绍,进入农业试验站工作,这成了他一生的重大转折点,也是统计学发展的转折点,在那工作的十余年里,他发展了一整套试验设计的思想,这十余年是费歇尔统计学生涯的全盛时期,他的大部分重要研究成果都产生于这一时期。1922年费歇尔想在大学学院扩建一个正式的生物计量学俱乐部,但是此事需要卡尔.皮尔逊的发起,但是和卡尔.皮尔逊不对付,于是托student说情,虽然事情没办成,但是可以看出两者的亲密关系。1933年卡尔.皮尔逊退休并将其职务一分为二,费歇尔接替其高尔登优生学讲座教授。
- 爱根.皮尔逊(1895-1980):卡尔.皮尔逊的儿子。为人性格内向,不善于与人交往。在当时统计界名流中,唯有student与他保持良好的关系。他1926年开始与student通信以来,一直到student去世的1937年。年轻时随父亲研究统计学,待奈曼1925年秋到大学学院参加卡尔.皮尔逊的研究生班时,爱根在班上协助其父任辅导,后来到1933年卡尔.皮尔逊退休并将其职务一分为二,爱根接替其统计系主任的工作直到退休。实际在1920年代中期开始,爱根背离其父亲的那套大样本统计,转而研究费歇尔的小样本统计。
- 奈曼(1894-1981):年轻时对纯数学有强烈的兴趣并有很高的素养。1926年会见了费歇尔,在卡尔.皮尔逊那里进修了一年,最后离开,对那里的统计学表示失望,认为没有多少数学。奈曼格外重视统计学中数学严格性的观点。1938年4月应美国加州伯克利大学数学系的招聘担任该系教师。这成了美国统计学发展以及他个人的转折点。
结尾
比起微积分,我对统计分析更感兴趣。以后好好研究一下数理统计。
感受这个卡尔·皮尔逊、费舍尔、Student、爱根·皮尔逊、Neyman等人的贡献如同品尝一本精妙而深邃的知识宝库。
卡尔·皮尔逊是一位举世无双的武林宗师,在他的门下习得的密技就是大数据技术基础
爱根·皮尔逊出身名门望族,在他早期习得的就是大数据技术基础,在经历了人生至暗时刻后转而采用小样本分析法
student以谦逊之姿示人,在人际交往方面表现卓越与卡尔·皮尔逊以及费歇耳关系甚为融洽,并自诩为小样本分析法的重要传承者之一
费歇耳作为武林宗师之首,在学术界独树一帜以其开拓性的思维成为新一代武林盟主
奈曼作为frequency school的核心人物引领着传统学派的发展潮流
后起之秀贝叶斯流则是新兴起来的一股革新力量在freq school之上开疆拓土直逼前者正统地位
不过如今的数理统计是怎么样的呢?
谁是这个时代的主流思想?
哪个思想又是推翻这个主流思想的新思想?
好想参与进去,青史留名。
感兴趣的朋友推荐看看《数理统计简史》
更新链接:( GitHub : https://gitee.com/wsdchong/Computer-science-postgraduate-notes )
