统计学习笔记——统计学习三要素

阅读量：

参考书：《统计学习方法》——李航

统计学习的三要素为：模型、策略、算法。

写在前面的话：

以下以监督学习为基础来进行论述。

监督学习的[

基于假设，在监督学习框架下 $P(X,Y)$ 表示输入变量X和输出变量Y的概率分布

](http://private.codecogs.com/eqnedit.php?latex=X)和[

](http://private.codecogs.com/eqnedit.php?latex=Y)服从联合概率分布[

P(X,Y)，被视为遵循训练集与测试集的联合概率分布

](http://private.codecogs.com/eqnedit.php?latex=P(X,Y))独立同分布产生的。

一、模型

在监督学习中, 我们的目的是从输入到输出建立一个对应关系, 也就是我们所说的模型. 通常情况下, 模型主要形式有两种, 其中一种是概率模型[

该代码块展示了条件概率分布P(Y|rel)，其另一种形式是非基于概率的方法

在实际应用中，
Y = f(X)
（决策函数）。
依据具体情况以及具体的训练方法，
我们选择使用概率型还是非概率型的模型。

二、策略

L(y, f(x)) = \text{某种形式的距离度量}

](http://private.codecogs.com/eqnedit.php?latex=L(Y,f(X)))，这里只举例0-1损失函数来帮助理解：

[

![](http://latex.codecogs.com/gif.latex?L(Y,f(X))=\begin{cases}&space;&1&space;,\quad&space;\text{&space;if&space;}&space;Y\neq&space;f(X)&space;\\ &space;&0&space;,\quad&space;\text%7b&space;if&space;%7d&space;Y=f%28X%29&space;\end%7bcases%7d)

风险函数（期望损失）是用来衡量模型在平均意义下表现好坏的重要指标。换句话说，在整个输入输出空间中对损失函数进行求均值的过程就是风险函数的表现形式。

](http://private.codecogs.com/eqnedit.php?latex=R_{exp}(f)=E_{p}\[L(Y,f(X))\]=\int&space;L(y,f(x))P(x,y)dxdy)

这里的[

](http://private.codecogs.com/eqnedit.php?latex=P(X,Y))需要特别说明一下。在监督学习当中，我们假设输入和输出的随机变量[

](http://private.codecogs.com/eqnedit.php?latex=X)和[

](http://private.codecogs.com/eqnedit.php?latex=Y)服从联合概率分布[

](http://private.codecogs.com/eqnedit.php?latex=P(X,Y))。但是这个分布对于我们来说，是不可知的，如果可知，我们就可以直接通过[

](http://private.codecogs.com/eqnedit.php?latex=P(X,Y))来求解[

](http://private.codecogs.com/eqnedit.php?latex=P(Y| rel=)，而不需要使用统计学习方法了。

显然而然，对应我们来说，最好的策略就是找到让风险函数最小的模型。可是呢，风险函数的计算需要用到[

在统计学中基于大数定律如果我们能够在输入输出空间中选取足够大的样本空间并利用该样本来近似计算风险函数那么监督学习便不再成为一个病态问题而能够获得合理的解决方案。

](http://private.codecogs.com/eqnedit.php?latex=R_{exp}(f))。基于这样的想法，我们对于含有N组数据的训练集，定义经验损失函数：

[

](http://private.codecogs.com/eqnedit.php?latex=R_{emp}(f)=\frac{1}{N}\sum_{i=1}^{N}L(y_{i},f(x_{i})))

根据大数定律，当N趋近于无穷大的时候，经验风险函数[

](http://private.codecogs.com/eqnedit.php?latex=R_{emp}(f))就趋近于风险函数[

](http://private.codecogs.com/eqnedit.php?latex=R_{exp}(f))。

所以，在样本容量足够大的时候，我们可以用经验风险[

该模型采用最小花策略进行最优模型选择。
当训练数据量相对较少时, 我们倾向于利用经验风险函数[ $R_{emp}(f)$ ]来进行参数估计。
为了增强分类器的一般化能力, 我们将引入正则化方法以防止过拟合。
在此过程中, 我们的首要目标是实现分类器的目标函数[ $J(f)$ ]。

](http://private.codecogs.com/eqnedit.php?latex=R_{emp}(f))来估算风险函数[

](http://private.codecogs.com/eqnedit.php?latex=R_{exp}(f))的效果并不理想，它很有可能产生一个叫做过拟合的现象。为了防止过拟合现象，结构风险最小化这个策略被提了出来。

结构风险的定义为：

[

](http://private.codecogs.com/eqnedit.php?latex=R_{srm}(f)=\frac{1}{N}\sum_{i=1}^{N}L(y_{i},f(x_{i}))+\lambda&space;J(f))

其中，[

该标记代表了模型的复杂度。该系统中所涉及的模型具有一定的复杂性。

](http://private.codecogs.com/eqnedit.php?latex=f)越复杂，[

](http://private.codecogs.com/eqnedit.php?latex=J(f))的值就越大。[

λ是一个非负系数，在协调经验损失与模型复杂度之间起作用的一个参数值

](http://private.codecogs.com/eqnedit.php?latex=\lambda&space;J(f))起到是一个惩罚项的作用，当模型越复杂，惩罚项越大。它所基于的理论是，当一个模型越复杂，我们认为它的泛化能力越差，越不具有一般性，越容易发生过拟合。

综上，我们在统计学习中的策略一般有两种——经验风险最小化，结构风险最小化。此时，我们就把统计学习问题转为了求解下面目标函数的优化问题：

[

](http://private.codecogs.com/eqnedit.php?latex=min&space;\quad&space;\frac{1}{N}\sum_{i=1}^{N}L(y_{i},f(x_{i})))

或者：

[

minimum of the expression $\frac{1}{N} \sum_{i=1}^{N} L(y_i, f(x_i)) + \lambda J(f)$

三、算法

方法即是解决该优化问题的关键所在。

这将涉及数值优化的相关知识。

选择恰当的最优化方法即可解决该问题。

全部评论 (0)

还没有任何评论哟~

统计学习笔记——统计学习三要素

参考书：《统计学习方法》——李航统计学习的三要素为：模型、策略、算法。写在前面的话：以下以监督学习为基础来进行论述。监督学习的[]http://private.codecogs.com/eqn...

《统计学习方法》学习笔记1——统计学习三要素

什么是统计机器学习/统计学习/机器学习？三个词指的都是同一概念，这里统一简称为机器学习，指的是计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。

[统计]_统计学习的三要素

这篇文章是对李航老师的《统计学习方法》同名章节的一个总结，李航老师在书中把统计学习分为了三个要素：模型，策略和算法。我个人感觉这是一个思路很清楚的划分，学习这部分内容，不一定能帮你答题，但有助于从一个...

机器学习笔记之统计学习方法三要素

前言本学期学习了机器学习的课程，读了《统计学习方法》——李航著，做为笔记。统计学习方法都是由模型、策略和算法构成的，作为初学者，可能大部分人都直接上手，各种python库一顿乱调，但其实知识不成体系...

计算机系统要素学习笔记

目录计算机阶层体系 pro1逻辑门设计方法总结 pro2布尔运算 pro3时序逻辑 pro4机器语言 pro5计算机体系结构计算机阶层体系高级语言/应用程序操作系统编译器虚拟机汇编编译...

【机器学习】—何为统计学习方法三要素？

阅读之前看这里👉：博主是一名正在学习的学习者学生，在每个领域我们都应当是学生的心态，也不应该拥有身份标签来限制自己学习的范围，所以博客记录的是在学习和求职过程中一些总结，也希望和大家一起进步，在记录...

统计学习方法学习笔记（一）统计学习方法的分类和简介，统计学习方法三要素（模型，策略和算法）

文章目录统计学习分类基本分类按模型进行分类按算法进行分类按技巧分类统计学习方法三要素实现统计学习方法的步骤如下：模型策略算法统计学习分类基本分类监督学习无监督学习强化学习有时...

Three.js学习笔记-三要素

Three.js学习笔记三要素一、Three.js简介（一）前世今生 Three.js是一款在浏览器中的3D引擎，由RicardoCabello（Mr.doob）在2010年4月于GitHub首次...

【学习笔记】数理统计习题三

Q1:LetX1,\dots,X15beasimplerandomsampleofN0,2^2.Whatisthedistributionof Y=\fracX1^2+\dots+X10^22X11^...

[统计学笔记] 统计学学习笔记重点总结

写在前面的话这两年DataScience和DataScientist是比较“火爆”的名词了，各大公司，不仅仅是IT&ICT类型的公司都在开展相关领域的工作，招聘和培养相应的人才。

是否确定退出登录?

统计学习笔记——统计学习三要素

写在前面的话：

一、模型

二、策略

三、算法

全部评论 (0)

相关文章推荐

统计学习笔记——统计学习三要素

《统计学习方法》学习笔记1——统计学习三要素

[统计]_统计学习的三要素

机器学习笔记之统计学习方法三要素

计算机系统要素学习笔记

【机器学习】—何为统计学习方法三要素？

统计学习方法学习笔记（一）统计学习方法的分类和简介，统计学习方法三要素（模型，策略和算法）

Three.js学习笔记-三要素

【学习笔记】数理统计习题三

[统计学笔记] 统计学学习笔记重点总结