Advertisement

方差、标准差、均方差和均方误差的区别

阅读量:

方差(variance)是在概率论与统计学中衡量随机变量或一组数据离散程度的一种指标。在概率论中,方差被用来度量随机变量与其数学期望(即均值)之间的偏离程度。而在统计学中,则将样本方差定义为各个数据与其平均数之差平方的平均值之和的比例系数。研究方差的意义在于其能够反映数据分布的分散程度及其波动情况等关键特征。

然后对各个数据与均值的差的平方求和

这里写图片描述

,最后对它们再求期望值就得到了方差公式。

这里写图片描述

这个公式描述了随机变量或统计数据与均值的偏离程度。


二、方差与标准差之间的关系就比较简单了

这里写图片描述

根号里的内容就是我们刚提到的

这里写图片描述

那么问题来了:既然已经有了方差这一指标来衡量变量与其均值之间的偏离程度,请问为什么要引入标准差这一概念呢?我发现没有意识到这一点之前一直困惑不已

我发现没有意识到这一点之前一直困惑不已:由于方差与其所衡量的数据量纲不一致尽管能够很好地反映数据与其均值之间的离散程度但这种处理方式却难以完全符合人们的直观理解

比如说在一个包含60名学生的班级中平均成绩为70分标准差为9平方根下81即为9这样的情况下我们无法直接通过观察到的具体数值来准确判断每个学生相对于平均成绩的具体差距但我们可以通过计算得到学生成绩分布在[61 79]分数段的概率约为68 26%也就是说大致相当于图中所示区域面积约为34 2%乘以两个尾部区域

这里写图片描述

三、均方差、均方误差又是什么?
标准差(Standard Deviation) ,中文环境中又常称均方差,但不同于均方误差(mean squared error,均方误差是各数据偏离真实值的距离平方和的平均数,也即误差平方和的平均数,计算公式形式上接近方差,它的开方叫均方根误差,均方根误差才和标准差形式上接近),标准差是离均差平方和平均后的方根,用σ表示。标准差是方差的算术平方根。
从上面定义我们可以得到以下几点:
1、均方差就是标准差,标准差就是均方差
2、均方误差不同于均方误差
3、均方误差是各数据偏离真实值的距离平方和的平均数
举个例子:我们要测量房间里的温度,很遗憾我们的温度计精度不高,所以就需要测量5次,得到一组数据[x1,x2,x3,x4,x5],假设温度的真实值是x,数据与真实值的误差e=x-xi
那么均方误差MSE=

这里写图片描述

总体而言,在统计学中衡量数据序列与其平均值之间差异程度的是均方差这一指标,在回归分析中衡量数据序列与其真实观测值之间偏离程度的是均方误差这一指标。因此我们只需关注真实观测值与平均预测值之间存在的关联即可。

全部评论 (0)

还没有任何评论哟~