Advertisement

方差、协方差、标准差、均方差、均方根值、均方误差、均方根误差对比分析

阅读量:

方差、协方差及标准差(标准偏差/均方差)、均方误差与均方根误差(标准误差)、均方根值

本文是博主在查阅网上的相关资料后进行整理和归纳,并最终完成编写工作的一篇总结性文章。如有任何发现错误或不当之处,请随时留言以便我们进行更正是非常感谢。此内容仅作为分享与学习使用,请广大网友提出宝贵意见或建议。


方差(Variance)

方差用于衡量随机变量或一组数据的离散程度,方差在在统计描述和概率分布中有不同的定义和计算公式。①概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度;②统计中的方差(样本方差)是每个样本值与全体样本均值之差的平方值的平均数,代表每个变量与总体均值间的离散程度。

概率论中计算公式

离散型随机变量的数学期望:

---------求取期望值

连续型随机变量的数学期望:

----------求取期望值

其中, pi 是变量, xi 发生的概率, f(x) 是概率密度。

---------求取方差值

统计学中计算公式

总体方差的计算方式

-----------求取总体均值

其中

------------求取总体方差

其中,\bar{X}为数据的平均数,n为数据的个数,s^{2}为方差。

样本统计量或估计量无偏估计在实际应用中被广泛使用。由于总体均值\bar{X}难以准确获得,在实践中通常通过抽样数据进行估计。进而导出样本方差的计算公式如下

--------------求取样本方差

此处,请解释为何样本方差计算时将分母调整为n-1而非n?其背后的原因是为了实现无偏估计方法来降低计算误差。建议进一步阅读《为什么样本方差的分母是 n-1》的文章以获取更深入的解答。

协方差(Covariance)

在概率论和统计学领域中使用协方差来衡量两个随机变量之间的关系及其波动性。这种度量方法特别适用于分析数据集中的多维特征间相互作用的程度。具体而言,在两个变量相同时的情况下,则该度量方法退化为计算单一变量的方差。协方差实际上反映了两个随机变量之间存在的系统误差水平;这与仅反映单个随机变量误差水平的方差存在显著差异。当两个随机变量的变化方向一致时(即其中一个高于其期望值而另一个同样高于其期望值),则计算出的协方差将呈现正值;反之,在两者变化方向相反时(即其中一个高于其期望值而另一个低于其期望值),则计算出的协方差将呈现负值。

formula
formula

其中E[X]E[Y]分别代表两个实数随机变量XY的expected value(期望值),而covariance(X,Y)则表示XY之间的covariance(协方差)。

标准差( Standard Deviation**)**

该指标也被称为**均方根偏差** ,在统计学中常用以衡量数据与均值之间的离散程度,在中文环境下亦常称其为标准偏差 。它表示数据与均值之差的平方平均数后再开平方得到的结果σ 。其计算公式即为:σ = √(Σ(x_i - μ)² / N),其中μ代表样本均值。

------------求取样本标准差

其中,

代表所采用的样本X1,X2,...,Xn的均值。

-------------求取总体标准差

其中,

代表总体X的均值。

:有一组数字分别是200、50、100、200,求它们的样本标准偏差。

= (200+50+100+200)/4 = 550/4 = 137.5

= [(200-137.5)2+(50-137.5)2+(100-137.5)2+(200-137.5)2]/(4-1)

样本标准偏差 S = Sqrt(S^2)=75

均方误差( mean-square error, MSE**)**

均方误差是一种衡量估计量与被估计量之间差异程度的标准指标。进一步说明参数估计值与参数真值之间的关系,则是通过计算这些值与其真值之差的平方的期望值得出的。MSE能够表征数据的变化程度,并且其数值越低,则表示预测模型在描述实验数据时具有更高的精确度。

均方根误差( root mean squared error,RMSE**)**

均方根误差亦称标准误差,是均方误差的算术平方根。换句话说,是观测值与真值(或模拟值)偏差(而不是观测值与其平均值之间的偏差)的平方与观测次数n比值的平方根,在实际测量中,观测次数n总是有限的,真值只能用最可信赖(最佳)值来代替。标准误差对一组测量中的特大或特小误差反映非常敏感,所以,标准误差能够很好地反映出测量的精密度。这正是标准误差在工程测量中广泛被采用的原因。因此,标准差 是用来衡量一组数自身的离散程度,而均方根误差 是用来衡量观测值同真值之间的偏差。

均方根值( root-mean-square,RMES**)**

均方根值也可称为方均根值或有效值,并被广泛应用于数据统计分析领域。在这一过程中,我们首先将所有数值先平方后相加,并计算它们的平均数(即总和除以数值个数),随后对这个平均数取平方根以获得均方根值。这一指标在物理学研究中被用来评估噪声特性。

例如幅值为100V且占空比为一半的方波信号,在采用平均值计算时其电压降为5O V,在采用均方根值计算时则可获得约7O .7I V.为什么会存在这样的差异呢?例如一组lOO V 的电池组,在每隔十分钟后供电十分钟.也就是说占空比达一半.当这组电池驱动负载电阻时,在供电十分钟内会产生约l安培 的电流以及一千瓦特 的功率.而在停电期间电流与功率则完全归零.

全部评论 (0)

还没有任何评论哟~