Advertisement

方差 标准差_方差、标准差、协方差、相关系数

阅读量:
e6cf22bcd4616d33fcbedc1811fd19d9.png

一、定义、公式
二、方差、标准差 vs 协方差、相关系数 区别

一、定义、公式

1、方差

概念:衡量一组数据离散程度的指标。在统计分析过程中,方差被用作度量每个观测值与总体均值之间差异程度的方法

公式:

复制代码
     为样本方差,X为变量,  为样本均值,N为样本例数。
    
    AI写代码

2、标准差

定义:标准差(std),是偏差平方的算术平均数的平方根,并被符号σ所表示。该指标也被称为标准偏差或实验标准差,在概率统计学中常用作度量数据分布程度的标准。

公式:

变异系数:

,其中

指数据的平均数

复制代码
    ps:标准差越小,说明数据越集中。
    
    AI写代码

3、协方差

定义:协方差(Covariance)用作衡量两个变量之间整体变化程度的一种指标。当两个变量在数值上呈现同步变动时即为正值;而当其中一个变量超出预期水平时另一个变量却低于预期水平时则表现为负值。

公式1:

公式2:

------该公式易于理解

其含义可作如下解释:考虑两个随机变量X和Y,在每个时间点上取到对应的数值时,X数值与其期望(即均值)之间的偏差与Y数值与其期望之间的偏差相乘得到一个结果,将所有时间点上的这些结果累加起来,并计算它们的平均数,即可得到协方差的结果。

复制代码
 注:

    
 1.协方差可以反应两个变量的协同关系, 变化趋势是否一致。同向还是方向变化。
    
 2.X变大,同时Y也变大,说明两个变量是同向变化的,这时协方差就是正的。
    
 3.X变大,同时Y变小,说明两个变量是反向变化的,这时协方差就是负的。
    
 4.从数值来看,协方差的数值越大,两个变量同向程度也就越大。反之亦然。
    
    
    
    
    AI写代码

4、相关系数

定义:相关系数是用以反映变量之间相关关系密切程度的统计指标。

公式:

注:相关系数是对协方差进行标准化处理得到的一种指标,在消除数据维度和规模差异的基础上直接反映了两个指标在单位变动时的一致性程度

针对量纲问题,在实际操作中可以参考相关案例分析以了解协方差与相关系数之间的关系

复制代码
 该案例转自以为老师,如有叨扰,可留言,我会删除链接,谢谢。

    
  
    
 相关性:指两变量之间的关联程度,如正相关,负相关,不相关。
    
    
    
    
    AI写代码

二、方差、标准差 vs 协方差、相关系数 区别

方差、标准差

用来描述一维数据。

协方差、相关系数

协方差仅适用于二维数据,在面对高维数据集时,则必须计算相应的协方差矩阵。例如,在n维的数据集中,我们需要计算 n(n−1)/2 个独立的协方差值。


关注/收藏

关注/收藏

全部评论 (0)

还没有任何评论哟~