方差,协方差,标准差和均值标准差等各种差
3 方差
3.1 英文名称
variance
3.2 所属学科
概率论和统计
3.3 实际用途
在概率论中,方差用于衡量随机变量与其均值之间的偏离程度。当标准偏差与方差增加时,在统计学中计算样本方差时,默认的做法是取各数据与其算术平均数之差平方后的总和,并将其平均。相反地,在这种情况下(即当离散程度减小时),这些指标会反映出数据点更加集中于均值周围。
3.4 历史
"方差"(variance)这一术语最初是由罗纳德·费雪(Ronald Fisher)在其论文《The Correlation Between Relatives on the Supposition of Mendelian Inheritance》中首次提出。
3.5 定义
是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。
3.6 公式
设 X 是一个随机变量,若
当X存在时,则称其为X的方差,并定义符号表示为D(X)、Var(X)或DX。其中E(X)表示X的期望值;而X代表实际观测到的数值。
称为方差。这里E{}只能理解为一个记号,真正的公式在这里:
右边的求和公式可以转换成更容易计算的形式:
- 说明
-
-
-
-
-
- 可以提取出来
-
-
-
-
-
用newlisp计算,实现代码如下:
; variance of a data vector X(define()(div()(sub(length)1))); sum of sqared differenses of X to mean of X(define()(sub()(div(mul()())(length))))
调用代码如下:
>(module"stat.lsp")(lambda()(append(join(mapstring)"\r\n")"\r\n"))>(setf(1231457))(1231457)>()4.904761904761905
4 标准差
(均方差)
4.1 英文名称
Standard Deviation
4.2 实际用途
因方差为数据平方而与检测值差距显著,在实际应用中不易直接观察其大小。通常采用对方差开平方来获得度量指标即是所要介绍的标准偏差。
4.3 公式
4.4 计算
newlisp 调用如下:
>()2.214669705568283
5 协方差
5.1 英文名称
covariance
5.2 简介
从直观上讲, 协方差衡量的是两个随机变量间误差的程度. 当这两个变量子相同的时候, 方差异即为这种特殊情形下的协变数. 对于不同的变量子而言, 两者的协变数即为它们之间的差异. 若变量子X与子Y相互独立, 则E[(X−E(X))(Y−E(Y))] = 0. 因此如果上述数学期望不等于零, 则子X与子Y之间必然存在某种关联.
5.3 公式
[]内部的乘法式子变换一下
将E[…]内部的都提取出来
该方法将变量Y的概率加权平均数视为一个常数,在运算过程中能够被提取到外部运算符的作用范围内。类似地,在处理包含两个期望值相乘的情况时(如...),同样遵循类似的线性性质进行计算。
所有E()都统一写成E[]
5.4 计算性质
协方差的性质:
1. Cov(X,Y)=Cov(Y,X)
2. Cov(aX,bY)=abCov(X,Y), (a,b是常数)
3. Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
