Advertisement

可汗学院公开课——统计学学习:35-46

阅读量:

中心极限定理

随着样本数量增加,随机变量序列部分和分布渐进于正态分布。

样本均值的抽样分布

偏态:正偏态(右偏态) 负偏态(左偏态)

峰度:正峰态----峰值较尖 负峰态----峰值平滑

根据中心极限定理可知,在其他条件不变的情况下,在大样本情况下,
无论总体是否服从某种特定分布,
其抽样均值都会服从或近似服从正态分布。
由此得到的正态分布,
其均值与原变量一致,
\mu_{\overline{x}}=\mu
而方差则缩小为原始方差的1/n,
\sigma_{\overline{x}}^{2}=\frac{\sigma^{2}}{n}
进一步地,
标准误则等于总体标准差除以根号n,
\sigma_{\overline{x}}=\frac{\sigma}{\sqrt{n}}

伯努利分布

最简单的二项分布在N=1时被称为伯努利分布在概率论中,
其特例即为当试验次数N等于1时的情况。
同样地
也可以认为二项分布在重复n次独立试验中表现出来。
此外
伯努利分布在概率论领域也被称为零一分布或两点分布在概率论领域
称为随机变量X服从参数为p(其中0 < p < 1)的两点分配其取值分别为数值1的概率为p数值0的概率则为(1 - p)
因此我们说随机变量X服从参数为p的两点分配

置信区间

使用样本方差S来估计总体方差\sigma;这也是为何将其称为置信区间而非概率的原因所在;其中方差被视为估计值。

小样本容量置信区间

一般而言,在样本数量超过30的情况下(即n>30),数据趋于呈现正态分布特征。然而,在实际应用中若遇到样本数量较小的情况(即n<30),则不宜直接假设其服从标准正态分布;相反地应被视为t分布在小样本情况下的适用模型。值得注意的是,在这种情况下其尾部较为宽厚。

全部评论 (0)

还没有任何评论哟~