Advertisement

人大版统计学教材第六版学习笔记--第7章 参数估计

阅读量:

文章目录

  • 参数估计的核心概念

    • 参数的点估算与区间预测
      • 点估算方法与区间预测方法

        • 点估算方法
        • 其核心是基于样本数据直接计算出一个具体的数值作为总体参数的近似值。
        • 包括矩估法、最大似然估法等经典方法。
        • 这种方法能够提供一个精确的数值结果。
        • 在实际应用中具有较高的计算效率。
      • 评价估计量的标准

  • 对单一总体参数进行区间估计

    • 对总体均值进行区间估计(即被确定为均值参数)
    • 对总体比例进行区间估计(即被确定为比例参数)
    • 对总体方差进行区间估计(即被确定为方差参数)
  • 基于两个总体参数的区间估计

    • 基于两总体系数均值差异的区间估计
      • 基于两总体系数比例差异的区间估计
      • 基于两总体系数方差比值的区间估计
  • 样本容量设定

    • 基于均值估计的需求下样本容量设定
    • 基于比例估计的要求下样本容量设定

参数估计:在抽样及抽样分布的基础上,根据样本统计量来推断总体参数。

参数估计的基本原理

估计量与估计值

为了探究一批灯泡的平均使用寿命,在实际操作中无法收集全部灯泡的数据。因此,通常采用抽样的方法,并利用样本信息进行总体特征的推断。

点估计和区间估计

点估计

point estimation:基于样本统计量选择一个合适的点估计量来代表总体参数

总体参数(真值)即为目标点,在进行一次抽样时可被视为一次射击操作。虽然完美击中目标点的概率较低微,但射中目标区域的可能性却很高。
我们以该点为中心位置,在其周围绘制一个区间范围,并假设该区间有很高的概率包含总体参数。

区间估计

区间估计interval estimate是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。(下限,点估计,上限)根据样本统计量的抽样分布对样本统计量和总体参数的接近程度给出一个概率度量。
以总体均值的区间估计为例来说明区间估计的基本原理。
样本均值的抽样分布sampling distribution of the sample mean(近似正态分布)样本均值的数学期望等于总体均值E(\bar x)=\mu,样本均值的标准误差为\sigma_{\bar x}=\sigma/\sqrt n。可知样本均值\bar x落在距离总体均值\mu 1个抽样标准差范围内的概率为0.6827,2个抽样标准差范围内的概率为0.9545,3个抽样标准差范围内的概率为0.9973等。
在实际情况中,样本均值\bar x是已知的(随机、已知),而总体均值\mu是未知的(固定、未知)。样本均值\bar x落在总体均值\mu的两个标准差范围之内,反过来,总体均值\mu也就被包括在以样本均值\bar x为中心的两个标准差范围之内。即约有95%的样本均值\bar x会落在总体均值\mu的两个标准差范围之内,也可以说是,约有95%的样本均值\bar x所构造的两个标准差区间会包括总体均值\mu

为了估计总体均值,在抽取100个样本的基础上构建了100个置信区间;这些置信区间的统计特性表明,在长期重复抽样过程中有约95%的概率能够准确地捕捉到该参数的真实取值范围。

在这里插入图片描述

standard deviation SD衡量数据分布的分散程度;例如常见的68-95-99.7法则就很好地描述了这一特征。
standard error SE表示样本均值的标准偏差;它反映了在多次抽样中样本均值之间的变化范围。

在区间估计过程中,在基于样本统计量构建的总体参数估计范围内被称为置信区间(confidence interval),该范围的最低边界即为置信下限(lower confidence bound),最高边界则被称为置信上限(upper confidence bound)。

这个区间被认为在一定程度上包含了总体参数,并因而被称为置信区间。

在构建置信区间的过程中,在大量重复抽样时,在构建的置信区间中包含总体参数真实值的比例即为该置信水平;根据研究需求和数据分析结果,在构建置信区间时通常会选择90%、95%或99%等常用显著性水平;其中最常见的选择通常是90%、95%或99%,具体选择依据研究者的需求和数据性质。

当样本量确定时,在给定的置信水平下(即固定的情况下),其对应的估计量置信区间的宽度会随着估计量误差的变化而变化。

在其他条件不变的情况下(如在相同的显著性水平下),当观察到的数据点数量增加时(即样本容量增大),用于构建参数估计量置信区间的必要精度也会相应提高。

采用95%的置信水平来估算某班学生考试分数范围时(即设定显著性水平α=5%),所得结果表明该班级学生的平均分数落在60至80分之间的概率实际上是零或百折不 branching的可能性问题。

正确的理解应当基于假设检验理论:如果从总体中抽取了100个独立样本并分别计算每个样本下的统计量及其相关参数估计值,则在这些情况下大概会有95个这样的区间能够包含真实的参数值。

评价估计量的标准

未完待续…

一个总体参数的区间估计

总体均值的区间估计

总体比例的区间估计

总体方差的区间估计

两个总体参数的区间估计

两个总体均值之差的区间估计

两个总体比例之差的区间估计

两个总体方差比的区间估计

样本量的确定

估计总体均值时样本量的确定

估计总体比例时样本量的确定

全部评论 (0)

还没有任何评论哟~