最常见的置信区间估计包括总体均值的估计。在实践中,具有已知样本均值和标准差以及未知总体标准差的样本数据用于估计总体均值。在这种情况下,统计学家提出了一种T分布来估计均值的置信区间。通过下面的例子,我们可以对均值的置信区间估计有更深的理解。
在纽约州,存储银行被允许销售一种名为储蓄银行人寿保险(SBLI)的保险产品。保险业的审批程序包括申请的审批、体检信息的正式确认、对体检信息和体检测试的可能要求,在保单准备阶段,将保险单据送到银行进行交付。在有效时间内将保险单传递给客户的能力是这项服务盈利的一个重要关键点。在一个月的某个时间,选择一个由24张已审批的保单组成的样本,记录总的处理时间天数。结果如图1所示:
图1 对于24个保险申请样本的处理时间
图2描述了Minitab置信区间估计对于总体均值的推断。图3描述了JMP输出。
图2 Minitab总体均值置信区间估计
图3 JMP置信区间估计
因此,可以得出以下结论:处理保险申请的总体平均时间在37.478天至50.605天之间,置信区间为95%。
图4为处理保险时间的Minitab正态分布散点图。
图4 处理保险时间的Minitab正态分布散点图
从图中可以看出,正态分布散点图中的点大致围绕着一条连接最小值和最大值的直线。因此,没有太多理由怀疑严重违反常见假设可能会影响置信区间估计的有效性。
注意:均值置信区间估计的一些假设。
t分布假设被研究的变量是正态分布。实际上,随着样本量的增加,且总体偏度不明显,在总体标准差(σ)未知的情况下,我们可以用T分布来估计总体均值。当样本量较小时,总体分布是偏态的,应首先考虑置信区间的有效性。总体为正态分布的假设可以通过样本数据的形状来判断,使用直方图、箱线图或正态概率图。
上一篇:置信区间的基本概念
下一篇:个体值与比例的置信区间估计