1.个体值的区间估计和预测
除了总体平均值的置信区间估计之外,通常还需要预测未来个体值的结果。
虽然平均预测区间的形式与置信区间估计相似,但对预测区间的理解是不同的。预测区间是对可观察的未来个体值X1的估计,而不是对未知总体参数μ的估计。因为Minitab和JMP现在无法计算预测区间,所以预测区间如公式1所示:
式1
回到保险申请处理时间的例子(在此《均值的置信区间估计(σ未知)》文章)中来,假设我们未来需要建立个人保险申请处理时间95%的预测区间估计。使用公式2:
式2
因此,我们预测未来个人保险申请的办理时间为11.22-76.86天,概率为95%。这个结果明显不同于均值的置信区间估计。因为我们估计的是未来的个人价值,而不是整个人口的平均值,所以预测区间足够宽。
2.比例的置信区间估计
因子的置信区间估计可用于估计给定类别中事件的概率。样本均值可以用来估计总体均值,这里我们可以利用事件的样本比例(P)来估计总体比例(π)。
样本统计量p服从二项分布,在大多数情况下可以用正态分布来近似。
为了说明比例的置信区间估计,我们可以考察大城市报纸质量工程师面临的问题。在报纸生产过程中,一个重要的质量特征与印刷报纸的比例有关,尽管存在许多不一致的因素,如印刷过剩、页面设置不合理、缺页或多页等。因为测试每份报纸是不现实的(耗时且昂贵),所以随机抽取了200份报纸作为研究和使用的样本。假设有35个样本,容量为200,在某种程度上质量问题最多。下表是Minitab对存在质量问题的报纸比例的95%置信区间估计:
因此,所有置信区间的95%来自200份报纸的随机样本,这将包括总体比例。由于总比例未知,12.2% ~ 22.8%的区间可能是包含总比例的95%的区间,而建立无总比例区间的概率为5%。
对于给定的样本量,比例的置信区间通常比其他测量变量更宽。对于连续变量,通过测量其概率获得的信息比分类变量获得的信息多。换句话说,分类变量只有两个可能的值,这与连续变量的概率度量相比是粗略的。因此,分类变量的测量只能为估计的参数提供很少的信息。
上一篇:均值的置信区间估计(σ未知)
下一篇:如何进行流程图分析