全国服务热线:400-777-6907

网站首页 学习分享 六西格玛管理文章> 六西格玛工具

置信区间的基本概念

作者:    分类:六西格玛工具    时间:2015-07-20 09:27:44

统计量的抽样分布的发展对能否利用抽样统计量获得总体特征至关重要。但是样本统计的特征,比如均值,都是只通过一个样本计算出来的,所以只能逐点估计整体特征。由于样本选择不同,点的估计值会有很大差异。因此,统计学家提出了区间估计的概念来估计人口的特征,并以上下限的形式表达置信水平。


为了理解区间估计的概念,让我们回到网站订单完成时间的200个例子。讨论绘制测量数据图表的顺序,“在图表中显示数据”。现在把这200单的完成时间看成一个整体,整体的特点在实际情况中是未知的。对于这一人群,平均值为69.637分钟,标准偏差为10.411分钟。


为了测试不同样本之间的差异,从总共200个订单中选择样本空间n为10的20个不同样本。这些样品的结果如表1所示。


置信区间的基本概念



从表1中,我们可以得出以下结论:


1.不同样本的样本统计是不同的。样本均值在61.10分钟至76.26分钟之间变化,样本标准差在6.50分钟至14.10分钟之间变化,样本中值在61.35分钟至76.85分钟之间变化,样本范围在21.50分钟至41.60分钟之间变化。


2.部分样本平均值大于总体平均值69.637分钟,部分样本平均值小于总体平均值;


3.部分样本的标准差大于总体标准差10.411分钟,部分样本的标准差小于总体标准差。


4.不同样本的变异远远大于样本的标准差。


不同样本之间样本统计量的差异称为抽样误差。抽样误差是从总体中选择单个样本时的变化。抽样误差的大小主要取决于总体的变异程度和样本量。大样本认为对于小样本,采样误差较小但成本较高。


因为在实践中通常只选择一个样本,统计学家开发了一些有特色的方法来估计人口,包括由上限和下限组成的区间,而不是一个值。这个区间称为置信区间估计。使用表1中的订单完成时间来说明总订单完成时间平均值的置信区间估算,如表2所示,20个样本,每个n为10:


置信区间的基本概念



首先,检查第一个选定的样本。样本均值为74.15分钟,样本标准差为13.3876分钟,总体均值的区间估计为67.6973-80.6027分钟。我们不需要知道这个置信区间估计值是否准确,因为在实际研究中我们很少知道总体均值的实际大小。然而,在订单完成时间的例子中,已知整体平均值为69.637分钟。如果我们检查67.6973-80.6027分钟的区间,我们会发现69.637的整体平均值包含在这个区间内。因此,第一个样本以区间估计的形式准确地估计了总体均值。再看其他19个样本,我们会发现除了第二个和第十二个样本之外,所有的样本都有类似的结果。对于对应于每个样本的区间(除了第2个和第12个样本),69.637的总平均值落在区间的某处。


但对于第二个样本,平均样本为61.10分钟,间隔为54.6473-67.5527分钟,对于第十二个样本,间隔为69.8073-82.7127分钟。样本平均值69.637落在区间外,用这两个样本对总体平均值的估计是不准确的。


实践中,使用区间估计主要存在两个问题:实践中只选取一个样本,无法100%确定总体特征的估计是正确的;然而,通过将确定水平设置为小于100%的值,并使用总体特征的区间估计,我们可以基于给定的精度获得统计推断。


通常,95%的置信区间估计值可以理解为,如果选择了所有可能的n尺寸样本,则95%的样本将包括整体特征,5%的样本将不包括整体特征。


95%是最常用的置信区间,如果需要增加置信度的话。99%也是常用的。如果你需要更少的自信,你可以用90%。然而,不同的置信水平和置信区间 width之间有得有失。对于给定的样本量,如果您希望置信区间具有更高的置信度以包含整体特征,则置信区间会更宽,采样误差也会更大。


无论估计人口的哪个特征,置信区间估计的基本概念都是一样的。为了执行置信区间估计,我们需要知道用于估计总体特征的样本统计及其抽样分布。


查看更多请点击-->:六西格玛工具