全国服务热线:400-777-6907

网站首页 学习分享 六西格玛管理文章> 六西格玛工具

如何利用算数平均值来进行测量

作者:    分类:六西格玛工具    时间:2015-07-08 09:20:29

虽然曲线图可以表示出图表和表格所涉及的基本数据,但是关键质量特性和关键过程特性仍然需要以可视化的方式来表达出来,这就需要来计算集中趋势和分布情况。


有三种方法可供选择:算术平均值、中位数和众数(本章介绍的是算术平均值,下一章讲介绍中位数与众数)。如果是从样本中得到的测量值,即为统计量。如果是从总体中得到的测量值,即为参数。(为了区别样本值和总体值的不同,罗马字符用于表示样本统计量,而希腊字符用于表示总体参数)。


算术平均值:平均值可以通过对各个不同的数值的计算得出来,即用各个数的和除以数值的个数可以得到答案。


对于一组简单的样本数据X1,X2,X3,…,Xn,样本的算术均值可以这样表示:


如何利用算数平均值来进行测量


为了更好的理解样本均值的概念,不妨和个人生活常识结合起来考虑。很多人会困惑,为什么早上准备去工作的这段时间总是比期望的要长一些,但是很少有人真正的测量过他们早上实际所花费在准备阶段的时间。假定你把从起床到离开家的这段时间以分钟来计时(四舍五入到最接近的分钟数)。你连续的在10个工作日测量,得到如下数据:


如何利用算数平均值来进行测量


为了要算出时间均值,首先要得出所有数值的和是多少,39+29+43+52+39+44+40+31+44+35=396。然后将其值3%除以个数10,得到39.6,这就是所求的时间均值。


虽然时间的均值是39.6,但这并不意味着在一个单独的样本里,值也正好是39.6。而它只是表达出样本值的集中趋势的属性而已,均值的计算也是基于所有样本值而得到的。


注意:当使用算术平均值的时候,由于计算基于每个具体的数据的值,均值会被某个极端的特殊的值影响。当出现这种情况时,均值就无法正确反映数据的真实情况。因此,在这种有特殊值的情况下,均值就不是反映数据集合的集中趋势的最佳方法。


为了验证极端值对数据的集中趋势的影响,我们假定把上例中的时间的最大值52换成98,则均值可以这样算出:


如何利用算数平均值来进行测量


大家可以发现一个极端值可以让均值变化的如此之大。和原先的数据相比,我们发现前例的均值是处在所有数据值之间的,而后例中的均值则比除了一个极端值以外其他9个值都要大。因此,均值对于表示数据的集中趋势并不是一个非常好的方法。

查看更多请点击-->:六西格玛工具