方差分析(ANOVA)是一种概率统计分析方法,用于研究不同水平的自变量或控制变量是否对因变量或观察变量有显著影响。如果只研究单个因素对观察变量的影响,则称为单向方差分析。
图 六西格玛之单因素方差分析
在六西格玛项目的实现中,需要用数据来判断团队认为可能影响流程产出Y的因素X,从而确认是否是关键X。
这种分析和判断可以由两个方面组成:
①这个因素X对过程产出Y的影响真的存在吗?也就是回答这个因素x对过程输出y的影响在统计上是否显著。
②这个因素X对过程产出Y的影响有多大?团队需要足够重视吗?除了这个影响因素X,是否还需要X的其他影响?即,回答该因素X对过程输出Y的影响在实践中是否显著。
方差分析是帮助团队回答上述问题的统计分析方法。在方差分析中,过程输出Y(因变量)为连续测量数据,而过程影响因素X(自变量)为差异数据,如不同团队、不同操作、不同过程状态、不同设计方案等。团队在考察因素的影响时,如果只考虑一个因素X影响Y,可以用单向方差分析来完成。
按照以下步骤,方差分析可以用来帮助团队得出分析结论:
①检查组收集的分析数据。如果过程输出Y的测量是连续数据,过程影响因子X是分组数据以区分不同状态(对应不同水平的因子),并且只考虑单个X的影响,那么可以用方差分析来回答影响的统计意义和实际意义的问题。
②检查数据是否满足方差分析的三个条件。
③确定显著水平α=0.05。
④利用收集到的数据,计算因子的离差平方和、误差的离差平方和、总离差平方和,计算因子和误差的自由度、对应的均方、因子和误差均方之比——F统计量。
⑤从F统计量计算相应的P值。如果p的值小于给定的α,则至少在一个水平上因子的总体均值不同于其他水平上的均值,因此可以判断因子X对过程输出y有显著影响。
⑥计算因素X的贡献率,即该因素方差之和与总波动方差之和的比值,以此判断该因素的影响,以及团队是否需要关注其他X的影响。