假设检验是六西格玛团队项目中使用最广泛的统计工具。例如要判断下列结论是否正确:“新员工比老员工得到更多的投诉”,“改进工作后平均产量有提高”,“加工温度为180度时比160度时垫圈断裂强度要高”等等。由于观测数据总是存在误差,我们不能从简单样本统计的结果中得出结论,必须使用严格的统计学假设检验方法才能得到准确的判断结论。
参数估计和假设检验是统计推断的两个重要方面。参数估计以“数”为输出结果,假设检验以“判断”为输出结果。以下描述了假设检验步骤。
1.建立一个假设。
假设检验的第一步是建立假设,这通常需要两个假设:原始假设Ho和替代假设H1。
2.选择检验统计以确定被拒绝域的形式。
如果测试总休息的平均值,那么我们将使用样本平均值来导出测试统计量;如果正态总体的方差被检验,我们将从样本方差中导出检验统计量。
根据统计量的值,将整个样本空间分为拒绝域W和非拒绝域a两部分,当样本统计量的值落在拒绝域时,原假设将被拒绝,否则不能拒绝原假设。因此,在假设检验,我们必须找出被拒绝的域。
根据不同的替代假设;拒绝域可以是双边的或单边的。在确定了拒绝域的类型之后,也确定了临界值。这要根据犯错误的允许概率来确定。
3.在测试中给出显著性水平A。
在判断原假设是否成立时,由于样本的随机性,可能会出现两种错误。第一种错误是当原假设为真时,由于样本的随机性,样本的观测值落入拒绝域W,从而做出拒绝原假设的决策。这种误差称为第一种误差,也称为误拒概率。
第二种错误的解释:如果钢筋的平均抗拉强度真的比原来高,那么钢筋的平均抗拉强度就不再是原来的2000公斤了,但是我们并没有拒绝把Ho误认为没有提高,也就是把“提高了”误认为“没有提高”。一般来说,何鸿燊失败的时候,我们没有拒绝何鸿燊,这是第二种错误。
4.给出临界值,确定拒绝域。
有了显著性水平A,我们就可以根据给定的测试统计量分布,查表得到临界值,从而确定具体的拒绝域。在不同的替代假设下,拒绝域、临界值和显著性水平A之间的关系是不同的。其含义见下图。
5.根据样品的观察值,计算检验统计值。
根据样品的观察值,计算检验统计值;收集样本数据并计算检验统计值。
6.根据检验统计值是否属于拒收字段进行判断。
①将检验统计量的值与拒绝域的临界值进行比较,当原假设落在拒绝域时,作出拒绝原假设的结论,否则,作出不能拒绝原假设的结论。
②用检验统计量计算P值。所谓P值,就是原假设成立时的当前情况的概率(严格来说,当前情况或更不利于原假设的情况,即更有利于替代假设的情况的概率)。当这个概率很小时(例如小于0.05),在原假设成立的情况下,这个结果不应该出现在实验中;但现在它确实出现了,所以我们有理由认为“原假设为真”的前提是错误的,所以我们应该拒绝原假设,接受替代假设。所以可以有一个普遍规律:如果p
③根据样本的观测值可以得到总体参数的置信区间。如果原假设的参数值不落入该置信区间,则作出拒绝原假设的结论,否则作出不能拒绝原假设的结论。目前大多数统计软件都提供了相应的置信区间,不需要自己计算,所以用这种方法判断也很方便。