设计可分为全因素设计和部分因素设计,部分因素设计是基于全因素设计。全因素实验设计是指所有因素在所有水平上的所有组合至少要测试一次。因为包含了所有的组合,所以需要测试的次数会更多,但是它的优点是可以估计所有的主效应和每阶的所有交互效应。因此,当因子数目不太大,又确实需要考察更多的交互作用时,往往采用全因子设计。
当因子水平超过2时,由于试验次数随因子数呈指数增长,通常只进行两个水平的全因子试验。如果真的要做三级或者更高级别的全因素测试,计算机软件也有和二级一样的测试设计和分析方法。但一般认为以中心点为中心点的两水平试验设计在工程实践中是充分的,可以在相当程度上替代三水平试验,且分析简单易行,现在已被工程师广泛使用。
1.测试目的
我们什么时候需要做实验?一般来说,任何实验都要分几批进行,大概是:首先,用部分实施的因子设计筛选因子,使因子数不超过5个;其次,采用全因素实验设计,对各因素的影响和交互作用进行综合分析;最后用响应面法确定回归关系,找到最优设置。
因此,实施部分因素测试通常只是为了筛选因素,测试次数较少。而响应面实验的设计是为了得到一个非常精细的带平方项的回归方程,实验次数最多,所以只对少数几个因素(个数小于等于3)有实际意义。全因子实验既不同于因子实验的部分实施,也不同于响应面实验设计。它可以同时具有筛选因素和建立回归的目的。它可以分析所有因素的主要影响以及所有因素之间的交互作用的影响。回归方程会包含所有的一阶项和所有因子的乘积项,实验次数适中,因子数小于5时可以使用。因为全因素试验的设计方法和理论是理解部分实施因素试验方法和响应面试验设计方法的基础。
2.测试的安排和中心点的选择
如何实现“重复试验”呢?一种方法是将每个测试条件重复两次或更多次,其优点是可以更准确地估计测试误差,但代价是大大增加了测试成本。另一个更巧妙的方法是只在“中心点”安排重复测试,通常在中心点重复测试三四次。
当所有因素都是连续变量时,即每个因素取其高水平和低水平的平均值时,中心很容易找到。当所有因素都是离散变量时,可以选择它们的组合之一作为“伪中心点”。当因子中既有连续变量又有离散变量时,可以选择连续变量的平均值,选择一个离散变量的组合作为“伪中心点”(此时不必要求实验的平衡性,但强调要有重复)。
这里选择“中心点”并安排重复试验的好处主要是在完全相同的条件下重复,因此可以估计试验误差,即随机误差。此外,由于每个连续因子的值原来只有Z值(高水平和低水平),现在增加到三个值,从而增加了对响应变量可能的弯曲趋势的估计能力,这也是简单全面的重复无法达到的效果。而且,把全因素实验的顺序随机化后,如果把中心点的三个或四个实验安排在所有实验的开始、中间和结束,那么这些点的检验结果之间应该只有随机误差。如果这些测试的结果出现明显的上升、下降或其他异常趋势,可能有助于我们发现测试过程中的异常情况。
总之,安排每个因素取两个水平,加上中心点,可以构成一个较好的全因素实验安排。
3.代码及其计算
无论实验的目的是筛选因素还是建立关系式,都要建立回归方程。那么,是对原始的自变量数值进行回归分析好,还是对这些数值进行编码后再进行回归分析好呢?所谓编码,就是把这个因子的低层码值设为-1,高层码值设为1,中央层设为0。经过理论分析,发现对自变量进行编码有很多好处,所以要对编码后的数据进行回归分析。
在编码回归方程中,自变量和交互项的系数可以直接比较,系数绝对值大的影响比系数绝对值小的影响更为重要和显著。
上一篇: 六西格玛管理项目选择包含哪些内容