相关分析是揭示变量之间关系的常用分析方法。我们知道产品、过程和服务的质量具有波动性和规律性。质量管理就是揭示质量随过程变化的规律性,找到最关键的几个变量并加以改进和控制,使过程保持在相对稳定的高水平。六西格玛管理是一个以数据为基础,以顾客需求为驱动的质量管理体系,所以利用相关和回归分析方法找出影响质量的关键因素是六西格玛突破战略的主要任务。
一、相关性和回归分析在六西格玛突破模式各阶段的作用
从图1可以看出,相关回归分析可以验证输入因素与输出结果之间关系的真实性,即原因的真实性,确定六西格玛突破战略分析阶段的“关键少数因素”。这是六西格玛分析阶段的主要任务。在控制阶段,相关和回归分析可以根据输入的变化预测输出结果,以确定是否应该调整输入。
图1 相关和回归分析在六西格玛突破模式各阶段的作用
二.相关分析概述
1.变量之间的相关性
示例:某工艺工程师想研究松香比重对焊点拉拔力的影响,测得一组数据如下图2所示:
图2 松香比重对焊点拉拔力的影响数据测量
如果仔细观察这组数据,我们会发现一个规律,当松香比重增大时,焊点的拉拔力也会相应增大,这说明焊点的拉拔力与松香比重之间是有关系的,我们称之为松香比重与焊点拉拔力的相关性。
2.散点图
散点图就是用图形表示一对变量,两个变量分别对应图上的X和Y坐标轴,这样每对对应的X和Y数据就可以用散点图上的一个点来表示。通过观察散点图的形状,可以直观地了解变量X和y之间的关系。
松香比重与焊点拉拔力之间的关系可用散点图表示如下:
图3 散布图-松香比重和焊点拉拔力的关系
从图3的散点图中,我们可以看到一个规律:数据分布是一条细细的带状(在一个带状范围内),从图表的左下角延伸到右上角。但是从上图我们能知道的信息很粗略。怎样才能量化X和Y的相关性,有没有一个参数来衡量X和Y的相关性?是的,这就是我们将要讨论的相关系数。
3.相关系数
相关系数是用来描述变量,x和y之间线性相关程度的参数,用r来表示,它具有以下特性。
①r的值介于(-1, 1)之间。
②r的绝对值越接近1表示x和Y之间的线性关系越密切。
③r>O,x与y呈正相关,r<0,x与Y呈负相关,r=O,x与y之间无线性相关关系。