在六西格玛管理项目实施的过程中,我们需要不断地处理数据,不断地根据数据做出决策,处理各种数据,这就是用数据来量化过程的性能,也就是度量过程能力。但是,从统计学上讲,这些测量数据可以分为两种基本类型,即连续数据和不连续或离散数据。
连续数据:又称计量数据,是指用连续坐标测量的数据,或用能连续取值的测量仪器或量具测量的数据。连续数据在一个输出单元中记录某一特性的测量结果,如尺寸、重量、时间、温度等。连续数据的特点是反映产品或过程的特性,这是一个量化问题。它能灵敏地反映特征过程的变化,包含丰富的信息。连续数据计量单位可以细分,有一定的实际意义。在统计分析中,可以用较少的样本量得出分析结论。但是,一般来说,连续数据都使用一个计量单位,如米、千克、小时等。,需要更高的测量手段和更高的测量成本。
不连续数据或离散数据:也称为计数数据。离散数据可分为可区分数据和可计数数据。可识别的数据记录单元是否满足顾客的需求,即好与坏、合格与不合格,如合格/不合格、通过/失败、是/否、接受/不接受等。可计数数据是记录一个输出单元中包含的缺陷数,如裂纹和缺陷数。离散数据在反映过程变化方面不如连续数据敏感,只反映客户需求是否得到满足和缺陷数量,包含的信息较少。在对离散数据进行统计分析的过程中,往往需要大量的样本或较长的测量周期才能得到分析结论。
但一般来说,离散数据只是类别信息,对测量手段和精度要求不高,测量成本低。连续数据属于正态分布,可区分数据属于二项分布,可数数据属于泊松分布。
正态分布:大家都很熟悉。图形呈钟形,左右对称,曲线下面积为1。正态分布的两个重要参数:均值和标准差。
二项分布:从篮子里拿出烂苹果的几率有多大?二项分布意味着一个篮子里有50个苹果。根据历史经验,15%的苹果会坏,那么从篮子里拿到50个苹果的几率有多大呢?其中一个会很烂的几率有多大?他们两个烂的几率有多大?
泊松分布:它的属性是产品有多少缺陷。
根据以上所述,在收集数据时,应尽可能使用连续数据。用什么样的数据,要根据客户的需求来决定。当你只需要知道一个输出单位是否合格时,就要选择可区分的数据,比如付款的准时和延迟,服务的好坏等。当你只需要知道一个输出单位的缺陷数时,就要选择可数的数据,比如一个合同的错误数,一个订单的漏项数,一个焊缝的气孔数,一米布的缺陷数等。当你需要知道一个输出单元的某个特性时,应该选择连续的数据,比如客服中心的回复时间,开发票的时间,零件的直径,货物的重量等。