对于品质数据,首先对它们进行归类,再计算出它们在每一类的频数分布或百分比分布。
下面我们将讨论两种广泛使用的图表形式--条形图和排列图。
1、条形图
条形图中的每一个条形代表品质类型变量的一个分类,条形的高度代表该组的频数或频率。表1是实验室试验的错误数量与错误类型的汇总表:
表1 实验室试验的错误原因汇总表
图1是用Minitab绘制的实验室试验的错误原因的条形图:
图1 Minitab绘制的实验室试验的错误原因的条形图
图2是用JMP绘制的相应条形图:
图2 JMP绘制的实验室试验的错误原因的条形图
在图1和图2中,由于社会保险号而导致的错误的条形高度尤其突出,这是因为有226个实验室试验错误是由社会保险号引起的。此外,我们可以发现姓名(71)和出生日期(58),也是导致错误发生的较主要原因。
2、排列图
排列图是一类特殊的条形图,X轴表示品质类型变量的所有分类,左边的Y轴表示每一类的频数(依频数由大到小在X轴上排列),右边的Y轴表示累计百分比。通常,不考虑“其他”项的频数,而将它放在X轴的最右侧。
排列图最主要的作用是从众多不重要的类目中找出少数几个重要的类目,以便人们将注意力集中于那些重要的类目。排列图利于人们区分各项活动的优先顺序,减少微控。图3是用Minitab绘制的实验室试验的错误原因的排列图。图4是用JMP所绘制的相应排列图。
图3 Minitab绘制的实验室试验的错误原因的排列图
图4 JMP绘制的实验室试验的错误原因的排列图
从图3或图4中,我们可以看到社会保险号是列出的第一个类目(占了所有错误的49.8%),其次是姓名(占15.6),然后是出生日期(占12.8)。其中,最常出现的两个类目,社会保险号和姓名共占了错误的65.4%,最常出现的三个类目,社会保险号、姓名和出生日期,共占了错误的78.2%。而仅社会保险号一项就占了总错误的49.8%。由此可以看出,社会保险号是产生错误的首要原因。
上一篇:绘制测度数据的图形
下一篇:如何利用算数平均值来进行测量