一、什么是正态分布
正态分布也用于测量数据的连续钟形分布。连续分布与二项式分布、泊松分布等离散分布在以下几个方面不同:
1.可变区间范围内的任何值都可能出现,而不仅仅是一些特定的值(如整数值)。比如循环时间精确到小数点后多少位合适;
2.特定X值出现的概率为零。例如,随着小数点右边位数的增加,循环时间被测量为3.000 000 000秒的概率更接近于零;
3.概率可以通过计算曲线下的累计面积来计算。例如,如果曲线已知且稳定,则可以知道周期时间在2.00到3.00分钟之间的概率。
正态分布用于表示一系列连续数据(变量或CTQ、CTP等。).许多自然现象,如完成一项活动的周期时间、测量误差、工业产品的尺寸、电压输出等。,被发现符合正态分布。图1描述了正态分布。此外,统计推断还使用了正态分布。
图1 正态分布
二、正态分布特性
表1描述了正态分布的一些重要理论性质。
表1 正态分布的特征
正态分布曲线下的概率,可以通过使用正态分布表或者使用Minitab或JMP来计算。图2说明了在正态曲线下如何查找概率或区域。
图2 标准正态分布
第一,通过使用表2可以查找一个值在均值下面少于3个标准差(-3σ)的概率,而表2则是截取于表3的完整正态分布表。
表2 查找-3标准差的累计区域
表3 累计标准正态分布
从表2中看出,一个值在一3.00个标准差单元(或Z)下的概率为0.00135或0.135%。
可以计算一个值在均值上面少于三个标准差(+3σ)的概率。表2截取于表3的完整正态分布表,其显示了在+3.00标准差(或Z)单元下的区域。
表4 查找在+3标准差下的累计区域
从表4可以计算出,一个值小于平均值以上三个标准差(+3σ)的概率为0.99865或99.865%。一个值高于平均值三个标准差(或z)的概率的补数是一个值低于平均值三个标准差(或z)的概率,如图3所示。
图3 计算在正态曲线下的区域或概率
因此,一个值超过三个标准差单位(或z)的概率为1.0-0.99865=0.00135。注意+3σ以上的面积与-3σ以下的面积相同。这是因为正态分布是对称的,所以曲线的每一半都是另一半的镜像。在平均值之外,大于三个标准差的面积等于或小于-3σ(0.00135)的面积和+3σ(0.00135)的面积之和。等于0.00135+0.00135=0.0027或0.27%。另一种表达是:一万次中有27次机会,一个值会大于平均值之外的三个标准差。这个表达式的补充是,有1-0.0027=0.9973或99.73%的概率,一个值在平均值的三个标准偏差之内。表5总结了一些不同标准偏差单位的信息。
表5 在选定数量标准差单元下的正态分布概率
上一篇:如何利用泊松分布计算概率
下一篇:什么是抽样分布