1、泊松概率分布
许多研究都是基于对每个概率区域中不一致或缺陷数量的计算。概率区域是时间和容量的连续单位,或者是可能发生多个事件的区域。例子包括新冰箱的表面缺陷,周末酒店的投诉数量,一个月工厂的事故数量。在这些情况下,可以使用泊松概率分布来计算概率。表1描述了使用泊松分布所必需的一些特定情况的特征。
表1 泊松分布
想想在午餐时间拜访位于大城市商业区的银行的客户数量。你对每分钟到达的顾客数量感兴趣。这种情况是否符合表1所示泊松分布的四个特征?
首先,事件是客户的到来,给定的概率区域定义为午餐时间在银行一分钟。零,一到两个就到了;其次,假设客户在随机选择的一分钟内到达的概率等于所有其他分钟内到达的概率;第三,任何一分钟一个客户的到来,对任何一分钟其他客户的到来都没有影响(比如统计独立性);第四,随着时间间隔变小,在给定的时间间隔内,两个或更多客户到达的概率接近于零。例如,两个客户在百分之一秒的时间间隔内到达的概率实际上是不可能的。因此,你可以用泊松分布来计算午餐时间一分钟内到达银行的客户数量的概率。
为了说明泊松概率的应用,假设过去的数据显示,平均每分钟有3个人在午餐时间到达。为了计算一定数量的客户在下一分钟到达的概率,可以使用Minitab或JMP。
表2显示了达到客户数量的概率,范围从0到12。例如,观察到平均值为每分钟3人,零客户到达的概率为0.049787,一个客户到达的概率为0.149361,两个客户到达的概率为0.224042,十二个客户到达的概率仅为0.00055。因此,为了计算两个或更少的客户到达的概率,您可以将零的概率(0.049787)、一的概率(0.149361)和两个的概率(0.224042)相加。
表2 Minitab泊松分布计算
因此,如果平均每分钟到达的客户数量为3人,则下一分钟有42.319%的概率会有两个或更少的客户到达。
2.泊松分布特征
每次指定平均值时,都会生成泊松分布。泊松分布会左偏,但接近对称,峰值会随着均值的增加而在中间位置。泊松分布的一个重要特征是均值和方差相等。以到达银行的客户数为例,平均值和期望值为每分钟3人,标准差为3的平方根,即每分钟1.732个客户。