【超几何分布公式详解】超几何分布是概率论中一种重要的离散概率分布,用于描述在不放回抽样中成功次数的概率分布。它与二项分布不同,二项分布是在有放回抽样中计算成功概率的模型,而超几何分布则适用于有限总体且无放回的情况。
一、超几何分布的基本概念
超几何分布适用于以下场景:
- 总体中有 $ N $ 个元素;
- 其中 $ K $ 个是“成功”元素(如合格品);
- 从总体中随机抽取 $ n $ 个样本,不放回;
- 求在这 $ n $ 个样本中恰好有 $ k $ 个“成功”元素的概率。
二、超几何分布的数学公式
超几何分布的概率质量函数为:
$$
P(X = k) = \frac{{\binom{K}{k} \binom{N-K}{n-k}}}{\binom{N}{n}}
$$
其中:
- $ N $:总体数量
- $ K $:成功元素的数量
- $ n $:抽取样本数
- $ k $:抽取样本中成功元素的数量
- $ \binom{a}{b} $:组合数,表示从 $ a $ 个元素中取出 $ b $ 个的组合方式数
三、超几何分布的期望与方差
参数 | 公式 | 说明 |
期望 $ E(X) $ | $ n \cdot \frac{K}{N} $ | 抽取样本中预期的成功数量 |
方差 $ Var(X) $ | $ n \cdot \frac{K}{N} \cdot \left(1 - \frac{K}{N}\right) \cdot \frac{N - n}{N - 1} $ | 反映成功次数的波动程度 |
> 注意:方差中多了一个修正因子 $ \frac{N - n}{N - 1} $,这是由于无放回抽样的原因,导致方差比二项分布小。
四、超几何分布与二项分布的区别
特征 | 超几何分布 | 二项分布 |
抽样方式 | 不放回 | 有放回 |
总体大小 | 有限 | 无限或可视为无限 |
成功概率 | 随样本变化 | 固定 |
方差 | 更小 | 较大 |
应用场景 | 小样本、有限总体 | 大样本、独立事件 |
五、实际应用举例
假设某工厂生产了 100 个产品,其中有 20 个是次品。现在从中随机抽取 5 个产品,求其中恰好有 2 个次品的概率。
根据公式:
$$
P(X = 2) = \frac{{\binom{20}{2} \binom{80}{3}}}{\binom{100}{5}}
$$
计算得:
$$
P(X = 2) \approx 0.246
$$
即抽取 5 个产品中恰好有 2 个次品的概率约为 24.6%。
表格总结
项目 | 内容 |
分布名称 | 超几何分布 |
适用场景 | 不放回抽样,有限总体 |
概率质量函数 | $ P(X = k) = \frac{{\binom{K}{k} \binom{N-K}{n-k}}}{\binom{N}{n}} $ |
期望 | $ E(X) = n \cdot \frac{K}{N} $ |
方差 | $ Var(X) = n \cdot \frac{K}{N} \cdot \left(1 - \frac{K}{N}\right) \cdot \frac{N - n}{N - 1} $ |
与二项分布区别 | 不放回 vs 有放回;总体有限 vs 无限 |
实际应用 | 质量控制、抽样调查、彩票等 |
通过以上内容,可以对超几何分布有一个全面的理解,了解其应用场景和数学表达形式,有助于在实际问题中合理选择和使用这一概率模型。