確率分布の再生性(Reproductive Property)とは、同じ分布族に従う独立な確率変数の和が、再び同じ分布族に従うという性質です。再生性を持つ確率分布は統計学や機械学習で理論的に扱いやすく、非常に重要な概念です。
本記事の内容
- 再生性の定義
- 代表的な分布の再生性一覧
- モーメント母関数による証明
- Python でのシミュレーション
前提知識
この記事を読む前に、以下の記事を読んでおくと理解が深まります。
再生性の定義
独立な確率変数 $X_1, X_2$ がそれぞれ分布族 $\mathcal{F}$ に属する分布に従うとき、和 $X_1 + X_2$ も同じ分布族 $\mathcal{F}$ に属する分布に従う場合、この分布族は再生性を持つと言います。
再生性を持つ代表的な分布
| 分布 | $X_1$ | $X_2$ | $X_1 + X_2$ |
|---|---|---|---|
| 正規分布 | $\mathcal{N}(\mu_1, \sigma_1^2)$ | $\mathcal{N}(\mu_2, \sigma_2^2)$ | $\mathcal{N}(\mu_1+\mu_2, \sigma_1^2+\sigma_2^2)$ |
| ポアソン分布 | $\text{Poi}(\lambda_1)$ | $\text{Poi}(\lambda_2)$ | $\text{Poi}(\lambda_1+\lambda_2)$ |
| ガンマ分布 | $\text{Gamma}(\alpha_1, \beta)$ | $\text{Gamma}(\alpha_2, \beta)$ | $\text{Gamma}(\alpha_1+\alpha_2, \beta)$ |
| カイ二乗分布 | $\chi^2(k_1)$ | $\chi^2(k_2)$ | $\chi^2(k_1+k_2)$ |
| 二項分布 | $\text{Bin}(n_1, p)$ | $\text{Bin}(n_2, p)$ | $\text{Bin}(n_1+n_2, p)$ |
| 負の二項分布 | $\text{NB}(r_1, p)$ | $\text{NB}(r_2, p)$ | $\text{NB}(r_1+r_2, p)$ |
ガンマ分布と二項分布では、スケールパラメータ($\beta$ や $p$)が同じである必要がある点に注意してください。
モーメント母関数による証明
ポアソン分布の再生性
$X_1 \sim \text{Poi}(\lambda_1)$, $X_2 \sim \text{Poi}(\lambda_2)$ のとき、
ポアソン分布のMGFは $M_X(t) = \exp(\lambda(e^t – 1))$ なので、
$$ \begin{align} M_{X_1+X_2}(t) &= M_{X_1}(t) \cdot M_{X_2}(t) \\ &= \exp(\lambda_1(e^t – 1)) \cdot \exp(\lambda_2(e^t – 1)) \\ &= \exp((\lambda_1 + \lambda_2)(e^t – 1)) \end{align} $$
これは $\text{Poi}(\lambda_1 + \lambda_2)$ のMGFに一致します。
カイ二乗分布の再生性
$\chi^2(k)$ 分布は $\text{Gamma}(k/2, 1/2)$ の特殊ケースなので、ガンマ分布の再生性から直ちに証明できます。
再生性を持たない分布
すべての分布が再生性を持つわけではありません。
- 一様分布: $X_1 \sim U(0,1)$, $X_2 \sim U(0,1)$ のとき、$X_1 + X_2$ は三角分布に従い、一様分布にはなりません
- 指数分布: $X_1 \sim \text{Exp}(\lambda)$, $X_2 \sim \text{Exp}(\lambda)$ のとき、$X_1 + X_2$ はガンマ分布 $\text{Gamma}(2, \lambda)$ に従い、指数分布にはなりません
Python でのシミュレーション
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm, poisson, chi2, gamma
np.random.seed(42)
n_samples = 100000
fig, axes = plt.subplots(2, 2, figsize=(14, 10))
# 正規分布の再生性
ax1 = axes[0, 0]
X1_norm = np.random.normal(2, 1, n_samples)
X2_norm = np.random.normal(3, 1.5, n_samples)
Z_norm = X1_norm + X2_norm
x_range = np.linspace(-5, 15, 300)
ax1.hist(Z_norm, bins=100, density=True, alpha=0.5, color='blue', label='X1+X2 (sim)')
ax1.plot(x_range, norm.pdf(x_range, 5, np.sqrt(1+2.25)), 'r-', linewidth=2,
label='N(5, 3.25) (theory)')
ax1.set_title('Normal: N(2,1) + N(3,2.25)', fontsize=12)
ax1.legend(fontsize=10)
ax1.grid(True, alpha=0.3)
# ポアソン分布の再生性
ax2 = axes[0, 1]
X1_poi = np.random.poisson(3, n_samples)
X2_poi = np.random.poisson(5, n_samples)
Z_poi = X1_poi + X2_poi
k_range = np.arange(0, 25)
ax2.hist(Z_poi, bins=np.arange(-0.5, 25.5, 1), density=True, alpha=0.5, color='blue', label='X1+X2 (sim)')
ax2.plot(k_range, poisson.pmf(k_range, 8), 'ro-', markersize=5, linewidth=1.5,
label='Poi(8) (theory)')
ax2.set_title('Poisson: Poi(3) + Poi(5)', fontsize=12)
ax2.legend(fontsize=10)
ax2.grid(True, alpha=0.3)
# カイ二乗分布の再生性
ax3 = axes[1, 0]
X1_chi = np.random.chisquare(3, n_samples)
X2_chi = np.random.chisquare(5, n_samples)
Z_chi = X1_chi + X2_chi
x_range2 = np.linspace(0, 30, 300)
ax3.hist(Z_chi, bins=100, density=True, alpha=0.5, color='blue', label='X1+X2 (sim)')
ax3.plot(x_range2, chi2.pdf(x_range2, 8), 'r-', linewidth=2,
label='chi2(8) (theory)')
ax3.set_title('Chi-squared: chi2(3) + chi2(5)', fontsize=12)
ax3.legend(fontsize=10)
ax3.grid(True, alpha=0.3)
# 一様分布(再生性なし)
ax4 = axes[1, 1]
X1_uni = np.random.uniform(0, 1, n_samples)
X2_uni = np.random.uniform(0, 1, n_samples)
Z_uni = X1_uni + X2_uni
x_range3 = np.linspace(0, 2, 300)
ax4.hist(Z_uni, bins=100, density=True, alpha=0.5, color='blue', label='X1+X2 (sim)')
# 理論: 三角分布
tri_pdf = np.where(x_range3 <= 1, x_range3, 2 - x_range3)
ax4.plot(x_range3, tri_pdf, 'r-', linewidth=2, label='Triangular (NOT uniform)')
ax4.set_title('Uniform: U(0,1) + U(0,1) -> NOT uniform!', fontsize=12)
ax4.legend(fontsize=10)
ax4.grid(True, alpha=0.3)
plt.suptitle('Reproductive Property of Probability Distributions', fontsize=14)
plt.tight_layout()
plt.show()
上段の正規分布とポアソン分布では再生性が成立し、シミュレーション結果と理論分布がよく一致しています。右下の一様分布では再生性が成立せず、和の分布は三角分布になることが確認できます。
まとめ
本記事では、確率分布の再生性について解説しました。
- 再生性とは、同じ分布族に従う独立な変数の和が再び同じ分布族に従う性質
- 正規分布、ポアソン分布、ガンマ分布、カイ二乗分布などが再生性を持つ
- モーメント母関数の積がMGFの一意性により再生性の簡潔な証明を与える
- 一様分布や指数分布は再生性を持たない
次のステップとして、以下の記事も参考にしてください。