確率論を学んでいると、次々と新しい分布が登場します。ベルヌーイ、二項、ポアソン、正規、指数、ガンマ、ベータ、t、F、カイ二乗… 個々の分布の定義は理解できても、「なぜこの分布が必要なのか」「この分布とあの分布はどう関係しているのか」が見えにくいことがあります。
実は、これらの分布は孤立して存在するのではなく、極限操作・変換・混合・共役性という明確な関係で結ばれた「ネットワーク」を形成しています。この全体像を把握することで、各分布の位置づけが明確になり、問題に応じた適切な分布の選択ができるようになります。
本記事では、以下の視点から分布の関係を整理します。
- 極限関係: ある分布のパラメータの極限が別の分布を与える
- 変換関係: ある分布に従う確率変数の変換が別の分布を与える
- 和・積の関係: 独立な確率変数の和や積が従う分布
- 共役関係: ベイズ統計における事前・尤度・事後の関係
本記事の内容
- 主要な確率分布の関係の全体像(関係図)
- 離散分布間の関係(ベルヌーイ → 二項 → ポアソン)
- 連続分布間の関係(指数 → ガンマ → カイ二乗 → t → F)
- 離散と連続の橋渡し(二項 → 正規、ポアソン → 正規)
- 共役関係のまとめ
- Pythonでの可視化
前提知識
この記事は各分布の個別記事を読んだ後の「まとめ」として最適です。
分布の関係の全体像
関係の種類
分布間の関係は大きく4種類に分類できます。
特殊ケース(is-a関係): ある分布は別の分布のパラメータを特定した特殊ケース – ベルヌーイ = 二項(n=1) – 指数 = ガンマ(α=1) – カイ二乗(ν) = ガンマ(ν/2, 1/2)
極限関係: パラメータの極限操作で別の分布が得られる – 二項(n,p) → ポアソン(λ=np)($n \to \infty$, $p \to 0$, $np$ 固定) – ポアソン(λ) → 正規(λ, λ)($\lambda \to \infty$) – t(ν) → N(0,1)($\nu \to \infty$)
変換関係: 確率変数の関数が別の分布に従う – $Z^2 \sim \chi^2(1)$($Z \sim N(0,1)$) – $Z/\sqrt{V/\nu} \sim t(\nu)$ – $(U/d_1)/(V/d_2) \sim F(d_1,d_2)$
和の関係(再生性): 独立な確率変数の和が同じ分布族に属する – Binomial(n₁,p) + Binomial(n₂,p) = Binomial(n₁+n₂,p) – Poisson(λ₁) + Poisson(λ₂) = Poisson(λ₁+λ₂) – Gamma(α₁,β) + Gamma(α₂,β) = Gamma(α₁+α₂,β) – Normal(μ₁,σ₁²) + Normal(μ₂,σ₂²) = Normal(μ₁+μ₂, σ₁²+σ₂²)
離散分布のネットワーク
ベルヌーイ → 二項 → ポアソン
最も基本的な離散分布の連鎖です。
ベルヌーイ分布: 1回のYes/No試行。$X \in \{0, 1\}$、$P(X=1) = p$
二項分布: $n$ 回のベルヌーイ試行の成功回数の合計。$X = \sum_{i=1}^n X_i$
ポアソン分布: 二項分布の $n \to \infty$, $p \to 0$, $np = \lambda$ の極限。「稀な事象のカウント」
幾何 → 負の二項
幾何分布: 最初の成功までの試行回数(ベルヌーイの待ち時間版)
負の二項分布: $r$ 回目の成功までの試行回数(幾何分布の $r$ 個の和)
連続分布のネットワーク
正規 → カイ二乗 → t → F
統計的推測に不可欠な分布の連鎖です。
正規分布: $Z \sim N(0,1)$
カイ二乗分布: $\chi^2(\nu) = Z_1^2 + \cdots + Z_\nu^2$(独立な標準正規の二乗和)
t分布: $T = Z / \sqrt{V/\nu}$($Z \sim N(0,1)$, $V \sim \chi^2(\nu)$、独立)
F分布: $F = (U/d_1) / (V/d_2)$($U \sim \chi^2(d_1)$, $V \sim \chi^2(d_2)$、独立)
指数 → ガンマ → カイ二乗
待ち時間の分布の連鎖です。
指数分布: ポアソン過程の1番目のイベントまでの待ち時間
ガンマ分布: $\alpha$ 番目のイベントまでの待ち時間($\alpha$ 個の指数分布の和)
カイ二乗分布: $\chi^2(\nu) = \text{Gamma}(\nu/2, 1/2)$
一様 → ベータ
一様分布: $\text{Beta}(1, 1)$
ベータ分布: $[0, 1]$ 上の一般的な分布。一様分布の順序統計量はベータ分布に従う
離散と連続の橋渡し
中心極限定理による正規近似
離散分布の多くは、パラメータが大きくなると正規分布で近似できます。
- 二項分布: $\text{Binomial}(n, p) \approx N(np, np(1-p))$($n$ 大)
- ポアソン分布: $\text{Poisson}(\lambda) \approx N(\lambda, \lambda)$($\lambda$ 大)
ポアソン-ガンマ混合
ポアソン分布の平均パラメータがガンマ分布に従う場合、周辺分布は負の二項分布になります。
共役関係のまとめ
ベイズ統計における共役事前分布の関係をまとめます。
| 尤度 | 共役事前分布 | 事後分布 |
|---|---|---|
| ベルヌーイ/二項 | ベータ | ベータ |
| ポアソン | ガンマ | ガンマ |
| 正規(平均未知) | 正規 | 正規 |
| 正規(分散未知) | 逆ガンマ | 逆ガンマ |
| 指数 | ガンマ | ガンマ |
| 多項 | ディリクレ | ディリクレ |
Pythonでの可視化
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
fig, axes = plt.subplots(2, 3, figsize=(18, 10))
# (a) 二項→ポアソン→正規 の関係
ax = axes[0, 0]
lam = 10
k = np.arange(0, 25)
x = np.linspace(0, 25, 300)
# 二項分布(n=100, p=0.1 → λ=10)
ax.bar(k, stats.binom.pmf(k, 100, 0.1), alpha=0.4, color='steelblue',
width=0.8, label='Binomial(100, 0.1)')
# ポアソン分布
ax.plot(k, stats.poisson.pmf(k, lam), 'ro-', markersize=5, linewidth=1.5,
label=f'Poisson({lam})')
# 正規近似
ax.plot(x, stats.norm.pdf(x, lam, np.sqrt(lam)), 'g-', linewidth=2.5,
label=f'N({lam}, {lam})')
ax.set_xlabel('k', fontsize=12)
ax.set_ylabel('P(X=k)', fontsize=12)
ax.set_title('Binomial → Poisson → Normal', fontsize=13)
ax.legend(fontsize=9)
ax.grid(True, alpha=0.3)
# (b) 指数→ガンマ→カイ二乗
ax = axes[0, 1]
x = np.linspace(0.01, 15, 300)
ax.plot(x, stats.expon.pdf(x, scale=1), linewidth=2,
label='Exp(1) = Gamma(1,1)')
ax.plot(x, stats.gamma.pdf(x, 3, scale=1), linewidth=2,
label='Gamma(3,1)')
ax.plot(x, stats.chi2.pdf(x, 6), '--', linewidth=2,
label='$\\chi^2$(6) = Gamma(3,1/2)')
ax.set_xlabel('x', fontsize=12)
ax.set_ylabel('f(x)', fontsize=12)
ax.set_title('Exponential → Gamma → Chi-squared', fontsize=13)
ax.legend(fontsize=9)
ax.grid(True, alpha=0.3)
# (c) 正規→カイ二乗→t→F
ax = axes[0, 2]
x = np.linspace(-5, 5, 300)
ax.plot(x, stats.norm.pdf(x), 'b-', linewidth=2.5, label='N(0,1)')
ax.plot(x, stats.t.pdf(x, 5), 'r-', linewidth=2, label='t(5)')
ax.plot(x, stats.t.pdf(x, 2), 'g--', linewidth=2, label='t(2)')
ax.set_xlabel('x', fontsize=12)
ax.set_ylabel('f(x)', fontsize=12)
ax.set_title('Normal → t (heavier tails)', fontsize=13)
ax.legend(fontsize=10)
ax.grid(True, alpha=0.3)
# (d) ベータ分布の多様性
ax = axes[1, 0]
x = np.linspace(0.001, 0.999, 300)
beta_params = [(1,1), (2,5), (5,2), (5,5), (0.5,0.5), (2,2)]
for a, b in beta_params:
ax.plot(x, stats.beta.pdf(x, a, b), linewidth=2,
label=f'Beta({a},{b})')
ax.set_xlabel('x', fontsize=12)
ax.set_ylabel('f(x)', fontsize=12)
ax.set_title('Beta Family (includes Uniform)', fontsize=13)
ax.legend(fontsize=9)
ax.grid(True, alpha=0.3)
ax.set_ylim(0, 4)
# (e) 再生性のまとめ
ax = axes[1, 1]
np.random.seed(42)
n_sim = 100000
# 正規分布の再生性
X1 = np.random.normal(2, 1, n_sim)
X2 = np.random.normal(3, 1.5, n_sim)
S_normal = X1 + X2
x_range = np.linspace(-2, 12, 300)
ax.hist(S_normal, bins=80, density=True, alpha=0.4, color='steelblue',
label='N(2,1)+N(3,2.25) sim')
sigma_sum = np.sqrt(1 + 1.5**2)
ax.plot(x_range, stats.norm.pdf(x_range, 5, sigma_sum), 'r-',
linewidth=2.5, label=f'N(5, {1+1.5**2:.2f}) theory')
ax.set_xlabel('x', fontsize=12)
ax.set_ylabel('Density', fontsize=12)
ax.set_title('Reproductive Property\n(Sum preserves family)', fontsize=12)
ax.legend(fontsize=9)
ax.grid(True, alpha=0.3)
# (f) 共役事前分布の概念図
ax = axes[1, 2]
x = np.linspace(0, 1, 300)
# Beta-Binomial共役性
prior = stats.beta.pdf(x, 2, 5)
# データ: 10回中7回成功
posterior = stats.beta.pdf(x, 2+7, 5+3)
# 尤度(正規化なし)
likelihood = x**7 * (1-x)**3
likelihood = likelihood / np.max(likelihood) * np.max(posterior) * 0.5
ax.plot(x, prior, 'b-', linewidth=2, label='Prior: Beta(2,5)')
ax.fill_between(x, prior, alpha=0.1, color='blue')
ax.plot(x, likelihood, 'g--', linewidth=2, label='Likelihood (scaled)')
ax.plot(x, posterior, 'r-', linewidth=2.5, label='Posterior: Beta(9,8)')
ax.fill_between(x, posterior, alpha=0.1, color='red')
ax.set_xlabel('$\\theta$', fontsize=12)
ax.set_ylabel('Density', fontsize=12)
ax.set_title('Conjugacy: Beta-Binomial\nPrior × Likelihood = Posterior',
fontsize=12)
ax.legend(fontsize=9)
ax.grid(True, alpha=0.3)
plt.tight_layout()
plt.savefig('distribution_relationships.png', dpi=150, bbox_inches='tight')
plt.show()
この可視化から、確率分布のネットワーク構造が理解できます。
-
左上(離散分布の連鎖): 二項分布(青い棒)とポアソン分布(赤い丸)がほぼ一致し、正規分布(緑の曲線)も良い近似を与えています。
-
中上(連続分布の連鎖): 指数→ガンマ→カイ二乗の包含関係が視覚的に示されています。
-
右上(正規→t): t分布は正規分布より裾が重く、自由度が小さいほどその差が顕著です。
-
左下(ベータ族): ベータ分布は一様分布を含む幅広い形状を表現できます。
-
中下(再生性): 正規分布の和が正規分布に従うことがシミュレーションで確認されています。
-
右下(共役性): 事前分布(青)×尤度(緑)=事後分布(赤)の関係がベータ-二項モデルで示されています。
まとめ
本記事では、主要な確率分布の関係を整理しました。
- 確率分布は孤立しておらず、極限・変換・和・共役の関係で結ばれたネットワークを形成
- 離散: ベルヌーイ→二項→ポアソン(極限)、幾何→負の二項(和)
- 連続: 指数→ガンマ→カイ二乗(特殊ケース)、正規→カイ二乗→t→F(変換)
- 離散⇔連続: CLTにより多くの離散分布は正規分布で近似できる
- 共役性: ベータ-二項、ガンマ-ポアソン等はベイズ推論の効率化に不可欠
- 再生性: 正規・ポアソン・ガンマ・二項は独立な和で分布族が保存される
次のステップとして、各分布の詳細記事を参照してください。