確率分布の関係図 — 二項・ポアソン・正規・ガンマの繋がり

確率論を学んでいると、次々と新しい分布が登場します。ベルヌーイ、二項、ポアソン、正規、指数、ガンマ、ベータ、t、F、カイ二乗… 個々の分布の定義は理解できても、「なぜこの分布が必要なのか」「この分布とあの分布はどう関係しているのか」が見えにくいことがあります。

実は、これらの分布は孤立して存在するのではなく、極限操作・変換・混合・共役性という明確な関係で結ばれた「ネットワーク」を形成しています。この全体像を把握することで、各分布の位置づけが明確になり、問題に応じた適切な分布の選択ができるようになります。

本記事では、以下の視点から分布の関係を整理します。

  • 極限関係: ある分布のパラメータの極限が別の分布を与える
  • 変換関係: ある分布に従う確率変数の変換が別の分布を与える
  • 和・積の関係: 独立な確率変数の和や積が従う分布
  • 共役関係: ベイズ統計における事前・尤度・事後の関係

本記事の内容

  • 主要な確率分布の関係の全体像(関係図)
  • 離散分布間の関係(ベルヌーイ → 二項 → ポアソン)
  • 連続分布間の関係(指数 → ガンマ → カイ二乗 → t → F)
  • 離散と連続の橋渡し(二項 → 正規、ポアソン → 正規)
  • 共役関係のまとめ
  • Pythonでの可視化

前提知識

この記事は各分布の個別記事を読んだ後の「まとめ」として最適です。

分布の関係の全体像

関係の種類

分布間の関係は大きく4種類に分類できます。

特殊ケース(is-a関係): ある分布は別の分布のパラメータを特定した特殊ケース – ベルヌーイ = 二項(n=1) – 指数 = ガンマ(α=1) – カイ二乗(ν) = ガンマ(ν/2, 1/2)

極限関係: パラメータの極限操作で別の分布が得られる – 二項(n,p) → ポアソン(λ=np)($n \to \infty$, $p \to 0$, $np$ 固定) – ポアソン(λ) → 正規(λ, λ)($\lambda \to \infty$) – t(ν) → N(0,1)($\nu \to \infty$)

変換関係: 確率変数の関数が別の分布に従う – $Z^2 \sim \chi^2(1)$($Z \sim N(0,1)$) – $Z/\sqrt{V/\nu} \sim t(\nu)$ – $(U/d_1)/(V/d_2) \sim F(d_1,d_2)$

和の関係(再生性): 独立な確率変数の和が同じ分布族に属する – Binomial(n₁,p) + Binomial(n₂,p) = Binomial(n₁+n₂,p) – Poisson(λ₁) + Poisson(λ₂) = Poisson(λ₁+λ₂) – Gamma(α₁,β) + Gamma(α₂,β) = Gamma(α₁+α₂,β) – Normal(μ₁,σ₁²) + Normal(μ₂,σ₂²) = Normal(μ₁+μ₂, σ₁²+σ₂²)

離散分布のネットワーク

ベルヌーイ → 二項 → ポアソン

最も基本的な離散分布の連鎖です。

ベルヌーイ分布: 1回のYes/No試行。$X \in \{0, 1\}$、$P(X=1) = p$

二項分布: $n$ 回のベルヌーイ試行の成功回数の合計。$X = \sum_{i=1}^n X_i$

ポアソン分布: 二項分布の $n \to \infty$, $p \to 0$, $np = \lambda$ の極限。「稀な事象のカウント」

幾何 → 負の二項

幾何分布: 最初の成功までの試行回数(ベルヌーイの待ち時間版)

負の二項分布: $r$ 回目の成功までの試行回数(幾何分布の $r$ 個の和)

連続分布のネットワーク

正規 → カイ二乗 → t → F

統計的推測に不可欠な分布の連鎖です。

正規分布: $Z \sim N(0,1)$

カイ二乗分布: $\chi^2(\nu) = Z_1^2 + \cdots + Z_\nu^2$(独立な標準正規の二乗和)

t分布: $T = Z / \sqrt{V/\nu}$($Z \sim N(0,1)$, $V \sim \chi^2(\nu)$、独立)

F分布: $F = (U/d_1) / (V/d_2)$($U \sim \chi^2(d_1)$, $V \sim \chi^2(d_2)$、独立)

指数 → ガンマ → カイ二乗

待ち時間の分布の連鎖です。

指数分布: ポアソン過程の1番目のイベントまでの待ち時間

ガンマ分布: $\alpha$ 番目のイベントまでの待ち時間($\alpha$ 個の指数分布の和)

カイ二乗分布: $\chi^2(\nu) = \text{Gamma}(\nu/2, 1/2)$

一様 → ベータ

一様分布: $\text{Beta}(1, 1)$

ベータ分布: $[0, 1]$ 上の一般的な分布。一様分布の順序統計量はベータ分布に従う

離散と連続の橋渡し

中心極限定理による正規近似

離散分布の多くは、パラメータが大きくなると正規分布で近似できます。

  • 二項分布: $\text{Binomial}(n, p) \approx N(np, np(1-p))$($n$ 大)
  • ポアソン分布: $\text{Poisson}(\lambda) \approx N(\lambda, \lambda)$($\lambda$ 大)

ポアソン-ガンマ混合

ポアソン分布の平均パラメータがガンマ分布に従う場合、周辺分布は負の二項分布になります。

共役関係のまとめ

ベイズ統計における共役事前分布の関係をまとめます。

尤度 共役事前分布 事後分布
ベルヌーイ/二項 ベータ ベータ
ポアソン ガンマ ガンマ
正規(平均未知) 正規 正規
正規(分散未知) 逆ガンマ 逆ガンマ
指数 ガンマ ガンマ
多項 ディリクレ ディリクレ

Pythonでの可視化

import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

fig, axes = plt.subplots(2, 3, figsize=(18, 10))

# (a) 二項→ポアソン→正規 の関係
ax = axes[0, 0]
lam = 10
k = np.arange(0, 25)
x = np.linspace(0, 25, 300)

# 二項分布(n=100, p=0.1 → λ=10)
ax.bar(k, stats.binom.pmf(k, 100, 0.1), alpha=0.4, color='steelblue',
       width=0.8, label='Binomial(100, 0.1)')
# ポアソン分布
ax.plot(k, stats.poisson.pmf(k, lam), 'ro-', markersize=5, linewidth=1.5,
        label=f'Poisson({lam})')
# 正規近似
ax.plot(x, stats.norm.pdf(x, lam, np.sqrt(lam)), 'g-', linewidth=2.5,
        label=f'N({lam}, {lam})')

ax.set_xlabel('k', fontsize=12)
ax.set_ylabel('P(X=k)', fontsize=12)
ax.set_title('Binomial → Poisson → Normal', fontsize=13)
ax.legend(fontsize=9)
ax.grid(True, alpha=0.3)

# (b) 指数→ガンマ→カイ二乗
ax = axes[0, 1]
x = np.linspace(0.01, 15, 300)

ax.plot(x, stats.expon.pdf(x, scale=1), linewidth=2,
        label='Exp(1) = Gamma(1,1)')
ax.plot(x, stats.gamma.pdf(x, 3, scale=1), linewidth=2,
        label='Gamma(3,1)')
ax.plot(x, stats.chi2.pdf(x, 6), '--', linewidth=2,
        label='$\\chi^2$(6) = Gamma(3,1/2)')

ax.set_xlabel('x', fontsize=12)
ax.set_ylabel('f(x)', fontsize=12)
ax.set_title('Exponential → Gamma → Chi-squared', fontsize=13)
ax.legend(fontsize=9)
ax.grid(True, alpha=0.3)

# (c) 正規→カイ二乗→t→F
ax = axes[0, 2]
x = np.linspace(-5, 5, 300)
ax.plot(x, stats.norm.pdf(x), 'b-', linewidth=2.5, label='N(0,1)')
ax.plot(x, stats.t.pdf(x, 5), 'r-', linewidth=2, label='t(5)')
ax.plot(x, stats.t.pdf(x, 2), 'g--', linewidth=2, label='t(2)')

ax.set_xlabel('x', fontsize=12)
ax.set_ylabel('f(x)', fontsize=12)
ax.set_title('Normal → t (heavier tails)', fontsize=13)
ax.legend(fontsize=10)
ax.grid(True, alpha=0.3)

# (d) ベータ分布の多様性
ax = axes[1, 0]
x = np.linspace(0.001, 0.999, 300)
beta_params = [(1,1), (2,5), (5,2), (5,5), (0.5,0.5), (2,2)]

for a, b in beta_params:
    ax.plot(x, stats.beta.pdf(x, a, b), linewidth=2,
            label=f'Beta({a},{b})')

ax.set_xlabel('x', fontsize=12)
ax.set_ylabel('f(x)', fontsize=12)
ax.set_title('Beta Family (includes Uniform)', fontsize=13)
ax.legend(fontsize=9)
ax.grid(True, alpha=0.3)
ax.set_ylim(0, 4)

# (e) 再生性のまとめ
ax = axes[1, 1]
np.random.seed(42)
n_sim = 100000

# 正規分布の再生性
X1 = np.random.normal(2, 1, n_sim)
X2 = np.random.normal(3, 1.5, n_sim)
S_normal = X1 + X2

x_range = np.linspace(-2, 12, 300)
ax.hist(S_normal, bins=80, density=True, alpha=0.4, color='steelblue',
        label='N(2,1)+N(3,2.25) sim')
sigma_sum = np.sqrt(1 + 1.5**2)
ax.plot(x_range, stats.norm.pdf(x_range, 5, sigma_sum), 'r-',
        linewidth=2.5, label=f'N(5, {1+1.5**2:.2f}) theory')

ax.set_xlabel('x', fontsize=12)
ax.set_ylabel('Density', fontsize=12)
ax.set_title('Reproductive Property\n(Sum preserves family)', fontsize=12)
ax.legend(fontsize=9)
ax.grid(True, alpha=0.3)

# (f) 共役事前分布の概念図
ax = axes[1, 2]
x = np.linspace(0, 1, 300)

# Beta-Binomial共役性
prior = stats.beta.pdf(x, 2, 5)
# データ: 10回中7回成功
posterior = stats.beta.pdf(x, 2+7, 5+3)
# 尤度(正規化なし)
likelihood = x**7 * (1-x)**3
likelihood = likelihood / np.max(likelihood) * np.max(posterior) * 0.5

ax.plot(x, prior, 'b-', linewidth=2, label='Prior: Beta(2,5)')
ax.fill_between(x, prior, alpha=0.1, color='blue')
ax.plot(x, likelihood, 'g--', linewidth=2, label='Likelihood (scaled)')
ax.plot(x, posterior, 'r-', linewidth=2.5, label='Posterior: Beta(9,8)')
ax.fill_between(x, posterior, alpha=0.1, color='red')

ax.set_xlabel('$\\theta$', fontsize=12)
ax.set_ylabel('Density', fontsize=12)
ax.set_title('Conjugacy: Beta-Binomial\nPrior × Likelihood = Posterior',
             fontsize=12)
ax.legend(fontsize=9)
ax.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig('distribution_relationships.png', dpi=150, bbox_inches='tight')
plt.show()

この可視化から、確率分布のネットワーク構造が理解できます。

  1. 左上(離散分布の連鎖): 二項分布(青い棒)とポアソン分布(赤い丸)がほぼ一致し、正規分布(緑の曲線)も良い近似を与えています。

  2. 中上(連続分布の連鎖): 指数→ガンマ→カイ二乗の包含関係が視覚的に示されています。

  3. 右上(正規→t): t分布は正規分布より裾が重く、自由度が小さいほどその差が顕著です。

  4. 左下(ベータ族): ベータ分布は一様分布を含む幅広い形状を表現できます。

  5. 中下(再生性): 正規分布の和が正規分布に従うことがシミュレーションで確認されています。

  6. 右下(共役性): 事前分布(青)×尤度(緑)=事後分布(赤)の関係がベータ-二項モデルで示されています。

まとめ

本記事では、主要な確率分布の関係を整理しました。

  • 確率分布は孤立しておらず、極限・変換・和・共役の関係で結ばれたネットワークを形成
  • 離散: ベルヌーイ→二項→ポアソン(極限)、幾何→負の二項(和)
  • 連続: 指数→ガンマ→カイ二乗(特殊ケース)、正規→カイ二乗→t→F(変換)
  • 離散⇔連続: CLTにより多くの離散分布は正規分布で近似できる
  • 共役性: ベータ-二項、ガンマ-ポアソン等はベイズ推論の効率化に不可欠
  • 再生性: 正規・ポアソン・ガンマ・二項は独立な和で分布族が保存される

次のステップとして、各分布の詳細記事を参照してください。