条件付き確率と同時確率の関係をイメージで理解する

確率論を学ぶ際に、条件付き確率と同時確率の関係を正しく理解することは非常に重要です。両者は密接に関連していますが、混同しがちな概念でもあります。

今回は、条件付き確率と同時確率の関係を、ベン図や表を使ってイメージで理解できるように解説します。

本記事の内容

同時確率、条件付き確率、周辺確率の定義
3つの確率の関係
ベン図による直感的理解
Python での可視化

前提知識

この記事を読む前に、以下の記事を読んでおくと理解が深まります。

条件付き確率とは？定義から計算例までわかりやすく解説

3つの確率の定義

同時確率

事象 $A$ と事象 $B$ が同時に起こる確率です。

$$ \begin{equation} P(A, B) = P(A \cap B) \end{equation} $$

条件付き確率

事象 $B$ が起こったという条件のもとで、事象 $A$ が起こる確率です。

$$ \begin{equation} P(A|B) = \frac{P(A, B)}{P(B)} \end{equation} $$

周辺確率

他の事象を考慮しない（周辺化した）確率です。

$$ \begin{equation} P(A) = \sum_B P(A, B) = \sum_B P(A|B)P(B) \end{equation} $$

3つの確率の関係

(2) 式を変形すると、

$$ \begin{equation} P(A, B) = P(A|B) \cdot P(B) = P(B|A) \cdot P(A) \end{equation} $$

これが最も基本的な関係式です。同時確率 = 条件付き確率 × 周辺確率 と覚えましょう。

大小関係

$0 < P(B) \leq 1$ より、

$$ P(A|B) = \frac{P(A, B)}{P(B)} \geq P(A, B) $$

条件付き確率は同時確率以上の値をとります。これは、条件付け操作によって標本空間が制限され、相対的に確率が増加するためです。

具体例: 天気と傘

以下の同時確率表を考えましょう。

	雨($B$)	晴れ($\bar{B}$)	合計
傘あり($A$)	0.30	0.10	0.40
傘なし($\bar{A}$)	0.10	0.50	0.60
合計	0.40	0.60	1.00

同時確率: $P(A, B) = 0.30$（雨かつ傘を持っている）

条件付き確率: $P(A|B) = \frac{0.30}{0.40} = 0.75$（雨のとき傘を持っている確率）

周辺確率: $P(A) = 0.40$（全体で傘を持っている確率）

条件付き確率 0.75 は同時確率 0.30 より大きく、また周辺確率 0.40 よりも大きいことがわかります。

Python での可視化

import numpy as np
import matplotlib.pyplot as plt
from matplotlib.patches import Circle
from matplotlib_venn import venn2

# 同時確率表の可視化
joint_prob = np.array([[0.30, 0.10],
                       [0.10, 0.50]])

fig, axes = plt.subplots(1, 3, figsize=(16, 5))

# 左: 同時確率表のヒートマップ
ax1 = axes[0]
im = ax1.imshow(joint_prob, cmap='Blues', vmin=0, vmax=0.5)
ax1.set_xticks([0, 1])
ax1.set_xticklabels(['Rain (B)', 'Sunny (not B)'], fontsize=11)
ax1.set_yticks([0, 1])
ax1.set_yticklabels(['Umbrella (A)', 'No umbrella (not A)'], fontsize=11)
for i in range(2):
    for j in range(2):
        ax1.text(j, i, f'{joint_prob[i, j]:.2f}', ha='center', va='center',
                 fontsize=14, color='black' if joint_prob[i, j] < 0.3 else 'white')
ax1.set_title('Joint Probability P(A, B)', fontsize=13)
plt.colorbar(im, ax=ax1, shrink=0.8)

# 中央: 条件付き確率の比較
ax2 = axes[1]
P_A = joint_prob.sum(axis=1)  # P(A), P(not A)
P_B = joint_prob.sum(axis=0)  # P(B), P(not B)

# P(A|B) vs P(A|not B)
P_A_given_B = joint_prob[0, 0] / P_B[0]
P_A_given_notB = joint_prob[0, 1] / P_B[1]

categories = ['P(A,B)\n(Joint)', 'P(A|B)\n(Conditional)', 'P(A)\n(Marginal)']
values = [joint_prob[0, 0], P_A_given_B, P_A[0]]
colors = ['steelblue', 'coral', 'green']
bars = ax2.bar(categories, values, color=colors, alpha=0.7)
for bar, val in zip(bars, values):
    ax2.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.02,
             f'{val:.2f}', ha='center', fontsize=13)
ax2.set_ylabel('Probability', fontsize=12)
ax2.set_title('Comparison: Joint vs Conditional vs Marginal', fontsize=13)
ax2.set_ylim(0, 1)
ax2.grid(True, alpha=0.3, axis='y')

# 右: モンテカルロシミュレーション
ax3 = axes[2]
np.random.seed(42)
n_sim = 50000
samples = np.random.choice(4, size=n_sim, p=joint_prob.flatten())
# 0: A&B, 1: A&notB, 2: notA&B, 3: notA&notB
is_A = (samples == 0) | (samples == 1)
is_B = (samples == 0) | (samples == 2)

# 条件付き確率の推定
n_values = np.arange(100, n_sim, 100)
P_AB_est = []
P_A_given_B_est = []
P_A_est = []

for n in n_values:
    a = is_A[:n]
    b = is_B[:n]
    P_AB_est.append(np.mean(a & b))
    P_A_given_B_est.append(np.mean(a[b]) if b.sum() > 0 else 0)
    P_A_est.append(np.mean(a))

ax3.plot(n_values, P_AB_est, 'b-', alpha=0.6, linewidth=1, label='P(A,B) sim')
ax3.plot(n_values, P_A_given_B_est, 'r-', alpha=0.6, linewidth=1, label='P(A|B) sim')
ax3.plot(n_values, P_A_est, 'g-', alpha=0.6, linewidth=1, label='P(A) sim')
ax3.axhline(y=0.30, color='b', linestyle='--', alpha=0.5)
ax3.axhline(y=0.75, color='r', linestyle='--', alpha=0.5)
ax3.axhline(y=0.40, color='g', linestyle='--', alpha=0.5)
ax3.set_xlabel('Number of samples', fontsize=12)
ax3.set_ylabel('Estimated probability', fontsize=12)
ax3.set_title('Monte Carlo Estimation', fontsize=13)
ax3.legend(fontsize=9)
ax3.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

中央のグラフでは、同時確率 < 周辺確率 < 条件付き確率の大小関係が視覚的に確認できます。

まとめ

本記事では、条件付き確率と同時確率の関係について解説しました。

同時確率 = 条件付き確率 × 周辺確率という基本関係が成り立つ
条件付き確率は同時確率以上の値をとる（条件付けにより標本空間が縮小するため）
条件付け操作は「特定の事象が起こった世界に制限する」ことに対応する
ベイズの定理はこの基本関係から導出される

次のステップとして、以下の記事も参考にしてください。

条件付き確率と同時確率の関係をイメージで理解する

前提知識

3つの確率の定義

同時確率

条件付き確率

周辺確率

3つの確率の関係

大小関係

具体例: 天気と傘

Python での可視化

まとめ

時系列異常検知の代表的な手法まとめ

機械学習における正則化とは？L1・L2正則化を分かりやすく解説

条件付き確率と同時確率の関係をイメージで理解する

前提知識

3つの確率の定義

同時確率

条件付き確率

周辺確率

3つの確率の関係

大小関係

具体例: 天気と傘

Python での可視化

まとめ

関連記事

測度論的確率論入門 — σ加法族と確率測度

確率変数の収束 — 概収束・確率収束・分布収束・Lp収束

ボレル・カンテリの補題と応用 — 無限回起きるか有限回で終わるか

時系列異常検知の代表的な手法まとめ

機械学習における正則化とは？L1・L2正則化を分かりやすく解説