多項分布について例を交えてわかりやすく解説

Posted: , Category: 確率 , 確率分布

多項分布は、よく、出る目が歪なサイコロを振った時に、各目が何回出るかを表現する確率分布として例えられます。

初見で勉強するとなかなか式の形が複雑であることや、出る目が歪なサイコロなんて現実世界ではあまり扱うこともないことから、なんとなく敬遠してしまう多項分布ですが、ベルヌーイ分布、二項分布、カテゴリカル分布と、順番を追って勉強していくと、実は意外と大したことないと気づくと思います。

今回は多項分布についてできる限り例を交えて、わかりやすく解説していきたいと思います。

また、基本的な統計量である期待値や分散についても取り扱います。

多項分布の定義

まず最初に、多項分布の定義を示します。

多項分布のパラメータは、試行回数$n$と、それぞれの出目が出る確率$\bm{\pi} = \{ \pi_1, \pi_2, \dots, \pi_K \}$で、確率密度関数への入力は、それぞれの出目が出る回数$\bm{x} = \{ x_1, x_2, \dots, x_K \}$ となります。

多項分布の定義
\begin{equation}
\begin{split}
Multi(\bm{x} | \bm{\pi}, n) = \frac{n !}{\prod_{k=1}^{K} x_k !} \prod_{k=1}^{K} \pi_k^{x_k}
\end{split}
\end{equation}

ここで、$\bm{\pi}$、$\bm{x}$は下記を満たす。

\begin{equation}
\begin{split}
\sum_{k=1}^K x_k &= n\\
\sum_{\pi=1}^K \pi_k &= 1
\end{split}
\end{equation}

多項分布のイメージと具体例

ここまで、ほとんど天下り式に、多項分布の定義について示しました。

初めて多項分布の定義式を見た人は、あまりの記号の多さに面食らってしまったと思います。私もナンダコレ 意味ワカラン…. となりました。しかし、多項分布が何を表現しようとしている確率分布かをイメージできるようになると、このような記号や数式が利用されていることをイメージできるようになると思います。

多項分布は、出目が均一ではない、歪なサイコロを振った時に、それぞれの出目が出る回数を表現する確率分布です。ざっくりイメージはこのようになっています。

通常のサイコロであれば、6面体ですが、多項分布はサイコロ以外も扱えるので、一般的に出目の種類を$k$とし、出目の種類の総数を$K$で表現します。

また、$\pi$も登場しますが、これはそれぞれのサイコロの出目が出る確率です。

出目の数はK種類あるので、$\pi$もK種類用意する必要があり、これらをベクトル表記で$\bm{\pi}$をいう記号を用いています。また、$x$は、それぞれの出目が何回出たかを示す変数で、これもK種類あるのでベクトルで $\bm{x}$で表現しています。

多項分布で調べたいのは、任意の$\bm{x}$を与えたとき(つまり、それぞれの出目が何回出るか)、その確率を出力する分布、ということになります。

多項分布の期待値と分散

多項分布における期待値と分散は次のようになっています。

多項分布の統計量

多項分布の期待値

\begin{equation}
\begin{split}
E[x_i] = n \pi_i 
\end{split}
\end{equation}

多項分布の分散

\begin{equation}
\begin{split}
Var[x_i] = n \pi_i (1- \pi_i )
\end{split}
\end{equation}

【広告】
統計学的にあなたの悩みを解決します。
仕事やプライベートでお悩みの方は、ベテラン占い師 蓮若菜にご相談ください。

機械学習と情報技術