【標準得点】統計学や機械学習で登場するZ値(Zスコア)をわかりやすく解説

Posted: , Category: 統計学

あるデータ群$\bm{X}$があったときに、そのデータ群の平均と標準偏差を求め、データの値から平均を引き、標準偏差で割ることで、Zスコアを求めることができます。

ZスコアはZ値や標準得点とも呼ばれており、統計学や機械学習でも頻繁に登場する統計値です。

機械学習分野では、データを全てZスコアに変換することをよく、標準化や基準化といいます。

英語では、標準化のことを、Z-score normalizationとも呼ばれています。

標準化することで、データの平均は0、標準偏差(と、その二乗である分散)は1になるため、他のデータ群との比較もできるようになります。

また、多くの機械学習アルゴリズムでは、たとえば回帰問題を解く際などは、説明変数を標準化することで、回帰モデルの精度が上がることが経験的に知られています。

Z値(Zスコア)の定義

Z値( Z-score, Zスコア, 標準得点)の定義

標準偏差を$\sigma$、平均を$\mu$とした時、Z値は次のように定義される

\begin{equation}
\begin{split}
Z_{score} = \frac{x - \mu}{\sigma}
\end{split}
\end{equation}

(1)でもわかるように、標準化するためには、事前にデータ$\bm{X}$の標準偏差$\sigma$と平均を$\mu$を求めておく必要性があります。

【広告】
統計学的にあなたの悩みを解決します。
仕事やプライベートでお悩みの方は、ベテラン占い師 蓮若菜にご相談ください。

機械学習と情報技術