あるデータ群$\bm{X}$があったときに、そのデータ群の平均と標準偏差を求め、データの値から平均を引き、標準偏差で割ることで、Zスコアを求めることができます。
ZスコアはZ値や標準得点とも呼ばれており、統計学や機械学習でも頻繁に登場する統計値です。
機械学習分野では、データを全てZスコアに変換することをよく、標準化や基準化といいます。
英語では、標準化のことを、Z-score normalizationとも呼ばれています。
標準化することで、データの平均は0、標準偏差(と、その二乗である分散)は1になるため、他のデータ群との比較もできるようになります。
また、多くの機械学習アルゴリズムでは、たとえば回帰問題を解く際などは、説明変数を標準化することで、回帰モデルの精度が上がることが経験的に知られています。
Z値(Zスコア)の定義
Z値( Z-score, Zスコア, 標準得点)の定義
標準偏差を$\sigma$、平均を$\mu$とした時、Z値は次のように定義される
\begin{equation} \begin{split} Z_{score} = \frac{x - \mu}{\sigma} \end{split} \end{equation}
(1)でもわかるように、標準化するためには、事前にデータ$\bm{X}$の標準偏差$\sigma$と平均を$\mu$を求めておく必要性があります。