統計検定3級 相関係数

相関係数は、変数XとYの線形関係の強さと方向を示す指標です。共分散を標準化した値であり、-1から1までの範囲で値が変動します。

  • +1: 完全な正の相関
    ⇨ 片方の変数が増加すると、もう片方の変数も増加する
  • 0: 無相関
    ⇨ 変数XとYの間に関連がない
  • -1: 完全な負の相関
    ⇨ 片方の変数が増加すると、もう片方の変数が減少する

相関係数の求め方

\begin{align}
\text{相関係数} &= \frac{\text{XとYの共分散}}{\text{Xの標準偏差} \cdot \text{Yの標準偏差}} \\
\\
&= \frac{\frac{1}{n} \sum_{i=1}^{n} (x_i-\bar{x})(y_i-\bar{y})}{\sqrt{\frac{1}{n} \sum_{i=1}^{n} (x_i-\bar{x})^2} \cdot \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i-\bar{y})^2}} \\
\end{align}

相関係数の特性
相関係数は共分散を標準化して求めるため、線形変換(加法とスカラー乗法)によって値が変化することはありません。

スケール不変性

\begin{align}
&Cor(X, Y) = COR(X, aY+b) \\
\end{align}

Sponsored Link