相関係数は、変数XとYの線形関係の強さと方向を示す指標です。共分散を標準化した値であり、-1から1までの範囲で値が変動します。
- +1: 完全な正の相関
⇨ 片方の変数が増加すると、もう片方の変数も増加する - 0: 無相関
⇨ 変数XとYの間に関連がない - -1: 完全な負の相関
⇨ 片方の変数が増加すると、もう片方の変数が減少する
相関係数の求め方
\begin{align}
\text{相関係数} &= \frac{\text{XとYの共分散}}{\text{Xの標準偏差} \cdot \text{Yの標準偏差}} \\
\\
&= \frac{\frac{1}{n} \sum_{i=1}^{n} (x_i-\bar{x})(y_i-\bar{y})}{\sqrt{\frac{1}{n} \sum_{i=1}^{n} (x_i-\bar{x})^2} \cdot \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i-\bar{y})^2}} \\
\end{align}
相関係数の特性
相関係数は共分散を標準化して求めるため、線形変換(加法とスカラー乗法)によって値が変化することはありません。
スケール不変性
\begin{align}
&Cor(X, Y) = COR(X, aY+b) \\
\end{align}