問題14
【設問】
各変数の関連性を表す指標である共分散と[inline_accordion word=”相関係数”]
相関係数は、変数XとYの線形関係の強さと方向を示す指標です。共分散を標準化した値であり、-1から1までの範囲で値が変動します。
- +1: 完全な正の相関
⇨ 片方の変数が増加すると、もう片方の変数も増加する - 0: 無相関
⇨ 変数XとYの間に関連がない - -1: 完全な負の相関
⇨ 片方の変数が増加すると、もう片方の変数が減少する
相関係数の求め方
\begin{align}
\text{相関係数} &= \frac{\text{XとYの共分散}}{\text{Xの標準偏差} \cdot \text{Yの標準偏差}} \\
\\
&= \frac{\frac{1}{n} \sum_{i=1}^{n} (x_i-\bar{x})(y_i-\bar{y})}{\sqrt{\frac{1}{n} \sum_{i=1}^{n} (x_i-\bar{x})^2} \cdot \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i-\bar{y})^2}} \\
\end{align}
相関係数の特性
相関係数は共分散を標準化して求めるため、線形変換(加法とスカラー乗法)によって値が変化することはありません。
スケール不変性
\begin{align}
&Cor(X, Y) = COR(X, aY+b) \\
\end{align}
【選択肢】
- 共分散は2つの変数の関係性の強さを測っており、2つの変数間に強い相関がある時に限り、共分散の値は大きくなる。
- 2つの変数の相関係数と、その2つの変数をそれぞれ基準化した変数の共分散は一致する。
- 2つの変数の一方のみ、単位を変更する(例えば、身長と体重の相関関係を考える際に、身長の単位をmからcmに変更など)とき、この2つの変数の共分散の値は変わるが相関係数の値は変わらない。
【答え】2, 3
解説
- 共分散は2つの変数の関係性の強さを測っており、2つの変数間に強い相関がある時に限り、共分散の値は大きくなる。
⇨ 誤り(相関係数の説明であり、共分散の値は単位の変化などにより変化する) - 2つの変数の相関係数と、その2つの変数をそれぞれ基準化した変数の共分散は一致する。
⇨ 正しい - 2つの変数の一方のみ、単位を変更する(例えば、身長と体重の相関関係を考える際に、身長の単位をmからcmに変更など)とき、この2つの変数の共分散の値は変わるが相関係数の値は変わらない。
⇨ 正しい