諸注意
- 問題本文は公式サイトまたは公式問題集を参照してください
- 統計検定2級の資格を持つ方を前提に解説していきます
問題1-1
ある感染症は1000人に1人の割合で感染する。検査1は真陽性率が99.9%, 偽陽性率が0.1%になります。検査1で陽性反応が出た時、本当に感染している確率を答えよ。
答え 50%
解説
前提知識
ベイズの定理
得られた結果から原因を推定する手法であり、情報を取り入れるたびに値を更新していきます。ベイズの定理で使われる用語は以下の通りです。
- 事象: \((A, B)\)
- 事後確率: \(P(A|B)\)
- 事前確率: \(P(A)\)
- 尤度: \(P(B|A)\)
- 周辺確率: \(P(B)\)
式1
\begin{align}
P(A|B)=\frac{P(B|A)P(A)}{P(B)} \\
\end{align}
周辺確率の計算
問題文より、感染者の割合は0.1%(1人/1000人), 検査1の真陽性率は99.9%, 偽陽性率は0.1%になります。これらの値をもとに検査1で陽性反応が出る確率を計算します。
式2
\begin{align}
& P(Y_1) = 0.001*0.999 + (1-0.001)*0.001 = 0.001998 \\
\end{align}
事後確率の計算
- 事象: \((X, Y_1)\)
⇨ \(X\): 感染症に感染している
⇨ \(Y_1\): 検査1で陽性反応が出る - 事後確率: \(P(X|Y_1)\)
⇨ 検査1で陽性反応が出た人の感染割合 - 事前確率: \(P(X) = 0.001\)
⇨ 全人口の感染割合 - 尤度: \(P(Y_1|X) = 0.999\)
⇨ 真陽性率(感染者が検査1で陽性と判定される確率) - 周辺確率: \(P(Y_1) = 0.001998\)
⇨ 陽性率(検査1で陽性と判定される確率)
式3
\begin{align}
P(X|Y_1) = \frac{P(Y_1|X)P(X)}{P(Y_1)} = \frac{0.999 \cdot 0.001}{0.001998} = 0.5 \\
\end{align}
したがって、検査1で陽性反応が出た人の感染割合は50%になります。
問題1-2
検査1で陽性反応が出た場合、検査2を行います。検査2は真陽性率が95%, 偽陽性率が5%になります。検査2で再び陽性反応が出た時、本当に感染している確率を答えよ。
答え 95%
解説
情報の更新
問題1-1では全人口を対象に確率を計算しましたが、本問では検査1で陽性反応が出た人を対象に確率を計算します。本問に対応するため、用語も以下の通り更新します。
- 事象: \((X, Y_1, Y_2)\)
⇨ \(X\): 感染症に感染している
⇨ \(Y_1\): 検査1で陽性反応が出る
⇨ \(Y_2\): 検査2で陽性反応が出る - 事後確率: \(P(X|Y_1, Y_2)\)
⇨ 検査1を通過後、検査2でも陽性反応が出た人の感染割合 - 事前確率: \(P(X|Y_1) = 0.5\)(問題1-1の答え)
⇨ 検査1を通過した人の感染割合 - 尤度: \(P(Y_2|X, Y_1) = 0.95\)
⇨ 真陽性率(感染者が検査1を通過後、検査2でも陽性と判定される確率) - 周辺確率: \(P(Y_2|Y_1)\)
⇨ 陽性率(検査1を通過後、検査2でも陽性と判定される確率)
事後確率の計算
検査1を通過した人の感染割合は50%, 検査2の真陽性率は95%, 偽陽性率は5%になります。これらの値を用いて周辺確率(検査2の陽性率)を計算した後、事後確率を求めます。
式4
\begin{align}
&P(Y_2|Y_1) = 0.5*0.95 + 0.5*0.05 = 0.5 \\
\\
&P(X|Y_1, Y_2) = \frac{P(Y_2|X, Y_1)P(X|Y_1)}{P(Y_2|Y_1)} = \frac{0.95 \cdot 0.5}{0.5} = 0.95 \\
\end{align}
したがって、検査1通過後に検査2でも陽性が出た時の感染確率は95%になります。