【解説】統計検定準1級 2018年問題1

諸注意

  • 問題本文は公式サイトまたは公式問題集を参照してください
  • 統計検定2級の資格を持つ方を前提に解説していきます

問題1-1

ある感染症は1000人に1人の割合で感染する。検査1は真陽性率が99.9%, 偽陽性率が0.1%になります。検査1で陽性反応が出た時、本当に感染している確率を答えよ。

答え 50%

解説

前提知識

ベイズの定理

得られた結果から原因を推定する手法であり、情報を取り入れるたびに値を更新していきます。ベイズの定理で使われる用語は以下の通りです。

  • 事象: \((A, B)\)
  • 事後確率: \(P(A|B)\)
  • 事前確率: \(P(A)\)
  • 尤度: \(P(B|A)\)
  • 周辺確率: \(P(B)\)

式1

\begin{align}
P(A|B)=\frac{P(B|A)P(A)}{P(B)} \\
\end{align}

周辺確率の計算

問題文より、感染者の割合は0.1%(1人/1000人), 検査1の真陽性率は99.9%, 偽陽性率は0.1%になります。これらの値をもとに検査1で陽性反応が出る確率を計算します。

式2

\begin{align}
& P(Y_1) = 0.001*0.999 + (1-0.001)*0.001 = 0.001998 \\
\end{align}

事後確率の計算

  • 事象: \((X, Y_1)\)
    ⇨ \(X\): 感染症に感染している
    ⇨ \(Y_1\): 検査1で陽性反応が出る
  • 事後確率: \(P(X|Y_1)\)
    ⇨ 検査1で陽性反応が出た人の感染割合
  • 事前確率: \(P(X) = 0.001\)
    ⇨ 全人口の感染割合
  • 尤度: \(P(Y_1|X) = 0.999\)
    ⇨ 真陽性率(感染者が検査1で陽性と判定される確率)
  • 周辺確率: \(P(Y_1) = 0.001998\)
    ⇨ 陽性率(検査1で陽性と判定される確率)

式3

\begin{align}
P(X|Y_1) = \frac{P(Y_1|X)P(X)}{P(Y_1)} = \frac{0.999 \cdot 0.001}{0.001998} = 0.5 \\
\end{align}

したがって、検査1で陽性反応が出た人の感染割合は50%になります。

問題1-2

検査1で陽性反応が出た場合、検査2を行います。検査2は真陽性率が95%, 偽陽性率が5%になります。検査2で再び陽性反応が出た時、本当に感染している確率を答えよ。

答え 95%

解説

情報の更新

問題1-1では全人口を対象に確率を計算しましたが、本問では検査1で陽性反応が出た人を対象に確率を計算します。本問に対応するため、用語も以下の通り更新します。

  • 事象: \((X, Y_1, Y_2)\)
    ⇨ \(X\): 感染症に感染している
    ⇨ \(Y_1\): 検査1で陽性反応が出る
    ⇨ \(Y_2\): 検査2で陽性反応が出る
  • 事後確率: \(P(X|Y_1, Y_2)\)
    ⇨ 検査1を通過後、検査2でも陽性反応が出た人の感染割合
  • 事前確率: \(P(X|Y_1) = 0.5\)(問題1-1の答え)
    ⇨ 検査1を通過した人の感染割合
  • 尤度: \(P(Y_2|X, Y_1) = 0.95\)
    ⇨ 真陽性率(感染者が検査1を通過後、検査2でも陽性と判定される確率)
  • 周辺確率: \(P(Y_2|Y_1)\)
    ⇨ 陽性率(検査1を通過後、検査2でも陽性と判定される確率)

事後確率の計算

検査1を通過した人の感染割合は50%, 検査2の真陽性率は95%, 偽陽性率は5%になります。これらの値を用いて周辺確率(検査2の陽性率)を計算した後、事後確率を求めます。

式4

\begin{align}
&P(Y_2|Y_1) = 0.5*0.95 + 0.5*0.05 = 0.5 \\
\\
&P(X|Y_1, Y_2) = \frac{P(Y_2|X, Y_1)P(X|Y_1)}{P(Y_2|Y_1)} = \frac{0.95 \cdot 0.5}{0.5} = 0.95 \\
\end{align}

したがって、検査1通過後に検査2でも陽性が出た時の感染確率は95%になります。

Sponsored Link