【解説】統計検定準1級 2019年問題10

諸注意

  • 問題本文は公式サイトまたは公式問題集を参照してください
  • 統計検定2級に合格している方を想定して解説していきます

問題9-1&問題9-2

Oリングの破損の有無と外気温の関係を調べるため、外気温を説明変数に持つロジスティック回帰モデルを利用してOリングの破損の有無を推定する。なお、スペースシャトルの打ち上げ回数を\(i=1,2,…,23\)、外気温を\(x_i\)、Oリングの破損の有無を\(y_i\)(1が破損あり、0が破損なし)で表す。この時、下記の(ア)と(イ)に当てはまる選択肢を答えよ。

\(y_i\)は互いに独立な確率変数\(Y_i\)の実現値であり、\(Y_i\)は(ア)に従う。\(\pi_i(0<\pi_i<1)\)について構造式(イ)を仮定する。

(ア)に当てはまる選択肢
① ベルヌーイ分布\(B(1,\pi_i)\) ② 二項分布\(B(23,\pi_i)\) ③ ポアソン分布 ④ 正規分布

(イ)に当てはまる選択肢
① \(log\frac{\pi_i}{1-\pi_i}=a+bx_i\) ② \(\frac{exp(\pi_i)}{1+exp(\pi_i)}=a+bx_i\) ③ \(log\pi_i=a+bx_i\) ④ \(\pi_i=a+bx_i\)

答え (ア)① ベルヌーイ分布 (イ)① \(log\frac{\pi_i}{1-\pi_i}=a+bx_i\)

解説

前提知識

ロジスティック回帰とは、リンク関数にロジット関数を持つ判別手法です。

  • 式1-1:ロジット関数
    ⇨ 対数オッズを用いたモデル
    ⇨ 成功確率\(\pi_i\)から回帰モデルを求めることができる
  • 式1-2:ロジスティック関数
    ⇨ ロジット関数の逆関数
    ⇨ 回帰モデルから成功確率を求めることができる

式1

\begin{align}
& log\frac{\pi_i}{1-\pi_i}=a+bx_i &(1) \\
& \frac{exp(a+bx_i)}{1+exp(a+bx_i)}=\pi_i &(2) \\
\end{align}

破損の有無を表す確率分布

問題文より、Oリングの破損の有無\(y_i\)は0か1のどちらかの値を取ります。確率変数が0か1のどちらかを取る確率分布はベルヌーイ分布になります。

したがって、(ア)に当てはまる選択肢はベルヌーイ分布\(B(1,\pi_i)\)(選択肢①)になります。

構造式

問題文より、ロジスティック回帰モデルを仮定しているため、リンク関数はロジット関数になります。選択肢と対応する関数名は以下の通りです。

  • \(log\frac{\pi_i}{1-\pi_i}=a+bx_i\)
    ⇨ ロジット関数
  • \(\frac{exp(\pi_i)}{1+exp(\pi_i)}=a+bx_i\)
    ⇨ ロジスティック関数もどき(\(\pi_i\)と\(a+bx_i\)が逆)
  • \(log\pi_i=a+bx_i\)
    ⇨ 対数関数
  • \(\pi_i=a+bx_i\)
    ⇨ 恒等関数

したがって、(イ)に当てはまる選択肢は\(log\frac{\pi_i}{1-\pi_i}=a+bx_i\)(選択肢①)が正解になります。

問題9-3

過去23回の打ち上げデータとロジスティック回帰の結果が以下の通りであった。なお、Tempは外気温, TDはOリングの破損の有無を表す。この時、Oリングの破損確率\(\pi_i\)が0.5となる外気温は何度か答えよ。

選択肢
① 14.9°F ② 24.3°F ③ 54.9°F ④ 64.8°F ⑤ 71.7°F

答え ④ 64.8°F

解説

R言語の見方

Call: glm(formula = df$TD ~ df$Temp, family = binomial(link = "logit"))では、非説明変数にOリングの破損の有無(df$TD), 説明変数に外気温(df$Temp)を用いたロジスティック回帰を指定しています。

その結果、Estimateの(Intercept)が15.0429, df$Tempが-0.2322となっています。これは切片aの推定値が15.0429であり、回帰係数b(傾き)が-0.2322であることを表しています。

外気温の計算

問題文より、Oリングの破損確率\(\pi_i\)が0.5になるため、ロジット関数に値を代入して外気温\(x_i\)を計算します。

式2

\begin{align}
log\frac{\pi_i}{1-\pi_i} &= a+bx_i \\
log\frac{0.5}{1-0.5} &= 15.0429 – 0.2322 x_i \\
0 &= 15.0429 – 0.2322 x_i \\
x_i &= \frac{15.0429}{0.2322} = 64.8 \\
\end{align}

したがって、外気温は64.8°F(選択肢④)になります。

問題9-4

問題9-3と同じロジスティック回帰に従う。外気温が31°Fの時、Oリングの破損確率\(\pi_i\)の推定値を答えよ。

選択肢
① 0.0028 ② 0.1589 ③ 0.5820 ④ 0.8979 ⑤ 0.9996

答え ⑤ 0.9996

解説

破損確率の計算

確率の計算はロジスティック関数の得意領域になるため、式1-2(ロジスティック関数)に値を代入してOリングの破損確率\(\pi_i\)を計算します。

式3

\begin{align}
\pi_i &= \frac{exp(a+bx_i)}{1+exp(a+bx_i)} \\
&= \frac{exp(15.0429-0.2322*31)}{(1 + exp(15.0429-0.232231))} \\
&= \frac{exp(7.84)}{(1 + exp(7.84))} \\
&= \frac{2540}{(1 + 2540)} \\
&= 0.9996 \\
\end{align}

したがって、Oリングの破損確率\(\pi_i\)は0.9996(選択肢⑤)になります。

余談

本問のデータをプロットすると、以下のようになります。このように教師データ(23件のデータ)から大きく外れた値を推定することを外挿(または補外)と呼びます。

外挿は的外れな結果を返すこともあるため、推定する際は注意が必要になります。

  • 白丸: これまでの23件のデータ
  • 赤ばつ: 31°Fのデータ

Sponsored Link