【解説】統計検定準1級 2019年問題11

諸注意

  • 問題本文は公式サイトまたは公式問題集を参照してください
  • 統計検定2級に合格している方を想定して解説していきます

問題11-1

ある年の格付けでは120企業のうち、A評価が100社、B評価が20社、C評価が0社であった。翌年の格付けでは、A評価からB評価に格下げされた企業が5社、B評価からA評価に格上げされた企業が1社、それ以外の企業の評価は据え置きとなった。格付けの推移はマルコフ連鎖を仮定して、次の推移確率行列Mに独立に従う。\(\phi=0.01\)の時、\(\theta\)の最尤推定値を小数点第3位を四捨五入して答えよ。

式1

\begin{align}
M=
\begin{bmatrix}
1-\theta & \theta & 0 \\
\theta & 1-\theta-\phi & \phi \\
0 & \phi & 1-\phi \\
\end{bmatrix}
\end{align}

答え \(\theta=0.05\)

解説

前提知識

推移確率行列

列が変化前、行が変化後、値が変化が起こる確率を表しています。以下の式は変化前後の評価と行列の位置を対応させたものになります。

式2

\begin{align}
M=
\begin{bmatrix}
A \rightarrow A & B \rightarrow A & C \rightarrow A \\
A \rightarrow B & B \rightarrow B & C \rightarrow B \\
A \rightarrow C & B \rightarrow C & C \rightarrow C \\
\end{bmatrix}
\end{align}

最尤推定法

尤度関数が最大になる組み合わせを計算して、尤もらしい値を推定する手法。計算の流れは以下の通りになります。具体的な計算は解説で行います。

  • 尤度関数を作成する
  • 尤度関数を微分する

尤度関数の作成

式1, 2より、評価が変化する内容を以下の表にまとめました。

事象(推移の分類)確率観測値(企業数)
\(A_A\)(A ⇨ A)\(1-\theta\)95
\(A_B\)(A ⇨ B)\(\theta\)5
\(A_C\)(A ⇨ C)\(0\)0
\(B_A\)(B ⇨ A)\(\theta\)1
\(B_B\)(B ⇨ B)\(1-\theta-\phi\)19
\(B_C\)(B ⇨ C)\(\phi\)0
\(C_A\)(C ⇨ A)\(0\)0
\(C_B\)(C ⇨ B)\(\phi\)0
\(C_C\)(C ⇨ C)\(1-\phi\)0

ここから尤度関数を作成します。尤度関数は事象が起きる確率と回数の総乗になります。

式3

\begin{align}
L(\theta) &= A_A^{95} \cdot A_B^5 \cdot A_C^0 \cdot B_A^1 \cdot B_B^{19} \cdot B_C^0 \cdot C_A^0 \cdot C_B^0 \cdot C_C^0 \\
&= (1-\theta)^{95} \cdot \theta^5 \cdot 0^0 \cdot \theta^1 \cdot (1-\theta-\phi)^{19} \cdot \phi^0 \cdot 0^0 \cdot \phi^0 \cdot (1-\phi)^0 \\
&= (1-\theta)^{95} \cdot \theta^5 \cdot 1 \cdot \theta \cdot (1-\theta-0.01)^{19} \cdot 1 \cdot 1 \cdot 1 \cdot 1 \\
&= (1-\theta)^{95} \cdot \theta^6 \cdot (0.99-\theta)^{19} \\
\end{align}

尤度関数の計算

後の計算を楽にするため、式3で求めた尤度関数を対数尤度関数に直します。

式4

\begin{align}
\log L(\theta) &= \log((1-\theta)^{95} \cdot \theta^6 \cdot (0.99-\theta)^{19}) \\
&= \log(1-\theta)^{95} + \log\theta^6 + \log(0.99-\theta)^{19} \\
&= 95\log(1-\theta) + 6\log\theta + 19\log(0.99-\theta) \\
\end{align}

次に、対数尤度関数を微分して、\(\theta\)が最大になる式を求めます。

式5

\begin{align}
&\frac{\partial \log L(\theta)}{\partial\theta} = 0 \\
&\frac{\partial}{\partial\theta} 95\log(1-\theta) + 6\log(\theta) + 19\log(0.99-\theta) = 0 \\
&-\frac{95}{1-\theta}+\frac{6}{\theta}-\frac{19}{0.99-\theta} = 0 \\
\end{align}

最後に、\(\theta\)の値を求めます。愚直に解いても良いですが、\(\theta\)の値は0.05付近であることが分かっています。

  • A評価からB評価に格下げされた企業: 5/100
  • B評価からA評価に格上げされた企業: 1/20

そのため、\(\theta=0.05\)と当たりを付けて、小数点第3位を四捨五入した時に0.05になる範囲(\(0.045 \leq \hat{\theta} < 0.055\))を代入して確認します。

式6

\begin{align}
f(\hat{\theta}=0.045) &= -\frac{95}{1-0.045}+\frac{6}{0.045}-\frac{19}{0.99-0.045}=13.75 \\
f(\hat{\theta}=0.055) &= -\frac{95}{1-0.055}+\frac{6}{0.055}-\frac{19}{0.99-0.055}=-11.75 \\
\end{align}

したがって、\(\theta\)の最尤推定値は0.05になります。

問題11-2

推移確率行列Mが問題11-1と同じ時、その固有値\(\lambda_i(i=1,2,3)\)は直行行列Uを用いて次のように表せる。この時、A評価の企業がn年後にC評価に格下げされる確率を\(n,\lambda,u\)を用いて答えよ。

式7

\begin{align}
U^TMU=
\begin{bmatrix}
\lambda_1 & 0 & 0 \\
0 & \lambda_2 & 0 \\
0 & 0 & \lambda_3 \\
\end{bmatrix}
\end{align}

答え \(\sum_{j=1}^3 \lambda_j^nu_{1j}u_{3j}\)

解説

前提知識

行列の積の結合法則

行列の計算では「(A×B)×C」と「A×(B×C)」の答えは一致します。そのため、A評価の企業の3年後の格付けは式8, 9のどちらでも求めることができます。

式8

\begin{align}
A^{(1)}=A^{(0)}M &=
\begin{bmatrix} 1.00 \\ 0 \\ 0 \end{bmatrix}
\begin{bmatrix}
0.95 & 0.05 & 0 \\
0.05 & 0.94 & 0.01 \\
0 & 0.01 & 0.99
\end{bmatrix} =
\begin{bmatrix} 0.95 \\ 0.05 \\ 0 \end{bmatrix} \\
A^{(2)}=A^{(1)}M &=
\begin{bmatrix} 0.95 \\ 0.05 \\ 0 \end{bmatrix}
\begin{bmatrix}
0.95 & 0.05 & 0 \\
0.05 & 0.94 & 0.01 \\
0 & 0.01 & 0.99
\end{bmatrix} =
\begin{bmatrix} 0.9025 \\ 0.0025 \\ 0 \end{bmatrix} \\
A^{(3)}=A^{(2)}M &=
\begin{bmatrix} 0.9050 \\ 0.0945 \\ 0.0005 \end{bmatrix}
\begin{bmatrix}
0.95 & 0.05 & 0 \\
0.05 & 0.94 & 0.01 \\
0 & 0.01 & 0.99
\end{bmatrix} =
\begin{bmatrix} 0.8645 \\ 0.1341 \\ 0.0014 \end{bmatrix} \\
\end{align}

式9

\begin{align}
A^{(3)} &= A^{(0)}M^3=
\begin{bmatrix} 1.00 \\ 0 \\ 0 \end{bmatrix}
\begin{bmatrix}
0.8645 & 0.1341 & 0.0014 \\
0.1341 & 0.8379 & 0.0280 \\
0.0014 & 0.0280 & 0.9706
\end{bmatrix} =
\begin{bmatrix} 0.8645 \\ 0.1341 \\ 0.0014 \end{bmatrix} \\
\end{align}

A企業の3年後の評価(A評価: 86.45%, B評価: 13.41%, C評価: 0.14%)

直行行列の性質

直行行列をU, 行列をX, Mと表した時、以下の性質を持ちます。

  • 直交変換
    ⇨ \(X=U^TMU\)と仮定した時、\(M=UXU^T\)と変形可能
  • 指数の影響を受けない
    ⇨ \((UXU^T)^n=UX^nU^T\)

問題の咀嚼

本問では、A評価の企業がn年後にC評価に降格する確率を問われているため、式9より\(M^n\)の3行1列目(\(A^n_C\))の値を求めれば良いことが分かります。

式10

\begin{align}
M^n=\begin{bmatrix}
A_A^n & B_A^n & C_A^n \\
A_B^n & B_B^n & C_B^n \\
A_C^n & B_C^n & C_C^n
\end{bmatrix}
\end{align}

行列の計算

直行行列の性質および式7を用いて\(M^n\)が持つ行列を求めます。

式11

\begin{align}
X^n &= (U^TMU)^n \\
M^n &= (UXU^T)^n \\
&= UX^nU^T \\
&= U(U^TMU)^nU^T \\
&=
\begin{bmatrix}
u_{11} & u_{12} & u_{13} \\
u_{21} & u_{22} & u_{23} \\
u_{31} & u_{32} & u_{33} \\
\end{bmatrix}
\begin{bmatrix}
\lambda_1^n & 0 & 0 \\
0 & \lambda_2^n & 0 \\
0 & 0 & \lambda_3^n \\
\end{bmatrix}
\begin{bmatrix}
u_{11} & u_{21} & u_{31} \\
u_{12} & u_{22} & u_{32} \\
u_{13} & u_{23} & u_{33} \\
\end{bmatrix} \\
\end{align}

ここから\(A_C^n\)の値を求めます。なお、余白の都合により\(A_C^n\)以外の箇所は計算を省略します。

式12

\begin{align}
M^n &=
\begin{bmatrix}
u_{11} & u_{12} & u_{13} \\
u_{21} & u_{22} & u_{23} \\
u_{31} & u_{32} & u_{33} \\
\end{bmatrix}
\begin{bmatrix}
\lambda_1^n & 0 & 0 \\
0 & \lambda_2^n & 0 \\
0 & 0 & \lambda_3^n \\
\end{bmatrix}
\begin{bmatrix}
u_{11} & u_{21} & u_{31} \\
u_{12} & u_{22} & u_{32} \\
u_{13} & u_{23} & u_{33} \\
\end{bmatrix} \\
&=
\begin{bmatrix}
A_A^n & B_A^n & C_A^n \\
A_B^n & B_B^n & C_B^n \\
u_{31}\lambda_1^nu_{11}+u_{32}\lambda_2^nu_{12}+u_{33}\lambda_3^nu_{13} & B_C^n & C_C^n \\
\end{bmatrix}
\end{align}

したがって、A評価の企業がn年後にC評価に降格する確率は\(\sum_{j=1}^3 u_{3j}\lambda_j^nu_{1j}\)になります。

Sponsored Link