リスクとオッズ
リスクとオッズは、それぞれ『全体に占める割合』と『成功と失敗の比率』を表しています。
例えば、総勢100名にアンケートを行い、60名がYES、40名がNOと答えたとしましょう。
- リスク(全体に占める割合)
\(\rightarrow 60/100=0.6\) - オッズ(成功と失敗の比率)
\(\rightarrow 60/40=1.5\)
相対的リスクとオッズ比
Point
- 調査で興味があるのは『状態Aと状態Bのリスクの差』になる
⇨ 相対的リスク - 調査対象の割合が小さい時、相対的リスクとオッズ比は近似値を取る
調査対象 | コントロール群 | 合計 | |
状態A | \(T_A\) | \(C_A\) | \(T_A+C_A\) |
状態B | \(T_B\) | \(C_B\) | \(T_B+C_B\) |
合計 | \(T_A+T_B\) | \(C_A+C_B\) |
多くの調査では、2行2列マトリクスを用いてデータを表現します。
例えば、喫煙がもたらす肺炎に罹るリスクを調べたい時は、以下のように読み替えます。
- 調査対象 ⇨ 肺炎患者
- コントロール群 ⇨ 健康な人
- 状態A ⇨ 喫煙者
- 状態B ⇨ 非喫煙者
状態Aと状態Bの相対的リスク
調査対象のリスクはそれぞれ以下の通り計算できます。
- 状態Aのリスク:\(T_A/(T_A+C_A)\)
- 状態Bのリスク:\(T_B/(T_B+C_B)\)
例えば、ある国では1%の人口が肺炎に罹患するとしましょう。
肺炎と喫煙者の関係を調べる為に、無作為に10,000人を調査した結果が以下の通りでした。
肺炎患者 | 健康な人 | 合計 | |
喫煙者 | 80 | 2920 | 3000 |
非喫煙者 | 20 | 6980 | 7000 |
合計 | 100 | 9900 | 10000 |
この時、喫煙者と非喫煙者が肺炎に罹るリスクは以下の通りです。
- 喫煙者が肺炎に罹るリスク:\(80/3000=0.0267\)
- 非喫煙者が肺炎に罹るリスク:\(20/7000=0.0028\)
ここから、喫煙がもたらす肺炎患者の相対的リスクは \(0.0267/0.0028=9.5\) になります。
⇨ 喫煙者が肺炎に罹るリスクは、非喫煙者の9.5倍であると言えます。
調査対象とコントロール群のオッズ比
調査対象が占める割合が小さいことが条件ですが、オッズ比は相対リスクの近似値を取ります。
オッズ比は、主に後ろ向き調査で使用されます。
- 調査対象のオッズ:\(T_A/T_B\)
⇨ 肺炎患者が喫煙者であるオッズ:\(80/20=4.0\) - コントロール群のオッズ:\(C_A/C_B\)
⇨ 健康な人が喫煙者であるオッズ:\(2920/6980=0.42\)
この時、喫煙者のオッズ比は \(4.0/0.42=9.5\) になります。
先ほど計算した肺炎患者の相対的リスクの9.5倍と一致します。
証明
【オッズ比と相対的リスクの近似】
条件:調査対象\(T_A, T_B\)がコントロール群\(C_A, C_B\)と比較して十分に小さい
\begin{align}
\text{オッズ比} &= \text{相対的リスク} \\
\\
\frac{T_A/T_B}{C_A/C_B} &= \frac{T_A/(T_A+C_A)}{T_B/(T_B+C_B)} \\
\\
\frac{T_AC_B}{T_BC_A} &= \frac{T_A(T_B+C_B)}{T_B(T_A+C_A)} \\
\\
\frac{T_AC_B}{T_BC_A} &= \frac{T_AC_B}{T_BC_A} \longleftarrow T_A<<C_A, T_B<<C_B\\
\end{align}
調査方法
主な調査方法には、前向き調査と後ろ向き調査の二つがあります。
- 前向き調査
⇨ 調査対象とコントロール群を無作為に選出する - 後ろ向き調査
⇨ 調査対象とコントロール群を別々に選出する
前向き調査
前向き調査の名前は、生まれたばかりの赤子を追跡して調査を行ったことに由来します。
前(未来)がどうなるか分からない状態で調査を行うという意味らしいです。
先ほど例に取り上げた肺炎の表で説明します。
前向き調査では、無作為に10,000人を調査するとだけ決めてデータを収集します。
肺炎患者 | 健康な人 | 合計 | |
喫煙者 | 80 | 2920 | 3000 |
非喫煙者 | 20 | 6980 | 7000 |
合計 | 100 | 9900 | 10000 |
後ろ向き調査
後ろ向き調査とは、後ろ(過去)を振りかって調査を行うという意味らしいです。
後ろ向き調査では、肺炎患者100名、健康な人300名を調査するというように、任意の値を決めてデータを収集します。
肺炎患者 | 健康な人 | 合計 | |
喫煙者 | 80 | 90 | 170 |
非喫煙者 | 20 | 210 | 230 |
合計 | 100 | 300 | 400 |
後ろ向き調査の注意点
Point
- 調査対象(肺炎患者)とコントロール群(健康な人)を跨いだ調査が行えない
調査対象とコントロール群を跨いだ分析
後ろ向き調査では、調査対象とコントロール群の数を任意に設定しています。
その為、調査対象とコントロール群では母集団が異なることになります。
例えば、肺炎患者100名、健康な人300名を任意に集めたとしましょう。
ここから、この国の肺炎患者の割合は25%(\(=100/400\))であるとは言えません。
同様に、喫煙者が肺炎に罹るリスクやオッズも信頼できない値になります。
- 喫煙者が肺炎に罹るリスク(使用不可)
\(80/170=0.47\) - 喫煙者が肺炎に罹るオッズ(使用不可)
\(80/90=0.89\)
調査対象とコントロール群を跨がない分析
調査対象とコントロール群を跨がない分析であれば、後ろ向き調査でも扱えます。
例えば、肺炎患者の喫煙率を調査する場合は、母集団が肺炎患者に限定される必要があります。
健康な人の喫煙率を調査する場合も同様です。
その為、肺炎患者と健康な人をそれぞれ任意の数集めたとしても、喫煙者のオッズは前向き調査と同じ条件で調査することが可能です。