ベイズ統計についての補足説明

ベイズの定理を書き直して、

$$ p(Y|X)P(X) = p(X|Y)p(Y) $$

とすると、

ある2つの事象$A$, $B$について,$A$が生じて次に$B$が起こる場合と、$B$が生ずる確率は等しい

というように解釈でき、わかりやすいかと思う。

Wikipediaにある「応用例」を見てみよう。

https://ja.wikipedia.org/wiki/%E3%83%99%E3%82%A4%E3%82%BA%E3%81%AE%E5%AE%9A%E7%90%86

  • ある病気の罹患者にある検査をすると99%の確率で陽性と判定できる
  • 非罹患者を検査して陰性になる確率も99%となる
  • 社会全体での罹患者は0.5% (つまり確率は0.005)である

場合を考えてみる。

任意に抽出した一人が陽性($+$)だったとき、その人が罹患してない(U)確率は

$$ \begin{eqnarray*} P(U|+) & = & \frac{P(+|U)P(U)}{P(+)}\\ & = & \frac{ {\rm (非罹患者が+になる確率)} \times {\rm (その人が非罹患者の確率)}} { {\rm (その人が非罹患者の確率)}\times {\rm (非罹患者が+になる確率)} + {\rm(その人が罹患者の確率)} \times {\rm (罹患者が+になる確率)} } \end{eqnarray*} $$

数値を当てはめると $$ P(U|+) = \frac{ 0.99 \times 0.005} { 0.995 \times 0.01 + 0.005 \times 0.99 } \approx 0.332 $$

つまり、任意に選んだ人が陽性だったとしても、本当にその人が健康である確率(偽陽性)は3割強あるということになる。

In [ ]: