おじさんが頑張ってベイズの定理を学ぶ

毎日学ぶことが多すぎて心が折れそうです。生成AIでも確率統計関連の話題が多く、ついていくために少しずつ学んでいこうと思います。
ChatGPTに言われた通りベイズの定理からベイズ推定あたりまでを理解したいと思います。

確率の基本概念：条件付き確率、ベイズの定理、期待値、分散

まずはベイズの定理のようです。この式はとにかく出てきますね。全く理解できません。

ベイズの定理は以下の数式で表されます：

P(A | B) = \frac{P(B | A) \cdot P(A)}{P(B)}

ここで：

ある病気にかかっている確率が1%であるとします。検査結果が陽性だったとき、その結果が正しい確率は80%だとします。しかし、病気ではない人も5%の確率で誤って陽性の結果が出ることがあります。ここで、検査結果が陽性だった場合に、実際に病気にかかっている確率を計算してみましょう。

ベイズの定理を使うと、

P(A | B) = \frac{P(B | A) \cdot P(A)}{P(B)}

まずは各確率を見てみます。

次に、全体の陽性確率 $P(B)$ を計算します：

P(B) = P(B | A) \cdot P(A) + P(B | \neg A) \cdot P(\neg A)

P(B) = (0.80 \times 0.01) + (0.05 \times 0.99) = 0.008 + 0.0495 = 0.0575

最後にベイズの定理に代入します：

P(A | B) = \frac{0.80 \times 0.01}{0.0575} = \frac{0.008}{0.0575} \approx 0.139

つまり、検査結果が陽性だったとしても、実際に病気にかかっている確率は約13.9%しかないことが分かります。

と、ChatGPTそのままの解説を載せてしまいました。

数式だけだと全くイメージつきませんが、具体例があるとイメージがつくようになってきました。
今回はこれから拡散モデルや変分オートエンコーダーなどに利用したいと考えていましたが、
普通にベイズ推定だけでも利用シーンが想定できそうな気がしてきました。

少しずつ勉強したいと思います。