毎日学ぶことが多すぎて心が折れそうです。生成AIでも確率統計関連の話題が多く、ついていくために少しずつ学んでいこうと思います。
ChatGPTに言われた通りベイズの定理からベイズ推定あたりまでを理解したいと思います。
確率の基本概念:条件付き確率、ベイズの定理、期待値、分散
まずはベイズの定理のようです。この式はとにかく出てきますね。全く理解できません。
ベイズの定理の数式
ベイズの定理は以下の数式で表されます:
ここで:
: 事後確率(事象P(A | B) が起こった後に、仮説B が真である確率)A : 尤度(仮説P(B | A) が真であるときに、事象A が起こる確率)B : 事前確率(仮説P(A) が真であると考える初期の確率)A : 周辺尤度(事象P(B) が起こる全体の確率)B
ベイズの定理の具体例
例1: 病気の診断
ある病気にかかっている確率が1%であるとします。検査結果が陽性だったとき、その結果が正しい確率は80%だとします。しかし、病気ではない人も5%の確率で誤って陽性の結果が出ることがあります。ここで、検査結果が陽性だった場合に、実際に病気にかかっている確率を計算してみましょう。
: 病気にかかっているA : 検査結果が陽性B
ベイズの定理を使うと、
まずは各確率を見てみます。
(病気にかかっている事前確率)P(A) = 0.01 (病気のとき陽性が出る確率、つまり尤度)P(B | A) = 0.80 (病気ではないのに陽性になる確率)P(B | \neg A) = 0.05 (病気にかかっていない事前確率)P(\neg A) = 0.99
次に、全体の陽性確率
最後にベイズの定理に代入します:
つまり、検査結果が陽性だったとしても、実際に病気にかかっている確率は約13.9%しかないことが分かります。
と、ChatGPTそのままの解説を載せてしまいました。
数式だけだと全くイメージつきませんが、具体例があるとイメージがつくようになってきました。
今回はこれから拡散モデルや変分オートエンコーダーなどに利用したいと考えていましたが、
普通にベイズ推定だけでも利用シーンが想定できそうな気がしてきました。
少しずつ勉強したいと思います。