潜在変数を一緒に学ぶ：初心者向けブログ

こんにちは！画像生成AIを学習中です。一番最初に出てくる、潜在変数からしてもうわかりません。今日は「潜在変数」という少し難しそうなテーマについて、一緒に学んでいきましょう。私もまだ勉強中なので、ゆっくりと進めていきます。

潜在変数って何？

まず、潜在変数（せんざいへんすう、英: latent variable）とは何かを理解しましょう。潜在変数とは、直接観測できないけれど、他のデータからその存在を推測できる変数のことです。

例えば、「ストレス」を考えてみましょう。ストレスそのものを直接測定するのは難しいですが、心拍数や血圧といった観測可能なデータからストレスの程度を推測できます。このとき、「ストレス」が潜在変数で、心拍数や血圧が観測変数と呼ばれるものです。

どうして潜在変数が重要なの？

潜在変数は、複雑なデータをシンプルに理解するために非常に重要です。例えば、たくさんの観測データがあるとき、それらを一つの潜在変数に集約することで、データの次元を減らし、分析をより簡単に行えるようにします。

さらに、潜在変数を使うことで、データの背後にある「隠れた構造」を理解することができます。例えば、購買行動の分析では、表面的なデータから顧客の「購買意欲」や「ブランドロイヤルティ」といった潜在変数を推測することで、より深い洞察を得ることができます。これは、ビジネス戦略の改善やターゲット顧客の理解に役立つ重要なステップです。

観測変数 $x$ と潜在変数 $z$ について

観測変数 $x$ は実際に観測や測定が可能なデータ、潜在変数 $z$ は直接観測できず他のデータを通じて推測される変数です。

同時分布について

同時分布は、複数の確率変数が同時に取る値の組み合わせに対する確率を表します。例えば、二つのサイコロを振る場合、サイコロの出目を $X$ と $Y$ という変数で表すと、同時分布 $P(X, Y)$ は次のように書けます：

P(X = x, Y = y)

これは、 $X$ が特定の値 $x$ を取り、かつ $Y$ が特定の値 $y$ を取る確率です。例えば、 $X$ が1、 $Y$ が6になる確率は、各サイコロが独立している場合、 $P(X = 1, Y = 6) = \frac{1}{6} \times \frac{1}{6} = \frac{1}{36}$ となります。

同時分布を例で説明しましょう。例えば、二つのサイコロを振ったときの結果を $X$ と $Y$ という変数で表すと、同時分布 $P(X, Y)$ は、 $X$ が1で $Y$ が6になる確率など、サイコロが同時にどの目を出すかに関する確率を表します。

周辺分布について

周辺分布は、同時分布から一つの変数に関する確率を求めるものです。例えば、変数 $X$ の周辺分布 $P(X = x)$ を求める際、変数 $Y$ の値を全て考慮して、その確率を合計します。式で表すと次のようになります：

P(X = x) = \sum_{y} P(X = x, Y = y)

または、連続変数の場合は積分で表されます：

P(X = x) = \int P(X = x, Y = y) \, dy

例えば、サイコロの例では、 $X$ が特定の目（例えば3）を出す確率を知りたいときに、 $Y$ の全ての可能な出目（1から6まで）について、その組み合わせの確率を足し合わせることで求められます。

潜在変数モデルとは？

潜在変数モデルでは、観測変数 $x$ と潜在変数 $z$ の関係を同時分布 $p_\theta(x, z)$ で表します。ここで、 $\theta$ （シータ）はモデルのパラメータを表し、モデルの動作や関係性を決定する役割を果たします。例えば、購買データを分析する際、 $\theta$ は顧客の購買意欲を推定するための係数や重みを示すことがあります。このように、 $\theta$ は潜在変数と観測変数をつなぐ重要な要素です。

尤度とは？

**尤度（ゆうど）**とは、統計学において観測されたデータが特定のモデルやパラメータの下でどれくらい「もっともらしい」かを示す尺度です。具体的には、あるモデルのパラメータが与えられたとき、そのパラメータが観測データを生成する確率を尤度と呼びます。

例えば、サイコロを振って「3」が出たとき、そのサイコロが公正（各面が同じ確率で出る）かどうかを考える場合、そのパラメータ（サイコロの各面が出る確率）に基づいて「3」が出る確率を計算し、それを尤度とします。尤度が高いほど、観測データがそのモデルに「適合」しているといえます。

尤度は、統計モデルのパラメータ推定やモデル選択において重要な役割を果たします。最尤推定法という手法では、尤度を最大化するパラメータを選びます。

周辺化された尤度

「周辺化された尤度 $p(x|\theta)$ 」というのは、観測データ $x$ が得られたときに、そのデータがパラメータ $\theta$ に基づいてどれくらいもっともらしいかを示す確率のことです。

具体的には、モデルの背後にある潜在変数 $z$ を考慮に入れて、その潜在変数がどのような値を取るかをすべて積分（または合計）して、観測データ $x$ のみの確率を計算します。この結果得られる確率を「周辺尤度」または「エビデンス」と呼び、これはモデルが観測データをどれだけうまく説明しているかを評価するために使います。

式 $p(x|\theta)$ は、「観測データ $x$ が与えられたときのパラメータ $\theta$ に基づく確率」という意味です。簡単に言えば、特定の条件（この場合はパラメータ $\theta$ ）の下で、データ $x$ がどれくらい起こりやすいかを表しています。

まとめ

今日は「潜在変数」について簡単に説明しましたが、まだまだ理解が深まるには時間がかかりそうです。次回は、潜在変数を使った具体的なモデルについて詳しく見ていきましょう。一緒に少しずつ学んでいきましょう！

参考：
wikipedia

次回もお楽しみに！

潜在変数を一緒に学ぶ：初心者向けブログ

Yuichiro Minato