周辺分布

2変量正規分布からサンプリングした図。周辺分布は赤と青で示されている。

周辺分布(しゅうへんぶんぷ、: marginal distribution)は同時確率分布から一部の確率変数を消去した確率分布である。周辺確率分布(しゅうへんかくりつぶんぷ、: marginal probability distribution)とも。

同時分布から周辺分布を作ることを周辺化(しゅうへんか、: marginalizing)という。確率質量関数確率密度関数で特定の確率変数の和もしくは積分をとることである。

表の欄外(margin)に行や列の和を記載することから周辺(marginal)と呼ばれるようになった[1]

分布に関連する様々な関数が周辺化できる。以下はその一例である:

表. 同時分布と対応する周辺分布
同時分布 周辺分布
累積分布関数 周辺累積分布関数 : marginal cumulative distribution function
確率質量関数 周辺確率質量関数 : marginal probability mass function
確率密度関数 周辺確率密度関数 : marginal probability density function

周辺分布に対し、条件付き確率分布は特定の確率変数を特定の値に制限したときの確率分布を指す。

定義

周辺分布は同時分布 P ( X , Y ) {\displaystyle P(X,Y)} 条件付き確率分布 P ( X | Y ) {\displaystyle P(X|Y)} を用いて定義される。

離散型確率分布

離散型確率変数において、 Y {\displaystyle Y} で周辺化された X {\displaystyle X} の周辺確率質量関数 P X ( X ) {\displaystyle P_{X}(X)} は以下で定義される:

P X ( X ) = y Y P X Y ( X , y ) = y Y P X | Y ( X | y ) P Y ( y ) = E P Y [ P X | Y ( X | Y ) ] {\displaystyle P_{X}(X)=\sum _{y\in Y}P_{XY}(X,y)=\sum _{y\in Y}P_{X|Y}(X|y)P_{Y}(y)=\mathbb {E} _{P_{Y}}[P_{X|Y}(X|Y)]}

連続型確率分布

連続型確率変数において、確率密度関数が存在する場合、 Y {\displaystyle Y} で周辺化された X {\displaystyle X} の周辺確率密度関数 P X ( X ) {\displaystyle P_{X}(X)} は以下で定義される:

P X ( X ) = y P X , Y ( X , y ) d y = y P X | Y ( X | y ) P Y ( y ) d y = E P Y [ P X | Y ( X | Y ) ] {\displaystyle P_{X}(X)=\int _{y}P_{X,Y}(X,y)\,\mathrm {d} y=\int _{y}P_{X|Y}(X|y)\,P_{Y}(y)\,\mathrm {d} y=\mathbb {E} _{P_{Y}}[P_{X|Y}(X|Y)]}

参照

  1. ^ Trumpler, Robert J. and Harold F. Weaver (1962). Statistical Astronomy. Dover Publications. pp. 32–33 


確率の歴史
確率の定義
客観確率
  • 統計的確率
  • 古典的確率
  • 公理的確率
主観確率
確率の拡張
基礎概念
モデル
確率変数
確率分布
関数
用語
確率の解釈
問題
法則・定理
測度論
確率微分方程式
確率過程
情報量
応用
数理ファイナンス
系統学
カテゴリ カテゴリ
  • 表示
  • 編集