統計学

【統計学】カイ2乗分布の確率密度関数

  1. HOME >
  2. 統計学 >

【統計学】カイ2乗分布の確率密度関数

スポンサーリンク

正規分布の確率密度関数からカイ2乗分布の確率密度関数を導出する。

標準正規分布の2乗の統計量が自由度1のカイ2乗分布に従うことを示していく。

また、一般化として自由度\(n\)のカイ2乗分布の確率密度関数の導出方法も紹介する。

統計学の入門書におすすめ!
¥3,080 (2022/06/27 19:34時点 | Amazon調べ)

カイ2二乗分布の確率密度関数

確率変数\(X\)が次の確率密度関数をもつとき、\(X\)は自由度\(n\)のカイ2乗分布に従うという。\begin{align}f(x)=\left\{\begin{array}{cc}\cfrac{e^{-\frac{1}{2}x}x^{\frac{1}{2}n-1}}{2^{\frac{1}{2}n} \Gamma(\frac{1}{2}n)}, & x\geq0,\\0, & otherwise.\end{array}\right. ,\end{align}ここに\(n\geq0\)である。

自由度1のカイ2乗分布の確率密度関数

標準正規分布の2乗の統計量が自由度1のカイ2乗分布に従うこと証明する。

証明(変数変換を用いた証明) 標準正規分布に従う確率変数を\(X\sim N(0, 1)\)とする。このとき、正規分布の確率密度関数より、\(X\)の確率密度関数は次で表現される。

\begin{align}\label{eq1}f(x) = \cfrac{1}{\sqrt{2\pi}}\exp\left(-\cfrac{x^2}{2}\right).\tag{1}\end{align}

ここで、\(y=x^2\)の変数変換を行う。\(y=x^2 \Leftrightarrow x = \pm\sqrt{y}\)であり、この変換は1対1対応でないことがわかる。そのため、\(x\geq 0\)であることを仮定し、\(x = \sqrt{y}\)とする。この変換のヤコビアンは

\begin{align}\cfrac{dx}{dy}=\cfrac{1}{2}y^{-\frac{1}{2}}\end{align}

となる。また、確率密度関数の対称性から、\(x\geq0\)の密度を2倍にさせることで\(x\)が正負の2通りの密度を一意に変換することが可能となる。したがって変数変換より、次の\(Y=X^2\)の確率密度関数を得る。

\begin{align}g(y) &=\cfrac{2}{\sqrt{2\pi}}\exp\left(-\cfrac{y}{2}\right)\left|\cfrac{dx}{dy}\right|\\&=\cfrac{e^{-\frac{1}{2}y}\cfrac{1}{2}y^{-\frac{1}{2}}}{2^{\frac{1}{2}} \Gamma(\frac{1}{2})}\end{align}

これは\(n=1\)のときの\eqref{eq1}のカイ2二乗分布の確率密度関数であり、標準正規分布の2乗の統計量が自由度1のカイ2乗分布に従うことが示された。□

証明(分布関数を用いた証明) 上の変数変換以外の証明方法として、分布関数を用いた証明も紹介する。上の証明と同様に、\(Y=X^2\)の確率密度関数を導出する。\(X\)の分布関数を\(F(x)\)とする。\(y<0\)に対し

\begin{align}\mathrm{Pr}\{Y<y\} = 0, \end{align}\(y\geq 0\)に対し\begin{align}\mathrm{Pr}\{Y<y\} &= \mathrm{Pr}\{X^2<y\}\\&= \mathrm{Pr}\{|X| <\sqrt{y}\}\\ &= \mathrm{Pr}\{\sqrt{y}<X<\sqrt{y}\}\\&=F(\sqrt{y})-F(\sqrt{-y})\end{align}

ここで、標準正規分布の対称性より、\(x\geq0\)に対して

\begin{align}F(-x) = 1-F(x)\end{align}

が成り立つ。したがって

\begin{align}F(\sqrt{y})-F(\sqrt{-y})&= F(\sqrt{y}) - \bigl\{1-F(\sqrt{y})\bigr\}\\\label{eq2}&=2F(\sqrt{y})-1\tag{2}\end{align}

を得る。確率密度関数は分布関数を微分することで得られるので、\(Y\)の確率密度関数は次のようにして導出される。

\begin{align}\cfrac{d}{dy}\bigl\{2F(\sqrt{y})-1\bigr\} &= 2\cfrac{1}{2}y^{-\frac{1}{2}}f(\sqrt{y})\\&= y^{-\frac{1}{2}}\cfrac{1}{\sqrt{2\pi}}\exp\left(-\cfrac{y}{2}\right)\\&=\cfrac{e^{\frac{1}{2}y}y^{-\frac{1}{2}}}{2^{\frac{1}{2}}\Gamma(\frac{1}{2})}□\end{align}

自由度2のカイ2乗分布の確率密度関数

次に自由度2のカイ二乗分布の確率密度関数の導出をする。自由度1のカイ2二乗分布に従う確率変数\(X\sim N(0, 1)\)、\(Y\sim N(0,1)\)はそれぞれ独立に分布しているとする。\(U=X^2+Y^2\)の確率密度関数を導出する。次の変数変換を考える。

\begin{align}x= wcos\theta,\\y =w\sin\theta,\end{align}

ここに\(w>0\)、\(-\pi\leq \theta <\pi\)この変換のヤコビアンは

\begin{align}\left|\cfrac{\partial(x,y)}{\partial(w,\theta)}\right| &=\begin{vmatrix}\cfrac{\partial x}{\partial w} & \cfrac{\partial x}{\partial \theta}\\\cfrac{\partial y}{\partial w} & \cfrac{\partial y}{\partial \theta}\end{vmatrix}\\&=\begin{vmatrix}\cos\theta & w(-\sin\theta)\\\sin\theta& w\cos\theta\end{vmatrix}\\&= w\cos^2\theta + w\sin^2\theta \\&= w\end{align}

である。また\(X\)と\(Y\)は独立であるので、次のように\(X\)と\(Y\)の同時密度関数は、\(X\)と\(Y\)の確率密度関数の積で表すことができる。

\begin{align}f_{X, Y}(x, y) &= \cfrac{1}{\sqrt{2\pi}}\exp\left(-\cfrac{x^2}{2}\right)\cfrac{1}{\sqrt{2\pi}}\exp\left(-\cfrac{y^2}{2}\right)\\&=\cfrac{1}{2\pi}\exp\left(-\cfrac{x^2+y^2}{2}\right).\end{align}

したがって、\(W\)と\(\Theta\)の同時密度関数は次となる。

\begin{align}f_{W, \Theta}(w, \theta) &= \cfrac{1}{2\pi}\exp\left(-\cfrac{w^2}{2}\right)\mathrm{mod}\left|\cfrac{\partial(x,y)}{\partial(w,v\theta)}\right| \\\label{eq3}&= \cfrac{we^{-\frac{1}{2}w^2}}{2\pi}.\tag{3}\end{align}

また、\eqref{eq3}を\(\theta\)の取りうる範囲で積分することで、次の\(U\)の周辺密度関数を得る。

\begin{align}f_W(w) &= \int_{-\pi}^{\pi} \cfrac{we^{-\frac{w^2}{2}}}{2\pi}.d\theta \\&=we^{-\frac{w^2}{2}}.\end{align}

最後に、\(U=X^2+Y^2\)の確率密度関数を得るために、\(U=W^2\)の変換を行う。この変換のヤコビアンは\(dw/du=(1/2)u^{-\frac{1}{2}}\)であるので、\(U=X^2+Y^2\)の確率密度関数は次となる。

\begin{align}f_u(u) &= u^{\frac{1}{2}}e^{-\frac{u}{2}}\left|\cfrac{dw}{du}\right|\\&=u^{\frac{1}{2}}e^{-\frac{u}{2}}\cfrac{u^{-\frac{1}{2}}}{2}\\\label{eq4}&= \cfrac{1}{2}e^{-\frac{u}{2}}.\tag{4}\end{align}

これは、\(n=2\)のときの\eqref{eq1}の確率密度関数であり、独立な2つの標準正規分布の2乗の和が自由度2のカイ2乗分布に従うことが示された。□

補足として、\eqref{eq4}は指数分布の確率密度関数でもある。自由度2のカイ2乗分布の確率密度関数は指数分布の確率密度関数でもある。

自由度\(n\)のカイ二乗分布の確率密度関数

最後に、これまでの一般化として、自由度\(n\)のカイ2二乗分布の確率密度関数について紹介する。\(X_1, \ldots, X_n;\Pi\sim N(0, 1)\)とし、\(Y=\sum_{i=1}^nX_i^2\)とする。このとき\(Y\)は\eqref{eq1}の確率密度関数をもつ自由度\(n\)のカイ2乗分布に従う。証明については、自由度2のカイ2乗分布の確率密度関数と同様に、\(n\)次元極座標変換を行うことで得られる。詳細な証明は、多変量正規分布の極座標変換を参照されたい。

スポンサーリンク

  • この記事を書いた人
  • 最新記事

usagi-san

統計学とゲームとかをメインに解説していくよ。 数式とかプログラミングコードにミスがあったり質問があったりする場合はコメントで受け付けます。すぐに対応します。

-統計学
-