楕円型分布

楕円型分布

  1. HOME >
  2. 楕円型分布 >

楕円型分布

スポンサーリンク

多変量正規分布などを含む分布のクラスを楕円型分布と呼ぶ。

ここでは、多変量正規分布などの分布の一般化として楕円型分布を解説していく。

球面、楕円型分布

多変量正規分布の幾何学的解釈で平均\(\boldsymbol{\mu}\)、共分散行列\(\boldsymbol{\Sigma}\)の多変量正規分布の確率密度関数は次の同心の楕円体上で一定であることを述べた。

\begin{align}\label{eq1}(\boldsymbol{x}-\boldsymbol{\mu})^T\boldsymbol{\Sigma}^{-1}(\boldsymbol{x}-\boldsymbol{\mu})=k.\tag{1}\end{align}

この特徴を持つ分布のクラスは、次の確率密度関数をもつ楕円型分布族という。

\begin{align}\label{eq2}|\boldsymbol{\Lambda}|^{-\frac{1}{2}}g[(\boldsymbol{x}-\boldsymbol{\nu})^T\boldsymbol{\Lambda}^{-1}(\boldsymbol{x}-\boldsymbol{\nu})],\tag{2}\end{align}

ここに\(\boldsymbol{\Lambda}\)は正定値行列であり、\(g(\cdot)\geq 0\)である。また

\begin{align}\label{eq3}\int_{-\infty}^{\infty}\cdots\int_{-\infty}^{\infty} g(\boldsymbol{y}^T\boldsymbol{y})dy_1\cdots dy_p = 1\tag{3}\end{align}

を満たす。\(\boldsymbol{C}\)が\(\boldsymbol{C}^T\boldsymbol{\Lambda}^{-1}\boldsymbol{C}=\boldsymbol{I}を\)満たす正則行列であるとき、\(\boldsymbol{x}-\boldsymbol{\nu}=\boldsymbol{Cy}\)の変換を行うことで、\eqref{eq2}の確率密度関数は

\begin{align}&|\boldsymbol{\Lambda}|^{-\frac{1}{2}}g[(\boldsymbol{x}-\boldsymbol{\nu})^T\boldsymbol{\Lambda}^{-1}(\boldsymbol{x}-\boldsymbol{\nu})]\\&=|\boldsymbol{CC}^T|^{-\frac{1}{2}}g[(\boldsymbol{Cy})^T(\boldsymbol{C}^T)^{-1}\boldsymbol{C}^{-1}\boldsymbol{Cy}]\cdot\mathrm{mod}\left|\cfrac{\partial\boldsymbol{x}}{\partial\boldsymbol{y}}\right|\\&=|\boldsymbol{C}|^{-1}g[\boldsymbol{y}^T\boldsymbol{C}^T(\boldsymbol{C}^T)^{-1}\boldsymbol{C}^{-1}\boldsymbol{Cy}]\cdot|\boldsymbol{C}|\\&=g(\boldsymbol{y}^T\boldsymbol{y})\end{align}

となる。一定な密度\(g(\boldsymbol{y}^T\boldsymbol{y})\)の外形は原点を中心とした球体である。このような確率密度関数のクラス球面分布という。楕円型分布は必ずしも確率密度関数をもたないが、ここでは統計的推測のために、確率密度関数をもつ分布のみを扱う。

球面分布

球面分布は次の極座標変換を用いて表される。

\begin{align}y_1&=r\sin\theta_1,\\y_2&=r\cos_1\sin\theta_2,\\y_3&=r\cos\theta_1\cos\theta_2\sin\theta_3,\\\vdots&\\ y_{p-1} &=r\cos\theta_1\cos\theta_2\cdots\cos\theta_{p-2}\sin\theta_{p-1},\\\label{eq4}y_p&=r\cos\theta_1\cos\theta_2\cdots\cos\theta_{p-2}\cos\theta_{p-1},\tag{4}\end{align}

ここに\(-\frac{1}{2}\pi < \theta_i \leq \frac{1}{2}\pi, i=1,\ldots,p-2\)、\(-\pi <\theta_{p-1}\leq \pi\)、また\(0\leq r <\infty\)である。このとき\(\boldsymbol{y}^T\boldsymbol{y} = r^2\)が成り立つ。多次元の極座標変換より、\eqref{eq4}のヤコビアンは

\begin{align}\cfrac{\partial(y_1, \ldots, y_p)}{\partial(r, \theta_1, \ldots, \theta_{p-1})} = r^{p-1} \cos^{p-2}\theta_1\cos^{p-3}\theta_2\cdots\cos\theta_{p-2} \end{align}

である。\(g(\boldsymbol{y}^T\boldsymbol{y})\)が\(\boldsymbol{Y}\)の確率密度関数であるとき、\(R, \Theta_1, \ldots, \Theta_{p-1}\)の確率密度関数は

\begin{align}&g(r^2) \mathrm{mod}\left|\cfrac{\partial(y_1, \ldots, y_p)}{\partial(r, \theta_1, \ldots, \theta_{p-1})}\right|\\&=g(r^2)r^{p-1} \cos^{p-2}\theta_1\cos^{p-3}\theta_2\cdots\cos\theta_{p-2}\\\label{eq5}&=r^{p-1}\cos^{p-2}\theta_1\cos^{p-3}\theta_2\cdots\cos\theta_{p-2}g(r^2)\tag{5}\end{align}

となる。後に\eqref{eq12}で示しているように、\(R, \Theta_1, \ldots, \Theta_{p-1}\)は独立に分布している。次の積分

\begin{align}\int_{-\pi/2}^{\pi/2}\cos^{h-1}\theta d\theta =\cfrac{\Gamma(\frac{1}{2}h)\Gamma(\frac{1}{2})}{\Gamma\bigl[\frac{1}{2}(h+1)\bigr]}\end{align}

より、\(R\)の周辺密度関数は次で与えられる。

\begin{align}&\int_{-\pi}^{\pi}\int_{-\pi/2}^{\pi/2}\cdots\int_{-\pi/2}^{\pi/2}r^{p-1}\cos^{p-2}\theta_1\cos^{p-3}\theta_{2}\cdots \cos\theta_{p-2}g(r^2)d\theta_1\cdots d\theta_{p-2}d\theta_{p-1}\\&=\left(\int_{-\pi}^{\pi}\int_{-\pi/2}^{\pi/2}\cdots\int_{-\pi/2}^{\pi/2}r^{p-1}\cos^{p-2}\theta_1\cos^{p-3}\theta_{2}\cdots \cos\theta_{p-2}d\theta_1\cdots d\theta_{p-2}d\theta_{p-1}\right)g(r^2)r^{p-1}\\&=\cfrac{\Gamma\bigl[\frac{1}{2}(p-1)\bigr]\Gamma(\frac{1}{2})}{\Gamma\bigl[\frac{1}{2}(p-1+1)\bigr]}\cfrac{\Gamma\bigl[\frac{1}{2}(p-2)\bigr]\Gamma(\frac{1}{2})}{\Gamma\bigl[\frac{1}{2}(p-2+1)\bigr]}\cdots\cfrac{\Gamma(\frac{2}{2})\Gamma(\frac{1}{2})}{\Gamma\bigl[\frac{1}{2}(2+1)\bigr]}2\pi g(r^2)r^{p-1}\\&=\cfrac{2\pi^{\frac{1}{2}p}}{\Gamma(\frac{1}{2}p)}g(r^2)r^{p-1}\\\label{eq7}&=C(p)g(r^2)r^{p-1},\tag{7}\end{align}

ここに\(C(p)\)は次で与えられる。

\begin{align}c(p)&=\cfrac{2\pi^{\frac{1}{2}p}}{\Gamma(\frac{1}{2}p)}\\\label{eq8}&=\int_{-\pi}^{\pi}\int_{-\pi/2}^{\pi/2}\cdots\int_{-\pi/2}^{\pi/2}\cos^{p-2}\theta_1\cos^{p-3}\theta_2\cdots\cos\theta_{p-2}d\theta_1 \cdots d\theta_{p-2}d\theta_{p-1}.\tag{8}\end{align}

\eqref{eq7}より

\begin{align}\int_{0}^{\infty}g(r^2)r^{p-1}dr = \cfrac{1}{C(p)}\end{align}

がいえる。したがって、\(\Theta_1, \ldots, \Theta_{p-1}\)の同時密度関数は

\begin{align}&\int_{0}^{\infty}\cos^{p-2}\theta_1\cos^{p-3}\theta_2\cdots\cos\theta_{p-2}g(r^2)r^{p-1}dr\\\label{eq9}&=\cfrac{1}{C(p)}\cos^{p-2}\theta_1\cos^{p-3}\theta_2\cdots\cos\theta_{p-2}\tag{9}\end{align}

となる。\(\theta_1, \ldots, \theta_{p-2}\)について\eqref{eq9}を積分することで、\(\Theta_{p-1}\)の周辺密度関数は次となる。

\begin{align}&\int_{-pi/2}^{\pi/2}\cdots\int_{-\pi/2}^{\pi/2}\cfrac{1}{C(p)}\cos^{p-2}\theta_1\cos^{p-3}\theta_2\cdots\cos\theta_{p-2}d\theta_1\cdots d\theta_{p-2}\\&=\cfrac{\Gamma(\frac{1}{2}p)}{2\pi^{\frac{1}{2}p}}\cfrac{\Gamma\bigl[\frac{1}{2}(p-1)\bigr]\Gamma(\frac{1}{2})}{\Gamma\bigl[\frac{1}{2}(p-1+1)\bigr]}\cfrac{\Gamma\bigl[\frac{1}{2}(p-2)\bigr]\Gamma(\frac{1}{2})}{\Gamma\bigl[\frac{1}{2}(p-2+1)\bigr]}\cdots\cfrac{\Gamma(\frac{2}{2})\Gamma(\frac{1}{2})}{\Gamma\bigl[\frac{1}{2}(2+1)\bigr]}{}\\&=\cfrac{\pi^{\frac{1}{2}(p-2)}}{2\pi^{\frac{1}{2}p}}\\\label{eq10}&=\cfrac{1}{2\pi}.\tag{10}\end{align}

また、\(\Theta_1, \ldots, \Theta_{p-1}\)の同時密度関数を\(\theta_{p-1}\)について積分することで、\(\Theta_1, \ldots, \Theta_{p-2}\)の同時分布は

\begin{align}&\int_{-\pi}^{\pi}\cfrac{1}{C(p)}\cos^{p-2}\theta_1\cos^{p-3}\theta_2\cdots\cos\theta_{p-2}d\theta_{p-1}\\&=\cfrac{2\pi}{C(p)}\cos^{p-2}\theta_1\cos^{p-3}\theta_2\cdots\cos\theta_{p-2}\end{align}

である。よって、上の同時密度関数を\(\theta_1, \ldots_{i-1}, \theta_{i+1},\ldots, \theta_{p-2} \)について積分することで、\(\Theta_i\)の周辺密度関数は次で与えられる。

\begin{align}&\int_{-\pi/2}^{\pi/2}\cdots\int_{-\pi/2}^{\pi/2}\int_{-\pi/2}^{\pi/2}\cdots\int_{-\pi/2}^{\pi/2}\cfrac{2\pi}{C(p)}\cos^{p-2}\theta_1\cos^{p-3}\theta_2\cdots\cos\theta_{p-2}d\theta_1\cdots d\theta_{i-1}d\theta_{i+1}d\theta_{p-2}\\&=\cfrac{2\pi}{C(p)} \cfrac{\Gamma\bigl[\frac{1}{2}(p-1)\bigr]\Gamma(\frac{1}{2})}{\Gamma\bigl[\frac{1}{2}(p-1+1)\bigr]}\cdots\cfrac{\Gamma\bigl[\frac{1}{2}(p-i+2)\bigr]\Gamma(\frac{1}{2})}{\Gamma\bigl[\frac{1}{2}(p-i-2+1)\bigr]}\cfrac{\Gamma\bigl[\frac{1}{2}(p-i+1)\bigr]\Gamma(\frac{1}{2})}{\Gamma\bigl[\frac{1}{2}(p-i+1+1)\bigr]}\\&\ \ \ \ \cdot\cfrac{\Gamma\bigl[\frac{1}{2}(p-i-1)\bigr]\Gamma(\frac{1}{2})}{\Gamma\bigl[\frac{1}{2}(p-i-1+1)\bigr]}\cfrac{\Gamma\bigl[\frac{1}{2}(p-i-2)\bigr]\Gamma(\frac{1}{2})}{\Gamma\bigl[\frac{1}{2}(p-i-2+1)\bigr]}\cdots\cfrac{\Gamma(\frac{2}{2})\Gamma(\frac{1}{2})}{\Gamma\bigl[\frac{1}{2}(2+1)\bigr]}\cos^{p-i-1}\theta_i\\&=\cfrac{\Gamma(\frac{1}{2}p)}{\pi^{\frac{1}{2}(p-2)}}\cfrac{\Gamma\bigl[\frac{1}{2}(p-i+1)\bigr]\pi^{\frac{1}{2}(p-3)}}{\Gamma\bigl[\frac{1}{2}(p-i)\bigr]}\cos^{p-i-1}\theta_i\\\label{eq11}&=\cfrac{\Gamma\bigl[\frac{1}{2}(p-i+1)\bigr]\cos^{p-i-1}\theta_i}{\Gamma(\frac{1}{2})\Gamma\bigl[\frac{1}{2}(p-i)\bigr]}.\tag{11}\end{align}

\(R\)の周辺密度関数\eqref{eq7}、\(\Theta_{p-1}\)の周辺密度関数\eqref{eq10}、\(\Theta_i\)の周辺密度関数\eqref{eq11}をそれぞれ\(g_{R}(r)\)、\(g_{\Theta_i}(\theta_i), i=1, \ldots, p-1\)で表記する。このとき、\(R, \Theta_1,\ldots, \Theta_{p-1}\)の周辺密度関数の積は

\begin{align}&g_{R}(r)g_{\Theta_1}(\theta_1)\cdots g_{\Theta_{p-1}}(\theta_{p-1})\\&=C(p)g(r^2)r^{p-1}\cfrac{\Gamma(\frac{1}{2}p)\cos^{p-2}\theta_1}{\Gamma(\frac{1}{2})\Gamma\bigl[\frac{1}{2}(p-1)\bigr]}\cfrac{\Gamma\bigl[\frac{1}{2}(p-1)\bigr]\cos^{p-3}\theta_2}{\Gamma(\frac{1}{2})\Gamma\bigl[\frac{1}{2}(p-2)\bigr]}\cdots\cfrac{\frac{3}{2}\cos\theta_{p-2}}{\Gamma(\frac{1}{2})\Gamma(\frac{2}{2})}\cfrac{1}{2\pi}\\&=r^{p-1}\cfrac{\Gamma(\frac{1}{2}p)}{2\pi^{\frac{1}{2}(p-2)}}C(p)\cos^{p-2}\theta_1\cos^{p-3}\theta_2\cdots\cos\theta_{p-2}g(r^2)\\&=r^{p-1}\cfrac{1}{C(p)}C(p)\cos^{p-2}\theta_1\cos^{p-3}\theta_2\cdots\cos\theta_{p-2}g(r^2)\\\label{eq12}&=r^{p-1}\cos^{p-2}\theta_1\cos^{p-3}\theta_2 \cdots\cos\theta_{p-2}g(r^2)\tag{12}\end{align}

となり、この右辺は\(R, \Theta_1, \ldots, \Theta_{p-1}\)の同時密度関数である。したがって、\(R, \Theta_1,\ldots, \Theta_{p-1}\)はそれぞれ互いに独立である。

\(N(\boldsymbol{0},\boldsymbol{I})\)の正規分布の場合、\(\boldsymbol{Y}\)の確率密度関数は\begin{align}g(\boldsymbol{y}^T\boldsymbol{y}) = (2\pi)^{-\frac{1}{2}p}\exp\left(-\tfrac{1}{2}\boldsymbol{y}^T\boldsymbol{y}\right)\end{align}である。多変量正規分布の極座標変換の系1より、\(R=(\boldsymbol{Y}^T\boldsymbol{Y})^{\frac{1}{2}}\)の確率密度関数は\(r^{p-1}\exp(-\frac{1}{2}r^2)/[2^{\frac{1}{2}(p-1))}\Gamma(\frac{1}{2}p)]\)であり、\(r^2=v\)の確率密度関数は\(v^{\frac{1}{2}}e^{-\frac{1}{2}v}/[2^{\frac{1}{2}p}\Gamma(\frac{1}{2}p)]\)である。これは自由度\(p\)のカイ2乗分布の確率密度関数である。

スポンサーリンク

  • この記事を書いた人
  • 最新記事

usagi-san

統計学とゲームとかをメインに解説していくよ。 数式とかプログラミングコードにミスがあったり質問があったりする場合はコメントで受け付けます。すぐに対応します。

-楕円型分布
-, ,