楕円型分布

球面分布の確率ベクトル表現

  1. HOME >
  2. 楕円型分布 >

球面分布の確率ベクトル表現

スポンサーリンク

前回の楕円型分布の続きをみていく。

球面分布の確率ベクトル表現

定数\(C(p)\)は\(p\)次元における単位球面の表面積である。\(\sin\Theta_1, \cos\Theta_1\cos\Theta_2, \ldots,\cos\Theta_1\cos\Theta_2\cdots\cos\Theta_{p-1}\)の座標から成る確率ベクトル\(\boldsymbol{U}\)は谷球面上で一様に分布している。ここに\(\Theta_1, \ldots, \Theta_{p-1}\)は、\(\Theta_{p-1}\)が\((-\pi, \pi)\)上で分布しているのを除いて、それぞれ独立に\((-\pi/2, \pi/2)\)上で一様に分布している(これは確率密度をもたない球面分布のもっとも簡単な例)。確率密度関数\(g(\boldsymbol{y}^T\boldsymbol{y})\)をもつ\(\boldsymbol{Y}\)は次の確率ベクトルで表される。

\begin{align}\label{eq1}\boldsymbol{Y}\overset{d}{=}R\boldsymbol{U},\tag{1}\end{align}

ここに\(R\)は、楕円型分布の(7)式の確率密度関数をもつ。

\(\Theta_1,\ldots,\Theta_{p-1}\)のそれぞれの確率密度関数は偶関数であることより、期待値は奇関数の\(\sin \cdot\)と偶関数の積から成る積分となる。奇関数と偶関数の積は奇関数であり、原点を中心に奇関数を積分すると\(0\)となることから、次が成り立つ。

\begin{align}\label{eq2}\mathrm{E}[\boldsymbol{U}]=\boldsymbol{0}.\tag{2}\end{align}

\(R\)と\(\boldsymbol{U}\)は独立であることより、\(\mathrm{E}[R]<\infty\)のとき

\begin{align}\label{eq3}\mathrm{E}[Y]&=\mathrm{E}[R\boldsymbol{U}]\\&=R\mathrm{E}[\boldsymbol{U}]\\&=R\boldsymbol{0}\\&=\boldsymbol{0}\tag{3}\end{align}

さらに、\(\mathrm{E}[R^2]<\infty\)のとき、次を考える。

\begin{align}\mathrm{E}[\boldsymbol{YY}^T]&=\mathrm{E}[R\boldsymbol{U}(R\boldsymbol{U})^T]\\\label{eq4}&=\mathrm{E}[R^2]\mathrm{E}[\boldsymbol{UU}^T].\tag{4}\end{align}

\(\sum_{i=1}^pU_i^2=1\)であるため、

\begin{align}&\mathrm{E}[\sum_{i=1}^pU_i^2]=\mathrm{E}[1]=1\\&\Leftrightarrow \sum_{i=1}^p\mathrm{E}[U_i^2] = 1\\&\Leftrightarrow p\mathrm{E}[U_i^2]=1\\&\Leftrightarrow \mathrm{E}[U_i^2]=\cfrac{1}{p}\end{align}

である。さらに、\(\boldsymbol{Y}\)は原点に関して対称的に分布していることから、の非対角成分は、\(\mathrm{E}[U_1U_2] =\mathrm{E}[U_1U_3] =\cdots=\mathrm{E}[U_{p-1}U_p]\)を満たす。ここで、\(\mathrm{E}[U_1U_2]= \mathrm{E}[\sin\Theta_1\cos\Theta_1\sin\Theta_2]\)は奇関数となり、この期待値は\(0\)である。\(\mathrm{E}[U_iU_j], i\neq j\)に対しても同じことが言えるので、\(\mathrm{E}[U_iU_j]=0, i\neq j\)である。これらの結果を次にまとめる。

\begin{align}\label{eq5}\mathrm{E}[\boldsymbol{UU}^T]=(1/p)\boldsymbol{I}_p.\tag{5}\end{align}

したがって、\eqref{eq4}は次となる。

\begin{align}\label{eq6}\mathrm{E}[\boldsymbol{YY}^T]=(1/p)\mathrm{E}[R^2]\boldsymbol{I}_p.\tag{6}\end{align}

球面分布の大きな特徴は、すべての直交行列\(\boldsymbol{O}\)に対して、\(\boldsymbol{OY}\overset{d}{=}\boldsymbol{Y}\)であることである。

定理1 直交変換に関する不変性

\(\boldsymbol{Y}\)が確率密度関数\(g(\boldsymbol{y}^T\boldsymbol{y})\)をもつとき、\(\boldsymbol{Z} = \boldsymbol{OY}\)は確率密度関数\(g(\boldsymbol{z}^T\boldsymbol{z})\)をもつ。ここに、\(\boldsymbol{O}^T\boldsymbol{O}=\boldsymbol{I}\)である。

証明 \(\boldsymbol{z}=\boldsymbol{O}^T\boldsymbol{y}\)の左側から\(\boldsymbol{O}^T\)を掛けると、\(\boldsymbol{y}=\boldsymbol{O}^T\boldsymbol{z}\)がいえる。

\begin{align}&|\boldsymbol{O}^T\boldsymbol{O}|=|\boldsymbol{I}|\\\Leftrightarrow |\boldsymbol{O}|^2=1\\\Leftrightarrow |\boldsymbol{O}|=1\end{align}

より、この変換のヤコビアンは

\begin{align}\left|\cfrac{\partial \boldsymbol{y}}{\partial \boldsymbol{z}}\right| = |\boldsymbol{O}|\\&=1\end{align}

である。また、\(\boldsymbol{y}^T\boldsymbol{y} = \boldsymbol{y}^T\boldsymbol{O}^T\boldsymbol{O}\boldsymbol{y}=\boldsymbol{z}^T\boldsymbol{z}\)である。したがって、\(\boldsymbol{Z}=\boldsymbol{OY}\)の確率密度関数は次で表される。

\begin{align}g(\boldsymbol{z}^T\boldsymbol{z})\cdot\left|\cfrac{\partial \boldsymbol{y}}{\partial \boldsymbol{z}}\right|&=g(\boldsymbol{z}^T\boldsymbol{z})\cdot1\\&=g(\boldsymbol{z}^T\boldsymbol{z}).□\end{align}

この定理から、\(\boldsymbol{Z}=\boldsymbol{OY}\overset{d}{=}\boldsymbol{Y}\)がいえる。\(\boldsymbol{Y}\)が球面分布であることの定義を、\(\boldsymbol{OY}\overset{d}{=}\boldsymbol{Y}\)の性質をもつ任意の分布であることへ拡張する。

系3 球面分布

\(\boldsymbol{Y}\)が\(\boldsymbol{Y}\overset{d}{=}R\boldsymbol{U}\)により表される球面分布であるとき、\(\boldsymbol{U}\)は球面分布である。ここに、\(R^2=\boldsymbol{Y}^T\boldsymbol{Y}\)とする。

証明 \(\boldsymbol{Z}=\boldsymbol{OY}\)のとき、\(\boldsymbol{Z}=\boldsymbol{OY}\overset{d}{=}\boldsymbol{Y}\)である。さらに、\(\boldsymbol{Z}\)は\(\boldsymbol{Z}\overset{d}{=}S\boldsymbol{V}\)で表される。ここに\(S^2=\boldsymbol{Z}^T\boldsymbol{Z}\)である。よって

\begin{align}\boldsymbol{Z}\overset{d}{=}\boldsymbol{Y}\\&\Leftrightarrow \boldsymbol{Z}^T\boldsymbol{Z}=\boldsymbol{Y}^T\boldsymbol{Y}\\&\Leftrightarrow S^2 = R^2\\&\Leftrightarrow S=R.\end{align}

である。また、次が成り立つ。

\begin{align}\boldsymbol{Z}=\boldsymbol{OY}\\&\Leftrightarrow \boldsymbol{Z}=\boldsymbol{O}R\boldsymbol{U}\\&\Leftrightarrow \boldsymbol{Z}=R\boldsymbol{OU}\\&\Leftrightarrow S\boldsymbol{V}=R\boldsymbol{OU}\\&\Leftrightarrow \boldsymbol{V}=\boldsymbol{OU}.\end{align}

さらに

\begin{align}&\boldsymbol{Z}\overset{d}{=}\boldsymbol{Y} \\&\Leftrightarrow S\boldsymbol{V}\overset{d}{=}R\boldsymbol{U}\\&\Leftrightarrow  \boldsymbol{V}\overset{d}{=}\boldsymbol{U}\end{align}

であることから、\(\boldsymbol{V}=\boldsymbol{OU}\overset{d}{=}\boldsymbol{U}\)である。直交変換に関して不変な任意の分布は球面分布なので、この系が示せた。□

定理3 楕円型分布のモーメント

\(\boldsymbol{X}\)が楕円型分布の(2)式の確率密度関数をもち、\(\mathrm{E}[R^2]<\infty\)であるとき\begin{align}\label{eq7}\mathrm{E}[\boldsymbol{X}]=\boldsymbol{\mu}=\boldsymbol{\nu}, \ \ \mathrm{Var}[\boldsymbol{X}]=\mathrm{E}\bigl[(\boldsymbol{X}-\boldsymbol{\mu})(\boldsymbol{X}-\boldsymbol{\mu})^T\bigr]=\boldsymbol{\Sigma}=(1/p)\mathrm{E}[R^2]\boldsymbol{\Lambda}.\tag{7}\end{align}

証明 \(\boldsymbol{X}=\boldsymbol{\nu}+\boldsymbol{CY}\)について、\(\boldsymbol{X}\)の期待値は

\begin{align}\mathrm{E}[\boldsymbol{X}]&=\mathrm{E}[\boldsymbol{\nu}+\boldsymbol{CY}]\\&=\boldsymbol{\nu}+\boldsymbol{C}\mathrm{E}[\boldsymbol{Y}]\\&=\boldsymbol{\nu}+\boldsymbol{C}\boldsymbol{0}\\&=\boldsymbol{\nu}\end{align}

であり、これを\(\mathrm{E}[\boldsymbol{X}]=\boldsymbol{\mu}=\boldsymbol{\nu}\)とおく。また、\(\boldsymbol{X}\)の共分散行列は

\begin{align}\mathrm{Var}[\boldsymbol{X}]&=\mathrm{E}\bigl[(\boldsymbol{X}-\boldsymbol{\mu})(\boldsymbol{X}-\boldsymbol{\mu})^T\bigr]\\&=\mathrm{E}\Bigl[\bigl((\boldsymbol{\nu+\boldsymbol{CY}})-\boldsymbol{\nu}\bigr)\bigl((\boldsymbol{\nu+\boldsymbol{CY}})-\boldsymbol{\nu}\bigr)^T\Bigr]\\&=\mathrm{E}\bigl[\boldsymbol{CY}(\boldsymbol{CY})^T\bigr]\\&=(1/p)\mathrm{E}[R^2]\boldsymbol{CC}^T.\end{align}

ここで、楕円型分布で仮定したように、\(\boldsymbol{C}^T\boldsymbol{\Lambda}^{-1}\boldsymbol{C}=\boldsymbol{I}\)から、\(\boldsymbol{\Lambda}^{-1}=(\boldsymbol{CC}^T)^{-1}\Leftrightarrow \boldsymbol{\Lambda}=\boldsymbol{CC}^T\)を得る。よって

\begin{align}(1/p)\mathrm{E}[R^2]\boldsymbol{CC}^T=(1/p)\mathrm{E}[R^2]\boldsymbol{\Lambda}.□\end{align}

次に、\(\mathrm{E}[R^m] <\infty\)のとき、\(\boldsymbol{Z}\)は\(N(\boldsymbol{0},\boldsymbol{\Sigma})\)に従い、\(h=h_1+\cdots+h_p\)とすると、\(\boldsymbol{X}\)の\(h\)次モーメントは

\begin{align}\mathrm{E}[(X_1-\mu_1)^{h_1}\cdots(X_p-\mu_p)^{h_p}]=\mathrm{E}[Z_1^{h_1}\cdots Z_p^{h_p}]\mathrm{E}[R^h]/\mathrm{E}[(\chi_p^2)^{\frac{1}{2}h}]\end{align}

であることを示す。

\(\mathrm{E}[(X_1-\mu_1)^{h_1}\cdots(X_p-\mu_p)^{h_p}]\)は次で与えられる。

\begin{align}\mathrm{E}[(X_1-\mu_1)^{h_1}\cdots(X_p-\mu_p)^{h_p}]&=\mathrm{E}\Bigl[\bigl((\nu_1+\boldsymbol{c}_1\boldsymbol{Y})-\boldsymbol{\nu}_1\bigr)^{h_1}\cdots\bigl((\nu_p+\boldsymbol{c}_p\boldsymbol{Y})-\boldsymbol{\nu}_p\bigr)^{h_p}\Bigr]\\&=\mathrm{E}\bigl[(\boldsymbol{c}_1\boldsymbol{Y})^{h_1}\cdots(\boldsymbol{c}_p\boldsymbol{Y})^{h_p}\bigr]\\&=\mathrm{E}[(\boldsymbol{c}_1R\boldsymbol{U})^{h_1}\cdots(\boldsymbol{c}_pR\boldsymbol{U})^{h_p}]\\\label{eq8}&=\mathrm{E}\bigl[S^h(\boldsymbol{c}_1\boldsymbol{U})\cdots(\boldsymbol{c}_p\boldsymbol{U})\bigr]\mathrm{E}[R^h]/\mathrm{E}[S^h],\tag{8}\end{align}

ここに\(\boldsymbol{c}_i, i=1,\ldots,p\)は正則行列\(\boldsymbol{C}\)の\(i\)行目とし、\(S^2 = \boldsymbol{Y}^T\boldsymbol{Y}\)であり、\(\boldsymbol{Y}\)は\(N(\boldsymbol{0}, \boldsymbol{I})\)に従うとする。多変量正規分布の極座標変換より、\(\mathrm{E}[S^h] = \mathrm{E}[(S^2)^{\frac{1}{2}h}] = \mathrm{E}[(\chi_p^2)^{\frac{1}{2}h}]\)である。また、楕円型分布より、確率密度関数\(|\boldsymbol{\Lambda}|^{-\frac{1}{2}}g((\boldsymbol{x}-\boldsymbol{\nu})^T(\boldsymbol{x}-\boldsymbol{\nu}))\)が変化しても、\(\Theta_1, \ldots, \Theta_{p-1}\)の確率密度関数は常に同じであるため、\(S\boldsymbol{U}\)は球面分布に従い、かつ\(S^2\sim \chi_p^2\)であることから、\(S\boldsymbol{U}\sim N(\boldsymbol{0}, \boldsymbol{I})\)である。よって、\(\boldsymbol{C}S\boldsymbol{U}=\boldsymbol{Z}\)とすると、\(\boldsymbol{Z}\sim N(\boldsymbol{0},\boldsymbol{\Sigma})\)なので、\eqref{eq8}は

\begin{align}&\mathrm{E}\bigl[S^h(\boldsymbol{c}_1\boldsymbol{U})\cdots(\boldsymbol{c}_p\boldsymbol{U})\bigr]\mathrm{E}[R^h]/\mathrm{E}[S^h]\\&=\mathrm{E}\bigl[(\boldsymbol{c}_1S\boldsymbol{U})^{h_1}\cdots(\boldsymbol{c}_pS\boldsymbol{U})^{h_p}\bigr]\mathrm{E}[R^h]/\mathrm{E}[(\chi_p^2)^h]\\&= \mathrm{E}[Z_1^{h_1}\cdots Z_p^{h_p}]\mathrm{E}[R^h]/\mathrm{E}[(\chi_p^2)^h].□\end{align}

定理3 不変な関数

\(\boldsymbol{X}\)が楕円型分布の(2)式の確率密度関数をもち、\(\mathrm{E}[R^2]<\infty\)であるとする。すべての\(c>0\)に対して、\(f[c\mathrm{Var}[\boldsymbol{X}]]=f[\mathrm{Var}[\boldsymbol{X}]]\)のとき、\(f[\mathrm{Var}[\boldsymbol{X}]]=f(\boldsymbol{\Sigma})\)である。

特に、\(\rho_{ij}(\boldsymbol{X})=\sigma_{ij}/\sqrt{\sigma_{ii}\sigma_{jj}}=\lambda_{ij}/\sqrt{\lambda_{ii}\lambda_{jj}}\)である。ここに、\(\boldsymbol{\Sigma}=(\sigma_{ij})\)、\(\boldsymbol{\Lambda}=(\lambda_{ij})\)である。相関係数は正の定数倍に関して不変である。

スポンサーリンク

  • この記事を書いた人
  • 最新記事

usagi-san

統計学とゲームとかをメインに解説していくよ。 数式とかプログラミングコードにミスがあったり質問があったりする場合はコメントで受け付けます。すぐに対応します。

-楕円型分布
-, ,