この記事では、多変量正規分布の特性関数を導出します。
1変量から多変量への自然な一般化が示されます。
特性関数
多変量正規分布の特性関数は密度関数に似た形をもつ。容易に、特性関数からモーメントとキュムラントを求めることが可能となる。
定義1 確率ベクトルの特性関数
この定義から、特性関数を求めるために、まず確率ベクトルを引数にもつ複素関数の期待値を定義する必要がある。
定義2 複素関数の期待値
特に\(e^{i\theta}=\cos\theta+ i\sin\theta\)であるので
\begin{align}\label{eq3}\mathrm{E}[e^{i\boldsymbol{t}^T\boldsymbol{X}}]=\mathrm{E}[\cos\boldsymbol{t}^T\boldsymbol{X}]+i\mathrm{E}[\sin\boldsymbol{t}^T\boldsymbol{X}]\tag{3}\end{align}
である。確率ベクトル\(\boldsymbol{X}\)の特性関数を解くために、次の補題を用いる。
補題1 複素関数の期待値の性質
証明 \(g(\boldsymbol{x})\)が実数をとり、\(\boldsymbol{X}\)が密度関数を持つとき、\(g(\boldsymbol{X})\)の期待値は次となる。
\begin{align}\mathrm{E}\bigl[g(\boldsymbol{X})\bigr]&=\int_{-\infty}^{\infty}\cdots\int_{-\infty}^{\infty}g(\boldsymbol{x})f(\boldsymbol{x})dx_1\cdots dx_p\\&=\int_{-\infty}^{\infty}\cdots\int_{-\infty}^{\infty}g^{(1)}(\boldsymbol{x}^{(1)})g^{(2)}(\boldsymbol{x}^{(2)})f^{(1)}(\boldsymbol{x}^{(1)})f^{(2)}(\boldsymbol{x}^{(2)})dx_1\cdots dx_p\\&=\int_{-\infty}^{\infty}\cdots\int_{-\infty}^{\infty}g^{(1)}(\boldsymbol{x}^{(1)})f^{(1)}(\boldsymbol{x}^{(1)})dx_1\cdots dx_q\\&\ \ \ \ \cdot\int_{-\infty}^{\infty}\cdots\int_{-\infty}^{\infty}g^{(2)}(\boldsymbol{x}^{(2)})f^{(2)}(\boldsymbol{x}^{(2)})dx_{q+1}\cdots dx_p\\\label{eq5}&=\mathrm{E}\bigl[g^{(1)}(\boldsymbol{X}^{(1)})\bigr]\mathrm{E}\bigl[g^{(2)}(\boldsymbol{X}^{(2)})\bigr]\tag{5}\end{align}
\(g(\boldsymbol{x})\)が複素数をとるとき
\begin{align}g(\boldsymbol{x})&=\bigl[g^{(1)}(\boldsymbol{X}^{(1)})+ig_2^{(1)}(\boldsymbol{X}^{(2)})\bigr]\bigl[g^{(2)}(\boldsymbol{X}^{(1)})+ig_2^{(2)}(\boldsymbol{X}^{(2)})\bigr]\\&=g_1^{(1)}(\boldsymbol{X}^{(1)})g_1^{(2)}(\boldsymbol{X}^{(2)})+ig_1^{(1)}(\boldsymbol{X}^{(1)})g_2^{(2)}(\boldsymbol{X}^{(2)})\\&\ \ \ \ +ig_2^{(1)}(\boldsymbol{X}^{(1)})g_1^{(2)}(\boldsymbol{X}^{(2)})-g_2^{(1)}(\boldsymbol{X}^{(1)}g_2^{(2)}(\boldsymbol{X}^{(2)})\\\label{eq6}&=g_1^{(1)}(\boldsymbol{X}^{(1)})g_1^{(2)}(\boldsymbol{X}^{(2)})-g_2^{(1)}(\boldsymbol{X}^{(1)})g_2^{(2)}(\boldsymbol{X}^{(2)})\\&\ \ \ \ +i\bigl[g_2^{(1)}(\boldsymbol{X}^{(1)})g_1^{(2)}(\boldsymbol{X}^{(2)})+g_1^{(1)}(\boldsymbol{X}^{(1)})g_2^{(2)}(\boldsymbol{X}^{(2)})\bigr]\tag{6}\end{align}
である。よって
\begin{align}&\mathrm{E}\bigl[g(\boldsymbol{X})\bigr]\\&=\mathrm{E}\Bigl[g_1^{(1)}(\boldsymbol{X}^{(1)})g_1^{(2)}(\boldsymbol{X}^{(2)})-g_2^{(1)}(\boldsymbol{X}^{(1)})g_2^{(2)}(\boldsymbol{X}^{(2)})\\&\ \ \ \ +i\bigl[g_2^{(1)}(\boldsymbol{X}^{(1)})g_1^{(2)}(\boldsymbol{X}^{(2)})+g_1^{(1)}(\boldsymbol{X}^{(1)})g_2^{(2)}(\boldsymbol{X}^{(2)})\bigr]\Bigr]\\&=\mathrm{E}\bigl[g_1^{(1)}(\boldsymbol{X}^{(1)})\bigr]\mathrm{E}\bigl[g_1^{(2)}(\boldsymbol{X}^{(2)})\bigr]-\mathrm{E}\bigl[g_2^{(1)}(\boldsymbol{X}^{(1)})\bigr]\mathrm{E}\bigl[g_2^{(2)}(\boldsymbol{X}^{(2)})\bigr]\\&\ \ \ \ +i\Bigl[\mathrm{E}\bigl[g_2^{(1)}(\boldsymbol{X}^{(1)})\bigr]\mathrm{E}\bigl[g_1^{(2)}(\boldsymbol{X}^{(2)})\bigr]+\mathrm{E}\bigl[g_1^{(1)}(\boldsymbol{X}^{(1)})\bigr]\mathrm{E}\bigl[g_2^{(2)}(\boldsymbol{X}^{(2)})\bigr]\\&=\Bigl[\mathrm{E}\bigl[g_1^{(1)}(\boldsymbol{X}^{(1)})\bigr]+i\mathrm{E}\bigl[g_2^{(1)}(\boldsymbol{X}^{(1)})\bigr]\Bigr]\Bigl[\mathrm{E}\bigl[g_1^{(2)}(\boldsymbol{X}^{(2)})\bigr]+i\mathrm{E}\bigl[g_2^{(2)}(\boldsymbol{X}^{(2)})\bigr]\Bigr]\\\label{eq7}&=\mathrm{E}\bigl[g^{(1)}(\boldsymbol{X}^{(1)})\bigr]\mathrm{E}\bigl[g^{(2)}(\boldsymbol{X}^{(2)})\bigr].□\tag{7}\end{align}
特性関数を求めるために、\(\boldsymbol{X}\)の要素について、補題1を\(g(\boldsymbol{X})=e^{i\boldsymbol{t}^T\boldsymbol{X}}\)に適用すると、次の補題を得る。
補題2 独立な要素を持つ確率ベクトルの特性関数
証明 補題1より\(g(\boldsymbol{X})=e^{i\boldsymbol{t}^T\boldsymbol{X}}\)とすると、
\(g(\boldsymbol{X})=e^{i\boldsymbol{t}^T\boldsymbol{X}}=e^{it_1X_1}\cdots e^{it_pX_p}=g_1(X_1)\cdots g_p(X_p)\)
が成り立つ。ここに\(g_j(X_j)=e^{it_jX_j}\)とする。\(\boldsymbol{X}\)の要素が独立であることから、
\begin{align}\mathrm{E}[e^{i\boldsymbol{t}^T\boldsymbol{X}}]&=\mathrm{E}[e^{it_1X_1}]\cdots \mathrm{E}[e^{it_pX_p}]\\&=\prod_{j=1}^p\mathrm{E}[e^{it_jX_j}]\end{align}
がいえる。□
この補題を用いて、次の正規分布に従う確率ベクトルの特性関数を示す。
定理1 多変量正規分布の特性関数
証明 正定値行列について#2の系2より、次を満たす正則行列\(\boldsymbol{C}\)が存在する。
\begin{align}\label{eq10}\boldsymbol{C}^T\boldsymbol{\Sigma}^{-1}\boldsymbol{C} = \boldsymbol{I}\tag{10}\end{align}
これを\(\boldsymbol{\Sigma}^{-1}\)について解くと
\begin{align}\label{eq11}\boldsymbol{\Sigma}^{-1}=(\boldsymbol{C}^T)^{-1}\boldsymbol{C}^{-1}=(\boldsymbol{CC}^T)^{-1}.\tag{11}\end{align}
である。また、多変量正規分布の平均ベクトル、共分散行列#1の補題1とその補題2より\(\boldsymbol{Y}\)を
\begin{align}\label{eq12}\boldsymbol{X}-\boldsymbol{\mu}-\boldsymbol{CY}\tag{12}\end{align}
とおくと、\(\boldsymbol{Y}\)は\(N(\boldsymbol{0},\boldsymbol{I})\)に従う。\(\boldsymbol{Y}\)の共分散行列は非対角成分が\(0\)であることから、\(\boldsymbol{Y}\)の各要素は互いに独立である。故に補題2より、\(\boldsymbol{Y}\)の特性関数は次となる。
\begin{align}\label{eq13}\psi(\boldsymbol{u})=\mathrm{E}[e^{i\boldsymbol{u}^T\boldsymbol{Y}}]=\prod_{j=1}^p \mathrm{E}[e^{iu_jY_x}]\tag{13}\end{align}
単変量の標準正規分布の特性関数より、\(\mathrm{E}[e^{it_jY_j}]= e^{-\frac{1}{2}u_j^2}\)であることから\eqref{eq13}は次となる。
\begin{align}\label{eq14}\psi(\boldsymbol{u}=\prod_{j=1}^pe^{-\frac{1}{2}u_j^2}=e^{-\frac{1}{2}\boldsymbol{u}^T\boldsymbol{u}}.\tag{14}\end{align}
したがって、\(\boldsymbol{X}\)の特性関数は
\begin{align}\phi(\boldsymbol{t})&=\mathrm{E}[e^{i\boldsymbol{t}^T\boldsymbol{X}}]=\mathrm{E}[e^{i\boldsymbol{t}^T(\boldsymbol{CY+\boldsymbol{\mu}})}]\\&=e^{i\boldsymbol{t}^T\boldsymbol{\mu}}\mathrm{E}[e^{i\boldsymbol{t}^T\boldsymbol{CY}}]\\\label{eq15}&=e^{i\boldsymbol{t}^T\boldsymbol{\mu}}e^{-\frac{1}{2}(\boldsymbol{t}^T\boldsymbol{C})(\boldsymbol{t}^T\boldsymbol{C})^T}\tag{15}\end{align}
である。\eqref{eq15}の3行目は、\eqref{eq14}において\(\boldsymbol{u}=\boldsymbol{t}^T\boldsymbol{C}\)とおくことで得られる。\eqref{eq11}より
\begin{align}\phi(\boldsymbol{t})&=e^{i\boldsymbol{t}^T\boldsymbol{\mu}}e^{-\frac{1}{2}\boldsymbol{t}^T\boldsymbol{CC}^T\boldsymbol{t}}\\\label{eq16}&=e^{i\boldsymbol{t}^T\boldsymbol{\mu}-\frac{1}{2}\boldsymbol{t}^T\boldsymbol{\Sigma t}}\tag{16}\end{align}
となり、この定理が示された。□