平均ベクトルの検定とその信頼区間

平均ベクトルの検定とその信頼区間を解説する。

この記事では、単変量のときの平均の検定を多変量に拡張していく。

また、母集団分布は多変量正規分布とし共分散行列が既知である下で、検定と信頼領域を与える。

母集団分布が多変量正規分布の下での平均ベクトルの検定についてみていく。

単変量の場合、標本平均と母平均の差\(\bar{X} - \mu\)が\(N(0, \sigma^2/n)\)に従うことから、標準正規分布の表を用いて有意点を得ることができる。一方、多変量正規分布の累積密度を計算することが困難であり、母集団分布の累積密度から有意点を計算することが難しいことが知られている（2変量の場合は表を用いることが可能である）。そのため検定を行う上で、多変量正規分布を単変量の分布に変換することを考える。

多変量正規分布から成る2次形式の分布

多変量正規分布に従う確率ベクトルから成る2次形式の分布に関する以下の定理を用いる。

定理1　カイ2乗分布

カイ2乗分布イント

\(m\)個の要素から成るベクトル\(\boldsymbol{Y}\)が\(N(\boldsymbol{\nu}, \boldsymbol{T})\)に従っているとき、\(\boldsymbol{Y}^T \boldsymbol{T}^{-1}\boldsymbol{Y}\)は自由度\(m\)、非心パラメータ\(\boldsymbol{\nu}^T\boldsymbol{T}^{-1}\boldsymbol{\nu}\)の非心カイ2乗分布に従う。また、\(\boldsymbol{\nu} = \boldsymbol{0} \)のとき中心カイ2乗分布に従う。

証明　\(\boldsymbol{C}\)を\(\boldsymbol{CTC}^T = \boldsymbol{I}\)を満たす正則行列とし、\(\boldsymbol{Z}\)を\(\boldsymbol{Z} = \boldsymbol{CY}\)で定義する。このとき

\begin{align}\mathrm{E}[\boldsymbol{Z}] &=\boldsymbol{\lambda}\\&= \boldsymbol{C\nu},\\ \mathrm{Var}[\boldsymbol{Z}] &= \boldsymbol{CT}\boldsymbol{C}^T\\ &= \boldsymbol{I}\end{align}

であることから、\(\boldsymbol{Z}\)は\(N(\boldsymbol{C\nu}, \boldsymbol{I})\)に従う。よって、

\begin{align}\boldsymbol{Y}^T\boldsymbol{T}^{-1}\boldsymbol{Y}&= (\boldsymbol{C}^{-1}\boldsymbol{Z})^T \boldsymbol{T}^{-1}\boldsymbol{C}^{-1}\boldsymbol{Z}\\&= \boldsymbol{Z}^T (\boldsymbol{C}\boldsymbol{T}^{-1}\boldsymbol{C}^T)^{-1} \boldsymbol{Z}\\&= \boldsymbol{Z}^T\boldsymbol{Z}.\end{align}

これは\(\boldsymbol{Z}\)の要素の2乗和である。同様に、

\begin{align}\boldsymbol{\nu}^T\boldsymbol{T}^{-1}\boldsymbol{\nu} &= (\boldsymbol{C}^{-1}\boldsymbol{\lambda})^T \boldsymbol{T}^{-1}\boldsymbol{C}^{-1}\boldsymbol{\lambda}\\&= \boldsymbol{\lambda}^T\boldsymbol{\lambda} \end{align}

を得る。ここで\(Z_1, \ldots, Z_m\)はそれぞれ独立に平均\(\lambda_1 , \ldots, \lambda_m\)、分散\(1\)の正規分布に従うことから、非心カイ2乗分布の定義より\(\boldsymbol{Y}^T \boldsymbol{T}^{-1}\boldsymbol{Y}\)は自由度\(m\)、非心パラメータ\(\boldsymbol{\nu}^T\boldsymbol{T}^{-1}\boldsymbol{\nu} = \sum_{i=1}^m\lambda_i^2\)のカイ2乗分布に従う。また、\(\lambda_1 = \cdots = \lambda_m = 0\)のとき、この分布は中心カイ2乗分布になる。この証明は多変量正規分布の極座標変換で行っている。□

平均ベクトルの検定・棄却域と信頼領域

共分散行列\(\boldsymbol{\Sigma}\)が与えられたときの平均ベクトルの検定方法についてみていく。平均ベクトルの検定は以下のように行う。

平均ベクトルの検定

\(\boldsymbol{x}_1 , \ldots , \boldsymbol{x}_N\)を\(N(\boldsymbol{\mu}, \boldsymbol{\Sigma})\)からの独立同一な標本とし、共分散行列\(\boldsymbol{\Sigma}\)は既知であるとする。このとき次の平均ベクトルに関する検定を考える。

\begin{align}&H_0:\ \boldsymbol{\mu} = \boldsymbol{\mu}_0,\\ &H_1:\ \boldsymbol{\mu} \neq \boldsymbol{\mu}_0,\end{align}

ここに\(\boldsymbol{\mu}_0\)は定数ベクトルである。この仮説を検定するために、次の検定統計量を用いる。

\begin{align}N(\bar{\boldsymbol{X}} - \boldsymbol{\mu})^T\boldsymbol{\Sigma}^{-1}(\bar{\boldsymbol{X}} - \boldsymbol{\mu}) \sim \chi_p^2, \end{align}

ここに、\(\chi_p^2\)は次の満たす数値である。

\begin{align}\mathrm{Pr}\{\chi_p^2 > \chi_p^2(\alpha)\} = \alpha.\end{align}

また、有意水準\(\alpha\)の棄却域は次で与えられる。

\begin{align}N(\bar{\boldsymbol{x}} - \boldsymbol{\mu}_0)^T\boldsymbol{\Sigma}^{-1}(\bar{\boldsymbol{x}} - \boldsymbol{\mu}_0) > \chi_p^2.\end{align}

また、検定以外にも平均ベクトルの信頼領域もみていく。平均ベクトルの信頼領域は以下のように構成される。

\(\boldsymbol{x}_1 , \ldots , \boldsymbol{x}_N\)を\(N(\boldsymbol{\mu}, \boldsymbol{\Sigma})\)からの独立同一な標本とし、共分散行列\(\boldsymbol{\Sigma}\)は既知であるとする。このとき、信頼度\(1-\alpha\)の平均ベクトル\(\boldsymbol{\mu}\)に対する信頼領域は次で与えられる。

\begin{align}N(\bar{\boldsymbol{x}} - \boldsymbol{\mu})^T\boldsymbol{\Sigma}^{-1}(\bar{\boldsymbol{x}} - \boldsymbol{\mu}) \leq \chi_p^2.\end{align}

平均ベクトルの検定の棄却域と信頼領域の導出については以下に紹介する。

平均ベクトルの検定の棄却域

\(\sqrt{N}(\bar{\boldsymbol{X}} - \boldsymbol{\mu})\)は\(N(\boldsymbol{0}, \boldsymbol{\Sigma})\)に従うことから、定理1を用いると次が成り立つ。

\begin{align}\label{eq1} N(\bar{\boldsymbol{X}} - \boldsymbol{\mu})^T\boldsymbol{\Sigma}^{-1}(\bar{\boldsymbol{X}} - \boldsymbol{\mu}) \sim \chi_p^2. \tag{1} \end{align}

\eqref{eq1}を用いることで、平均ベクトル\(\boldsymbol{\mu}\)に関する検定と信頼区間を構成することが可能である。\(\chi_p^2(\alpha)\)を次を満たす数値とする。

\begin{align}\label{eq2}\mathrm{Pr}\{ \chi_p^2 > \chi_p^2(\alpha)\} = \alpha. \tag{2}\end{align}

\eqref{eq1}と\eqref{eq2}より、

\begin{align} \label{eq3} \mathrm{Pr}\{ N(\bar{\boldsymbol{X}} - \boldsymbol{\mu})^T\boldsymbol{\Sigma}^{-1}(\bar{\boldsymbol{X}} - \boldsymbol{\mu}) > \chi_p^2(\alpha) \} = \alpha. \tag{3} \end{align}

が成り立つ。\(\boldsymbol{\mu} = \boldsymbol{\mu}_0\)の検定をするために、棄却域として次を用いる。

\begin{align}\label{eq4} N(\bar{\boldsymbol{X}} - \boldsymbol{\mu}_0)^T\boldsymbol{\Sigma}^{-1}(\bar{\boldsymbol{X}} - \boldsymbol{\mu}_0) > \chi_p^2(\alpha) \tag{4},\end{align}

ここに、\(\boldsymbol{\mu}_0 \)は定数ベクトルである。\eqref{eq4}を満たすような標本\(\boldsymbol{x}_1, \ldots, \boldsymbol{x}_N\)を得た場合、帰無仮説\(\boldsymbol{\mu} = \boldsymbol{\mu}_0\)を棄却する。\eqref{eq4}が中心\(\boldsymbol{\mu}_0\)の楕円体であるため、\(\boldsymbol{\mu}\)が\(\boldsymbol{\mu}_0\)と離れているとき、\(\bar{\boldsymbol{x}}\)の密度は楕円体の端付近、または外側に集中することが分かる。このことから\(\boldsymbol{\mu}\)が\(\boldsymbol{\mu}_0\)と著しく異なるとき、帰無仮説を棄却する確率は\(\alpha\)より大きいことが直感的にわかる。\(\bar{\boldsymbol{X}}\)が\(N(\boldsymbol{\mu}, \boldsymbol{\Sigma})\)からの\(N\)個の標本平均であるとき、\(N(\bar{\boldsymbol{X}} - \boldsymbol{\mu}_0)^T\boldsymbol{\Sigma}^{-1}(\bar{\boldsymbol{X}} - \boldsymbol{\mu}_0)\)は自由度\(p\)、非心パラメータ\(N(\boldsymbol{\mu} - \boldsymbol{\mu}_0)^T\boldsymbol{\Sigma}^{-1}(\boldsymbol{\mu} - \boldsymbol{\mu}_0)\)の非心カイ2乗分布に従う。

平均ベクトルの信頼領域

次に、標本平均\(\bar{\boldsymbol{x}}\)に関する不等式から平均ベクトルの信頼領域を構成する。次\(\boldsymbol{\mu}^*\)についての不等式を考える。

\begin{align}\label{eq5} N (\bar{\boldsymbol{x}} - \boldsymbol{\mu}^*)^T\boldsymbol{\Sigma}^{-1}(\bar{\boldsymbol{x}} - \boldsymbol{\mu}^*) \leq \chi_p^2.\tag{5}\end{align}

\eqref{eq3}は上の不等式が偽であること同値であることから、\eqref{eq3}の確率より上の不等式が起こる確率は\(1 - \alpha\)であることが分かる。このことから、\eqref{eq5}を満たす\(\boldsymbol{\mu}^*\)の集合は信頼度\(1-\alpha\)の\(\boldsymbol{\mu}\)に対する信頼領域である。

\(\bar{\boldsymbol{x}}\)の\(p\)次元空間において、\eqref{eq4}は\(\boldsymbol{\mu}_0\)を中心とする楕円体の表または外側であり、楕円体の形は\(\boldsymbol{\Sigma}^{-1}\)または\(\boldsymbol{\Sigma}^{-1}\)が与えられたとき\((1/ N) \chi_p^2(\alpha)\)の大きさに依存する。また、\(\boldsymbol{\mu}^*\)の\(p\)次元空間において、\eqref{eq5}は\(\bar{\boldsymbol{x}}\)を中心とする楕円体の表面または内側である。特殊な例として、\(\boldsymbol{\Sigma}^{-1} = \boldsymbol{I}\)のとき、\eqref{eq3}は\(\bar{\boldsymbol{x}}\)と\(\boldsymbol{\mu}\)との距離が\(\sqrt{\chi_p^2 / N}\)より大きい確率は\(\alpha\)となる。これは次の式より明らかである。

\begin{align}& \mathrm{Pr}\{N(\bar{\boldsymbol{X}} - \boldsymbol{\mu}_0)^T\boldsymbol{I}(\bar{\boldsymbol{X}} - \boldsymbol{\mu}_0) > \chi_p^2(\alpha) \} = \alpha \\ & \Leftrightarrow \mathrm{Pr}\{\|\bar{\boldsymbol{X}} - \boldsymbol{\mu}_0)\|^2 > \chi_p^2(\alpha)/N \} = \alpha \\ & \Leftrightarrow \mathrm{Pr}\{\|\bar{\boldsymbol{X}} - \boldsymbol{\mu}_0)\| > \sqrt{\chi_p^2(\alpha) / N} \} = \alpha.\end{align}