標本平均ベクトル・標本共分散行列の一致性

標本母集団分布が多変量正規分布である場合の標本平均ベクトルと不偏標本共分散行列の性質についてみていく。

ここでは標本平均ベクトルと不偏標本共分散行列の一致性を解説する。

十分性、完備性、有効性については、標本平均ベクトルと不偏標本共分散行列の十分性と完備性と有効性を参照されたい。

一致性

標本平均ベクトルと不偏標本共分散行列の一致性をみていく。単変量のとき、標本平均と不偏標本共分散は一致性をもつことを一致推定量で示した。これらの性質を多変量へと拡張する。

まず、一致推定量の定義を紹介する。

定義1　一致推定量

一致推定量

\(\mathrm{plim}_{n\to \infty} t_{in} = \theta_i,\ i = 1,\ldots, m\)のとき、ベクトル\(\boldsymbol{t}_n = (t_{1n}, \ldots, t_{mn})^T,\ n=1,2, \ldots\)の列は\(\boldsymbol{\theta} = (\theta_1, \ldots, \theta_{m})^T\)の一致推定量である。

上の定義は一致推定量で紹介した単変量の一致推定量を多変量へと拡張したものである。単変量のとき標本平均と不偏分散は一致性を持つことを示したが、多変量のときでも標本平均ベクトルと不偏標本共分散行列は次の一致性をもつ。

定理1　標本平均ベクトルと不偏標本共分散行列の一致性

標本平均ベクトルと不偏標本共分散行列の一致性

\(\boldsymbol{x}_1, \ldots, \boldsymbol{x}_N\)を平均ベクトル\(\boldsymbol{\mu}\)、共分散行列\(\boldsymbol{\Sigma}\)をもつ同一母集団からの大きさ\(N\)の無作為標本とする。このとき標本平均ベクトル\(\bar{\boldsymbol{x}} = (1/N)\sum_{\alpha=1}^N\boldsymbol{x}_{\alpha}\)は平均ベクトル\(\mu\)の一致推定量であり、不偏標本共分散行列\(S = (1/n)\sum_{\alpha=1}^N(\boldsymbol{x}_{\alpha} - \bar{\boldsymbol{x}})(\boldsymbol{x}_{\alpha} - \bar{\boldsymbol{x}})^T\)は共分散行列\(\boldsymbol{\Sigma}\)の一致推定量である。ここに\(n=N-1\)。

証明　対数の法則により、独立同一母集団からの標本\(\boldsymbol{x}_1, \ldots, \boldsymbol{x}_N\)に対し、標本平均ベクトル\(\bar{\boldsymbol{x}}\)は平均ベクトル\(\boldsymbol{\mu}\)の一致推定量である。母集団分布に正規性を仮定しなくてもこの性質は成り立つ。これは次のようにマルコフの不等式を用いて確認できる。一致性を示すために次のマルコフの不等式を用いる。

\begin{align}\label{eq1}\mathrm{Pr}\{ X \geq a \} \leq \cfrac{\mathrm{E}[X]}{a},\tag{1}\end{align}

ここに、\(a > 0\)である。\eqref{eq1}に\(X = (X - \mu)^2\)、\(a = \varepsilon^2\)とおくと、次の不等式が得られる。

\begin{align}&\mathrm{Pr}\{ (X - \mu)^2 \geq \varepsilon^2 \} \leq \cfrac{\mathrm{E}\bigl[(X - \mu)^2\bigr]}{\varepsilon^2}\\\label{eq2} &=\mathrm{Pr}\{ |X - \mu| \geq \varepsilon \} \leq \cfrac{\mathrm{Var}[X]}{\varepsilon^2} \tag{2},\end{align}

ここに、\(\forall \varepsilon >0\)である。標本平均ベクトルの分布より、\(\bar{\boldsymbol{X}}\)の第\(i\)成分の期待値と分散はそれぞれ次である。

\begin{align}\mathrm{E}[\bar{X}_i ]&= \mu_i,\\\mathrm{Var}[\bar{X}_i ] &= \cfrac{1}{N}\sigma_{ii}.\end{align}

\eqref{eq2}の不等式に\(X=\bar{X}_i\)を適用すると、次の不等式が得られる。

\begin{align}\mathrm{Pr}\{ |\bar{X}_i - \mu_i| \geq \varepsilon \} \leq \cfrac{\sigma_{ii} / n}{\varepsilon^2}\end{align}

\(n\to \infty\)のとき、上式は

\begin{align}& \lim_{N\to \infty} \mathrm{Pr}\{ |\bar{X}_i - \mu_i| \geq \varepsilon \} \leq \cfrac{\sigma_{ii} / n}{\varepsilon^2} \\ &= \mathrm{Pr}\{ |\bar{X}_i - \mu_i| \geq \varepsilon \} \leq 0\\ &= \mathrm{Pr}\{ |\bar{X}_i - \mu_i| \geq \varepsilon \} = 0\\ &\Leftrightarrow \mathrm{Pr}\{ |\bar{X}_i - \mu_i| < \varepsilon \} = 1 .\end{align}

故に\(\bar{x}_i\)は\(\mu_i\)の一致推定量である。よって\(\bar{\boldsymbol{x}}\)は\(\boldsymbol{\mu}\)の一致推定量であることが示された。

次に不偏標本共分散行列の一致性について証明する。不偏標本共分散行列は次のように書ける。

\begin{align}\label{eq4} s_{ij} = \cfrac{1}{n}\sum_{\alpha=1}^N(x_{i\alpha} - \mu_i)(x_{j\alpha} - \mu_j) - \cfrac{N}{n}(\bar{x}_i - \mu_i)(\bar{x}_j - \mu_j).\tag{4}\end{align}

\(\mathrm{plim}_{N\to \infty} \bar{x}_i = \mu_i\)より、\eqref{eq4}の第二項の確率極限は\(0\)である。故に、第一項のみマルコフの不等式に適用することを考える。第一項を\(a_ij\)とすると、\(a_{ij}\)の期待値と分散は次となる。

\begin{align}\mathrm{E}[A_{ij}^2] &=\mathrm{E}\left[\cfrac{1}{n}\sum_{\alpha=1}^{N}(x_{i\alpha} - \mu_i)(x_{j\alpha} - \mu_j) \right] \\&=\cfrac{1}{n} \sum_{\alpha=1}^{N} \mathrm{E}[(x_{i\alpha} - \mu_i)(x_{j\alpha} - \mu_j) ] \\&= \cfrac{N}{n} \sigma_{ij},\\ \mathrm{Var}[A_{ij}] &= \mathrm{Var}\left[\cfrac{1}{n}\sum_{\alpha=1}^{N} (x_{i\alpha} - \mu_i)(x_{j\alpha} - \mu_j)\right] \\&= \cfrac{1}{n^2}\sum_{\alpha=1}^{N} \mathrm{Var}[(x_{i\alpha} - \mu_i)(x_{j\alpha} - \mu_j) ] \\&= \cfrac{1}{n^2}\sum_{\alpha=1}^{N}\left[ \mathrm{E}[(x_{i\alpha} - \mu_i)^2(x_{j\alpha} - \mu_j)^2] - \bigl(\mathrm{E}[(x_{i\alpha} - \mu_i)(x_{j\alpha} - \mu_j)]\bigr)^2\right]\\ &= \cfrac{1}{n^2}\sum_{\alpha=1}^{N}\left[ \sigma_{ii}\sigma_{jj} + 2\sigma_{ij}^2- \sigma_{ij}^2\right]\\&=\cfrac{N}{n^2}( \sigma_{ii}\sigma_{jj} + \sigma_{ij}^2). \end{align}

よって、\eqref{eq4}の不等式に\(X = A_{ij}\)を適用すると次を得る。

\begin{align} \mathrm{Pr}\left\{ \left|A_{ij}^2 - \cfrac{N}{n}\sigma_{ij}\right| \geq \varepsilon \right\} \leq \cfrac{(N/n^2)( \sigma_{ii}\sigma_{jj} + \sigma_{ij}^2)}{\varepsilon^2}\end{align}

したがって、\(N\to\infty\)のとき

\begin{align}&\lim_{N\to\infty} \mathrm{Pr}\left\{ \left|A_{ij} - \cfrac{N}{n}\sigma_{ij}\right| \geq \varepsilon \right\} \leq \cfrac{(N/n^2)( \sigma_{ii}\sigma_{jj} + \sigma_{ij}^2)}{\varepsilon^2}\\ &= \mathrm{Pr}\left\{ |A_{ij} - \sigma_{ij}| \geq \varepsilon \right\} \leq 0 \\ &= \mathrm{Pr}\left\{ |A_{ij} - \sigma_{ij}| \geq \varepsilon \right\} = 0.\end{align}

よって\(\mathrm{plim}_{N\to\infty}a_{ij} = \sigma_{ij}\)である。故に

\begin{align}\lim_{N\to\infty}s_{ij} &= \lim_{N\to\infty}\left[\cfrac{1}{n}\sum_{\alpha=1}^N(x_{i\alpha} - \mu_i)(x_{j\alpha} - \mu_j) - \cfrac{N}{n}(\bar{x}_i - \mu_i)(\bar{x}_j - \mu_j) \right]\\ &= \lim_{N\to\infty} a_{ij} + 0\\&= \sigma_{ij}.\end{align}

したがって、\(s_{ij}\)は\(\sigma_{ij}\)の一致推定量であることが示された。不偏標本共分散行列\(\boldsymbol{S}\)は共分散行列\(\boldsymbol{\Sigma}\)の一致推定量である。□

usagi-san

統計学とゲームとかをメインに解説していくよ。数式とかプログラミングコードにミスがあったり質問があったりする場合はコメントで受け付けます。すぐに対応します。

2024/04/28

【R言語】F検定テンプレートスクリプト

2024/04/28

【R言語】経験密度関数・経験分布関数のプロット　関数densityとecdfの使い方

2024/04/10

【R言語】ベータ関数とガンマ関数　関数beta, gammaの使い方

usagi-sanの記事をもっと見る

-多変量正規分布
-多変量正規分布, 多変量解析

aki より:
2022年8月4日 12:38 AM
Var[A_ij]の四行目の等号の第一項目はどのように導出されたのでしょうか．
返信
- usagi-san より:
  2022年8月4日 10:13 PM
  質問ありがとうございます。
  ここに正規性のもとでの1次から4次までのモーメントおよび平均周りのモーメントをまとめています。分散を計算するうえで4次モーメントを計算する必要がありますが、リンク先の記事にあるように微分でゴリ押しで求められます。また、様々な論文や記事でn次モーメントの公式が導出されていたと思います。途中式まみれで汚くなっちゃうので、計算を省いてまし・・・
  返信
  - aki より:
    2022年8月10日 10:37 AM
    お答えいただきありがとうございます．
    標本に対する分布の仮定を見落としていました．一番始めの導入で多変量正規分布と話されていましたね．見落としていました．申し訳ありません．
    返信
    - usagi-san より:
      2022年8月11日 1:25 AM
      いえいえ。わからなかったら全然質問してくださって大丈夫です
      返信
      - aki より:
        2022年8月11日 5:34 AM
        ご親切な対応ありがとうございます．
        面白い記事をたくさん書いてくださっているので，また他の記事も拝読させていただきます．

comment コメントをキャンセル

: 多変量正規分布
重相関係数
ここでは相関係数をより一般化した重相関係数の解説をする。重相関係数 \(\boldsymbol{X}\)を\(\boldsymbol{X}^{(1)}\)\(\boldsymbol{X}^{(2)} ...

: 多変量正規分布
共分散行列の性質と2変量正規分布の確率密度関数
共分散行列の性質 \(\boldsymbol{\Sigma}\)の\(i\)番目の対角成分\(\sigma_{ii}\)は\(\boldsymbol{X}\)の\(i\)番目の要素\(X_i\)の分散 ...

: 多変量正規分布
多変量正規分布の平均ベクトル、共分散行列#1
多変量正規分布のパラメータである平均ベクトル、共分散行列の性質をみていく。平均ベクトルと共分散行列まず次の一般的な確率行列を定義する。定義1　確率行列確率行列\(\boldsymbol{Z}\ ...

: 多変量正規分布
多変量正規分布の特性関数
この記事では、多変量正規分布の特性関数を導出します。 1変量から多変量への自然な一般化が示されます。特性関数多変量正規分布の特性関数は密度関数に似た形をもつ。容易に、特性関数からモーメントとキュム ...

: 多変量正規分布
平均ベクトルの検定とその信頼区間
平均ベクトルの検定とその信頼区間を解説する。この記事では、単変量のときの平均の検定を多変量に拡張していく。また、母集団分布は多変量正規分布とし共分散行列が既知である下で、検定と信頼領域を与える。 ...

【R言語】文字列の操作・正規表現

R言語　確率分布のプロット・乱数の生成　様々な乱数の算出方法

標本平均ベクトル・標本共分散行列の一致性

一致性

定義1 一致推定量

定理1 標本平均ベクトルと不偏標本共分散行列の一致性

定義1　一致推定量

定理1　標本平均ベクトルと不偏標本共分散行列の一致性