統計学

【統計学】標本分散の分布

  1. HOME >
  2. 統計学 >

【統計学】標本分散の分布

スポンサーリンク

標本平均の分布に続き、標本分散の分布をみていく。

ここでは、母集団分布が正規分布であると仮定する。

母集団分布が正規分布の際、標本分散はカイ2乗分布に従うことを示していく。

統計学の基礎を学習したい方へ
¥2,420 (2022/06/08 18:12時点 | Amazon調べ)

標本分散の分布

確率変数\(X1, \ldots, X_n; i.i.d.\sim N(\mu, \sigma^2)\)を考える。次に、確率変数\(X_i,\ i = 1, \ldots, n\)を標準化した統計量\(Z_i=(X_i-\mu)/\sigma\)を考える。このとき、次の統計量\(V\)は、カイ2乗分布の確率密度関数及び連続分布の再生性より自由度\(n\)のカイ2乗分布に従う。\begin{align}V = \sum_{i = 1}^nZ_i^2.\end{align}この結果を以下の定理にまとめる。

定理1 カイ2乗分布

\(X_1, \ldots, X_n; i.i.d. \sim N(\mu, \sigma^2)\)とする。このとき確率変数\(V= \sum_{i = 1}^n(X_i-\mu)^2/\sigma^2\)は自由度\(n\)のカイ2乗分布に従う。

次に、標本分散\(s^2\)を次式で定義する。\begin{align}s^2 = \cfrac{1}{n}\sum_{i=1}^n(x_i - \bar{x})^2.\end{align}標本平均の分布と同様に、標本分散\(s^2\)を確率変数としてみなし、これを

\begin{align}\label{eq1}S^2 = \cfrac{1}{n}\sum_{ i= 1}^n(X_i - \bar{X})^2.\tag{1}\end{align}

このことから、標本分散は正規分布に従う確率変数の2乗和で表現されることが分かる。ここで、\eqref{eq1}を次のように展開する。

\begin{align} \cfrac{1}{n}\sum_{ i= 1}^n(X_i - \bar{X})^2 &= \cfrac{1}{n}\sum_{ i= 1}^n\bigl\{(X_i - \mu)+ (\mu- \bar{X})\bigr\}^2\\&= \cfrac{1}{n}\sum_{ i= 1}^n\bigl\{ (X_i - \mu)^2+ 2(X_i - \mu)(\mu- \bar{X}) + (\mu- \bar{X})^2\bigr\}\\ &= \cfrac{1}{n}\sum_{ i= 1}^n(X_i - \mu)^2+ \cfrac{2}{n}\sum_{i=1}^n(X_i - \mu)(\mu- \bar{X}) + \cfrac{1}{n}\sum_{ i= 1}^n(\mu- \bar{X})^2\\&= \cfrac{1}{n}\sum_{ i= 1}^n(X_i - \mu)^2 + \cfrac{2}{n}n(\bar{X} - \mu)(\mu- \bar{X}) + \cfrac{1}{n}n(\mu- \bar{X})^2\\\label{eq2}&= \cfrac{1}{n}\sum_{ i= 1}^n(X_i - \mu)^2 - (\bar{X} - \mu)^2.\tag{2} \end{align}

次に、\eqref{eq2}の両辺に\(n/\sigma^2\)を掛ける。

\begin{align}\label{eq3} \cfrac{nS^2}{\sigma^2}=  \cfrac{1}{\sigma^2}\sum_{ i= 1}^n(X_i - \mu)^2 - \cfrac{n}{\sigma^2}(\bar{X} - \mu)^2.\tag{3}\end{align}

\eqref{eq3}の右辺の第1項は、定理1より自由度\(n\)のカイ2乗分布に従う。第2項は

\begin{align}\cfrac{n}{\sigma^2}(\bar{X} - \mu)^2 &= \cfrac{(\bar{X} - \mu)^2}{(\sigma/\sqrt{n})^2}\end{align}

であり、\(\bar{X}\sim N(\mu, \sigma^2/n)\)であることから、

\begin{align} \cfrac{(\bar{X} - \mu)^2}{(\sigma/\sqrt{n})^2}\sim \chi_1^2\end{align}

である。したがって、カイ2乗分布の確率密度関数より、独立なカイ2乗分布に従う確率変数の和もカイ2乗分布に従ので、\eqref{eq3}の左辺\(nS^2/\sigma^2\)は自由度\(n-1\)のカイ2乗分布に従う。

この結果を次の定理にまとめる。

定理2 標本分散の分布

\(X_1, \ldots, X_n; i.i.d. \sim N(\mu, \sigma^2)\)とする。このとき標本分散\(S^2 = n^{-1}\sum_{i=1}^n (X_i- \bar{X})^2\)から成る統計量\(nS^2/\sigma^2\)は自由度\(n-1\)のカイ2乗分布に従う。

標本平均と標本分散の独立性

次に、標本平均と標本分散の独立性を示す。母分散が道であるときの母平均の検定の際の検定統計量は標本平均と標本分散から成る。これらの分布を考える際に、標本平均と標本分散の独立性が非常に役立つ。この性質はt分布の確率変数を構成する際に用いられる。

まず、\(n\times n\)直交行列\(\boldsymbol{C}\)に対して、\( Y_i= \sum_{j=1}^nc_{ij}X_j \sim N(\sum_{j=1}^n c_{ij}\mu_j, \sigma^2)\)であり、\(Y_1, \ldots, Y_n\)は互いに独立であることを示す。

\(Y_i, \ i = 1, \ldots, n\)の期待値は

\begin{align}\mathrm{E}[Y_i] &=\mathrm{E}\left[\sum_{j=1}^nc_{ij}X_j \right]\\ &= \sum_{j = 1}^n c_{ij}\mathrm{E}[X_j]\\&= \sum_{j = 1}^n c_{ij}\mu_j\end{align}

である。\(Y_i\)と\(Y_j\)の共分散は

\begin{align}\mathrm{E}\bigl[(Y_i - \mathrm{E}[Y_i])(Y_j - \mathrm{E}[Y_j])\bigr]\\ &= \mathrm{E}\left\{\left[\sum_{k=1}^nc_{ik}(X_k -\mu_k)\right]\left[\sum_{l=1}^nc_{jl}(X_l-\mu_l)\right]\right\} \\ &= \sum_{k, l = 1}^n c_{ik}c_{il}\mathrm{E}\bigl[(X_k-\mu_k)(X_l-\mu_l)\bigr]\\ &= \sum_{k,l = 1}^nc_{ik}c_{jl}\delta_{kl}\sigma^2\\ &= \sum_{k =1}^nc_{ik}c_{jl}\sigma^2\\&= \delta_{ij}\sigma^2.\end{align}

である。ここに、\(\delta_{ij}\)はクロネッカーのデルタである。したがって\(Y_1, \ldots, Y_n; i.i.d. \sim N(\sum_{j=1}^n c_{ij}\mu_j, \sigma^2)\)が示された。

次に、最後の行が次で構成される\(n\times n\)直交行列\(B\)を定義する。

\begin{align}\begin{pmatrix} \cfrac{1}{\sqrt{n}} & \cdots & \cfrac{1}{\sqrt{n}}\end{pmatrix}.\end{align}

この直交行列を用いて統計量\(Z_1, \ldots, Z_n\)を次で定義する。

\begin{align}Z_i = \sum_{j = 1}^nb_{ij} (X_j - \mu).\end{align}

今、標本平均\(\bar{X}\)について次が成り立つ。

\begin{align}Z_n &= \sum_{j = 1}^n b_{nj}(X_j - \mu) \\&= \sum_{j = 1}^n\cfrac{1}{\sqrt{n}}(X_j-\mu)\\ &= \sqrt{n}\left[\cfrac{1}{n}\sum_{j=1}(X_j -\mu)\right]\\&= \sqrt{n}(\bar{X} - \mu).\end{align}

さらに、標本分散\(S^2\)について次が成り立つ。

\begin{align}\cfrac{nS^2}{\sigma^2} &=\cfrac{1}{\sigma^2}\sum_{ i= 1}^n(X_i - \mu)^2 - \cfrac{n}{\sigma^2}(\bar{X} - \mu)^2\\&=\cfrac{1}{\sigma^2}\sum_{j= 1}^nZ_j^2- \cfrac{1}{\sigma^2}Z_n^2 \\&=\cfrac{1}{\sigma^2}\sum_{j= 1}^{n-1}Z_j^2.\end{align}

2行目の第2項は次の直交行列についての関係を用いた。

\begin{align}\sum_{i= 1}^nZ_i^2 &= \sum_{i=1}^n\sum_{j=1}^nb_{ij}(X_j-\mu) \sum_{k=1}^nb_{ik}(X_k-\mu)\\&= \sum_{j,k = 1}^n\left[\sum_{i=1}^n b_{ij}b_{ik}\right](X_j-\mu)(X_k-\mu)\\&= \sum_{j,k=1}^n \delta_{jk}(X_j-\mu)(X_k-\mu)\\&= \sum_{j=1}^n(X_j-\mu)^2.\end{align}

よって、\(\bar{X}\)と\(nS^2/\sigma^2\)がそれぞれ

\begin{align}\bar{X} &= \cfrac{1}{\sqrt{n}}Z_n + \mu,\\ \cfrac{nS^2}{\sigma^2} &=\cfrac{1}{\sigma^2}\sum_{j= 1}^{n-1}Z_j^2\end{align}

で表されることから、標本平均\(\bar{X}\)と標本分散\(S^2\)は独立である。故に次の定理を示せた。

定理3 標本平均と標本分散の独立性

\(X_1, \ldots, X_n; i.i.d. \sim N(\mu, \sigma^2)\)とする。このとき、標本平均\(\bar{X} = n^{-1}\sum_{i=1}^nX_i\)と標本分散\(S^2 = n^{-1}\sum_{i=1}^n(X_i-\bar{X})^2\)は独立である。

スポンサーリンク

  • この記事を書いた人
  • 最新記事

usagi-san

統計学とゲームとかをメインに解説していくよ。 数式とかプログラミングコードにミスがあったり質問があったりする場合はコメントで受け付けます。すぐに対応します。

-統計学
-