統計学

【統計学】母分散の検定 一標本カイ二乗検定

  1. HOME >
  2. 統計学 >

【統計学】母分散の検定 一標本カイ二乗検定

スポンサーリンク

パラメトリックな母分散の検定である一標本カイ二乗検定について解説する。

母分散の検定の検定統計量や棄却域や尤度比に基づいた導出法についてもみていく。

等分散性の検定であるF検定については次の記事を参照されたい。

【統計学】等分散性のF検定・分散の比の検定

2つの母集団の分散の比ついての仮説を検定する際に用いられるF検定を解説する。 F検定の検定統計量の導出や検定統計量がF分布に従うことの証明をしていく。 また、母集団の分散の比を検定しt検定を行う際の検 ...

続きを見る

また、R言語での1標本カイ二乗検定の実行例については次の記事を参照。

【R言語】母分散の検定・一標本カイ二乗検定

R言語で母分散の検定を行う関数やその実行例を紹介していきます。 この記事では、一標本カイ二乗検定(one-sample chi squared test)と呼ばれる母分散の検定をRで行う方法を解説しま ...

続きを見る

母分散の検定

母分散の検定はカイ二乗分布に従う検定統計量を用いるため一標本カイ二乗検定(one-sample chi squared test)とも呼ばれる。

以下、母分散の検定の手順である。

母分散の検定

正規分布\(N(\mu, \sigma^2)\)から大きさ\(n\)の無作為標本\(x_1, x_2, \ldots, x_n\)が得たとする。標本平均と不偏標本分散をそれぞれ\(\bar{x} =n^{-1} \sum_{i=1}^nx_i\)、\(s^2 = (n-1)^{-1}\sum_{i=1}^n(x_i - \bar{x})^2\)で表す。この標本に対応する確率変数をそれぞれ\(X_1, X_2, \ldots, X_n\)としたとき、次の仮説検定を考える。

\begin{align}&H_0:\ \sigma^2 = \sigma_0^2\\ &H_1:\ \sigma^2 \neq \sigma_0^2\end{align}

この仮説検定の検定統計量は次で与えられる。

\begin{align}\label{eq1} V = \cfrac{(n - 1)S^2}{\sigma_0^2} \sim \chi_{n-1}^2,\tag{1} \end{align}

ここに\(S^2\)は次で定義される不偏標本分散の確率変数である。

\begin{align} S^2 &= \cfrac{1}{n-1}\sum_{i= 1}^n (X_i - \bar{X})^2,\\ \bar{X} &= \cfrac{1}{n} \sum_{i=1}^n X_i. \end{align}

また、有意水準\(\alpha\)の棄却域は次で与えられる。

\begin{align} \label{eq2} [0, \chi_{n- 1, 1 - \alpha /2}) \cup (\chi_{n- 1, \alpha/2}), \tag{2} \end{align}

ここに、\(\chi_{n, \alpha}\)は自由度\(n\)のカイ二乗分布の上側\(\alpha\)点である。

\eqref{eq1}の検定統計量がカイ二乗分布に従うことは、標本分散の分布より\((n-1)S^2 / \sigma^2 \sim \chi_{n-1}^2\)\であることより示すことができる。

2標本の等分散性の検定の場合、分母の\(\sigma^2\)を標本から推定する必要があり、検定統計量はF分布となる。

尤度比検定からの検定統計量の導出

次に、尤度比検定により\eqref{eq1}の検定統計量を導出する。\(x_1, \ldots, x_n\)はそれぞれ\(N(\mu, \sigma^2)\)からの独立同一な標本であると仮定する。このとき、母集団分布は次の確率密度関数を持つ。

\begin{align}f(x) = \cfrac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{1}{2\sigma^2}(x-\mu)^2}.\end{align}次の尤度比\(\lambda\)を考える。\begin{align}\lambda = \cfrac{\max_{\mu}L(\mu, \sigma_0^2)}{\max_{\mu, \sigma^2}L(\mu, \sigma^2)},\end{align}

ここに、

\begin{align}L(\mu, \sigma^2) = \prod_{i=1}^n \cfrac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{1}{2\sigma^2}(x_i-\mu)^2} .\end{align}

最尤推定量より、帰無仮説\(H_0\)の下での\(\mu\)の最尤推定量は

\begin{align}\hat{\mu} &= \bar{x}\end{align}であり、対立仮説\(H_1\)の下での\(\mu\)と\(\sigma^2\)の最尤推定量は次で与えられる。\begin{align}\hat{\mu} &= \bar{x},\\ \hat{\sigma}^2 &= \cfrac{1}{n}\sum_{i=1}^n(x_i -\bar{x})^2.\end{align}

よって、\(\lambda\)は次となる。

\begin{align}\lambda &= \cfrac{L(\hat{\mu}, \sigma_0^2)}{L(\hat{\mu} ,\hat{\sigma}^2)} \\&=  \cfrac{\cfrac{1}{(2\pi)^{\frac{n}{2}}} (\sigma_0^2)^{-\frac{n}{2}}e^{-\frac{n}{2 \sigma_0^2} \sum_{i=1}^n(x_i- \bar{x})^2}}{\cfrac{1}{(2\pi)^{\frac{n}{2}}} \left[\cfrac{1}{n}\sum_{i=1}^n (x_i - \bar{x})^2\right]^{-\frac{n}{2}}e^{-\frac{n}{2}\left[\sum_{i=1}^n(x_i - \bar{x})^2\right]^{-1}\sum_{i=1}^n(x_i-\bar{x})^2}}\\ &= \left[\cfrac{\frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2}{\sigma_0^2}\right]^{\frac{n}{2}} e^{-\frac{n}{2}\left\{ \frac{1}{\sigma_0^2} \sum_{i=1}^n(x_i- \bar{x})^2 -1\right\}}.\end{align}

したがって、棄却域として次を用いればよい。

\begin{align}\lambda < \lambda(\varepsilon),\end{align}

ここに、\(\lambda(\varepsilon)\)は上式が確率\(\varepsilon\)で成り立つ定数である。棄却域に関して次が言える。

\begin{align}& \left[\cfrac{\frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2}{\sigma_0^2}\right]^{\frac{n}{2}} e^{-\frac{n}{2}\left\{ \frac{1}{\sigma_0^2} \sum_{i=1}^n(x_i- \bar{x})^2 -1\right\}} < \lambda(\varepsilon)\\ &\Leftrightarrow \left[\cfrac{\frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2}{\sigma_0^2}\right]^{\frac{n}{2}} e^{-\frac{n}{2\sigma_0^2} \sum_{i=1}^n(x_i- \bar{x})^2} < e^{-\frac{n}{2}}\lambda(\varepsilon). \end{align}

上の不等式の左辺を\(V = \frac{1}{\sigma_0^2} \sum_{i=1}^n (x_i - \bar{x})^2\)の関数とすると不等式は次となる。

\begin{align}& (nV)^{\frac{n}{2}} e^{-\frac{n}{2}V} < V(\varepsilon) ,\end{align}

ここに、\(V(\varepsilon) = e^{-\frac{n}{2}}\lambda(\varepsilon)\)。\(V \to 0\)または\(V \to \infty\)のとき\((nV)^{\frac{n}{2}} e^{-\frac{n}{2}V} \to 0\)であることから、上の不等式が確率\(\varepsilon\)で成り立つためには次が成り立てばよい。

\begin{align} V < \chi_1^2(\varepsilon),\quad V > \chi_2^2( \varepsilon). \end{align}

ここに、\(\chi_1^2(\varepsilon )\)と\(\chi_2^2(\varepsilon)\)は、\(\lambda\)に関する不等式が確率\(\varepsilon\)で成り立つような定数である。すなわち、\(\chi_1^2(\varepsilon )\)と\(\chi_2^2(\varepsilon)\)はそれぞれ自由度\(n-1\)のカイ二乗分布の上側\(1 - \varepsilon/2\)点と\(\varepsilon / 2\)点である。\eqref{eq1}の検定統計量と棄却域\eqref{eq2}が導出できた。

スポンサーリンク

  • この記事を書いた人
  • 最新記事

usagi-san

統計学とゲームとかをメインに解説していくよ。 数式とかプログラミングコードにミスがあったり質問があったりする場合はコメントで受け付けます。すぐに対応します。

-統計学
-