統計学

【統計学】2×2分割表に対する独立性の検定と母比率の差の検定

  1. HOME >
  2. 統計学 >

【統計学】2×2分割表に対する独立性の検定と母比率の差の検定

スポンサーリンク

2×2分割表の独立性の検定と母比率の検定の関係について解説する。

2×2分割表に対する独立性の検定が母比率の検定と同値であることとその証明について見ていく。

カイ二乗検定の詳細については以下の記事を参照されたい。

【統計学】カイ二乗検定 適合度検定・独立性の検定

カテゴリカルデータに関する検定の一種であるカイ二乗検定を解説する。 カイ二乗検定の定義を与え、適合度検定、一様性の検定、独立性の検定の検定統計量や棄却域をみていく。 R言語でのカイ二乗検定の実行方法に ...

続きを見る

2×2分割表に対する独立性の検定と母比率の差の検定の関係

2つの属性\(A\)と\(B\)があるとする。\(A\)は2個の互いに排反なクラス\(A_1, A_2\)をもち、\(B\)は2個の互いに排反なクラス\(B_1,B_2\)をもつとする。ある母集団から\(n\)個の標本が得られ、それらはクラス\((A_i, B_j),\ i,j= 1, 2\)に分類されており、\((A_i, B_j)\)に分類された観測度数を

\begin{gather}n_{11} = a, \quad  n_{12} = b,\quad  n_{21} = c, \quad  n_{22} = d \end{gather}

とする。また、観測値が\((A_i, B_j)\)に分類される確率を\(p_{ij}\)とする。属性\(A\)、\(B\)に関する分割表は以下のようになる。

\begin{array}{c|cccc|c}     & B_1 & B_2 & 計 \\\hline A_1 &a   & b & a + b\\  A_2 & c & d   & c + d \\\hline 計 & a + c & b+ d  & n\end{array}.

ここで、次の確率\(p_{ij}, \ i, j = 1 , 2\)に関する仮説を考える。

\begin{align}&H_0:\ p_{ij} = p_{i\cdot}p_{\cdot j},\ \ \ \ i, j = 1, 2 \\ &H_1:\ \mathrm{not}\ H_0\end{align}

ここに、\(p_{i\cdot} = \sum_{j=1}^2p_{ij}\)、\(p_{\cdot j} = \sum_{i=1}^2p_{ij}\)である。

このとき、2×2分割表のときに独立性の検定の検定統計量は次の式で表現することができる。

\begin{align} \label{eq1} X^2 &= \cfrac{n(ad- bc)^2}{(a + b )(c+ d)( a +c )(b +d)} ,\tag{1}\end{align}

2×2分割表のときの独立性の検定については次の記事を参照。

【統計学】2×2分割表に対する独立性の検定の公式

2×2分割表の独立性の検定の公式について紹介する。 2×2分割表に対する独立性の検定の統計量の公式とその導出法について見ていく。 カイ二乗検定については以下の記事を参照されたい。 2×2分割表に対する ...

続きを見る

また、各属性\(A_i,\ i = 1, 2\)についてクラス\(B_{i1}\)に分類する確率が\(p_i\)である独立同一なベルヌーイ分布の確率変数\(X_{i1}, X_{i2}, \ldots, X_{in_{i\cdot}};\ i.i.d.\sim Bernoulli(p_{i})\)とする。次の「2つの群の母比率は等しいか」という仮説検定を考える。\begin{align}&H_0:\ p_1 = p _2\\  &H_1:\ p_1\neq p_2\end{align}この仮説の検定統計量は次で与えられる。

\begin{align}\label{eq2} Z = \cfrac{\hat{p}_1 - \hat{p}_2}{\sqrt{\hat{p}(1 - \hat{p})(1/ n_{1\cdot}+ 1/ n_{2\cdot})}} ,\tag{2}\end{align}

ここに\(n_{1\cdot}= a + b \)、\(n_{2\cdot} =c + d \)、

\begin{align} \hat{p}_i &= \cfrac{1}{n_{i\cdot}} \sum_{j = 1}^{n_{i\cdot}}X_{ij},\quad i = 1, 2, \\ \hat{p} &= \cfrac{1}{n}(n_{1\cdot} \hat{p}_1 + n _{2\cdot} \hat{p}_2).\end{align}

\eqref{eq1}のカイ二乗検定と\eqref{eq2}のZ検定の統計量について次が成り立つ。

2×2の分割表に対する独立性の検定と母比率の差の検定

2×2分割表に対する独立性の検定の検定統計量を\(X^2\)、母比率の検定の検定統計量を\(Z\)とすると次が言える。

\begin{align}X^2 = Z^2.\end{align}

上式は2×2分割表に対する独立性の検定の検定統計量は、母比率の検定の検定統計量の二乗に一致することを意味し、2×2分割表に対する独立性の検定は母比率の検定と同値であることを意味する。

公式の導出法についてはこの後みていく。

証明

\(n_{1\cdot}= a + b \)、\(n_{2\cdot} =c + d \)、\(\sum_{j = 1}^{n_{1\cdot}}X_{1j} = a\)、\(\sum_{j = 1}^{n_{2\cdot}}X_{2j} = c\)より、\eqref{eq2}は次のように書ける。

\begin{align} Z &= \cfrac{\hat{p}_1 - \hat{p}_2}{\sqrt{\hat{p}(1 - \hat{p})(1/ n_{1\cdot}+ 1/ n_{2\cdot})}} \\ &= \cfrac{n_{1\cdot}^{-1}\sum_{j = 1}^{n_{1\cdot}}X_{1j} - n_{2\cdot}^{-1}\sum_{j = 1}^{n_{2\cdot}}X_{2j}}{\sqrt{ n^{-1}(\sum_{j = 1}^{n_{1\cdot}}X_{1j}  +\sum_{j = 1}^{n_{2\cdot}}X_{2j} )\bigl\{1 - n^{-1}(\sum_{j = 1}^{n_{1\cdot}}X_{1j}  + \sum_{j = 1}^{n_{2\cdot}}X_{2j} )\bigr\}(1/ n_{1\cdot}+ 1/ n_{2\cdot})}} \\ &= \cfrac{a / (a + b ) - c /(c + d)}{\sqrt{\bigl\{(a + c) / n \bigr\}\bigl\{(1 - (a + c) / n\bigr\}\bigl\{1/ (a + b)+ 1/ (c + d) \bigr\}}} \\ &= \cfrac{\frac{n\bigl\{a(c + d) - c(a + b)\bigr\} }{(a + b)( c + d )} }{\sqrt{ \frac{n(a + c)(b + d)}{(a + b)(c + d)}}} \\ &= \cfrac{(ad- bc)  }{\sqrt{ (a + b )(c + d)(a + c)(b + d) / n }}. \end{align}

上式の右辺を二乗することで、\(Z^2\)は\eqref{eq1}のカイ二乗統計量に一致することが分かる。

\begin{align}Z^2 &= \left\{\cfrac{(ad- bc)  }{\sqrt{ (a + b )(c + d)(a + c)(b + d) / n }} \right\}^2 \\ &= \cfrac{n(ad- bc)^2  }{ (a + b )(c + d)(a + c)(b + d) }  = X^2.□\end{align}

スポンサーリンク

  • この記事を書いた人
  • 最新記事

usagi-san

統計学とゲームとかをメインに解説していくよ。 数式とかプログラミングコードにミスがあったり質問があったりする場合はコメントで受け付けます。すぐに対応します。

-統計学
-