統計学

【統計学】2×2分割表に対する独立性の検定の公式

  1. HOME >
  2. 統計学 >

【統計学】2×2分割表に対する独立性の検定の公式

スポンサーリンク

2×2分割表の独立性の検定の公式について紹介する。

2×2分割表に対する独立性の検定の統計量の公式とその導出法について見ていく。

カイ二乗検定については以下の記事を参照されたい。

【統計学】カイ二乗検定 適合度検定・独立性の検定

カテゴリカルデータに関する検定の一種であるカイ二乗検定を解説する。 カイ二乗検定の定義を与え、適合度検定、一様性の検定、独立性の検定の検定統計量や棄却域をみていく。 R言語でのカイ二乗検定の実行方法に ...

続きを見る

2×2分割表に対する独立性の検定の公式

2つの属性\(A\)と\(B\)があるとする。\(A\)は2個の互いに排反なクラス\(A_1, A_2\)をもち、\(B\)は2個の互いに排反なクラス\(B_1,B_2\)をもつとする。ある母集団から\(n\)個の標本が得られ、それらはクラス\((A_i, B_j),\ i,j= 1, 2\)に分類されており、\((A_i, B_j)\)に分類された観測度数を

\begin{gather}n_{11} = a, \quad  n_{12} = b,\quad  n_{21} = c, \quad  n_{22} = d \end{gather}

とする。また、観測値が\((A_i, B_j)\)に分類される確率を\(p_{ij}\)とする。属性\(A\)、\(B\)に関する分割表は以下のようになる。

\begin{array}{c|cccc|c}     & B_1 & B_2 & 計 \\\hline A_1 &a   & b & a + b\\  A_2 & c & d   & c + d \\\hline 計 & a + c & b+ d  & n\end{array}.

ここで、次の確率\(p_{ij}, \ i, j = 1 , 2\)に関する仮説を考える。

\begin{align}&H_0:\ p_{ij} = p_{i\cdot}p_{\cdot j},\ \ \ \ i, j = 1, 2 \\ &H_1:\ \mathrm{not}\ H_0\end{align}

ここに、\(p_{i\cdot} = \sum_{j=1}^2p_{ij}\)、\(p_{\cdot j} = \sum_{i=1}^2p_{ij}\)である。

2×2の分割表に対する独立性の検定の公式

このとき、2×2分割表のときに独立性の検定の検定統計量は次の式で表現することができる。

\begin{align} X^2 &= \sum_{i, j = 1}^2\cfrac{\left(n_{ij} - \frac{n_{i\cdot} n_{\cdot j }}{n}\right)^2}{\frac{n_{i\cdot}n_{\cdot j}}{n} } \\\label{eq1} &= \cfrac{n(ad- bc)^2}{(a + b )(c+ d)( a +c )(b +d)} ,\tag{1}\end{align}

ここに、\(n_{i\cdot} = \sum_{j=1}^2n_{ij}\)、\(n_{\cdot j} = \sum_{i=1}^2n_{ij}\)

2×2分割表の4セルの観測度数を上の公式にあてはめることで容易に独立性の検定を行うことがで切ることを意味する。

公式の導出法についてはこの後みていく。

公式の導出

\(n_{1\cdot} = a + b\)、\(n_{2\cdot} = c+ d\)であることから、\eqref{eq1}の左辺を展開すると次のように書ける。

\begin{align}X^2 &= \sum_{i, j = 1}^2\cfrac{\left(n_{ij} - \frac{n_{i\cdot} n_{\cdot j }}{n}\right)^2 }{\frac{n_{i\cdot}n_{\cdot j}}{n} } \\ &= \cfrac{\left( n_{11} - \frac{n_{1\cdot}n_{\cdot1}}{n}\right)^2}{\frac{n_{1\cdot}n_{\cdot1}}{n}} + \cfrac{\left(n_{12} - \frac{n_{1\cdot}n_{\cdot2}}{n}\right)^2}{\frac{n_{1\cdot}n_{\cdot2}}{n}}  + \cfrac{\left(n_{21} - \frac{n_{2\cdot}n_{\cdot1}}{n}\right)^2}{\frac{n_{2\cdot}n_{\cdot1}}{n}}  + \cfrac{\left( n_{22} - \frac{n_{2\cdot}n_{\cdot2}}{n}\right)^2}{\frac{n_{1\cdot}n_{\cdot1}}{n}} \\  &= \cfrac{\bigl\{na - (a + b)(a + c) \bigr\}^2}{n(a + b)(a + c)} + \cfrac{\bigl\{ nb -(a + b)(b + d)\bigr\}^2}{n(a + b)(b + d)}  \\ &\quad + \cfrac{\bigl\{ nc - (c + d)(a + c)\bigr\}^2}{n(c + d)(a + c)}  + \cfrac{\bigl\{ nd - (c + d)(b + d)\bigr\}^2}{n(c + d)(b + d)}\\ &= \cfrac{\bigl\{ a^2 + ab + ac + ad - (a^2 + ac + ab + bc) )\bigr\}^2}{n(a + b)(a + c)} + \cfrac{\bigl\{ (ab + b^2 + bc + bd) -(ab + ad + b^2 + bd)\bigr\}^2}{n(a + b)(b + d)}  \\ &\quad+ \cfrac{\bigl\{ (ac + bc + c^2 + cd) - (ac + c^2 + ad + cd)\bigr\}^2}{n(c + d)(a + c)}  + \cfrac{\bigl\{ (ad + bd + cd + d^2) - (bc + cd + bd + d^2)\bigr\}^2}{n(c + d)(b + d)}\\ &=\cfrac{( ad - bc)^2}{n(a + b)(a + c)} + \cfrac{(bc- ad )^2}{n(a + b)(b + d)} + \cfrac{( bc - ad )^2}{n(c + d)(a + c)}  + \cfrac{ (ad  - bc  )^2}{n(c + d)(b + d)}\\ &= \cfrac{(ad - bc)^2}{n} \left\{ \cfrac{1}{(a + b)(a + c)} + \cfrac{1}{(a + b)(b + d)} + \cfrac{1}{(c + d)(a + c)}  + \cfrac{1}{(c + d)(b + d)}\right\} \\&= \cfrac{(ad - bc)^2}{n} \cfrac{(c + d)(b + d) + (c + d)(a + c) + (a + b)(b + d) + (a + b)(a + c) }{(a + b)(c + d)(a + c)(b + d)} .\end{align}

上式の右辺の中括弧の分子は次のように因数分解できる。

\begin{align} &(c + d)(b + d) + (c + d)(a + c) + (a + b)(b + d) + (a + b)(a + c) \\ &= (c + d)\bigl\{(b + d) + (a + c) \bigr\} + (a + b)\bigl\{(b + d)+ (a + c)\bigr\} \\ &= n (c + d) + n(a + b) \\ &= n\bigl\{(c + d) + (a + b)\bigr\} \\ &= n^2.\end{align}

よって

\begin{align} &\cfrac{(ad - bc)^2}{n} \cfrac{(c + d)(b + d) + (c + d)(a + c) + (a + b)(b + d) + (a + b)(a + c) }{(a + b)(c + d)(a + c)(b + d)}  \\& = \cfrac{(ad - bc)^2}{n} \cfrac{n^2}{(a + b)(c + d)(a + c)(b + d)} \\ &=\cfrac{n(ad - bc)^2}{(a + b)(c + d)(a + c)(b + d)} .\end{align}

\eqref{eq1}が示された。

スポンサーリンク

  • この記事を書いた人
  • 最新記事

usagi-san

統計学とゲームとかをメインに解説していくよ。 数式とかプログラミングコードにミスがあったり質問があったりする場合はコメントで受け付けます。すぐに対応します。

-統計学
-