統計学

【統計学】二項検定 母比率の検定

  1. HOME >
  2. 統計学 >

【統計学】二項検定 母比率の検定

スポンサーリンク

母比率の検定である二項検定を解説する。

ここでは、小標本の下での正確率検定である二項検定を紹介し、検定の手順を具体れ付きで詳しくみていく。

大標本の下での母比率の検定については以下の記事を参照。

【統計学】母比率の検定・母比率の差の検定

通常の1標本の母比率の検定や2標本の母比率の差の検定を含む様々な母比率の検定を解説する。 ここでは、Z検定を用いた大標本の下で母比率の検定について紹介し、検定統計量や棄却域の導出を行う。 大標本におけ ...

続きを見る

二項検定

二項検定は正確率検定の一種であり、標本母集団分布が二項分布に従うことを利用しその確率関数からp値を計算することで検定を行う。

二項検定の概要は以下のとおりである。

二項検定

\(x_1, \ldots, x_n\)は\(Bernoulli(p)\)からの独立同一な標本とする。また、このとき\(\sum_{i=1}^n x_i\)は\(Bi(n, p)\)からの標本でもある。次の「母比率\(p\)は特定の値\(p_0\)であるか」の仮説を検定する。

\begin{align}&H_0: p= p_0 \\&H_1: p\neq p_0\end{align}

上記の両側検定のp値は次の二項分布の確率関数から計算される。

\begin{align}\label{eq1} \sum_{i \in \mathcal{I}} \begin{pmatrix}n \\ i\end{pmatrix}p^i (1-p)^{n-i},\tag{1}\end{align}

ここに

\begin{align} \mathcal{I} =\{i :\ \mathrm{Pr}(X = i) \leq \mathrm{Pr}(X = k)\} \end{align}

であり\(k=\sum_{i=1}^n x_i\)である。は有意水準を\(\alpha\)とすると上記のp値が\(\alpha\)未満である場合、帰無仮説\(H_0\)を棄却する。

\eqref{eq1}の確率は、二項分布から標本\(k=\sum_{i=1}^n x_i\)が得られる確率及び\(k\)より極端な標本が得られる確率を意味する。

コイン投げを例に二項検定の手順について見ていく。

コインの裏表の事象はパラメータ\(p\)のベルヌーイ分布に従うとし、コイン投げを10回したところ3回表が出たとする。このとき、表が出る確率と裏が出る確率は等しいという次の仮説検定を考える。

\begin{align}& H_0:\ p = 1/ 2\\ &H_1:\ p\neq 1/ 2  \end{align}

今、観測値である表が出た回数は3回であるため、コインの表が出る回数の確率変数を\(X\)とすると、帰無仮説の下で\(X\)が3回以下または7回以上となる確率はそれぞれ

\begin{align}\mathrm{Pr}\{X \leq 3\} &= \sum_{k = 0 }^{3} \begin{pmatrix}10 \\ k \end{pmatrix} \left(\cfrac{1}{2}\right)^{k} \left(1 - \cfrac{1}{2}\right)^{10 - k} \\ &=\left\{ \cfrac{10!}{0! (10 - 0)!} + \cfrac{10!}{1! (10 - 1)!} + \cfrac{10!}{2!(10 - 2)!} + \cfrac{10!}{3!(10 - 3)!}\right\}\left(\cfrac{1}{2}\right)^{10}  \\ &= \cfrac{1+ 10 + 44+ 120}{2^{10}}  \\ &= \cfrac{175}{2^{10}} \approx 0.01709, \\ \mathrm{Pr}\{ X \geq 7\} &= \sum_{k = 7 }^{10} \begin{pmatrix}10 \\ k \end{pmatrix} \left(\cfrac{1}{2}\right)^{k} \left(1 - \cfrac{1}{2}\right)^{10 - k} \\ &=\left\{ \cfrac{10!}{7! (10 - 7)!} + \cfrac{10!}{8! (10 - 8)!} + \cfrac{10!}{9!(10 - 9)!} + \cfrac{10!}{10!(10 - 10)!}\right\}\left(\cfrac{1}{2}\right)^{10}  \\ &= \cfrac{120 + 44 + 10 +1}{2^{10}}  \\ &= \cfrac{175}{2^{10}} \approx 0.01709\end{align}

であるので、この検定のp値は次となる。

\begin{align}p &= \mathrm{Pr}\{X \leq 3 \} + \mathrm{Pr}\{X \geq 7\}\\ &\approx 0.3418. \end{align}

故に\(p \geq 0.05\)であるので、有意水準\(\alpha = 0.05\)の下で、帰無仮説\(H_0\)は棄却されて「コインの表と裏が出る確率は等しい」という結論が得られた。

p値の計算の際には次のグラフに示すように、観測値3をとる確率よりも極端な値をとる確率を計算している。

 
\(k\)012345678910
\(\mathrm{Pr}\{ X =k \}\)0.00100.00980.04390.11720.20510.24610.20510.11720.04390.00980.0010

二項分布の確率

スポンサーリンク

  • この記事を書いた人
  • 最新記事

usagi-san

統計学とゲームとかをメインに解説していくよ。 数式とかプログラミングコードにミスがあったり質問があったりする場合はコメントで受け付けます。すぐに対応します。

-統計学
-

© 2022 ウサギさんの統計学サロン Powered by AFFINGER5