統計学

【統計学】二項分布の確率質量関数 

  1. HOME >
  2. 統計学 >

【統計学】二項分布の確率質量関数 

スポンサーリンク

二項分布の確率質量関数について解説する。

二項分布の確率質量関数の定義を与え、解釈の仕方や二項分布の例についてを紹介する。

また、ベルヌーイ分布との関係についても触れる。

二項分布の期待値と分散や分布関数については次の記事を参照。

離散分布のモーメント【統計学】

ここでは、離散分布に対するモーメントの定義や様々な離散分布のモーメントの導出を行う。 モーメントの定義を行う前に、離散確率変数の期待値や一般化した関数に対する期待値を述べる。 離散分布の期待値 離散確 ...

続きを見る

二項分布の確率質量関数

二項分布の確率質量関数を紹介する。二項分布の確率質量関数は次の通り。

二項分布の確率質量関数

確率変数\(X\)はパラメータ\(n\)、\(p\)の二項分布\(B(n, p)\)に従うとする。\(X\)は次の確率質量関数を持つ。

\begin{align}  P(k)&= \mathrm{Pr}\{X = k \} \\ \label{eq1}&= \begin{pmatrix}n \\k \end{pmatrix} p^k (1- p)^{n -k} , \quad k \in \{0, 1, \ldots, n\}. \tag{1} \end{align}

上に示すように\(p\)を成功する確率とすると、二項分布は\(n\)回の試行中\(k\)回成功する確率として表される。すなわち、成功する確率が\(p\)である\(n\)回のベルヌーイ試行の成功数は二項分布に従うことを意味する。

今、パラメータ\(p\)のベルヌーイ分布に独立同一に従う\(n\)個の確率変数を\(Y_1, Y_2, \ldots, Y_n\)とする。\(Y_1, Y_2, \ldots, Y_n\)のうちいずれかの\(k\)個が\(1\)となる確率を考える。\(n\)個中\(k\)個のインデックスを表す集合を\(A\subseteq \{0, 1, \ldots, n\},\ |A| = k\)とすると、\(Y_1, Y_2, \ldots, Y_n\)はそれぞれ互いに独立なので、\(k\)回成功する確率は次のように表現できる。

\begin{align} \mathrm{Pr}\left\{\bigcap_{i \in A}  Y_i = 1\ \mathrm{and} \bigcap_{i \in B = \overline{A}} Y_i = 0\right\} &= \prod_{i = 1}^k\mathrm{Pr}\{ Y_i = 1\} \cdot \prod_{i = 1}^{n - k}\mathrm{Pr}\{ Y_i = 0\}\\ \label{eq2} &= p^k (1-p)^{n - k} .\tag{2}\end{align}

また、\(Y_1,Y_2, \ldots, Y_n\)から\(k\)個選ぶ組み合わせは\(_nC_k\)であることから、\(Y_1, Y_2, \ldots, Y_n\)に関する集合\(A\)の組み合わせは\(_nC_k\)ある。したがって、\(n\)個中\(k\)個が成功する確率は次となり、\eqref{eq1}の二項分布の確率質量関数と一致する。

\begin{align}\mathrm{Pr} \left\{\sum_{i = 1}^n Y_i = k \right\} &= \begin{pmatrix} n \\ k\end{pmatrix} \mathrm{Pr}\left\{\bigcap_{i \in A}  Y_i = 1\ \mathrm{and} \bigcap_{i \in B = \overline{A}} Y_i = 0\right\} \\ &= \begin{pmatrix} n \\ k\end{pmatrix} p^k (1-p)^{n - k}. \end{align}

二項係数

\begin{align}(x + y)^n = \sum_{k = 0}^n \begin{pmatrix}n\\ k \end{pmatrix} x^k y^{n - k} \end{align}

より\(k \in \{0, 1, \ldots, n\}\)について和をとると、次のように確率変数が取りうるすべての事象についての和は\(1\)となり、確率質量関数の定義を満たしていることが確認できる。

\begin{align}\sum_{k=0}^n \begin{pmatrix} n \\ k\end{pmatrix} p^k (1-p)^{n - k } &= \bigl( p + (1 - p) \bigr\}^n \\ &= 1^n = 1.\end{align}

二項分布の例

コイン投げを例に二項分布について見ていく。表と裏が出る確率が同じであるコインがあるとする。\(10\)回のコイン投げにおける表の数の確率変数は二項分布\(B(10, 1/2)\)に従い、次の確率質量関数を持つ。

\begin{align} P(k) =\begin{pmatrix}10 \\ k \end{pmatrix} \left(\cfrac{1}{2} \right)^k \left( 1 - \cfrac{1}{2} \right)^{10 - k}, \quad k \in \{0, 1, \ldots, 10\}.\end{align}

このとき、10個のコインを投げた時に表が3回出る確率は次で与えられる。

\begin{align} \mathrm{Pr}\{\mathrm{the\ number\ of\ heads} = 3\} &= \begin{pmatrix}10 \\ 3 \end{pmatrix} \left( \cfrac{1}{2}\right)^3 \left(1 - \cfrac{1}{2}\right)^{10 -3 }\\ &= \cfrac{10!}{3!(10 - 3)!} \left( \cfrac{1}{2} \right)^{10}\\ &= \cfrac{15 }{128}.\end{align}

他の\(k \in \{0, 1, \ldots, 10\}\)についても同様に計算でき、それぞれの確率は次の表となる。

二項分布の確率\(n=10,\ p=1/2\)
\(k\)\(P(k)\)
\(0\)\(1/1024\)
\(1\)\(10/1024\)
\(2\)\(45/1024\)
\(3\)\(120/1024\)
\(4\)\(210/1024\)
\(5\)\(252/1024\)
\(6\)\(210/1024\)
\(7\)\(120/1024\)
\(8\)\(45/1024\)
\(9\)\(10/1024\)
\(10\)\(1/1024\)

二項分布p=1/2

今、表の出る確率が\(1/ 2\)であるため、二項分布の期待値である\(10 \times (1/2) = 5 \)のときの確率が一番大きく、\(0\)回や\(10\)回といった極端な回数になるほど確率は小さくなる。

次にパラメータ\(p\)が\(9 / 10\)であるときを考える。このとき、3回表が出る確率は

\begin{align}\mathrm{Pr}\{\mathrm{the\ number\ of\ heads} = 3\} &= \begin{pmatrix}10 \\ 3 \end{pmatrix} \left( \cfrac{9}{10}\right)^3 \left(1 - \cfrac{9}{10}\right)^{10 -3 }\\ &= \cfrac{10!}{3!(10 - 3)!} \cfrac{9^3}{10^{10}} \\ &= \cfrac{ 2187}{ 250,000,000} \approx 0.000008748 \end{align}

であり、\(p = 1/ 2\)であるときの確率より大きくなる。同様に、他の\(k\)について表にまとめると次となる。

二項分布の確率\(n=10,\ p=9/10\)
\(k\)\(P(k)\)
\(0\)\(1/10^{10}\)
\(1\)\(90/10^{10}\)
\(2\)\(3645/10^{10}\)
\(3\)\(87480/10^{10}\)
\(4\)\(137810/10^{10}\)
\(5\)\(14,880,348/10^{10}\)
\(6\)\(111,602,610/10^{10}\)
\(7\)\(573,956,280/10^{10}\)
\(8\)\(1,937,102,445/10^{10}\)
\(9\)\(3,874,204,890/10^{10}\)
\(10\)\(3,486,784,401/10^{10}\)

二項分布p=9/10

\(p=1/2\)のときは、\(5\)を中心に確率質量関数は左右対称であったが、\(p = 9/10\)のときは、左右対称ではなく左に歪んだ分布となている。表が出る確率が大きいため、表の出る数が少ないほど確率は小さくなる。

スポンサーリンク

  • この記事を書いた人
  • 最新記事

usagi-san

統計学とゲームとかをメインに解説していくよ。 数式とかプログラミングコードにミスがあったり質問があったりする場合はコメントで受け付けます。すぐに対応します。

-統計学
-