二項分布の確率質量関数について解説する。
二項分布の確率質量関数の定義を与え、解釈の仕方や二項分布の例についてを紹介する。
また、ベルヌーイ分布との関係についても触れる。
二項分布の期待値と分散や分布関数については次の記事を参照。
離散分布のモーメント【統計学】
ここでは、離散分布に対するモーメントの定義や様々な離散分布のモーメントの導出を行う。 モーメントの定義を行う前に、離散確率変数の期待値や一般化した関数に対する期待値を述べる。 離散分布の期待値 離散確 ...
続きを見る
二項分布の確率質量関数
二項分布の確率質量関数を紹介する。二項分布の確率質量関数は次の通り。
二項分布の確率質量関数
確率変数\(X\)はパラメータ\(n\)、\(p\)の二項分布\(B(n, p)\)に従うとする。\(X\)は次の確率質量関数を持つ。
上に示すように\(p\)を成功する確率とすると、二項分布は\(n\)回の試行中\(k\)回成功する確率として表される。すなわち、成功する確率が\(p\)である\(n\)回のベルヌーイ試行の成功数は二項分布に従うことを意味する。
今、パラメータ\(p\)のベルヌーイ分布に独立同一に従う\(n\)個の確率変数を\(Y_1, Y_2, \ldots, Y_n\)とする。\(Y_1, Y_2, \ldots, Y_n\)のうちいずれかの\(k\)個が\(1\)となる確率を考える。\(n\)個中\(k\)個のインデックスを表す集合を\(A\subseteq \{0, 1, \ldots, n\},\ |A| = k\)とすると、\(Y_1, Y_2, \ldots, Y_n\)はそれぞれ互いに独立なので、\(k\)回成功する確率は次のように表現できる。
また、\(Y_1,Y_2, \ldots, Y_n\)から\(k\)個選ぶ組み合わせは\(_nC_k\)であることから、\(Y_1, Y_2, \ldots, Y_n\)に関する集合\(A\)の組み合わせは\(_nC_k\)ある。したがって、\(n\)個中\(k\)個が成功する確率は次となり、\eqref{eq1}の二項分布の確率質量関数と一致する。
二項係数
より\(k \in \{0, 1, \ldots, n\}\)について和をとると、次のように確率変数が取りうるすべての事象についての和は\(1\)となり、確率質量関数の定義を満たしていることが確認できる。
二項分布の例
コイン投げを例に二項分布について見ていく。表と裏が出る確率が同じであるコインがあるとする。\(10\)回のコイン投げにおける表の数の確率変数は二項分布\(B(10, 1/2)\)に従い、次の確率質量関数を持つ。
このとき、10個のコインを投げた時に表が3回出る確率は次で与えられる。
他の\(k \in \{0, 1, \ldots, 10\}\)についても同様に計算でき、それぞれの確率は次の表となる。
\(k\) | \(P(k)\) |
\(0\) | \(1/1024\) |
\(1\) | \(10/1024\) |
\(2\) | \(45/1024\) |
\(3\) | \(120/1024\) |
\(4\) | \(210/1024\) |
\(5\) | \(252/1024\) |
\(6\) | \(210/1024\) |
\(7\) | \(120/1024\) |
\(8\) | \(45/1024\) |
\(9\) | \(10/1024\) |
\(10\) | \(1/1024\) |
今、表の出る確率が\(1/ 2\)であるため、二項分布の期待値である\(10 \times (1/2) = 5 \)のときの確率が一番大きく、\(0\)回や\(10\)回といった極端な回数になるほど確率は小さくなる。
次にパラメータ\(p\)が\(9 / 10\)であるときを考える。このとき、3回表が出る確率は
であり、\(p = 1/ 2\)であるときの確率より大きくなる。同様に、他の\(k\)について表にまとめると次となる。
\(k\) | \(P(k)\) |
\(0\) | \(1/10^{10}\) |
\(1\) | \(90/10^{10}\) |
\(2\) | \(3645/10^{10}\) |
\(3\) | \(87480/10^{10}\) |
\(4\) | \(137810/10^{10}\) |
\(5\) | \(14,880,348/10^{10}\) |
\(6\) | \(111,602,610/10^{10}\) |
\(7\) | \(573,956,280/10^{10}\) |
\(8\) | \(1,937,102,445/10^{10}\) |
\(9\) | \(3,874,204,890/10^{10}\) |
\(10\) | \(3,486,784,401/10^{10}\) |
\(p=1/2\)のときは、\(5\)を中心に確率質量関数は左右対称であったが、\(p = 9/10\)のときは、左右対称ではなく左に歪んだ分布となている。表が出る確率が大きいため、表の出る数が少ないほど確率は小さくなる。