ポアソン分布の確率質量関数について解説する。
ある時間内でのイベント発生数を表すポアソン分布の確率質量関数の定義やその具体例について見ていく。
また、二項分布や指数分布との関係についても紹介する。
ポアソン分布の確率質量関数
ポアソン分布の確率質量関数は次の通り。
ポアソン分布の確率質量関数
\(X\)をパラメータ\(\lambda\)のポアソン分布\(Pois(\lambda)\)に従う確率変数とする。このとき、\(X\)は次の確率質量関数を持つ。
ポアソン分布の確率質量関数は\(e^{\lambda}\)の原点周りのテイラー展開の\(k\)項目として表される。確率質量関数は\(k \in \{0, 1, 2, \ldots \}\)の無限集合上で定義されるが、次のように\(k \in \{0, 1, 2, \ldots \}\)における和が\(1\)となり、確率質量関数の定義を満たしていることが確認できる。
ポアソン分布は観測度数が非常に大きくイベントの発生確率が非常に小さいときの二項分布としてとらえることができる。観測度数が非常に大きくイベントの発生確率が非常に小さいと気に、二項分布が\eqref{eq1}の確率質量関数をもつことをポアソンの極限定理という。
また、ある時間\([0, t]\)におけるイベントの発生数が単位時間\(t\)あたり\(\lambda\)回のポアソン分布\(Pois(\lambda t)\)に従うとき、時間\(t\)の確率分布\(T\)はパラメータ\(\lambda \)の指数分布\(Exp(\lambda)\)に従うことが知られている。すなわち、最後に発生してから次に発生する時間は指数分布に従うことを意味する。この性質の詳細については、ポアソン分布と指数分布を参照。
具体例
ポアソン分布の確率質量関数の具体例を紹介する。
ある市における一日あたりの事故件数を例に、ポアソン分布がどのようなものなのかみていく。ある市では一日あたり平均\(5\)件事故が発生するとする。このとき、一日あたりの事故件数の確率変数を\(X\)とすると\(X \sim Pois(5)\)である。一日あたりの事故件数はパラメータ\(\lambda = 5\)のポアソン分布に従うことから、一日あたり2件の事故が発生する確率は次のように計算できる。
同様に、他の\(k \in \{0, 1,2, \ldots \}\)についても計算でき、\(k = 10\)までの確率は次の表となる。
\(k\) | \(P(k)\) |
\(0\) | \(0.0067\) |
\(1\) | \(0.0337\) |
\(2\) | \(0.0842\) |
\(3\) | \(0.1404\) |
\(4\) | \(0.1755\) |
\(5\) | \(0.1755\) |
\(6\) | \(0.1462\) |
\(7\) | \(0.1044\) |
\(8\) | \(0.0653\) |
\(9\) | \(0.0363\) |
\(10\) | \(0.0181\) |
また、ポアソン分布の確率質量関数のグラフは次の通り。
\(k = 5\)のときの確率が一番高くなっていることが、一日あたりの平均事故数は\(5\)であることに対応しているのが確認できる。\(k = 5\)から極端な事象になるほど、つまり事故数が\(5\)より少ない、または大きい事象になればなるほどその確率は小さくなる。