ポアソン検定について解説する。
ポアソン過程に関するデータの平均時間当たりのイベントの発生数の検定であるポアソン検定の手順や検定の例を紹介する。
検定の例では、ポアソン検定のp値の具体的な計算例を紹介する。
また、R言語でポアソン検定を実行したい方は次の記事を参照。
【R言語】ポアソン検定 poisson.testの使い方
R言語でポアソン検定を実行する関数とその実行例を紹介します。 あるイベント数に関するデータがあるときに、イベントの単位時間当たりの発生頻度を検定する際に用いるポアソン検定について見ていきます。 この記 ...
続きを見る
ポアソン検定
ポアソン検定は、ポアソン分布に従う標本に用いる正確検定であり、平均時間当たりのイベントの発生数に関する検定である。
同じ正確検定でありイベントの発生確率に関する検定である二項検定との違いとして、イベントの発生確率が極めて小さく標本数が極めて大きいことがある。標本数が著しく大きい場合、二項検定では計算量が膨大になってしまい、検定を行うことが困難な場合がある。ポアソン検定では、標本数は用いずに、イベントの発生数と観測の開始時間と終了時間から単位時間当たりのイベントの発生数を用いているのが特徴である。
以下、ポアソン検定の手順。
ポアソン検定
\(x\)をパラメータ\(\lambda\)のポアソン分布\(Pois(\lambda)\)からの観測値とする。次の仮説検定を考える。
有意水準\(\alpha\)の仮説検定を行うために、次のポアソン分布の両側確率から計算されるp値を用いる。
ここに
上の集合は、\(x\)に対応する確率変数\(X\)が観測値\(x\)よりも極端な値をとる確率を意味する。
検定の例
ポアソン検定の例を紹介する。
ある市の一日の交通事故件数は10回であったとする。一日あたりの交通事故件数は経験的に5回であるとし、「交通事故件数は一日あたり5回である」という仮説検定をポアソン検定により行う。この仮説は次のように表される。
今、観測値である一日の交通事故件数は10回であり\(10 > 5\)であるので、一日の交通事故件数の確率変数を\(X\)とすると、帰無仮説の下で\(X\)が10回以上となる確率は
また、\(X\)が0回となる確率は
であるので、この検定のp値は次となる。
故に\(p < 0.05\)であるので、有意水準\(\alpha = 0.05\)の下で、帰無仮説\(H_0\)は棄却されて「一日あたりの交通事故件数は5回であるとはいえない」という結論が得られた。
p値の計算の際には次のグラフに示すように、観測値10をとる確率よりも極端な値をとる確率を計算している。
\(k\) | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
\(\mathrm{Pr}\{ X =k \}\) | 0.0181 | 0.0337 | 0.0842 | 0.1404 | 0.1755 | 0.1755 | 0.1462 | 0.1044 | 0.0653 | 0.0363 | 0.0181 | 0.0082 | 0.0034 | 0.0013 | 0.0005 | 0.0002 |