前回の連続分布の再生性に続いて、様々な離散分布の再生性を示す。
確率分布の再生性の定義については、連続分布の再生性を参照されたい。
代表的な離散分布である二項分布や負の二項分布、ポアソン分布の再生性を示していく。
二項分布
二項分布の再生性を示す。独立な確率変数\(X_1\sim B(m, p),\ X_2\sim B(n,p)\)について、\(X_1+X_2\)が再び二項分布に従うことを示す。
確率関数を用いた導出
確率変数\(X_1\)と\(X_2\)はそれぞれ次の確率関数をもつ。
\begin{align}\mathrm{Pr}\{X_1 = k\} &= \begin{pmatrix}m\\k\end{pmatrix}p^k(1-p)^{m-k},\ \ k = 0,1,2\ldots, m\\ \mathrm{Pr}\{X_2 = k\} &=\begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k},\ \ k = 0,1,2\ldots, n.\end{align}
確率関数の定義より、\(U = X_1+X_2\)の確率関数は次のように書ける。
\begin{align}\mathrm{Pr}\{U = k\} &= \mathrm{Pr}\{X_1+X_2 = k\}\\&=\sum_{i=0}^k\mathrm{Pr}\{X_1 = i, X_2 = k-i\}\\&= \sum_{i=0}^k\mathrm{Pr}\{X_1 = i\}\mathrm{Pr}\{X_2 = k-i\}\\&= \sum_{i=0}^k\begin{pmatrix}m\\i\end{pmatrix}p^m(1-p)^{m-i}\begin{pmatrix}n\\k-i\end{pmatrix} p^n(1-p)^{n-(k-i)}\\&=\sum_{i=0}^k\cfrac{m!}{i!(m-i)!}\cfrac{n!}{(k-i)!(n-k+i)!}\begin{pmatrix}m\\i\end{pmatrix}\begin{pmatrix}n\\k-i\end{pmatrix} p^{m+n}(1-p)^{m+n-k}\label{eq1}\\&= \cfrac{m+n}{k}p^{m+n}(1-p)^{m+n-k}.\tag{1}\end{align}
最後の等式は次の朱ファンでルモンドの等式より成り立つ。
\begin{align}\label{eq2}\sum_{i=0}^k\begin{pmatrix}m\\i\end{pmatrix}\begin{pmatrix}n-m\\k-i\end{pmatrix} = \begin{pmatrix}n\\k.\end{pmatrix}\tag{2}\end{align}
したがって、\(U=X_1+X_2\sim B(m+n, p)\)であることが示された。よって、パラメータ\(p\)が同じ場合、二項分布は再生性をもつ。
特性関数を用いた導出
特性関数を用いた二項分布の再生性の証明を行う。
確率変数\(X_1\sim B(m, p)\)と\(X_2\sim B(n, p)\)の特性関数はそれぞれ次で与えられる。
\begin{align}\phi_{X_1}(t) &= (1-p+pe^{it})^m,\\ \phi_{X_2}(t) &= (1-p+pe^{it})^n.\end{align}また、特性関数の定義より、\(U=X_1+X_2\)の特性関数は次で表現される
\begin{align}\phi_U(t) &= \mathrm{E}[e^{itu}]\\&=\mathrm{E}[e^{it(X_1+X_2)}]\\&= \mathrm{E}[e^{itX_1}]\mathrm{E}[e^{itX_2}]\\&= (1-p+pe^{it})^m(1-p+pe^{it})^n\\\label{eq3}&= (1-p+pe^{it})^{m+n}.\tag{3}\end{align}
3行目の等式は、確率変数\(X_1\)と\(X_2\)が独立であることよりいえる。\eqref{eq2}はパラメータ\(m+n\)、\(p\)の二項分布の確率関数である。よって二項分布の再生性が示された。
負の二項分布
確率関数を用いた導出
負の二項分布の再生性を示す。二項分布と同様に、独立な確率変数\(X_1\sim NB(\alpha_1, p),\ X_2\sim NB(\alpha_2,p)\)について、\(X_1+X_2\)が再び負の二項分布に従うことを示す。
確率変数\(X_1\)と\(X_2\)はそれぞれ次の確率関数を持つ。
\begin{align}\mathrm{Pr}\{X_1 = k\} &=\begin{pmatrix}k+\alpha_1-1\\k\end{pmatrix}(1-p)^{\alpha_1}p^k ,\\ \mathrm{Pr}\{X_2 = k\} &= \begin{pmatrix}k+\alpha_2-1\\k\end{pmatrix}(1-p)^{\alpha_2}p^k.\end{align}
確率関数の定義より、\(U = X_1+X_2\)の確率関数は次のように書ける。
\begin{align}\mathrm{Pr}\{U = k\} &= \sum_{i=0}^k\mathrm{Pr}\{X_1 = i\}\mathrm{Pr}\{X_2 = k-i\}\\&= \sum_{i=0}^k\begin{pmatrix}i+\alpha_1 -1 \\i\end{pmatrix}(1-p)^{\alpha_1}p^i\begin{pmatrix}k-i+\alpha_2 -1 \\k-i\end{pmatrix}(1-p)^{\alpha_2}p^{k-i}\\&=p^k(1-p)^{\alpha_1+\alpha_2} \sum_{i=0}^k\begin{pmatrix}i+\alpha_1 -1 \\i\end{pmatrix}\begin{pmatrix}k-i+\alpha_2 -1 \\k-i\end{pmatrix}\\&=p^k(1-p)^{\alpha_1+\alpha_2} \sum_{i=0}^k (-1)^{i}\begin{pmatrix}-\alpha_1\\i\end{pmatrix}(-1)^{k-i}\begin{pmatrix}-\alpha_2\\ k-i\end{pmatrix}\\&= p^k(1-p)^{\alpha_1+\alpha_2} \sum_{i=0}^k (-1)^{k}\begin{pmatrix}-\alpha_1\\i\end{pmatrix}\begin{pmatrix}-\alpha_2\\ k-i\end{pmatrix}\end{align}
ここで、\eqref{eq2}を用いると上式は、さらに次のように表される。
\begin{align}& p^k(1-p)^{\alpha_1+\alpha_2} \sum_{i=0}^k (-1)^{k}\begin{pmatrix}-\alpha_1\\i\end{pmatrix}\begin{pmatrix}-\alpha_2\\ k-i\end{pmatrix}\\&= p^k(1-p)^{\alpha_1+\alpha_2} (-1)^{k}\begin{pmatrix}-(\alpha_1+\alpha_2)\\ k\end{pmatrix}\\&=p^k(1-p)^{\alpha_1+\alpha_2}\begin{pmatrix}k + (\alpha_1+\alpha_2) -1\\ k\end{pmatrix}\\\label{eq4}&=\begin{pmatrix}k + (\alpha_1+\alpha_2) -1\\ k\end{pmatrix} (1-p)^{\alpha_1+\alpha_2}p^k.\tag{4}\end{align}
\eqref{eq4}はパラメータ\(\alpha_1 + \alpha_2\)、\(p\)の負の二項分布の確率関数である。したがって、\(X_1+ X_2 \sim NB(\alpha_1 + \alpha_2, p)\)であり、\(p\)が同じである場合、負の二項分布は再生性を持つことが証明された。
特性関数を用いた導出
特性関数を用いて、負の二項分布の再生性を示す。
確率変数\(X_1\)と\(X_2\)はそれぞれ次の特性関数を持つ。
\begin{align}\phi_{X_1}(t) &= \left(\cfrac{1-p}{1-pe^{it}}\right)^{\alpha_1},\\\phi_{X_2}(t) &= \left(\cfrac{1-p}{1-pe^{it}}\right)^{\alpha_2},\end{align}
また、特性関数の定義より、\(U=X_1+X_2\)の特性関数は次で表現される
\begin{align}\phi_U(t) &= \mathrm{E}[e^{itu}]\\&= \mathrm{E}[e^{itX_1}]\mathrm{E}[e^{itX_2}]\\&= \left(\cfrac{1-p}{1-pe^{it}}\right)^{\alpha_1}\left(\cfrac{1-p}{1-pe^{it}}\right)^{\alpha_2}\\&=\left(\cfrac{1-p}{1-pe^{it}}\right)^{\alpha_1+\alpha_2} \end{align}
これは、パラメータ\(\alpha_1+\alpha_2\)、\(p\)の負の二項分布の確率関数である。したがって\(X_1 + X_2\sim NB(\alpha_1 + \alpha_2, p)\)であり、負の二項分布の再生性が示された。
ポアソン分布
ポアソン分布の再生性を示す。独立な確率変数\(X_1\sim Po(\lambda_1),\ X_2\sim Po(\lambda_2)\)について、\(X_1+X_2\)が再びポアソン分布に従うことを示す。
確率関数を用いた導出
確率変数\(X_1\)と\(X_2\)はそれぞれ次の確率関数を持つ。
\begin{align}\mathrm{Pr}\{X_1 = k\} &= \cfrac{\lambda_1^ke^{-\lambda_1}}{k!}\\ \mathrm{Pr}\{X_2 = k\} &= \cfrac{\lambda_2^k e^{-\lambda_2}}{k!}.\end{align}
また、確率関数の定義より、\(U = X_1+X_2\)の確率関数は次のように書ける。
\begin{align}\mathrm{Pr}\{U = k\} &= \sum_{i=0}^k\mathrm{Pr}\{X_1 = i\}\mathrm{Pr}\{X_2 = k-i\}\\&= \sum_{i=0}^k \cfrac{\lambda_1^ie^{-\lambda_1}}{i!}\cfrac{\lambda_2^{k-i} e^{-\lambda_2}}{(k-i)!}\\&= e^{-(\lambda_1+\lambda_2)}\cfrac{1}{k!}\sum_{i=0}^k\cfrac{k!}{i!(k-i)!} \lambda_1^i\lambda_2^{k-i}\\&=e^{-(\lambda_1+\lambda_2)}\cfrac{1}{k!}\sum_{i=0}^k\begin{pmatrix}k\\i\end{pmatrix} \lambda_1^i\lambda_2^{k-i}\\&= e^{-(\lambda_1+\lambda_2)}\cfrac{1}{k!}(\lambda_1+\lambda_2)^k\\\label{eq5}&=\cfrac{(\lambda_1+\lambda_2)^ke^{-(\lambda_1+\lambda_2)}}{k!}.\tag{5} \end{align}
5行目の等式は、自然数\(n\)及び\(k = 0, 1, \ldots, n\)に対する次の二項係数を用いた。
\begin{align}(x +y)^n= \sum_{k=0}^n x^ky^{n-k}.\end{align}
\eqref{eq5}はパラメータ\(\lambda_1+\lambda_2\)のポアソン分布の確率関数である。よって、\(X_1 + X_2\sim Po(\lambda_1 + \lambda_2)\)であり、ポアソン分布の再生性が示された。
特性関数を用いた導出
特性関数を用いてポアソン分布の再生性を示す。
確率変数\(X_1\)と\(X_2\)の特性関数はそれぞれ次で与えれる。
\begin{align}\phi_{X_1}(t) &=\exp\bigl\{\lambda_1(e^t-1)\bigr\}, \\\phi_{X_2}(t) &= \exp\bigl\{\lambda_2(e^t-1)\bigr\}.\end{align}
また、特性関数の定義より、\(U=X_1+X_2\)の特性関数は次で表現される
\begin{align}\phi_U(t) &= \mathrm{E}[e^{itu}]\\&= \mathrm{E}[e^{itX_1}]\mathrm{E}[e^{itX_2}]\\&= \exp\bigl\{\lambda_1(e^t-1)\bigr\}\exp\bigl\{\lambda_2(e^t-1)\bigr\}\\&=\exp\bigl\{(\lambda_1+\lambda_2)(e^t-1)\bigr\}.\tag{2}\end{align}
これはパラメータ\(\lambda_1+\lambda_2\)のポアソン分布の確率関数である。よって、\(X_1+X_2\sim Po(\lambda_1 + \lambda_2)\)であり、ポアソン分布の再生性が示された。