ここでは離散分布の積率母関数を定義し、様々な分布の積率母関数を導出していく。
積率母関数と積率(モーメント)との関係も述べる。
連続分布の積率母関数については、連続分布の積率母関数を参照されたい。
離散確率変数の積率母関数
モーメントは期待値の定義により、直接計算することができるが、別の方法として積率母関数を用いた方法がある。積率母関数はその名の通り、積率(モーメント)を生成する関数である。
離散確率変数の積率母関数は次で定義される。
定義1 積率母関数
この級数は\(t\)の関数であり、\(M_X(t)\)のように添え字に\(X\)を付けたのは、確率変数\(X\)に対する積率母関数であることを強調するためである。また、\(t\)はモーメントを計算するための変数として用いられる。\(M_X(t)\)からモーメントを計算する過程をこれからみていく。まず確率変数\(X\)のモーメント\(\mu_i\), \(i = 1, 2 , \ldots\)が存在し、確率関数\(\mathrm{Pr}\{X=x_i\}, i =1,2,\ldots\)は、\eqref{eq1}の級数が収束するような関数とする。\(e^{t x_i}\)をべき級数に展開し、項別に和をとる。\(e^{z}\)のべき級数展開は
\begin{align}e^z = 1 + z +\cfrac{z^2}{2!}+\cfrac{z^3}{3!}+\cdots\end{align}
であるから、モーメントの定義と\eqref{eq1}より
\begin{align}M_X(t) &= \sum_{i=1}^{\infty}\left[1+t x_i +\cfrac{t^2 x_i^2}{2!}+\cfrac{t^3 x_i^3}{3!}+\cdots\right]\mathrm{Pr}\{X=x_i\}\\&=\sum_{i=1}^{\infty}\mathrm{Pr}\{X=x_i\} + t \sum_{i=1}^{\infty}x_i\mathrm{Pr}\{X=x_i\}+\cfrac{t^2}{2!}\sum_{i=1}^{\infty}x_i^2\mathrm{Pr}\{X=x_i\}+\cdots\\\label{eq2}&=1+t\mu_1+\cfrac{t^2}{2!}\mu_2+\cfrac{t^3}{3!}\mu_3+\cdots.\tag{2}\end{align}
である。この展開式における\(t^k/k!\)の係数は原点周りの\(k\)次のモーメントであるから、次のように\(k\)階微分を考えることによって、\(\mu_k\)を得ることができる。\eqref{eq2}を\(t\)で\(k\)階微分して\(t=0\)とすると
\begin{align}\label{eq3}\mu_k =\left. \cfrac{d^kM_X(t)}{dt^k}\right|_{t=0}\tag{3}\end{align}
を得るので、\(k\)次のモーメントを求めるためには、\(M_X(t)\)をその次数と同じ回数だけ微分し、\(t=0\)とおけばよい。
離散分布の積率母関数
ベルヌーイ分布
確率変数\(X\)がベルヌーイ分布に従うとき、\(0\leq p\leq 1\)に対して、\(X\)の確率関数は次で与えられる。
\begin{align}\mathrm{Pr}\{X=1\} &= p,\\ \mathrm{Pr}\{X=0\}&=1-p. \end{align}
ベルヌーイ分布に従う確率変数\(X\)の積率母関数を導出する。離散確率変数の積率母関数の定義より、\(X\)の積率母関数は
\begin{align}M_X(t) &=e^{t \cdot1}p+e^{t\cdot0}(1-p)\\&=1-p+pe^{t}\end{align}
また\(X\)の1次モーメントは
\begin{align}\mu_1 &= \left.\cfrac{dM_X(t)}{dt} \right|_{t=0}\\&= pe^{t}|_{t=0}\\&=p\end{align}
であり、2次モーメントは
\begin{align}\mu_2 &= \left.\cfrac{d^2M_X(t)}{dt^2} \right|_{t=0}\\&= \left.\cfrac{d}{dt}pe^{t}\right|_{t=0}\\&= pe^{t}|_{t=0}\\&=p\end{align}
である。故に\(X\)の期待値と分散は、それぞれ
\begin{align}\mathrm{E}[X]&=\mu_1 = p\\\mathrm{Var}[X]&=\mu_2-\mu_1^2\\&=p-p^2\\&=p(1-p)\end{align}
である。
2項分布
確率変数\(X\)が2項分布に従うとき、\(0\leq p\leq 1\)、\(n\in\{0, 1, 2, \ldots\}\)に対して、\(X\)の確率関数は次で与えられる。
\begin{align}\label{eq4}\mathrm{Pr}\{X=k\}=\begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}, \ \ \ \ k = 0, 1, 2, \ldots, n.\tag{4}\end{align}
2項分布に従う確率変数\(X\)の積率母関数を導出する。\(X\)の積率母関数\(M_X(t)\)は
\begin{align}M_X(t) &= \sum_{k=0}^ne^{t k}\begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}\\\label{eq5}&=\sum_{k=0}^n\begin{pmatrix}n\\k\end{pmatrix}(pe^{t})^k(1-p)^{n-k}\tag{5}\end{align}
となり、ここで次の二項定理を用いる。
\begin{align}(x+y)^n = \sum_{k=0}^n\begin{pmatrix}n\\k\end{pmatrix} x^ky^{n-k}.\end{align}
よって、\eqref{eq5}は
\begin{align}\sum_{k=0}^n\begin{pmatrix}n\\k\end{pmatrix}(pe^{t})^k(1-p)^{n-k}&=\bigl\{pe^{t}+(1-p)\bigr\}^n\\&=(1-p+pe^{t})^n\end{align}
となる。したがって次の2項分布に従う確率変数\(X\)の積率母関数M_X(t)が得られた。
\begin{align}\label{eq6}M_X(t)=(1-p+pe^{t})^n.\tag{6}\end{align}
また、確率変数\(X\)の1次モーメントは
\begin{align}\mu_1 &= \left.\cfrac{dM_X(t)}{dt} \right|_{t=0}\\&= npe^{t}(1-p+pe^{t})^{n-1}|_{t=0}\\&=np\end{align}
であり、2次モーメントは
\begin{align}\mu_2 &= \left.\cfrac{d^2M_X(t)}{dt^2}\right|_{t=0}\\&=\left.\cfrac{d}{dt}npe^{t}(1-p+pe^{t})^{n-1}\right|_{t=0}\\&=npe^{t}(1-p+pe^{t})^{n-1}+n(n-1)p^2e^{2t}(1-p+pe^{t})^{n-2}|_{t=0}\\&=npe^{t}(1-p+pe^{t})^{n-2}\{1-p+pe^{t}+(n-1)pe^{t}\}\\&=npe^{t}(1-p+pe^{t})^{n-2}(1-p+npe^{t})|_{t=0}\\&=np(1-p+np)\end{align}
である。故に\(X\)の期待値と分散は、それぞれ
\begin{align}\mathrm{E}[X] &= \mu_1= np,\\\mathrm{Var}[X] &=\mu_2-\mu_1^2 \\&=np(1-p+np)-(np)^2\\&=np(1-p)\end{align}
である。
負の2項分布
確率変数\(X\)が負の2項分布に従うとき、\(0\leq p\leq1\)、\(r\in\{1,2,\ldots\}\)に対して、\(X\)の確率関数は次で与えられる。
\begin{align}\mathrm{Pr}\{X=k\}=\begin{pmatrix}k+r-1\\k\end{pmatrix}(1-p)^rp^k, k = 0, 1, 2, \ldots.\end{align}
2項分布に従う確率変数\(X\)の積率母関数を導出する。\(X\)の積率母関数\(M_X(t)\)は
\begin{align}M_X(t)&=\sum_{k=0}^{\infty}e^{tk}\begin{pmatrix}k+r-1\\k\end{pmatrix}(1-p)^rp^k\end{align}
で表され、ここで二項係数が
\begin{align}\begin{pmatrix}x+r-1\\x\end{pmatrix}&=\cfrac{(x+r-1)(x+r-2)\cdots r}{x!}\notag\\
&=(-1)^x\cfrac{(-r-x+1)(-r-x+2)\cdots(-r)}{x!}\notag\\
&=(-1)^x\cfrac{(-r)(-r-1)\cdots(-r-x+1)}{x!}\notag\\
&=(-1)^x\begin{pmatrix}-r\\x\end{pmatrix}\notag.
\end{align}
で表されることから、次の積率母関数を得る。
\begin{align}&\sum_{k=0}^{\infty}e^{t k}\begin{pmatrix}k+r-1\\k\end{pmatrix}(1-p)^rp^k\\&=\sum_{k=0}^{\infty}e^{t k}(-1)^k\begin{pmatrix}-r\\k\end{pmatrix} p^r(1-p)^k\\&=p^r\sum_{k=0}^{\infty}\begin{pmatrix}-r\\k\end{pmatrix}(-1)^ke^{t k}(1-p)^k\\&=p^r\sum_{k=0}^{\infty}\begin{pmatrix}-r\\k\end{pmatrix}\bigl\{-(1-p)e^{t}\bigr\}^k1^{-r-k}\\&=p^r\bigl\{-(1-p)e^{t}+1\bigr\}^{-k}\\&=\left(\cfrac{p}{1-(1-p)e^{t}}\right)^r.\end{align}
また、確率変数\(X\)の1次モーメントは
\begin{align}\mu_1 &= \left.\cfrac{dM_X(t)}{dt} \right|_{t=0}\\&=\left.\cfrac{d}{dt}\left(\cfrac{p}{1-(1-p)e^{t}}\right)^r\right|_{t=0}\\&=\left.\cfrac{ r(1-p)p^re^{t}}{\bigl\{1-(1-p)e^{t}\bigr\}^{r+1}}\right|_{t=0}\\&=\cfrac{r(1-p)}{p}\end{align}
であり、2次モーメントは
\begin{align}\mu_2 &= \left.\cfrac{d^2M_X(t)}{dt^2}\right|_{t=0}\\&=\left.\cfrac{d}{dt}\cfrac{ r(1-p)p^re^{t}}{\bigl\{1-(1-p)e^{t}\bigr\}^{r+1}}\right|_{t=0}\\&=\left.\cfrac{r(1-p)p^re^{t}\bigl\{1-(1-p)e^{t}\bigr\}^{r+1}+r(r+1)(1-p)^2p^re^{2t}\bigl\{1-(1-p)e^{t}\bigr\}^r}{\bigl\{1-(1-p)e^{t}\bigr\}^{2(r+1)}}\right|_{t=0}\\&=\cfrac{r(1-p)(r-rp+1)}{p^2}\end{align}
である。故に\(X\)の期待値と分散は、それぞれ
\begin{align}\mathrm{E}[X] &= \mu_1 =\cfrac{r(1-p)}{p} ,\\\mathrm{Var}[X]&=\mu_2-\mu_1^2\\&=\cfrac{r(1-p)(r-rp+1)-r^2(1-p)^2}{p^2}\\&=\cfrac{r(1-p)}{p^2}\end{align}
である。
ポアソン分布
確率変数\(X\)がポアソン分布に従うとき、\(\lambda > 0\)に対して、\(X\)の確率関数は次で与えられる。
\begin{align}\mathrm{Pr}\{X=k\} = \cfrac{e^{-\lambda}\lambda^k}{k!}, \ \ \ \ k=0, 1, 2, \ldots\end{align}
ポアソン分布に従う確率変数\(X\)の積率母関数を導出する。\(X\)の積率母関数\(M_X(t)\)は
\begin{align}M_X(t) &= \sum_{k=0}^{\infty}e^{t k}\cfrac{e^{-\lambda}\lambda^k}{k!}\\&=e^{-\lambda}\sum_{k=0}^{\infty}\cfrac{(\lambda e^{t})^k}{k!}\\&=e^{-\lambda}e^{\lambda e^{t}}\\&=e^{\lambda(e^{t}-1)}\end{align}
となる。
また、確率変数\(X\)の1次モーメントは
\begin{align}\mu_1 &= \left.\cfrac{dM_X(t)}{dt} \right|_{t=0}\\&= \left.\lambda e^{t}e^{\lambda(e^{t}-1)}\right|_{t=0}\\&=\lambda\end{align}
であり、2次モーメントは
\begin{align}\mu_2 &= \left.\cfrac{d^2M_X(t)}{dt^2}\right|_{t=0}\\&=\left.\cfrac{d}{dt}\lambda e^{\lambda(e^{t}-1)+t}\right|_{t=0}\\&=(\lambda e^{t}+1)\lambda e^{\lambda(e^{t}-1)+t}|_{t=0}\\&=\lambda(\lambda+1) \end{align}
である。故に\(X\)の期待値と分散は、それぞれ
\begin{align}\mathrm{E}[X] &= \mu_1 = \lambda,\\\mathrm{Var}[X]&=\mu_2-\mu_1^2\\&=\lambda(\lambda+1)-\lambda^2\\&=\lambda\end{align}
である。
幾何分布
確率変数\(X\)が幾何分布に従うとき、\(0\leq p\leq1\)に対して、\(X\)の確率関数は次で与えられる。
\begin{align}\mathrm{Pr}\{X=k\} = (1-p)^{k-1}p, \ \ \ \ k=1,2, \ldots\end{align}
幾何分布に従う確率変数\(X\)の積率母関数を導出する。\(X\)の積率母関数\(M_X(t)\)は
\begin{align}M_X(t)&=\sum_{k=1}^{\infty}e^{t k}(1-p)^{k-1}p\\&=pe^{t}\sum_{k=1}^{\infty}\bigl\{(1-p)e^{t}\bigr\}^{k-1}\\\label{eq7}&=pe^{t}\sum_{k=0}^{\infty}\bigl\{(1-p)e^{t}\bigr\}^{k}\tag{7}\end{align}
となる。ここで\eqref{eq7}の無限等比級数を導出するために、\(|(1-p)e^{t}|<1\)の場合、すなわち\(e^{t}>0\)、\((1-p)>0\)より\(e^{t}<1/(1-p)\)の場合を考える。両辺に対数をとることで、\(t<-\log(1-p)\)を得る。したがって\(t<-\log(1-p)\)に対して、\eqref{eq7}の和は初項\(1\)、公比\((1-p)e^{t}\)の無限等比級数である。故に、\eqref{eq7}の積率母関数は次となる。
\begin{align}pe^{t}\sum_{k=0}^{\infty}\bigl\{(1-p)e^{t}\bigr\}^{k}&=\cfrac{pe^{t}}{1-(1-p)e^{t}}\end{align}
また、確率変数\(X\)の1次モーメントは
\begin{align}\mu_1 &= \left.\cfrac{dM_X(t)}{dt} \right|_{t=0}\\&=\left. \cfrac{pe^{t}\bigl\{1-(1-p)e^{t}\bigr\}+pe^{t}(1-p)e^{t}}{\bigl\{1-(1-p)e^{t}\bigr\}^2}\right|_{t=0}\\&=\cfrac{p^2+(1-p)p}{p^2}\\&=\cfrac{1}{p}\end{align}
であり、2次モーメントは
\begin{align}\mu_2 &= \left.\cfrac{d^2M_X(t)}{dt^2}\right|_{t=0}\\&=\left.\cfrac{d}{dt} \cfrac{pe^{t}\bigl\{1-(1-p)e^{t}\bigr\}+pe^{t}(1-p)e^{t}}{\bigl\{1-(1-p)e^{t}\bigr\}^2}\right|_{t=0}\\&=\left.\cfrac{pe^{t}\bigl\{1-(1-p)e^{t}\bigr\}^2+2(1-p)pe^{2t}\bigl\{1-(1-p)e^{t}\bigr\} }{\bigl\{1-(1-p)e^{t}\bigr\}^4}\right|_{t=0}\\&=\cfrac{2-p}{p^2}\end{align}
である。故に\(X\)の期待値と分散は、それぞれ
\begin{align}\mathrm{E}[X] &= \mu_1 = \cfrac{1}{p}\\\mathrm{Var}[X]&=\mu_2-\mu_1^2\\&=\cfrac{2-p}{p^2}-\cfrac{1}{p^2}\\&=\cfrac{1-p}{p^2}\end{align}
である。
超幾何分布
確率変数\(X\)が超幾何分布に従うとき、\(N\in\{0, 1, 2, \ldots\}\)、\(K\in\{0, 1, 2, \ldots, N\}\)、\(n\in\{0, 1, 2, \ldots, N\}\)に対して、\(X\)の確率関数は次で与えられる。
\begin{align}\mathrm{Pr}\{X=k\} = \cfrac{\begin{pmatrix}K\\k\end{pmatrix}\begin{pmatrix}N-K\\n-k\end{pmatrix}}{\begin{pmatrix}N\\n\end{pmatrix}}, \ \ \ \ \max(0,n+K-N)\leq k \leq\min(K,n)\end{align}
超幾何分布に従う確率変数\(X\)の積率母関数を導出する。積率母関数を求めるうえで次のgeneralized hypergeometric functionを導入する。
\begin{align}F\left[\begin{array}a_1, a_2,\ldots, a_r\\b_1,b_2,\ldots b_s\end{array};z\right]=\sum_{n=0}^{\infty}\cfrac{(a_1)^{(n)}(a_2)^{(n)}\cdots(a_r)^{(n)}}{(b_1)^{(n)}(b_2)^{(n)}\cdots(b_s)^{(n)}n!}z^n.\end{align}
ただし
\begin{align}(y)^{(0)} &= 1\\(y)^{(n)} &= \prod_{k=0}^{n-1}(y+k)=\cfrac{(y+n-1)!}{(y-1)!}\end{align}
は昇べきのポッホハマー記号である。また、降べきのポッホハマー記号\((y)_{(n)}\)を\begin{align}(y)_{(n)}=\cfrac{y!}{(y-n)!}\end{align}とし、
\begin{align}\begin{pmatrix}y\\n\end{pmatrix}=\cfrac{(y)_{(n)}}{n!}\end{align}
が成り立つことから、\(X\)の積率母関数は
\begin{align}M_X(t) &= \sum_{k=0}^{\infty}\cfrac{\begin{pmatrix}K\\k\end{pmatrix}\begin{pmatrix}N-K\\n-k\end{pmatrix}}{\begin{pmatrix}N\\n\end{pmatrix}}e^{t k}\\&=\sum_{k=0}^{\infty}\cfrac{(K)_{(k)}}{k!}\cfrac{(N-K)_{(n-k)}}{(n-k)!}\cfrac{n!}{(N)_{(n)}}e^{t k}\end{align}
である。ここで
\begin{align}\cfrac{(N-K)_{(n)}}{(N-K-n+1)^{(k)}}&=\cfrac{(N-K)!/(N-K-n)!}{(N-K-n+k)!/(N-K-n)!}\\&=\cfrac{(N-K)!}{(N-K-n+k)!}\\&=(N-K)_{(n-k)}\end{align}
であることより、
\begin{align}&\sum_{k=0}^{\infty}\cfrac{(K)_{(k)}}{k!}\cfrac{(N-K)_{(n-k)}}{(n-k)!}\cfrac{n!}{(N)_{(n)}}e^{t k}\\&=\cfrac{}{(N)_{(k)}}\sum_{k=0}^{\infty}\cfrac{(K)_{(k)}}{k!}\cfrac{(N-K)_{(n)}}{(N-K-n+1)^{(k)} }\cfrac{n!}{(n-k)!}e^{t k}\\\label{eq8}&=\cfrac{(N-K)_{(n)}}{(N)_{(n)}}\sum_{k=0}^{\infty}\cfrac{(K)_{(k)}(n)_{(k)}}{(N-K-n+1)^{(k)}k!}e^{t k}\tag{8}\end{align}
となる。ここに、\((y)^{(n)}\)は次の昇べきのポッホハマー記号である。
\begin{align}(y)^{(n)}=\cfrac{(y+n-1)!}{(y-1)!}.\end{align}
昇べきのポッホハマー記号に対して
\begin{align}(-y)^{(n)}=(-1)^n(y-n+1)^{(n)}\end{align}
が成り立つ。よって
\begin{align}(-K)^{(k)}(-n)^{(k)}&=(-1)^{2k}(K-k+1)^{(k)}(n-k+1)^{(k)}\\&=\cfrac{K!}{(K-k)!}\cfrac{n!}{(n-k)!}\\&=(K)_{(k)}(n)_{(k)}\end{align}
である。故に\eqref{eq8}は
\begin{align}& \cfrac{(N-K)_{(n)}}{(N)_{(n)}}\sum_{k=0}^{\infty}\cfrac{(K)_{(k)}(n)_{(k)}}{(N-K-n+1)^{(k)}k!}e^{t k}\\&=\cfrac{(N-K)_{(n)}}{(N)_{(n)}}\sum_{k=0}^{\infty}\cfrac{(-K)^{(k)}(-n)^{(k)}}{(N-K-n+1)^{(k)}k!}e^{t k}\\&=\cfrac{\begin{pmatrix}N-K\\n\end{pmatrix}\ _2F_1(-n, -K; N-K-n+1; e^{t})}{\begin{pmatrix}N\\n\end{pmatrix}}\end{align}
となる。