統計学

離散分布の積率母関数【統計学】

  1. HOME >
  2. 統計学 >

離散分布の積率母関数【統計学】

スポンサーリンク

ここでは離散分布の積率母関数を定義し、様々な分布の積率母関数を導出していく。

積率母関数と積率(モーメント)との関係も述べる。

連続分布の積率母関数については、連続分布の積率母関数を参照されたい。

離散確率変数の積率母関数

モーメントは期待値の定義により、直接計算することができるが、別の方法として積率母関数を用いた方法がある。積率母関数はその名の通り、積率(モーメント)を生成する関数である。

離散確率変数の積率母関数は次で定義される。

定義1 積率母関数

確率関数\(\mathrm{Pr}\{X = x_i\}, i=1, 2, \ldots\)をもつ離散確率変数\(X\)の積率母関数は
\begin{align}\label{eq1}M_X(t)= \mathrm{E}[e^{t X}] = \sum_{i=1}^{\infty} e^{t x_i}\mathrm{Pr}\{X=x_i\}\tag{1}\end{align}
で与えられる。

この級数は\(t\)の関数であり、\(M_X(t)\)のように添え字に\(X\)を付けたのは、確率変数\(X\)に対する積率母関数であることを強調するためである。また、\(t\)はモーメントを計算するための変数として用いられる。\(M_X(t)\)からモーメントを計算する過程をこれからみていく。まず確率変数\(X\)のモーメント\(\mu_i\), \(i = 1, 2 , \ldots\)が存在し、確率関数\(\mathrm{Pr}\{X=x_i\}, i =1,2,\ldots\)は、\eqref{eq1}の級数が収束するような関数とする。\(e^{t x_i}\)をべき級数に展開し、項別に和をとる。\(e^{z}\)のべき級数展開は

\begin{align}e^z = 1 + z +\cfrac{z^2}{2!}+\cfrac{z^3}{3!}+\cdots\end{align}

であるから、モーメントの定義と\eqref{eq1}より

\begin{align}M_X(t) &= \sum_{i=1}^{\infty}\left[1+t x_i +\cfrac{t^2 x_i^2}{2!}+\cfrac{t^3 x_i^3}{3!}+\cdots\right]\mathrm{Pr}\{X=x_i\}\\&=\sum_{i=1}^{\infty}\mathrm{Pr}\{X=x_i\} + t \sum_{i=1}^{\infty}x_i\mathrm{Pr}\{X=x_i\}+\cfrac{t^2}{2!}\sum_{i=1}^{\infty}x_i^2\mathrm{Pr}\{X=x_i\}+\cdots\\\label{eq2}&=1+t\mu_1+\cfrac{t^2}{2!}\mu_2+\cfrac{t^3}{3!}\mu_3+\cdots.\tag{2}\end{align}

である。この展開式における\(t^k/k!\)の係数は原点周りの\(k\)次のモーメントであるから、次のように\(k\)階微分を考えることによって、\(\mu_k\)を得ることができる。\eqref{eq2}を\(t\)で\(k\)階微分して\(t=0\)とすると

\begin{align}\label{eq3}\mu_k =\left. \cfrac{d^kM_X(t)}{dt^k}\right|_{t=0}\tag{3}\end{align}

を得るので、\(k\)次のモーメントを求めるためには、\(M_X(t)\)をその次数と同じ回数だけ微分し、\(t=0\)とおけばよい。

離散分布の積率母関数

ベルヌーイ分布

確率変数\(X\)がベルヌーイ分布に従うとき、\(0\leq p\leq 1\)に対して、\(X\)の確率関数は次で与えられる。

\begin{align}\mathrm{Pr}\{X=1\} &= p,\\ \mathrm{Pr}\{X=0\}&=1-p. \end{align}

ベルヌーイ分布に従う確率変数\(X\)の積率母関数を導出する。離散確率変数の積率母関数の定義より、\(X\)の積率母関数は

\begin{align}M_X(t) &=e^{t \cdot1}p+e^{t\cdot0}(1-p)\\&=1-p+pe^{t}\end{align}

また\(X\)の1次モーメントは

\begin{align}\mu_1 &= \left.\cfrac{dM_X(t)}{dt} \right|_{t=0}\\&= pe^{t}|_{t=0}\\&=p\end{align}

であり、2次モーメントは

\begin{align}\mu_2 &= \left.\cfrac{d^2M_X(t)}{dt^2} \right|_{t=0}\\&= \left.\cfrac{d}{dt}pe^{t}\right|_{t=0}\\&= pe^{t}|_{t=0}\\&=p\end{align}

である。故に\(X\)の期待値と分散は、それぞれ

\begin{align}\mathrm{E}[X]&=\mu_1 = p\\\mathrm{Var}[X]&=\mu_2-\mu_1^2\\&=p-p^2\\&=p(1-p)\end{align}

である。

2項分布

確率変数\(X\)が2項分布に従うとき、\(0\leq p\leq 1\)、\(n\in\{0, 1, 2, \ldots\}\)に対して、\(X\)の確率関数は次で与えられる。

\begin{align}\label{eq4}\mathrm{Pr}\{X=k\}=\begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}, \ \ \ \ k = 0, 1, 2, \ldots, n.\tag{4}\end{align}

2項分布に従う確率変数\(X\)の積率母関数を導出する。\(X\)の積率母関数\(M_X(t)\)は

\begin{align}M_X(t) &= \sum_{k=0}^ne^{t k}\begin{pmatrix}n\\k\end{pmatrix}p^k(1-p)^{n-k}\\\label{eq5}&=\sum_{k=0}^n\begin{pmatrix}n\\k\end{pmatrix}(pe^{t})^k(1-p)^{n-k}\tag{5}\end{align}

となり、ここで次の二項定理を用いる。

\begin{align}(x+y)^n = \sum_{k=0}^n\begin{pmatrix}n\\k\end{pmatrix} x^ky^{n-k}.\end{align}

よって、\eqref{eq5}は

\begin{align}\sum_{k=0}^n\begin{pmatrix}n\\k\end{pmatrix}(pe^{t})^k(1-p)^{n-k}&=\bigl\{pe^{t}+(1-p)\bigr\}^n\\&=(1-p+pe^{t})^n\end{align}

となる。したがって次の2項分布に従う確率変数\(X\)の積率母関数M_X(t)が得られた。

\begin{align}\label{eq6}M_X(t)=(1-p+pe^{t})^n.\tag{6}\end{align}

また、確率変数\(X\)の1次モーメントは

\begin{align}\mu_1 &= \left.\cfrac{dM_X(t)}{dt} \right|_{t=0}\\&= npe^{t}(1-p+pe^{t})^{n-1}|_{t=0}\\&=np\end{align}

であり、2次モーメントは

\begin{align}\mu_2 &= \left.\cfrac{d^2M_X(t)}{dt^2}\right|_{t=0}\\&=\left.\cfrac{d}{dt}npe^{t}(1-p+pe^{t})^{n-1}\right|_{t=0}\\&=npe^{t}(1-p+pe^{t})^{n-1}+n(n-1)p^2e^{2t}(1-p+pe^{t})^{n-2}|_{t=0}\\&=npe^{t}(1-p+pe^{t})^{n-2}\{1-p+pe^{t}+(n-1)pe^{t}\}\\&=npe^{t}(1-p+pe^{t})^{n-2}(1-p+npe^{t})|_{t=0}\\&=np(1-p+np)\end{align}

である。故に\(X\)の期待値と分散は、それぞれ

\begin{align}\mathrm{E}[X] &= \mu_1= np,\\\mathrm{Var}[X] &=\mu_2-\mu_1^2 \\&=np(1-p+np)-(np)^2\\&=np(1-p)\end{align}

である。

負の2項分布

確率変数\(X\)が負の2項分布に従うとき、\(0\leq p\leq1\)、\(r\in\{1,2,\ldots\}\)に対して、\(X\)の確率関数は次で与えられる。

\begin{align}\mathrm{Pr}\{X=k\}=\begin{pmatrix}k+r-1\\k\end{pmatrix}(1-p)^rp^k, k = 0, 1, 2, \ldots.\end{align}

2項分布に従う確率変数\(X\)の積率母関数を導出する。\(X\)の積率母関数\(M_X(t)\)は

\begin{align}M_X(t)&=\sum_{k=0}^{\infty}e^{tk}\begin{pmatrix}k+r-1\\k\end{pmatrix}(1-p)^rp^k\end{align}

で表され、ここで二項係数が

\begin{align}\begin{pmatrix}x+r-1\\x\end{pmatrix}&=\cfrac{(x+r-1)(x+r-2)\cdots r}{x!}\notag\\
&=(-1)^x\cfrac{(-r-x+1)(-r-x+2)\cdots(-r)}{x!}\notag\\
&=(-1)^x\cfrac{(-r)(-r-1)\cdots(-r-x+1)}{x!}\notag\\
&=(-1)^x\begin{pmatrix}-r\\x\end{pmatrix}\notag.
\end{align}

で表されることから、次の積率母関数を得る。

\begin{align}&\sum_{k=0}^{\infty}e^{t k}\begin{pmatrix}k+r-1\\k\end{pmatrix}(1-p)^rp^k\\&=\sum_{k=0}^{\infty}e^{t k}(-1)^k\begin{pmatrix}-r\\k\end{pmatrix} p^r(1-p)^k\\&=p^r\sum_{k=0}^{\infty}\begin{pmatrix}-r\\k\end{pmatrix}(-1)^ke^{t k}(1-p)^k\\&=p^r\sum_{k=0}^{\infty}\begin{pmatrix}-r\\k\end{pmatrix}\bigl\{-(1-p)e^{t}\bigr\}^k1^{-r-k}\\&=p^r\bigl\{-(1-p)e^{t}+1\bigr\}^{-k}\\&=\left(\cfrac{p}{1-(1-p)e^{t}}\right)^r.\end{align}

また、確率変数\(X\)の1次モーメントは

\begin{align}\mu_1 &= \left.\cfrac{dM_X(t)}{dt} \right|_{t=0}\\&=\left.\cfrac{d}{dt}\left(\cfrac{p}{1-(1-p)e^{t}}\right)^r\right|_{t=0}\\&=\left.\cfrac{ r(1-p)p^re^{t}}{\bigl\{1-(1-p)e^{t}\bigr\}^{r+1}}\right|_{t=0}\\&=\cfrac{r(1-p)}{p}\end{align}

であり、2次モーメントは

\begin{align}\mu_2 &= \left.\cfrac{d^2M_X(t)}{dt^2}\right|_{t=0}\\&=\left.\cfrac{d}{dt}\cfrac{ r(1-p)p^re^{t}}{\bigl\{1-(1-p)e^{t}\bigr\}^{r+1}}\right|_{t=0}\\&=\left.\cfrac{r(1-p)p^re^{t}\bigl\{1-(1-p)e^{t}\bigr\}^{r+1}+r(r+1)(1-p)^2p^re^{2t}\bigl\{1-(1-p)e^{t}\bigr\}^r}{\bigl\{1-(1-p)e^{t}\bigr\}^{2(r+1)}}\right|_{t=0}\\&=\cfrac{r(1-p)(r-rp+1)}{p^2}\end{align}

である。故に\(X\)の期待値と分散は、それぞれ

\begin{align}\mathrm{E}[X] &= \mu_1 =\cfrac{r(1-p)}{p} ,\\\mathrm{Var}[X]&=\mu_2-\mu_1^2\\&=\cfrac{r(1-p)(r-rp+1)-r^2(1-p)^2}{p^2}\\&=\cfrac{r(1-p)}{p^2}\end{align}

である。

ポアソン分布

確率変数\(X\)がポアソン分布に従うとき、\(\lambda > 0\)に対して、\(X\)の確率関数は次で与えられる。

\begin{align}\mathrm{Pr}\{X=k\} = \cfrac{e^{-\lambda}\lambda^k}{k!}, \ \ \ \ k=0, 1, 2, \ldots\end{align}

ポアソン分布に従う確率変数\(X\)の積率母関数を導出する。\(X\)の積率母関数\(M_X(t)\)は

\begin{align}M_X(t) &= \sum_{k=0}^{\infty}e^{t k}\cfrac{e^{-\lambda}\lambda^k}{k!}\\&=e^{-\lambda}\sum_{k=0}^{\infty}\cfrac{(\lambda e^{t})^k}{k!}\\&=e^{-\lambda}e^{\lambda e^{t}}\\&=e^{\lambda(e^{t}-1)}\end{align}

となる。

また、確率変数\(X\)の1次モーメントは

\begin{align}\mu_1 &= \left.\cfrac{dM_X(t)}{dt} \right|_{t=0}\\&= \left.\lambda e^{t}e^{\lambda(e^{t}-1)}\right|_{t=0}\\&=\lambda\end{align}

であり、2次モーメントは

\begin{align}\mu_2 &= \left.\cfrac{d^2M_X(t)}{dt^2}\right|_{t=0}\\&=\left.\cfrac{d}{dt}\lambda e^{\lambda(e^{t}-1)+t}\right|_{t=0}\\&=(\lambda e^{t}+1)\lambda e^{\lambda(e^{t}-1)+t}|_{t=0}\\&=\lambda(\lambda+1) \end{align}

である。故に\(X\)の期待値と分散は、それぞれ

\begin{align}\mathrm{E}[X] &= \mu_1 = \lambda,\\\mathrm{Var}[X]&=\mu_2-\mu_1^2\\&=\lambda(\lambda+1)-\lambda^2\\&=\lambda\end{align}

である。

幾何分布

確率変数\(X\)が幾何分布に従うとき、\(0\leq p\leq1\)に対して、\(X\)の確率関数は次で与えられる。

\begin{align}\mathrm{Pr}\{X=k\} = (1-p)^{k-1}p, \ \ \ \ k=1,2, \ldots\end{align}

幾何分布に従う確率変数\(X\)の積率母関数を導出する。\(X\)の積率母関数\(M_X(t)\)は

\begin{align}M_X(t)&=\sum_{k=1}^{\infty}e^{t k}(1-p)^{k-1}p\\&=pe^{t}\sum_{k=1}^{\infty}\bigl\{(1-p)e^{t}\bigr\}^{k-1}\\\label{eq7}&=pe^{t}\sum_{k=0}^{\infty}\bigl\{(1-p)e^{t}\bigr\}^{k}\tag{7}\end{align}

となる。ここで\eqref{eq7}の無限等比級数を導出するために、\(|(1-p)e^{t}|<1\)の場合、すなわち\(e^{t}>0\)、\((1-p)>0\)より\(e^{t}<1/(1-p)\)の場合を考える。両辺に対数をとることで、\(t<-\log(1-p)\)を得る。したがって\(t<-\log(1-p)\)に対して、\eqref{eq7}の和は初項\(1\)、公比\((1-p)e^{t}\)の無限等比級数である。故に、\eqref{eq7}の積率母関数は次となる。

\begin{align}pe^{t}\sum_{k=0}^{\infty}\bigl\{(1-p)e^{t}\bigr\}^{k}&=\cfrac{pe^{t}}{1-(1-p)e^{t}}\end{align}

また、確率変数\(X\)の1次モーメントは

\begin{align}\mu_1 &= \left.\cfrac{dM_X(t)}{dt} \right|_{t=0}\\&=\left. \cfrac{pe^{t}\bigl\{1-(1-p)e^{t}\bigr\}+pe^{t}(1-p)e^{t}}{\bigl\{1-(1-p)e^{t}\bigr\}^2}\right|_{t=0}\\&=\cfrac{p^2+(1-p)p}{p^2}\\&=\cfrac{1}{p}\end{align}

であり、2次モーメントは

\begin{align}\mu_2 &= \left.\cfrac{d^2M_X(t)}{dt^2}\right|_{t=0}\\&=\left.\cfrac{d}{dt} \cfrac{pe^{t}\bigl\{1-(1-p)e^{t}\bigr\}+pe^{t}(1-p)e^{t}}{\bigl\{1-(1-p)e^{t}\bigr\}^2}\right|_{t=0}\\&=\left.\cfrac{pe^{t}\bigl\{1-(1-p)e^{t}\bigr\}^2+2(1-p)pe^{2t}\bigl\{1-(1-p)e^{t}\bigr\} }{\bigl\{1-(1-p)e^{t}\bigr\}^4}\right|_{t=0}\\&=\cfrac{2-p}{p^2}\end{align}

である。故に\(X\)の期待値と分散は、それぞれ

\begin{align}\mathrm{E}[X] &= \mu_1 = \cfrac{1}{p}\\\mathrm{Var}[X]&=\mu_2-\mu_1^2\\&=\cfrac{2-p}{p^2}-\cfrac{1}{p^2}\\&=\cfrac{1-p}{p^2}\end{align}

である。

超幾何分布

確率変数\(X\)が超幾何分布に従うとき、\(N\in\{0, 1, 2, \ldots\}\)、\(K\in\{0, 1, 2, \ldots, N\}\)、\(n\in\{0, 1, 2, \ldots, N\}\)に対して、\(X\)の確率関数は次で与えられる。

\begin{align}\mathrm{Pr}\{X=k\} = \cfrac{\begin{pmatrix}K\\k\end{pmatrix}\begin{pmatrix}N-K\\n-k\end{pmatrix}}{\begin{pmatrix}N\\n\end{pmatrix}}, \ \ \ \ \max(0,n+K-N)\leq k \leq\min(K,n)\end{align}

超幾何分布に従う確率変数\(X\)の積率母関数を導出する。積率母関数を求めるうえで次のgeneralized hypergeometric functionを導入する。

\begin{align}F\left[\begin{array}a_1, a_2,\ldots, a_r\\b_1,b_2,\ldots b_s\end{array};z\right]=\sum_{n=0}^{\infty}\cfrac{(a_1)^{(n)}(a_2)^{(n)}\cdots(a_r)^{(n)}}{(b_1)^{(n)}(b_2)^{(n)}\cdots(b_s)^{(n)}n!}z^n.\end{align}

ただし

\begin{align}(y)^{(0)} &= 1\\(y)^{(n)} &= \prod_{k=0}^{n-1}(y+k)=\cfrac{(y+n-1)!}{(y-1)!}\end{align}

は昇べきのポッホハマー記号である。また、降べきのポッホハマー記号\((y)_{(n)}\)を\begin{align}(y)_{(n)}=\cfrac{y!}{(y-n)!}\end{align}とし、

\begin{align}\begin{pmatrix}y\\n\end{pmatrix}=\cfrac{(y)_{(n)}}{n!}\end{align}

が成り立つことから、\(X\)の積率母関数は

\begin{align}M_X(t) &= \sum_{k=0}^{\infty}\cfrac{\begin{pmatrix}K\\k\end{pmatrix}\begin{pmatrix}N-K\\n-k\end{pmatrix}}{\begin{pmatrix}N\\n\end{pmatrix}}e^{t k}\\&=\sum_{k=0}^{\infty}\cfrac{(K)_{(k)}}{k!}\cfrac{(N-K)_{(n-k)}}{(n-k)!}\cfrac{n!}{(N)_{(n)}}e^{t k}\end{align}

である。ここで

\begin{align}\cfrac{(N-K)_{(n)}}{(N-K-n+1)^{(k)}}&=\cfrac{(N-K)!/(N-K-n)!}{(N-K-n+k)!/(N-K-n)!}\\&=\cfrac{(N-K)!}{(N-K-n+k)!}\\&=(N-K)_{(n-k)}\end{align}

であることより、

\begin{align}&\sum_{k=0}^{\infty}\cfrac{(K)_{(k)}}{k!}\cfrac{(N-K)_{(n-k)}}{(n-k)!}\cfrac{n!}{(N)_{(n)}}e^{t k}\\&=\cfrac{}{(N)_{(k)}}\sum_{k=0}^{\infty}\cfrac{(K)_{(k)}}{k!}\cfrac{(N-K)_{(n)}}{(N-K-n+1)^{(k)} }\cfrac{n!}{(n-k)!}e^{t k}\\\label{eq8}&=\cfrac{(N-K)_{(n)}}{(N)_{(n)}}\sum_{k=0}^{\infty}\cfrac{(K)_{(k)}(n)_{(k)}}{(N-K-n+1)^{(k)}k!}e^{t k}\tag{8}\end{align}

となる。ここに、\((y)^{(n)}\)は次の昇べきのポッホハマー記号である。

\begin{align}(y)^{(n)}=\cfrac{(y+n-1)!}{(y-1)!}.\end{align}

昇べきのポッホハマー記号に対して

\begin{align}(-y)^{(n)}=(-1)^n(y-n+1)^{(n)}\end{align}

が成り立つ。よって

\begin{align}(-K)^{(k)}(-n)^{(k)}&=(-1)^{2k}(K-k+1)^{(k)}(n-k+1)^{(k)}\\&=\cfrac{K!}{(K-k)!}\cfrac{n!}{(n-k)!}\\&=(K)_{(k)}(n)_{(k)}\end{align}

である。故に\eqref{eq8}は

\begin{align}& \cfrac{(N-K)_{(n)}}{(N)_{(n)}}\sum_{k=0}^{\infty}\cfrac{(K)_{(k)}(n)_{(k)}}{(N-K-n+1)^{(k)}k!}e^{t k}\\&=\cfrac{(N-K)_{(n)}}{(N)_{(n)}}\sum_{k=0}^{\infty}\cfrac{(-K)^{(k)}(-n)^{(k)}}{(N-K-n+1)^{(k)}k!}e^{t k}\\&=\cfrac{\begin{pmatrix}N-K\\n\end{pmatrix}\ _2F_1(-n, -K; N-K-n+1; e^{t})}{\begin{pmatrix}N\\n\end{pmatrix}}\end{align}

となる。

スポンサーリンク

  • この記事を書いた人
  • 最新記事

usagi-san

統計学とゲームとかをメインに解説していくよ。 数式とかプログラミングコードにミスがあったり質問があったりする場合はコメントで受け付けます。すぐに対応します。

-統計学
-