多変量の離散分布のモーメント　多項分布の期待値・分散・共分散【統計学】

多変量の離散確率分布である多項分布のモーメントについてみていく。

離散確率分布のモーメントの定義より、多項分布の期待値、分散、共分散を導出する。

単変量の離散確率分布のモーメントに関しては、離散分布のモーメントを参照されたい。

多変量の離散分布のモーメント

多変量の離散分布のモーメントの定義を与える。次に与えるモーメントの定義は、多項分布の期待値、分散、共分散を求める際に用いる。

多変量の離散分布の期待値

離散確率変数\(X_1, \ldots, X_k\)は同時確率関数

\(\mathrm{Pr}\{X_1 = x_{1l_1}, \ldots,X_k = x_{kl_k}\},\ l_1 = 1, 2, \ldots,\ l_k = 1, 2, \ldots.\)

をもつとする。このとき、\(X_1^{h_1}\cdots X_k{h_k}\)の同時モーメントは次で定義される。

\begin{align}\label{eq1} \mathrm{E}\left[X_1^{h_1}\cdots X_k{h_k}\right] = \sum_{l_1, l_k = 1}^{\infty}x_{1l_1}^{h_1}\cdots x_{kl_k}{h_k} \mathrm{Pr}\{X_1 = x_1, \ldots,X_k = x_k\}.\tag{1}\end{align}

\eqref{eq1}より、\(X_i,\ i = 1, \ldots, k\)や\(X_i^2,\ i=1,\ldots, k\)などのモーメントを計算することができ、周辺分布の期待値や分散を求めることができる。すなわち、周辺分布を導出することで\(X_i,\ i=1, \ldots, k\)に関するモーメントを求めることが可能である。

離散分布のモーメントで紹介したが、式\eqref{eq1}は離散分布の\(k\)次モーメントを多変量に拡張したものであることが分かる。

多項分布のモーメント

離散確率変数\(X_1, \ldots, X_k\)がパラメータ\(n,\ p_1, \ldots, p_k\)の多項分布に従うとする。このとき、\(X_1, \ldots, X_k\)は次の確率関数をもつ。

\begin{align}\mathrm{Pr}\{X_1 = x_1 , \ldots, X_k = x_k\} = \left\{ \begin{array}{cc} \cfrac{n!}{x_1! \cdots x_k!} p_1^{x_1} \cdots p_k^{x_k}, & \sum_{i=1}^kx_i = n,\\ 0, & otherwise.\end{array} \right.\end{align}

確率変数\(X_i\)の期待値と分散、\(X_i\)と\(X_j\)の共分散はそれぞれ

\begin{align}\mathrm{E}[X_i] &= np_i,\\ \mathrm{Var}[X_i]&= np_i(1-p_i),\\ \mathrm{Cov}[X_i, X_j] &= -np_ip_j\end{align}

である。

証明　\(X_i\)の期待値と\(X_i\)と\(X_j\)の共分散を求めるために、\(X_i\)についての周辺化と\(X_i\)、\(X_j\)についての周辺化を行う。\(X_i\)の周辺確率関数は

\begin{align}\mathrm{Pr}\{X_i = x_i\} &= \sum_{\substack{x_j,\ \ j \neq i\\ \sum_{\substack{j=1\\j\neq i}}x_j = n- x_i}} \cfrac{n!}{\prod_{l=1}^k x_l!}\prod_{l=1}^k p_l^{x_l}\\&=\cfrac{n!(1- p_i)^{n-x_i}}{(n-x_i)!x_i!} p_i^{x_i} \sum_{\substack{x_j,\ \ j \neq i\\ \sum_{\substack{j=1\\j\neq i}}x_j = n- x_i}} \cfrac{(n-x_i)!}{\prod_{\substack{l=1\\ l\neq i}}^k x_l!}\prod_{\substack{l=1\\ l\neq i}}^k \left(\cfrac{p_l}{1-p_i}\right)^{x_l}\\&=\begin{pmatrix}n\\x_i\end{pmatrix} p_i^{x_i}(1- p_i)^{n-x_i}.\end{align}

\(X_i\)と\(X_j\)の同時確率関数は

\begin{align}&\mathrm{Pr}\{X_i = x_i, X_j = x_j\}\\ &= \sum_{\substack{x_l,\ \ l \neq i,\ l\neq j\\ \sum_{\substack{l=1\\l\neq i,\ l\neq j}}x_l = n- x_i-x_j}} \cfrac{n!}{\prod_{m=1}^k x_m!}\prod_{m=1}^k p_m^{x_m}\\&= \cfrac{n!(1- p_i)^{n-x_i-x_j}}{(n-x_i-x_j)!x_i!x_j!} p_i^{x_i}p_j^{x_j} \\&\quad \cdot \sum_{\substack{x_l,\ \ l \neq i,\ l\neq j\\\sum_{\substack{l=1\\l\neq i,\ l\neq j}}x_l = n- x_i-x_j}} \cfrac{(n-x_i-x_j)!}{\prod_{\substack{m=1\\ m\neq i,\ m\neq j}}^k x_m!}\prod_{\substack{m=1\\ m\neq i,\ m\neq j}}^k \left(\cfrac{p_m}{1-p_i-p_j}\right)^{x_m}\\&=\cfrac{n!}{(n-x_i-x_j)!x_i!x_j!} p_i^{x_i}p_j^{x_j} (1- p_i)^{n-x_i-x_j}.\end{align}

\(X_i,\ i=1, \ldots, k\)の確率関数はパラメータ\(n\)、\(p_i\)の二項分布であることから、\(X_i\)の期待値と分散はそれぞれ

\begin{align}\mathrm{E}[X_i] &= np_i,\\\mathrm{Var}(X_i)&=np_i(1-p_i)\end{align}

である。また\(\mathrm{E}[X_iX_j]\)は

\begin{align}&\mathrm{E}[X_iX_j] \\&= \sum_{x_i, x_j}xix_j\cfrac{n!}{(n-x_i-x_j)!x_i!x_j!} p_i^{x_i}p_j^{x_j} (1- p_i)^{n-x_i-x_j}\\&= n(n-1)p_ip_j\\&\quad \cdot\sum_{x_i, x_j}\biggl[\cfrac{(n-2)!}{[(n-1)-(x_-1)i-(x_j-1)]!(x_i-1)!(x_j-1)!}\\&\qquad\qquad p_i^{x_i-1}p_j^{x_j-1} (1- p_i)^{(n-2)-(x_i-1)-(x_j-1)}\biggr]\\&= n(n-1)p_ip_j\end{align}

である。したがって\(X_i\)と\(X_j\)の共分散は

\begin{align}\mathrm{Cov}[X_i, X_j] &= \mathrm{E}(X_iX_j)-\mathrm{E}(X_i)\mathrm{E}(X_j)\\&= n(n-1)p_ip_j - np_i np_j\\&= p_ip_j[n(n-1) - n^2]\\&= -np_ip_j.\end{align}

□