統計学

多変量の離散分布のモーメント 多項分布の期待値・分散・共分散【統計学】

  1. HOME >
  2. 統計学 >

多変量の離散分布のモーメント 多項分布の期待値・分散・共分散【統計学】

スポンサーリンク

多変量の離散確率分布である多項分布のモーメントについてみていく。

離散確率分布のモーメントの定義より、多項分布の期待値、分散、共分散を導出する。

単変量の離散確率分布のモーメントに関しては、離散分布のモーメントを参照されたい。

多変量の離散分布のモーメント

多変量の離散分布のモーメントの定義を与える。次に与えるモーメントの定義は、多項分布の期待値、分散、共分散を求める際に用いる。

多変量の離散分布の期待値

多変量の離散分布の期待値

離散確率変数\(X_1, \ldots, X_k\)は同時確率関数

\(\mathrm{Pr}\{X_1 = x_{1l_1}, \ldots,X_k = x_{kl_k}\},\ l_1 = 1, 2, \ldots,\ l_k = 1, 2, \ldots.\)

をもつとする。このとき、\(X_1^{h_1}\cdots X_k{h_k}\)の同時モーメントは次で定義される。

\begin{align}\label{eq1} \mathrm{E}\left[X_1^{h_1}\cdots X_k{h_k}\right] = \sum_{l_1, l_k = 1}^{\infty}x_{1l_1}^{h_1}\cdots x_{kl_k}{h_k} \mathrm{Pr}\{X_1 = x_1, \ldots,X_k = x_k\}.\tag{1}\end{align}

\eqref{eq1}より、\(X_i,\ i = 1, \ldots, k\)や\(X_i^2,\ i=1,\ldots, k\)などのモーメントを計算することができ、周辺分布の期待値や分散を求めることができる。すなわち、周辺分布を導出することで\(X_i,\ i=1, \ldots, k\)に関するモーメントを求めることが可能である。

離散分布のモーメントで紹介したが、式\eqref{eq1}は離散分布の\(k\)次モーメントを多変量に拡張したものであることが分かる。

多項分布のモーメント

多項分布のモーメント

離散確率変数\(X_1, \ldots, X_k\)がパラメータ\(n,\ p_1, \ldots, p_k\)の多項分布に従うとする。このとき、\(X_1, \ldots, X_k\)は次の確率関数をもつ。

\begin{align}\mathrm{Pr}\{X_1 = x_1 , \ldots, X_k = x_k\} = \left\{ \begin{array}{cc} \cfrac{n!}{x_1! \cdots  x_k!} p_1^{x_1} \cdots p_k^{x_k}, & \sum_{i=1}^kx_i = n,\\ 0, & otherwise.\end{array} \right.\end{align}

確率変数\(X_i\)の期待値と分散、\(X_i\)と\(X_j\)の共分散はそれぞれ

\begin{align}\mathrm{E}[X_i] &= np_i,\\ \mathrm{Var}[X_i]&= np_i(1-p_i),\\ \mathrm{Cov}[X_i, X_j] &= -np_ip_j\end{align}

である。

証明 \(X_i\)の期待値と\(X_i\)と\(X_j\)の共分散を求めるために、\(X_i\)についての周辺化と\(X_i\)、\(X_j\)についての周辺化を行う。\(X_i\)の周辺確率関数は

\begin{align}\mathrm{Pr}\{X_i = x_i\} &= \sum_{\substack{x_j,\ \ j \neq i\\ \sum_{\substack{j=1\\j\neq i}}x_j = n- x_i}} \cfrac{n!}{\prod_{l=1}^k x_l!}\prod_{l=1}^k p_l^{x_l}\\&=\cfrac{n!(1- p_i)^{n-x_i}}{(n-x_i)!x_i!} p_i^{x_i} \sum_{\substack{x_j,\ \ j \neq i\\ \sum_{\substack{j=1\\j\neq i}}x_j = n- x_i}} \cfrac{(n-x_i)!}{\prod_{\substack{l=1\\ l\neq i}}^k x_l!}\prod_{\substack{l=1\\ l\neq i}}^k \left(\cfrac{p_l}{1-p_i}\right)^{x_l}\\&=\begin{pmatrix}n\\x_i\end{pmatrix} p_i^{x_i}(1- p_i)^{n-x_i}.\end{align}

\(X_i\)と\(X_j\)の同時確率関数は

\begin{align}&\mathrm{Pr}\{X_i = x_i, X_j = x_j\}\\ &= \sum_{\substack{x_l,\ \ l \neq i,\ l\neq j\\ \sum_{\substack{l=1\\l\neq i,\ l\neq j}}x_l = n- x_i-x_j}} \cfrac{n!}{\prod_{m=1}^k x_m!}\prod_{m=1}^k p_m^{x_m}\\&= \cfrac{n!(1- p_i)^{n-x_i-x_j}}{(n-x_i-x_j)!x_i!x_j!} p_i^{x_i}p_j^{x_j} \\&\quad \cdot \sum_{\substack{x_l,\ \ l \neq i,\ l\neq j\\\sum_{\substack{l=1\\l\neq i,\ l\neq j}}x_l = n- x_i-x_j}} \cfrac{(n-x_i-x_j)!}{\prod_{\substack{m=1\\ m\neq i,\ m\neq j}}^k x_m!}\prod_{\substack{m=1\\ m\neq i,\ m\neq j}}^k \left(\cfrac{p_m}{1-p_i-p_j}\right)^{x_m}\\&=\cfrac{n!}{(n-x_i-x_j)!x_i!x_j!} p_i^{x_i}p_j^{x_j} (1- p_i)^{n-x_i-x_j}.\end{align}

\(X_i,\ i=1, \ldots, k\)の確率関数はパラメータ\(n\)、\(p_i\)の二項分布であることから、\(X_i\)の期待値と分散はそれぞれ

\begin{align}\mathrm{E}[X_i] &= np_i,\\\mathrm{Var}(X_i)&=np_i(1-p_i)\end{align}

である。また\(\mathrm{E}[X_iX_j]\)は

\begin{align}&\mathrm{E}[X_iX_j] \\&= \sum_{x_i, x_j}xix_j\cfrac{n!}{(n-x_i-x_j)!x_i!x_j!} p_i^{x_i}p_j^{x_j} (1- p_i)^{n-x_i-x_j}\\&= n(n-1)p_ip_j\\&\quad \cdot\sum_{x_i, x_j}\biggl[\cfrac{(n-2)!}{[(n-1)-(x_-1)i-(x_j-1)]!(x_i-1)!(x_j-1)!}\\&\qquad\qquad p_i^{x_i-1}p_j^{x_j-1} (1- p_i)^{(n-2)-(x_i-1)-(x_j-1)}\biggr]\\&= n(n-1)p_ip_j\end{align}

である。したがって\(X_i\)と\(X_j\)の共分散は

\begin{align}\mathrm{Cov}[X_i, X_j] &= \mathrm{E}(X_iX_j)-\mathrm{E}(X_i)\mathrm{E}(X_j)\\&= n(n-1)p_ip_j - np_i np_j\\&= p_ip_j[n(n-1) - n^2]\\&= -np_ip_j.\end{align}

スポンサーリンク

  • この記事を書いた人
  • 最新記事

usagi-san

統計学とゲームとかをメインに解説していくよ。 数式とかプログラミングコードにミスがあったり質問があったりする場合はコメントで受け付けます。すぐに対応します。

-統計学
-