ノンパラメトリック検定の一種であるマン・ホイットニーのU検定について解説する。
マン・ホイットニーのU検定の概要と検定統計量の導出についてみていく。
マン・ホイットニーのU検定と同値な検定であるウィルコクソンの順位和検定については、次の記事を参照されたい。
-
【統計学】ウィルコクソンの順位和検定
ノンパラメトリックの検定の一種であるウィルコクソンの順位和検定について解説する。 ウィルコクソンの順位和検定の検定統計量と棄却域を紹介し、それらを導出する方法を紹介する。 順位和統計量の期待値と分散を ...
続きを見る
マン・ホイットニーのU検定
マン・ホイットニーのU検定は により提案された位置母数に対するノンパラメトリックである。
2標本のノンパラメトリック検定であるウィルコクソンの順位和検定と同値な検定としても知られている。ウィルコクソンの順位和検定と同様に、検定統計量は順位和からなる。
マン・ホイットニーのU検定の概要を以下にまとめる。
マン・ホイットニーのU検定
\begin{align}&H_0:\ \mathrm{Pr}\{ X > Y \} = \cfrac{1}{2}\\ &H_1:\ \mathrm{Pr}\{ X > Y \} \neq \cfrac{1}{2} \end{align}
この仮説検定のために、次の統計量を定義する。
\begin{align}U_1 &= W_1 - \cfrac{n_1(n_1 + 1)}{2}, \\ U_2 &= W_2 - \cfrac{n_2 (n_2 + 2) }{2}, \end{align}
ここに
\begin{align} W_i &= \sum_{j = 1}^{n_i} R_j . \end{align}
\(n_1, n_2 \to \infty\)の下で、次を検定統計量として用いる。
\begin{align}Z = \cfrac{U - \mathrm{E}[U]}{\sqrt{\mathrm{Var}[U]}} \sim N(0, 1), \end{align}
ここに
\begin{align}U &= \min(U_1 , U_2 ) , \\ \mathrm{E}[U] &=\cfrac{n_1 n_2}{2} , \\ \mathrm{Var}[U] &= \cfrac{n_1n_2(n_1+ n_2 + 1}{12}.\end{align}
また、有意水準\(\alpha\)の検定の棄却域は次で与えらえる。
\begin{align} (-\infty , - Z_{\alpha/ 2}] \cup [Z_{\alpha/ 2} , \infty), \end{align}
ここに\(Z_{\alpha}\)は標準正規分布の上側\(\alpha\)点である。
マン・ホイットニーのU検定の検定統計量の導出(期待値と分散の導出)はこの後、見ていく。
検定統計量の導出
マン・ホイットニーのU検定の検定統計量の導出を行う。
U統計量の期待値と分散を求めることで正規近似の下でのマン・ホイットニーのU検定の検定統計量を導出する。\(U_1 < U_2\)のとき
\begin{align}\mathrm{E}[U]&= \mathrm{E}[U_1] \\ &= \mathrm{E}\left[ W_1 - \cfrac{n_1(n_1 + 1)}{2} \right] \\ &= \mathrm{E} [ W_1] - \cfrac{n_1(n_1 + 1)}{2},\quad \mathrm{given}\ \mathrm{that}\ U_1 < U_2. \end{align}
ここでウィルコクソンの順位和統計量より、\(\mathrm{E}[W_1] =n_1(n_1 + n_2 + 1) / 2\)である。よって
\begin{align}\mathrm{E} [ W_1] - \cfrac{n_1(n_1 + 1)}{2} &= \cfrac{n_1(n_1 + n_2 + 1)}{2} - \cfrac{n_1(n_1 + 1)}{2} \\ &=\cfrac{n_1n_2}{2}.\end{align}
同様に\(U_1\geq U_2\)についても次のように計算できる。
\begin{align}\mathrm{E}[U]&= \mathrm{E}[U_2] \\ &= \mathrm{E}\left[ W_2 - \cfrac{n_2(n_2 + 1)}{2} \right] \\ &= \mathrm{E} [ W_2] - \cfrac{n_2(n_2 + 1)}{2} \\ &= \cfrac{n_2(n_1+n_2 + 1)}{2} - \cfrac{n_2(n_2 + 1)}{2} \\ &= \cfrac{n_1n_2}{2},\quad \mathrm{given}\ \mathrm{that}\ U_1 \geq U_2. \end{align}
したがって\(U_1\)と\(U_2\)の大小関係にかかわらず次が成り立つ。
\begin{align} \mathrm{E}[U] &= \cfrac{n_1n_2}{2} .\end{align}
分散についても同様に、\(U_1 < U_2\)のとき
\begin{align}\mathrm{Var}[U]&= \mathrm{Var}[U_1] \\ &= \mathrm{Var}\left[ W_1 - \cfrac{n_1(n_1 + 1)}{2} \right] \\ &= \mathrm{Var}[W_1 ], \quad \mathrm{given}\ \mathrm{that}\ U_1 < U_2.\end{align}
ここでウィルコクソンの順位和統計量より、\(\mathrm{Var}[W_1] =n_1n_2(n_1 + n_2 + 1) / 12\)である。よって
\begin{align}\mathrm{Var} [ W_1] - \cfrac{n_1(n_1 + 1)}{2} &= \cfrac{n_1n_2(n_1 + n_2 + 1)}{12} - \cfrac{n_1(n_1 + 1)}{2} \\ &=\cfrac{n_1n_2}{2}.\end{align}
同様に\(U_1\geq U_2\)についても次のように計算できる。
\begin{align}\mathrm{Var}[U]&= \mathrm{Var}[U_2] \\ &= \mathrm{Var}\left[ W_2 - \cfrac{n_2(n_2 + 1)}{2} \right] \\ &= \mathrm{Var} [ W_2]\\ &= \cfrac{n_1n_2(n_1+n_2 + 1)}{12} ,\quad \mathrm{given}\ \mathrm{that}\ U_1 \geq U_2. \end{align}
したがって\(U_1\)と\(U_2\)の大小関係にかかわらず次が成り立つ。
\begin{align} \mathrm{Var}[U] &= \cfrac{n_1n_2(n_1 + n_2 + 1)}{12} .\end{align}
マン・ホイットニーのU検定の期待値と分散が導出できた。故に\(n_1, n_2 \to \infty\)の下で次の検定統計量は標準正規分布に従う。
\begin{align}Z = \cfrac{U - n_1n_2 / 2}{\sqrt{ n_1n_2 (n_1 + n_2 + 1)/ 12}}. □\end{align}