【統計学】母平均の差の検定の検出力

標本の母集団分布が正規分布であるときの母平均の差の検出力についてみていく。

検出力の定義を与え、分散が既知であるときと未知であるときのそれぞれの検出力を導出する。

母平均の検出力については以下を参照。

: 【統計学】母平均の検定の検出力
標本の母集団分布が正規分布であるときの母平均の検出力についてみていく。検出力の定義を与え、分散が既知であるときと未知であるときのそれぞれの検出力を導出する。母平均の差の検出力については以下を参照。 ...
続きを見る

統計学入門 (基礎統計学Ⅰ)

統計学の入門書におすすめ！

¥3,080 （2022/06/27 19:34時点 | Amazon調べ）

Amazon

楽天市場

Yahooショッピング

ポチップ

日本統計学会公式認定統計検定 2級公式問題集[2018〜2021年]

¥1,980 （2022/06/27 19:37時点 | Amazon調べ）

Amazon

楽天市場

Yahooショッピング

ポチップ

母平均の差の検出力

検出力

帰無仮説を\(H_0\)、対立仮説を\(H_1\)とする仮説検定の検出力の定義は次のとおりである。

検出力

\begin{align}\mathrm{power} = \mathrm{Pr}\{\mathrm{reject}\ H_0 | H_1\}\end{align}

検出力は対立仮説\(H_1\)が真のときに、帰無仮説が\(H_0\)が棄却される確率である。第二種の過誤を\(\beta\)とすると、検出力は\(1-\beta\)で表現できる。すんわち、検出力とは、第二種の過誤が起こらない確率のことをいう。

母平均の差の検定の検出力

平均\(\mu_1\)、分散\(\sigma_1^2\)の正規分布から大きさ\(n_1\)の無作為標本\(x_{11}, \ldots, x_{1n_1}\)と平均\(\mu_2\)、分散\(\sigma_2^2\)の正規分布から大きさ\(n_2\)の無作為標本\(x_{21}, \ldots, x_{2n_2}\)を得たときの母平均の差の検定の検出力を以下にまとめる。

両側検定

次の母平均の仮説検定を考える。

\begin{align}&H_0:\ \mu_1 = \mu_2\\ &H_1:\ \mu_1 \neq \mu_2\end{align}

母平均の差の検定の検出力（分散が既知）

分散\(\sigma_1^2\)、\(\sigma_2^2\)が既知のとき、母平均の差の検定の検出力は次で与えられる。

\begin{align} \label{eq1} \mathrm{power} = 1 - \Phi\left( z_{\alpha / 2} - \cfrac{\mu_1 - \mu_2}{ \sqrt{ \sigma_1^2 / n_1 + \sigma_2^2 / n_2}} \right) + \Phi\left(- z_{\alpha / 2} - \cfrac{\mu_1 - \mu_2}{ \sqrt{ \sigma_1^2 / n_1 + \sigma_2^2 / n_2}} \right) \tag{1} ,\end{align}

ここに、\(z_{\alpha}\)は標準正規分布の上側\(\alpha\)点であり、\(\Phi(\cdot) \)は標準正規分布は分布関数である。

母平均の検定の検出力（分散が未知で同じとき）

分散\(\sigma_1^2\)、\(\sigma_2^2\)が未知かつ\(\sigma_1^2 = \sigma_2^2 = \sigma^2\)のとき、母平均の差の検定の検出力は次で与えられる。

\begin{align} \label{eq2}\mathrm{power} =1 - T_{n_1 + n_2 -2}\left(t_{n_1 + n_2 - 2, \alpha / 2} \left| \cfrac{\mu_1 - \mu_2}{\sqrt{(1 / n_1 + 1/ n_2) \sigma^2}}\right. \right) + T_{n_1 + n_2 - 2}\left(- t_{n_1 + n_2 - 2, \alpha / 2} \left| \cfrac{\mu_1 - \mu_2}{\sqrt{(1 / n_1 + 1/ n_2) \sigma^2}}\right. \right), \tag{2} \end{align}

ここに、\(t_{n, \alpha}\)は自由度\(n\)のt分布の上側\(\alpha\)点であり、\(T_n(\cdot | \lambda) \)は自由度\(n\)、非心パラメータ\(\lambda\)のt分布の分布関数である。

分散が既知のとき未知のときに関わらず、\(\mu_1 - \mu_2\)の差が大きいほど、標本数\(n_1\)、\(n_2\)が大きいほど、分散\(\sigma_1^2\)、\(\sigma_2^2\)が小さいほど検出力が大きくる。これは、\(H_0\)を仮定したときの母集団分布の平均と\(H_1\)のときの平均の差が大きいほど第二種の過誤が起こる確率が低くなることを意味する。また、標本数が大きくなるほど標本平均\(\bar{X}_1\)、\(\bar{X}_2\)の分散が小さくなるため第二種の過誤が小さくなる。

片側検定

便宜上右片側検定のみ扱う。次の母平均の検定を考える。

\begin{align}&H_0:\ \mu_1 = \mu_2\\ &H_1:\ \mu_1 > \mu_2\end{align}

母平均の検定の検出力（分散が既知のとき）

分散\(\sigma_1^2\)、\(\sigma_2^2\)が既知のとき、母平均の差の検定の検出力は次で与えられる。

\begin{align} \label{eq3} \mathrm{power} = 1 - \Phi\left( z_{\alpha } - \cfrac{\mu_1 - \mu_2}{ \sqrt{ \sigma_1^2 / n_1 + \sigma_2^2 / n_2}} \right). \tag{3}\end{align}

母平均の検定の検出力（分散が未知で同じとき）

分散\(\sigma_1^2 = \sigma_2^2 = \sigma^2\)が未知のとき、母平均の差の検定の検出力は次で与えられる。

\begin{align} \label{eq4} \mathrm{power} =1 - T_{n_1 + n_2 -2}\left(t_{n_1 + n_2 - 2, \alpha} \left| \cfrac{\mu_1 - \mu_2}{\sqrt{(1 / n_1 + 1/ n_2) \sigma^2}}\right. \right) .\tag{4} \end{align}

母平均の差の検定の検出力の導出

両側検定

\begin{align}&H_0:\ \mu_1 = \mu_2 \\ &H_1:\ \mu_1 \neq \mu_2\end{align}

の検出力を分散が既知のときと未知のときに分けて導出する。

分散が既知のとき

検出力の定義と分散が既知のときの母平均の検定の棄却域より、分散が既知のときの検定統計量を\(Z\)とすると、検出力は次のように表せる。

\begin{align}\mathrm{power} &= \mathrm{Pr}\{\mathrm{reject}\ H_0 | H_1\}\\ &= \mathrm{Pr}\{ |Z| > z_{\alpha / 2}| H_1\}\\ &= \mathrm{Pr}\left\{ \left. \left| \cfrac{ \bar{X}_1 - \bar{X}_2 }{\sqrt{ \sigma_1^2 / n_1 + \sigma_2^2 / n_2} } \right| > z_{\alpha / 2} \right| H_1 \right\} \\ &= \mathrm{Pr}\left\{ \left. \left| \cfrac{ \bar{X}_1 - \bar{X}_2 - (\mu_1 - \mu_2) + (\mu_1 - \mu_2)}{ \sqrt{ \sigma_1^2 / n_1 + \sigma_2^2 / n_2}} \right| > z_{\alpha / 2} \right| H_1 \right\} \\ &= \mathrm{Pr}\left\{ \left.\cfrac{ \bar{X}_1 - \bar{X}_2 - (\mu_1 - \mu_2) + (\mu_1 - \mu_2)}{ \sqrt{ \sigma_1^2 / n_1 + \sigma_2^2 / n_2}} < - z_{\alpha / 2}\ \mathrm{and}\ z_{\alpha / 2} < \cfrac{ \bar{X}_1 - \bar{X}_2 - (\mu_1 - \mu_2) + (\mu_1 - \mu_2)}{ \sqrt{ \sigma_1^2 / n_1 + \sigma_2^2 / n_2}} \right| H_1 \right\}\\ &= \mathrm{Pr}\left\{ \left.\cfrac{ \bar{X}_1 - \bar{X}_2 - (\mu_1 - \mu_2)}{ \sqrt{ \sigma_1^2 / n_1 + \sigma_2^2 / n_2}} < - z_{\alpha / 2} - \cfrac{\mu_1 - \mu_2}{ \sqrt{ \sigma_1^2 / n_1 + \sigma_2^2 / n_2}} \ \mathrm{and}\ z_{\alpha / 2} - \cfrac{\mu_1 - \mu_2}{ \sqrt{ \sigma_1^2 / n_1 + \sigma_2^2 / n_2}} < \cfrac{ \bar{X}_1 - \bar{X}_2 - (\mu_1 - \mu_2)}{ \sqrt{ \sigma_1^2 / n_1 + \sigma_2^2 / n_2}} \right| H_1 \right\} \\ &= 1 - \Phi\left( z_{\alpha / 2} - \cfrac{\mu_1 - \mu_2}{ \sqrt{ \sigma_1^2 / n_1 + \sigma_2^2 / n_2}} \right) + \Phi\left(- z_{\alpha / 2} - \cfrac{\mu_1 - \mu_2}{ \sqrt{ \sigma_1^2 / n_1 + \sigma_2^2 / n_2}} \right), \end{align}

ここに、\(\bar{X}_i\)は標本平均\(\bar{X}_i = (1 / n_i) \sum_{j=1}^{n_i} X_{ij},\ i = 1,2\)、\(z_{\alpha/2}\)は標準正規分布の上側\(\alpha/2\)点であり、\(\Phi(\cdot) \)は標準正規分布は分布関数である。\eqref{eq1}の検出力が示せた。

分散が未知のとき

分散が既知のときと同様に、分散が未知のときの母平均の検定の棄却域より、分散が未知のときの検定統計量を\(t\)とすると、\eqref{eq2}の検出力を得る。

\begin{align}\mathrm{power} &= \mathrm{Pr}\{\mathrm{reject}\ H_0 | H_1\}\\ &= \mathrm{Pr}\{ |t| > t_{n_1 + n_2 -2, \alpha / 2}| H_1\}\\ &= \mathrm{Pr}\left\{ \left| \cfrac{ \bar{X}_1 - \bar{X}_2}{\sqrt{(1 / n_1 + 1 / n_2)U^2}} > t_{n_1 + n_2 - 2, \alpha / 2} \right| H_1 \right\} \\ &= \mathrm{Pr}\left\{ \left. \left| \cfrac{ \{\bar{X}_1 - \bar{X}_2 - (\mu_1 - \mu_2) + (\mu_1 - \mu_2)\} / \sqrt{(1 / n_1 + 1/ n_2) \sigma^2} }{\sqrt{(n_1 + n_2 - 2)U^2 / \sigma^2(n_1 + n_2 - 2)}} \right| > t_{n_1 + n_2 - 2, \alpha / 2} \right| H_1 \right\} \\ &= \mathrm{Pr}\left\{ \left. \cfrac{Z + \sqrt{n}(\mu_1 - \mu_2) / \sqrt{(1 / n_1 + 1 / n_2)\sigma^2} / \sigma}{V / (n_1 + n_2 -2)} < - t_{n_1 + n_2 -2, \alpha / 2}\ \mathrm{and}\ t_{n_1 + n_2 - 2, \alpha / 2} < \cfrac{ Z + (\mu_1 - \mu_2) / \sqrt{(1 / n_1 + 1/ n_2) \sigma^2}}{V / (n_1 + n_2 - 2)} \right| H_1 \right\} \\ &= 1 - T_{n_1 + n_2 - 2}\left(t_{n_1 + n_2 - 2, \alpha / 2} \left| \cfrac{\mu_1 - \mu_2}{\sqrt{(1 / n_1 + 1/ n_2) \sigma^2}}\right. \right) + T_{n_1 + n_2 - 2}\left(- t_{n_1 + n_2 - 2, \alpha / 2} \left| \cfrac{\mu_1 - \mu_2}{\sqrt{(1 / n_1 + 1/ n_2) \sigma^2}}\right. \right) , \end{align}

ここに、\(U^2\)は次のプール不偏標本分散

\begin{align}\\ U^2 &= \cfrac{(n_1-1) U_1^2+ (n_2 - 1)U_2^2}{n_1 + n_2 - 2},\\ U_i^2 &= \cfrac{1}{n_i - 1}\sum_{j=1}^{n_i}(X_{ij} - \bar{X}_i)^2.\end{align}

また、\(Z\)と\(V\)はそれぞれ\(H_1\)の下で標本平均\(\bar{X}\)を標準化した変数と\(U^2\)から構成されるカイ2乗統計量

\begin{align}Z &= \cfrac{\bar{X}_1 \bar{X}_2 - (\mu_1 -\mu_2)}{ \sqrt{(1 / n_1 + 1 / n_2)\sigma^2}} \sim N(0,1), \\ V &= (n-1)U^2 / \sigma^2 \sim \chi_{n_1 + n_2 - 2}^2,\end{align}

\(t_{n_1 + n_2 -2, \alpha/2}\)は自由度\(n_1 + n_2 - 2\)のt分布の上側\(\alpha/2\)点であり、\(T_{n_1 + n_2 -2}(\cdot| \lambda) \)は自由度\(n_1 + n_2 -2\)、非心パラメータ\(\lambda\)のt分布は分布関数である。

片側検定

右片側検定

\begin{align} &H_0:\ \mu_1 = \mu_2\\ &H_1:\ \mu_1 > \mu_2 \end{align}

の検出力を分散が既知であるときと未知であるときに分けて導出する。左片側検定の検出力は同様にして導出できるので省略する。

分散が既知のとき

分散が既知のときの母平均の検定の棄却域より、分散が既知のときの検定統計量を\(Z\)とすると、検出力は次のように表せる。

\begin{align}\mathrm{power} &= \mathrm{Pr}\{\mathrm{reject}\ H_0 | H_1\}\\ &= \mathrm{Pr}\{ Z > z_{\alpha }| H_1\}\\ &= \mathrm{Pr}\left\{\left. \cfrac{ \bar{X}_1 - \bar{X}_2 }{\sqrt{ \sigma_1^2 / n_1 + \sigma_2^2 / n_2} } > z_{\alpha} \right| H_1 \right\} \\ &= \mathrm{Pr}\left\{\left. \cfrac{ \bar{X}_1 - \bar{X}_2 - (\mu_1 - \mu_2) + (\mu_1 - \mu_2)}{ \sqrt{ \sigma_1^2 / n_1 + \sigma_2^2 / n_2}} > z_{\alpha} \right| H_1 \right\} \\ &= \mathrm{Pr}\left\{ \left.\cfrac{ \bar{X}_1 - \bar{X}_2 - (\mu_1 - \mu_2) + (\mu_1 - \mu_2)}{ \sqrt{ \sigma_1^2 / n_1 + \sigma_2^2 / n_2}} > z_{\alpha} \right| H_1 \right\}\\ &= \mathrm{Pr}\left\{ \left.\cfrac{ \bar{X}_1 - \bar{X}_2 - (\mu_1 - \mu_2)}{ \sqrt{ \sigma_1^2 / n_1 + \sigma_2^2 / n_2}} > z_{\alpha} - \cfrac{\mu_1 - \mu_2}{ \sqrt{ \sigma_1^2 / n_1 + \sigma_2^2 / n_2}} \right| H_1 \right\} \\ &= 1 - \Phi\left( z_{\alpha } - \cfrac{\mu_1 - \mu_2}{ \sqrt{ \sigma_1^2 / n_1 + \sigma_2^2 / n_2}} \right) .\end{align}

\eqref{eq3}の検出力が示せた。

分散が未知のとき

分散が未知のときの母平均の検定の棄却域より、分散が既知のときの検定統計量を\(Z\)とすると、次の\eqref{eq4}の母平均の検定の検出力を得る。

\begin{align}\mathrm{power} &= \mathrm{Pr}\{\mathrm{reject}\ H_0 | H_1\}\\ &= \mathrm{Pr}\{ t > t_{n_1 + n_2 - 2, \alpha }| H_1\}\\ &= \mathrm{Pr}\left\{\left. \cfrac{ \bar{X}_1 - \bar{X}_2}{\sqrt{(1 / n_1 + 1 / n_2)U^2}} > t_{n_1 + n_2 - 2, \alpha} \right| H_1 \right\} \\ &= \mathrm{Pr}\left\{ \left. \cfrac{ \{\bar{X}_1 - \bar{X}_2 - (\mu_1 - \mu_2) + (\mu_1 - \mu_2)\} / \sqrt{(1 / n_1 + 1/ n_2) \sigma^2} }{\sqrt{(n_1 + n_2 - 2)U^2 / \sigma^2(n_1 + n_2 - 2)}} > t_{n_1 + n_2 -2, \alpha} \right| H_1 \right\} \\ &= \mathrm{Pr}\left\{ \left. \cfrac{Z + \sqrt{n}(\mu_1 - \mu_2) / \sqrt{(1 / n_1 + 1 / n_2)\sigma^2} / \sigma}{V / (n_1 + n_2 -2)} > t_{n_1 + n_2 -2, \alpha }\right| H_1 \right\} \\ &= 1 - T_{n_1 + n_2 -2}\left(t_{n_1 + n_2 - 2, \alpha} \left| \cfrac{\mu_1 - \mu_2}{\sqrt{(1 / n_1 + 1/ n_2) \sigma^2}}\right. \right) . \end{align}