【統計学】母平均の信頼区間

標本が正規分布に従う場合の母平均の信頼区間の導出についてみていきます。

母分散が既知または未知である場合についてそれぞれの信頼区間を解説します。

母平均の差の信頼区間については以下を参照。

: 【統計学】母平均の差の信頼区間
標本が正規分布に従う場合の母平均の差の信頼区間の導出についてみていきます。母分散が既知または未知である場合について二群の母平均の差の信頼区間を解説します。母平均の信頼区間については以下の記事を参照 ...
続きを見る

信頼区間

信頼区間の定義は次で与えられる。

信頼区間

\(x_1, \ldots, x_n\)はパラメータ\(\theta\)をもつ分布からの大きさ\(n\)の標本とする。このとき、パラメータ\(\theta\)をもつ統計量を\(g(\theta)\)とすると、\(\theta\)の\(100(1 - \alpha ) \)%信頼区間は

\begin{align}\label{eq1} \mathrm{Pr}\{ l \leq g( \theta) \leq u\} = 1-\alpha \tag{1}\end{align}

を満たす区間\([l, u]\)で与えられる。

例えば\(\alpha = 0.05\)であるとき、\eqref{eq1}はパラメータ\(\theta\)は\(l\)と\(u\)の間に95%で存在することを意味する。また、\((1- \alpha)\)は信頼水準（confidence level, C.I.）と呼ばれる。

母平均の信頼区間

正規母集団\(N(\mu, \sigma^2)\)からの大きさ\(n\)の無作為標本\(x_1, \ldots, x_n\)が得られたときの、母平均\(\mu\)の\(100(1- \alpha)\)%信頼区間を紹介する。以降、標本平均を\(\bar{x} = (1 /n) \sum_{i = 1}^n x_i\)、不偏標本分散を\(u^2 = \sum_{i=1}^n (x_i - \bar{x})^2 / (n-1)\)、標準正規分布の上側\(\alpha\)点を\(Z_{\alpha}\)、自由度\(n\)のt分布の上側\(\alpha\)点を\(t_{n, \alpha}\)とする。

母平均の信頼区間（母分散が既知のとき）

母分散\(\sigma^2\)が既知であるとき、母平均\(\mu\)の\(100(1 - \alpha)\)%信頼区間は次で与えられる。

\begin{align} \label{eq2} \left[ \bar{x} - \cfrac{\sigma}{\sqrt{n}} Z_{\alpha/2} , \bar{x} + \cfrac{\sigma}{\sqrt{n}} Z_{\alpha/2}\right]. \tag{2} \end{align}

母平均の信頼区間（母分散が未知のとき）

母分散\(\sigma^2\)が未知であるとき、母平均\(\mu\)の\(100(1 - \alpha)\)%信頼区間は次で与えられる。

\begin{align} \label{eq3} \left[ \bar{x} - \cfrac{u}{\sqrt{n}} t_{n-1, \alpha/2}, \bar{x} + \cfrac{u}{\sqrt{n}} t_{n-1, \alpha/2}\right]. \tag{3}\end{align}

母平均の信頼区間の導出

正規母集団\(N(\mu, \sigma^2)\)からの大きさ\(n\)の無作為標本\(x_1, \ldots, x_n\)が得られたときの、母平均\(\mu\)の\(100(1- \alpha)\)%信頼区間の導出を行う。母分散\(\sigma^2\)が既知であるか未知であるかに分けてそれぞれの信頼区間を構成する。以降、導出の際に\(x_1, \ldots, x_n\)に対応する確率変数を\(X_1, \ldots, X_n\)とする。

母分散が既知のとき

\(X_1, \ldots, X_n\)は独立に\(N(\mu, \sigma^2)\)に従うので標本平均の分布より、\(\bar{X} = \sim N(\mu, \sigma^2 / n)\)である。よって

\begin{align}Z = \sqrt{n} (\bar{X} - \mu) / \sigma \sim N(0, 1).\end{align}

ここで、標準正規分布の上側\(\alpha\)%点を\(Z_{\alpha}\)とすると、確率変数\(Z\)は次を満たす。

\begin{align} &\mathrm{Pr}\{ -Z_{\alpha / 2} \leq Z \leq Z_{\alpha / 2}\} =1- \alpha\\ &\Leftrightarrow \mathrm{Pr}\{ -Z_{\alpha / 2} \leq \sqrt{n}(\bar{X} - \mu) / \sigma \leq Z_{\alpha / 2}\} =1- \alpha.\end{align}

よって\eqref{eq1}より、\(\sqrt{n}(\bar{X} - \mu) / \sigma\)の信頼区間は次ので表される。

\begin{align}-Z_{\alpha / 2} \leq \sqrt{n}(\bar{X} - \mu) / \sigma \leq Z_{\alpha / 2}. \end{align}

故に標本\(x_1, \ldots, x_n\)が与えられたとき、\(\mu\)について式変形を行うと\eqref{eq2}の母平均\(\mu\)の信頼区間を得る。

\begin{align} & - Z_{\alpha/2} \leq \sqrt{n}(\bar{x} - \mu) / \sigma \leq Z_{\alpha/2} \\ &\Leftrightarrow \bar{x} - \cfrac{\sigma}{\sqrt{n}} Z_{\alpha/2} \leq \mu \leq \bar{x} + \cfrac{\sigma}{\sqrt{n}} Z_{\alpha/2}. \end{align}

母分散が未知のとき

不偏標本分散の確率変数を\(U^2 = \sum_{i=1}^n(X_i- \bar{X})^2/(n-1)\)とする。\(X_1, \ldots, X_n\)は独立に\(N(\mu, \sigma^2)\)に従うので、標本分散の分布より\(\bar{X}\)と\(U^2\)は独立であることがいえる。さらに\(\bar{X} \sim N(\mu, \sigma^2 / n)\)、\((n-1) U^2 /\sigma^2 \sim \chi_{n-1}^2\)であるので

\begin{align}t &= \cfrac{Z}{\sqrt{ (n-1)U^2 / \sigma^2(n - 1)}} \\ &= \sqrt{n}(\bar{X} - \mu)/U . \sim t_{n-1}\end{align}

よって、自由度\(n-1\)のt分布の上側\(\alpha\)%点を\(t_{n-1, \alpha}\)とすると、確率変数\(t\)は次を満たす。

\begin{align} &\mathrm{Pr}\{ -t_{n-1, \alpha / 2} \leq t \leq t_{n-1, \alpha / 2}\} =1- \alpha\\ &\Leftrightarrow \mathrm{Pr}\{ -t_{n-1, \alpha / 2} \leq \sqrt{n}(\bar{X} - \mu) / U \leq t_{n-1, \alpha / 2}\} =1- \alpha.\end{align}

よって\eqref{eq1}より、\(\sqrt{n}(\bar{X} - \mu) / U\)の信頼区間は次ので表される。

\begin{align} -t_{n-1, \alpha / 2} \leq \sqrt{n}(\bar{X} - \mu) / U \leq t_{n-1, \alpha / 2}. \end{align}

故に標本\(x_1, \ldots, x_n\)が与えられたとき、\(\mu\)について式変形を行うと\eqref{eq3}の母平均\(\mu\)の信頼区間を得る。

\begin{align} & - t_{n-1, \alpha/2} \leq \sqrt{n}(\bar{x} - \mu) / u \leq t_{n-1, \alpha/2} \\ &\Leftrightarrow \bar{x} - \cfrac{u}{\sqrt{n}} t_{n-1, \alpha/2} \leq \mu \leq \bar{x} + \cfrac{u}{\sqrt{n}} t_{n-1, \alpha/2}. \end{align}