標本平均や標本分散、標本標準偏差、標本標準誤差について解説する。
標本平均と標本分散の定義を与え、実際にデータから標本平均や標本分散を計算する例を紹介する。
標本中央値や四分位数、標本相関係数については以下の記事を参照されたい。
標本平均や標本分散 様々な推定量
\(x_1, x_2, \ldots, x_n\)を\(n\)個の標本とする。標本(データ)の特徴を知るために、すなわち母集団分布の平均(位置母数)と分散(尺度母数)を推定するために、次で定義される標本平均と標本分散がよく用いられる。
標本平均
標本平均
標本\(x_1, x_2, \ldots, x_n\)の標本平均は次で与えられる。
\begin{align} \bar{x}= \cfrac{1}{n} \sum_{i = 1}^n x_i.\end{align}
標本分散
標本\(x_1, x_2, \ldots, x_n\)の標本分散は次で与えられる。
\begin{align} s^2= \cfrac{1}{n} \sum_{i = 1}^n (x_i - \bar{x})^2.\end{align}
また、母集団分布の分散の不偏推定量である次の不偏標本分散も分散の推定量として用いる。標本平均との差の二乗和を\(n-1\)で割ったもので与えられる。標本分散より不偏標本分散のバイアスの方が小さくなるという理由から不偏標本分散が推定量として用いられる。
不偏標本分散
標本\(x_1, x_2, \ldots, x_n\)の不偏標本分散は次で与えられる。
\begin{align} u^2= \cfrac{1}{n-1} \sum_{i = 1}^n (x_i - \bar{x})^2.\end{align}
データのばらつきの度合いの指標である標準偏差の推定量として、次の標本標準偏差と標本標準誤差がある。
標本標準偏差
標本\(x_1, x_2, \ldots, x_n\)の標本標準偏差(標準偏差)は次で与えられる。
\begin{align} SD &= u\\ &= \sqrt{\cfrac{1}{n- 1}\sum_{i = 1}^n(x_i - \bar{x})^2}.\end{align}
標本標準誤差
標本\(x_1, x_2, \ldots, x_n\)の標本標準誤差(標準誤差)は次で与えられる。
\begin{align} SE &= \cfrac{u}{\sqrt{n}}\\ &= \sqrt{\cfrac{\frac{1}{n-1} \sum_{i=1}^n(x_i- \bar{x})^2}{n}}.\end{align}
標本標準偏差\(SD\)は各データ\(x_1, x_2, \ldots, x_n\)のばらつきの度合いを表し、一方、標本標準誤差\(SE\)は標本平均\(\bar{x}\)のばらつきの度合いを表す。\(\bar{x}\)の分散が\(x_1, x_2, \ldots, x_n\)の分散を標本数\(n\)で割ったもので与えられるため、このことがいえる。詳しくは標本平均の分布を参照。
計算例
次の10個の標本\(x_1, x_2, \ldots, x_{10}\)が得られたとする。
このとき標本平均\(\bar{x}\)と標本分散\(s^2\)、不偏標本分散\(u^2\)は
\begin{align}\bar{x} &= \cfrac{1}{10} \sum_{i = 1}^{10}x_i \\ &= \cfrac{1}{10} (8 + 5 + 12 + 13 + 9 + 6 + 10 + 11 + 10 + 7)\\ &= \cfrac{91}{10} = 9.1,\\ s^2 &= \cfrac{1}{10} \sum_{i = 1}^{10}(x_i - \bar{x})^2\\ &= \cfrac{1}{10}\Biggl\{\left(8 - \cfrac{91}{10}\right)^2 + \left( 5 - \cfrac{91}{10}\right)^2 + \left(12 - \cfrac{91}{10}\right)^2 + \left(13 - \cfrac{91}{10}\right)^2 + \left( 9 - \cfrac{91}{10}\right)^2 \\ &\qquad\ \ \ + \left( 6 - \cfrac{91}{10}\right)^2 + \left(10 - \cfrac{91}{10}\right)^2 + \left( 11- \cfrac{91}{10}\right)^2 + \left( 10 - \cfrac{91}{10}\right)^2 + \left( 7- \cfrac{91}{10} \right)^2\Biggr\}\\ &= \cfrac{1}{10^3}\bigl\{(-11)^2 + (-41)^2 + 29^2 + 39^2+ 1^2 + (-31)^2 + 9^2 + 19^2 + 9^2 + (-21)^2\bigr\} \\ &= \cfrac{6090}{10^3} = 6.09,\\ u^2 &= \cfrac{10}{9}s^2 \\ &\approx 6.7667.\end{align}
また、標本標準偏差\(SD\)と標本標準誤差\(SE\)は
\begin{align} SD &= \sqrt{\frac{10}{10 - 1} s^2}\\ &= \sqrt{\cfrac{60.9}{9}} \\ &\approx 2.6013,\\ SE &= \cfrac{u}{\sqrt{10}} \\ &\approx 0.8226. \end{align}
また、次のグラフはこれらの推定値を用いてデータを要約したものである。太線が標本平均に、細い両端の線が標本平均±標本標準偏差に対応する。
データ要約