偏差積和の公式とその導出について紹介する。
偏差積和の公式や標本分散や標本共分散との関係についてみていく。
偏差積和の公式
次の2つの偏差積和に関する公式について解説する。
\begin{align}a_x^2 &= \sum_{i = 1}^n (x_i- \bar{x})^2, \\ a_y^2 &= \sum_{i = 1}^n (y_i- \bar{y})^2, \\ a_{xy} &= \sum_{i = 1}^n(x_i - \bar{x})(y_i - \bar{y}),\end{align}
ここに
\begin{align}\bar{x} &= \cfrac{1}{n} \sum_{i = 1}^n x_i , \\ \bar{y} &= \cfrac{1}{n } \sum_{i = 1}^n y_i.\end{align}
偏差積和\(a_x^2\)、\(a_y^2\)、\(a_{xy}\)は次のように書ける。
\begin{align}a_x^2 &= \sum_{i = 1}^n x_i^2 - n\bar{x}^2, \\ a_y^2 &= \sum_{i = 1}^n y_i^2 - n\bar{y}^2, \\ a_{xy} &= \sum_{i = 1}^n x_iy_i - n \bar{x}\bar{y}.\end{align}
証明 偏差積和\(a_x^2\)、\(a_y^2\)、\(a_{xy}\)を展開するとそれぞれ次のようになる。
\begin{align}a_x^2 &=\sum_{i = 1}^n(x_i - \bar{x})^2 \\ &= \sum_{i = 1}^n(x_i ^2- 2x_i \bar{x} + \bar{x}^2) \\ &= \sum_{i = 1}^nx_i ^2- 2 \sum_{i = 1}^n x_i \bar{x} + \sum_{i = 1}^n \bar{x}^2 \\ &= \sum_{i = 1}^nx_i ^2- 2n \bar{x} \bar{x} + n \bar{x}^2 \\ &= \sum_{i = 1}^n x_i^2 - n\bar{x}^2,\\ a_y^2 &=\sum_{i = 1}^n(y_i - \bar{y})^2 \\ &= \sum_{i = 1}^n(y_i ^2- 2y_i \bar{y} + \bar{y}^2)\\ &= \sum_{i = 1}^n y_i^2 - n\bar{y}^2, \\ a_{xy} &= \sum_{i = 1}^n(x_i - \bar{x})(y_i - \bar{y}) \\ &= \sum_{i = 1}^n(x_i y_i - x_i \bar{y} - \bar{x}y_i + \bar{x}\bar{y}) \\ &= \sum_{i = 1}^nx_i y_i - \sum_{i = 1}^n x_i \bar{y} - \bar{x} \sum_{i = 1}^n y_i + \sum_{i = 1}^n \bar{x}\bar{y} \\ &= \sum_{i = 1}^nx_i y_i - n \bar{x} \bar{y} - \bar{x} n \bar{y} + n \bar{x}\bar{y} \\ &= \sum_{i = 1}^n x_iy_i - n \bar{x}\bar{y}.□\end{align}
標本分散や標本共分散との関係
標本分散と標本共分散、標本相関係数をそれぞれ次で与える。
\begin{align}s_x^2 &= \cfrac{1}{n} \sum_{ i = 1}^n (x_i - \bar{x})^2, \\ s_y &=\cfrac{1}{n} \sum_{ i = 1}^n (y_i - \bar{y})^2, \\ s_{xy} &= \cfrac{1}{n} \sum_{i = 1}^n (x_i - \bar{x})(y_i - \bar{y}) , \\ r_{x, y } &= \cfrac{s_{xy}}{s_x s_y} = \cfrac{\sum_{i = 1}^n (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{ \sum_{ i = 1}^n (x_i - \bar{x})^2 \sum_{ i = 1}^n (x_i - \bar{x})^2 \sum_{ i = 1}^n (y_i - \bar{y})^2}}. \end{align}
偏差積和の公式を用いることで、標本分散と標本共分散はそれぞれ次のように表すことができる。
\begin{align}s_x^2 &= \cfrac{1}{n} a_x^2 \\ &= \cfrac{1}{n} \sum_{i = 1}^n x_i^2 - \bar{x}^2, \\ s_{xy} &= \cfrac{1}{n} a_{xy} \\ &= \cfrac{1}{n}\sum_{i=1}^n x_iy_i - \bar{x}\bar{y}, \\ r_{x, y } &= \cfrac{a_{xy}}{a_x a_y} \\ &= \cfrac{ \sum_{i=1}^n x_iy_i - n\bar{x}\bar{y}}{\sqrt{ \left(\sum_{i = 1}^n x_i^2 - n\bar{x}^2\right) \left( \sum_{i = 1}^n y_i^2 -n \bar{y}^2\right) }}. \end{align}