【統計学】正規分布の確率密度関数

統計学や確率論で重要な正規分布の確率密度関数を厳密に導出していきます。

確率変数が正規分布に従うなどの仮定は一切用いずに証明していきます。

分布の対称性やベルカーブの性質などを用いて、導出していきます。

統計学入門 (基礎統計学Ⅰ)

統計学の入門書におすすめ！

¥3,080 （2022/06/27 19:34時点 | Amazon調べ）

Amazon

楽天市場

Yahooショッピング

ポチップ

改訂版日本統計学会公式認定統計検定2級対応統計学基礎

統計学の基礎を学習したい方へ

¥2,420 （2022/06/08 18:12時点 | Amazon調べ）

Amazon

楽天市場

Yahooショッピング

ポチップ

正規分布

正規分布の確率密度関数

確率変数\(X\)が次の確率密度関数をもつとき、\(X\)は正規分布に従うという。\begin{align}f(x) = \cfrac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\cfrac{(x-\mu)^2}{2\sigma^2}\right\},\end{align}ここに、\(\mu\)は実数であり、\(\sigma^2>0\)である。

\(X\)が上式の確率密度関数をもつとき、\(X\)は正規分布、またはガウス分布に従うという。次に、この確率密度関数がどのように導出されたかみていく。

確立密度関数の導出

正規分布の確率密度関数の導出をする。まず前提として、同一の確率密度関数\(f\)をもつ互いに独立な確率変数\(X_1\)と\(X_2\)について、次の微小区間の確率を与える。

\begin{align}\mathrm{Pr}\{x_1 \leq X_1 \leq x_1+\Delta x_1\} &= \int_{x_1}^{x_1+\Delta x_1}f(u)du \approx f(x_1)\Delta x_1,\\\mathrm{Pr}\{x_2 \leq X_2 \leq x_2+\Delta x_2\} &= \int_{x_2}^{x_2+\Delta x_2}f(u)du \approx f(x_2)\Delta x_2.\end{align}

ここで、\(x_1\)と\(x_2\)は互いに独立であることより、\(X_1\)と\(X_2\)の同時密度関数は\(f(x_1, x_2)=f(x_1)f(x_2)\)である。よって、上式のの領域は次で表すことができる。

\begin{align}\mathrm{Pr}\{x_1 \leq X_1 \leq x_1+\Delta x_1, x_2 \leq X_2 \leq x_2+\Delta x_2\}&=f(x_1, x_2)\Delta x_1 \Delta x_2\\&= f(x_1)f(x_2)\Delta x_1\Delta x_2.\end{align}

また、これら2つの分布が原点\((0, 0)\)が中心ではなく、\((\mu, \mu)\)が中心であるとき、つまり中心\((0, 0)\)の確率密度関数\(g\)をもつ確率変数を\(Y_1 = X_1 + \mu\)、\(Y_2=X_2+\mu\)のとき、領域は次で与えられる。

\begin{align}&\mathrm{Pr}\{x_1 \leq Y_1\leq x_1+\Delta x_1, x_2 \leq Y_2\leq x_2+\Delta x_2\}\\&=\mathrm{Pr}\{x_1+\mu \leq Y_1+\mu \leq x_1+\mu+\Delta x_1, x_2 +\mu\leq Y_2+\mu\leq x_2+\mu+\Delta x_2\}\\&=\mathrm{Pr}\{x_1+\mu \leq X_1 \leq x_1+\mu+\Delta x_1, x_2 +\mu\leq X_2\leq x_2+\mu+\Delta x_2\}\\&=\int_{x_1+\mu}^{x_1+\mu+\Delta x_1}\int_{x_2+\mu}^{x_2+\mu+\Delta x_2}f(x_1)f(x_2)dx_1dx_2\\\label{eq1}&= f(x_1+\mu)f(x_2+\mu)\Delta x_1 \Delta x_2.\tag{1}\end{align}

また次のように、\eqref{eq1}の確率密度\(f(x_1+\mu)f(x_2+\mu)\)と等しい確率密度をもつ確率変数を\(R\)とし、この確率密度関数を\(h(r)\)とする。

\begin{align}f(x_1+\mu)f(x_2+\mu)\Delta x_1 \Delta x_ 2= h(r)\Delta x_1 \Delta x_2.\end{align}

関数\(h(r)\)は、角度\(\theta\)に依らないことを仮定している。極座標変換\(x_1 = r\sin\theta\)、\(x_2=r\cos\theta\)を用いると

\begin{align}\cfrac{dh(r)}{d\theta} &= f(x_2+\mu)\cfrac{d}{d\theta}f(x_1+\mu) + f(x_1+\mu)\cfrac{d}{d\theta}f(x_2+\mu)\\&= f(x_2+\mu)\cfrac{df(x_1+\mu)}{d(x_1+\mu)}\cfrac{d(x_1+\mu)}{d\theta} + f(x_1+\mu)\cfrac{df(x_2+\mu)}{d(x_2+\mu)}\cfrac{d(x_2+\mu)}{d\theta}\\&=f(x_2+\mu)f'(x_1+\mu)(-r\sin\theta)+f(x_1+\mu)f'(x_2+\mu)r\cos\theta\end{align}

が成り立つ。故に、次の関係が示された。

\begin{align}\label{eq2}0=f(x_1+\mu)f'(x_2+\mu)r\cos\theta-f(x_2+\mu)f'(x_1+\mu)r\sin\theta\tag{2}\end{align}

また、\eqref{eq2}の\(r\cos\theta\)と\(r\sin\theta\)をそれぞれ\(x_1\)と\(x_2\)で置き換えるとがいえる。

\begin{align}&f(x_1+\mu)f'(x_2+\mu)x_1=f(x_2+\mu)f'(x_1+\mu)x_2\\&\label{eq3}\Leftrightarrow \cfrac{f'(x_2+\mu)}{f(x_2+\mu)x_2} = \cfrac{f'(x_1+\mu)}{f(x_1+\mu)x_1}, \ \ \forall x_1, x_2\in \mathbb{R}\tag{3} \end{align}

次のように\eqref{eq3}を定数\(C\)で固定する。

\begin{align} \cfrac{f'(x_2+\mu)}{f(x_2+\mu)x_2} = \cfrac{f'(x_1+\mu)}{f(x_1+\mu)x_1} = C\end{align}

左辺について

\begin{align}&\cfrac{df(x_2+\mu)/d(x_2+\mu)}{f(x_2+\mu)x_2} = C \\&\Leftrightarrow \int \cfrac{df(x_2+\mu)}{f(x_2+\mu)} =\int Cx_2 d(x_2+\mu)\\&\Leftrightarrow \log\bigl\{f(x_2+\mu)\bigr\}=\cfrac{C}{2}x_2^2+C_2\\&\Leftrightarrow f(x_2+\mu) = \exp\left(\cfrac{C}{2}x_2^2+C_2\right)=A\exp\left(\cfrac{C}{2}x_2^2\right)\end{align}

がいえる。同様に、\(x_1\)についても次の関係式が示せる。

\begin{align}f(x_1+\mu) = B\exp\left(\cfrac{C}{2}x_1^2\right).\end{align}

ここまでの結果を以下にまとめる。

\begin{align}f(x_2+\mu)= A\exp\left(\cfrac{C}{2}x_2^2\right),\ \ f(x_1+\mu)=B\exp\left(\cfrac{C}{2}x_1^2\right)\end{align}

正規分布（ガウス分布）の性質から、中心からの距離が大きいほど事象が起こりにくい。したがって指数の肩の部分をマイナスでなくてはならないので、\(C\)を\(-C\)で置き換えることで次を得る。

\begin{align}f(x_2+\mu)= A\exp\left(-\cfrac{C}{2}x_2^2\right),\ \ f(x_1+\mu)=B\exp\left(-\cfrac{C}{2}x_1^2\right)\end{align}

また、\(y_1 = x_1+\mu\)、\(y_2 = x_2+\mu\)の変換を行うと次となる。

\begin{align}f(y_2) = A\exp\left\{-\cfrac{C}{2}(y_2-\mu)^2\right\}, f(y_2) = B\exp\left\{-\cfrac{C}{2}(y_1-\mu)^2\right\}.\end{align}

確率密度関数の定義として、確率密度の取りうる範囲で積分を行うと\(1\)になる性質がある。よって

\begin{align}&\int_{-\infty}^{\infty} A\exp\left\{-\cfrac{C}{2}(y_2-\mu)^2\right\}dy_2= A\int_{-\infty}^{\infty}\exp\left\{-\cfrac{C}{2}(y_2-\mu)^2\right\}dy_2 = 1\\\label{eq4}&\Leftrightarrow \int_{-\infty}^{\infty}\exp\left\{-\cfrac{C}{2}(y_2-\mu)^2\right\}dy_2 = \cfrac{1}{A}.\tag{4}\end{align}

ここで\(z=y_2-\mu\)の変換を行うと上式の2行目は次となる。

\begin{align} \int_{-\infty}^{\infty}\exp\left\{-\cfrac{C}{2}(y_2-\mu)^2\right\}dy_2 = \int_{-\infty}^{\infty}\exp\left(-\cfrac{C}{2}z^2\right)dz\end{align}

上式の2行目の左辺の積分はガウス積分であることから

\begin{align} \int_{-\infty}^{\infty}\exp\left(-\cfrac{C}{2}z^2\right)dz = \sqrt{\cfrac{2\pi}{C}}\end{align}

である。故に、\eqref{eq4}より

\begin{align}&\int_{-\infty}^{\infty}\exp\left(-\cfrac{C}{2}z^2\right)dz = \sqrt{2\pi} = \cfrac{1}{A}\\&\Leftrightarrow A= \sqrt{\cfrac{C}{2\pi}}. \end{align}

したがって、\(Y_2\)の確率密度関数は次となる。

\begin{align}f(y_2)=\cfrac{1}{\sqrt{2\pi/C}}\exp\left\{-\cfrac{C}{2}(y_2-\mu)^2\right\}\end{align}

同様に、\(Y_1\)の確率密度関数も得られる。

\begin{align}f(y_1)=\cfrac{1}{\sqrt{2\pi/C}}\exp\left\{-\cfrac{C}{2}(y_1-\mu)^2\right\}\end{align}

ここで、定数\(C\)を\(\sigma^2 = 1/C\)と置き換えることで次の正規分布の確率密度関数が得られた。

\begin{align}f(y_1) = \cfrac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\cfrac{(y_1-\mu)^2}{2\sigma^2}\right\}.\end{align}

usagi-san

統計学とゲームとかをメインに解説していくよ。数式とかプログラミングコードにミスがあったり質問があったりする場合はコメントで受け付けます。すぐに対応します。

2024/04/28

【R言語】F検定テンプレートスクリプト

2024/04/28

【R言語】経験密度関数・経験分布関数のプロット　関数densityとecdfの使い方

2024/04/10

【R言語】ベータ関数とガンマ関数　関数beta, gammaの使い方

usagi-sanの記事をもっと見る

-統計学
-統計学

comment コメントをキャンセル

: 統計学
【統計学】歪度と尖度　記述統計
データの分布の形状（対称性や鋭さ）を表す尺度である歪度と尖度について解説する。ここでは、母集団分布ではなく観測値に基づく標本歪度と標本尖度の定義やその計算例を扱う。計算例では、様々なデータに対して ...

: 統計学
【統計学】確率分布の無記憶性
確率分布の重要な性質である無記憶性について解説する。無記憶性の定義を紹介し、幾何分布と指数分布についてこの性質が成り立つことを示す。無記憶性定義１　離散確率分布の無記憶性集合\(\{0, 1, ...

: 統計学
離散分布の積率母関数【統計学】
ここでは離散分布の積率母関数を定義し、様々な分布の積率母関数を導出していく。積率母関数と積率（モーメント）との関係も述べる。連続分布の積率母関数については、連続分布の積率母関数を参照されたい。離 ...

: 統計学
【統計学】カイ二乗分布の正規近似　自由度が無限大のときのカイ二乗統計量
カイ二乗分布の正規近似について解説する。中心極限定理を用いることで、自由度が無限大のときのカイ二乗分布の漸近分布を証明する。また、そのほかにも単純な中心極限定理を用いた統計量よりも速く収束する統計 ...

: 統計学
連続分布のモーメント【統計学】
連続分布のモーメントの定義や性質を述べる。また様々な連続分布のモーメントを導出し、期待値と分散を求める。特性関数、積率母関数を利用した期待値と分散の導出法については、それぞれ連続分布の特性関数、連 ...

連続分布の特性関数【統計学】

離散分布のモーメント【統計学】