順序統計量の同時分布【統計学】

順序統計量で紹介した確率変数\(X_1, \ldots, X_n; i.i.d.\)に対する順序統計量\(X_{(k)}, \ k=1, \ldots, n\)の同時分布をみていく。

前回の続きから解説するため、表記等については順序統計量を参照されたい。

順序統計量の同時分布

2つの順序統計量の同時密度関数

確率変数\(X_1, \ldots, X_n\)は独立に同一の分布に従い、確率密度関数\(f_X(x)\)と分布関数\(F_X(x)\)をもつとする。\(k\)番目の順序統計量を\(X_{(k)}, k = 1,\ldots, n\)で表記するとき、\(X_{(i)}\)と\(X_{(j)}\)の同時密度関数は次で与えられる。\begin{align}&f_{X_{(i)}, X_{(j)}} (u, v) \\\label{eq1}&= \cfrac{n!}{(i-1)!(j-1-i)!(n-j)!}f_X(u)f_X(v)F_{X}^{i-1}(u)\bigl\{F_X(v)-F_X(u)\bigr\}^{j-1-i}\bigl\{1-F_X(v)\bigr\}^{n-j},\ \ -\infty <u < v < \infty\tag{1}\end{align}ここに\(i<j\)である。

証明　微小区間\(\Delta u\)と\(\Delta v\)を用いることで、\(X_{(i)}\)と\(X_{(j)}\)の同時密度関数は次のように表現できる。

\begin{align}\label{eq2}\lim_{\substack{\Delta u \to 0\\\Delta v \to 0}} \cfrac{\mathrm{Pr}\{u \leq X_{(i)} \leq u + \Delta u, v \leq X_{(j)} \leq v + \Delta v\}}{\Delta u \Delta v} &= f_{X_{(i)}, X_{(j)}}(u, v)v. \tag{2}\end{align}

ここで事象\( u \leq X_{(i)} \leq u + \Delta u, v \leq X_{(j)} \leq v + \Delta v\)は、「\(u\)より小さい\(X_l,\ l= 1,\ldots, n\)が\(i-1\)個あり、\(u+\Delta u\)より大きく\(v\)より小さい\(X_l,\ l= 1,\ldots, n\)が\(j-1-i\)個あり、\(v+\Delta v\)より大きい\(X_l,\ l= 1,\ldots, n\)が\(n-j\)個あること」を意味する。また、これらの確率変数\(X_l\)の取りうる組み合わせは次で表される。

\begin{align}\cfrac{n!}{(i-1)!(j-1-i)!(n-j)!}.\end{align}

したがって、\(u\leq u_0\leq u+\Delta u\)、\(v\leq v_0\leq v+\Delta v\)を満たす\(u_0\)と\(v_0\)を用いることで、\eqref{eq2}は

\begin{align}& \lim_{\substack{\Delta u \to 0\\\Delta v \to 0}} \cfrac{\mathrm{Pr}\{u \leq X_{(i)} \leq u + \Delta u, v \leq X_{(j)} \leq v + \Delta v\}}{\Delta u \Delta v}\\ &= \lim_{\substack{\Delta u \to 0\\\Delta v \to 0}}\cfrac{n!}{(i-1)!(j-1-i)!(n-j)!\Delta u \Delta v}\bigl[\mathrm{Pr}\{X \leq u\}\bigr]^{i-1}\mathrm{Pr}\{u\leq X \leq u+\Delta u \}\bigl[ \mathrm{Pr}\{X> \Delta u, X \leq v\}\bigr]^{j-1-i}\mathrm{Pr}\{v\leq X \leq v+\Delta v\}\bigl[\mathrm{Pr}\{X > v + \Delta v\}\bigr]^{n-j}\\ &= \lim_{\substack{\Delta u \to 0\\\Delta v \to 0}} \cfrac{n!}{(i-1)!(j-1-i)!(n-j)!\Delta u \Delta v}F_X^{i-1}(u)\mathrm{Pr}\{u\leq X \leq u+\Delta u \}\bigl\{F_X(v)-F_X(u+\Delta u)\bigr\}^{j-1-i}
\mathrm{Pr}\{v\leq X \leq v+\Delta v\}\bigl\{1-F_X(v+\Delta v)\bigr\}^{n-j}\\ &= \lim_{\substack{\Delta u \to 0\\\Delta v \to 0}}\cfrac{n!}{(i-1)!(j-1-i)!(n-j)!\Delta u \Delta v}F_X^{i-1}(u)f_X(u_0)\Delta u\bigl\{F_X(v)-F_X(u+\Delta u)\bigr\}^{j-1-i}f_X(v_0)\Delta v\bigl\{1-F_X(v+\Delta v)\bigr\}^{n-j} \\ &= \cfrac{n!}{(i-1)!(j-1-i)!(n-j)!}f_X(u)f_X(v) F_X^{i-1}(u)\bigl\{F_X(v)-F_X(u)\bigr\}^{j-1-i}\bigl\{1-F_X(v)\bigr\}^{n-j}\end{align}

となる。したがって\eqref{eq2}より、次の\eqref{eq1}で与えられる同時密度関数が得られた。

\begin{align}f_{X_{(i)}, X_{(j)}} (u, v) = \cfrac{n!}{(i-1)!(j-1-i)!(n-j)!}f_X(u)f_X(v)F_{X}^{i-1}(u)\bigl\{F_X(v)-F_X(u)\bigr\}^{j-1-i}\bigl\{1-F_X(v)\bigr\}^{n-j}.□\end{align}

2つの順序統計量\(X_{(i)}\)と\(X_{(j)}\)に関する同時密度関数が得られた。同様に上記のような推測的な証明で任意の複数の順序統計量の同時密度関数を得ることが可能である。

\(n\)個の順序統計量の同時密度関数

確率変数\(X_1, \ldots, X_n\)は独立に同一の分布に従い、確率密度関数\(f_X(x)\)と分布関数\(F_X(x)\)をもつとする。\(k\)番目の順序統計量を\(X_{(k)}, k = 1,\ldots, n\)で表記するとき、\(X_{(1)}, \ldots, X_{(n)}\)の同時密度関数は次で与えられる。\begin{align}&f_{X_{(1)}, \ldots, X_{(n)}} (u_1, \ldots, u_n) \\\label{eq3}&= n!f_X(u_1)\cdots f_X(u_n),\ \ -\infty<u_1 <\infty, \ldots -\infty < v < \infty\tag{3}\end{align}

証明　微小区間\(\Delta u_1, \ldots, Delta u_n\)を用いることで、\(X_{(1)}, \ldots X_{(n)}\)の同時密度関数は次のように表現できる。

\begin{align}\label{eq4}\lim_{\substack{\Delta u_1 \to 0\\vdots\\\Delta v \to 0}} \cfrac{\mathrm{Pr}\{u_1 \leq X_{(1)} \leq u_2 + \Delta u_2, \ldots, u_n \leq X_{(n)} \leq u_n + \Delta u_n\}}{\Delta u_1\cdots \Delta u_n}&=f_{X_{(1)}, \ldots, X_{(n)}} (u_1, \ldots, u_n). \tag{4}\end{align}

ここで事象\( u_1 \leq X_{(1)} \leq u_1 + \Delta u_1, \ldots, u_n \leq X_{(n)} \leq v_n + \Delta v_n\)は、「確率変数\(X_l, l = 1, \ldots, n\)のそれぞれが\(n\)個の微小区間\([u_1, u_1 + \Delta u_1], \ldots, [u_n, u_n + \Delta u_n]\)」に1つずつ含まれることを意味する。この事象の組み合わせは\(n!\)であることから、\(u_1\leq u_1^{(0)}\leq u_1 +\Delta u_1, \ldots, u_n\leq u_n^{(0)}\leq u_n +\Delta u_n\)を満たす\(u_1^{(0)}, \ldots, u_n^{(0)}\)を用いることで、\eqref{eq4}の左辺は次となる。

\begin{align}&\lim_{\substack{\Delta u_1 \to 0\\vdots\\\Delta v \to 0}} \cfrac{\mathrm{Pr}\{u_1 \leq X_{(1)} \leq u_2 + \Delta u_2, \ldots, u_n \leq X_{(n)} \leq u_n + \Delta u_n\}}{\Delta u_1\cdots \Delta u_n} \\&=\lim_{\substack{\Delta u_1 \to 0\\vdots\\\Delta v \to 0}} \cfrac{n!}{\Delta u_1\cdots \Delta u_n}\mathrm{Pr}\{u_1 \leq X \leq u_1 + \Delta u_1\} \cdots \mathrm{Pr}\{u_n \leq X \leq u_n + \Delta u_n\}\\&=\lim_{\substack{\Delta u_1 \to 0\\vdots\\\Delta v \to 0}} \cfrac{n!}{\Delta u_1\cdots \Delta u_n}f_X(u_1^{(0)})\Delta u_1 \cdots f_X(u_n^{(0)})\Delta u_n\\&= n!f_X(u_1)\cdots f_X(u_n).\end{align}

よって、\eqref{eq4}から、\(\Delta u_1\cdots \Delta u_n\)の係数が\(u_1, \ldots u_n\)の同時密度関数である。したがって次の\eqref{eq3}で与えられる同時密度関数が得られた。

\begin{align}f_{X_{(1)}, \ldots, X_{(n)}} (u_1, \ldots, u_n) &= n!f_X(u_1)\cdots f_X(u_n).□\end{align}

一様分布の例

確率変数\(X_1, \ldots, X_n\)は独立に一様分布\(U(0, 1)\)に従っているとする。また、\(k\)番目の順序統計量\(X_{(k)}, k= 1,\ldots, n\)とする。このとき、\(X_1, \ldots, X_n\)は次で示される確率密度関数と分布関数を持つをもつ。

\begin{align}f_X(x) &= \left\{\begin{array}{cc}1, & 0\leq x\leq1\\ 0, &otherwise\end{array}\right. ,\\ F_X(x) &= \left\{ \begin{array}{cc}0, & x<0,\\ x, & 0\leq x \leq 1,\\1, & x>1\end{array}\right. . \end{align}

したがって、\(X_{(i)}, X_{(j)}, i < j\)の同時密度関数は

\begin{align}f_{X_{(i)}, X_{(j)}}(u , v) &= \cfrac{n!}{(i-1)!(j-1-i)!(n-j)!}u^{i-1}(v-u)^{j-1-i}(1-v)^{n-j}\end{align}

である。

また\(X_{(1)}, \ldots, X_{(n)}\)の同時密度関数は

\begin{align}f_{X_{(1)}, \ldots, X_{(n)}} (u_1, \ldots, u_n) &= n!1\cdots1\\&=n!\end{align}

usagi-san

統計学とゲームとかをメインに解説していくよ。数式とかプログラミングコードにミスがあったり質問があったりする場合はコメントで受け付けます。すぐに対応します。

2024/04/28

【R言語】F検定テンプレートスクリプト

2024/04/28

【R言語】経験密度関数・経験分布関数のプロット　関数densityとecdfの使い方

2024/04/10

【R言語】ベータ関数とガンマ関数　関数beta, gammaの使い方

usagi-sanの記事をもっと見る

-統計学
-統計学

comment コメントをキャンセル

: 統計学
【統計学】標本平均や標本分散　記述統計
標本平均や標本分散、標本標準偏差、標本標準誤差について解説する。標本平均と標本分散の定義を与え、実際にデータから標本平均や標本分散を計算する例を紹介する。標本中央値や四分位数、標本相関係数について ...

: 統計学
【統計学】母分散の信頼区間
標本が正規分布に従う場合の母分散の信頼区間およびその導出についてみていく。信頼区間の定義から分散の\(100(1-\alpha)\)%信頼区間を構成していく。母平均の信頼区間については次の記事を参 ...

: 統計学
【統計学】平均値・中央値・最頻値　ヒストグラム　記述統計
データの位置母数である平均値、中央値、最頻値に解説する。データの分布の形状によって平均値、中央値、最頻値がどのように変化するのか、また平均値、中央値、最頻値のうちどれを代表値として用いればよいのか、 ...

: 統計学
【統計学】相関係数・ピアソンの積率相関係数
相関係数とピアソンの積率相関係数について解説する。相関係数およびピアソンの積率相関係数の定義を与え、その性質や幾何学的解釈などをみていく。相関係数の検定については以下の記事を参照されたい。相関係 ...

: 統計学
【統計学】自由度が無限大のときのF分布　カイ二乗分布への収束
自由度が無限大であるときのF分布について解説する。第二自由度を大きくするとF分布に従う確率変数が第一自由度のカイ二乗分布布へと収束する性質とその証明を行う。自由度が無限大のときのt分布の性質につい ...

楕円型分布の特性関数とモーメント

連続分布の再生性【統計学】