順序統計量で紹介した確率変数\(X_1, \ldots, X_n; i.i.d.\)に対する順序統計量\(X_{(k)}, \ k=1, \ldots, n\)の同時分布をみていく。
前回の続きから解説するため、表記等については順序統計量を参照されたい。
順序統計量の同時分布
2つの順序統計量の同時密度関数
確率変数\(X_1, \ldots, X_n\)は独立に同一の分布に従い、確率密度関数\(f_X(x)\)と分布関数\(F_X(x)\)をもつとする。\(k\)番目の順序統計量を\(X_{(k)}, k = 1,\ldots, n\)で表記するとき、\(X_{(i)}\)と\(X_{(j)}\)の同時密度関数は次で与えられる。\begin{align}&f_{X_{(i)}, X_{(j)}} (u, v) \\\label{eq1}&= \cfrac{n!}{(i-1)!(j-1-i)!(n-j)!}f_X(u)f_X(v)F_{X}^{i-1}(u)\bigl\{F_X(v)-F_X(u)\bigr\}^{j-1-i}\bigl\{1-F_X(v)\bigr\}^{n-j},\ \ -\infty <u < v < \infty\tag{1}\end{align}ここに\(i<j\)である。
証明 微小区間\(\Delta u\)と\(\Delta v\)を用いることで、\(X_{(i)}\)と\(X_{(j)}\)の同時密度関数は次のように表現できる。
ここで事象\( u \leq X_{(i)} \leq u + \Delta u, v \leq X_{(j)} \leq v + \Delta v\)は、「\(u\)より小さい\(X_l,\ l= 1,\ldots, n\)が\(i-1\)個あり、\(u+\Delta u\)より大きく\(v\)より小さい\(X_l,\ l= 1,\ldots, n\)が\(j-1-i\)個あり、\(v+\Delta v\)より大きい\(X_l,\ l= 1,\ldots, n\)が\(n-j\)個あること」を意味する。また、これらの確率変数\(X_l\)の取りうる組み合わせは次で表される。
したがって、\(u\leq u_0\leq u+\Delta u\)、\(v\leq v_0\leq v+\Delta v\)を満たす\(u_0\)と\(v_0\)を用いることで、\eqref{eq2}は
\mathrm{Pr}\{v\leq X \leq v+\Delta v\}\bigl\{1-F_X(v+\Delta v)\bigr\}^{n-j}\\ &= \lim_{\substack{\Delta u \to 0\\\Delta v \to 0}}\cfrac{n!}{(i-1)!(j-1-i)!(n-j)!\Delta u \Delta v}F_X^{i-1}(u)f_X(u_0)\Delta u\bigl\{F_X(v)-F_X(u+\Delta u)\bigr\}^{j-1-i}f_X(v_0)\Delta v\bigl\{1-F_X(v+\Delta v)\bigr\}^{n-j} \\ &= \cfrac{n!}{(i-1)!(j-1-i)!(n-j)!}f_X(u)f_X(v) F_X^{i-1}(u)\bigl\{F_X(v)-F_X(u)\bigr\}^{j-1-i}\bigl\{1-F_X(v)\bigr\}^{n-j}\end{align}
となる。したがって\eqref{eq2}より、次の\eqref{eq1}で与えられる同時密度関数が得られた。
2つの順序統計量\(X_{(i)}\)と\(X_{(j)}\)に関する同時密度関数が得られた。同様に上記のような推測的な証明で任意の複数の順序統計量の同時密度関数を得ることが可能である。
\(n\)個の順序統計量の同時密度関数
確率変数\(X_1, \ldots, X_n\)は独立に同一の分布に従い、確率密度関数\(f_X(x)\)と分布関数\(F_X(x)\)をもつとする。\(k\)番目の順序統計量を\(X_{(k)}, k = 1,\ldots, n\)で表記するとき、\(X_{(1)}, \ldots, X_{(n)}\)の同時密度関数は次で与えられる。\begin{align}&f_{X_{(1)}, \ldots, X_{(n)}} (u_1, \ldots, u_n) \\\label{eq3}&= n!f_X(u_1)\cdots f_X(u_n),\ \ -\infty<u_1 <\infty, \ldots -\infty < v < \infty\tag{3}\end{align}
証明 微小区間\(\Delta u_1, \ldots, Delta u_n\)を用いることで、\(X_{(1)}, \ldots X_{(n)}\)の同時密度関数は次のように表現できる。
ここで事象\( u_1 \leq X_{(1)} \leq u_1 + \Delta u_1, \ldots, u_n \leq X_{(n)} \leq v_n + \Delta v_n\)は、「確率変数\(X_l, l = 1, \ldots, n\)のそれぞれが\(n\)個の微小区間\([u_1, u_1 + \Delta u_1], \ldots, [u_n, u_n + \Delta u_n]\)」に1つずつ含まれることを意味する。この事象の組み合わせは\(n!\)であることから、\(u_1\leq u_1^{(0)}\leq u_1 +\Delta u_1, \ldots, u_n\leq u_n^{(0)}\leq u_n +\Delta u_n\)を満たす\(u_1^{(0)}, \ldots, u_n^{(0)}\)を用いることで、\eqref{eq4}の左辺は次となる。
よって、\eqref{eq4}から、\(\Delta u_1\cdots \Delta u_n\)の係数が\(u_1, \ldots u_n\)の同時密度関数である。したがって次の\eqref{eq3}で与えられる同時密度関数が得られた。
一様分布の例
確率変数\(X_1, \ldots, X_n\)は独立に一様分布\(U(0, 1)\)に従っているとする。また、\(k\)番目の順序統計量\(X_{(k)}, k= 1,\ldots, n\)とする。このとき、\(X_1, \ldots, X_n\)は次で示される確率密度関数と分布関数を持つをもつ。
したがって、\(X_{(i)}, X_{(j)}, i < j\)の同時密度関数は
である。
また\(X_{(1)}, \ldots, X_{(n)}\)の同時密度関数は