統計学

【統計学】オッズ比の信頼区間

  1. HOME >
  2. 統計学 >

【統計学】オッズ比の信頼区間

スポンサーリンク

オッズ比の信頼区間を解説する。

オッズ比の信頼区間とその導出方法についてみていく。対数オッズ比が漸近的に正規分布に従うこととを用いてオッズ比の信頼区間を構成する。

オッズ比については次の記事を参照されたい。

【統計学】母分散の信頼区間

標本が正規分布に従う場合の母分散の信頼区間およびその導出についてみていく。 信頼区間の定義から分散の\(100(1-\alpha)\)%信頼区間を構成していく。 母平均の信頼区間については次の記事を参 ...

続きを見る

信頼区間

信頼区間の定義は次で与えられる。

信頼区間

\(x_1, x_2,\ldots, x_n\)はパラメータ\(\theta\)をもつ分布からの大きさ\(n\)の標本とする。このとき、パラメータ\(\theta\)をもつ統計量を\(g(\theta)\)とすると、\(\theta\)の\(100(1 - \alpha ) \)%信頼区間は

\begin{align}\label{eq1} \mathrm{Pr}\{ l \leq g( \theta) \leq u\} = 1-\alpha \tag{1}\end{align}

を満たす区間\([l, u]\)で与えられる。

例えば\(\alpha = 0.05\)であるとき、\eqref{eq1}はパラメータ\(\theta\)は\(l\)と\(u\)の間に95%で存在することを意味する。また、\((1- \alpha)\)は信頼水準(confidence level, C.I.)と呼ばれる。

オッズ比の信頼区間

オッズ比の比の信頼区間

オッズ比\(OR\)を次で定義する。

\begin{align} OR &= \cfrac{p_{11} p_{00} }{p_{10 }p_{01}}  .\end{align}

また、標本対数オッズ比を次で与える。

\begin{align} L &=\log \left(\cfrac{n_{11} n_{00}}{n_{10} n_{01}}\right)\\ &= \log n_{11} +\log n_{00} - \log n_{10} - \log n_{01} . \end{align}

\(n\to\ infty\)の下で、標本オッズ比\(OR\)の\(100(1 - \alpha)\)%信頼区間は次で与えられる。

\begin{align} \label{eq2} \left[ \exp\left\{L - \cfrac{\hat{\sigma}}{\sqrt{n}}Z_{\alpha / 2} \right\},  \exp\left\{L + \cfrac{\hat{\sigma}}{\sqrt{n}}Z_{\alpha / 2} \right\} \right], \tag{2} \end{align}

ここに

\begin{align}\hat{\sigma}^2 = \cfrac{1}{n_{00}}+ \cfrac{1}{n_{10}} + \cfrac{1}{n_{01}} + \cfrac{1}{n_{11}},\end{align}

また、\(Z_{\alpha}\)は標準正規分布の上側\(\alpha\)点。

オッズ比の信頼区間の導出

今、\((n_{11}, n_{10}, n_{01}, n_{00})^T\)は分布\(M(n, (p_{11}, p_{10}, p_{01}, p_{00})^T)\)に従うことから、\begin{gather}\mathrm{E}[n_{ij}] = np_{ij},\quad  \mathrm{Var}[n_{11}] = n(p_{ij} - p_{ij}^2) , \quad  i, j = 0, 1, \\  \mathrm{Cov}[n_{ij} ,n_{kl}] = -np_{ij}p_{kl} , \quad i,j, k , l = 0, 1.  \end{gather}ここで

\begin{align} \boldsymbol{X}=  \begin{pmatrix}X_{11} \\ X_{10} \\ X_{01} \end{pmatrix} = \cfrac{1}{n} \begin{pmatrix} n_{11} \\ n_{10} \\  n_{01} \end{pmatrix}\end{align}

とすると

\begin{align} \mathrm{E} [\boldsymbol{X}]&=\boldsymbol{\mu} = \begin{pmatrix} p_{11} \\ p_{10} \\ p_{01}\end{pmatrix} , \\ \mathrm{Var}[\boldsymbol{X}] &= \boldsymbol{\Sigma} = \cfrac{1}{n}\begin{pmatrix} p_{11} - p_{11}^2& - p_{11} p_{10} & - p_{11} p_{01} \\- p_{10} p_{11} & p_{10} - p_{10}^2& -p_{10}p_{01} \\ -p_{01} p_{11} & - p_{01} p_{10} & p_{01}-  p_{01}^2 \end{pmatrix} .\end{align}

多変量の中心極限定理より、\(n\to \infty\)の下で\(\sqrt{n}(\boldsymbol{X} - \boldsymbol{\mu}) \sim N(\boldsymbol{0}, \boldsymbol{\Sigma})\)である。ここで関数\(f(x_{11}, x_{10}, x_{01})\)を次で定義する。

\begin{align}f(x_{11}, x_{10}, x_{01}) = \log x_{11} +\log (1 - x_{11} - x_{10} - x_{01}) - \log x_{10} - \log x_{01} . \end{align}

デルタ法より\(\sqrt{n} \{f(\boldsymbol{X}) - f(\boldsymbol{\mu})\} \sim N(0, \sigma^2) \)。ここに

\begin{align} \sigma^2 &= \left( \cfrac{\partial f(\boldsymbol{\mu})}{ \partial \boldsymbol{X}}\right)^T \boldsymbol{\Sigma}\left( \cfrac{\partial f(\boldsymbol{\mu})}{ \partial \boldsymbol{X}}\right) \\ &=\begin{pmatrix} \cfrac{1}{p_{11}} -\cfrac{1}{p_{00}} &-\cfrac{1}{p_{10}} -\cfrac{1}{p_{00}} &- \cfrac{1}{p_{01}} -\cfrac{1}{p_{00}} \end{pmatrix} \cfrac{1}{n}\begin{pmatrix} p_{11} - p_{11}^2& - p_{11} p_{10} & - p_{11} p_{01} \\- p_{10} p_{11} & p_{10} - p_{10}^2& -p_{10}p_{01} \\- p_{01} p_{11} & - p_{01} p_{10} & p_{01}-  p_{01}^2 \end{pmatrix} \begin{pmatrix} \cfrac{1}{p_{11}} -\cfrac{1}{p_{00}} \\ -\cfrac{1}{p_{10}} -\cfrac{1}{p_{00}} \\ - \cfrac{1}{p_{01}} -\cfrac{1}{p_{00}} \end{pmatrix} \\ &= \cfrac{1}{n} \begin{pmatrix} \cfrac{p_{00} - p_{11}}{p_{11} p_{00}} &-\cfrac{p_{00} + p_{10}}{p_{10}p_{00}} &- \cfrac{p_{00} + p_{01}}{p_{01}p_{00}} \end{pmatrix} \begin{pmatrix} p_{11} - p_{11}^2& - p_{11} p_{10} & - p_{11} p_{01} \\- p_{10} p_{11} & p_{10} - p_{10}^2& -p_{10}p_{01} \\ -p_{01} p_{11} & - p_{01} p_{10} & p_{01}-  p_{01}^2 \end{pmatrix} \begin{pmatrix} \cfrac{p_{00} - p_{11}}{p_{11} p_{00}} \\-\cfrac{p_{00} + p_{10}}{p_{10}p_{00}} \\- \cfrac{p_{00} + p_{01}}{p_{01}p_{00}} \end{pmatrix} \\&= \cfrac{1}{n} \begin{pmatrix}\cfrac{p_{00} - p_{11} +p_{11}(p_{11} + p_{00} + p_{10}+  p_{01}) }{p_{00}} & \cfrac{ - p_{00} - p_{10} + p_{10}(p_{10} + p_{11} + p_{00}  + p_{01})}{p_{00}}& \cfrac{ - p_{00} - p_{01} + p_{01}(p_{01} +  p_{11}  +p_{00} + p_{10})}{p_{00}} \end{pmatrix}  \begin{pmatrix} \cfrac{p_{00} - p_{11}}{p_{11} p_{00}} \\-\cfrac{p_{00} + p_{10}}{p_{10}p_{00}} \\- \cfrac{p_{00} + p_{01}}{p_{01}p_{00}} \end{pmatrix} \\&= \cfrac{1}{n} \begin{pmatrix}1 & -1 & -1 \end{pmatrix}  \begin{pmatrix} \cfrac{p_{00} - p_{11}}{p_{11} p_{00}} \\-\cfrac{p_{00} + p_{10}}{p_{10}p_{00}} \\- \cfrac{p_{00} + p_{01}}{p_{01}p_{00}} \end{pmatrix} \\&= \cfrac{1}{n} \left( \cfrac{p_{00} - p_{11}}{p_{11} p_{00}} + \cfrac{p_{00} + p_{10}}{p_{10}p_{00}} + \cfrac{p_{00} + p_{01}}{p_{01}p_{00}} \right) \\ &= \cfrac{1}{n} \cfrac{p_{10} p_{01}(p_{00} - p_{11}) + p_{11}p_{01}( p_{00} + p_{10}) + p_{11} p_{10}(p_{00} + p_{01} )}{p_{11} p_{10} p_{01} p_{00}} \\  &= \cfrac{1}{n} \left(\cfrac{1}{p_{11}} + \cfrac{1}{p_{10}}+ \cfrac{1}{p_{01}}+ \cfrac{1}{p_{00}}\right)   \end{align}

ここで、\(\sigma^2\)を不偏推定量で置き換えたものを\(\hat{\sigma}^2\)とする。

\begin{align}\hat{\sigma}^2 &= \cfrac{1}{n} \left(\cfrac{1}{n_{11} / n} + \cfrac{1}{n_{10} / n}+ \cfrac{1}{n_{01} / n}+ \cfrac{1}{n_{00} / n}\right)\\ &= \cfrac{1}{n_{11}} + \cfrac{1}{n_{10}}+ \cfrac{1}{n_{01} }+ \cfrac{1}{n_{00} }. \end{align}

確率変数の和、差、積、商は確率極限は確率変数の確率極限の和、差、積、商であるので\(\mathrm{plim}_{n\to \infty} \hat{\sigma}^2 = \sigma^2\)。よって、スラツキーの定理より

\begin{align} \cfrac{\sqrt{n}\{f(\boldsymbol{X}) -f( \boldsymbol{\mu}) \}}{\hat{\sigma}^2} \underset{d}{\to}\cfrac{Z}{\sigma^2 } \sim N(0, 1), \end{align}

ここに、\(Z\sim N(0, \sigma^2)\)。ここで\(Z_{\alpha}\)を標準正規分布の上側\(\alpha\)点とすると、\(n \to \infty\)のもとで

\begin{align} & \mathrm{Pr} \left\{ - Z_{\alpha / 2}\leq  \cfrac{\sqrt{n}\{f(\boldsymbol{X}) -f( \boldsymbol{\mu}) \}}{\hat{\sigma}} \leq Z_{\alpha / 2} \right\} = 1- \alpha\\ &\Leftrightarrow \mathrm{Pr} \left\{ f(\boldsymbol{X}) - \cfrac{\hat{\sigma}}{\sqrt{n}} Z_{\alpha / 2} \leq f( \boldsymbol{\mu}) \leq f(\boldsymbol{X}) + \cfrac{\hat{\sigma}}{\sqrt{n}}Z_{\alpha / 2} \right\} = 1- \alpha. \end{align}

故に対数オッズ比\(\log OR=f( \boldsymbol{\mu})\)の信頼区間は次で表される。

\begin{align}& f(\boldsymbol{X}) - \cfrac{\hat{\sigma}^2}{\sqrt{n}} Z_{\alpha / 2} \leq f( \boldsymbol{\mu}) \leq f(\boldsymbol{X}) + \cfrac{\hat{\sigma}^2}{\sqrt{n}}Z_{\alpha / 2}  \\& \Leftrightarrow \log \cfrac{n_{11}}{n} +\log \cfrac{n_{01}}{n} - \log \cfrac{n_{10}}{n} - \log \cfrac{n_{01}}{n} - \cfrac{\hat{\sigma}^2}{\sqrt{n}} Z_{\alpha / 2} \leq\log OR \leq \log \cfrac{n_{11}}{n} +\log \cfrac{n_{01}}{n} - \log \cfrac{n_{10}}{n} - \log \cfrac{n_{01}}{n} + \cfrac{\hat{\sigma}^2}{\sqrt{n}}Z_{\alpha / 2 } \\& \Leftrightarrow \log \left(\cfrac{n_{11}n_{00}}{n_{10} n_{01}}\right)  - \cfrac{\hat{\sigma}^2}{\sqrt{n}} Z_{\alpha / 2} \leq\log OR \leq \log \left(\cfrac{n_{11}n_{00}}{n_{10} n_{01}}\right)  + \cfrac{\hat{\sigma}^2}{\sqrt{n}}Z_{\alpha / 2 }  \\& \label{eq3} \Leftrightarrow L  - \cfrac{\hat{\sigma}^2}{\sqrt{n}} Z_{\alpha / 2} \leq \log OR \leq L+ \cfrac{\hat{\sigma}^2}{\sqrt{n}}Z_{\alpha / 2 }.\tag{3} \end{align}

よって、\eqref{eq3}の指数をとることで次の不等式を得る。

\begin{align}\exp\left\{ L  - \cfrac{\hat{\sigma}^2}{\sqrt{n}} Z_{\alpha / 2}\right\} \leq OR \leq \exp\left\{L+ \cfrac{\hat{\sigma}^2}{\sqrt{n}}Z_{\alpha / 2 }\right\} .\end{align}

\eqref{eq2}のオッズ比の信頼区間が導出された。□

スポンサーリンク

  • この記事を書いた人
  • 最新記事

usagi-san

統計学とゲームとかをメインに解説していくよ。 数式とかプログラミングコードにミスがあったり質問があったりする場合はコメントで受け付けます。すぐに対応します。

-統計学
-