統計学

【統計学】標本オッズ比 オッズ比の計算 記述統計

  1. HOME >
  2. 統計学 >

【統計学】標本オッズ比 オッズ比の計算 記述統計

スポンサーリンク

2つのグループにおける事象の起こりやすさの尺度であるオッズ比について解説する。

オッズ比の定義や分割表が与えられたときのオッズの計算例を紹介する。

様々な分割表のオッズ比を計算し、オッズ比がどのように変化するのかをみていく。

R言語のオッズ比について詳しく見たい方は次の記事を参照。

【R言語】カイ二乗検定 適合度検定・独立性の検定

R言語でカイ2乗検定を実行する方法を解説していきます。データセットの用意から検定までの一連の流れを紹介していきます。 カイ2乗検定の種類として適合度検定や独立性の検定がありますが、R言語に標準で実装さ ...

続きを見る

オッズ比

オッズ比は2つの群におけるある事象の起こりやすさの尺度であり、次のように2つの群の標本オッズの比として定義される。

標本オッズ比

\(x_1, x_2, \ldots, x_m\)をベルヌーイ分布\(Bernoulli(p)\)、\(y_1, y_2, \ldots , y_n\)をベルヌーイ分布\(Bernoulli(q)\)からの無作為標本とする。2つの母集団の標本比率をそれぞれ\(\hat{p} =  m^{-1} \sum_{i = 1}^m x_i\)、\(\hat{q} =  n^{-1} \sum_{i = 1}^n y_i\)とすると、標本オッズ比は次で定義される。

\begin{align} OR = \cfrac{\hat{p} / (1 - \hat{p})}{\hat{q} / (1 - \hat{q})} = \cfrac{\hat{p} (1 - \hat{q}) }{\hat{q} (1 - \hat{p})} = \cfrac{\sum_{i = 1}^m x_i(n - \sum_{ j= 1}^n y_j)}{\sum_{j = 1}^ny_j (m - \sum_{i = 1}^m x_i)}. \end{align}

2つの群を\(A\)と\(B\)とし、それぞれの群でのイベントの発生数を\(\sum_{i = 1}^m x_i\)、\(\sum_{j = 1}^n y_j\)とすると、2×2分割表を用いることで事象の発生数をつぎのようにまとめることができる。

\begin{array}{c|ccc}  & \mathrm{occurred} & \mathrm{not\ occurred} \\\hline A  & \sum_{i = 1}^m x_i & m - \sum_{i = 1}^m x_i  \\ B  & \sum_{j = 1}^m y_j &  n - \sum_{j = 1}^m y_j \end{array}

このとき、各群の標本オッズはそれぞれ\( \sum_{i = 1}^m x_i / (m - \sum_{i = 1}^m x_i )\)、\( \sum_{j = 1}^m y_j / (n - \sum_{j = 1}^m y_j)\)であり、この比が標本オッズ比\(OR\)となる。2つの群の事象の発生数が同じであるときオッズ比は\(1\)となり、発生数が乖離するほど\(0\)または\(\infty\)に向かうことが知られている。

計算例

次の3つの群AとBのクラスとイベントの発生に関するクラスから成る2×2分割表が与えられたとする。これらの分割表に対し、オッズ比の計算を行う。

\begin{align}& \begin{array}{c|ccc}  & \mathrm{occurred} & \mathrm{not\ occurred} \\\hline A  & 22 & 8  \\ B  & 11 &  19 \end{array}\\ &\begin{array}{c|ccc}  & \mathrm{occurred} & \mathrm{not\ occurred} \\\hline A  & 6 & 24  \\ B  & 18  & 12 \end{array}\\ &\begin{array}{c|ccc}  & \mathrm{occurred} & \mathrm{not\ occurred} \\\hline A  & 10 & 20 \\ B  & 10 &  20 \end{array}\end{align}

3つの分割表の2群の事象をそれぞれベルヌーイ分布からの無作為標本\(x_{11}, x_{12}, \ldots, x_{1, 30}, y_{11}, y_{12}, \ldots, y_{1, 30}\)、\(x_{21}, x_{22}, \ldots, x_{2, 30}, y_{21}, y_{22}, \ldots, y_{2, 30}\)、\(x_{31}, x_{32}, \ldots, x_{3, 30}, y_{31}, y_{32}, \ldots, y_{3, 30}\)とすると、事象の発生数は次のようにまとめられる。

\begin{gather} \sum_{i = 1}^{30} x_{1i} = 22, \quad  \sum_{j = 1}^{30} y_{1j} = 11, \\  \sum_{i = 1}^{30} x_{2i} = 6, \quad  \sum_{j = 1}^{30} y_{2j} = 18,\\ \sum_{i = 1}^{30} x_{3i} = 10, \quad  \sum_{j = 1}^{30} y_{3j} = 10. \end{gather}

よってオッズ比の定義より、3つの分割表に対するオッズ比はそれぞれ

\begin{align}OR_1 &= \cfrac{\sum_{i = 1}^{30} x_{1i}(30 - \sum_{ j= 1}^{30} y_{1j})}{\sum_{j = 1}^{30}y_{1j} (30 - \sum_{i = 1}^{30} x_{1i})} \\ &= \cfrac{22( 30 - 11)}{11 ( 30 - 8)}\\ &= \cfrac{22 \cdot 19}{11 \cdot 22} \approx 4.6162,\\ OR_2 &= \cfrac{\sum_{i = 1}^{30} x_{2i}(30 - \sum_{ j= 1}^{30} y_{2j})}{\sum_{j = 1}^{30}y_{2j} (30 - \sum_{i = 1}^{30} x_{2i})}\\ &= \cfrac{6 (30 -18) }{18 (30 - 6)} \\ &=\cfrac{6 \cdot 12}{18 \cdot 24} \approx 0.1723 ,\\ OR_3  &= \cfrac{\sum_{i = 1}^{30} x_{3i}(30 - \sum_{ j= 1}^{30} y_{3j})}{\sum_{j = 1}^{30}y_{3j} (30 - \sum_{i = 1}^{30} x_{3i})} \\ &=\cfrac{10 (30- 10 ) }{10 ( 30 - 10)} \\ &= \cfrac{10 \cdot 20}{10 \cdot 20}  = 1.\end{align}

次の図のように各群AとBの標本比率に関するヒートマップを作成すると、オッズ比が理解しやすい。次の図は3つの分割表の2つの群の標本比率をヒートマップである。標本比率が大きいほど赤くなり、小さいほど白くなる。グラフにy軸はy=2が群A、y=1が群Bを表し、x軸はx=1がイベントが発生した数、x=2がイベントが発生しなかった数を表す。

オッズ比

行方向に対して色の濃さが同じであるほどオッズ比が1に近づくのが確認できる。また、行方向について色の濃さ異なれば異なるほどオッズ比は無限大または0に向かうのが分かる。

スポンサーリンク

  • この記事を書いた人
  • 最新記事

usagi-san

統計学とゲームとかをメインに解説していくよ。 数式とかプログラミングコードにミスがあったり質問があったりする場合はコメントで受け付けます。すぐに対応します。

-統計学
-