E[Y11 Y22] = ψ E[Y12 Y21]を確認してみよう!

McCullagh, P. and Nelder, J.A. (1st ed.:1983, 2nd ed.:1989) Generalized Linear Models, Chapman & Hall の問題9.10における最初の問い(推定関数の期待値がゼロとなることを確認してくださいね,という問い)を考えてみました.

もっとエレガントな解き方がたぶんあると思います.もしエレガントな解き方を知っている方がいれば教えていただけると... 助かります... .

設定

次のような表を考える.

 

A

Not A

Total

Sampled Y_{11}

Y_{12} = m_1 - Y_{11}

m_1

Non-sampled

Y_{21} = s_1 - Y_{11}

Y_{22} = m_2 - s_1 + Y_{11}

m_2

Total

s_1

s_2

m.

行和および列和ともに固定されており,オッズ比  \psiの非心度超幾何分布に従っているとする.ここでは Y_{11}を基準に考えていくとして,確率関数が次のようになっているとする.

 Pr(Y_{11}= y_{11}| \psi, {\bf s}, {\bf m}) = \frac{ _{m_1} C _{y_{11}}  \ \ {_{m_2} C _{y_{21}}} \ \ \psi^{y_{11}}} {P_0(\psi)}

ここで  {\bf s} = (s_1, s_2), {\bf m} = (m_1, m_2) であり,また, P_0(\psi) = \sum_{y_{11} \in D_1} {_{m_1} C _{y_{11}}}  \ \ {_{m_2} C _{y_{21}}} \psi^{y_{11}}(分子を標本空間全体の領域で足し合わせたもの)である.標本空間全体の領域を示す集合 D_1は,上表の4つのセルすべてにおいて,度数がゼロ以上となっているものの集まりである.

 D_1 = \{y_{11} \in {\mathbb Z} | y_{11} \ge 0, y_{21} \ge 0, y_{12} \ge 0, y_{22} \ge 0\}

なお,この集合 D_1の条件には,

 y_{21} = s_1 - y_{11}, y_{12} = m_1 - y_{11}, y_{22} = s_2 - m_1 + y_{11}

という等号制約もあるが,煩雑になるので以下でも,( D_1, D_2, D_3, D_4に対する)この種の等号制約は記載を省略することにする.

解答

上記の設定のもとで  \psi E[Y_{12} Y_{21}]= E[Y_{11} Y_{22}]となることを確認していく.LOTUS(law of the unconscious statistician)より,

 \psi E[Y_{12} Y_{21}] = \psi \sum_{y_{11} \in D_1} y_{12} y_{21} Pr(Y_{11}= y_{11}| \psi, {\bf s}, {\bf m})

        = \frac{ \psi \sum_{y_{11} \in D_1} y_{12} y_{21} \ \ {_{m_1} C _{y_{11}}}  \ \ {_{m_2} C _{y_{21}}} \ \ \psi^{y_{11}}} {P_0(\psi)}

である.以後,簡単のため分子だけを見ていく. _x C _y = \frac{x!}{y! (x - y)!}より,

(分子)  = \sum_{y_{11} \in D_1} y_{12} y_{21} \ \ {_{m_1} C _{y_{11}}}  \ \ {_{m_2} C _{y_{21}}} \ \ \psi^{y_{11}+1}

      = \sum_{y_{11} \in D_1} y_{12} y_{21} \ \ \frac{m_1!}{y_{11}! y_{12}!} \ \frac{m_2!}{y_{21}! y_{22}!} \ \ \psi^{y_{11}+1}

 y_{12} = 0もしくは y_{21}= 0の項は上記の総和には貢献しないことに注意しながら, \frac{x}{x!} = \frac{1}{(x-1)!}と計算すると, 

      = \sum_{y_{11} \in D_2} \frac{m_1!}{y_{11}! (y_{12}-1)!} \ \frac{m_2!}{(y_{21}-1)! y_{22}!} \ \ \psi^{y_{11}+1}

と変形される.ここで  D_2 D_1から,  y_{12} = 0もしくは y_{21}= 0である集まりを引いたものである.

 D_2 = \{y_{11} \in {\mathbb Z} | y_{11} \ge 0, y_{21} \ge 1, y_{12} \ge 1, y_{22} \ge 0\}

この変形した式の分母分子に (y_{11} + 1)および (y_{22} + 1)をかけると,

      = \sum_{y_{11} \in D_2} (y_{11}+1)(y_{22} + 1)\frac{m_1!}{(y_{11}+1)! (y_{12}-1)!} \ \frac{m_2!}{(y_{21}-1)! (y_{22}+1)!} \ \ \psi^{y_{11}+1}

となる.

ここで,次のように置換する.

 y'_{11} = y_{11} + 1

 y'_{12} = y_{12} - 1

 y'_{21} = y_{21} - 1

 y'_{22} = y_{22} + 1

上記の変数に置換した式は次のようになる.

      = \sum_{y_{11} \in D_2}  y'_{11} y'_{22} \frac{m_1!}{y'_{11}! y'_{12}!} \ \frac{m_2!}{y'_{21}! y'_{22}!} \ \ \psi^{y'_{11}}

集合  D_2y'_{11} , y'_{12} , y'_{21} , y'_{22} に置き換えた D_3は次のようになる.

 D_3 = \{y'_{11} \in {\mathbb Z} | y'_{11} \ge 1, y'_{21} \ge 0, y'_{12} \ge 0, y'_{22} \ge 1\}

ここで,

 y'_{11} + y'_{12} = y_{11} + y_{12} = m_1

 y'_{21} + y'_{22} = y_{21} + y_{22} = m_2

 y'_{11} + y'_{21} = y_{11} + y_{21} = s_1

 y'_{12} + y'_{22} = y_{12} + y_{22} = s_2

となっていることに注意する.つまり, y'_{11}, y'_{12}, y'_{21}, y'_{22}に対する周辺和による制約は,元の y_{11}, y_{12}, y_{21}, y_{22}に対する周辺和による制約とまったく同じである.また, y'_{11} = 0もしくは y'_{22} = 0となっている項は総和には貢献しないことを踏まえれば,上記の式は

      = \sum_{y'_{11} \in D_4}  y'_{11} y'_{22} \ \ {_{m_1} C _{y'_{11}}}  \ \ {_{m_2} C _{y'_{21}}} \ \ \psi^{y'_{11}}

と変形できる.ここで

 D_4 = \{y'_{11} \in {\mathbb Z} | y'_{11} \ge 0, y'_{21} \ge 0, y'_{12} \ge 0, y'_{22} \ge 0\}

である.周辺和に対する制約も同じだったので,この D_4 D_1と等しい.置換した式のプライムをすべて除いて記述すると,

      = \sum_{y_{11} \in D_1}  y_{11} y_{22} \ \ {_{m_1} C _{y_{11}}}  \ \ {_{m_2} C _{y_{21}}} \ \ \psi^{y_{11}}

となる.ここで D_1は前述したものであり,再掲すると,

 D_1 = \{y_{11} \in {\mathbb Z} | y_{11} \ge 0, y_{21} \ge 0, y_{12} \ge 0, y_{22} \ge 0\}

である.

 

以上のことから,

 \psi E[Y_{12} Y_{21}] = \frac{\sum_{y_{11} \in D_1}  y_{11} y_{22} \ \ {_{m_1} C _{y_{11}}}  \ \ {_{m_2} C _{y_{21}}} \ \ \psi^{y_{11}}}{P_0(\psi)}

となることが確認できた.よって,

 \psi E[Y_{12} Y_{21}] =  \sum_{y_{11} \in D_1} y_{11} y_{22} Pr(Y_{11}= y_{11}| \psi, {\bf s}, {\bf m})

       = E[Y_{11} Y_{22}]

である.

修正

2021年10月19日 22:45   総和の範囲 D_1, \dots, D_4において,周辺和で固定されているのが抜けていた.