2/21 MIKUセミナー

そんななぁなぁではなく、きちんと原因追求(バグ取り)していかないと、なんか知らないけど治っちゃた〜あはは、になっちゃうよというお話。(その1)(その2)(その3)(その4
先生はそういうところは厳しいけど、厳しく指摘してくださるのはありがたい。EBMって言うし、薬あげたらなんか知らんけど勝手に治っちゃった、というのではいかん。
まあ、ここは休み中にスクリプトを見直すとしよう。
それよりも今日はχ自乗検定の話が非常にわかりやすかった。
チーム1とチーム2の勝敗数から、2チームの強さを比較したい。
チーム1からみて、チーム2に対しての勝敗数を収めているとすると
\begin{matrix}&Win&Lose\\Battle&30&28\end{matrix}
これだと、チーム1がチーム2より強そう、とは思えないけど
\begin{matrix}&Win&Lose\\Battle&300&280\end{matrix}
だと、チーム1のほうが強そうに思える。
チーム1とチーム2が同じ強さと思っているのは、つまり58試合と580試合で同じ確率で勝敗を分け合うときなので、そこから考えて30勝28敗と300勝280敗がどれだけありえなさそうか、というのが問題で
\sum_{k=0}^n\begin{pmatrix}n\\k\end{pmatrix}(\frac{1}{2})^n(n=58,580)
で各々勝数の確率がでる。
すると、58試合ではp値が1に近いけど、580試合ではずいぶんp値が小さくなったので、これならチーム1とチーム2の強さは同じ、という仮説は棄却されると思うほうに近づいてくる。
こちらでおかしいのは、chisq.testに何も考えず放り込んだのもすだけど、充分回試行しているから、検定なんか使わなくても結果がそうなっていることがそういうことを言っている。

A<- rep(0,58+1)
for(n in 0:58){
  A[n+1]<- choose(58,n)*(1/2)^58
}
B<- rep(0,580+1)
for(n in 0:580){
  B[n+1]<- choose(580,n)*(1/2)^580
}
# p値
1-sum(A[29])
1-sum(B[281:299])
par(mfrow=c(1,2))
plot(A,type="s",ylim=c(0,max(A,B)))
abline(v=30);abline(v=28)
plot(B,type="s",ylim=c(0,max(A,B)))
abline(v=300);abline(v=280)