p値

PART4 CHAPTER15のシミュレーション。
 
p値と検定について。
こちらで、統計とは、
集計すること
検定すること
推定すること
と書いた。
今回は検定について考える。
ここで、本中にある例を使って検定をしてみる。
 
例:コインを20回投げたところ、16回は表、4回は裏であった。この確率はどの程度低いだろうか。
 
集計したことは
 
コインを20回投げたところ、16回は表、4回は裏であった。
 
である。
この試行をするまえに、私たちは、
 
コインは表と裏が等しい確率(=\frac{1}{2})で出る
 
と信じていた。
この条件のもとで、実際に得られた結果が出る確率をp値と本では言っている。
自分の理解もこれで正しい。と思う。
 
統計学の本に書いてあるように、正しい流れで書くと、表が出る確率p_{omote}、裏が出る確率p_{ura}として
帰無仮説p_{omote}=p_{ura}(=\frac{1}{2})
対立仮説p_{omote}\not=p_{ura}
やり方としては背理法で、帰無仮説を仮定してやったことが矛盾していたら、帰無仮説はおかしい
だから対立仮説が支持されるだろう、という手法でやる。
 
帰無仮説の通りにいくと、表と裏の出る確率は等しく、それでいて表が16回出るような場合を考える。
これは

binom.test(16,20,p=0.5)

で与えられる。

# Result

	Exact binomial test

data:  16 and 20 
number of successes = 16, number of trials = 20, p-value = 0.01182
alternative hypothesis: true probability of success is not equal to 0.5 
95 percent confidence interval:
 0.563386 0.942666 
sample estimates:
probability of success 
                   0.8 

この確率は0.01182です、と言っている(p-valueの項)。
95%信頼区間も返してくれている。
帰無仮説を信じるなら、この結果を得る確率は0.0118です、ということである。
どんなことでも、万が一、億が一、の確率で起こることもあるだろう。ただし、それらすべてを採用するわけにもいかないので、それならば、5%より珍しいことは起きにくいでしょう、ということにする。
すると、帰無仮説を信じていたら起きにくいことなので、帰無仮説はダメでしょう、ということになる。
 
仮説検定に戻って、帰無仮説p_{omote}=p_{ura}は違う、ということだけは言える。