PART4 CHAPTER15のシミュレーション。
p値と検定について。
こちらで、統計とは、
集計すること
検定すること
推定すること
と書いた。
今回は検定について考える。
ここで、本中にある例を使って検定をしてみる。
例:コインを20回投げたところ、16回は表、4回は裏であった。この確率はどの程度低いだろうか。
集計したことは
コインを20回投げたところ、16回は表、4回は裏であった。
である。
この試行をするまえに、私たちは、
コインは表と裏が等しい確率で出る
と信じていた。
この条件のもとで、実際に得られた結果が出る確率をp値と本では言っている。
自分の理解もこれで正しい。と思う。
統計学の本に書いてあるように、正しい流れで書くと、表が出る確率、裏が出る確率として
帰無仮説:
対立仮説:
やり方としては背理法で、帰無仮説を仮定してやったことが矛盾していたら、帰無仮説はおかしい
だから対立仮説が支持されるだろう、という手法でやる。
帰無仮説の通りにいくと、表と裏の出る確率は等しく、それでいて表が16回出るような場合を考える。
これは
binom.test(16,20,p=0.5)
で与えられる。
# Result Exact binomial test data: 16 and 20 number of successes = 16, number of trials = 20, p-value = 0.01182 alternative hypothesis: true probability of success is not equal to 0.5 95 percent confidence interval: 0.563386 0.942666 sample estimates: probability of success 0.8
この確率は0.01182です、と言っている(p-valueの項)。
95%信頼区間も返してくれている。
帰無仮説を信じるなら、この結果を得る確率は0.0118です、ということである。
どんなことでも、万が一、億が一、の確率で起こることもあるだろう。ただし、それらすべてを採用するわけにもいかないので、それならば、5%より珍しいことは起きにくいでしょう、ということにする。
すると、帰無仮説を信じていたら起きにくいことなので、帰無仮説はダメでしょう、ということになる。
仮説検定に戻って、帰無仮説は違う、ということだけは言える。