p値の続き。
PART4 CHAPTER15のシミュレーション。
こちらで体温を扱ったのでこれを流用してみる。
平均的な正常体温は37.0度だと多くの書物は示しているらしい。
ここで、130人の体温をランダムにサンプリングしたら、平均は36.82度、95%信頼区間は36.75~36.89度だった。
95%信頼区間は37.0を含んでいないので、平均値が37.0の母集団から抽出された値であるという仮説に一致しないことが明らかである。
けれども、練習と思って検定してみる。
下のスクリプトでは乱数を固定した。
サンプル平均と仮の母平均との差は0.19である。p値は次の質問に答える。
母平均が真に37.0であるとすれば、130のサンプルで、サンプル平均と仮の母平均の差の絶対値が0.19またはそれ以上である確率はどの程度か?
ここでは両側t検定を行った(片側は後述)。
tm<- c(37,36,37.1,37.1,36.2,37.3,36.8,37,36.3,36.9,36.7,36.8) # 本の値 set.seed(3000) # 乱数調整 tms<- rnorm(130,36.82,0.36) # こちらで良い感じに調節しました。 summary(tms) t.test(tms,mu=37,alternative="two.sided",paired=FALSE,conf.level=0.95) # 母平均37.0、両側t検定、対応のないt検定、信頼水準95%とまじめに書いたらこうなる。 One Sample t-test data: tms t = -6.0822, df = 129, p-value = 1.253e-08 alternative hypothesis: true mean is not equal to 37 95 percent confidence interval: 36.74749 36.87145 sample estimates: mean of x 36.80947
p値は極端に小さく、単純にp<0.0001と報告する。
これは母平均が真に37.0のときに、130人のサンプル平均が実際に観察されるのと同程度に仮の平均から離れている確率がわずかしかないことを示す。
これは帰無仮説が正しくないことを証明するわけではないことに注意する。
統計学的に有意な差であることは証明された。
問題は、統計学的有意が生物学的に有意かという話である。
130人の体温の平均が37.0度ではなかったから、だからどうした?という話である。ぶっちゃけて言うと無いと思う。
ただ、これは統計の理解のためのシミュレーションなので勘弁して欲しい。
サンプルが増えるとp値が厳しくなることを思い出すと、
t.test(tm,mu=37,alternative="two.sided",paired=FALSE,conf.level=0.95) One Sample t-test data: tm t = -2.0169, df = 11, p-value = 0.06878 alternative hypothesis: true mean is not equal to 37 95 percent confidence interval: 36.51204 37.02130 sample estimates: mean of x 36.76667
サンプルが12に小さいと、p値は0.069で、0.05を基準に言うと有意でない。
まあ、だからどうしたという(ry