こちらから。
リサンプリングの話。
t検定は正規分布を仮定しているが、リサンプリングは正規分布を仮定できないときでも使える。
計算機の進化によって大量のシミュレーションができるようになった。
ただ、いつでも使えるからいつでもやるわけでもなく、t検定が使える状況ならばt検定を使ったほうがみんなが納得しやすい。
p値もいくつも計算するハメになるから、いくらでも操作できてしまう。
一番都合の悪いp値を採用することにしておく。
L<- 100000 # リサンプリングする回数 tm<- c(37,36,37.1,37.1,36.2,37.3,36.8,37,36.3,36.9,36.7,36.8) # 本の値 data<- matrix(sample(tm,size=L*length(tm),replace=TRUE),nc=length(tm)) # リサンプリングします datamean<- apply(data,1,mean) # 平均値 sum(datamean>37)/L # が、帰無仮説37度より高いか hist(datamean,nclass=1000) # ヒストグラム res<- cumsum(apply(data,1,mean)>37)/(1:L) plot(res,cex=0.1) # リサンプリングごとの、mu>37の確率。 t.test(tm,mu=37) One Sample t-test data: tm t = -2.0169, df = 11, p-value = 0.06878 alternative hypothesis: true mean is not equal to 37 95 percent confidence interval: 36.51204 37.02130 sample estimates: mean of x 36.76667