11/28 MIKUセミナー

MikuHatsune2011-11-29

こちらから。
リサンプリングの話。
t検定は正規分布を仮定しているが、リサンプリングは正規分布を仮定できないときでも使える。
計算機の進化によって大量のシミュレーションができるようになった。
ただ、いつでも使えるからいつでもやるわけでもなく、t検定が使える状況ならばt検定を使ったほうがみんなが納得しやすい。
p値もいくつも計算するハメになるから、いくらでも操作できてしまう。
一番都合の悪いp値を採用することにしておく。

L<- 100000 # リサンプリングする回数
tm<- c(37,36,37.1,37.1,36.2,37.3,36.8,37,36.3,36.9,36.7,36.8) # 本の値
data<- matrix(sample(tm,size=L*length(tm),replace=TRUE),nc=length(tm)) # リサンプリングします
datamean<- apply(data,1,mean) # 平均値
sum(datamean>37)/L # が、帰無仮説37度より高いか
hist(datamean,nclass=1000) # ヒストグラム

res<- cumsum(apply(data,1,mean)>37)/(1:L)
plot(res,cex=0.1) # リサンプリングごとの、mu>37の確率。

t.test(tm,mu=37)

	One Sample t-test

data:  tm 
t = -2.0169, df = 11, p-value = 0.06878
alternative hypothesis: true mean is not equal to 37 
95 percent confidence interval:
 36.51204 37.02130 
sample estimates:
mean of x 
 36.76667