とある試験は受験回数の制限はないが、受験回数が増えるごとに合格率が低下していくことが指摘されている。
というわけでデータを入手してプロットしてみた。
# データ # 受験回数, 受験者数, 合格者数のデータフレーム trial,candidate,passed 1,7742,7205 2,467,362 3,125,75 4,49,26 5,30,9 6,17,6 7,14,0 8,13,3 9,14,2 10,98,8
合格率を地味にプロットすると、線形かと思いきや指数関数的に減少しているように見えるので、指数関数的に減少するモデルに当てはめる。
初回受験者は97%、2回目でも75%は合格するが、それ以上は難しい…とうかモチベーションが続かないだろう。
dat <- read.csv("clipboard") # データの読み込み library(drc) curve1 <- drm(dat$passed/dat$candidate ~ dat$trial, fct=EXD.2()) pr1 <- predict(curve1, as.data.frame(dat$trial)) # 各受験回数で予測 x <- seq(min(dat$trial), max(dat$trial)+1, length=1000) pr2 <- predict(curve1, as.data.frame(x)) # 曲線補完するための予測 par(mar=c(5, 5, 4, 2)) plot(dat$trial, dat$passed/dat$candidate, xlim=c(1, max(dat$trial)+1), ylim=c(0, 1), xlab="受験回数", ylab="合格率", cex.lab=2, cex.axis=1.6, xaxt="n", las=1) axis(1, at=dat$trial, labels=dat$trial, cex.axis=1.6) lines(x, pr2, lwd=3) text(dat$trial, pr1, paste(round(pr1*100, 1), "%", sep=""), adj=c(0, -1))
センター試験の記号の偏りがどうかこうかとかいう質問を受けたので、過去4年分の回答から選択肢の散らばりをとってきた。
複数回答はばらして、記号が純粋に何回選ばれたかをカウントした。また、A〜E以外の選択肢は面倒なので除外した。
A B C D E 107 122 110 93 125 135 106 99 106 135 123 113 105 118 128 132 111 133 104 121 123 143 123 128