リスクゾーンという言葉を目にした。一般用語ではないけれども、試験で落ちそうなボーダーのところにいる人のことを指している。
証拠保全に魚拓取った。
今回の国試では,国立大学の受験生が苦戦している様子が分かります。と書かれているのだが、苦戦している様子がまったく分からない…
国立、私立関係なく、採点したすべての受験者からリスクゾーンになる人がどれくらいの割合出てくるか計算して、これを帰無仮説にして二項検定で苦戦しているかどうか検定してみる。
結果としては国立は4.5% ~ 7.3%の人がリスクゾーン、私立だと7.1% ~ 14%の人がリスクゾーンになる計算。国立大学の受験生は何を基準にしたら苦戦しているのだろうか…
そもそも、データから単純にリスクゾーンになる人の割合を出しただけでも国立5.6%、私立10%なのに、何を持って苦戦と言うのか…「リスクゾーン」というもの自体は、いままでの模試の成績から算定されたものなので国試とは違うが、いやでもよく分からない。
この段落で「今回の国試では,国立大学の受験生が苦戦している様子が分かります。」と言われてもそれを読み取れるだけの情報がないと思うし、この後の項を読んでも単純集計した数で円グラフを作っているっぽいし、それで苦戦しているというのだろうか…それなら国立大学が多いのは当たり前なんだからそうなんじゃない…
分かる人教えてください。
a <- read.delim("clipboard", header=TRUE) # データ読み込み s1 <- tapply(a$V1, a$V3, sum) # カテゴリごとの採点者数 s2 <- tapply(a$V2, a$V3, sum) # カテゴリごとのリスクゾーン人数 p1 <- sum(s2) / sum(s1) # 全カテゴリをいっしょくたにした、リスクゾーンになる受験者の割合
binom.test(s2["国立"], s1["国立"], p1)
Exact binomial test data: s2["国立"] and s1["国立"] number of successes = 66, number of trials = 1138, p-value = 0.3375 alternative hypothesis: true probability of success is not equal to 0.06543837 95 percent confidence interval: 0.04513491 0.07319800 sample estimates: probability of success 0.05799649
binom.test(s2["私立"], s1["私立"], p1)
Exact binomial test data: s2["私立"] and s1["私立"] number of successes = 31, number of trials = 303, p-value = 0.01409 alternative hypothesis: true probability of success is not equal to 0.06543837 95 percent confidence interval: 0.07057947 0.14207198 sample estimates: probability of success 0.1023102
データはこちら。
62 6 国立 59 5 国立 68 5 国立 68 5 国立 51 4 国立 51 4 国立 55 4 国立 56 4 国立 60 4 国立 61 4 国立 67 4 国立 88 4 国立 57 3 国立 60 2 国立 61 2 国立 65 2 国立 70 2 国立 79 2 国立 41 4 公立 92 2 公立 53 9 私立 45 8 私立 41 4 私立 54 4 私立 54 3 私立 56 3 私立