Bradley–Terry modelという、組み合わせ勝負の序列推定法が論文に使われている。
Nat Genet. 2015 May;47(5):458-68.
日本語解説
脳腫瘍はいわゆる普通の癌のような、TNM分類による悪性度 Grade X はなく、病理学的分類からWHO I 〜 IV というカテゴリになる。
WHO IV はよく聞く膠芽腫だが、Grade IIくらいの悪性度の低めの脳腫瘍の遺伝子変異パターンと、変異が入る順序の解析が行われている。
IDH1 もしくはIDH2 遺伝子変異が入ってから、1p と 19q の欠損が起きることをBradley–Terry model を使って推定している。
Bradley–Terry model
BradleyTerry2でできる。
解説
library(BradleyTerry2) data(citations)
citations データは相互参照数がどれくらいかの集計である。
citing cited Biometrika Comm Statist JASA JRSS-B Biometrika 714 730 498 221 Comm Statist 33 425 68 17 JASA 320 813 1072 142 JRSS-B 284 276 325 188
これをBradleyTerry2 パッケージが扱えるように1対1のペアにする。
citations.sf <- countsToBinomial(citations)
journal1 journal2 win1 win2 1 Biometrika Comm Statist 730 33 2 Biometrika JASA 498 320 3 Biometrika JRSS-B 221 284 4 Comm Statist JASA 68 813 5 Comm Statist JRSS-B 17 276 6 JASA JRSS-B 142 325
Bradley–Terry model をする。この場合はBiometrika からみた強さが出る。つまりBiometrika を0にした場合である。JRSS-B が一番強そう(確信
names(citations.sf)[1:2] <- c("journal1", "journal2") ## First fit the "standard" Bradley-Terry model citeModel <- BTm(cbind(win1, win2), journal1, journal2, data = citations.sf)
Bradley Terry model fit by glm.fit Call: BTm(outcome = cbind(win1, win2), player1 = journal1, player2 = journal2, data = citations.sf) Coefficients: ..Comm Statist ..JASA ..JRSS-B -2.9491 -0.4796 0.2690 Degrees of Freedom: 6 Total (i.e. Null); 3 Residual Null Deviance: 1925 Residual Deviance: 4.293 AIC: 46.39
基準を変えたいときには
## Now the same thing with a different "reference" journal update(citeModel, refcat = "JASA")