Bradley–Terry model

Bradley–Terry modelという、組み合わせ勝負の序列推定法が論文に使われている。
Nat Genet. 2015 May;47(5):458-68.
日本語解説
 
脳腫瘍はいわゆる普通の癌のような、TNM分類による悪性度 Grade X はなく、病理学的分類からWHO I 〜 IV というカテゴリになる。
WHO IV はよく聞く膠芽腫だが、Grade IIくらいの悪性度の低めの脳腫瘍の遺伝子変異パターンと、変異が入る順序の解析が行われている。
IDH1 もしくはIDH2 遺伝子変異が入ってから、1p と 19q の欠損が起きることをBradley–Terry model を使って推定している。
 
Bradley–Terry model
BradleyTerry2でできる。
解説

library(BradleyTerry2)
data(citations)

citations データは相互参照数がどれくらいかの集計である。

              citing
cited          Biometrika Comm Statist JASA JRSS-B
  Biometrika          714          730  498    221
  Comm Statist         33          425   68     17
  JASA                320          813 1072    142
  JRSS-B              284          276  325    188

これをBradleyTerry2 パッケージが扱えるように1対1のペアにする。

citations.sf <- countsToBinomial(citations)
      journal1     journal2 win1 win2
1   Biometrika Comm Statist  730   33
2   Biometrika         JASA  498  320
3   Biometrika       JRSS-B  221  284
4 Comm Statist         JASA   68  813
5 Comm Statist       JRSS-B   17  276
6         JASA       JRSS-B  142  325

Bradley–Terry model をする。この場合はBiometrika からみた強さが出る。つまりBiometrika を0にした場合である。JRSS-B が一番強そう(確信

names(citations.sf)[1:2] <- c("journal1", "journal2")
## First fit the "standard" Bradley-Terry model
citeModel <- BTm(cbind(win1, win2), journal1, journal2, data = citations.sf)
Bradley Terry model fit by glm.fit 

Call:  BTm(outcome = cbind(win1, win2), player1 = journal1, player2 = journal2, 
    data = citations.sf)

Coefficients:
..Comm Statist          ..JASA        ..JRSS-B  
       -2.9491         -0.4796          0.2690  

Degrees of Freedom: 6 Total (i.e. Null);  3 Residual
Null Deviance:	    1925 
Residual Deviance: 4.293 	AIC: 46.39

基準を変えたいときには

## Now the same thing with a different "reference" journal
update(citeModel, refcat = "JASA")