Multiple alignment してほしいんだけど、と言われて系統樹まで作った話。
遺伝的距離や系統樹についてはこちらが詳しいし、塩基配列の変化パターンによる重み付けについては昔やった。
Multiple alignment はClustal がよく言われるが、ClustalW2を使ってみる。
まずは入力のためのFASTAファイルを作成する。
library(seqinr) library(ape) library(phangorn) data(woodmouse) w <- as.alignment(woodmouse) write.fasta(lapply(w$seq, s2c), w$nam, file="woodmouse.fasta")
タブでDNAにして、入力ボックスにコピペしてもいいし、ファイルをアップロードしてもよい。
output option は PHYLIP にしておくと後が楽っぽい。
置換や欠損のペナルティをいくつかにするかは適宜変更する。
このあとで phylip 形式の系統樹用のデータを入手してグラフを作る。Rで作るのが面倒だったらブラウザから系統樹のデータを取ってきて、read.tree をしたら一緒になる。
ph <- read.alignment("aln-phylip.txt", format="phylip") phyDat <- as.phyDat(ph) tree0 <- NJ(dist.ml(phyDat)) plot(tree0)