Multiple alignment

MikuHatsune2015-05-12

Multiple alignment してほしいんだけど、と言われて系統樹まで作った話。
遺伝的距離や系統樹についてはこちらが詳しいし、塩基配列の変化パターンによる重み付けについては昔やった
Multiple alignment はClustal がよく言われるが、ClustalW2を使ってみる。
まずは入力のためのFASTAファイルを作成する。

library(seqinr)
library(ape)
library(phangorn)

data(woodmouse)
w <- as.alignment(woodmouse)
write.fasta(lapply(w$seq, s2c), w$nam, file="woodmouse.fasta")

タブでDNAにして、入力ボックスにコピペしてもいいし、ファイルをアップロードしてもよい。
output option は PHYLIP にしておくと後が楽っぽい。
置換や欠損のペナルティをいくつかにするかは適宜変更する。
このあとで phylip 形式の系統樹用のデータを入手してグラフを作る。Rで作るのが面倒だったらブラウザから系統樹のデータを取ってきて、read.tree をしたら一緒になる。

ph <- read.alignment("aln-phylip.txt", format="phylip")
phyDat <- as.phyDat(ph)
tree0 <- NJ(dist.ml(phyDat))
plot(tree0)