ゲノム疫学のためのインフォマティクス2012 ゲノム(1)、ハプロタイプ、連鎖不平衡、因子の組合せ、アレル特異的機能差
case 100
ctrl 100
SNP 100,000
とすると
100,000 * 200 のgenotypeがある。
アレルを表すなら、3種類の文字があればよい
文字と区切り(\t, \, ,,,)と改行を使ってtxtファイルを作る。
の6個の部屋
60万の数値
SNPがn個あるとして、SNP を
と並べる。
HWE
連鎖不平衡
DNA分子の上に複数の多型があるとする。一つの多型のアレルがわかると、別の多型のアレルがわかってしまうとき、この2つの多型は連鎖不平衡にあるという。
Wiki中の、「特定の組合せ(ハプロタイプ)の頻度が有意に高くなる集団遺伝学的な現象」と同じ。
A/T G/C のとき
A-G 30%
A-C 30%
T-G 30%
T-C 10%
SNP1のメジャーアレルはA
SNP2のメジャーアレルはG
p1 AA GG/GC/CC
p2 TT GG/GC/CC
10万個(ではないけど)のSNPをゲノムワイドに等間隔に配置したとして
がたくさん計算される→個
heatmapをピラミッド状に書き換える。
chr5 あるSNP_X(転写開始領域とか) AA AT TT
chr8 あるSNP_Y(アミノ酸変化を伴うCDSとか) GG GC CC
AA/CCのときリスクが上がる、とかすると
3*3の9通りのgenotype
SNP k個につき、通り
heatmapを描いてくれるRがあった。
mapLD
ただし、出力が.epsというファイルで、Windowsだとデフォルトで開けなかったのでLinuxで作成した。
head(SNPdata) Allele1 Allele2 subjectID markerID position 4182 C T 82 m13 18601 4526 G T 82 m14 18601 4870 G G 82 m15 18601 5214 A A 82 m16 18601 5558 A G 82 m17 18601 5902 G T 82 m18 18601
library(mapLD) data(SNPdata) mapLD(SNPdata, locusID.col="markerID", subjectID.col="subjectID", allele.cols=c("Allele1", "Allele2"), outgraph="output.eps") #SNPdata にはdataframeか、たぶんズラズラとvectorを入れればできそう。 #locusID.col にはマーカーのID #subjectID.col にはサンプルのID #allele.cols は比較する2つのアレル #出力は現在のRディレクトリに.epsで出力される。ディレクトリと名前を指定できる。 #計算だけならNAを指定する。 $LDinfo LOCUSID1 LOCUSID2 f.AB f.Ab f.aB f.ab 1 1 2 3.710638e-01 7.024109e-05 4.739362e-01 1.549298e-01 2 1 3 3.710660e-01 6.797557e-05 4.789340e-01 1.499320e-01 3 1 4 3.710654e-01 6.866209e-05 4.774195e-01 1.514465e-01 4 1 5 2.421140e-01 1.290201e-01 8.111836e-02 5.477476e-01 5 1 6 1.231615e-01 2.479725e-01 5.536062e-01 7.525980e-02 6 1 7 3.514525e-01 1.968151e-02 2.435475e-01 3.853185e-01 7 1 8 1.242309e-01 2.469031e-01 5.424358e-01 8.643023e-02 8 1 9 2.430293e-02 3.468311e-01 1.706971e-01 4.581689e-01 9 1 10 1.215552e-01 2.495788e-01 4.034448e-01 2.254212e-01 10 1 11 2.103941e-02 3.500946e-01 2.289606e-01 3.999054e-01 11 1 12 3.647589e-01 6.375138e-03 5.152411e-01 1.136249e-01 12 1 13 2.478409e-01 1.232931e-01 8.215910e-02 5.467069e-01 13 2 3 6.950694e-01 1.499306e-01 1.549306e-01 6.936818e-05 14 2 4 6.935546e-01 1.514454e-01 1.549302e-01 6.978936e-05 15 2 5 3.231589e-01 5.218411e-01 7.343453e-05 1.549266e-01 16 2 6 5.218411e-01 3.231589e-01 1.549266e-01 7.343453e-05 17 2 7 5.949298e-01 2.500702e-01 7.024109e-05 1.549298e-01 18 2 8 5.283996e-01 3.166004e-01 1.382671e-01 1.673290e-02 19 2 9 4.523015e-02 7.997698e-01 1.497698e-01 5.230152e-03 20 2 10 3.700702e-01 4.749298e-01 1.549298e-01 7.024109e-05 21 2 11 9.507024e-02 7.499298e-01 1.549298e-01 7.024109e-05 22 2 12 7.402118e-01 1.047882e-01 1.397882e-01 1.521180e-02 23 2 13 3.299298e-01 5.150702e-01 7.024109e-05 1.549298e-01 24 3 4 8.440579e-01 5.942119e-03 4.426968e-03 1.455730e-01 25 3 5 3.231643e-01 5.268357e-01 6.797557e-05 1.499320e-01 26 3 6 5.268357e-01 3.231643e-01 1.499320e-01 6.797557e-05 27 3 7 5.876428e-01 2.623572e-01 7.357234e-03 1.426428e-01 28 3 8 5.167346e-01 3.332654e-01 1.499320e-01 6.797557e-05 29 3 9 1.949226e-01 6.550774e-01 7.741409e-05 1.499226e-01 30 3 10 3.750680e-01 4.749320e-01 1.499320e-01 6.797557e-05 31 3 11 2.499320e-01 6.000680e-01 6.797557e-05 1.499320e-01 32 3 12 7.305915e-01 1.194085e-01 1.494085e-01 5.915092e-04 33 3 13 3.299320e-01 5.200680e-01 6.797557e-05 1.499320e-01 34 4 5 3.231637e-01 5.253212e-01 6.866209e-05 1.514465e-01 35 4 6 5.253212e-01 3.231637e-01 1.514465e-01 6.866209e-05 36 4 7 5.949313e-01 2.535535e-01 6.866209e-05 1.514465e-01 37 4 8 5.152202e-01 3.332647e-01 1.514465e-01 6.866209e-05 38 4 9 1.949559e-01 6.535290e-01 4.413456e-05 1.514710e-01 39 4 10 3.735535e-01 4.749313e-01 1.514465e-01 6.866209e-05 40 4 11 2.499313e-01 5.985535e-01 6.866209e-05 1.514465e-01 41 4 12 7.285459e-01 1.199390e-01 1.514541e-01 6.103572e-05 42 4 13 3.299313e-01 5.185535e-01 6.866209e-05 1.514465e-01 43 5 6 2.546708e-03 3.206856e-01 6.742210e-01 2.546708e-03 44 5 7 3.231825e-01 4.983098e-05 2.718175e-01 4.049502e-01 45 5 8 4.983579e-05 3.231825e-01 6.666168e-01 1.015085e-02 46 5 9 4.767514e-05 3.231846e-01 1.949523e-01 4.818154e-01 47 5 10 4.983579e-05 3.231825e-01 5.249502e-01 1.518175e-01 48 5 11 7.001839e-05 3.231623e-01 2.499300e-01 4.268377e-01 49 5 12 2.658345e-01 5.739781e-02 6.141655e-01 6.260219e-02 50 5 13 3.231825e-01 4.983098e-05 6.817508e-03 6.699502e-01 51 6 7 2.718175e-01 4.049502e-01 3.231825e-01 4.983174e-05 52 6 8 6.666168e-01 1.015084e-02 4.982586e-05 3.231825e-01 53 6 9 1.949523e-01 4.818153e-01 4.767223e-05 3.231847e-01 54 6 10 5.249502e-01 1.518175e-01 4.982797e-05 3.231825e-01 55 6 11 2.499300e-01 4.268377e-01 7.001839e-05 3.231623e-01 56 6 12 6.141655e-01 6.260219e-02 2.658345e-01 5.739781e-02 57 6 13 6.817512e-03 6.699502e-01 3.231825e-01 4.983569e-05 58 7 8 2.685222e-01 3.264778e-01 3.981445e-01 6.855545e-03 59 7 9 4.767514e-05 5.949523e-01 1.949523e-01 2.100477e-01 60 7 10 1.200701e-01 4.749299e-01 4.049299e-01 7.010346e-05 61 7 11 7.001839e-05 5.949300e-01 2.499300e-01 1.550700e-01 62 7 12 5.205301e-01 7.446988e-02 3.594699e-01 4.553012e-02 63 7 13 3.299483e-01 2.650517e-01 5.172606e-05 4.049483e-01 64 8 9 1.837150e-01 4.829517e-01 1.128502e-02 3.220483e-01 65 8 10 5.133799e-01 1.532868e-01 1.162009e-02 3.217132e-01 66 8 11 2.411249e-01 4.255418e-01 8.875130e-03 3.244582e-01 67 8 12 6.058176e-01 6.084902e-02 2.741824e-01 5.915098e-02 68 8 13 1.780783e-03 6.648859e-01 3.282192e-01 5.114117e-03 69 9 10 1.949523e-01 4.767223e-05 3.300477e-01 4.749523e-01 70 9 11 1.949523e-01 4.767223e-05 5.504767e-02 7.499523e-01 71 9 12 1.932826e-01 1.717398e-03 6.867174e-01 1.182826e-01 72 9 13 4.767514e-05 1.949523e-01 3.299523e-01 4.750477e-01 73 10 11 2.499300e-01 2.750700e-01 7.001839e-05 4.749300e-01 74 10 12 4.525514e-01 7.244863e-02 4.274486e-01 4.755137e-02 75 10 13 5.173097e-05 5.249483e-01 3.299483e-01 1.450517e-01 76 11 12 2.145699e-01 3.543008e-02 6.654301e-01 8.456992e-02 77 11 13 7.001839e-05 2.499300e-01 3.299300e-01 4.200700e-01 78 12 13 2.734894e-01 6.065106e-01 5.651060e-02 6.348940e-02 DPRIME Lower Upper LDstrength 1 0.99877896 0.578 0.9920 Others 2 0.99877896 0.555 0.9920 Others 3 0.99877896 0.537 0.9910 Others 4 0.60093260 0.457 0.7100 Historical Evidence of Recombination 5 0.62975417 0.489 0.7350 Historical Evidence of Recombination 6 0.86905991 0.698 0.9400 Others 7 0.58768531 0.446 0.6950 Historical Evidence of Recombination 8 0.66419028 0.278 0.8480 Historical Evidence of Recombination 9 0.37614537 0.199 0.5240 Historical Evidence of Recombination 10 0.77324194 0.487 0.8970 Historical Evidence of Recombination 11 0.85685453 0.439 0.9510 Others 12 0.60410170 0.465 0.7100 Historical Evidence of Recombination 13 0.99701642 0.151 0.9760 Others 14 0.99702832 0.155 0.9760 Others 15 0.99853427 0.291 0.9850 Others 16 0.99853427 0.291 0.9850 Others 17 0.99923837 0.797 0.9970 Strong LD 18 0.67613748 0.120 0.8990 Historical Evidence of Recombination 19 0.95808333 0.839 0.9860 Strong LD 20 0.99904596 0.684 0.9950 Others 21 0.99939578 0.877 0.9980 Strong LD 22 0.18216124 0.043 0.9290 Others 23 0.99862676 0.322 0.9860 Others 24 0.96521668 0.881 0.9880 Strong LD 25 0.99859800 0.428 0.9890 Others 26 0.99859800 0.428 0.9890 Others 27 0.91756601 0.651 0.9720 Others 28 0.99864049 0.465 0.9900 Others 29 0.99735336 0.225 0.9810 Others 30 0.99904596 0.643 0.9940 Others 31 0.99818732 0.430 0.9890 Others 32 0.96713838 0.077 0.9600 Others 33 0.99862676 0.452 0.9900 Others 34 0.99859801 0.422 0.9890 Others 35 0.99859801 0.422 0.9890 Others 36 0.99923837 0.787 0.9970 Strong LD 37 0.99864049 0.460 0.9900 Others 38 0.99850621 0.215 0.9810 Others 39 0.99904596 0.663 0.9940 Others 40 0.99818732 0.365 0.9870 Others 41 0.99664304 0.079 0.9610 Others 42 0.99862676 0.446 0.9890 Others 43 0.98835807 0.944 0.9960 Strong LD 44 0.99961935 0.854 0.9980 Strong LD 45 0.99976873 0.951 0.9999 Strong LD 46 0.99924362 0.539 0.9920 Others 47 0.99970632 0.907 0.9990 Strong LD 48 0.99913352 0.703 0.9950 Strong LD 49 0.22915215 0.035 0.5140 Historical Evidence of Recombination 50 0.99976990 0.965 0.9999 Strong LD 51 0.99961934 0.854 0.9980 Strong LD 52 0.99976878 0.940 0.9990 Strong LD 53 0.99924366 0.539 0.9920 Others 54 0.99970637 0.907 0.9990 Strong LD 55 0.99913352 0.703 0.9950 Strong LD 56 0.22915215 0.035 0.5140 Historical Evidence of Recombination 57 0.99976988 0.957 0.9999 Strong LD 58 0.94921818 0.778 0.9820 Strong LD 59 0.99958910 0.854 0.9980 Strong LD 60 0.99963559 0.921 0.9990 Strong LD 61 0.99952929 0.896 0.9990 Strong LD 62 0.06316623 0.023 0.6420 Historical Evidence of Recombination 63 0.99961297 0.858 0.9980 Strong LD 64 0.82638426 0.335 0.9410 Others 65 0.93359947 0.811 0.9730 Others 66 0.89349844 0.555 0.9630 Others 67 0.23938721 0.038 0.5180 Historical Evidence of Recombination 68 0.99190553 0.940 0.9980 Strong LD 69 0.99948532 0.779 0.9970 Strong LD 70 0.99967404 0.910 0.9990 Strong LD 71 0.92660691 0.079 0.9600 Others 72 0.99925913 0.561 0.9920 Others 73 0.99941037 0.846 0.9980 Strong LD 74 0.16576540 0.026 0.5850 Historical Evidence of Recombination 75 0.99970141 0.907 0.9990 Strong LD 76 0.06033419 0.019 0.6450 Historical Evidence of Recombination 77 0.99915129 0.714 0.9950 Strong LD 78 0.21033088 0.031 0.5050 Historical Evidence of Recombination $LDblock head tail contains 1 1 1 1 2 2 11 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 3 12 12 12 4 13 13 13 $locusMap LocusName LocusIndex 1 m13 1 2 m14 2 3 m15 3 4 m16 4 5 m17 5 6 m18 6 7 m19 7 8 m20 8 9 m21 9 10 m22 10 11 m23 11 12 m24 12 13 m25 13