相関解析

MikuHatsune2011-05-13

遺伝子1座に2つのアレルがあって、優性遺伝をしているある遺伝病を考える。
 
\textrm{y}:遺伝的要因に関係なく病気になる人の頻度。表現型模写phenocopyという。
\textrm{f}:浸透率。観察可能な変異遺伝子が表現型として発現するかしないかという現象のことをいうらしい。
\textrm{p}:疾患原因遺伝子のアレル頻度。
\textrm{q}:野生型アレル頻度。\textrm{1-p}
\textrm{D}:疾患原因遺伝子アレル。
\textrm{d}:野生型アレル。
\textrm{a}:オッズ比。
\textrm{K}:一般人口での発症頻度。
\textrm{R}:人口寄与危険。集団全体でその遺伝子がそれほど関わっているか。\textrm{\frac{K-y}{K}}
 
優性遺伝なので、遺伝型が\textrm{DD}\textrm{Dd}なら発症、\textrm{dd}ならそうならない。
ただし、遺伝型が\textrm{DD}\textrm{Dd}であっても、発症するかは浸透率\textrm{f}による。
遺伝型が\textrm{DD}\textrm{Dd}である確率は、遺伝型が\textrm{dd}である確率の余事象なので、\textrm{1-q^2}
遺伝型が\textrm{DD}\textrm{Dd}で、発症する人の割合は、遺伝子の浸透による発病\textrm{f}と、遺伝的要因に関係なく発症する人の頻度\textrm{y}の和集合で、\textrm{f+y-fy}
この遺伝型で発症しない人は、余事象\textrm{1-(f+y-fy)=(1-f)(1-y)
遺伝型が\textrm{dd}で発症する人は、\textrm{y}
この遺伝型で発症しない人は、余事象\textrm{1-y}
 
こうすると、2*2の表が作れて
 
\begin{matrix}&\textrm{DD,Dd}&\textrm{dd}\\\textrm{Disease}&\textrm{\lbrace1-(1-f)(1-y)\rbrace(1-q^2)}&\textrm{yq^2}\\\textrm{No\hspace{3}disease}&\textrm{(1-f)(1-y)(1-q^2)}&\textrm{(1-y)q^2}\end{matrix}
 
ここからオッズ比を計算すると
\textrm{a=\frac{f+y-fy}{y(1-f)}}
浸透率\textrm{f}について整理すると
\textrm{f=\frac{y(a-1)}{1+y(a-1)}}
 
\textrm{K}は、遺伝型が\textrm{DD}\textrm{Dd}の集団(頻度\textrm{1-q^2})と、\textrm{dd}の集団(頻度\textrm{q^2})から発症してくる人を合わせて
\textrm{(f+y-fy)(1-q^2)+yq^2=f(1-q^2)(1-y)+y}
 
本当は\textrm{K}\textrm{R}についてもやりたいけど、飛ばす。

f<- function(a,y){
  res<- (y*(a-1))/(1+y*(a-1))
  return(res)
}
a<- seq(from=1,to=10,by=0.1)
y<- seq(from=0.05,to=0.4,by=0.05)
A<- matrix(0,length(a),length(y))
for(i in 1:length(a)){
for(j in 1:length(y)){
  A[i,j]<- f(a[i],y[j])
}}
persp(A,col=rainbow(length(a)*length(y)),phi=30,theta=-45,
      xlab="Odds ratio",ylab="Phenocopy",zlab="Penetrance")


オッズ比が小さいと、浸透率が小さく、家系が見つけにくい。
オッズ比が大きいと、優性遺伝形式に近くなる。
表現型模写が大きいほど、浸透率は高くなる。
 
家系が見つかったら、原因遺伝子はかなりの可能性で見つけられるようだ。