Mendelian randomization

読んだ。
Public Health. 2017 Apr;145:113-119.
Nat Rev Rheumatol. 2016 Aug;12(8):486-96.
Biosocial Surveys.
Nat Rev Genet. 2013 Jul;14(7):483-95.
 
Mendelian randomization は何かというと、経済学などの因果推論では操作変数法と呼ばれるものを統計遺伝学で言っているもののようである。
Mendelian Randomization/Instrumental Variable法 - ryamadaの遺伝学・遺伝統計学メモ
遺伝統計学における「因果律」の特殊性 - aggren0xの日記
因果グラフからみる交絡問題:「遺伝統計学における因果問題の特殊性」について考えてみた - Take a Risk:林岳彦の研究メモ
 
MR の前提は、操作変数法の第3変数の前提と同じで、そもそも因果推論には原因→結果、を推定したいのだが、どちらにも影響する交絡因子がある。これを制御するには、RCT が絶対である。
がしかし、RCT 以外の因果推論法は、RCT できないからこそ、いまある手持ちのデータを単なる観察研究ではなく因果推論力の高い推定をしたい、というモチベーションである。
で、MR の前提に戻ると、
instrument variable (と操作変数のことを言う)は、原因(と思っている変数)にのみ影響し、交絡、結果には影響しない。
ランダムに割り付けられる。
効果は単一
であることが挙げられている。
 
原因にのみ影響するのは、DAG がよく書かれているが、IV が増減したら原因のみが増減して、ここに因果関係があるならば、原因が増減したから結果が増減する、これを定量化するわけである。もしIV が交絡因子にも影響すれば、同時に動くパラメータが増えすぎるため、真の因果推論効果の推定は難しい。
ランダムに割り付けられるのは、Mendelian randomization と言っているくらいだから、ランダムなのである。なぜランダム性が担保されるかというと、ある遺伝子要素(基本的にSNP かアレル)は、減数分裂meiosis のときに、基本的には50:50 で分配されるからである。このランダム性はHWE だし、あるリスクアレルを持つ人たち AA/Aa/aa は、基本的にランダムに分配される。
効果は単一であるのは、単一であるほうが推定が簡単だからである。pleiotropy(いち遺伝子が複数疾患に関与する)場合は難しい。
 
よく例示されるのが、喫煙と肺癌の関係である。喫煙は何も考えないまま症例を集めると、性別や収入階級、年齢が交絡となる。年齢が高いほど喫煙しやすいし、そもそも自然経過として癌に罹患しやすい。
ここで、MR を用いて、IV としてCYP2A6 という酵素の多型を考える。CYP2A6 はいろいろな毒素の分解に関わっていて、このgenotype だとどれくらいの毒素分解能があるかというのは分かっている。なので、肺癌の毒性物質に対する強さがそれなりにわかる。
そして、CYP2A6 そのものは肺癌の発生には関係ない(体内毒素はどうなの? と聞かれるとよくわからん)し、CYP2A6 があるから喫煙しませんとか、むしろ喫煙しますとか、普通の人ならそんなことは考えないので、交絡因子とは無関係である。そして、CYP2A6 は遺伝子として減数分裂時にランダムに分配されるので、ランダムである。ということでMR を使った因果推論をしている。
 
Propensity score と同じで、基本的にRCT ができなさそうなときにうまくgenotype が取れる系の研究ならこれが可能で、たとえば、CRP と虚血性心疾患は関係あるのか(ない)とか、HDL を上げると心疾患に対してはいいのか(悪くはないけどよくはならなさそう)とか、胎児のアルコール暴露はどうなのか(RCT は無理だが、MR では悪影響であることがわかった)とか、そういうことが分かるらしい。
 
で、上のリンクの特殊性で言っているように、遺伝医学は病気になった人と健康な人を集めてgenotyping して解析するのは、一見すると観察研究のようなのに因果関係として言っていいのかというと、遺伝情報は生まれたときから変わらないから、という前提があるからである(エピゲノムはここでは置いとく)。
因果関係を示すには、時間の項と介入のふたつの要素が必要である。X にA という介入を行ったから、B が起きた、というには、X(原因)という事象はY(結果)という事象より先に起こっていないといけない。だから、じゃあ明日10000人集めて、その人たちが喫煙/非喫煙か、肺癌/非肺癌かの2x2 分割表を作って検定しよう! というのは、時間の項がないから因果関係は(厳密には)推定できないのである。
という意味で、ある1時刻で患者と健常人を集めてgenotype することは観察研究になるのだが、遺伝情報は生まれたとき(というよりも減数分裂時)にランダムに決められて、かつ、発症するまでは変えようがない因子なので、因果関係として扱ってよいのである。