交絡

飲酒している人としていない人を追跡し、心筋梗塞発症との関連を調査した。
 
\begin{matrix}&\textrm{MI(+)}&\textrm{MI(-)}&\textrm{total}\\\textrm{drink(+)}&71(6.7%)&988&1059\\\textrm{drink(-)}&29(3.1%)&912&941\\\textrm{total}&100&1900&2000\end{matrix}
 
飲酒したグループでは6.7%が、していないグループでは3.1%が心筋梗塞になった。
なので、飲酒すると心筋梗塞が2倍発生しやすい。
 
???
 
飲酒していたかしていないかに加え、喫煙していたかで層分けした結果、次のようになった。
 
\begin{matrix}&\textrm{smoking(+)}&&&&\textrm{smoking(-)}&&&\\&\textrm{MI(+)}&\textrm{MI(-)}&\textrm{total}&&\textrm{MI(+)}&\textrm{MI(-)}&\textrm{total}\\\textrm{drink(+)}&63(8.4%)&684&747&&8(2.6%)&304&312\\\textrm{drink(-)}&7(8.4%)&76&83&&22(2.6%)&836&858\\\textrm{total}&70&760&830&&30&1140&1170\end{matrix}
 
喫煙者は、飲酒ありでもなしでも、心筋梗塞発生は8.6%。
非喫煙者は、飲酒ありでもなしでも、心筋梗塞発生は2.6%。
と、飲酒が心筋梗塞発生に関係がない結果となった。
 
このとき重要になるのが、交絡である。
上の結果の解釈として考えられるのは
1:喫煙を無視して、飲酒は心筋梗塞のリスクを2倍高めると結論。
2:喫煙で層分けして、飲酒と心筋梗塞は無関係と結論。
3:全体で見ると飲酒は心筋梗塞のリスクを高めるが、喫煙で見ると無関係と結論。
4:さあ?
 
ここで比較したいのは、飲酒している人が飲酒によってが心筋梗塞になりやすいのか、ということで、2群を比較することで検討しようとしているから、追跡開始時点で他の条件は2群で揃っていてほしい。
飲酒ありの人たちの理想の比較は、「飲酒ありの人たちが飲酒しなかった場合」である。
つまり
 
飲酒あり→(追跡開始)→飲酒あり→結果
飲酒あり→(追跡開始)→飲酒なし→結果
 
これを比較したい。
しかし、飲酒あり、と数えられてしまった味点で、もうこの集団は生成できない。
現実に存在する比較は、「飲酒なし」というグループだが、これは
 
飲酒なし→(追跡開始)→飲酒あり→結果
飲酒なし→(追跡開始)→飲酒なし→結果
 
というグループがある。
たぶん、上は(超誠実な人が事業に失敗して破産とかしない限り)まあいないだろう、とかおもうと、実際は
 
飲酒なし→(追跡開始)→飲酒なし→結果
 
しか残っていない。
ちょっと整理する。
 
Ⅰ飲酒あり→(追跡開始)→飲酒あり→結果
Ⅱ飲酒あり→(追跡開始)→飲酒なし→結果
Ⅲ飲酒なし→(追跡開始)→飲酒なし→結果
 
本当に比較したいのはⅠとⅡ。
しかしⅡはない。
なのでⅠとⅢの比較で我慢する。
 
ということである。Ⅱ=Ⅲなら、まあ妥当な考え方だろう。
Ⅱ=Ⅲなら、因果的解釈ができて、
「飲酒ありの人は、飲酒したことによって、飲酒した場合に比べ、心筋梗塞発生のリスクが2.2倍<増加する。」
と言える。
因果関係にない(Ⅱ\neqⅢ)なら
「飲酒ありの人は、飲酒なしの人にくらべ、心筋梗塞の発生割合が2.2倍多い。」
ということらしい。
ⅡとⅢでは飲酒なしなのに、心筋梗塞発生割合が異なるから、追跡開始以前で何か影響がすでにあったのだろう。
ということで、ⅡもⅢも飲酒なしなのに心筋梗塞発生割合が異なる状況を交絡というらしい。
 
交絡の条件として
結果に因果的に影響している(そりゃ喫煙は心筋梗塞に影響大だろう)。
比較する集団で分布が異なっている(飲酒する人は喫煙も多いだろう)。
原因と結果の因果連鎖の中間にあってはならない。
らしい。
 
答えとしては上の調査は、2の判断が正しいらしい。
 
交絡はデータにつきものらしいが、影響が大きいか小さいかの問題で、医学的、疫学的知識があればある程度想像がつくらしい。