今回の話
パラメーターで表すこと
モデルを立てる
パラメータ:本当に知りたいことを変数Xにおいてみる
Xを知るために:実験しましょう。観測するのは別のこと。
X←Y(数えられるもの):何かしらの関係
振り返ってみて
塩基
X:種間の差 Y:塩基配列の違い
YがなぜXに関連づけられるか?:変異の個数
配列が同一だと、種は同じ
変異が、自然選択の結果起きたのだろう:変異の個数、変異率(数/時間)が種が分岐した瞬間だろう
2つの異なる遺伝子
種間を隔てている時間
siの実験
発現量と反応
X:ストレス応答 Y:生細胞率
ストレス応答があがると、生細胞数あがる
ストレス応答が下がると、生細胞数あがる
配列の違いと変異率、ストレス応答と生存率の関係は、少なくとも単調増加(減少)だろうと思われる。(簡単なモデル)
面倒くさい:山とか多峰性とか
t.testについて
si(-)とsi(+)で生存率を比較
どう差があると思っている?
si(+) だと、生存率80%くらいだとしよう。
80%付近に多くなってほしい:正規分布
発現量を落とすと、生存率80%になる。いろいろになると思うけど、その周辺に分布するとします(モデル化)。
対照は、生存率75%でその付近に分布。
(正規分布は中央と分散を仮定している。)
というモデル。
両者を合わせて、中央77.5%、分散‥の一山と仮定するより、
中央80%、分散‥、中央75%、分散‥の二山あると仮定したほうがいいんじゃない、というモデル。
これを判断してくれるのが、t.test
ちょっと考える:生存率が100% or 0%に近いとき
正規分布を考えるモデルが違うのではないか?
死に絶えるのがほとんどで、ほんのちょっとだけ生きる、とか
一番おきやすいことは?
一山にした生存率78%か
二つ山がある80%と75%か?
モデル
前回のSNPと優性/劣性遺伝モデル
優性と劣性との間に、相加モデルを入れる。
A/A 2
A/G 1
G/G 0
として
優性:A/A and A/G 1 G/G 0
劣性
遺伝型に点数を与える
A/A A/G G/G
優性 2 2 0
相加 2 1 0
劣性 2 0 0
何が違う?A/G列:ヘテロの点数の与え方
2は扱いにくいので1に変換
A/A A/G G/G
優性 1 1 0
相加 1 0.5 0
劣性 1 0 0
多型のアレルの強さ
ヘテロのときの強さを、2つのホモタイプのどの辺におくか。
相加平均にする:相加モデル
偏らせる:優性/劣性モデル
A/Gの力がG/Gの半分か?:実のところ、そういうことはあまりない
そうなれば、0.8とか‥‥
ヘテロの力がx(0