20110713 graduateschoolgenome
解析の対象を抜き出す
前回から
DNAの配列
データQC
今回のデータ
RNAiでタンパク発現抑制sh#1
対照shControl
それぞれにH2O2を添加、生存に差があるか?
細胞の(いろんな)ストレス応答と関係があるか、ないか
ストレス応答:周辺環境からの刺激に対する対応の仕方
ストレスのかけ方→ストレス応答
たくさんあるストレス→たくさんあるストレス応答
のうち、
DNAに損傷を与えるようなストレスに関係しているのかな?
として、たくさんあるストレスのほうを狭めた。
ストレス応答とは、代謝とか発現量とか
ストレスA:タンパク質
ストレスnotA:
ネガコン
の3種類
あるタンパク質:酵母ではストレスに応答すると知られている。ほ乳類では?
ストレス応答を引き起こしているか?関与しているか?→
機能抑制(介入)して定量する
機能正常のまま定量する
定量するのは‥‥‥特異抗体を用いてタンパク質の個数に比例(?)した量→画像上の色の濃さを数値化してくれるコンピュータ
つまりは、代理の値
生存率
顕微鏡で直接観察
生細胞と死細胞を染め分ける試薬
生/(生+死)で生存率を算出
ストレス
on
off
介入
on
off
生存率計算
スタート→母集団2分→sh →タンパク定量x2→サンプリングx20→5.ストレスあり→サンプリングx1カウント(3.推定値)→比率
→ストレスなし →サンプリングx1カウント(4.推定値)→比率
→not sh→タンパク定量x2→サンプリングx20→5.ストレスあり→サンプリングx1カウント(3.推定値)→比率
→ストレスなし →サンプリングx1カウント(4.推定値)→比率
推定値と推定値の比率を取っているので、推定値の二乗みたいなことになっている
なぜタンパク量を測ったか:タンパク量の推定
なぜx2:推定値が実験技能に左右されていないか確かめる
複数の値の何を信じるか:平均を取ってみる
何回やったら確かと言えるか:
推定量をいくつにするか:正常と差があればまあいいかな
写真の濃さをどうする:1.補正
2.推定値をとうする
3.生細胞推定値
4.死細胞推定値
5.ふりかけ誤差
結局、見たかったのは何か:処理の有無→比率
生:10 と死:5
生:10000と死:5000
ならどうする?
データQCをどうするか、という話題
ex)microarray:数万のデータの中のゴミを捨てる
3000人中50万マーカーで、300マーカーが成功率<0.9で他>0.999:捨てる?
何を基準にQCするか
10サンプルで、sh+ H2O2+
生(推定値) 死(推定値) 率 総和(推定値)
1
2
10
同じ条件で、総和が そ れ な り にそろっている
それなり、とは?
82,76,58,74 だとしたら:捨てない
82,76,48,74 だとしたら:捨てない
82,76,28,74 だとしたら:うーん‥おかしいから捨てるか
82,76, 8,74 だとしたら:捨てる
82,76,28,74,121 だとしたら:捨てない
82,76,28,74,141 だとしたら:捨てない
82,76,28,74,191 だとしたら:191捨てる
82,76,28,74,191,136 だとしたら:28捨てる
382,376,328,474,421 だとしたら:どれも捨てない
そろってそうなやつの平均から、すごい離れていたら捨てる
平均と、平均からの離れ方
1000回サンプリングしたとしよう。
外れ値よりも、全体がばらついていることが問題か?
結局、見たかったもの:生存率とタンパク発現量 を検定する
やった、やってない は2値
定量は連続値
縦:生存 横:発現定量値 とすると、関係が強そうなら回帰できそう
0or1から、離散的な順序のあるカテゴリー、量的尺度へ
↓ ↓
t.test それなりの手法
観測値は推定値、つまり誤差含む
知りたいもの同士をくらべる
くらべるものが決まったら、検定は 必 ず 決まる
NEJM:なんやかんや変な検定を使っていて、間違い多い
Nature:シンプルで簡潔な検定。解釈も至極当然なもの
次回:多重検定など