第三回

20110713 graduateschoolgenome
解析の対象を抜き出す
前回から
DNAの配列
 
データQC
 
今回のデータ
RNAiでタンパク発現抑制sh#1
対照shControl
それぞれにH2O2を添加、生存に差があるか?
 
細胞の(いろんな)ストレス応答と関係があるか、ないか
ストレス応答:周辺環境からの刺激に対する対応の仕方
ストレスのかけ方→ストレス応答
たくさんあるストレス→たくさんあるストレス応答
のうち、
DNAに損傷を与えるようなストレスに関係しているのかな?
として、たくさんあるストレスのほうを狭めた。
ストレス応答とは、代謝とか発現量とか
 
ストレスA:タンパク質
ストレスnotA:
ネガコン
の3種類
 
あるタンパク質:酵母ではストレスに応答すると知られている。ほ乳類では?
ストレス応答を引き起こしているか?関与しているか?→
機能抑制(介入)して定量する
機能正常のまま定量する
定量するのは‥‥‥特異抗体を用いてタンパク質の個数に比例(?)した量→画像上の色の濃さを数値化してくれるコンピュータ
つまりは、代理の値
 
生存率
顕微鏡で直接観察
生細胞と死細胞を染め分ける試薬
生/(生+死)で生存率を算出
 
ストレス
on
off
介入
on
off
生存率計算
 
スタート→母集団2分→sh →タンパク定量x2→サンプリングx20→5.ストレスあり→サンプリングx1カウント(3.推定値)→比率
                               →ストレスなし →サンプリングx1カウント(4.推定値)→比率
          →not sh→タンパク定量x2→サンプリングx20→5.ストレスあり→サンプリングx1カウント(3.推定値)→比率
                               →ストレスなし →サンプリングx1カウント(4.推定値)→比率
 
推定値と推定値の比率を取っているので、推定値の二乗みたいなことになっている
 
なぜタンパク量を測ったか:タンパク量の推定
なぜx2:推定値が実験技能に左右されていないか確かめる
複数の値の何を信じるか:平均を取ってみる
何回やったら確かと言えるか:
定量をいくつにするか:正常と差があればまあいいかな
 
写真の濃さをどうする:1.補正
2.推定値をとうする
3.生細胞推定値
4.死細胞推定値
5.ふりかけ誤差
 
結局、見たかったのは何か:処理の有無→比率
 
生:10 と死:5
生:10000と死:5000
ならどうする?
 
データQCをどうするか、という話題
ex)microarray:数万のデータの中のゴミを捨てる
3000人中50万マーカーで、300マーカーが成功率<0.9で他>0.999:捨てる?
 
何を基準にQCするか
10サンプルで、sh+ H2O2+
生(推定値)   死(推定値)   率   総和(推定値)
1
2
 
10
 
同じ条件で、総和が そ れ な り にそろっている
それなり、とは?
82,76,58,74 だとしたら:捨てない
82,76,48,74 だとしたら:捨てない
82,76,28,74 だとしたら:うーん‥おかしいから捨てるか
82,76, 8,74 だとしたら:捨てる
82,76,28,74,121 だとしたら:捨てない
82,76,28,74,141 だとしたら:捨てない
82,76,28,74,191 だとしたら:191捨てる
82,76,28,74,191,136 だとしたら:28捨てる
382,376,328,474,421 だとしたら:どれも捨てない
そろってそうなやつの平均から、すごい離れていたら捨てる
 
平均と、平均からの離れ方
1000回サンプリングしたとしよう。
外れ値よりも、全体がばらついていることが問題か?
 
結局、見たかったもの:生存率とタンパク発現量 を検定する
やった、やってない は2値
定量は連続値
縦:生存 横:発現定量値 とすると、関係が強そうなら回帰できそう
 
0or1から、離散的な順序のあるカテゴリー、量的尺度へ
 ↓      ↓
t.test   それなりの手法
 
観測値は推定値、つまり誤差含む
知りたいもの同士をくらべる
くらべるものが決まったら、検定は 必 ず 決まる
NEJM:なんやかんや変な検定を使っていて、間違い多い
Nature:シンプルで簡潔な検定。解釈も至極当然なもの
 
次回:多重検定など