医学

岩波データサイエンス Vol.5

読んだ。岩波データサイエンス Vol.5作者: 岩波データサイエンス刊行委員会出版社/メーカー: 岩波書店発売日: 2017/02/16メディア: 単行本(ソフトカバー)この商品を含むブログ (3件) を見るCOI:自分で買ったが著者に知り合いがいる。 岩波データサイエン…

薬の副作用の有無をAIが100% 的中

読んだ。 Machine learning-based prediction of adverse drug effects: an example of seizure-inducing compounds プレスリリース COI:なし 薬学も電気生理学も情報科学も何ひとつ専門ではないけど、100%予測に釣られたので書く。 seizure (けいれん)を引…

性なる夜に

こんなツイートがあった。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter.c…

p値はawful

ここで紹介されているこの例をやってみた。 状況としてはこんな図と実験がある。 ある腫瘍細胞に薬#1 と#2 を単独もしくは両者ともにふりかける実験をする。#1 のみもしくは#2 のみふりかけた実験では対照と有意差はなく、#1#2 と同時にふりかけた場合は有意…

ベイジアンネットワーク

読んだ。 Bioinformatics. 2016 Dec 21. pii: btw807. ベイジアンネットワークをやるbnstruct というパッケージを作りましたという話。 ベイジアンネットワークをやるならbnlearn が有名だが、bnstruct は欠損値があってもできるとのこと。 Bayesian Network…

今年読んだ一番好きな論文2016

この記事は今年読んだ一番好きな論文2016 の25日目の記事です。 今年読んだ論文ではこれがよかったです。 Computational flow cytometry: helping to make sense of high-dimensional immunology data. Nature Reviews Immunology 16, 449–462 (2016) レビュ…

今日は来る人が少なくて静かな日だね(ニコッ というフラグ発言

読んだ。 PLoS One. 2016 Dec 9;11(12):e0167480. doi: 10.1371/journal.pone.0167480. J(^o^)PAN I/II という顔文字の入った臨床研究なんて初めて見た!! とかそういう話はどうでもいいです。 救急外来では、午前中に受診者がいないと、ふいに誰かが「今日は…

フィッシャーの正確確率検定とカイ自乗検定と尤度比検定

遺伝統計学の基礎―Rによる遺伝因子解析・遺伝子機能解析―作者: 山田亮出版社/メーカー: オーム社発売日: 2010/09/04メディア: 単行本(ソフトカバー)購入: 7人 クリック: 155回この商品を含むブログ (38件) を見る3つの検定法の比較というところで、2*2 の…

antimicrobial cycling

読んだ。 Proc Natl Acad Sci U S A. 2004 Sep 7;101(36):13285-90. antimicrobial cycling という概念がある。細菌感染症に対して抗生物質を使うのだが、うまく治療していても耐性菌は生じることもあるし、適当に使ってしまえばさらに耐性菌のリスクがあが…

Biclustering

読んだ。 Bioinformatics. 2016 Oct 6. Nucleic Acids Res. 2009 Aug;37(15):e101. Biclustering をするQUBIC という手法をR で実装しました。クッソ速いです、とのこと。 そもそもbiclustering とはなにかというと、ヒートマップクラスタリングをするときに…

iCluster: オミックスデータの統合

読んだ。 Bioinformatics(2009)25(22):2906-2912. コピーナンバー(CNV)、発現データ(mRNA)、メチル化などのオミックスデータで、症例数 に対してパラメータ数 のデータ行列が複数ある。 各々の実験を勝手にやるのは、それはそれでいいが、CNV、発現、メチル…

inheritance vector

読んだ。Am J Hum Genet. 1996 Jun; 58(6): 1323–1337. inheritance vector というものがよくわからなかったのでLander-Green algorithm とともにいくつか検索。inheritance vector と何も考えずに検索するとプログラミングのinheritance が引っかかる。 Par…

minimal Hypergeometric (mHG)

読んだ。 Cell. 2016 Sep 8;166(6):1500-1511.e9 TIL (Tumor infiltrating lymphocyte) の発現解析をして、Activate/Dysfunction の順位付けをしている。 その中でminimal hypergeometric というものがあった。 Gene Ontology 解析ではannotation が有意に出…

ガウス混合分布と曲率等高線を用いたセグメンテーション

読んだ。 Accurate Automatic Detection of Densely Distributed Cell Nuclei in 3D Space. PLoS Comput Biol. 2016 Jun 6;12(6):e1004970. プレスリリース 線虫の細胞の3D(4Dもいけるけど)画像のなかで、細胞がくっついているように見えるのもがうまくセグ…

受動喫煙による日本人の肺がんリスク約1.3倍

読んだ。 Jpn J Clin Oncol. 2016 Aug 10. 受動喫煙によって肺がんになるリスクが1.3倍ということがメタアナリシスによって示され、「ほぼ確実」から「確実」とグレードアップされましたよ、という元論文。 COI:筆者ら、国立がん研究センターとは一切関係な…

R とエクセルで解析結果が違うんですがどうしたらいいですか?

という質問を同級生から受けた。 氏いわく、リスクの有無と疾患の有無で分割表をフィッシャー検定したら、R ではp=1 でエクセルではp=0.7 だった。たぶんp=0.7 っぽいからエクセルの解析を信じたいのだけど、なぜR でp=1 になったのか、とのこと。 そしてそ…

岩波データサイエンス Vol.4 地理空間情報処理

読んだ。岩波データサイエンス Vol.4作者: 岩波データサイエンス刊行委員会出版社/メーカー: 岩波書店発売日: 2016/10/15メディア: 単行本(ソフトカバー)この商品を含むブログ (3件) を見るCOI:編集者の一部は知り合いだけど自費で買った。 疫学研究者な…

Nonlinear Regression with R

読んだ。Nonlinear Regression with R (Use R!)作者: Christian Ritz,Jens Carl Streibig出版社/メーカー: Springer発売日: 2009/02/03メディア: ペーパーバックこの商品を含むブログを見るモデル自体は指数関数モデルや濃度曲線など簡単なものが多く、ペー…

重回帰のときに必要なデータの数はパラメータの数の10倍です

読んだ。 J Clin Epidemiol. 1995 Dec;48(12):1503-10. パラメータ数が のデータを標本数 個観測して重回帰なりなんらかの回帰分析を行うのだが、「標本数はいくつあったらいいんですか?」と聞かれることが多々ある。そういうとき、パラメータの10倍(10)あっ…

Precision and Recall

機械学習の分野で分類性能の評価に適合率と再現率というものがある。 医学分野での分類には、たいてい病気/非病気のラベルの分類にはReceiver Operating Characteristic (ROC) 曲線と曲線下面積AUC を使うが、情報系ではPrecision-Recall curve (PRC) とF1 …

離散型物体データの球面調和関数展開

球面調和関数を使って.obj データを級数展開してくれるやつを後輩が書いてくれたのでやってみる。 例えばこれ(J Med Syst. 2014 May;38(5):20.)では、病気の肝臓と健康な肝臓をCT画像から構成して、球面調和関数による比較分類を行っている。 肝硬変が進んだ…

医学・生命科学研究に使える遺伝統計関連のデータベース

遺伝統計夏の学校というものに来ている。 データベースが増えすぎていてすべてはもちろんわからないので、知った時に知識を増やしておこう。 スライドより一覧。 ゲノム・遺伝子情報のWebツール UCSC Genome Browser https://genome.ucsc.edu/cgi-bin/hgGate…

Spike-and-slab

読んだ Nat Genet. 2016 Aug 1. 様々なデータを取ってきて、遺伝子との相関があるかを解析するわけだが、サンプルの人数、組織、遺伝子の3次元をサンプル×要素(component やfactor と呼ぶ)と要素×遺伝子の行列に分解することで、テンソル分解してデータの構…

アレのサイズの自己申告に基づくデータに見られるheaping をrstanで解析する。

rstan神がやっている人口ピラミッドのAge Heapingを階層ベイズで補正するという解析について、自己申告に基づくデータにheapingが見られるという別の話があったので、3番煎じだがrstanを使わねば!! 上記のブログにある分布は、ギザギザしすぎているし、デー…

Ricci flow

読んでる。Comput Vis Image Underst. 2013 Sep 1;117(9):1107-1118. Ricci flow という、Willmore flow とはまた違う条件で微分幾何学的物体変換を行う。 その前に下準備。 以前やった(離散)ガウス曲率は、1-ring下の三角形の角度と、と呼ばれる傘の面積で…

時系列データにt 検定を行うことに関してstan 神の解析がやばい

時系列データにt 検定を行うことに関して、すごいもにょっていたのだが、そもそもstan 神が既にモデル化してくれていた。 リンクでは2階差分と、変化点検出のコーシー分布の合わせ技を用いている。 そのままパクってやってみる。 diの95%ベイズ信頼区間が0を…

HWE とLD

アレルA とアレルa がある。 アレルA の存在確率がのとき、アレルa の存在確率はである。 1世代交配して得られる遺伝子型はである。 これは、アレルA とアレルA を持つ者同士は強制的に子孫残してね、というような神の見えざる手が働かない、つまり、完全に…

成長速度の変化点

読んだ Behav Ecol Sociobiol. 2007 Dec;62(2):245-253 dimorphic allometry という二形性の成長を見ていて、その変化点らしきところを推定する。 論文ではT. dichotomus septentrionalis と呼ばれる、いわゆるカブトムシの体の大きさ(body) と角(horn) につ…

時系列データにt 検定を行う

読んだ Nature (2016) doi:10.1038/nature18294 PD1/PDL1 系の薬剤は高いので、それが良く効く患者集団を選びたいというのが最近のトレンドォ!!! 3' 側のUTR がないことで、PD-L1 の発現があがり、それによって免疫機構から逃れるPD1/PD-L1 axis がクッソすご…

球状の物体をメルカトル図法で2次元にする

物体をいじって球にしている。いま、球になった物体があるとして、これを2次元平面に展開して眺めたい。 地球儀が世界地図になるメルカトル図法みたいな感じ。 もとのうさぎは、各頂点の(離散)ガウス曲率にしたがって色付けしてある。正なら赤、0近くは灰色…