医学

帰無仮説検定で有意になった項目についてROC 解析をしてください

と査読で言われた。 状況設定としてはこんな感じである。いま、とある検査項目 (連続量)について、予後を予測するマーカーになるか検討したい。ここで、デザインとしてはとりあえず研究を立ち上げてみました、というような後ろ向き観察研究で、予後転帰が…

Rule of Three: 僕のまわりではそんなことはない!

面白い話を教えてもらったので読んだ。 稀な事象の生起確率に関する統計的推測 Rule of Three とその周辺 ポアソン分布とRule of Three(統計学ワード) 上記の証拠(?)をもって「○○は存在しない!」と主張する人がときたまいるが、その人のまわりをN人探して…

oscillation (振動)を検定する

この記事は 今年読んだ一番好きな論文2017 Advent Calendar 2017 の2日目が空いているということにこの記事を書いてから気づいて、1000円相当の参加賞があることに目がくらんで加筆修正した記事です。2017年で一番好きかというとそうでm(ここで文章が途絶え…

予後因子 prognostic と予測因子 predictive は何が違うのか

興味深い話を教えてもらったので読んだ。 Understanding Prognostic versus Predictive Biomarkers よく予後因子や予測因子となるバイオマーカーを探そう、という研究があるが、そもそも予後因子/予測因子とはなんぞや、という話。 現実世界においては、ある…

数少ない事象の比較

こんなニュースを見かけた。 https://headlines.yahoo.co.jp/hl?a=20171122-00000523-san-hlth 亡くなられた方のご冥福をお祈りします。 統計的に差がなかったから無痛分娩は安全だとか、無痛分娩はしても大丈夫だとか、そういうことをいうつもりはまったく…

awk を使って行の要素がすべて0 の行を除外する

RNAseqをしているが、行に5つくらいのデータがあって、それらすべてが0 の行を取り除きたいのだが、いい方法はないかと聞かれた。 列和であれば、$2 とかしてすぐに結果が出せるのはぐぐってよく出る。 しかし、行和をどうこうするのはなかなか出てこない。 …

面白そうな統計の話・論文

Crowdsourced research: Many hands make tight work 黒人サッカー選手が警告を受けやすいかを解析すると、様々な結果が出てしまうという話。 Avoidable waste in the production and reporting of research evidence 適切な疑問を設定すること、適切な研究…

科研費(学振) LaTeX を他の申請書に流用する

この記事が役に立つのは世界で3人以下の自信ある() 研究者が競争的資金を獲得するのに申請書を書くが、科研費LaTeX というものがあり、これによりword で体裁が崩れてイラッ☆っとするリスクが減る。 DC やPD と呼ばれる学振にもこのフォーマットがあり、情報…

10万枚の胸部X線画像をCNNした

読んだ。 ChestX-ray8: Hospital-scale Chest X-ray Database and Benchmarks on Weakly-Supervised Classification and Localization of Common Thorax Diseases. IEEE CVPR 2017 3万人の患者から10万枚程度の胸部X線画像を入手し、CNNによりAtelectasis, C…

分娩後出血多量のトラネキサムは出血死亡を減らす

読んだ。 Lancet. 2017 May 27;389(10084):2105-2116. 読んだ印象としては日本ではあまり意味がないかもと思った。 パキスタン、カメルーンなど発展途上国の21ヶ国193施設から、トラネキサム1g群10036人とプラセボ(生食)9985人がリクルートされて、出血多…

Mendelian randomization

読んだ。 Public Health. 2017 Apr;145:113-119. Nat Rev Rheumatol. 2016 Aug;12(8):486-96. Biosocial Surveys. Nat Rev Genet. 2013 Jul;14(7):483-95. Mendelian randomization は何かというと、経済学などの因果推論では操作変数法と呼ばれるものを統計…

高次元データを次元削減したうえでクラスターを真面目に検出する

読んだ。 ClusterSignificance: a bioconductor package facilitating statistical analysis of class cluster separations in dimensionality reduced data Bioinformatics. 2017 Oct 1;33(19):3126-3128. オミックス解析などをすると複数パラメータの高次…

順序制約のあるrstan

推定するパラメータに順序制約があるとき、rstan ではordered、正に限定するならpositive_ordered が使える。 例えばYaegashi (J Hum Genet. 1998;43(2):85-90.)らは、出生時の染色体異常が母体年齢に応じてどう推移するかをデータを取って調べている。 ここ…

OmicCircos

読んだ。 Cancer Inform. 2014 Jan 16;13:13-20. オミックス研究では、各染色体でのCNVや遺伝子発現状態、各種統計量の定量値や分布などをずらずらっと描きたいが、横に長く描くといけてないと誰かが思ったのだろうか、丸く描くやり方がある。 これをcircos …

独習 統計学24講

読んだ。独習 統計学24講: 医療データの見方・使い方作者: 鶴田陽和出版社/メーカー: 朝倉書店発売日: 2013/05/29メディア: 単行本この商品を含むブログ (3件) を見るすべての医療系学生・研究者に贈る 独習統計学応用編24講 ─分割表・回帰分析・ロジスティ…

統計的因果推論

読んだ。統計的因果推論 (統計解析スタンダード)作者: 岩崎学出版社/メーカー: 朝倉書店発売日: 2015/11/10メディア: 単行本(ソフトカバー)この商品を含むブログ (3件) を見るCOI:研究室にあった。 ランダム化比較試験ができないときの、傾向スコアマッチ…

血液1滴で複数の癌が95% 早期発見できる

血液1滴を検査するだけで、各癌腫特有のmicroRNA を検出して癌であるかどうかを95% 以上の精度で判定するらしい。 https://medical-tribune.co.jp/news/2017/0724509666/ ネットでは称賛の嵐のようである。 よくよく記事を読むと、どういう理屈で癌を判定し…

ガンマ分布:癌にかかるまでの時間

ガンマ分布は、期間 ごとに1回くらい起こるランダムな事象が 回起こるまでの時間の分布としてモデル化されることがあるらしい。 ガンマ分布自体は、shape とscale (もしくは逆数のrate) のふたつのパラメータで決定される。 悪性腫瘍(いっぱんにがん)は、遺…

糖質制限ダイエットを始めたらたった1日で体重が2kg減った話をしたらもっと詳しい体重推移データをもらった

ダイエットのデータを昔使って遊んだけど、元データを持っている人が更に長期のデータを公開してくれた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t;…

single cell RNA-seq のdropout

読んだ。 MAGIC: A diffusion-based imputation method reveals gene-gene interactions in single-cell RNA-sequencing data コードはPython で書かれている。computational flowcytometry のDana Peer ラボ。RNA-seq のデータ行列が取るであろう高次元空間…

糖質制限ダイエットを始めたらたった1日で体重が2kg減った

親戚が集まったときの会で、ふいにそんなことを言われた。その人としては減量をがんばったということを言いたかったのだろうが、自分自身、糖質制限ダイエットに対してエビデンスを持っていないことと、1日で2kg 減るっていうのは、偶然「2日間連続で体重を…

N=300 の試験みっつとN=900 の試験ひとつのどっちがよいか

こんな話を見かけた。 生物・医療統計の立場的に言えば、N=300 * 3 の試験のほうがよいとおもう。 I’ve been thinking about this thought experiment:Imagine you’re given two papers. Both papers explore the same topic and use the same methodology. …

推計人口 2053年に1億人下回る

という記事があった。 国立社会保障・人口問題研究所の日本の将来推計人口(平成29年推計)というものがあったので、表1-1 総人口,年齢3区分(0〜14歳,15〜64歳,65歳以上)別人口及び年齢構造係数:[出生中位(死亡中位)推計]というネ申エクセルデータを図示…

研究計画っぽい棒グラフ表示

とある研究計画の申請の時期だが、研究をどんな感じで進めていきます、というプレゼンというか図示で時間軸に棒が伸びてる感じの図がある。 学振申請書の書き方とコツ DC/PD獲得を目指す若者へ (KS科学一般書)作者: 大上雅史出版社/メーカー: 講談社発売日: …

ボクセルデータから形を構成する

蛍光イメージング動画があって、そこから細胞の3次元の形を再構成したい。 手順としては、 蛍光イメージの取得:他力本願 2Dでのセグメンテーション:他力本願、大津法 セグメンテーションされた領域の抽出:openCV セグメンテーションされた領域内で欠けて…

医学研究における査読者の統計レベル

読んだ。 BMJ. 2002 May 25;324(7348):1271-3. これを読んでいたら論文があったので読んでみた。 いきなり要点を書いておくと Peer reviewers often make unfounded statistical criticisms, particularly in difficult areas such as sample size and multi…

EM アルゴリズムとベイズ

EM アルゴリズムとベイズという話が出てきたので、やってみる。 題材はこちら 状況としては、ABOの血液型で、どんな血液型を持っているかは観測できるが、その血液型population を生み出したアレル頻度は一体どのようなものだろうか、これを推定したい、とい…

「原因と結果」の経済学 データから真実を見抜く思考法

読んだ。「原因と結果」の経済学―――データから真実を見抜く思考法作者: 中室牧子,津川友介出版社/メーカー: ダイヤモンド社発売日: 2017/02/17メディア: 単行本(ソフトカバー)この商品を含むブログ (15件) を見るCOI:自分で買った。筆者らとは知り合いで…

岩波データサイエンス Vol.5

読んだ。岩波データサイエンス Vol.5作者: 岩波データサイエンス刊行委員会出版社/メーカー: 岩波書店発売日: 2017/02/16メディア: 単行本(ソフトカバー)この商品を含むブログ (3件) を見るCOI:自分で買ったが著者に知り合いがいる。 岩波データサイエン…

薬の副作用の有無をAIが100% 的中

読んだ。 Machine learning-based prediction of adverse drug effects: an example of seizure-inducing compounds プレスリリース COI:なし 薬学も電気生理学も情報科学も何ひとつ専門ではないけど、100%予測に釣られたので書く。 seizure (けいれん)を引…