2016-01-01から1年間の記事一覧

声優統計の統計C91版

声優統計第九号は、新刊の第九号と既刊の5-8 がまとまった論文集2 ともに完売しました。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createEl…

ベイジアンネットワーク

読んだ。 Bioinformatics. 2016 Dec 21. pii: btw807. ベイジアンネットワークをやるbnstruct というパッケージを作りましたという話。 ベイジアンネットワークをやるならbnlearn が有名だが、bnstruct は欠損値があってもできるとのこと。 Bayesian Network…

声優統計第九号 声優力

この記事は R Advent Calendar 2016 Stan Advent Calendar 2016 ごちうさ Advent Calendar 2016 まんがタイムきらら Advent Calendar 2016 の25日目の担当記事です。 C91 で声優統計ネタとして声優力を推定します。声優力とはなんぞや、という話ですが、ある…

今年読んだ一番好きな論文2016

この記事は今年読んだ一番好きな論文2016 の25日目の記事です。 今年読んだ論文ではこれがよかったです。 Computational flow cytometry: helping to make sense of high-dimensional immunology data. Nature Reviews Immunology 16, 449–462 (2016) レビュ…

2016年のアニソン10選

関係各所で流行っているようなのであげといた。 2016年のアニソン10選 - 記 2016年の10曲 - 声優統計 基本的に見てて楽しかったアニメの影響が強く、個人の好みとして電波系が多い。iPhone のなかで再生数が多くなる。 順番は発売日順。 夢の蕾Yume no Tsubo…

Computational single cell analysis

いくつか読んだ。 FCM やsingle cell trinscriptome などの一細胞解析で、多次元行列データが得られるが、それを機械的に解析する手法をいくつかまとめて読んだ。 R で実装されているものは頑張ってみたかったが、bioconductor でインストールしてもlibrary(…

今日は来る人が少なくて静かな日だね(ニコッ というフラグ発言

読んだ。 PLoS One. 2016 Dec 9;11(12):e0167480. doi: 10.1371/journal.pone.0167480. J(^o^)PAN I/II という顔文字の入った臨床研究なんて初めて見た!! とかそういう話はどうでもいいです。 救急外来では、午前中に受診者がいないと、ふいに誰かが「今日は…

Rstudio を使わない人にとってのRstudio

この記事はRStudio Advent Calendar 2016 の9日目の記事です。 Rstudio、使ってますか? 私は使っていません。 インストールはしてあります。Rstudio を使う利点は、OS が異なっても統一された解析環境を用意できることです。R 初心者にR を使ってもらう時に…

球面調和関数の回転

球面調和関数をRでやったりPythonでやったりしていたのだが、球面調和関数展開して係数をもっているときに、物体が回転してしまうとルジャンドル関数が回転してしまうので、係数も回転に応じて適当に変換しないといけない。 これはたいてい、回転後のパラメ…

フィッシャーの正確確率検定とカイ自乗検定と尤度比検定

遺伝統計学の基礎―Rによる遺伝因子解析・遺伝子機能解析―作者: 山田亮出版社/メーカー: オーム社発売日: 2010/09/04メディア: 単行本(ソフトカバー)購入: 7人 クリック: 155回この商品を含むブログ (38件) を見る3つの検定法の比較というところで、2*2 の…

Rmd でreveal.js のhtml スライドプレゼンテーション

Japan.R 2016 が終わりました。参加された方々はお疲れ様でした。 発表者不在というなんとも謎なLT をしたやつがいたらしいですが、Rmd でRpresentation を作って自動プレゼンするやり方について。 自動プレゼン自体はppt にも実装されています。リハーサル…

antimicrobial cycling

読んだ。 Proc Natl Acad Sci U S A. 2004 Sep 7;101(36):13285-90. antimicrobial cycling という概念がある。細菌感染症に対して抗生物質を使うのだが、うまく治療していても耐性菌は生じることもあるし、適当に使ってしまえばさらに耐性菌のリスクがあが…

29cm vs 28.3cm

こんなページを見つけた。 理系大学院生の普段使いリュックの中身を見せます! | 人生を楽しむエネルギーブログ 現役の博士課程大学院生の生活を支えるカバンの中身を細かく紹介! | AbstractLife 入院生活者のかばんの中身らしい。 私のかばんには、いつで…

Biclustering

読んだ。 Bioinformatics. 2016 Oct 6. Nucleic Acids Res. 2009 Aug;37(15):e101. Biclustering をするQUBIC という手法をR で実装しました。クッソ速いです、とのこと。 そもそもbiclustering とはなにかというと、ヒートマップクラスタリングをするときに…

iCluster: オミックスデータの統合

読んだ。 Bioinformatics(2009)25(22):2906-2912. コピーナンバー(CNV)、発現データ(mRNA)、メチル化などのオミックスデータで、症例数 に対してパラメータ数 のデータ行列が複数ある。 各々の実験を勝手にやるのは、それはそれでいいが、CNV、発現、メチル…

inheritance vector

読んだ。Am J Hum Genet. 1996 Jun; 58(6): 1323–1337. inheritance vector というものがよくわからなかったのでLander-Green algorithm とともにいくつか検索。inheritance vector と何も考えずに検索するとプログラミングのinheritance が引っかかる。 Par…

minimal Hypergeometric (mHG)

読んだ。 Cell. 2016 Sep 8;166(6):1500-1511.e9 TIL (Tumor infiltrating lymphocyte) の発現解析をして、Activate/Dysfunction の順位付けをしている。 その中でminimal hypergeometric というものがあった。 Gene Ontology 解析ではannotation が有意に出…

ガウス混合分布と曲率等高線を用いたセグメンテーション

読んだ。 Accurate Automatic Detection of Densely Distributed Cell Nuclei in 3D Space. PLoS Comput Biol. 2016 Jun 6;12(6):e1004970. プレスリリース 線虫の細胞の3D(4Dもいけるけど)画像のなかで、細胞がくっついているように見えるのもがうまくセグ…

Archetypal analysis and principal convex hull

他のグループがやっている解析で、データ分布が四面体のように見える、という話があって、単体を多次元にフィッティングさせるような話を持ってきていた。 Archetypal analysis for machine learning and data mining ちょっとググっていたらシステム生物学…

文字列を時間に変換する

ある基準時刻からの経過時間が、時:分で納められているデータがある。 これを分単位に変換して、差分を取りたいらしい。 format が決まれば、strptime で文字列を時間に整形できる。 x <- c("0:19", "1:05", "10:20") y <- strptime(x, "%H:%M") difftime(y[…

受動喫煙による日本人の肺がんリスク約1.3倍

読んだ。 Jpn J Clin Oncol. 2016 Aug 10. 受動喫煙によって肺がんになるリスクが1.3倍ということがメタアナリシスによって示され、「ほぼ確実」から「確実」とグレードアップされましたよ、という元論文。 COI:筆者ら、国立がん研究センターとは一切関係な…

R とエクセルで解析結果が違うんですがどうしたらいいですか?

という質問を同級生から受けた。 氏いわく、リスクの有無と疾患の有無で分割表をフィッシャー検定したら、R ではp=1 でエクセルではp=0.7 だった。たぶんp=0.7 っぽいからエクセルの解析を信じたいのだけど、なぜR でp=1 になったのか、とのこと。 そしてそ…

StanとRでベイズ統計モデリング

読んだ。StanとRでベイズ統計モデリング (Wonderful R)作者: 松浦健太郎,石田基広出版社/メーカー: 共立出版発売日: 2016/10/25メディア: 単行本この商品を含むブログ (10件) を見るCOI:謹 呈。激甘書評。 rstan の神が丹精込めて書きあげた、至高の一冊。 …

岩波データサイエンス Vol.3 因果推論

読んだ(読んでた)。岩波データサイエンス Vol.3作者: 岩波データサイエンス刊行委員会出版社/メーカー: 岩波書店発売日: 2016/06/10メディア: 単行本(ソフトカバー)この商品を含むブログ (4件) を見るCOI:自費で買った。読んだけど記事書いてなかった。 …

岩波データサイエンス Vol.4 地理空間情報処理

読んだ。岩波データサイエンス Vol.4作者: 岩波データサイエンス刊行委員会出版社/メーカー: 岩波書店発売日: 2016/10/15メディア: 単行本(ソフトカバー)この商品を含むブログ (3件) を見るCOI:編集者の一部は知り合いだけど自費で買った。 疫学研究者な…

Biostatistics with R: An Introduction to Statistics Through Biological Data

読んだ。Biostatistics with R: An Introduction to Statistics Through Biological Data (Use R!) (English Edition)作者: Babak Shahbaba出版社/メーカー: Springer発売日: 2011/12/15メディア: Kindle版この商品を含むブログ (1件) を見る統計は素人()だ…

Introducing Monte Carlo Methods with R

読んだ。Introducing Monte Carlo Methods with R (Use R!)作者: Christian Robert,George Casella出版社/メーカー: Springer発売日: 2009/12/10メディア: ペーパーバック クリック: 1回この商品を含むブログを見るギブスサンプリングとかそういうのは名前は…

Nonlinear Regression with R

読んだ。Nonlinear Regression with R (Use R!)作者: Christian Ritz,Jens Carl Streibig出版社/メーカー: Springer発売日: 2009/02/03メディア: ペーパーバックこの商品を含むブログを見るモデル自体は指数関数モデルや濃度曲線など簡単なものが多く、ペー…

100年分のアニメを使ったしりとり

100年分のアニメ作品リストをExcelデータで公開した - 本しゃぶり というデータベースがあったので鮮度を大事にしりとりネタをパクる。 データをダウンロードしたらエクセルなので読みの部分だけ取り出してとりあえずUTF8 で保存しておく。また、メディアの…

俺の果南とルビィの仲がこんなに悪いわけがない

サンシャインメンバーのセリフ回数を調べたので、そのまま名前の呼び合いグラフを作った話。 名前を呼んでいる、愛称は可。善子が自分のことを「善子ちゃうわヨハネや」というのも両方カウントしている。 ダイヤのことを生徒会長、鞠莉のことを理事長はよそ…