rstan

rstanで打ち切りデータがあるときのパラメータ推定をする

これに、打ち切りデータがあるときの平均値の推定問題がある。StanとRでベイズ統計モデリング (Wonderful R)作者:健太郎, 松浦発売日: 2016/10/25メディア: 単行本データが正規分布に従うのだろうが、25を下回るデータはとなっているので、このデータを無視…

新型肺炎COVID-19 の感染陽性患者数の過小報告分をrstanで推定する

読んだ。 Ascertainment rate of novel coronavirus disease (COVID-19) in Japan | medRxiv ascertainment rate という、感染者数(PCR陽性ベース)がどれくらいか、つまり、1だと実際の報告数が潜在的な患者数と同一で、>1だと過剰に報告されている、軽症…

新型肺炎COVID-19 の潜伏期間をrstanで推定する

読んだ。 Incubation period of 2019 novel coronavirus (2019-nCoV) infections among travellers from Wuhan, China, 20-28 January 2020. - PubMed - NCBI最初に武漢で肺炎が発生したときに、88症例について感染履歴を聴取して、ワイブル分布で潜伏期間を…

rstanで自分で定義した確率分布からサンプリングする:Johnson's SU 分布

本当はこの通りにしたかったが、自作関数のサンプリングが遅すぎたので先に正規分布normalからのサンプリングがvectorかひとつひとつかtargetかで変わるのかを検証していた。 結論から言うと組み込みのvector型サンプリングは速いが、自作関数はひとつひとつ…

rstanでの確率分布からのサンプリングの速さを比較する

rstanで自作関数、というかrstanに実装されていない確率分布からサンプリングをしたくてコードを書いていたが、その前にコードの書き方でサンプリングの効率というか速さが違うので速くなる書き方をしよう、という検証。 結論から言うと、実装されている関数…

ふたつの分布が違うのをどう示したらいいですか

こんな記事を書いたらごく狭い範囲で反響があった。 mikuhatsune.hatenadiary.com ガンマ分布の記事感動しました。そんなガンマ分布マスターであられる驚異のアニヲタさんに質問するもの失礼なほど低級な質問なんですが、、、 ある疾患があって、その疾患発…

混合分布:急性期と亜急性期の発症がある

こんな感じのデータを見かけた。 本人が言うには、8日あたりを境目にして、8日までに発症するパターンと、それ以降に発症するパターンに分かれそうだ、という。 データの意味合いと二峰性の具合から、おそらくふたつのガンマ分布が重なっているのでは、とい…

「男女間モテ格差」をzero-inflated model で考える

こんな話を見つけた。そもそも、女性の考える「非モテ男性」と実際の「非モテ男性」の認識にすれ違いがありそう。女性は何もしなくても75%は一度は告白される。一方男性は、半数以上が一度も告白されない。女性のリアルからみると「非モテ」とは「下位25%…

医薬データ解析のためのベイズ統計学

読んだ。医薬データ解析のためのベイズ統計学作者: Emmanuel Lesaffre,Andrew B. Lawson,宮岡悦良,遠藤輝,安藤英一,鎗田政男,中山高志出版社/メーカー: 共立出版発売日: 2016/02/25メディア: 単行本この商品を含むブログ (3件) を見るめっちゃ時間がかかって…

レプリカ交換法

読んだ。 Bayesian estimation of phase response curves. Neural Netw. 2010 Aug;23(6):752-63. Phase response curve (PRC) という神経細胞の発火の記録を推定したいが、周期のズレや発火タイミングの変化などで普通にやったら推定が収束しないらしい。 レ…

ギブスサンプリング

Metropolis-Hastings サンプリングをやったので、ギブスサンプリングをやってみる。 ある変数 について、 番目を取り除いた を ( 番目が抜けている) で順次サンプリングして、その値を入れなおしてまたサンプリングする、を について行う。 結局、あるひと…

時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装

読んだ。時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装作者: 馬場真哉出版社/メーカー: プレアデス出版発売日: 2018/02/14メディア: 単行本この商品を含むブログ (3件) を見るCOI:自費で買った。 時系列分析とRstan を使った状態空間モデルの…

FKが一番上手いのは誰? 「過去5年間の成功率」で見る“ベスト・フリーキッカー”TOP20

という記事を見かけた。 FKが一番上手いのは誰? 「過去5年間の成功率」で見る“ベスト・フリーキッカー”TOP20 現在、最もフリーキックが上手い選手は誰なのか……。イギリス誌『FourFourTwo』が、「2013−14シーズンからの5年間で最もフリーキックの成功率が高か…

(サッカー解説)2点差は危険なスコアですね ← ???

高校サッカーを見ていた。2017年度は前橋育英が初優勝で幕を閉じた。 どの試合だったか忘れてしまったが、2点差がついたときに解説が「2点差は危険」ということを言っていた。 調べてみると、やはりよく言われていることのようだが、実際にデータをとってみ…

きららフェスタ2017 に出演していた声優たちの集客力をRstan で推定する

この記事は RStudio Advent Calendar 2017 - Qiita まんがタイムきらら Advent Calendar 2017 ごちうさ Advent Calendar 2017 Stan Advent Calendar 2017 - Qiita R Advent Calendar 2017 - Qiita の3日目の配当記事です。 声優統計第9号で、きららフェスタ2…

順序制約のあるrstan

推定するパラメータに順序制約があるとき、rstan ではordered、正に限定するならpositive_ordered が使える。 例えばYaegashi (J Hum Genet. 1998;43(2):85-90.)らは、出生時の染色体異常が母体年齢に応じてどう推移するかをデータを取って調べている。 ここ…

援助交際してそうなアニメキャラランキング2017をstanで考える

注意:本解析の結果と、実際に声優がそうであるかはまったく関係がありません。 援助交際してそうなアニメキャラランキング2016をstanで考える - 驚異のアニヲタ社会復帰への道 援助交際してそうなアニメキャラランキング2015をstanで考える - 驚異のアニヲ…

100年間の気温変化

こんな話を見かけた。 「昔の夏はもっと涼しかっただろ!」と思い、50年前の日本の気温を調べてみたところ、まさかの結果が…! | netgeek これについて言及していた人がいて、データソースがおかしい、ということのようだ。 気象庁 | 日本の年平均気温 変化…

賭ケグルイの投票じゃんけんで蛇喰さんはどうやって芽亜里の奴隷であるクラスメイトの割合を推定したか

賭ケグルイを見ている。 黒髪ロングのプリーツスカート黒タイツのはやみんなので視聴意欲がやばい。 ここで、賭ケグルイの1話で、投票じゃんけんという変則じゃんけんで勝負する。 クラス 人がグー 、チョキ 、パー のいずれかの手を投票する。 蛇喰さんと芽…

糖質制限ダイエットを始めたらたった1日で体重が2kg減った話をしたらもっと詳しい体重推移データをもらった

ダイエットのデータを昔使って遊んだけど、元データを持っている人が更に長期のデータを公開してくれた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t;…

single cell RNA-seq のdropout

読んだ。 MAGIC: A diffusion-based imputation method reveals gene-gene interactions in single-cell RNA-sequencing data コードはPython で書かれている。computational flowcytometry のDana Peer ラボ。RNA-seq のデータ行列が取るであろう高次元空間…

糖質制限ダイエットを始めたらたった1日で体重が2kg減った

親戚が集まったときの会で、ふいにそんなことを言われた。その人としては減量をがんばったということを言いたかったのだろうが、自分自身、糖質制限ダイエットに対してエビデンスを持っていないことと、1日で2kg 減るっていうのは、偶然「2日間連続で体重を…

μ's とAqours の人気の差

こんな記事があった。あるアニメショップでキャラの人気投票をしたら、ラブライブにおいてμ's のメンバーのほうが、Aqours のメンバーより総じて上位だったらしい。 というわけで、2グループの人気はどれくらいの差かを考える。 2グループ各9人、全部で18人…

PK戦での各試行に及ぼす影響をrstan でやってみる

PK 戦の順序が勝ちやすさに影響するか考えたかったけど、データを集めた時点で先攻が勝つ確率が50% だったので、いろいろな条件のもとでのPK の成功率を考えていた。 stan でやってみる。 PK は10人が蹴るまでに終わるとする(154試合1389回)。 各PK での成功…

EM アルゴリズムとベイズ

EM アルゴリズムとベイズという話が出てきたので、やってみる。 題材はこちら 状況としては、ABOの血液型で、どんな血液型を持っているかは観測できるが、その血液型population を生み出したアレル頻度は一体どのようなものだろうか、これを推定したい、とい…

声優統計の統計C91版

声優統計第九号は、新刊の第九号と既刊の5-8 がまとまった論文集2 ともに完売しました。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createEl…

声優統計第九号 声優力

この記事は R Advent Calendar 2016 Stan Advent Calendar 2016 ごちうさ Advent Calendar 2016 まんがタイムきらら Advent Calendar 2016 の25日目の担当記事です。 C91 で声優統計ネタとして声優力を推定します。声優力とはなんぞや、という話ですが、ある…

Biclustering

読んだ。 Bioinformatics. 2016 Oct 6. Nucleic Acids Res. 2009 Aug;37(15):e101. Biclustering をするQUBIC という手法をR で実装しました。クッソ速いです、とのこと。 そもそもbiclustering とはなにかというと、ヒートマップクラスタリングをするときに…

StanとRでベイズ統計モデリング

読んだ。StanとRでベイズ統計モデリング (Wonderful R)作者: 松浦健太郎,石田基広出版社/メーカー: 共立出版発売日: 2016/10/25メディア: 単行本この商品を含むブログ (10件) を見るCOI:謹 呈。激甘書評。 rstan の神が丹精込めて書きあげた、至高の一冊。 …

岩波データサイエンス Vol.4 地理空間情報処理

読んだ。岩波データサイエンス Vol.4作者: 岩波データサイエンス刊行委員会出版社/メーカー: 岩波書店発売日: 2016/10/15メディア: 単行本(ソフトカバー)この商品を含むブログ (3件) を見るCOI:編集者の一部は知り合いだけど自費で買った。 疫学研究者な…