統計

交互作用項のある回帰分析で標準化偏回帰係数を求めるのに標準化はいつするべきか

みたいな相談を受けた。 回帰分析は最近ほとんどしないし、そもそもしたとしても交互作用の項は変数が増えるし解釈も面倒になるのでしたことがないのが本音だが、聞かれたので考えた。 結論から言うと、変数は先に標準化して、そして積を取るようである。 ir…

二次計画法を久しぶりにやる

二次計画法をRでやる必要が出てきたので久しぶりにやってみる。 二次計画法はRはでは ただし、行列 が正定値行列でないと matrix D in quadratic function is not positive definite! と言われてしまうので、逆行列を持つように微妙に変化させた行列を無理や…

賭ケグルイ(双)のスリーヒットダイスをやってみる

賭ケグルイ(双)の1巻に、スリーヒットダイスという賭けがある。 賭ケグルイ双(漫画)- マンガペディア 聚楽幸子が提案したゲーム。ダイスの123を「DOWN」、456を「UP」として扱い、プレイヤーはDOWNとUPの「連続する3つの出目」を予想してカードに書き、…

内科診療ストロングエビデンス

読んだ。内科診療 ストロング・エビデンス作者:谷口 俊文発売日: 2013/12/16メディア: 単行本COI:中古でワンコインだったので買ったがそもそも3500円だったらしい。面白そうだったのが貧血の項で、術後Hb が8を下回った人について、宗教上の理由で輸血を拒…

Rのformula をdata.frame の色々な変数の組み合わせで内容を変えながらやりたいのだが

というような質問を受けた。 glm関数とかでみかける、 A ~ B + C みたいな式の、A,B,Cをfor loopとかで内容変えながら生成する方法はないかとおもって。 A,B,Cはデータの列名やけど、その名前を変数に格納して渡しても無理でさ。 いちいちもとのデータの列名…

新型肺炎COVID-19の厚生労働省が行なった抗体検査から集団の有病率をrstanで推定する

こんな記事を観測した。 新型コロナウイルス感染症に関する検査について|厚生労働省 Roche社とAbbott社が売っている抗体検査キットを使って、東京、大阪、宮城の住民を無作為に抽出した結果、各社での陽性陰性結果は以下のようになった、という。Roche社で…

新型肺炎COVID-19の日本の実効再生産数を推定したrstanのコードを解説してみる

西浦先生が日本の実効再生産数を推定した。 コードはrstanで下記から取れる。 https://nbviewer.jupyter.org/github/contactmodel/COVID19-Japan-Reff/tree/master/解説動画を見逃したのでコードと関連論文からのお勉強になるが、肝としては、 ・知りたいの…

新型肺炎COVID-19の山梨大学医学部附属病院でのPCR検査の結果をrstanで解析する

山梨大学医学部附属病院で、慶応大学病院と同じように入院中の患者にPCR検査を行うと、370人中全員が陰性だったらしい。 山梨大病院、すべての入院患者らにPCR検査 全員陰性 [新型コロナウイルス]:朝日新聞デジタル 山梨大の島田真路学長は「陽性者がいる場…

新型肺炎COVID-19の集中治療を要する患者の推移をSIRモデルを使ってrstanで推定する

こんなことをした。 mikuhatsune.hatenadiary.com 集中治療学会が、人工呼吸器を要している患者、ECMOをしている患者、ECMOで死亡した患者、ECMOから回復した患者、など日ベースで公開してる。 これに、毎日の感染者や死亡者のデータをくっつけて、SIRを使っ…

新型肺炎COVID-19の神戸における真のIgG抗体陽性患者数をrstanで推定する

読んだ。 Estimation of seroprevalence of novel coronavirus disease (COVID-19) using preserved serum at an outpatient setting in Kobe, Japan: A cross-sectional study. | medRxiv 神戸市の入院中の患者で、入院中の検査を適当(ランダムサンプリン…

新型肺炎COVID-19の抗体検査から集団の有病率をrstanで推定する

結論から言うと、抗体検査を受けた202人の集団において、9.4%(95% 信用区間で5.4%〜13.9%)が感染者である。ただし、この抗体検査を受けた202人は、東京都(とか他の都道府県一般)のランダムサンプリングとは言えないので、単純に東京都人口の9.4%が感染し…

新型肺炎COVID-19が流行してから全身麻酔件数がどれほど減ったかをrstanで推定する

こんなツイーヨを観測した。コロナウィルス騒動で全国のオペ室今どうなってるのかアンケート7回目全国の麻酔科の先生におたずねします。今(4/24)現在、オペ室は、— DAJ (@dajhiroki) 2020年4月24日 コロナウィルス騒動で全国のオペ室今どうなってるのかア…

新型肺炎COVID-19の無症状感染者の割合を慶応大学病院のPCR検査の結果からrstanで推定する

慶応大学病院で、入院中で(新型肺炎COVID-19について)無症状の患者67人をPCR検査すると、6%(=4人)の患者で陽性だった、という話。 某感染症の先生は、めちゃめちゃ単純な推定を使って、一番楽観的な推定で47万人、一番悲観的な推定で430万人、東京に無症…

新型肺炎COVID-19のSEIRS two stain model がrstanで出来たので満足した

諦めていた。 mikuhatsune.hatenadiary.com しかし、なんか出来そうになった。 mikuhatsune.hatenadiary.com(型の)コロナウイルスの流行具合から、相互に免疫があるものとして、新型肺炎の今後数年の流行がどうなっていくかをSEIRSモデルで、かつ2種類のウ…

新型肺炎COVID-19の感染推移を時間依存パラメータを含むSEIRSモデルで推定しようと思って断念していたが出来るかもしれない

諦めていた。 mikuhatsune.hatenadiary.com というのも、SEIRSモデルでS→Eになるパラメータ が、時間依存的なパラメータとして で定義されるが、これはrstanではできなさそうである。というのが、integrate_ode関数が時間依存のパラメータをどう頑張っても取…

新型肺炎COVID-19が今後2022年まで流行が続くというのをrstanで再現しようとしたが断念した

読んだ。 Projecting the transmission dynamics of SARS-CoV-2 through the postpandemic period. - PubMed - NCBI COVID-19がこのままだと2022年も続いているのではないか、といろいろ話題になった論文。 githubがおいてあるが、ここにあるデータは GitHub…

新型肺炎COVID-19の無症状感染者の割合をrstanで推定しようとしたが断念した

読んだ。 Estimating the asymptomatic proportion of coronavirus disease 2019 (COVID-19) cases on board the Diamond Princess cruise ship, Yokohama, Japan, 2020. - PubMed - NCBI COI:なしダイヤモンド・プリンセス号のPCR検査と陽性数および症状の…

新型肺炎COVID-19の感染者数の推移をSEIRモデルを使ってrstanでシミュレーションする

読んだ。 A Simulation on Potential Secondary Spread of Novel Coronavirus in an Exported Country Using a Stochastic Epidemic SEIR Model. - PubMed - NCBI COI:筆者はこの著者とは直接の関係はないので、純粋に統計解析のツッコミです。こんなツイー…

rstanで打ち切りデータがあるときのパラメータ推定をする

これに、打ち切りデータがあるときの平均値の推定問題がある。StanとRでベイズ統計モデリング (Wonderful R)作者:健太郎, 松浦発売日: 2016/10/25メディア: 単行本データが正規分布に従うのだろうが、25を下回るデータはとなっているので、このデータを無視…

新型肺炎COVID-19の重症化率を推定する

読んだ。 Eurosurveillance | Estimating the infection and case fatality ratio for coronavirus disease (COVID-19) using age-adjusted data from the outbreak on the Diamond Princess cruise ship, February 2020 ダイヤモンド・プリンセス号のデータ…

新型肺炎COVID-19 の感染陽性患者数の過小報告分をrstanで推定する

読んだ。 Ascertainment rate of novel coronavirus disease (COVID-19) in Japan | medRxiv ascertainment rate という、感染者数(PCR陽性ベース)がどれくらいか、つまり、1だと実際の報告数が潜在的な患者数と同一で、>1だと過剰に報告されている、軽症…

新型肺炎COVID-19 の潜伏期間をrstanで推定する

読んだ。 Incubation period of 2019 novel coronavirus (2019-nCoV) infections among travellers from Wuhan, China, 20-28 January 2020. - PubMed - NCBI最初に武漢で肺炎が発生したときに、88症例について感染履歴を聴取して、ワイブル分布で潜伏期間を…

新型肺炎COVID-19の感染力R0を推定する

読んだ。 www.ncbi.nlm.nih.gov 巷を賑わせているCOVID-19だが、厚生労働省がダイヤモンド・プリンセス号のPCR陽性者数を逐一ネットに挙げていたので、この論文にもあるようにそこからデータを取ってきて、COVID-19の感染力を推定しようと思った。 Basic rep…

rstanで自分で定義した確率分布からサンプリングする:Johnson's SU 分布

本当はこの通りにしたかったが、自作関数のサンプリングが遅すぎたので先に正規分布normalからのサンプリングがvectorかひとつひとつかtargetかで変わるのかを検証していた。 結論から言うと組み込みのvector型サンプリングは速いが、自作関数はひとつひとつ…

rstanでの確率分布からのサンプリングの速さを比較する

rstanで自作関数、というかrstanに実装されていない確率分布からサンプリングをしたくてコードを書いていたが、その前にコードの書き方でサンプリングの効率というか速さが違うので速くなる書き方をしよう、という検証。 結論から言うと、実装されている関数…

臨床に直結しそうで、ベッドサイドですぐに役立ちそうなエビデンスはぶっちゃけ書かれていない

読んだ。臨床に直結する集中治療のエビデンス―ベッドサイドですぐに役立つリファレンスブック発売日: 2013/03/01メディア: 単行本COI:定価は高かったけど古くなったのでくっそ安くなってたので買って積んでた。読み始めてから知り合いがいたことに気づいた…

ふたつの分布が違うのをどう示したらいいですか

こんな記事を書いたらごく狭い範囲で反響があった。 mikuhatsune.hatenadiary.com ガンマ分布の記事感動しました。そんなガンマ分布マスターであられる驚異のアニヲタさんに質問するもの失礼なほど低級な質問なんですが、、、 ある疾患があって、その疾患発…

混合分布:急性期と亜急性期の発症がある

こんな感じのデータを見かけた。 本人が言うには、8日あたりを境目にして、8日までに発症するパターンと、それ以降に発症するパターンに分かれそうだ、という。 データの意味合いと二峰性の具合から、おそらくふたつのガンマ分布が重なっているのでは、とい…

線虫でがん検査、約85%の確率で特定

という記事を観測した。 詳細はいつもの通り不明だが、記事によると、 がん患者1400人に実施した検査では的中率は約85%に上り、特にステージ0~1の患者は87%で判定できた。一般的ながん検査「腫瘍マーカー」よりかなり高確率という。 反応するのは胃、大腸…

「男女間モテ格差」をzero-inflated model で考える

こんな話を見つけた。そもそも、女性の考える「非モテ男性」と実際の「非モテ男性」の認識にすれ違いがありそう。女性は何もしなくても75%は一度は告白される。一方男性は、半数以上が一度も告白されない。女性のリアルからみると「非モテ」とは「下位25%…