Rを使いこなす

虹ヶ咲学園スクールアイドル同好会の名前呼び合いグラフをかく 5話

エマさん回だったわけだが、しずくがはぶられているが大丈夫か? 虹ヶ咲学園スクールアイドル同好会の名前呼び合いグラフをかく 1〜3話 - 驚異のアニヲタ社会復帰の予備 虹ヶ咲学園スクールアイドル同好会の名前呼び合いグラフをかく 4話 - 驚異のアニヲタ社…

虹ヶ咲学園スクールアイドル同好会の名前呼び合いグラフをかく 4話

愛さんがキーパーソンすぎるわけだが、あんな娘現実におったらこっちが勝手に惚れてしまって振られてしまうやつじゃんェ… 虹ヶ咲学園スクールアイドル同好会の名前呼び合いグラフをかく 1〜3話 - 驚異のアニヲタ社会復帰の予備

ソシャゲの生存率

こんな記事を観測した。 【悲報】ソシャゲの「10年生存率」、ほぼ0と判明する | やらおん!こんな面白い解析ネタがあったのに乗り遅れた。 しかし、図の生存曲線がどのように作られたかが謎である。カプランマイヤーなのだろうか。 しかも、10年で「ほぼ」0%…

交互作用項のある回帰分析で標準化偏回帰係数を求めるのに標準化はいつするべきか

みたいな相談を受けた。 回帰分析は最近ほとんどしないし、そもそもしたとしても交互作用の項は変数が増えるし解釈も面倒になるのでしたことがないのが本音だが、聞かれたので考えた。 結論から言うと、変数は先に標準化して、そして積を取るようである。 ir…

Rのプロット領域の角に文字をおきたい

論文のsub figure でAとかBとかを角に置きたいが、角の座標を取得したい。 Rのプロット領域の仕様として、余白 margin と描出されない外領域がある。 box 関数を使うと余白領域または外領域を囲ってくれるが、これは.External.graphics で関数を参照するのを…

二次計画法を久しぶりにやる

二次計画法をRでやる必要が出てきたので久しぶりにやってみる。 二次計画法はRはでは ただし、行列 が正定値行列でないと matrix D in quadratic function is not positive definite! と言われてしまうので、逆行列を持つように微妙に変化させた行列を無理や…

Rのformula をdata.frame の色々な変数の組み合わせで内容を変えながらやりたいのだが

というような質問を受けた。 glm関数とかでみかける、 A ~ B + C みたいな式の、A,B,Cをfor loopとかで内容変えながら生成する方法はないかとおもって。 A,B,Cはデータの列名やけど、その名前を変数に格納して渡しても無理でさ。 いちいちもとのデータの列名…

zip になってるshape ファイルをRのみの操作でダウンロードして扱いたい

という相談を受けた。 昔は地図を扱うときにsp というパッケージを使っていたが、最近ではsf が流行りだそうだ。 notchained.hatenablog.com インタラクティブにしたければleaflet があるが、普通にプレゼンとか論文の図にしたい、ということでsf を使いたい…

新型肺炎COVID-19の日本の実効再生産数を推定したrstanのコードを解説してみる

西浦先生が日本の実効再生産数を推定した。 コードはrstanで下記から取れる。 https://nbviewer.jupyter.org/github/contactmodel/COVID19-Japan-Reff/tree/master/解説動画を見逃したのでコードと関連論文からのお勉強になるが、肝としては、 ・知りたいの…

新型肺炎COVID-19の山梨大学医学部附属病院でのPCR検査の結果をrstanで解析する

山梨大学医学部附属病院で、慶応大学病院と同じように入院中の患者にPCR検査を行うと、370人中全員が陰性だったらしい。 山梨大病院、すべての入院患者らにPCR検査 全員陰性 [新型コロナウイルス]:朝日新聞デジタル 山梨大の島田真路学長は「陽性者がいる場…

新型肺炎COVID-19 の集中治療学会のデータを引っこ抜く

こんなデータがある。 covid19.jsicm.org COVID-19による全国の人工呼吸器患者数とECMO稼働数(と離脱者数、死亡者数、現在も治療されている最中の数)がjsでグリグリできる。 グリグリできるのはいいが、47都道府県+地方別とデータを取るのが面倒なので、引…

新型肺炎COVID-19の神戸における真のIgG抗体陽性患者数をrstanで推定する

読んだ。 Estimation of seroprevalence of novel coronavirus disease (COVID-19) using preserved serum at an outpatient setting in Kobe, Japan: A cross-sectional study. | medRxiv 神戸市の入院中の患者で、入院中の検査を適当(ランダムサンプリン…

新型肺炎COVID-19の抗体検査から集団の有病率をrstanで推定する

結論から言うと、抗体検査を受けた202人の集団において、9.4%(95% 信用区間で5.4%〜13.9%)が感染者である。ただし、この抗体検査を受けた202人は、東京都(とか他の都道府県一般)のランダムサンプリングとは言えないので、単純に東京都人口の9.4%が感染し…

新型肺炎COVID-19が流行してから全身麻酔件数がどれほど減ったかをrstanで推定する

こんなツイーヨを観測した。コロナウィルス騒動で全国のオペ室今どうなってるのかアンケート7回目全国の麻酔科の先生におたずねします。今(4/24)現在、オペ室は、— DAJ (@dajhiroki) 2020年4月24日 コロナウィルス騒動で全国のオペ室今どうなってるのかア…

新型肺炎COVID-19の無症状感染者の割合を慶応大学病院のPCR検査の結果からrstanで推定する

慶応大学病院で、入院中で(新型肺炎COVID-19について)無症状の患者67人をPCR検査すると、6%(=4人)の患者で陽性だった、という話。 某感染症の先生は、めちゃめちゃ単純な推定を使って、一番楽観的な推定で47万人、一番悲観的な推定で430万人、東京に無症…

新型肺炎COVID-19のSEIRS two stain model がrstanで出来たので満足した

諦めていた。 mikuhatsune.hatenadiary.com しかし、なんか出来そうになった。 mikuhatsune.hatenadiary.com(型の)コロナウイルスの流行具合から、相互に免疫があるものとして、新型肺炎の今後数年の流行がどうなっていくかをSEIRSモデルで、かつ2種類のウ…

新型肺炎COVID-19の感染推移を時間依存パラメータを含むSEIRSモデルで推定しようと思って断念していたが出来るかもしれない

諦めていた。 mikuhatsune.hatenadiary.com というのも、SEIRSモデルでS→Eになるパラメータ が、時間依存的なパラメータとして で定義されるが、これはrstanではできなさそうである。というのが、integrate_ode関数が時間依存のパラメータをどう頑張っても取…

新型肺炎COVID-19が今後2022年まで流行が続くというのをrstanで再現しようとしたが断念した

読んだ。 Projecting the transmission dynamics of SARS-CoV-2 through the postpandemic period. - PubMed - NCBI COVID-19がこのままだと2022年も続いているのではないか、といろいろ話題になった論文。 githubがおいてあるが、ここにあるデータは GitHub…

新型肺炎COVID-19の無症状感染者の割合をrstanで推定しようとしたが断念した

読んだ。 Estimating the asymptomatic proportion of coronavirus disease 2019 (COVID-19) cases on board the Diamond Princess cruise ship, Yokohama, Japan, 2020. - PubMed - NCBI COI:なしダイヤモンド・プリンセス号のPCR検査と陽性数および症状の…

新型肺炎COVID-19の感染者数をgooglevis を使って表示する

こんな記事を観測した。 www.ft.com 新型肺炎の感染者数および死亡者数を、ECDCという機関のデータから取得してプロットしている。 Homepage | European Centre for Disease Prevention and Control この機関、いいところがcsv データを整備してくれていて、…

新型肺炎COVID-19の感染者数の推移をSEIRモデルを使ってrstanでシミュレーションする

読んだ。 A Simulation on Potential Secondary Spread of Novel Coronavirus in an Exported Country Using a Stochastic Epidemic SEIR Model. - PubMed - NCBI COI:筆者はこの著者とは直接の関係はないので、純粋に統計解析のツッコミです。こんなツイー…

rstanで打ち切りデータがあるときのパラメータ推定をする

これに、打ち切りデータがあるときの平均値の推定問題がある。StanとRでベイズ統計モデリング (Wonderful R)作者:健太郎, 松浦発売日: 2016/10/25メディア: 単行本データが正規分布に従うのだろうが、25を下回るデータはとなっているので、このデータを無視…

新型肺炎COVID-19の重症化率を推定する

読んだ。 Eurosurveillance | Estimating the infection and case fatality ratio for coronavirus disease (COVID-19) using age-adjusted data from the outbreak on the Diamond Princess cruise ship, February 2020 ダイヤモンド・プリンセス号のデータ…

新型肺炎COVID-19 の感染陽性患者数の過小報告分をrstanで推定する

読んだ。 Ascertainment rate of novel coronavirus disease (COVID-19) in Japan | medRxiv ascertainment rate という、感染者数(PCR陽性ベース)がどれくらいか、つまり、1だと実際の報告数が潜在的な患者数と同一で、>1だと過剰に報告されている、軽症…

新型肺炎COVID-19 の潜伏期間をrstanで推定する

読んだ。 Incubation period of 2019 novel coronavirus (2019-nCoV) infections among travellers from Wuhan, China, 20-28 January 2020. - PubMed - NCBI最初に武漢で肺炎が発生したときに、88症例について感染履歴を聴取して、ワイブル分布で潜伏期間を…

新型肺炎COVID-19の感染力R0を推定する

読んだ。 www.ncbi.nlm.nih.gov 巷を賑わせているCOVID-19だが、厚生労働省がダイヤモンド・プリンセス号のPCR陽性者数を逐一ネットに挙げていたので、この論文にもあるようにそこからデータを取ってきて、COVID-19の感染力を推定しようと思った。 Basic rep…

rstanで自分で定義した確率分布からサンプリングする:Johnson's SU 分布

本当はこの通りにしたかったが、自作関数のサンプリングが遅すぎたので先に正規分布normalからのサンプリングがvectorかひとつひとつかtargetかで変わるのかを検証していた。 結論から言うと組み込みのvector型サンプリングは速いが、自作関数はひとつひとつ…

rstanでの確率分布からのサンプリングの速さを比較する

rstanで自作関数、というかrstanに実装されていない確率分布からサンプリングをしたくてコードを書いていたが、その前にコードの書き方でサンプリングの効率というか速さが違うので速くなる書き方をしよう、という検証。 結論から言うと、実装されている関数…

令和2年2月21日版の国内コロナ陽性者をgooglevisでやる

www.mhlw.go.jp これの2月20日12:00現在、確認されている国内の発生状況の国内事例(チャーター便帰国者を除く)をgooglevisを使って都道府県名別にプロットしてみようと思った。 googlevisクッソ使いにくい。 厚生労働省もがんばっているのだろうが、(令和…

ふたつの分布が違うのをどう示したらいいですか

こんな記事を書いたらごく狭い範囲で反響があった。 mikuhatsune.hatenadiary.com ガンマ分布の記事感動しました。そんなガンマ分布マスターであられる驚異のアニヲタさんに質問するもの失礼なほど低級な質問なんですが、、、 ある疾患があって、その疾患発…