数学

中心極限定理を確かめる

どんな分布(注)からでもサンプリングされた標本の平均をさらに繰り返して標本の分布を考えたとき、その分布は正規分布になる。 というのでいろいろ分布を変えて試してみる。 Rでは接頭語rdpqに続いて分布名があるので、標準で実装されている関数をapropos…

帰無仮説検定が正しいのか正しくないのか

検定とp値がいつまで経ってもわからないので久々にシミュレーションした。 対照群 と治療群 があって、なんらかの指標となる値に変化があるかどうか調べたい。 比較するのは、母集団(真の分布)である(ここでは真の分布は正規分布であると自分は分かってい…

NEJMに載るようなRCTでも再解析したら結果が異なるのですが??

面白い話題を見つけたので考えてみようと思ったらデータもあったのでやってみた。 ことの発端はここで 産科編 妊娠中期 妊娠中、虫歯の治療はできますか? (周産期医学 49巻13号) | 医書.jp 妊婦に歯科治療を行うと37週未満の早産が減らせるかどうかというRCT…

6□4□5□2□1でカウントダウンする問題

式の数字の部分は固定で、+-×÷だけが変えられるようになっている。毎朝、前を通る度に「ほえ~」と感心している。さて明日は……? pic.twitter.com/W7ogjjzvOz— 田中 草大 (たなか そうた) (@_sotanaka) 2022年10月21日 流行っていたのでRでやってみた。 Pyt…

二次計画法を久しぶりにやる

二次計画法をRでやる必要が出てきたので久しぶりにやってみる。 二次計画法はRはでは ただし、行列 が正定値行列でないと matrix D in quadratic function is not positive definite! と言われてしまうので、逆行列を持つように微妙に変化させた行列を無理や…

新型肺炎COVID-19のSEIRS two stain model がrstanで出来たので満足した

諦めていた。 mikuhatsune.hatenadiary.com しかし、なんか出来そうになった。 mikuhatsune.hatenadiary.com(型の)コロナウイルスの流行具合から、相互に免疫があるものとして、新型肺炎の今後数年の流行がどうなっていくかをSEIRSモデルで、かつ2種類のウ…

新型肺炎COVID-19の感染推移を時間依存パラメータを含むSEIRSモデルで推定しようと思って断念していたが出来るかもしれない

諦めていた。 mikuhatsune.hatenadiary.com というのも、SEIRSモデルでS→Eになるパラメータ が、時間依存的なパラメータとして で定義されるが、これはrstanではできなさそうである。というのが、integrate_ode関数が時間依存のパラメータをどう頑張っても取…

rstanで打ち切りデータがあるときのパラメータ推定をする

これに、打ち切りデータがあるときの平均値の推定問題がある。StanとRでベイズ統計モデリング (Wonderful R)作者:健太郎, 松浦発売日: 2016/10/25メディア: 単行本データが正規分布に従うのだろうが、25を下回るデータはとなっているので、このデータを無視…

混合分布:急性期と亜急性期の発症がある

こんな感じのデータを見かけた。 本人が言うには、8日あたりを境目にして、8日までに発症するパターンと、それ以降に発症するパターンに分かれそうだ、という。 データの意味合いと二峰性の具合から、おそらくふたつのガンマ分布が重なっているのでは、とい…

線虫でがん検査、約85%の確率で特定

という記事を観測した。 詳細はいつもの通り不明だが、記事によると、 がん患者1400人に実施した検査では的中率は約85%に上り、特にステージ0~1の患者は87%で判定できた。一般的ながん検査「腫瘍マーカー」よりかなり高確率という。 反応するのは胃、大腸…

アレルとgenotype の頻度を信頼区間付で求めたい

という質問を受けたので1万年と2000年ぶりくらいに遺伝統計やった。 雰囲気としては、こんな感じの値を求めたい。Indian J Endocrinol Metab. 2014 Nov-Dec; 18(6): 850–854. のTable 1 より引用www.ncbi.nlm.nih.gov ここで、データとしては被験者たちのgen…

ようやくShinyを使ってインタラクティブにパラメータをいじって遊べるシミュレーターをweb上にあげることができた

Shinyというhtml 上でいろいろパラメータをいじったものを即座に計算して描出するインタラクティブでなんかすごいアプリがあったのだが、rmarkdown と同様に手をつけることなく放置していた。 せっかちな人はこちら → https://yfujii08.shinyapps.io/pkpdsim…

医薬データ解析のためのベイズ統計学

読んだ。医薬データ解析のためのベイズ統計学作者: Emmanuel Lesaffre,Andrew B. Lawson,宮岡悦良,遠藤輝,安藤英一,鎗田政男,中山高志出版社/メーカー: 共立出版発売日: 2016/02/25メディア: 単行本この商品を含むブログ (3件) を見るめっちゃ時間がかかって…

W杯の試合観戦中にトイレはいついくべきか

こんなツイートを観測した。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter…

決勝トーナメントに向けて初戦が大事というが初戦はどれくらい大事なのか

2018FIFAワールドカップが始まった。日本の決勝トーナメント進出は初戦に勝利できるかにかかっている! とかなんとかよく聞くが、実際に初戦に勝利するのはどれだけ大事かは定量的に言われていない気がする。 2002年と2010年に決勝トーナメントに進出したので…

なぜ人は新刊を落とすのか

こんなツイートを見かけた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter…

ホーム&アウェー方式のアウェーゴールは妥当なのか

チャンピオンズリーグを見ていた。 CL というか本拠地があってホームでもアウェーでも試合を行うタイプのスポーツにあるのが、先に言ったホームとアウェーで戦い方というか試合に影響する部分が大きい、ということである。 サッカーは特にホーム&アウェーの…

ギブスサンプリング

Metropolis-Hastings サンプリングをやったので、ギブスサンプリングをやってみる。 ある変数 について、 番目を取り除いた を ( 番目が抜けている) で順次サンプリングして、その値を入れなおしてまたサンプリングする、を について行う。 結局、あるひと…

ものすごいわかりやすかったKullback-Leibler divergence

情報量を と置くと、 単調に減少する ふたつの分布が独立ならば、加算的に扱える というので、 と書いておく。 符号化してその平均長を考えると はエントロピーである。 さてここで、 はわからないけど、理論的にこれならば、上のエントロピーが成り立つ。し…

線形回帰の最小二乗法をベクトル偏微分で解く

の最小化を偏微分で求めるが、ベクトル演算とベクトル微分が「これは知ってて当然でしょ」という感じでさっくり飛ばされることが多いのでしつこいくらいにひとつずつやる。下準備 微分されるベクトル変数は, 係数のベクトルは とする。基本的に または とか…

DNA型が一致しないときに突然変異ということで一致判定できるか

こんな記事を見かけた。 http://www.yomiuri.co.jp/national/20180511-OYT1T50044.html 判例 平成29(あ)882 困惑している人が多い。 意外と知られていない知識「突然変異によるDNA型の変化はまれにある」裁判での逆転有罪の科学的根拠に驚きの声 - Togetter …

ランダムウォークで乱数を生成する

機械学習のTA なのに機械学習素人なので機械学習と統計の講義を聞いている。 多次元な確率分布から乱数をいい感じに取ってくる方法に、ランダムウォークを使う。 多次元な確率分布としては、単純に2次元正規分布、とする。二次元の正規分布は、x1 とx2 のそ…

時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装

読んだ。時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装作者: 馬場真哉出版社/メーカー: プレアデス出版発売日: 2018/02/14メディア: 単行本この商品を含むブログ (3件) を見るCOI:自費で買った。 時系列分析とRstan を使った状態空間モデルの…

FKが一番上手いのは誰? 「過去5年間の成功率」で見る“ベスト・フリーキッカー”TOP20

という記事を見かけた。 FKが一番上手いのは誰? 「過去5年間の成功率」で見る“ベスト・フリーキッカー”TOP20 現在、最もフリーキックが上手い選手は誰なのか……。イギリス誌『FourFourTwo』が、「2013−14シーズンからの5年間で最もフリーキックの成功率が高か…

(サッカー解説)2点差は危険なスコアですね ← ???

高校サッカーを見ていた。2017年度は前橋育英が初優勝で幕を閉じた。 どの試合だったか忘れてしまったが、2点差がついたときに解説が「2点差は危険」ということを言っていた。 調べてみると、やはりよく言われていることのようだが、実際にデータをとってみ…

杏仁豆腐「あんかけどうふ」の待機列がまたもや凄まじかった話

C92 に続いてC93 でもデレマス絵師の杏仁豆腐さんが参加していた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id…

ケーキをなるべく均等に9等分したい

大掃除をしたあとクリスマスっぽい感じでケーキを食べようということになったのだが、9人いたのでケーキをどう切るか問題になった。 360度を40度ずつ切ればいいが、実際に40度でケーキを切るのは困難である。 単純に平行に切るのが楽でよい。 というわけで、…

logit の代わりにtanh を使ってはいけないのですか?

講義の最中にこんな質問があって、「logit は0-1 の範囲にあって、確率として扱いやすいから」という回答だったが、あとで スケールが変わっただけで本質的には同じということがアナウンスされていた。 logit は tanh は となり、これらの関係は となる。 と…

確率分布が均一でないサイコロの施行

こんな問題を見かけた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter.com…

独習 統計学24講

読んだ。独習 統計学24講: 医療データの見方・使い方作者: 鶴田陽和出版社/メーカー: 朝倉書店発売日: 2013/05/29メディア: 単行本この商品を含むブログ (3件) を見るすべての医療系学生・研究者に贈る 独習統計学応用編24講 ─分割表・回帰分析・ロジスティ…