統計

アレルとgenotype の頻度を信頼区間付で求めたい

という質問を受けたので1万年と2000年ぶりくらいに遺伝統計やった。 雰囲気としては、こんな感じの値を求めたい。Indian J Endocrinol Metab. 2014 Nov-Dec; 18(6): 850–854. のTable 1 より引用www.ncbi.nlm.nih.gov ここで、データとしては被験者たちのgen…

多浪女性だけど医学部に合格したい

結論から言うと福岡大学(多浪を重視、OR=1.31)は多浪女性でも医学部合格しやすいかもしれない。ただし女性であることで合格しやすいかは有意差がない。 現役女性に限って言えば、女性で合格しやすいのは三重大学(OR=1.23)、弘前大学(OR=1.34)である。 …

東京大学での式辞の統計問題を考える

こんな話を見かけた。ちなみに式辞は読んでない。 qiita.comデータ取得まではやってくれていて、解析もしていた。解析者では、東京大学、鳥取大学、島根大学の医学部での男女合格率には差がない、ということだった。 せっかく81大学の男女受験者数と合格者数…

第113回医師国家試験を項目反応理論で解析します(予告)、の予備実験

予備実験用の解答サンプルシートはこちら 第112回から適当に20問とってきたもの。 ↓ https://docs.google.com/forms/d/e/1FAIpQLSfiLVA-1m7NC5SMmyi0X1ftSYJzhWuOac6kr-WMR8gKgFLWVA/viewform shiny 上でその20問の項目反応理論(IRT) ↓ https://yfujii08.shi…

昔は3日間あった試験が今では2日間しかないのだから勉強量は2/3 でいいでしょう?

昔、とある試験を受けたのだが、最近では改定されて3日間あった日程が2日間に減っているらしい。 ならば昔の受験生がいままで一生懸命勉強に費やしていた期間は今の人達は2/3 でいいんじゃね?(適当 と後輩を煽っていたのだが、以前試験勉強に飽きたので今ま…

急速導入のセリック手技はしなくてもいいのではないか

読んだ。 Effect of Cricoid Pressure Compared With a Sham Procedure in the Rapid Sequence Induction of Anesthesia: The IRIS Randomized Clinical Trial. JAMA Surg. 2018 Oct 17. doi: 10.1001/jamasurg.2018.3577. 緊急手術時の急速導入で、セリック…

医薬データ解析のためのベイズ統計学

読んだ。医薬データ解析のためのベイズ統計学作者: Emmanuel Lesaffre,Andrew B. Lawson,宮岡悦良,遠藤輝,安藤英一,鎗田政男,中山高志出版社/メーカー: 共立出版発売日: 2016/02/25メディア: 単行本この商品を含むブログ (3件) を見るめっちゃ時間がかかって…

レプリカ交換法

読んだ。 Bayesian estimation of phase response curves. Neural Netw. 2010 Aug;23(6):752-63. Phase response curve (PRC) という神経細胞の発火の記録を推定したいが、周期のズレや発火タイミングの変化などで普通にやったら推定が収束しないらしい。 レ…

VARで本当にPKが多くなっているのか

ロシアW杯でVAR が導入されたことにより、PK の数が多いような印象である。実際、予選リーグの時点で過去最高だとか、いろいろ言われている。毎日新聞によると https://mainichi.jp/articles/20180703/ddm/035/050/161000c VARは、得点▽PK▽レッドカード…

W杯の試合観戦中にトイレはいついくべきか

こんなツイートを観測した。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter…

single cell の分化系統樹解析

読んだ。 A comparison of single-cell trajectory inference methods: towards more accurate and robust tools. single cell のRNAseq などからデータを取得して、細胞分化系統樹を解析するのに多種多様な手法やパッケージが出ている。 59手法を試してみて…

決勝トーナメントに向けて初戦が大事というが初戦はどれくらい大事なのか

2018FIFAワールドカップが始まった。日本の決勝トーナメント進出は初戦に勝利できるかにかかっている! とかなんとかよく聞くが、実際に初戦に勝利するのはどれだけ大事かは定量的に言われていない気がする。 2002年と2010年に決勝トーナメントに進出したので…

なぜ人は新刊を落とすのか

こんなツイートを見かけた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter…

就学年数が長いから近視になるのか近視になるから就学年数が長いのか

読んだ。 BMJ. 2018 Jun 6;361:k2022. 観察研究では、どちらも関連があるが、この論文の結論から言えば就学年数が長いから近視になり、近視だから就学年数が長い、ということにはならない。これを近視に関する多型でメンデリアンランダマイゼーションした場…

ホーム&アウェー方式のアウェーゴールは妥当なのか

チャンピオンズリーグを見ていた。 CL というか本拠地があってホームでもアウェーでも試合を行うタイプのスポーツにあるのが、先に言ったホームとアウェーで戦い方というか試合に影響する部分が大きい、ということである。 サッカーは特にホーム&アウェーの…

ギブスサンプリング

Metropolis-Hastings サンプリングをやったので、ギブスサンプリングをやってみる。 ある変数 について、 番目を取り除いた を ( 番目が抜けている) で順次サンプリングして、その値を入れなおしてまたサンプリングする、を について行う。 結局、あるひと…

ものすごいわかりやすかったKullback-Leibler divergence

情報量を と置くと、 単調に減少する ふたつの分布が独立ならば、加算的に扱える というので、 と書いておく。 符号化してその平均長を考えると はエントロピーである。 さてここで、 はわからないけど、理論的にこれならば、上のエントロピーが成り立つ。し…

線形回帰の最小二乗法をベクトル偏微分で解く

の最小化を偏微分で求めるが、ベクトル演算とベクトル微分が「これは知ってて当然でしょ」という感じでさっくり飛ばされることが多いのでしつこいくらいにひとつずつやる。下準備 微分されるベクトル変数は, 係数のベクトルは とする。基本的に または とか…

DNA型が一致しないときに突然変異ということで一致判定できるか

こんな記事を見かけた。 http://www.yomiuri.co.jp/national/20180511-OYT1T50044.html 判例 平成29(あ)882 困惑している人が多い。 意外と知られていない知識「突然変異によるDNA型の変化はまれにある」裁判での逆転有罪の科学的根拠に驚きの声 - Togetter …

ランダムウォークで乱数を生成する

機械学習のTA なのに機械学習素人なので機械学習と統計の講義を聞いている。 多次元な確率分布から乱数をいい感じに取ってくる方法に、ランダムウォークを使う。 多次元な確率分布としては、単純に2次元正規分布、とする。二次元の正規分布は、x1 とx2 のそ…

グラフの検定

グラフの相同性とか統計量とかの話で、cug.test という検定を後輩から教えてもらった。 sna パッケージでできる。 グラフ隣接行列からランダムな隣接行列を作りまくって分布を作成して、p値を計算するらしい。 グラフとしてはこんな感じで 検定は以下のよう…

遺伝統計学と疾患ゲノムデータ解析

書いた。 遺伝統計学と疾患ゲノムデータ解析 COI:著者謹呈。編集者とはズブズブの関係。 序文を引用すると、 学問の学びの最初の一歩は,背景となる基礎理論の丁寧な理解から始まる。第1章では,遺伝統計学の基礎理論について,日本を代表する専門家の先生方…

アンケート調査でN数はいくら必要なのか

こんな話を見かけた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter.com/w…

時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装

読んだ。時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装作者: 馬場真哉出版社/メーカー: プレアデス出版発売日: 2018/02/14メディア: 単行本この商品を含むブログ (3件) を見るCOI:自費で買った。 時系列分析とRstan を使った状態空間モデルの…

(臨床系の)統計解析でやらかしがちな10個のミス

読んだ。 Common scientific and statistical errors in obesity research. Obesity (Silver Spring). 2016 Apr;24(4):781-90. PNAS の特集で統計とか解析の再現性というなかで Issues with data and analyses: Errors, underlying themes, and potential so…

心不全の心血管イベント発症率を予測するモデル()

読んだ。 The impact of creating mathematical formula to predict cardiovascular events in patients with heart failure. Sci Rep. 2018 Mar 5;8(1):3986. プレスリリース COI:なし 慢性心不全患者の血液検査、診察所見、検査データなどから、心血管イ…

帰無仮説検定で有意になった項目についてROC 解析をしてください

と査読で言われた。 状況設定としてはこんな感じである。いま、とある検査項目 (連続量)について、予後を予測するマーカーになるか検討したい。ここで、デザインとしてはとりあえず研究を立ち上げてみました、というような後ろ向き観察研究で、予後転帰が…

FKが一番上手いのは誰? 「過去5年間の成功率」で見る“ベスト・フリーキッカー”TOP20

という記事を見かけた。 FKが一番上手いのは誰? 「過去5年間の成功率」で見る“ベスト・フリーキッカー”TOP20 現在、最もフリーキックが上手い選手は誰なのか……。イギリス誌『FourFourTwo』が、「2013−14シーズンからの5年間で最もフリーキックの成功率が高か…

(サッカー解説)2点差は危険なスコアですね ← ???

高校サッカーを見ていた。2017年度は前橋育英が初優勝で幕を閉じた。 どの試合だったか忘れてしまったが、2点差がついたときに解説が「2点差は危険」ということを言っていた。 調べてみると、やはりよく言われていることのようだが、実際にデータをとってみ…

Rule of Three: 僕のまわりではそんなことはない!

面白い話を教えてもらったので読んだ。 稀な事象の生起確率に関する統計的推測 Rule of Three とその周辺 ポアソン分布とRule of Three(統計学ワード) 上記の証拠(?)をもって「○○は存在しない!」と主張する人がときたまいるが、その人のまわりをN人探して…