数学

アレルとgenotype の頻度を信頼区間付で求めたい

という質問を受けたので1万年と2000年ぶりくらいに遺伝統計やった。 雰囲気としては、こんな感じの値を求めたい。Indian J Endocrinol Metab. 2014 Nov-Dec; 18(6): 850–854. のTable 1 より引用www.ncbi.nlm.nih.gov ここで、データとしては被験者たちのgen…

ようやくShinyを使ってインタラクティブにパラメータをいじって遊べるシミュレーターをweb上にあげることができた

Shinyというhtml 上でいろいろパラメータをいじったものを即座に計算して描出するインタラクティブでなんかすごいアプリがあったのだが、rmarkdown と同様に手をつけることなく放置していた。 せっかちな人はこちら → https://yfujii08.shinyapps.io/pkpdsim…

医薬データ解析のためのベイズ統計学

読んだ。医薬データ解析のためのベイズ統計学作者: Emmanuel Lesaffre,Andrew B. Lawson,宮岡悦良,遠藤輝,安藤英一,鎗田政男,中山高志出版社/メーカー: 共立出版発売日: 2016/02/25メディア: 単行本この商品を含むブログ (3件) を見るめっちゃ時間がかかって…

W杯の試合観戦中にトイレはいついくべきか

こんなツイートを観測した。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter…

決勝トーナメントに向けて初戦が大事というが初戦はどれくらい大事なのか

2018FIFAワールドカップが始まった。日本の決勝トーナメント進出は初戦に勝利できるかにかかっている! とかなんとかよく聞くが、実際に初戦に勝利するのはどれだけ大事かは定量的に言われていない気がする。 2002年と2010年に決勝トーナメントに進出したので…

なぜ人は新刊を落とすのか

こんなツイートを見かけた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter…

ホーム&アウェー方式のアウェーゴールは妥当なのか

チャンピオンズリーグを見ていた。 CL というか本拠地があってホームでもアウェーでも試合を行うタイプのスポーツにあるのが、先に言ったホームとアウェーで戦い方というか試合に影響する部分が大きい、ということである。 サッカーは特にホーム&アウェーの…

ギブスサンプリング

Metropolis-Hastings サンプリングをやったので、ギブスサンプリングをやってみる。 ある変数 について、 番目を取り除いた を ( 番目が抜けている) で順次サンプリングして、その値を入れなおしてまたサンプリングする、を について行う。 結局、あるひと…

ものすごいわかりやすかったKullback-Leibler divergence

情報量を と置くと、 単調に減少する ふたつの分布が独立ならば、加算的に扱える というので、 と書いておく。 符号化してその平均長を考えると はエントロピーである。 さてここで、 はわからないけど、理論的にこれならば、上のエントロピーが成り立つ。し…

線形回帰の最小二乗法をベクトル偏微分で解く

の最小化を偏微分で求めるが、ベクトル演算とベクトル微分が「これは知ってて当然でしょ」という感じでさっくり飛ばされることが多いのでしつこいくらいにひとつずつやる。下準備 微分されるベクトル変数は, 係数のベクトルは とする。基本的に または とか…

DNA型が一致しないときに突然変異ということで一致判定できるか

こんな記事を見かけた。 http://www.yomiuri.co.jp/national/20180511-OYT1T50044.html 判例 平成29(あ)882 困惑している人が多い。 意外と知られていない知識「突然変異によるDNA型の変化はまれにある」裁判での逆転有罪の科学的根拠に驚きの声 - Togetter …

ランダムウォークで乱数を生成する

機械学習のTA なのに機械学習素人なので機械学習と統計の講義を聞いている。 多次元な確率分布から乱数をいい感じに取ってくる方法に、ランダムウォークを使う。 多次元な確率分布としては、単純に2次元正規分布、とする。二次元の正規分布は、x1 とx2 のそ…

時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装

読んだ。時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装作者: 馬場真哉出版社/メーカー: プレアデス出版発売日: 2018/02/14メディア: 単行本この商品を含むブログ (3件) を見るCOI:自費で買った。 時系列分析とRstan を使った状態空間モデルの…

FKが一番上手いのは誰? 「過去5年間の成功率」で見る“ベスト・フリーキッカー”TOP20

という記事を見かけた。 FKが一番上手いのは誰? 「過去5年間の成功率」で見る“ベスト・フリーキッカー”TOP20 現在、最もフリーキックが上手い選手は誰なのか……。イギリス誌『FourFourTwo』が、「2013−14シーズンからの5年間で最もフリーキックの成功率が高か…

(サッカー解説)2点差は危険なスコアですね ← ???

高校サッカーを見ていた。2017年度は前橋育英が初優勝で幕を閉じた。 どの試合だったか忘れてしまったが、2点差がついたときに解説が「2点差は危険」ということを言っていた。 調べてみると、やはりよく言われていることのようだが、実際にデータをとってみ…

杏仁豆腐「あんかけどうふ」の待機列がまたもや凄まじかった話

C92 に続いてC93 でもデレマス絵師の杏仁豆腐さんが参加していた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id…

ケーキをなるべく均等に9等分したい

大掃除をしたあとクリスマスっぽい感じでケーキを食べようということになったのだが、9人いたのでケーキをどう切るか問題になった。 360度を40度ずつ切ればいいが、実際に40度でケーキを切るのは困難である。 単純に平行に切るのが楽でよい。 というわけで、…

logit の代わりにtanh を使ってはいけないのですか?

講義の最中にこんな質問があって、「logit は0-1 の範囲にあって、確率として扱いやすいから」という回答だったが、あとで スケールが変わっただけで本質的には同じということがアナウンスされていた。 logit は tanh は となり、これらの関係は となる。 と…

確率分布が均一でないサイコロの施行

こんな問題を見かけた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter.com…

独習 統計学24講

読んだ。独習 統計学24講: 医療データの見方・使い方作者: 鶴田陽和出版社/メーカー: 朝倉書店発売日: 2013/05/29メディア: 単行本この商品を含むブログ (3件) を見るすべての医療系学生・研究者に贈る 独習統計学応用編24講 ─分割表・回帰分析・ロジスティ…

杏仁豆腐「あんかけどうふ」の待機列が牛歩だったので待ち行列モデルで考えてみる

C92 1日目の「あんかけどうふ」というサークルは、デレマスのみくにゃんなどで有名な杏仁豆腐氏の作品が出るサークルということで、叶姉妹のサークル、けものフレンズのたつき監督と並んで3大徹夜サクチケ転売屋の巣窟、という下馬評があったりなかったり。 …

合格率60% の認定試験でほとんどの国民は一般人になれるか

虚構新聞のネタなので、一般人を試験により認定するという話は存在しません。 こんな記事を見かけた。 一般人認定試験、来年度実施を検討 「共謀罪」成立受け 共謀罪について、一般人であるかどうかの認定試験を行って、一般人か否かが決まる。ここで、「合…

R に用意されている確率分布

Rの確率分布をやっていた。確率分布はたくさんある。 Rでデフォルトではいっているものは何があるのだろうと思って探した。R 内の確率分布に関する関数は、累積密度p、確率点q、確率密度d、乱数r が用意されていて、21個とbirthday 分布が用意してあった。た…

勾配法による最適化

ある関数があって、最小化もしくは最大化したい。これらは正負を入れ替えればよいでの最小化を考える。 いま、適当に という関数があったとする。これの最小値とそのときのの組を求めたい。 2変数なので3次元に図示するとこんな感じである。最小値はひとつ定…

フーリエ変換でみる矩形波

矩形波がフーリエ変換の要素数を増やすとどれくらい近似度があがるかという動画を見かけたのでやってみる。 矩形波は となる。 が増えると近似度があがり、そのための小さな円が数珠つなぎに増える。 矩形波の平坦な部分はこの数珠がぐるぐる巻にされ、yが入…

ゼロから作るDeep Learning Pythonで学ぶディープラーニングの理論と実装

読んだ。ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装作者: 斎藤康毅出版社/メーカー: オライリージャパン発売日: 2016/09/24メディア: 単行本(ソフトカバー)この商品を含むブログ (18件) を見るCOI:自費で買った。著者は知り…

ボクセルデータから形を構成する

蛍光イメージング動画があって、そこから細胞の3次元の形を再構成したい。 手順としては、 蛍光イメージの取得:他力本願 2Dでのセグメンテーション:他力本願、大津法 セグメンテーションされた領域の抽出:openCV セグメンテーションされた領域内で欠けて…

機械学習のための連続最適化

読んだ。機械学習のための連続最適化 (機械学習プロフェッショナルシリーズ)作者: 金森敬文,鈴木大慈,竹内一郎,佐藤一誠出版社/メーカー: 講談社発売日: 2016/12/07メディア: 単行本(ソフトカバー)この商品を含むブログ (3件) を見るCOI:ラボにあった。著…

PK戦での各試行に及ぼす影響をrstan でやってみる

PK 戦の順序が勝ちやすさに影響するか考えたかったけど、データを集めた時点で先攻が勝つ確率が50% だったので、いろいろな条件のもとでのPK の成功率を考えていた。 stan でやってみる。 PK は10人が蹴るまでに終わるとする(154試合1389回)。 各PK での成功…

PK戦の順序

こんな記事があった。簡単にいうと、PK戦は先攻有利と言われているから、先攻後攻をABABAB... とやるのではなく、途中で入れ子にしてABBAABBA... というような順序でやろう、という話である。 実際にPK戦が先攻有利かというと、先攻は6割くらい勝つらしい(PD…