R

アレルとgenotype の頻度を信頼区間付で求めたい

という質問を受けたので1万年と2000年ぶりくらいに遺伝統計やった。 雰囲気としては、こんな感じの値を求めたい。Indian J Endocrinol Metab. 2014 Nov-Dec; 18(6): 850–854. のTable 1 より引用www.ncbi.nlm.nih.gov ここで、データとしては被験者たちのgen…

東京大学での式辞の統計問題を考える

こんな話を見かけた。ちなみに式辞は読んでない。 qiita.comデータ取得まではやってくれていて、解析もしていた。解析者では、東京大学、鳥取大学、島根大学の医学部での男女合格率には差がない、ということだった。 せっかく81大学の男女受験者数と合格者数…

元号が発表されたのでいままでの元号で使われた漢字の関係をみる

とおもってネットワーク解析をしようと思ってグラフを作ったはいいがigraph の扱いを完全に忘れているので保留。 その元号の年数もあるので適当にヒストグラムでも。 n <- read.delim("nengo.txt", stringsAsFactors=FALSE, header=FALSE) library(stringr) …

フェンタニルの持続静注と部位効果濃度

フェンタニルの持続静注をすることで術後鎮痛を行うことがあるが、フェンタニルを低用量で開始するだけでは目標とする鎮痛濃度に達するにはものすごい時間がかかる。 例えば、身長160cm、体重50kg、年齢40歳の男性に20ug/hr でフェンタニルの持続静注をする…

googlevis をはてなブログにそのまま貼れる

前にこんな話をした。 mikuhatsune.hatenadiary.com 旧はてなダイアリーではhtml の扱いがよくわからなかったので、グラフ上の値を取得できるreactive なグラフはよくわからなかった。 はてなブログではhtml の扱いが強化されているっぽいので、googlevisやp…

googlevis でいろいろ触れるプロットを作る

この記事はR Advent Calendar 2018 の24日目の記事です。 R でプロットするときに、標準ではgraphics のなかにあるplot を使ってべたなプロットを作ると思うが、最近ではggplot なんかが流行っている。 最近、プロット上にマウスカーソルを持ってくるとデー…

第113回医師国家試験を項目反応理論で解析します(予告)、の予備実験

予備実験用の解答サンプルシートはこちら 第112回から適当に20問とってきたもの。 ↓ https://docs.google.com/forms/d/e/1FAIpQLSfiLVA-1m7NC5SMmyi0X1ftSYJzhWuOac6kr-WMR8gKgFLWVA/viewform shiny 上でその20問の項目反応理論(IRT) ↓ https://yfujii08.shi…

昔は3日間あった試験が今では2日間しかないのだから勉強量は2/3 でいいでしょう?

昔、とある試験を受けたのだが、最近では改定されて3日間あった日程が2日間に減っているらしい。 ならば昔の受験生がいままで一生懸命勉強に費やしていた期間は今の人達は2/3 でいいんじゃね?(適当 と後輩を煽っていたのだが、以前試験勉強に飽きたので今ま…

自然科学研究のためのR入門: 再現可能なレポート執筆実践 (Wanderful R)

読んだ。自然科学研究のためのR入門―再現可能なレポート執筆実践― (Wonderful R 4)作者: 江口哲史,石田基広,市川太祐,高橋康介,高柳慎一,福島真太朗,松浦健太郎出版社/メーカー: 共立出版発売日: 2018/10/11メディア: 単行本この商品を含むブログ (1件) を見…

ようやくShinyを使ってインタラクティブにパラメータをいじって遊べるシミュレーターをweb上にあげることができた

Shinyというhtml 上でいろいろパラメータをいじったものを即座に計算して描出するインタラクティブでなんかすごいアプリがあったのだが、rmarkdown と同様に手をつけることなく放置していた。 せっかちな人はこちら → https://yfujii08.shinyapps.io/pkpdsim…

gganatogram を使って人体を描く

こんなのを見かけた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter.com/w…

医薬データ解析のためのベイズ統計学

読んだ。医薬データ解析のためのベイズ統計学作者: Emmanuel Lesaffre,Andrew B. Lawson,宮岡悦良,遠藤輝,安藤英一,鎗田政男,中山高志出版社/メーカー: 共立出版発売日: 2016/02/25メディア: 単行本この商品を含むブログ (3件) を見るめっちゃ時間がかかって…

VARで本当にPKが多くなっているのか

ロシアW杯でVAR が導入されたことにより、PK の数が多いような印象である。実際、予選リーグの時点で過去最高だとか、いろいろ言われている。毎日新聞によると https://mainichi.jp/articles/20180703/ddm/035/050/161000c VARは、得点▽PK▽レッドカード…

W杯の試合観戦中にトイレはいついくべきか

こんなツイートを観測した。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter…

single cell の分化系統樹解析

読んだ。 A comparison of single-cell trajectory inference methods: towards more accurate and robust tools. single cell のRNAseq などからデータを取得して、細胞分化系統樹を解析するのに多種多様な手法やパッケージが出ている。 59手法を試してみて…

決勝トーナメントに向けて初戦が大事というが初戦はどれくらい大事なのか

2018FIFAワールドカップが始まった。日本の決勝トーナメント進出は初戦に勝利できるかにかかっている! とかなんとかよく聞くが、実際に初戦に勝利するのはどれだけ大事かは定量的に言われていない気がする。 2002年と2010年に決勝トーナメントに進出したので…

なぜ人は新刊を落とすのか

こんなツイートを見かけた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter…

行列演算だから速いだろうと油断してはいけない

回帰分析の最小二乗法による係数の推定は で求められる。ここで、標本数、パラメータ数 とすると である。 普通に演算すると、 に をかけて をかける、という順番だが、 として先に と をかけて としてから にかけるのが高速である。 20180607追記 スーパー…

ホーム&アウェー方式のアウェーゴールは妥当なのか

チャンピオンズリーグを見ていた。 CL というか本拠地があってホームでもアウェーでも試合を行うタイプのスポーツにあるのが、先に言ったホームとアウェーで戦い方というか試合に影響する部分が大きい、ということである。 サッカーは特にホーム&アウェーの…

ギブスサンプリング

Metropolis-Hastings サンプリングをやったので、ギブスサンプリングをやってみる。 ある変数 について、 番目を取り除いた を ( 番目が抜けている) で順次サンプリングして、その値を入れなおしてまたサンプリングする、を について行う。 結局、あるひと…

ものすごいわかりやすかったKullback-Leibler divergence

情報量を と置くと、 単調に減少する ふたつの分布が独立ならば、加算的に扱える というので、 と書いておく。 符号化してその平均長を考えると はエントロピーである。 さてここで、 はわからないけど、理論的にこれならば、上のエントロピーが成り立つ。し…

線形回帰の最小二乗法をベクトル偏微分で解く

の最小化を偏微分で求めるが、ベクトル演算とベクトル微分が「これは知ってて当然でしょ」という感じでさっくり飛ばされることが多いのでしつこいくらいにひとつずつやる。下準備 微分されるベクトル変数は, 係数のベクトルは とする。基本的に または とか…

DNA型が一致しないときに突然変異ということで一致判定できるか

こんな記事を見かけた。 http://www.yomiuri.co.jp/national/20180511-OYT1T50044.html 判例 平成29(あ)882 困惑している人が多い。 意外と知られていない知識「突然変異によるDNA型の変化はまれにある」裁判での逆転有罪の科学的根拠に驚きの声 - Togetter …

Rmd をコマンドでrender したい

rmarkdown を使っているとき、Rstudio ならknitr ボタン、コマンドならrender でRmd ファイルがコンパイルされる。 昔、同僚が「R を開かずにコマンドでrender したいすっね〜」って言っていたのでワンライナーで自作してあげたのだが、いまさらながら自分も…

ランダムウォークで乱数を生成する

機械学習のTA なのに機械学習素人なので機械学習と統計の講義を聞いている。 多次元な確率分布から乱数をいい感じに取ってくる方法に、ランダムウォークを使う。 多次元な確率分布としては、単純に2次元正規分布、とする。二次元の正規分布は、x1 とx2 のそ…

グラフの検定

グラフの相同性とか統計量とかの話で、cug.test という検定を後輩から教えてもらった。 sna パッケージでできる。 グラフ隣接行列からランダムな隣接行列を作りまくって分布を作成して、p値を計算するらしい。 グラフとしてはこんな感じで 検定は以下のよう…

遺伝統計学と疾患ゲノムデータ解析

書いた。 遺伝統計学と疾患ゲノムデータ解析 COI:著者謹呈。編集者とはズブズブの関係。 序文を引用すると、 学問の学びの最初の一歩は,背景となる基礎理論の丁寧な理解から始まる。第1章では,遺伝統計学の基礎理論について,日本を代表する専門家の先生方…

アンケート調査でN数はいくら必要なのか

こんな話を見かけた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter.com/w…

時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装

読んだ。時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装作者: 馬場真哉出版社/メーカー: プレアデス出版発売日: 2018/02/14メディア: 単行本この商品を含むブログ (3件) を見るCOI:自費で買った。 時系列分析とRstan を使った状態空間モデルの…

Grid Error Analysis

糖尿病の研究をしたいという知り合いから、Grid Error Analysis をしたいのだが、という相談を受けた。 ぶっちゃけ聞いたことがなかったが、要は糖尿病患者が自身で簡易血糖観測器を用いて測定した血糖と、本当の血糖の値が正しいかどうかを考えているだけ。…