Rを使いこなす

アレルとgenotype の頻度を信頼区間付で求めたい

という質問を受けたので1万年と2000年ぶりくらいに遺伝統計やった。 雰囲気としては、こんな感じの値を求めたい。Indian J Endocrinol Metab. 2014 Nov-Dec; 18(6): 850–854. のTable 1 より引用www.ncbi.nlm.nih.gov ここで、データとしては被験者たちのgen…

多浪女性だけど医学部に合格したい

結論から言うと福岡大学(多浪を重視、OR=1.31)は多浪女性でも医学部合格しやすいかもしれない。ただし女性であることで合格しやすいかは有意差がない。 現役女性に限って言えば、女性で合格しやすいのは三重大学(OR=1.23)、弘前大学(OR=1.34)である。 …

東京大学での式辞の統計問題を考える

こんな話を見かけた。ちなみに式辞は読んでない。 qiita.comデータ取得まではやってくれていて、解析もしていた。解析者では、東京大学、鳥取大学、島根大学の医学部での男女合格率には差がない、ということだった。 せっかく81大学の男女受験者数と合格者数…

googlevis をはてなブログにそのまま貼れる

前にこんな話をした。 mikuhatsune.hatenadiary.com 旧はてなダイアリーではhtml の扱いがよくわからなかったので、グラフ上の値を取得できるreactive なグラフはよくわからなかった。 はてなブログではhtml の扱いが強化されているっぽいので、googlevisやp…

googlevis でいろいろ触れるプロットを作る

この記事はR Advent Calendar 2018 の24日目の記事です。 R でプロットするときに、標準ではgraphics のなかにあるplot を使ってべたなプロットを作ると思うが、最近ではggplot なんかが流行っている。 最近、プロット上にマウスカーソルを持ってくるとデー…

第113回医師国家試験を項目反応理論で解析します(予告)、の予備実験

予備実験用の解答サンプルシートはこちら 第112回から適当に20問とってきたもの。 ↓ https://docs.google.com/forms/d/e/1FAIpQLSfiLVA-1m7NC5SMmyi0X1ftSYJzhWuOac6kr-WMR8gKgFLWVA/viewform shiny 上でその20問の項目反応理論(IRT) ↓ https://yfujii08.shi…

自然科学研究のためのR入門: 再現可能なレポート執筆実践 (Wanderful R)

読んだ。自然科学研究のためのR入門―再現可能なレポート執筆実践― (Wonderful R 4)作者: 江口哲史,石田基広,市川太祐,高橋康介,高柳慎一,福島真太朗,松浦健太郎出版社/メーカー: 共立出版発売日: 2018/10/11メディア: 単行本この商品を含むブログ (1件) を見…

ようやくShinyを使ってインタラクティブにパラメータをいじって遊べるシミュレーターをweb上にあげることができた

Shinyというhtml 上でいろいろパラメータをいじったものを即座に計算して描出するインタラクティブでなんかすごいアプリがあったのだが、rmarkdown と同様に手をつけることなく放置していた。 せっかちな人はこちら → https://yfujii08.shinyapps.io/pkpdsim…

gganatogram を使って人体を描く

こんなのを見かけた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter.com/w…

W杯の試合観戦中にトイレはいついくべきか

こんなツイートを観測した。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter…

single cell の分化系統樹解析

読んだ。 A comparison of single-cell trajectory inference methods: towards more accurate and robust tools. single cell のRNAseq などからデータを取得して、細胞分化系統樹を解析するのに多種多様な手法やパッケージが出ている。 59手法を試してみて…

行列演算だから速いだろうと油断してはいけない

回帰分析の最小二乗法による係数の推定は で求められる。ここで、標本数、パラメータ数 とすると である。 普通に演算すると、 に をかけて をかける、という順番だが、 として先に と をかけて としてから にかけるのが高速である。 20180607追記 スーパー…

ギブスサンプリング

Metropolis-Hastings サンプリングをやったので、ギブスサンプリングをやってみる。 ある変数 について、 番目を取り除いた を ( 番目が抜けている) で順次サンプリングして、その値を入れなおしてまたサンプリングする、を について行う。 結局、あるひと…

Rmd をコマンドでrender したい

rmarkdown を使っているとき、Rstudio ならknitr ボタン、コマンドならrender でRmd ファイルがコンパイルされる。 昔、同僚が「R を開かずにコマンドでrender したいすっね〜」って言っていたのでワンライナーで自作してあげたのだが、いまさらながら自分も…

ランダムウォークで乱数を生成する

機械学習のTA なのに機械学習素人なので機械学習と統計の講義を聞いている。 多次元な確率分布から乱数をいい感じに取ってくる方法に、ランダムウォークを使う。 多次元な確率分布としては、単純に2次元正規分布、とする。二次元の正規分布は、x1 とx2 のそ…

グラフの検定

グラフの相同性とか統計量とかの話で、cug.test という検定を後輩から教えてもらった。 sna パッケージでできる。 グラフ隣接行列からランダムな隣接行列を作りまくって分布を作成して、p値を計算するらしい。 グラフとしてはこんな感じで 検定は以下のよう…

アンケート調査でN数はいくら必要なのか

こんな話を見かけた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter.com/w…

Grid Error Analysis

糖尿病の研究をしたいという知り合いから、Grid Error Analysis をしたいのだが、という相談を受けた。 ぶっちゃけ聞いたことがなかったが、要は糖尿病患者が自身で簡易血糖観測器を用いて測定した血糖と、本当の血糖の値が正しいかどうかを考えているだけ。…

FKが一番上手いのは誰? 「過去5年間の成功率」で見る“ベスト・フリーキッカー”TOP20

という記事を見かけた。 FKが一番上手いのは誰? 「過去5年間の成功率」で見る“ベスト・フリーキッカー”TOP20 現在、最もフリーキックが上手い選手は誰なのか……。イギリス誌『FourFourTwo』が、「2013−14シーズンからの5年間で最もフリーキックの成功率が高か…

Rでパスを省略せずに取得したい

R の場合、HOME ディレクトリは ~ で省略されるが、これを使って例えばR の外部のプログラムを実行させるときの引数にするとき、パスを省略せずに書かないといけない場合がある。 例えば、Python の os.path.expanduser みたいなやつ。 関数を探してもすぐに…

くぁwせdrftgyふじこlp を可視化する

ゆるキャン△で東山奈央がくぁwせdrftgyふじこlp を発音したのが話題になっていた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement…

system 関数を使ってR のコンソールからターミナルへコマンドを送って実行する

R を使っていろいろやっているときに、R だけで完結すればいいが、R で実行できない関数や実装されていない仕様みたいなものがあって、計算がはかどらないときがある。 そういうときは別のプログラムを使ってその部分の計算をして、その結果をファイルに書き…

ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 12話目と13話めとまとめ

12話 ラブライブ決勝に向けて決意を固めるメンバーたち。 ダイヤは自分のことはフルネームで呼んでいた。ルビィのかんばルビィx2 と感謝すルビィもカウントした。 13話 最終話にしてダイヤさんは千歌からダイヤちゃんと呼んでもらうことができました。 13話…

oscillation (振動)を検定する

この記事は 今年読んだ一番好きな論文2017 Advent Calendar 2017 の2日目が空いているということにこの記事を書いてから気づいて、1000円相当の参加賞があることに目がくらんで加筆修正した記事です。2017年で一番好きかというとそうでm(ここで文章が途絶え…

Python っぽい感じでうまくクラスの概念を使ってR を書きたい

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装作者: 斎藤康毅出版社/メーカー: オライリージャパン発売日: 2016/09/24メディア: 単行本(ソフトカバー)この商品を含むブログ (18件) を見る写経しながらR で書き換えつつやってみ…

ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 9話目

saint snow の姉妹の仲がギクシャクしたのでルビィら1年生組が函館に残ってsaint snow のために歌を作ったけど、結局千歌がセンターを奪った話。 ダイヤさんの姉みがやばい。DQN ネームじゃなかったら推しにできたのに… 果南ちゃんは誰も名前を呼ばず、また…

きららフェスタ2017 に出演していた声優たちの集客力をRstan で推定する

この記事は RStudio Advent Calendar 2017 - Qiita まんがタイムきらら Advent Calendar 2017 ごちうさ Advent Calendar 2017 Stan Advent Calendar 2017 - Qiita R Advent Calendar 2017 - Qiita の3日目の配当記事です。 声優統計第9号で、きららフェスタ2…

R で変数をなんやかんやしたい

関数で定義されている変数を取り出したいという相談を受けた。 deparse でできるようだ。 deparse(plot) [1] "function (x, y, ...) " "UseMethod(\"plot\")" 逆に、テキストになっている変数を関数に使いたいとも聞かれた。 eval とparse の合わせ技ででき…

高次元データを次元削減したうえでクラスターを真面目に検出する

読んだ。 ClusterSignificance: a bioconductor package facilitating statistical analysis of class cluster separations in dimensionality reduced data Bioinformatics. 2017 Oct 1;33(19):3126-3128. オミックス解析などをすると複数パラメータの高次…

色見本

R の関数にcolors というものがあって、これで色の名前指定でデフォルトで入っている色を使える。 プロットしているときに単純にcol=番号指定だと1:8 で終わってしまうし、かと言っていい色ないかなと毎回悩むのでとりあえず灰色以外を一括してプロットして…