R

帰無仮説検定で有意になった項目についてROC 解析をしてください

と査読で言われた。 状況設定としてはこんな感じである。いま、とある検査項目 (連続量)について、予後を予測するマーカーになるか検討したい。ここで、デザインとしてはとりあえず研究を立ち上げてみました、というような後ろ向き観察研究で、予後転帰が…

FKが一番上手いのは誰? 「過去5年間の成功率」で見る“ベスト・フリーキッカー”TOP20

という記事を見かけた。 FKが一番上手いのは誰? 「過去5年間の成功率」で見る“ベスト・フリーキッカー”TOP20 現在、最もフリーキックが上手い選手は誰なのか……。イギリス誌『FourFourTwo』が、「2013−14シーズンからの5年間で最もフリーキックの成功率が高か…

Rでパスを省略せずに取得したい

R の場合、HOME ディレクトリは ~ で省略されるが、これを使って例えばR の外部のプログラムを実行させるときの引数にするとき、パスを省略せずに書かないといけない場合がある。 例えば、Python の os.path.expanduser みたいなやつ。 関数を探してもすぐに…

くぁwせdrftgyふじこlp を可視化する

ゆるキャン△で東山奈央がくぁwせdrftgyふじこlp を発音したのが話題になっていた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement…

(サッカー解説)2点差は危険なスコアですね ← ???

高校サッカーを見ていた。2017年度は前橋育英が初優勝で幕を閉じた。 どの試合だったか忘れてしまったが、2点差がついたときに解説が「2点差は危険」ということを言っていた。 調べてみると、やはりよく言われていることのようだが、実際にデータをとってみ…

system 関数を使ってR のコンソールからターミナルへコマンドを送って実行する

R を使っていろいろやっているときに、R だけで完結すればいいが、R で実行できない関数や実装されていない仕様みたいなものがあって、計算がはかどらないときがある。 そういうときは別のプログラムを使ってその部分の計算をして、その結果をファイルに書き…

ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 12話目と13話めとまとめ

12話 ラブライブ決勝に向けて決意を固めるメンバーたち。 ダイヤは自分のことはフルネームで呼んでいた。ルビィのかんばルビィx2 と感謝すルビィもカウントした。 13話 最終話にしてダイヤさんは千歌からダイヤちゃんと呼んでもらうことができました。 13話…

ケーキをなるべく均等に9等分したい

大掃除をしたあとクリスマスっぽい感じでケーキを食べようということになったのだが、9人いたのでケーキをどう切るか問題になった。 360度を40度ずつ切ればいいが、実際に40度でケーキを切るのは困難である。 単純に平行に切るのが楽でよい。 というわけで、…

Rule of Three: 僕のまわりではそんなことはない!

面白い話を教えてもらったので読んだ。 稀な事象の生起確率に関する統計的推測 Rule of Three とその周辺 ポアソン分布とRule of Three(統計学ワード) 上記の証拠(?)をもって「○○は存在しない!」と主張する人がときたまいるが、その人のまわりをN人探して…

oscillation (振動)を検定する

この記事は 今年読んだ一番好きな論文2017 Advent Calendar 2017 の2日目が空いているということにこの記事を書いてから気づいて、1000円相当の参加賞があることに目がくらんで加筆修正した記事です。2017年で一番好きかというとそうでm(ここで文章が途絶え…

ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 10話目と11話め

3年生が進路を考え、鞠莉もダイヤも果南もみんな沼津を出て海外進出する様子。 いままであまり名前を呼ばれていなかった鞠莉が人気になり、善子が孤立ノードとなった。 閉校祭をやってみんな仲良い感じ。 しかし、ダイヤさんはあいかわらず千歌からダイヤさ…

予後因子 prognostic と予測因子 predictive は何が違うのか

興味深い話を教えてもらったので読んだ。 Understanding Prognostic versus Predictive Biomarkers よく予後因子や予測因子となるバイオマーカーを探そう、という研究があるが、そもそも予後因子/予測因子とはなんぞや、という話。 現実世界においては、ある…

Python っぽい感じでうまくクラスの概念を使ってR を書きたい

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装作者: 斎藤康毅出版社/メーカー: オライリージャパン発売日: 2016/09/24メディア: 単行本(ソフトカバー)この商品を含むブログ (18件) を見る写経しながらR で書き換えつつやってみ…

ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 9話目

saint snow の姉妹の仲がギクシャクしたのでルビィら1年生組が函館に残ってsaint snow のために歌を作ったけど、結局千歌がセンターを奪った話。 ダイヤさんの姉みがやばい。DQN ネームじゃなかったら推しにできたのに… 果南ちゃんは誰も名前を呼ばず、また…

きららフェスタ2017 に出演していた声優たちの集客力をRstan で推定する

この記事は RStudio Advent Calendar 2017 - Qiita まんがタイムきらら Advent Calendar 2017 ごちうさ Advent Calendar 2017 Stan Advent Calendar 2017 - Qiita R Advent Calendar 2017 - Qiita の3日目の配当記事です。 声優統計第9号で、きららフェスタ2…

ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 8話目

ピギィ多すぎ。 ダイヤとルビィの姉妹丼とキマシタワー回。 ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 1話目と2話目 - 驚異のアニヲタ社会復帰への道 ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 3話目 - 驚異のアニヲタ社会復帰への道 …

数少ない事象の比較

こんなニュースを見かけた。 https://headlines.yahoo.co.jp/hl?a=20171122-00000523-san-hlth 亡くなられた方のご冥福をお祈りします。 統計的に差がなかったから無痛分娩は安全だとか、無痛分娩はしても大丈夫だとか、そういうことをいうつもりはまったく…

ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 7話目

ラブライブ出場が決まったのに、入学希望者数が100人に満たない。 そこで午前5時まで期限を延ばして動向を見守るが、98人でシステムが切り替わり、結局足りなかった。 千歌はラブライブ出場への意味も見失いつつあるが、生徒たちからも後押しされて、ラブラ…

logit の代わりにtanh を使ってはいけないのですか?

講義の最中にこんな質問があって、「logit は0-1 の範囲にあって、確率として扱いやすいから」という回答だったが、あとで スケールが変わっただけで本質的には同じということがアナウンスされていた。 logit は tanh は となり、これらの関係は となる。 と…

ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 6話目

新しいフォーメーションを試そうと、センターの千歌ががんばるが、それは過去に3年生組が失敗した因縁のフォーメーションだった。 フォーメーションに取り組む千歌の運命はッ… っていう感じで、千歌にたいしてエッジが多い。 梨子が堕天してリリィと呼ばれた…

ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 5話目

善子が犬を拾って、梨子に一時預かれないか頼むが、犬は迷い犬だったという話。 よしりこ(りこよし?)がキマシタワーな回になっている。 ダイヤさんは第4話でダイヤちゃんと呼んでほしいと言っておきながら、今回は出番の少なさもあいまって誰の名前も呼んでない…

ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 4話目

ダイヤさんとよそよそしく呼ばれるのが嫌なダイヤさんが、特に下級生たちと交流を深める話。 ダイヤさんのことを最も多く呼んでいたのは千歌。さすがの主人公。 曜はダイヤさんの妄想のなかでエコーがかかっていたのでこれで呼んだ回数が増えている。 ルビィ…

Mendelian randomization

読んだ。 Public Health. 2017 Apr;145:113-119. Nat Rev Rheumatol. 2016 Aug;12(8):486-96. Biosocial Surveys. Nat Rev Genet. 2013 Jul;14(7):483-95. Mendelian randomization は何かというと、経済学などの因果推論では操作変数法と呼ばれるものを統計…

R で変数をなんやかんやしたい

関数で定義されている変数を取り出したいという相談を受けた。 deparse でできるようだ。 deparse(plot) [1] "function (x, y, ...) " "UseMethod(\"plot\")" 逆に、テキストになっている変数を関数に使いたいとも聞かれた。 eval とparse の合わせ技ででき…

ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 3話目

ラブライブ予選に出場することと、学校説明会でライブをすることで入学希望者を増やそうと計画していたが、学校説明会がずれたことでラブライブ予選とダブルブッキングになってしまった。 みかん畑のみかん輸送機を使うことで、ラブライブからの学校説明会に…

とくべつけんきゅういん

某とくべつけんきゅういんの採用発表があった。 結果はお察しである。 不採択になった場合は、どれだけ評価が低かったかという数値と、応募者(応募領域内での)の順位が分かる。 このとき、評点は適当な変換がなされて、T スコアというスカラーが返ってくるが…

ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 1話目と2話目

ラブライブサンシャインの2期が始まった。 昔、名前の呼び合いグラフ(これとかこれ)をやったので、今回は放送リアルタイムに各話やっていこうと思う。 1話目は学校説明会を開こうとしたが、結局廃校騒ぎになってしまい、その裏で奮闘する鞠莉にスポットがあ…

awk を使ってターミナル上で必要な部分の列和を計算する

SNP とかなんでもいいのだが、行列データがあって、ある列のデータのうち条件をみたすものだけを抽出して、和を取りたい。 それをR とかPython を使わずに、シェルというかawk で完結したいのだが、という悩みを同僚が言ってきたのでやってみた。 一発でsum …

高次元データを次元削減したうえでクラスターを真面目に検出する

読んだ。 ClusterSignificance: a bioconductor package facilitating statistical analysis of class cluster separations in dimensionality reduced data Bioinformatics. 2017 Oct 1;33(19):3126-3128. オミックス解析などをすると複数パラメータの高次…

色見本

R の関数にcolors というものがあって、これで色の名前指定でデフォルトで入っている色を使える。 プロットしているときに単純にcol=番号指定だと1:8 で終わってしまうし、かと言っていい色ないかなと毎回悩むのでとりあえず灰色以外を一括してプロットして…