R

ものすごいわかりやすかったKullback-Leibler divergence

情報量を と置くと、 単調に減少する ふたつの分布が独立ならば、加算的に扱える というので、 と書いておく。 符号化してその平均長を考えると はエントロピーである。 さてここで、 はわからないけど、理論的にこれならば、上のエントロピーが成り立つ。し…

線形回帰の最小二乗法をベクトル偏微分で解く

の最小化を偏微分で求めるが、ベクトル演算とベクトル微分が「これは知ってて当然でしょ」という感じでさっくり飛ばされることが多いのでしつこいくらいにひとつずつやる。下準備 微分されるベクトル変数は, 係数のベクトルは とする。基本的に または とか…

DNA型が一致しないときに突然変異ということで一致判定できるか

こんな記事を見かけた。 http://www.yomiuri.co.jp/national/20180511-OYT1T50044.html 判例 平成29(あ)882 困惑している人が多い。 意外と知られていない知識「突然変異によるDNA型の変化はまれにある」裁判での逆転有罪の科学的根拠に驚きの声 - Togetter …

Rmd をコマンドでrender したい

rmarkdown を使っているとき、Rstudio ならknitr ボタン、コマンドならrender でRmd ファイルがコンパイルされる。 昔、同僚が「R を開かずにコマンドでrender したいすっね〜」って言っていたのでワンライナーで自作してあげたのだが、いまさらながら自分も…

ランダムウォークで乱数を生成する

機械学習のTA なのに機械学習素人なので機械学習と統計の講義を聞いている。 多次元な確率分布から乱数をいい感じに取ってくる方法に、ランダムウォークを使う。 多次元な確率分布としては、単純に2次元正規分布、とする。二次元の正規分布は、x1 とx2 のそ…

グラフの検定

グラフの相同性とか統計量とかの話で、cug.test という検定を後輩から教えてもらった。 sna パッケージでできる。 グラフ隣接行列からランダムな隣接行列を作りまくって分布を作成して、p値を計算するらしい。 グラフとしてはこんな感じで 検定は以下のよう…

遺伝統計学と疾患ゲノムデータ解析

書いた。 遺伝統計学と疾患ゲノムデータ解析 COI:著者謹呈。編集者とはズブズブの関係。 序文を引用すると、 学問の学びの最初の一歩は,背景となる基礎理論の丁寧な理解から始まる。第1章では,遺伝統計学の基礎理論について,日本を代表する専門家の先生方…

アンケート調査でN数はいくら必要なのか

こんな話を見かけた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter.com/w…

時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装

読んだ。時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装作者: 馬場真哉出版社/メーカー: プレアデス出版発売日: 2018/02/14メディア: 単行本この商品を含むブログ (3件) を見るCOI:自費で買った。 時系列分析とRstan を使った状態空間モデルの…

Grid Error Analysis

糖尿病の研究をしたいという知り合いから、Grid Error Analysis をしたいのだが、という相談を受けた。 ぶっちゃけ聞いたことがなかったが、要は糖尿病患者が自身で簡易血糖観測器を用いて測定した血糖と、本当の血糖の値が正しいかどうかを考えているだけ。…

帰無仮説検定で有意になった項目についてROC 解析をしてください

と査読で言われた。 状況設定としてはこんな感じである。いま、とある検査項目 (連続量)について、予後を予測するマーカーになるか検討したい。ここで、デザインとしてはとりあえず研究を立ち上げてみました、というような後ろ向き観察研究で、予後転帰が…

FKが一番上手いのは誰? 「過去5年間の成功率」で見る“ベスト・フリーキッカー”TOP20

という記事を見かけた。 FKが一番上手いのは誰? 「過去5年間の成功率」で見る“ベスト・フリーキッカー”TOP20 現在、最もフリーキックが上手い選手は誰なのか……。イギリス誌『FourFourTwo』が、「2013−14シーズンからの5年間で最もフリーキックの成功率が高か…

Rでパスを省略せずに取得したい

R の場合、HOME ディレクトリは ~ で省略されるが、これを使って例えばR の外部のプログラムを実行させるときの引数にするとき、パスを省略せずに書かないといけない場合がある。 例えば、Python の os.path.expanduser みたいなやつ。 関数を探してもすぐに…

くぁwせdrftgyふじこlp を可視化する

ゆるキャン△で東山奈央がくぁwせdrftgyふじこlp を発音したのが話題になっていた。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement…

(サッカー解説)2点差は危険なスコアですね ← ???

高校サッカーを見ていた。2017年度は前橋育英が初優勝で幕を閉じた。 どの試合だったか忘れてしまったが、2点差がついたときに解説が「2点差は危険」ということを言っていた。 調べてみると、やはりよく言われていることのようだが、実際にデータをとってみ…

system 関数を使ってR のコンソールからターミナルへコマンドを送って実行する

R を使っていろいろやっているときに、R だけで完結すればいいが、R で実行できない関数や実装されていない仕様みたいなものがあって、計算がはかどらないときがある。 そういうときは別のプログラムを使ってその部分の計算をして、その結果をファイルに書き…

ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 12話目と13話めとまとめ

12話 ラブライブ決勝に向けて決意を固めるメンバーたち。 ダイヤは自分のことはフルネームで呼んでいた。ルビィのかんばルビィx2 と感謝すルビィもカウントした。 13話 最終話にしてダイヤさんは千歌からダイヤちゃんと呼んでもらうことができました。 13話…

ケーキをなるべく均等に9等分したい

大掃除をしたあとクリスマスっぽい感じでケーキを食べようということになったのだが、9人いたのでケーキをどう切るか問題になった。 360度を40度ずつ切ればいいが、実際に40度でケーキを切るのは困難である。 単純に平行に切るのが楽でよい。 というわけで、…

Rule of Three: 僕のまわりではそんなことはない!

面白い話を教えてもらったので読んだ。 稀な事象の生起確率に関する統計的推測 Rule of Three とその周辺 ポアソン分布とRule of Three(統計学ワード) 上記の証拠(?)をもって「○○は存在しない!」と主張する人がときたまいるが、その人のまわりをN人探して…

oscillation (振動)を検定する

この記事は 今年読んだ一番好きな論文2017 Advent Calendar 2017 の2日目が空いているということにこの記事を書いてから気づいて、1000円相当の参加賞があることに目がくらんで加筆修正した記事です。2017年で一番好きかというとそうでm(ここで文章が途絶え…

ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 10話目と11話め

3年生が進路を考え、鞠莉もダイヤも果南もみんな沼津を出て海外進出する様子。 いままであまり名前を呼ばれていなかった鞠莉が人気になり、善子が孤立ノードとなった。 閉校祭をやってみんな仲良い感じ。 しかし、ダイヤさんはあいかわらず千歌からダイヤさ…

予後因子 prognostic と予測因子 predictive は何が違うのか

興味深い話を教えてもらったので読んだ。 Understanding Prognostic versus Predictive Biomarkers よく予後因子や予測因子となるバイオマーカーを探そう、という研究があるが、そもそも予後因子/予測因子とはなんぞや、という話。 現実世界においては、ある…

Python っぽい感じでうまくクラスの概念を使ってR を書きたい

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装作者: 斎藤康毅出版社/メーカー: オライリージャパン発売日: 2016/09/24メディア: 単行本(ソフトカバー)この商品を含むブログ (18件) を見る写経しながらR で書き換えつつやってみ…

ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 9話目

saint snow の姉妹の仲がギクシャクしたのでルビィら1年生組が函館に残ってsaint snow のために歌を作ったけど、結局千歌がセンターを奪った話。 ダイヤさんの姉みがやばい。DQN ネームじゃなかったら推しにできたのに… 果南ちゃんは誰も名前を呼ばず、また…

きららフェスタ2017 に出演していた声優たちの集客力をRstan で推定する

この記事は RStudio Advent Calendar 2017 - Qiita まんがタイムきらら Advent Calendar 2017 ごちうさ Advent Calendar 2017 Stan Advent Calendar 2017 - Qiita R Advent Calendar 2017 - Qiita の3日目の配当記事です。 声優統計第9号で、きららフェスタ2…

ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 8話目

ピギィ多すぎ。 ダイヤとルビィの姉妹丼とキマシタワー回。 ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 1話目と2話目 - 驚異のアニヲタ社会復帰への道 ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 3話目 - 驚異のアニヲタ社会復帰への道 …

数少ない事象の比較

こんなニュースを見かけた。 https://headlines.yahoo.co.jp/hl?a=20171122-00000523-san-hlth 亡くなられた方のご冥福をお祈りします。 統計的に差がなかったから無痛分娩は安全だとか、無痛分娩はしても大丈夫だとか、そういうことをいうつもりはまったく…

ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 7話目

ラブライブ出場が決まったのに、入学希望者数が100人に満たない。 そこで午前5時まで期限を延ばして動向を見守るが、98人でシステムが切り替わり、結局足りなかった。 千歌はラブライブ出場への意味も見失いつつあるが、生徒たちからも後押しされて、ラブラ…

logit の代わりにtanh を使ってはいけないのですか?

講義の最中にこんな質問があって、「logit は0-1 の範囲にあって、確率として扱いやすいから」という回答だったが、あとで スケールが変わっただけで本質的には同じということがアナウンスされていた。 logit は tanh は となり、これらの関係は となる。 と…

ラブライブ!サンシャイン!! の名前呼び合いグラフをかく 6話目

新しいフォーメーションを試そうと、センターの千歌ががんばるが、それは過去に3年生組が失敗した因縁のフォーメーションだった。 フォーメーションに取り組む千歌の運命はッ… っていう感じで、千歌にたいしてエッジが多い。 梨子が堕天してリリィと呼ばれた…