2017-01-01から1ヶ月間の記事一覧

機械学習プロフェッショナルシリーズを何冊か読んだ

読んだ。関係データ学習 (機械学習プロフェッショナルシリーズ)作者: 石黒勝彦,林浩平出版社/メーカー: 講談社発売日: 2016/12/07メディア: 単行本(ソフトカバー)この商品を含むブログ (1件) を見るラボにあった。 関係データということでテンソル分解みた…

性なる夜に

こんなツイートがあった。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter.c…

指数分布族

変数, パラメータ があるとき、 と表すことができる場合は、指数分布族という。ここで、exp やlog で無理やりカッコ内に指数法則を使って変換してやれば、各々の式は同じことを意味している。 ここで、 :十分統計量 sufficient statistics :natural parame…

Bias-Variance decomposition

機械学習などで予測モデルを立てたときに絶対に突っ込まれるのが「それ他のデータセットでも言えんの?」ということで、モデルの性能を評価しないといけない。一般的には手持ちのデータからモデルを作って、それとは別のデータに対してそのモデルが有用かとい…

data.frame のplot とmatrix のpairs

オブジェクトがdata.frame のとき、plot をすると2変数ずつ取ってきてplot してくれる。 plot(iris, col=iris$Species) これは各パラメータの関係をとりあえず把握するのによかった。 ただ、オブジェクトが行列のときに、data.frame に戻さないといけなくて …

p値はawful

ここで紹介されているこの例をやってみた。 状況としてはこんな図と実験がある。 ある腫瘍細胞に薬#1 と#2 を単独もしくは両者ともにふりかける実験をする。#1 のみもしくは#2 のみふりかけた実験では対照と有意差はなく、#1#2 と同時にふりかけた場合は有意…

ボウリングの得点

ボウリングをした。珍しくストライクが2回連続で出たので、スコアは137点だった。 ボウリングの得点分布はどうなっているのか気になったが、実際のゲームから得点分布を描くといろいろググって出てくる。 適当にピンを倒すとき、どうなるかをシミュレーショ…