2015-05-01から1ヶ月間の記事一覧

Fisher's Least Significant Difference (LSD) test

Fisher's Least Significant Difference (LSD) testというpost hoc analysisを聞いた。 というのも、N群のデータでどれとどれに有意差があるか、ということを検定したいときに、単純に通りのt検定をすると多重検定補正が必要で云々、となるが、生物学や医学…

声優の主役力をRstanでやる

声優の主役力の推定をモデル化してRstanでやってみる話の導入。 声優統計第五号に、主役力 : キャストの表記順に着目したプレイヤーレーティング、という論文があるが、これはTrue skill というモデル(これとかこれとか)を用いている。1対1のペアを作るが、…

ちょっと使えるRの小ネタ

データを読み込むとき、ヘッダーの数行が実験のメタデータだったりすると、そのまま読み込むと列ラベルがひどいことになる。 そのようなときに skip 引数で readline する行数を指定できる。 また、N列目を指定することでその列を行の名前にできる。 # M 行…

腫瘍のサイズと年齢

シミュレーションの章。 腎臓癌の腫瘍サイズと腫瘍ができてからの年数をシミュレーションで求めようという話。元ネタはこちら。 元々は軍人だった人が腎臓癌とわかって、腎臓癌が軍にいる間にできたものであればいろいろ援助が受けられるけれども、いまの大…

サイコロ問題

推定の章 4, 6, 8, 12, 20面サイコロがひとつずつあって、どれを振ったかわからないが1回振って6が出たらしい。 このとき、N面サイコロが選ばれる確率を考える。 side <- c(4, 6, 8, 12, 20) n <- 6 p <- ifelse(side < n, 0, 1/side) ps <- post_p <- p/sum…

ThinkBayesで学ぶベイズ統計

ThinkBayesという本を見かけた。Think Bayes ―プログラマのためのベイズ統計入門作者: Allen B. Downey,黒川利明出版社/メーカー: オライリージャパン発売日: 2014/09/06メディア: 単行本(ソフトカバー)この商品を含むブログ (6件) を見る英語版ならここに…

声優の身長と男女

前回のデータを使って、何かして遊ぼうと思った。 せっかく男女のデータを取ってもらったので、これと身長のデータを合わせてROCでもやった。 結論としては164cmで感度、特異度ともに90%程度になる。 library(pROC) dat <- read.csv("cv_profile.txt", strin…

声優のプロフィール

心優しいお方が手助けしてくれました。 rvest で声優の男女データをスクレイピング #rstatsj - Qiita 持つべきものはプログラミング能力高い人だね!! 解析用に声優の年齢や所属事務所などのデータを取ろうと思った。 例によって.lainからデータをパクってく…

Multiple alignment

Multiple alignment してほしいんだけど、と言われて系統樹まで作った話。 遺伝的距離や系統樹についてはこちらが詳しいし、塩基配列の変化パターンによる重み付けについては昔やった。 Multiple alignment はClustal がよく言われるが、ClustalW2を使ってみ…

ハロー!!きんいろ deep learning モザイク

注意:この記事は大好評放送中のハロー!!きんいろモザイクと最近話題のDeep learning をかぶせて話題沸騰!!にしたかったけれども、きんいろモザイクに出ている声優のサンプルボイス(東山奈央)が入手できず、DNNについても結局実装が間に合わずにrandom fores…

クールジャパン

アニメイトが全国出店したらしい。アニメイトが全都道府県に出店したらしいのでオタクショップあるない表を作りました。 pic.twitter.com/CIhgGBBB25— 酉越区郎 (@Torikoshi960) 2015, 4月 27ということでこのツイートを元に、全国のオタクショップの出店有…