2015-01-01から1年間の記事一覧

声優統計の統計 C89版

繰り返しになりますが声優統計第七号は完売しました。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "…

声優統計第七号:結婚したら声優は仕事が減るのか? 〜種田梨沙が結婚したら僕はもう…〜

この記事はR Advent Calendar 2015 の第29日目の記事です(勝手に参加 声優統計第七号でInterrupted time series analysis を使って、結婚と仕事の影響を調べた。 結論からすると、パラメータ的には仕事は減るが、半年で1本程度なのであまり気にしなくてよさ…

第27羽:ぴゅぴゅっと飛び射...出すか線路へポッピンジャンプか、それが問題だ

最終回が放送されたので昨日の予告通り、12月26日分のツイートを収集した。 最終回だけあって他の放送日よりツイート数は多かったようです。 1週間のツイート数の傾向は変化ありませんでした。12月24日分のツイートはmerge するのが面倒だったので欠損値っぽ…

第26羽:宝物は君の#gochiusa で呟いた瞬間

この記事はごちうさ住民 Advent Calendar 2015 の第26日目の記事です(2年連続の勝手に参加。 ネタと解析がなやましい これが私の最大限です 11月の始めころになんとなしにググっていたところ、上記のアドベントカレンダーが今年も行われることに気づいた。 …

塩基のIUPAC表記

塩基はACTG の4文字からなるが、C もしくはG のように代替パターンがあるときにS などの表記がIUPAC で決まっている。 seqinr パッケージの関数でできて、 C/G がS であることを確認するにはbma, S がC/G であることを確認するにはamb を使う。 amb(c("s")) …

最近のラノベアニメはランキング最下位の主人公が突発的に赤髪王女であるヒロインの着替えを覗いてしまってそれが原因で決闘に至り、ヒロインは強力な炎の能力の使い手で剣を操る学園最高峰の実力者だが勝負に勝ってしまいヒロインに惚れられてしまうチョロい展開の作品が多いのか?

学戦都市の英雄譚と落第騎士アスタリスクというアニメを見ている。 違った、学戦都市アスタリスクと落第騎士の英雄譚だったか… 各方面でこれらのアニメの展開が似ている、という話が出ている。 秋アニメ『学園都市アスタリスク』と『落第騎士の英雄譚』が1話…

岩波データサイエンスVol.1

人生で初めて著書を贈呈していただきました。岩波データサイエンス Vol.1作者: 岩波データサイエンス刊行委員会出版社/メーカー: 岩波書店発売日: 2015/10/08メディア: 単行本(ソフトカバー)この商品を含むブログ (10件) を見る レビュー書く。 COI:著者…

Interrupted time-series analysis

Interrupted time-series analysisという解析法をやろうと思ったのでやってみたメモ。 J Clin Pharm Ther. 2002 Aug;27(4):299-309.(PDF)を読めばいい。 データとしては、次の図のような日時と処方数のデータについて、とあるイベントが起きたときのそのイベ…

for を mapply で代用できるんじゃないかと思ってやってみたこと

解析プログラムを書いていて、逐次上から処理するようなことをやっていて、普通は計算結果を格納するオブジェクトを作っておいて、そこに計算結果を投げ込んでいけばそこそこに速い。 適当に、行列を作っておいて、行和をfor loop でゴリ押しすることを考え…

世界一わかりやすいワクチン講義(誇大広告)

炎上案件を見かけた。本当は祭りになっているときに早めに投下して鮮度を大事にしたかったけど、個人的用事で忙しいこととシミュレーションプログラムを作るのに時間がかかったこともあり、この記事の鮮度はもう0よッ… おそらく一般人が全然知らないワクチン…

医療費と心肺停止からの生存率の関係

医療費が低い都道府県では、心肺停止(CPA)してから生き残る確率が低いらしい。 BMJ Open 2015;5:e008374 著者の解説 という話を知り合いから仕入れたら、その知り合いは筆者と知り合いっぽいが、医療費と、心肺停止後から1ヶ月後に生存しているかの関係で下…

声優統計の統計

C88 で声優統計第六号が完売となりました。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://pl…

援助交際してそうなアニメキャラランキング2015をstanで考える

注意:本解析の結果と、実際に声優がそうであるかはまったく関係がありません。 援助交際してそうなアニメキャラランキング2015というものがある。某キャラはこの数年ぶっちぎりトップを走っている。 これを見た師匠が 「アニメの人気度とかそういうのも加味…

感染症の発生数をrstanで推定する

バシラスという菌が季節性(夏)に増えるという話を聞いた(Eur J Clin Microbiol Infect Dis. 2014 Aug;33(8):1371-9.) 論文の図からデータが取れるので、月別のバシラス発生数をrstanで推定する。 バシラスという菌はグラム陽性の桿菌で、臨床検体である血液…

グラム染色画像の処理

グラム染色をしている。 グラム染色をしたあとで顕微鏡で観察し、写真をとる。 適当に画像を分割して菌体が観察できている視野を水増ししてdeep learning の学習データ用になんとかする。 こんな感じの画像が撮れる。 これは大腸菌を分離してグラム染色した…

Caffeを使うときにハマったこと

Caffeがはやっている。 画像認識系のDeep learning をするときにいい。というのはこちらに書いてある。 環境は ubuntu 14.04 GPUはない!! インストールはこちらやこちらを参考にコピペするだけ。 ハマったことその1:CPUモード CaffeはGPUがないボンビーにつ…

週刊少年ジャンプの掲載順位データ

週刊少年ジャンプの掲載順位データという記事を見つけた。そこで、「早いペースで掲載順位が落ちていく漫画は打ち切られそう」という仮説があったので、どのくらいのペースで掲載順位が落ちると打ち切られるのかやってみる。 結果としては4週目以降から打ち…

ビンゴゲーム

ビンゴゲームに参加する機会があった。 早く上がって商品を頂いた記憶があまりないが、今回は商品をゲットできた。 ビンゴになる確率は厳密に計算できて、ググればいろいろ出てくる。参加人数を考えればどれくらい商品を用意すればいいかが最適化されるはず…

DAS28-CRP

関節リウマチの重症度のスコアリングにDAS28というスコアリングがある。関節リウマチという病気は関節が機能的、解剖学的に破壊されていく病気で、手指や肘などの小〜中関節が痛かったり腫れたりする。基本的にDASはそれらの関節が痛い/腫れるといった身体所…

早見沙織のフォルマント解析

駄目絶対音感の続き。 ボイスサンプルからひたすら母音だけ抽出してフォルマントが分離できるかがんばってみた話。 「はやみさおりです」と言っているスペクトログラム。「さ」と「す」がものすごい高周波数である。 「は」「や」「さ」の母音は/a/なので、…

ラブライブの新聞全国展開

ラブライブ劇場版の見開き広告が全国展開されて、各都道府県で違うらしい。 わかりやすくプロットしといた。 library(spsurvey) jpn_GA <- read.shape("JPN_adm/JPN_adm1.shp") # 日本全体の設定 xl <- c(129, 146) yl <- c(30.8, 45) dat <- read.delim("ne…

Bradley–Terry model

Bradley–Terry modelという、組み合わせ勝負の序列推定法が論文に使われている。 Nat Genet. 2015 May;47(5):458-68. 日本語解説 脳腫瘍はいわゆる普通の癌のような、TNM分類による悪性度 Grade X はなく、病理学的分類からWHO I 〜 IV というカテゴリになる…

Fisher's Least Significant Difference (LSD) test

Fisher's Least Significant Difference (LSD) testというpost hoc analysisを聞いた。 というのも、N群のデータでどれとどれに有意差があるか、ということを検定したいときに、単純に通りのt検定をすると多重検定補正が必要で云々、となるが、生物学や医学…

声優の主役力をRstanでやる

声優の主役力の推定をモデル化してRstanでやってみる話の導入。 声優統計第五号に、主役力 : キャストの表記順に着目したプレイヤーレーティング、という論文があるが、これはTrue skill というモデル(これとかこれとか)を用いている。1対1のペアを作るが、…

ちょっと使えるRの小ネタ

データを読み込むとき、ヘッダーの数行が実験のメタデータだったりすると、そのまま読み込むと列ラベルがひどいことになる。 そのようなときに skip 引数で readline する行数を指定できる。 また、N列目を指定することでその列を行の名前にできる。 # M 行…

腫瘍のサイズと年齢

シミュレーションの章。 腎臓癌の腫瘍サイズと腫瘍ができてからの年数をシミュレーションで求めようという話。元ネタはこちら。 元々は軍人だった人が腎臓癌とわかって、腎臓癌が軍にいる間にできたものであればいろいろ援助が受けられるけれども、いまの大…

サイコロ問題

推定の章 4, 6, 8, 12, 20面サイコロがひとつずつあって、どれを振ったかわからないが1回振って6が出たらしい。 このとき、N面サイコロが選ばれる確率を考える。 side <- c(4, 6, 8, 12, 20) n <- 6 p <- ifelse(side < n, 0, 1/side) ps <- post_p <- p/sum…

ThinkBayesで学ぶベイズ統計

ThinkBayesという本を見かけた。Think Bayes ―プログラマのためのベイズ統計入門作者: Allen B. Downey,黒川利明出版社/メーカー: オライリージャパン発売日: 2014/09/06メディア: 単行本(ソフトカバー)この商品を含むブログ (6件) を見る英語版ならここに…

声優の身長と男女

前回のデータを使って、何かして遊ぼうと思った。 せっかく男女のデータを取ってもらったので、これと身長のデータを合わせてROCでもやった。 結論としては164cmで感度、特異度ともに90%程度になる。 library(pROC) dat <- read.csv("cv_profile.txt", strin…

声優のプロフィール

心優しいお方が手助けしてくれました。 rvest で声優の男女データをスクレイピング #rstatsj - Qiita 持つべきものはプログラミング能力高い人だね!! 解析用に声優の年齢や所属事務所などのデータを取ろうと思った。 例によって.lainからデータをパクってく…