2015-01-01から1年間の記事一覧
繰り返しになりますが声優統計第七号は完売しました。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "…
この記事はR Advent Calendar 2015 の第29日目の記事です(勝手に参加 声優統計第七号でInterrupted time series analysis を使って、結婚と仕事の影響を調べた。 結論からすると、パラメータ的には仕事は減るが、半年で1本程度なのであまり気にしなくてよさ…
最終回が放送されたので昨日の予告通り、12月26日分のツイートを収集した。 最終回だけあって他の放送日よりツイート数は多かったようです。 1週間のツイート数の傾向は変化ありませんでした。12月24日分のツイートはmerge するのが面倒だったので欠損値っぽ…
この記事はごちうさ住民 Advent Calendar 2015 の第26日目の記事です(2年連続の勝手に参加。 ネタと解析がなやましい これが私の最大限です 11月の始めころになんとなしにググっていたところ、上記のアドベントカレンダーが今年も行われることに気づいた。 …
塩基はACTG の4文字からなるが、C もしくはG のように代替パターンがあるときにS などの表記がIUPAC で決まっている。 seqinr パッケージの関数でできて、 C/G がS であることを確認するにはbma, S がC/G であることを確認するにはamb を使う。 amb(c("s")) …
学戦都市の英雄譚と落第騎士アスタリスクというアニメを見ている。 違った、学戦都市アスタリスクと落第騎士の英雄譚だったか… 各方面でこれらのアニメの展開が似ている、という話が出ている。 秋アニメ『学園都市アスタリスク』と『落第騎士の英雄譚』が1話…
人生で初めて著書を贈呈していただきました。岩波データサイエンス Vol.1作者: 岩波データサイエンス刊行委員会出版社/メーカー: 岩波書店発売日: 2015/10/08メディア: 単行本(ソフトカバー)この商品を含むブログ (10件) を見る レビュー書く。 COI:著者…
Interrupted time-series analysisという解析法をやろうと思ったのでやってみたメモ。 J Clin Pharm Ther. 2002 Aug;27(4):299-309.(PDF)を読めばいい。 データとしては、次の図のような日時と処方数のデータについて、とあるイベントが起きたときのそのイベ…
解析プログラムを書いていて、逐次上から処理するようなことをやっていて、普通は計算結果を格納するオブジェクトを作っておいて、そこに計算結果を投げ込んでいけばそこそこに速い。 適当に、行列を作っておいて、行和をfor loop でゴリ押しすることを考え…
炎上案件を見かけた。本当は祭りになっているときに早めに投下して鮮度を大事にしたかったけど、個人的用事で忙しいこととシミュレーションプログラムを作るのに時間がかかったこともあり、この記事の鮮度はもう0よッ… おそらく一般人が全然知らないワクチン…
医療費が低い都道府県では、心肺停止(CPA)してから生き残る確率が低いらしい。 BMJ Open 2015;5:e008374 著者の解説 という話を知り合いから仕入れたら、その知り合いは筆者と知り合いっぽいが、医療費と、心肺停止後から1ヶ月後に生存しているかの関係で下…
C88 で声優統計第六号が完売となりました。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://pl…
注意:本解析の結果と、実際に声優がそうであるかはまったく関係がありません。 援助交際してそうなアニメキャラランキング2015というものがある。某キャラはこの数年ぶっちぎりトップを走っている。 これを見た師匠が 「アニメの人気度とかそういうのも加味…
バシラスという菌が季節性(夏)に増えるという話を聞いた(Eur J Clin Microbiol Infect Dis. 2014 Aug;33(8):1371-9.) 論文の図からデータが取れるので、月別のバシラス発生数をrstanで推定する。 バシラスという菌はグラム陽性の桿菌で、臨床検体である血液…
グラム染色をしている。 グラム染色をしたあとで顕微鏡で観察し、写真をとる。 適当に画像を分割して菌体が観察できている視野を水増ししてdeep learning の学習データ用になんとかする。 こんな感じの画像が撮れる。 これは大腸菌を分離してグラム染色した…
Caffeがはやっている。 画像認識系のDeep learning をするときにいい。というのはこちらに書いてある。 環境は ubuntu 14.04 GPUはない!! インストールはこちらやこちらを参考にコピペするだけ。 ハマったことその1:CPUモード CaffeはGPUがないボンビーにつ…
週刊少年ジャンプの掲載順位データという記事を見つけた。そこで、「早いペースで掲載順位が落ちていく漫画は打ち切られそう」という仮説があったので、どのくらいのペースで掲載順位が落ちると打ち切られるのかやってみる。 結果としては4週目以降から打ち…
ビンゴゲームに参加する機会があった。 早く上がって商品を頂いた記憶があまりないが、今回は商品をゲットできた。 ビンゴになる確率は厳密に計算できて、ググればいろいろ出てくる。参加人数を考えればどれくらい商品を用意すればいいかが最適化されるはず…
関節リウマチの重症度のスコアリングにDAS28というスコアリングがある。関節リウマチという病気は関節が機能的、解剖学的に破壊されていく病気で、手指や肘などの小〜中関節が痛かったり腫れたりする。基本的にDASはそれらの関節が痛い/腫れるといった身体所…
駄目絶対音感の続き。 ボイスサンプルからひたすら母音だけ抽出してフォルマントが分離できるかがんばってみた話。 「はやみさおりです」と言っているスペクトログラム。「さ」と「す」がものすごい高周波数である。 「は」「や」「さ」の母音は/a/なので、…
ラブライブ劇場版の見開き広告が全国展開されて、各都道府県で違うらしい。 わかりやすくプロットしといた。 library(spsurvey) jpn_GA <- read.shape("JPN_adm/JPN_adm1.shp") # 日本全体の設定 xl <- c(129, 146) yl <- c(30.8, 45) dat <- read.delim("ne…
Bradley–Terry modelという、組み合わせ勝負の序列推定法が論文に使われている。 Nat Genet. 2015 May;47(5):458-68. 日本語解説 脳腫瘍はいわゆる普通の癌のような、TNM分類による悪性度 Grade X はなく、病理学的分類からWHO I 〜 IV というカテゴリになる…
Fisher's Least Significant Difference (LSD) testというpost hoc analysisを聞いた。 というのも、N群のデータでどれとどれに有意差があるか、ということを検定したいときに、単純に通りのt検定をすると多重検定補正が必要で云々、となるが、生物学や医学…
声優の主役力の推定をモデル化してRstanでやってみる話の導入。 声優統計第五号に、主役力 : キャストの表記順に着目したプレイヤーレーティング、という論文があるが、これはTrue skill というモデル(これとかこれとか)を用いている。1対1のペアを作るが、…
データを読み込むとき、ヘッダーの数行が実験のメタデータだったりすると、そのまま読み込むと列ラベルがひどいことになる。 そのようなときに skip 引数で readline する行数を指定できる。 また、N列目を指定することでその列を行の名前にできる。 # M 行…
シミュレーションの章。 腎臓癌の腫瘍サイズと腫瘍ができてからの年数をシミュレーションで求めようという話。元ネタはこちら。 元々は軍人だった人が腎臓癌とわかって、腎臓癌が軍にいる間にできたものであればいろいろ援助が受けられるけれども、いまの大…
推定の章 4, 6, 8, 12, 20面サイコロがひとつずつあって、どれを振ったかわからないが1回振って6が出たらしい。 このとき、N面サイコロが選ばれる確率を考える。 side <- c(4, 6, 8, 12, 20) n <- 6 p <- ifelse(side < n, 0, 1/side) ps <- post_p <- p/sum…
ThinkBayesという本を見かけた。Think Bayes ―プログラマのためのベイズ統計入門作者: Allen B. Downey,黒川利明出版社/メーカー: オライリージャパン発売日: 2014/09/06メディア: 単行本(ソフトカバー)この商品を含むブログ (6件) を見る英語版ならここに…
前回のデータを使って、何かして遊ぼうと思った。 せっかく男女のデータを取ってもらったので、これと身長のデータを合わせてROCでもやった。 結論としては164cmで感度、特異度ともに90%程度になる。 library(pROC) dat <- read.csv("cv_profile.txt", strin…
心優しいお方が手助けしてくれました。 rvest で声優の男女データをスクレイピング #rstatsj - Qiita 持つべきものはプログラミング能力高い人だね!! 解析用に声優の年齢や所属事務所などのデータを取ろうと思った。 例によって.lainからデータをパクってく…