2014-01-01から1年間の記事一覧

第28羽 声優統計第五号:Twitterの投稿時間分布から見る声優の生態

この記事はR Advent Calendar 2014の12月28日の配当記事(28日に申し込んだと思ったら27日で登録されているけど) かつ ごちうさ住民 Advent Calendar 2014の第28日目の記事です(勝手に継続しちゃう です。 声優統計第五号は完売しました。 window.twttr = (fu…

第26羽 ココア「チノちゃん、スリーサイズ教えて」チノ「嫌ですよ」

この記事はごちうさ住民 Advent Calendar 2014の第26日目の記事です(勝手に参加。 ひと目で尋常でない解析ネタだと見抜いたよ 「チノちゃん、スリーサイズ教えて」 「嫌ですよ」 (´・ω:;.:... データを愛した少女と解析に愛された少女 「というわけでお馴染…

TRISSを用いた外傷重症度スコア

TRISSという重症度スコアがある。 J Emerg Trauma Shock. 2011 Oct-Dec; 4(4): 446–449. Crit Care Med. 1981 Sep;9(9):672-6. J Trauma. 1987 Apr;27(4):370-8. 基本的には骨折などの人体ダメージ(AIS)と、血圧、意識レベル(GCS EVM)、呼吸数の生理的ダメー…

Twitterで声優のフォローリストを取得する

こちらを参考に一回200人の取得をAPIに引っかからないように取得する。フォローしている人(friends)もしくはフォローされている人(followers)で別個に取得できる。有名人ならたいていfollowersが万人規模になるので、取得するだけでくっそ時間がかかる。 # …

GF(仮)のキャラ画像からニーソかどうか判別する分類器をdeep learning で作ったわけだが

GF(仮)のキャラがニーソかどうか知りたかったわけだが、興味深いコメントをもらった。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElem…

GF(仮)のキャラがニーソなのかどうなのかを Deep learning を使ってなんとか知りたい

GF(仮)を見てる。 クロエ・ルメールのようなニーソキャラが好きなのだが、これをどうにかキャラプロフィールから推定できないか…と思っていたら MNIST手書き文字データをdeep learnignで分類するっていう、あの有名なやつを、Rパッケージであるh2oでやる、と…

アナフィラキシーショックの死亡原因

日本アレルギー学会のアナフィラキシーガイドラインを読んだ。 最近プロットしてなかったので、死亡原因をプロットした。 dat <- read.delim("clipboard") anaph <- dat[, -1] yl <- c(0, 40) par(mar=c(4.5, 4.5, 2, 5), cex.lab=1.6) matplot(dat$year, an…

病原体の感染力と死亡率

他の病原体と比較したエボラという図を見た。 x軸には一人の感染者が何人の新たな感染者を生むか、y軸には感染した場合の死亡率がプロットされている。 死亡率0〜10%の病原体は多く、この領域だけ対数軸になっているのだが、ここは変換してゴリ押しした。 感…

GERDに対してPPIを処方するけれども

ネキシウムというPPIがGERDの症状を改善するという話を聞いた。(Jpn. J. Med. Pharm. Sci. 68(3), 437-449, 2012.) こんな感じの図が出た。 GERDの人は1週間のうち4日は症状に悩まされているけれども、PPIを飲むと1日以下になるとか。 サンプルサイズが104人…

Twitterの投稿時間分布から考える声優のあれこれ

これとこれ(取り下げになってるけど)に触発されて次の声優統計ネタにしようと思ってやってみる。 Twitterの投稿時間分布が似ていれば、生活習慣が似ているだろうし、アフレコとかラジオとか仕事がちょっとはかぶっているだろうし、男と女の関係を邪推したり…

TwitterからTweetの取得

Twitterから声優のtweetをひたすら収集するプログラム。 昔やったときは直近200tweetしか取れない、と思っていたら、ID指定でそこからさかのぼれることが判明した。というわけでIDごとにループするようになっている。 連続で取得しすぎるとAPIで弾かれるらし…

声優Twitterのアカウント収集

声優さんのTwitterアカウント一覧.comのトップページを保存してhtmlテキストからアカウント名と声優名を取ってくるPythonスクリプト。 twitter_cv_list.txtというcsvファイルができる。 2014年10月15日現在で女性266人、男性122人取得した。 import re # inp…

自称、統計学をやっていますとドヤ顔するものなので

赤ちゃんに保湿剤を塗るとアトピー性皮膚炎が減るらしい。 赤ちゃんに毎日保湿剤 アトピー減 生後まもない赤ちゃんの皮膚に保湿剤を毎日塗ると、アトピー性皮膚炎になるリスクを30%減らすことができたとする研究成果を、国立成育医療研究センターのグループ…

いくみ B73 vs 千早 B72に関する考察 その2

バストサイズ解析をしようとして放置していたやつの続きをやる。 結果としていくみがAカップ、千早がAAカップとなった。ハナヤマタの面々も今期のアニメだからついでにプロットしてみるとこうなる。 一番ロリィなのはハナ。いくみと同じAカップ。 シグモイド…

いくみ B73 vs 千早 B72に関する考察

人生を見ている。 第11話でいくみのプロフィールが出ている。 150cm, 42kg, B73/W54/H77だそうだ。 これを見た某氏がこんなことを言っていた。 生徒会室のシーン。佐々木のぞみ 162cm 48kg 87/56/85 A型 靴24cm 特技 新体操 趣味 音楽鑑賞 座右の銘 努力は自…

光の早さでsentence2vec使ってみた。

sentence2vec 動かした - laughingのブログに触発されて、昔やったword2vecの拡張版っぽいやつのsentence2vecをやってみる。 最近メタアナリシスに忙しいので論文は全く読まずにライブラリを使ってやっちゃうダメなやつである。 コーパスはとある医療系テキ…

声優の誕生日のカレンダープロット

カレンダープロットなんてものを見てしまうと声優の誕生日でやってみたくなってしまう。 1月生まれが多そうな感じ。

sankey plotと声優の誕生日

sankey plotというものを見た。 RでもrCharts, googleVis, riverplotパッケージあたりでできるらしいがこれを知る前に2時間くらいかかって作った。 つなぐのはロジスティクス関数で曲線を補完する。 4つの県と6つの高校でやってみたらこんな感じ。 声優の誕…

C86 でなんやかんや出させていただきます

さすがにもう行かないよね…と思ったけど時間があったので自分から出しにいった声をかけていただいた(?)ので、興味のある方はぜひとも手にとって見てください。 声優統計 金曜日 東チ-21b 声優統計(Webカタログ)の第四号が内容公開となった。毎回昼過ぎには完…

1年生存率と5年生存率

各年代の年間死亡率を考えると、高齢者で死亡率が高くなるのは当たり前だが、5年生存率に換算すると悪性腫瘍とかそういう疾患を持ってて治療している場合と対して変わらないよね?という話を聞いた。 データをもらったのでプロットしてみる。 単調に増加する…

PDFファイルをいじる

こちらとこちらを参考に、pdftk というコマンドで色々できる。

薬剤感受性

薬剤感受性試験の結果を入手した。 本当は複数年あったので経時変化とかなんかそういうやつを解析したかったが、データの入力がそもそも1年分ですらぐちゃぐちゃなのに各年度でぐちゃぐちゃで整理するのも面倒だったので1年分だけやった。 ある菌にたいして…

生存解析のサンプルサイズ

こんな感じの生存曲線を見た。 元論文では対照のマウスにある処置をすると生存期間が伸びる、ということで、それぞれ20匹のマウスを使っていた。 library(survival) # 図から再現したらこんな感じ n1 <- n2 <- 20 clp1 <- rep(c(24, 30, 42, 48), c(7,9,1,3)…

ハナヤマタにはまりすぎて心がぱぁ〜とぱぁ〜とするんじゃあ^〜

ハナヤマタがヤバイハナヤマタ (1) (まんがタイムKRコミックス フォワードシリーズ)作者: 浜弓場双出版社/メーカー: 芳文社発売日: 2011/12/12メディア: コミック購入: 4人 クリック: 84回この商品を含むブログ (33件) を見る ハナヤマタ 1組目「シャル・ウ…

近未来の医療機器がすごい。キリト君GGO行ってる場合じゃないすぐに精査必要

SAO2期きた。あすなんとかさんは退場してまた新たなキリトハーレムの一員を探して、FPSオンラインゲームであるGGOへログイン!! するのだが… ニコニコ動画における最新話公式放送から引用させていただいた(ソードアート・オンラインII 第3話「鮮血の記憶」)。…

処方量のタイトレーションが

こんな感じのデータを見た。 基本的に痛み止めとして処方されている量から、急に痛みが出た時の頓服量(レスキュー)を知りたいわけだが、データがこんな感じなので予測ができず、タイトレーションは適宜やってみて決める、という話。 相関係数がなぜかspearma…

てさぐれ!!RStanもの

なんかよくわからんけどStanやってみた。導入はこちら。 分からないことはだいたいここにある。答えのあるモデルとして、があるとして、周期と誤差を推定する感じでやろう。 よく分からんけどdata, parameters, model 部分をそれなりに書く。 文末に ; を忘…

心電図

読んだ。判読ER心電図 1(基本編)―実際の症例で鍛える作者: A.マトゥー,W.ブラディ出版社/メーカー: 西村書店発売日: 2010/12/01メディア: 単行本この商品を含むブログを見る鑑別を全く覚えていないのでP147を写経する。広範なST上昇 広範な急性心筋梗塞 急性…

変行伝導

毎回聞いても訳わからんのでテキスト読んだ。心電図の読み方パーフェクトマニュアル―理論と波形パターンで徹底トレーニング!作者: 渡辺重行,山口巖出版社/メーカー: 羊土社発売日: 2006/02/23メディア: 単行本(ソフトカバー)購入: 5人 クリック: 26回この…

Bayesian meta-analysisによるPCIと内科的治療の検討

読んだ。 Circulation. 2013 Jun 4;127(22):2177-85. ベイズ推定を使って、PCI vs 内科的治療(medical therapy, MT)を比較したところ、PCIが非常にいい結果で、ガイドラインが推奨する通り… という話だが、実際のところ、比較試験として存在するのは、CABG v…