2013-01-01から1年間の記事一覧

声優統計第三号 複数の声優によるセリフの音響的類似性の考察:不愉快です

この記事はR Advent Calendar 2013の12月29日の配当記事です。 境界の彼方というアニメで私の大好きな種田梨沙さんがメインヒロインである栗山未来を演じている。 作中で「不愉快です」というセリフが口癖らしく、いたるところで出てくるが、このセリフ、栗…

クリスマス声優監視2013 Twitter結果

毎年恒例のクリスマス声優監視が各所で行われているので、今年は便乗してみた。 声優さんのTwitterアカウント一覧.comと声優 - Twitterアカウント一覧をクローリングして声優のTwitterアカウントを取得し、夜のtweet回数をカウントした。 アカウントが存在し…

人口ピラミッド

人口ピラミッドの形を問う問題があったのでシミュレーションしてみる。 死亡率と出生率は適当なS字曲線に従い、死亡率の低下が先にきてから、出生率の低下が起こる。 出生率は全人口に対して何人生まれたかの‰ 死亡率は全人口に対して何人死んだかの‰だが、…

GRAph ALigner Algorithm (GRAAL) を真面目にやる

GRAALをもう一回真面目にやってみる(Cancer Inform, J R Soc Interface, Bioinformatics)。 アルゴリズムとしては、ふたつのネットワークとについて(のほうがノード数が少ない)、内のすべてのノードを、内のノードに完全に一対一対応させることを目的とする(…

ラブライブ!各話の百合ネットワークの動的変化

昔、pixivの出演共起から百合ネットワークを考えたのだが、今回はラブライブ!各話でのキャラ同士の会話回数をカウントして、百合ネットワークがどう変わっているかを見た。 アニメ全13話を視聴して、キャラ同士名前を呼び合っている回数をカウントするのだが…

30分で油絵

探偵ナイトスクープで昔、ボブ・ロスの指導を受けたいという依頼があったらしいが、それを見て大爆笑していたら それをペイントでやるという人がいたのでやってみる。 ね、簡単でしょう?(どうみても動画と違う)

Rの初心者向けコード(生物系)

R

これを見たらすぐさまRができす。 # # はコメントアウトといって、入力しても無視されます # たいてい # の後ろに説明が入ります # 適当なデータを定義する a1 <- c(1, 2, 4.3, 1.2, 5, 3.2) # とりあえずプロットする plot(a1) # x軸の値を定義する x <- c(…

Apply family を使ってみる

この記事はR Advent Calendar 2013の12月7日の配当記事です。 そこそこにRを使っていままでやってきたが、Rの特徴としてときたま挙げられるのがapply関数群だと思う。 一番よく使うのは apply だと思うが、初心者が慣れるのに難しい割にはそんなに解説テキス…

k-diagonal matrix

k-diagonal matrixというものがある。 正方行列の対角成分に値があれば diagonal matrixといい、その直上に値がある場合は superdiagonal, 直下なら subdiagonal という。 k番目がどうか…というので一般化すると k本の糸で構成されるネットワークになる。 ma…

プログレスバーを作る

プログレスバー(R, Python)で進捗状況をプロンプトに出せるわけだが、プログレスバーがあってもいいんじゃね?と思って描いてみる。 saveGIF関数でGIFのめくる時間間隔が指定できるはずなのに、GIF化したあとで実際その指定した時間通りにプログレスバーが進…

臨床試験での生存解析に必要なサンプル数と観察期間

臨床試験における生存解析では、参加登録した患者をランダムに2群に割り付け、新薬Xと旧薬Aをそれぞれの群に投与する。 新薬のMST(中央生存期間)は適当に17ヶ月、旧薬のMSTは10ヶ月。 カプランマイヤーの生存解析では、ハザード比がどの時刻においても新薬群…

A Complex Cause of Pleuritic Chest Pain

NEJM. 2012 Nov;367(18):1742-8. 肺塞栓から始まって精査したら潰瘍性大腸炎、原発性硬化性胆管炎、膜性腎症の合併があったという話。 UCとPSCはどちらもIgG4関連疾患の概念に入るらしく、これらが合併しやすいというのはよくある話。 ネフローゼの鑑別 原発…

GRAph ALigner Algorithm (GRAAL)

GRAph ALigner Algorithm (GRAAL) (wiki)という、ネットワーク同士の相同性(align)を計算してくれるアルゴリズムがある。 # graph 1 edgelist 1 3 1 4 1 6 4 6 5 6 # graph 2 edgelist 1 3 1 4 1 6 2 3 2 4 4 6 5 3 これらを gw format に変換する。 # ター…

An Intricate Interplay

NEJM. 2012 Oct 4;367(14):1342-7. ぐぐって見つけた日本語の解説。 バックナンバー

The Eyes Have It

NEJM. 2013 Jan 24;368(4):394. バックナンバー

ニコニコ動画のボーカロイド共演ネットワーク

VOCALOIDのタグを付けて投稿される動画は爆発的に増えている。 タグの共起を抽出してネットワークを描いた。初音ミクが中心にくることは予想に難くないので初音ミクのところを拡大した。 共演ネットワークはいわゆる複雑ネットワークになるだろうと思ったら…

Rで音声解析

またコミケでの声優統計ネタで声優の音声解析をやろうと思った。 昔Rで音声解析をやろうと思ってやったら.wavが読み込めなくて諦めていたが実は loadSample ではなく readWave もしくは readMP3 だとうまくいくことに気づいたのでやってみる。 ubuntuででき…

湿疹三角形

湿疹三角形というものがあるらしいので、有向グラフ描いた。 微妙なレイアウトはtkplotでがんばってtkplot.getcoordsすると座標が得られる。 "紅斑","丘疹" "紅斑","小水疱" "紅斑","落屑" "丘疹","落屑" "丘疹","小水疱" "小水疱","膿疱" "小水疱","湿潤" "…

初音ミクの流行解析をDTMで

昔、声優統計でDTMをしたのだが、その下準備に初音ミクでDTMをしようとしてしたはいいけど結果を書いてなかったので書く。 結果としてはよくわからんがこんな感じのトピックを抽出した。 Topic 6: 元気な歌? タ,意味,とか,かご,分かる,穴,気がつく,se,なんか…

Twitter解析

声優統計第三号がC85に当選となったのでネタとしてはTwitterを解析しようと思った。 ということでまずはデータ取り(タイムライン取得)をやる。 結論としてはRでやるよりPythonでやるほうがよかった。あとはAPIがバージョンが変わったとかなんとかでたくさん…

薬物依存

覚えていなくていつも間違えるからメモ。 依存の型 身体依存 精神依存 耐性 代表的な薬物 アルコール ++ +++ + モルヒネ +++ +++ +++ ヘロイン,コデイン バルビツール酸 +++ ++ ++ フェノバルビタール,睡眠薬 コカイン - +++ - 大麻 - ++ - マリファナ,ハシ…

Multiple imputation

欠損値をどうにかこうにか補おうということでimputationがある。 欠損データ分析には欠損値のメカニズムとして MCAR, MAR, MNAR を挙げている。リンクのサンプルデータとして、欠損値を含む変数, 解析上の変数, 別の変数, 欠損値かどうかの確率変数(欠損値な…

就職活動の結果

就職活動の結果が出たわけだが、やはり都市部では人が多く、東北日本海側で人手不足だった。 愛知で50%のフルマッチ、宮崎県ではフルマッチしたプログラムは0件だった。 前回の中間発表で熊本県が謎の人気だったが、今回もフルマッチ病院が多めだったようだ。…

Breathtaking Journey

NEJM. 2012 Aug 2;367(5):452-7. いろいろな感染症の潜伏期一覧 バックナンバー

機械学習の性能評価

機械学習の評価として、Recall, Precision, F値, Matthews correlation coefficient (MCC)があるので、Rでできる機械学習をひたすらやって性能評価をしてみる。 今回は交差検証は行わず、データセットの全てのデータでモデルを構築して、それを元のデータに…

虫食い算

面白い問題を教えてもらった。 虫食い算をRで総当りで解くらしい。 S E N D +) M O R E M O N E Y 行列構造を保って演算するようにがんばる。 f1 <- function(){ library(gtools) perm <- permutations(10, 8, v=0:9, set=TRUE, repeats.allowed=FALSE) # パ…

2変数プロット

bagplotというのを聞いた。aplpackパッケージでできるらしい。 library(aplpack) dat <- cbind(rnorm(100)+100, rnorm(100)+300) dat <- rbind(dat, c(105, 295)) plot(dat) bagplot(dat,factor=2.5,create.plot=TRUE,approx.limit=300, show.outlier=TRUE,s…

At a loss

NEJM. 2012 Jul 5;367(1):67-72. Gloves and Stocking 型の感覚鈍麻になる疾患 DANG THERAPIST D:DM A:alcohol N:nutrient G:GBS T:tumor H:hereditary CMT E:endcrine R:renal A:amyloidosis P:porphirin I:HIV, spiroheta, Lyme S:salcoidosis T:toxic バ…

ネットワークのコミュニティ

ネットワークのコミュニティ検出をやろうやろうと思って長らく放置していたのでやる。 重複がないコミュニティはigraph, 重複があるコミュニティはlinkcommでできるので、重複があるほうをする。 linkcomm クラスというのができるので扱いにくいかと思ったら…

サンプルサイズ

数学いらずの医科統計学PART7 CHAPTER43で、サンプルサイズについて書いてある。 パッケージならpwr、デフォルトならpower.*.test関数群でできる。 最近はやりのびっぐでーたなら、メモリに乗ってPCで解析できる分だけとにかく持っているデータを使えばいい…