2014-01-01から1ヶ月間の記事一覧

海の人間と陸の人間の遺伝学

凪のあすからで、「海と陸の人間との間に生まれた子供は海中では生きていけない」という設定があるのだが、海の人間であるみおりと、陸の人間である至のこどもである美海が、急に海の中で息ができるようになったので遺伝学的に考察する。 家系図の作成にはki…

データ

声優出演情報と売上情報を取ってくる。 # 声優出演情報の取得 # R x <- seq(1, 5030) id <- paste(sapply(mapply(rep, 0, 4-nchar(x)), paste, collapse=""), x, sep="") http <- paste("http://lain.gr.jp/mediadb/media/", id, sep="") write.table(http, …

ぼくのかんがえた さいきょうの せいゆう キャスティング

声優統計第一号で、アニメの内容及びキャスティングを用いないDVD売上予測問題というのをやっていたのだが、円盤売上と声優出演データが取れたらやってみたいと思っていたところ、声優さん共演関係など解析という記事を見つけたのでやってみる。 声優統計第…

RefSeqのNM ID

RefSeqのmRNA IDであるNM_nnnnnがどの遺伝子に対応しているのかいまいちわからなかったのでゴリ押しした。 NCBIからデータベースをnucleotideにして、 "Mus musculus"[Organism] AND NM_000000[PACC] : NM_999999[PACC] と検索すれば、マウスのNM IDのものを…

試験問題が多いと大変ですね()

試験問題が多いと受験そのものが大変だということをよく言われるが、実際のところ合格するには問題数が多いほうがいいよね、という話を友人がしていた。 統計学的には、問題数が増えると、受験者が持つ真の正答率に近づくので、勉強をしっかりしている人にと…

Pythonの入力自動補完

UbuntuでPythonを使っていてイラッ☆とくるのが、Rみたいにタブキーで入力補完ができないということ。 だとしたらこれ、絶対解決に乗り出している人がいると思ったらいた(1, 2)のでやってみる。 Ubutuなら /etc/python.xxx/ に sitecustomize.py というスクリ…

挑戦回数による合格率の変化

とある試験は受験回数の制限はないが、受験回数が増えるごとに合格率が低下していくことが指摘されている。 というわけでデータを入手してプロットしてみた。 # データ # 受験回数, 受験者数, 合格者数のデータフレーム trial,candidate,passed 1,7742,7205 …

アイマス, ラブライブ, WUG, GFのキャラ分析

ガールフレンド(仮)、ラブライブ!、シンデレラガールズ、Wake Up, Girls!のキャラ分析をやったのだが、ごく一部の熱心なファンから、これら全体で見たときにアニメ間で類似性や違いがあったりするのか、という質問を受けたのでやってみる。 その前に、月白陽…

ガールフレンド(仮)のプロフィールデータ

ミス・モノクロームのプロフィールが欠損状態の生データ ID,name,grade,club,type,birthday,X,blood,height,weight,B,W,H,hobby,like,dislike 41,新垣雛菜,2,帰宅部,SWEET,12月13日,いて座,O,155,47,79,55,80,前髪をきれいに切る、ヘアアレンジ,とろろこんぶ…

ガールフレンド(仮)のキャラ分析

というわけで、ミス・モノクロームの欠損値を補ったので、毎度おなじみの主成分分析をやる(ラブライブ!, シンデレラガールズ, Wake Up, Girls!)。 画像はガールフレンド(仮)速報のトップページを保存したらjpgが取ってこれるので、001から始まるjpgファイル…

ミス・モノクロームのプロフィール推定

主成分分析に持ち込みたいが、欠損値があると計算できないので、ミス・モノクロームの欠損値を他のガールフレンドたちのデータから推定する。 昔の双葉杏みたいに、とりあえず身長と年齢から推定してみて、スリーサイズが揃ったらもう一回してみる、なんてこ…

データ取り

ガールフレンド(仮)速報では、女の子たちのプロフィールと顔写真がまとまっている。ここからhtmlを取得してプロフィールデータをパースするという流れて、wgetを使おうと思ったらjavascriptが云々言われたので、デスクトップ自動化でゴリ押しする。 ubuntu O…

(^q^)「くおえうえーーーるえうおおおwwwwwwwwwwwwwwwwwwwww」

(^q^)「くおえうえーーーるえうおおおwwwwwwwwwwwwwwwwwwwww」 にはまりすぎてやばいのだが、例によってガールフレンド(仮)に登場する女の子たちを解析する。 さて、解析しようと思ってざっとデータを眺めると、大好きな堀江由衣がやっ…

substituteで数式のプロット

プロット上に数式を書きたいと思ったら、expressionが使えるが、loop回したり複雑な式を書きたいと思ったらsubstituteが使える。 例にあるやつを全部やって、そのあと複雑に式を並べたやつをごっそりやってみる。 テキストを用意したらparseしてsubstituteに…

マイクロアレイのネットワーク解析

マイクロアレイのネットワーク解析で weighted correlation network analysis というのがあって、WGCNAでできるというのを聞いた(BMC Bioinformatics 2008, 9:559)。 Pathway Studio 論文のアブストからテキストマイニングで遺伝子シグナリングネットワーク…

Wake Up, Girls!のキャラ分析

昔、ラブライブキャラの主成分分析をやって、アニメ初見者のためにキャラを分類してみたのだが、Wake Up, Girls!もラブライブ的な匂いがするのでキャラを覚えるついでにやってみる。 本当は体重推定問題をやりたかったのだが、3サイズが既にあったのでやめた…