2014-01-01から1年間の記事一覧

リボライブ!

スクフェスで課金してURカード66枚をすべてコンプリートするのに140万円かかったという話。課金しまくることをリボライブ!というらしい。 https://twitter.com/yamato_s0816/statuses/442476514005618689 先行研究としてはガチャとは心の所作を見てほしい。 …

今回の国試では,国立大学の受験生が苦戦している様子が分かります。

リスクゾーンという言葉を目にした。一般用語ではないけれども、試験で落ちそうなボーダーのところにいる人のことを指している。 証拠保全に魚拓取った。 今回の国試では,国立大学の受験生が苦戦している様子が分かります。と書かれているのだが、苦戦して…

細胞カウント

細胞を使った実験をしていると、溶液中にどれくらいの細胞があるかを数えなければならないことがある。それで、プレパラートみたいなものの上に10μlくらい細胞の入った溶液を乗っけて、顕微鏡観察下でバードウォッチングの如くカチャカチャ数を数える。 プレ…

EBImageからいくつか関数が消えた

EBImageといえばこれだったが、図に文字を描けるdrawtextが使えなくなっていたのでヒートマップにゴリ押しした結果がこちら。 library(EBImage) # システムファイルからサンプルデータを読み出す。 nuc <- readImage(system.file("images", "nuclei.tif", pa…

沖縄だけ絶妙に例外的に描く

spsurveyで日本地図を描くのだが、沖縄だけ遠いから絶妙に日本海側に描く方法をゴリ押しした。 library(spsurvey) jpn_GA <- read.shape("JPN_adm/JPN_adm1.shp") # 日本全体の設定 xl <- c(129, 146) yl <- c(30.8, 45) cols <- bluered(100) lmat <- matri…

wordcloud

文章がいくつかあってなんか面白いことできないかと聞かれたのでwordcloudはどうですかと言ったものはいいが、やったことがなかったのでやってみる。 wordcloudでできる。 library(wordcloud) library(tm) data(SOTU) corp <- SOTU corp <- tm_map(corp, rem…

プロットのときの日本語フォント問題

昔、Mac OSXのRで日本語をプロットしたいという話で、.Rprofileをいじくってどうこうやったが、こんな面倒なことできれば避けたいし、共用PCなどでそういった設定をいじるのが難しげなときに、コマンドでできるらしい。 png("test.png") par(family="HiraMar…

立体棒グラフ

クロス集計などで行列を作ったとき、「エクセルみたいに棒グラフ並べたやつ作ってよ」と頼まれたので探したらepadeパッケージでできるようだ。 persp関数と違って視野をうまくまわせないっぽいので引数のxwとzwをなんとかいじくってごり押しする。また、ラベ…

viSNEによる次元削減とプロット

viSNEという、FCMデータのような高次元データを低次元に削減する手法を知ったのでやってみる。 Nat Biotechnol. 2013 Jun;31(6):545-52. キモとしては、t-SNEと呼ばれる次元削減法で、多次元データの中でとが似る確率と、次元削減データの中でとが似る確率を…

二次元キャラの分化(成長)を多次元データ解析法で真面目にやってみる

SPADEが使いやすくなったので、二次元キャラのプロフィールデータを多次元データとみなして、年齢とプロフィールがどう変わっていくのかをながめた。 グラフレイアウトが前回と変わっているが、左上がロリで右下が年を取っていっている感じ。年齢の作用が強…

SPADEを使いやすくする

SPADEを昔やったけど、免疫システムの多次元データ解析という総説があって、「FCSの高次元データ、とりあえずSPADE使ってみなよ」的なことが書いてあったのだが、BioconductorのSPADEはFCSデータ専用感が満載なので、行列データが生で存在していても使えるよ…

海の人間と陸の人間の遺伝学

凪のあすからで、「海と陸の人間との間に生まれた子供は海中では生きていけない」という設定があるのだが、海の人間であるみおりと、陸の人間である至のこどもである美海が、急に海の中で息ができるようになったので遺伝学的に考察する。 家系図の作成にはki…

データ

声優出演情報と売上情報を取ってくる。 # 声優出演情報の取得 # R x <- seq(1, 5030) id <- paste(sapply(mapply(rep, 0, 4-nchar(x)), paste, collapse=""), x, sep="") http <- paste("http://lain.gr.jp/mediadb/media/", id, sep="") write.table(http, …

ぼくのかんがえた さいきょうの せいゆう キャスティング

声優統計第一号で、アニメの内容及びキャスティングを用いないDVD売上予測問題というのをやっていたのだが、円盤売上と声優出演データが取れたらやってみたいと思っていたところ、声優さん共演関係など解析という記事を見つけたのでやってみる。 声優統計第…

RefSeqのNM ID

RefSeqのmRNA IDであるNM_nnnnnがどの遺伝子に対応しているのかいまいちわからなかったのでゴリ押しした。 NCBIからデータベースをnucleotideにして、 "Mus musculus"[Organism] AND NM_000000[PACC] : NM_999999[PACC] と検索すれば、マウスのNM IDのものを…

試験問題が多いと大変ですね()

試験問題が多いと受験そのものが大変だということをよく言われるが、実際のところ合格するには問題数が多いほうがいいよね、という話を友人がしていた。 統計学的には、問題数が増えると、受験者が持つ真の正答率に近づくので、勉強をしっかりしている人にと…

Pythonの入力自動補完

UbuntuでPythonを使っていてイラッ☆とくるのが、Rみたいにタブキーで入力補完ができないということ。 だとしたらこれ、絶対解決に乗り出している人がいると思ったらいた(1, 2)のでやってみる。 Ubutuなら /etc/python.xxx/ に sitecustomize.py というスクリ…

挑戦回数による合格率の変化

とある試験は受験回数の制限はないが、受験回数が増えるごとに合格率が低下していくことが指摘されている。 というわけでデータを入手してプロットしてみた。 # データ # 受験回数, 受験者数, 合格者数のデータフレーム trial,candidate,passed 1,7742,7205 …

アイマス, ラブライブ, WUG, GFのキャラ分析

ガールフレンド(仮)、ラブライブ!、シンデレラガールズ、Wake Up, Girls!のキャラ分析をやったのだが、ごく一部の熱心なファンから、これら全体で見たときにアニメ間で類似性や違いがあったりするのか、という質問を受けたのでやってみる。 その前に、月白陽…

ガールフレンド(仮)のプロフィールデータ

ミス・モノクロームのプロフィールが欠損状態の生データ ID,name,grade,club,type,birthday,X,blood,height,weight,B,W,H,hobby,like,dislike 41,新垣雛菜,2,帰宅部,SWEET,12月13日,いて座,O,155,47,79,55,80,前髪をきれいに切る、ヘアアレンジ,とろろこんぶ…

ガールフレンド(仮)のキャラ分析

というわけで、ミス・モノクロームの欠損値を補ったので、毎度おなじみの主成分分析をやる(ラブライブ!, シンデレラガールズ, Wake Up, Girls!)。 画像はガールフレンド(仮)速報のトップページを保存したらjpgが取ってこれるので、001から始まるjpgファイル…

ミス・モノクロームのプロフィール推定

主成分分析に持ち込みたいが、欠損値があると計算できないので、ミス・モノクロームの欠損値を他のガールフレンドたちのデータから推定する。 昔の双葉杏みたいに、とりあえず身長と年齢から推定してみて、スリーサイズが揃ったらもう一回してみる、なんてこ…

データ取り

ガールフレンド(仮)速報では、女の子たちのプロフィールと顔写真がまとまっている。ここからhtmlを取得してプロフィールデータをパースするという流れて、wgetを使おうと思ったらjavascriptが云々言われたので、デスクトップ自動化でゴリ押しする。 ubuntu O…

(^q^)「くおえうえーーーるえうおおおwwwwwwwwwwwwwwwwwwwww」

(^q^)「くおえうえーーーるえうおおおwwwwwwwwwwwwwwwwwwwww」 にはまりすぎてやばいのだが、例によってガールフレンド(仮)に登場する女の子たちを解析する。 さて、解析しようと思ってざっとデータを眺めると、大好きな堀江由衣がやっ…

substituteで数式のプロット

プロット上に数式を書きたいと思ったら、expressionが使えるが、loop回したり複雑な式を書きたいと思ったらsubstituteが使える。 例にあるやつを全部やって、そのあと複雑に式を並べたやつをごっそりやってみる。 テキストを用意したらparseしてsubstituteに…

マイクロアレイのネットワーク解析

マイクロアレイのネットワーク解析で weighted correlation network analysis というのがあって、WGCNAでできるというのを聞いた(BMC Bioinformatics 2008, 9:559)。 Pathway Studio 論文のアブストからテキストマイニングで遺伝子シグナリングネットワーク…

Wake Up, Girls!のキャラ分析

昔、ラブライブキャラの主成分分析をやって、アニメ初見者のためにキャラを分類してみたのだが、Wake Up, Girls!もラブライブ的な匂いがするのでキャラを覚えるついでにやってみる。 本当は体重推定問題をやりたかったのだが、3サイズが既にあったのでやめた…