2013-05-01から1ヶ月間の記事一覧

ベン図の要素

ベン図を描いていたのだが、各要素がどこに所属するか、Rに入ってない(!?!?)。 というわけで無理矢理作った。 library(gplots) # venn の example から oneName <- function() paste(sample(LETTERS, 5, replace=TRUE), collapse="") geneNames <- replicate…

ひとめで分かるラブライブ総選挙結果

毎度おなじみのラブライブだが、新曲のセンターポジションをめぐって何回か総選挙をしている。 wikiから総選挙結果をパクって、未発表分のメンバーの順位予想や、次回以降の順位予想をしようと思ったけど何を元に予測すればいいかちょっと難しかったので、今…

ロジスティック回帰分析

ロジスティック回帰分析という解析があるが、聞いたことはあっても実はやったことがなかったのでやってみる。 ロジスティックの式は、昔もやったが、微分方程式 を解いて となる。 解析するときは、線形回帰として を解く。これなら直線でプロットできて、こ…

初音ミクの投稿数をバースト解析

初音ミクの投稿数の時系列解析とバースト解析を組み合わせただけ。 前回は19943曲だったが、今回はVOCALONOBISというサイトから2013年5月22付で94334曲のIDを頂いたので、これでやってみる。 wgetの段階で94322曲になった。 直近1年間くらいでオワコン化が進…

バーストモデル

データの観測を続けているとき、ある時刻から急にデータが増えることがある。これをバーストといい、この瞬間を検出する手法があるらしい。 Rではburstsパッケージでできる。 データは時系列の累積和になっていて、時刻と間(隣り合わなくてもよい)でのバース…

ボカロ楽曲のニコニコ動画投稿数を時系列解析する

ニコニコ動画への投稿数を時系列解析する。 どんなときに投稿数が増減するか、またその予測をする。 事後(というか事前にもわかっていたけど)ボカロの誕生日に投稿数が跳ね上がっていた。 解析結果を見た先輩が 「この2年ほどで初音ミクの誕生日(8月31日)に…

初音ミク解析

LDAをやってみたわけだが、それなら初音ミクの歌の解析をしたいと思い そうしたら初音ミクの歌詞のデータベースがあるらしいのでそこから歌詞を抽出しようと思って そうしたら投稿日やP情報も取れることに気づいたので、時系列解析や共演関係などのネットワ…

Pythonでプログレスバー

RでやったらPythonでもやってみたくなる。 ここからパクった。 print で出す方法もあるみたいだがとりあえず progressbar モジュールを使ってみる。 from progressbar import * widgets = ["progress:", Percentage(), Bar()] maxval = 1000000 pbar = Progr…

Rでプログレスバー

Rでプログレスバーというのがあったので、やってみる。 OSがLinuxなので、 txtProgressBar を使ったが、tcltkを使うとGUIっぽいプログレスバーができるらしい。そのときは library(tcltk) tkProgressBar を使う。 n <- 10000 for(i in seq(n)){ pb <- txtPro…

デンドログラムをヒートマップのまわりに描き足す

マイクロアレイをやるのにgplotsパッケージのheatmap.2関数を使っていたのだが、デフォルトで使うと正方形のプロットになって、行と列の数が極端に異なるときに気持ち悪い。 というわけでアイマスデータベースimas1.txtを使ってやってみよう。 同じクラスタ…

トピックモデルを使ってラブライブの歌を解析する

LDAをいじってみたわけだが、これを使ってラブライブ(μ's)の歌を歌詞を解析してトピック分類してみる。 取得した歌詞33曲分を読み込んで、RMeCabで品詞分解する。 その後、LDAができるようにデータ加工する。 library(RMeCab) wd <- "/lovelive_song/" music…

トピックモデル

Latent Dirichlet allocation(LDA)というなかなか面白そうなテキストマイニングを教えてもらったのでやってみる。 最近のラノベのトピックは異世界物が多い。というかここ数年は、ツンデレ、空から女の子が降ってくるハーレム物から、難聴系・鈍感主人公がハ…

安定マッチング問題

マッチングという制度がある。いくつかの候補となるところを試験や面接を受けて採用候補者としてもらい(でも試験受けたけど候補リストに挙がらないとかあるの?)、こちらも採用してほしいところを順番に入力したら、あとはコンピューターが勝手に計算してくれ…

報告される回数が正確ではないポアソン過程的なもの

数学いらずの医科統計学PART2 CHAPTER6で、ポアソン分布に従う事象の話がある。 そこで、それぞれの事象は1回だけ数えられないといけないのだが、飛行機のニアミスがどの程度生じたか調べた研究では、お互いの飛行機の操縦士と副操縦士合わせて4人が各々報告…

初音ミク関数 その2

初音ミク関数を使って遊んでいたのだが、ツインテールしか描けなかった原因は媒介変数の範囲のようだった。 をもっと広げるとそれっぽくなった。 いろいろいじっていると、の範囲でヘビサイド関数と符号関数が体の各パーツを作っているのではないかという指…

初音ミク関数

昔おっぱい関数というものを描いたのだが、初音ミク関数というものを教えてもらった。 WolframAlphaから数式を頂戴してやってみる。 SignとHeaviside Stepという関数が必要だそうなので用意しておく。 theta <- function(t) ifelse(t != 0, ifelse(t > 0, 1,…