2013-05-01から1ヶ月間の記事一覧
ベン図を描いていたのだが、各要素がどこに所属するか、Rに入ってない(!?!?)。 というわけで無理矢理作った。 library(gplots) # venn の example から oneName <- function() paste(sample(LETTERS, 5, replace=TRUE), collapse="") geneNames <- replicate…
毎度おなじみのラブライブだが、新曲のセンターポジションをめぐって何回か総選挙をしている。 wikiから総選挙結果をパクって、未発表分のメンバーの順位予想や、次回以降の順位予想をしようと思ったけど何を元に予測すればいいかちょっと難しかったので、今…
ロジスティック回帰分析という解析があるが、聞いたことはあっても実はやったことがなかったのでやってみる。 ロジスティックの式は、昔もやったが、微分方程式 を解いて となる。 解析するときは、線形回帰として を解く。これなら直線でプロットできて、こ…
初音ミクの投稿数の時系列解析とバースト解析を組み合わせただけ。 前回は19943曲だったが、今回はVOCALONOBISというサイトから2013年5月22付で94334曲のIDを頂いたので、これでやってみる。 wgetの段階で94322曲になった。 直近1年間くらいでオワコン化が進…
データの観測を続けているとき、ある時刻から急にデータが増えることがある。これをバーストといい、この瞬間を検出する手法があるらしい。 Rではburstsパッケージでできる。 データは時系列の累積和になっていて、時刻と間(隣り合わなくてもよい)でのバース…
ニコニコ動画への投稿数を時系列解析する。 どんなときに投稿数が増減するか、またその予測をする。 事後(というか事前にもわかっていたけど)ボカロの誕生日に投稿数が跳ね上がっていた。 解析結果を見た先輩が 「この2年ほどで初音ミクの誕生日(8月31日)に…
LDAをやってみたわけだが、それなら初音ミクの歌の解析をしたいと思い そうしたら初音ミクの歌詞のデータベースがあるらしいのでそこから歌詞を抽出しようと思って そうしたら投稿日やP情報も取れることに気づいたので、時系列解析や共演関係などのネットワ…
RでやったらPythonでもやってみたくなる。 ここからパクった。 print で出す方法もあるみたいだがとりあえず progressbar モジュールを使ってみる。 from progressbar import * widgets = ["progress:", Percentage(), Bar()] maxval = 1000000 pbar = Progr…
Rでプログレスバーというのがあったので、やってみる。 OSがLinuxなので、 txtProgressBar を使ったが、tcltkを使うとGUIっぽいプログレスバーができるらしい。そのときは library(tcltk) tkProgressBar を使う。 n <- 10000 for(i in seq(n)){ pb <- txtPro…
マイクロアレイをやるのにgplotsパッケージのheatmap.2関数を使っていたのだが、デフォルトで使うと正方形のプロットになって、行と列の数が極端に異なるときに気持ち悪い。 というわけでアイマスデータベースimas1.txtを使ってやってみよう。 同じクラスタ…
LDAをいじってみたわけだが、これを使ってラブライブ(μ's)の歌を歌詞を解析してトピック分類してみる。 取得した歌詞33曲分を読み込んで、RMeCabで品詞分解する。 その後、LDAができるようにデータ加工する。 library(RMeCab) wd <- "/lovelive_song/" music…
Latent Dirichlet allocation(LDA)というなかなか面白そうなテキストマイニングを教えてもらったのでやってみる。 最近のラノベのトピックは異世界物が多い。というかここ数年は、ツンデレ、空から女の子が降ってくるハーレム物から、難聴系・鈍感主人公がハ…
マッチングという制度がある。いくつかの候補となるところを試験や面接を受けて採用候補者としてもらい(でも試験受けたけど候補リストに挙がらないとかあるの?)、こちらも採用してほしいところを順番に入力したら、あとはコンピューターが勝手に計算してくれ…
数学いらずの医科統計学PART2 CHAPTER6で、ポアソン分布に従う事象の話がある。 そこで、それぞれの事象は1回だけ数えられないといけないのだが、飛行機のニアミスがどの程度生じたか調べた研究では、お互いの飛行機の操縦士と副操縦士合わせて4人が各々報告…
初音ミク関数を使って遊んでいたのだが、ツインテールしか描けなかった原因は媒介変数の範囲のようだった。 をもっと広げるとそれっぽくなった。 いろいろいじっていると、の範囲でヘビサイド関数と符号関数が体の各パーツを作っているのではないかという指…
昔おっぱい関数というものを描いたのだが、初音ミク関数というものを教えてもらった。 WolframAlphaから数式を頂戴してやってみる。 SignとHeaviside Stepという関数が必要だそうなので用意しておく。 theta <- function(t) ifelse(t != 0, ifelse(t > 0, 1,…