2013-08-01から1ヶ月間の記事一覧

スクフェス予想の修正

スクフェスの楽曲属性予測をしていたわけだが、2勝2敗(これとこれとこれ)でしかも Listen to my heart!! の予想をし忘れていたということもあってやり直しておこう。ラブライブ! Webラジオ ラブライ部 ラジオ課外活動~にこりんぱな~テーマソングCDアーティス…

試験に合格するためにぎりぎりを目指すのもいいけどどれくらいがんばればいいかわからない人に

昔試験に合格するにはどれくらいがんばればいいかというのをやったわけだが、今回もそのネタ。 とある試験は500問で構成されているが、複数の合格基準がある。 細かいことは面倒なので省略するが、モデルの構築上必要なのが、 1:とあるセクションは100問で…

SVGを各種画像に変換

Rでよく svg で出力するのだが、これを png や tiff に変換したいことがあってどうしようかと思ってたら、コマンドでできるらしい。 Batikから batik-1.7.zip (20121112最新)のソースをダウンロードしてきて、ホームディレクトリかどっかにおいて解凍してお…

生物の名前がついた症状

swan neck RA 鷲手 ulnar クモ状指 Marfan 猿手 median 猿線 Down 正中神経麻痺 低位と高位:肘 主根管症候群 Phalen, Tinel, hand raising Colles(手掌) Smith(手背) フォーク状変形 高位麻痺 低位の症状に加え、前腕回内不可。祈祷手 尺骨神経麻痺 開放創 …

DTM解析

DTMを行うためにコメントを文章化して lexicalize し、データ加工する。 Rに移る。w コメントは異常に多いため、w が2つ以上並ぶものは w 1つに処理する。 1つの動画に付いているコメントをつなぎあわせて文章化する。コメント 1000 以上ある動画を対象にし…

データセットと声優動画の抽出

国立情報学研究所にあるニコニコデータセットをダウンロードする。JSON形式で圧縮されている約50GBの800万動画分コメントデータである。 圧縮されたファイルは解凍しないでそのまま処理することで、HDDが300GBなくても大丈夫なようにした。 ニコニコ大百科女…

結果

タグ解析 水樹奈々が多い。2010年以降は新人が増えたので各声優のタグ占有割合は減少している。 近年では豊崎愛生、花澤香菜の伸びがすごい。 トピック解析 原稿にあったトピックを簡単に掲載する。本文は第二号をチェック。 トピック 2:アイマスラジオ・中…

声優統計第二号 トピックモデルを用いたニコニコ動画コメントデータの声優トピック流行推移解析

結果 処理 DTM解析

47の心得シリーズをトピックモデルで分類する。

「本当に」医者に殺されない47の心得というシリーズ物があって、これをトピックモデルで解析する。 ざっと読んだ感じ、臨床検査と薬剤の使い方について言及しているものが多いので、こんな感じでトピックが抽出できたらいいと思う。 本当は30くらい溜まった…

またもやスクフェスの新曲属性予測が見事当たっていなかった件

スクフェスの楽曲属性予測を前にやっていて、7月1日のアップデートで追加されたススメ→トゥモロウとNo brand girlsが見事にそれぞれスマイル(S)とクール(C)だったからドヤァとか思っていたら、7月19日のアップデートで追加されたLove marginalの属性が実はスマ…

重回帰法の落とし穴

数学いらずの医科統計学PART7 CHAPTER38で、重回帰分析における過剰適合について説明している。 パラメータ取ったんならたくさん使って推定しようぜ!!というのはよくわかる気持ちだが、使い過ぎるとパラメタ間の相互作用とかなんかいろいろな都合でダメにな…