声優統計の統計 C90版 & Q&A

MikuHatsune2016-08-14

声優統計第八号は完売しました。
IF は自己引用していたのが自分だけだったので、0.67 と1 を切ってしまいました。しかし、アニメ動画の音声とキャスト情報を用いた声優認識 (PDF)に声による既婚声優の判別問題が引用されるという謎現象が発生したのがC89-C90 間でのトピックでした。

 
それでは編集者と読者からのコメントです。
c90 お疲れさまでしたエントリ - 声優統計より

Q: 「秋奈」は「ちゅな」じゃなくて「あきな」だよ殺すぞ (声優島打ち上げより、匿名希望さんから)
A:
完全に査読ミスです本当に申し訳ありませんお詫びに切腹します(しません)。


しりとり一覧並べてまぁとにかく絵面は強いなと思った反面「この中になにか問題があっても絶対に見つけられない…」と思った事を覚えています。
いや、それでも一通り見なければ、と斜め読みし、思った以上に知らない名前が出てくることに*1めげて諦めました。


でもよくよく思い出すと寝ぼけながらぼーっとこのページを見てた時に
あーすげー短い名前おる秋奈だ前の人の名前は…あーなるほどさちかぁなるほどなー」
と思った記憶があるので、やっぱり全面的に私が悪いですしにます。
本当に申し訳ありませんまじで。


一応執筆者には(このブログをもって)お伝えしておきますのできっと修正版がアップされるんじゃないかなぁちらっちらっ。


ちなみに:
この原稿でデータソースとされている.lainの「秋奈」のページを見てみると、一覧から「ち」の声優としてインデックスされてるけどページ中の読み仮名は「あきな」に直ってる。
このページの設計上の制約を感じるしスクレイピングスクリプトの不備を感じる。
おわり。

本誌では「表3: 女性声優 2252 人のうち 647 人で構成される最長しりとり。」の37行目に、國立幸→秋奈→仲谷明香となっており、声優「秋奈」が「ち→な」という有向エッジとなっている。しかし、「秋奈」は「あきな」であり、「ちゅな」ではない、という読者からの指摘である。
本来なら私もしっかりみるべきだったが、ぶっちゃけ4000人近い声優の読みを確認なんてできてないし、思った以上に知らない名前が出てくることは同様にめげていた。
で、秋奈さんのファンは憤慨しただろうし、なにより秋奈さん本人にも申し訳なかった。
ここで、「秋奈」に対するふたつの回答をこの場で行う。
 
1 「秋奈」の読みは「あきな」でもあり、「ちゅな」でもあった。
編集者が行っているように、.lain の秋奈のページ(http://lain.gr.jp/voicedb/profile/2805) では、た行にインデックスされているのにも関わらず、読みは「あきな」である。wiki (https://ja.wikipedia.org/wiki/%E7%A7%8B%E5%A5%88)でも「あきな」である。しかし、筆者がデータを収集した2016年6月27日の時点のhtml ファイルを確認すると、読みは「ちゅな」であった。
また、8月14日時点での所属事務所はスターダストプロモーションであるが、6月27日時点ではサンミュージックプロダクションに所属していたというように.lain のデータベース上はなっている。これは、wikiにも「2016年からはスターダストプロモーションに所属し活動を行っている」との記述があり、スターダストプロモーションのプロフィールページ(http://www.stardust.co.jp/profile/akina.html)があり、サンミュージックプロダクションもプロフィールページが残っている(http://sunmusic.org/profile/chuna.html)。
また、過去のツイッターアカウントらしいが、@chunchun_chuna というのがあった (現在は@Akina_1102 https://twitter.com/Akina_1102)
ぐぐってみると、声優グランプリWEB 声優未来予想図第25回 秋奈(ちゅな) さん (http://seigura.com/senior/future/20131120_181)が出てくるし、某巨大掲示板のスレが出てくるが、あまり踏み込まない方がよさそうな感じである。
だがしかし、読み方としては「ちゆな」もあってもよかった(過去はよくても現在はダメと言われたらアレだが)ようで、「ちゆな」は間違ってはいなかった、はず。
ちなみにはてなで自動に貼られるリンク上でも「ちゆな」読みは存在する。
秋奈は2012年頃から貧乏神が!ガールズ&パンツァーアイカツ! などに多数出演しているが、筆者のカバーしきれていないいわゆる新人声優枠なので、よく知らなかったのは申し訳ない。秋奈ファンのみなさんもそうだが、秋奈氏本人に対しても申し訳なかったことをお詫びしておく。
 
2 「ちゆな」のほうが最長しりとりを構築できる
今回、「秋奈」を「ちゆな」の読みでしりとりをしたため、本来(と言えるのかわらかないが)「あきな」でやった場合に、そちらがより長いしりとりを作ることができれば、原稿差し替えである。場合によっては回収!?!? いやそんなこと私の一存では決められないが、少なくとも、「ちゆな」を「あきな」で置き換えた場合のしりとりを確かめておく必要がある。
結論から言うと、「あきな」でしりとりをしたときに、女性の場合は646、男女混合では1643となった。本誌のように「ちゆな」でしりとりをしたときは女性647、全体1645だったので、怪我の功名…あぶないあぶない。
というわけで、「ちゆな」でしりとりをしたほうが、最長のしりとりができる。
 

図3 がコンパイルされていませんでした。申し訳ありませんでした。図3 は男女別の先頭文字→末尾文字のパターンであり、こちらに掲載しています。
グリモアはインストールするとソシャゲに時間を食われるので勘弁してください。
編集者がやってくれるかもしれません(丸投げ
 
逆に、辞書内の単語分布の均一性が使用単語率にどう影響するのかというようなことが調べられるんでしょうか。
 
推しの声優が出ていたらうれしいですが、推しの声優が出ていなければすみません。
 
統計のプロになりたい。
 

dat <- read.csv("C90.csv", stringsAsFactor=FALSE)
pub <- 84:90

impactfactor <- mapply(function(x) mean(dat[dat$publish < x, paste("C", x, sep="")]), pub)
names(impactfactor) <- colnames(dat)[grep("C", colnames(dat))]
impactfactor <- mapply(function(x) mean(dat[dat$publish < x, paste("C", x, sep="")]), pub)
names(impactfactor) <- colnames(dat)[grep("C", colnames(dat))]

plot(impactfactor, type="o", lwd=3, pch=15, xaxt="n", ylim=c(0, max(impactfactor)), xlab="Comic market", ylab="Impact Factor")
axis(1, at=seq(impactfactor), labels=names(impactfactor))
pos <- c(4, 1, 1, 3, 1, 3, 1)
text(seq(impactfactor), impactfactor, round(impactfactor, 3), pos=pos)
title	author	publish	C84	C85	C86	C87	C88	C89	C90
日本声優統計学会発足のご挨拶 -声優と科学の融合を目指して	@MagnesiumRibbon	83	0	0	0	1	1	1	0
Wikipediaの声優PVデータ特性とブレイク判定手法	@kkobayashi	83	2	0	1	0	1	0	0
キャスティング情報のbag-of-声優モデルを用いた音響監督推定問題	@MagnesiumRibbon	83	1	1	1	0	0	1	0
声優統計入門	@R_Linux	83	0	0	0	0	0	0	0
ブログを用いた女性声優の結婚時期予測問題	@y_benjo	83	0	0	0	1	0	1	0
アニメの内容及びキャスティングを用いないDVD売上予測問題	@y_benjo	83	1	0	1	0	0	0	0
序文 「日本声優統計学会に寄せて」	@toddler2009	84	0	0	0	0	0	0	0
トピックモデルを用いたニコニコ動画コメントデータの声優トピック流行推移解析	@Med_KU	84	0	0	0	1	0	0	0
声優活動における「元アイドル」の影響予測	@kkobayashi	84	0	0	0	0	1	0	0
声優ブログの「ご報告」エントリ自動検出システムの検討	@MagnesiumRibbon	84	0	0	0	1	0	0	0
続・声優統計入門 貧乳と巨乳の狭間で	@R_Linux	84	0	0	0	0	0	0	0
音声による既婚声優の判別問題	@y_benjo	84	0	1	0	0	1	1	1
Labeled LDAを用いた声優のニコニコ動画における特徴的コメントの抽出	@y_benjo	84	0	0	0	1	0	0	0
序文: 声優統計における言語情報と非言語情報 -- 『声優統計』第三号に寄せて --	@langstat	85	0	0	0	0	0	0	0
声優も「箱で推せ!」 -- 声優ファンにおける推し声優コミュニティの検出 --	@kkobayashi	85	0	0	0	0	0	0	0
ソーシャルな声優イベント参加履歴に基づく声優ファン行動の定量化分析	@MagnesiumRibbon	85	0	0	0	2	0	0	0
アニメ,声優,二次創作における百合ネットワークの考察	@Med_KU	85	0	0	0	0	0	0	0
複数の声優によるセリフの音響的類似性の考察:不愉快です	@Med_KU	85	0	0	0	0	0	0	0
続・続・声優統計入門 -- 初めてのテキストマイニング --	@R_Linux	85	0	0	0	0	0	0	0
今会いに行ける声優: ブログに登場する位置情報単語を用いた声優の出現位置予測	@y_benjo	85	0	0	1	1	0	0	0
声優の結婚時期予測2013: 2012年予測の精度,変化	@y_benjo	85	0	0	0	0	0	1	0
Twitterからみる声優ファンのネットワーク構造	@ysks3n	85	0	0	0	0	0	0	0
序文: 声優と統計とシンギュラリティ -- 声優統計の目指す未来 --	@MagnesiumRibbon	86	0	0	0	0	0	0	0
種田梨沙が出演すると百合アニメか?: Propensity score matching による検討	@Med_KU	86	0	0	0	0	0	0	1
声優ファンが今推したいアイドル	@kkobayashi	86	0	0	0	0	0	0	0
声優固有のアニメ顔は存在するか: Deep Learning を用いたアニメ画像キャスティング一致問題	@y_benjo	86	0	0	0	0	0	0	0
声優統計未解決問題	@y_benjo	86	0	0	0	0	1	0	0
田村ゆかりは永遠の 17 歳なのか? - CV から見た声年齢の推移 -	@harapon	87	0	0	0	0	0	0	0
現役女子高生声優とその周辺事情	@kkobayashi	87	0	0	0	0	0	0	0
晴れ声優もしくは雨声優に対する統計学的考察	@MagnesiumRibbon	87	0	0	0	0	0	0	1
Twitterの投稿時間分布から見る声優の生態	@Med_KU	87	0	0	0	0	0	0	0
パンツを求めて	@R_Linux	87	0	0	0	0	0	0	0
主役力 : キャストの表記順に着目したプレイヤーレーティング	@y_benjo	87	0	0	0	0	0	0	0
声優の食事内容の検討 - 外食声優を求めて -	@dichika	87	0	0	0	0	0	0	0
序文 : 人工声優は東京ドーム公演の夢を見るか?	@hitoshi_ni	88	0	0	0	0	0	0	0
イベント出演状況から予想するネクストブレイク声優	@kkobayashi	88	0	0	0	0	0	1	0
同一セリフからの声優と心情の同時推定問題 -- 声優統計標準ベンチマークの提案	@MagnesiumRibbon	88	0	0	0	0	0	0	0
ダメ絶対音感:レベル・ネオは早見沙織? 日笠陽子?	@Med_KU	88	0	0	0	0	0	0	0
青田買いの神話 : 青田買いを考慮した製品普及モデルにもとづく声優分析	@y_benjo	88	0	0	0	0	0	0	0
脇役識別問題	:-)	88	0	0	0	0	0	0	0
結婚したら声優は仕事が減るのか?	@Med_KU	89	0	0	0	0	0	0	0
日本声優統計学会 投稿&査読ガイド	@MagnesiumRibbon	89	0	0	0	0	0	0	0
「他界」の科学 : 限界効用逓減と代替財を考慮した声優イベント参加モデル	@y_benjo	89	0	0	0	0	0	0	0
Wikipediaとラジオでの楽曲選択に基づく黒沢ともよさんの音楽嗜好推定	@wakuteka	89	0	0	0	0	0	0	0
Bluemix × Watson × 声優	@kkobayashi	89	0	0	0	0	0	0	0
なれる!声優〜Deep Learning を利用した声質変換〜	@asteerism	90	0	0	0	0	0	0	0
声優しりとり	@Med_KU	90	0	0	0	0	0	0	0
複数声優歌唱楽曲における歌唱パート特定問題 ~声優統計的ハイレゾのススメ~	@MagnesiumRibbon	90	0	0	0	0	0	0	0
「他界」の科学 (2) : 個別の感染症モデルにもとづくイベント参加予測	@y_benjo	90	0	0	0	0	0	0	0
会いにいける賃貸住宅を求めて	@wakuteka	90	0	0	0	0	0	0	0