キャスティング情報のbag-of声優モデルを用いた音響監督推定問題

@MagnesiumRibbon
元ネタはこちら
一般にアニメ声優はオーディションで決まる(らしい)のだが、監督によっては「この声優使いたい(グヘヘ)」的な問題があるのではないかと。
結果的には平均49%の精度で分類問題が解け、音響監督と声優は強いつながりを持っているようだが相関関係があるものとないものの差があることが示唆された、らしい。
テキストマイニングBag-of-words モデルというものがあるらしい。これは勉強になった。
普通は文章中に単語が出てくるか否かをモデルにするのだが、これを文章をアニメ、単語を声優とし、アニメに声優が出るか否かをモデルとした。
SVMのような分類問題で、適合率、再現率、F値という指標があるようだ。勉強のために引用する
 
あるクラスXに分類することを考える。
真にXに属するデータの集合N、推定でXに分類されたデータの集合Cとする。
適合率とは、あるクラスXに分類されたデータのうち、真にXに属するもの:\frac{N\cap C}{N}
再現率とは、真にXに属するデータのうち、推定でXに分類されたもの:\frac{N\cap C}{C}
F値とは、適合率と再現率の調和平均:\frac{2N\cap C}{N+C}
完璧に分類される、つまりN\cap C=N=Cなら、F=1である。
キャスティングの傾向が掴みやすいF>0.6、傾向があるようなないような0.4\leq F\leq0.6、傾向がつかめないF\leq0.4で分類した。今回はキャスティングがあれば一律1としていること(主役と脇役が同等)、他のスタッフとの兼ね合いを見ていないので、今後の課題とするようだ。