100年分のアニメを使ったしりとり

MikuHatsune2016-10-12

100年分のアニメ作品リストをExcelデータで公開した - 本しゃぶり
というデータベースがあったので鮮度を大事にしりとりネタをパクる。
データをダウンロードしたらエクセルなので読みの部分だけ取り出してとりあえずUTF8 で保存しておく。また、メディアの部分も取っておく。
簡単にメディアがアニメ、かつ、読みがちゃんとあるものを抽出すると4439件に減った。その後、特殊文字を取り除いたり濁音は清音に変換したりしてゴニョゴニョしてから、単語集合から最長しりとりを得るプログラムに投げる。
 
結果としては利用単語数 1913, 単語利用率 43.10% のしりとりができた。

 
声優のときと比べると、アニメの先頭の文字はあかさたは行に多いがそれなりに散らばっていて、終わりの文字も「ん」が圧倒的(○○編というのが多い)だがそれなりに均等に散らばっているので、利用率が高かったようだ。