声優さんのTwitterアカウント一覧.comのトップページを保存してhtmlテキストからアカウント名と声優名を取ってくるPythonスクリプト。
twitter_cv_list.txtというcsvファイルができる。
2014年10月15日現在で女性266人、男性122人取得した。
import re # input w = open("声優さんのTwitter(ツイッター)アカウント一覧.com.html", "rU") r1 = re.compile('<a href="http://twitter.com/.*" target="_blank">.*</a><br>') # output w0 = open("twitter_cv_list.txt", "w") for tmp in w: line = r1.findall(tmp) if len(line) > 0: line1 = re.sub("#!/", "", line[0]) line2 = re.sub('<a href="http://twitter.com/', "", line1) line3 = re.sub('" target="_blank">', ",", re.sub('</a><br>', "", line2)) w0.write(line3 + "\n") w0.close()