2013-02-17から1日間の記事一覧

HTMLファイルからデータの抽出

データを取得したわけだが、ここから病院紹介文や給与などを抽出しよう。 まず、作業ディレクトリpmet2013を作り、そこにhtmlファイルがたくさんあるとする。 保存したファイルと病院名を取得する。 #ターミナル ls *html > hospital.txt HTMLファイルにはい…