« サーバー障害によりデータ消失 | メイン | IT失敗学の研究―30のプロジェクト破綻例に学ぶ »

BOOKLOGの本棚にある本のISBNを取得するRubyスクリプト

BOOKLOGの本棚にある本のISBNを取得するRubyスクリプト。

#!ruby -Ke
require 'open-uri'

#アカウント(本棚のURLが「http://booklog.jp/users/sample」なら「sample」)
ACCOUNT = 'sample'
#ページ数
PAGE = 2
#出力ファイル名
FILENAME = 'isbn.txt'

result = [] #重複を避けるための履歴
open(FILENAME, 'w') do |file|
  PAGE.times {|page|
    url = "http://booklog.jp/users/#{ACCOUNT}/spine/dm=&jm=&cate=&page=#{page}"
    open(url) {|f|
      html = f.read
      while token = html.slice(/\/asin\/(\w+)/, 1)
        if not result.include?(token)
          result << token
          file.puts token 
        end
        html = $'
      end
    }
  }
end

トラックバック

このエントリーのトラックバックURL:
http://www.gesource.jp/mt/mt-tb.cgi/154

コメントを投稿

(いままで、ここでコメントしたことがないときは、コメントを表示する前にこのブログのオーナーの承認が必要になることがあります。承認されるまではコメントは表示されません。そのときはしばらく待ってください。)

About

2006年09月30日 17:54に投稿されたエントリーのページです。

ひとつ前の投稿は「サーバー障害によりデータ消失」です。

次の投稿は「IT失敗学の研究―30のプロジェクト破綻例に学ぶ」です。

他にも多くのエントリーがあります。メインページアーカイブページも見てください。

Powered by
Movable Type 3.35