Top / Programming / Python / Python Tips / 指定したURLのHTMLを文字列で取得する

指定したURLのHTMLを文字列で取得する

指定したURLのHTML、例えば、http://www.yahoo.co.jp/ のHTMLを文字列として取得する方法です。

urllib2 の urlopen を使用します。

import urllib2
fp = urllib2.urlopen(url)
html = fp.read()
fp.close()

http://www.yahoo.co.jp/ のHTMLを取得する場合は、

import urllib2
fp = urllib2.urlopen('http://www.yahoo.co.jp/')
html = fp.read()
fp.close()

とすると、変数 html に http://www.yahoo.co.jp/ のHTMLが入ります。

関連