nkfバージョン2用pythonインターフェース NkfPython がすごく便利。
Windows用のバイナリファイルも用意されているので、インストールもコピーするだけ。
とても簡単です。
Python 2.4からCJKCodecsが標準ライブラリに含まれるようになり、日本語が扱いやすくなりました。
ですが、CJKCodecsには文字コードの推測機能がありません。
そこで頼りになるのがnkfです。
nkfもいつの間にかバージョン2になって、utf-8にも対応していました。
ありがたいことです。
使い方も簡単。これからお世話になりそうです。
import nkf
# 文字コードのわからない文字をUTF-8に変換する
some_string = …
output = nkf.nkf('-w', some_string)
# 文字コードを推測する
some_string = …
input_code = nkf.guess(some_string)