nkfバージョン2用pythonインターフェース NkfPython がすごく便利

nkfバージョン2用pythonインターフェース NkfPython がすごく便利。
Windows用のバイナリファイルも用意されているので、インストールもコピーするだけ。
とても簡単です。

Python 2.4からCJKCodecsが標準ライブラリに含まれるようになり、日本語が扱いやすくなりました。
ですが、CJKCodecsには文字コードの推測機能がありません。

そこで頼りになるのがnkfです。
nkfもいつの間にかバージョン2になって、utf-8にも対応していました。
ありがたいことです。

使い方も簡単。これからお世話になりそうです。

import nkf

# 文字コードのわからない文字をUTF-8に変換する
some_string = …
output = nkf.nkf('-w', some_string)

# 文字コードを推測する
some_string = …
input_code = nkf.guess(some_string)

追記
WindowsXP python2.6用NKF_pythonのDLLモジュールを作成しました。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください