PythonでJanomeを使って形態素解析した結果をファイルに保存する

PythonでJanomeを使って形態素解析した結果をファイルに保存する方法です。

PythonでJanomeを使って形態素解析」のコメント欄で質問をもらったので、書いておきます。

実行環境は

$ python3 --version
Python 3.5.2

ソースコードです。

from janome.tokenizer import Tokenizer

tokenizer = Tokenizer()
with open("token.txt", "w") as fp:
    for token in tokenizer.tokenize("すもももももももものうち"):
        fp.write(str(token))
        fp.write("\n")

実行結果

すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も   助詞,係助詞,*,*,*,*,も,モ,モ
もも  名詞,一般,*,*,*,*,もも,モモ,モモ
も   助詞,係助詞,*,*,*,*,も,モ,モ
もも  名詞,一般,*,*,*,*,もも,モモ,モモ
の   助詞,連体化,*,*,*,*,の,ノ,ノ
うち  名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ

コメント

  1. コメント失礼いたします。
    初心者なものでして、質問させてください。
    すもももももももものうち の部分をあらかじめ用意したtxtファイルで実行したい場合はどうすればよいですか?

    txt内のデータは書籍タイトルが並んでいます。
    例.
    python参考書
    pythonを学ぶ教科書
    プログラミング入門
    ・・・
    というように、1タイトルごとに改行しています。大体930件ほど…

    ご教授お願いいたします。。。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

This site uses Akismet to reduce spam. Learn how your comment data is processed.