PythonでJanomeを使って形態素解析した結果をファイルに保存する

PythonでJanomeを使って形態素解析した結果をファイルに保存する方法です。

PythonでJanomeを使って形態素解析」のコメント欄で質問をもらったので、書いておきます。

実行環境は

$ python3 --version
Python 3.5.2

ソースコードです。

from janome.tokenizer import Tokenizer

tokenizer = Tokenizer()
with open("token.txt", "w") as fp:
    for token in tokenizer.tokenize("すもももももももものうち"):
        fp.write(str(token))
        fp.write("\n")

実行結果

すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も   助詞,係助詞,*,*,*,*,も,モ,モ
もも  名詞,一般,*,*,*,*,もも,モモ,モモ
も   助詞,係助詞,*,*,*,*,も,モ,モ
もも  名詞,一般,*,*,*,*,もも,モモ,モモ
の   助詞,連体化,*,*,*,*,の,ノ,ノ
うち  名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ

コメント

  1. コメント失礼いたします。
    初心者なものでして、質問させてください。
    すもももももももものうち の部分をあらかじめ用意したtxtファイルで実行したい場合はどうすればよいですか?

    txt内のデータは書籍タイトルが並んでいます。
    例.
    python参考書
    pythonを学ぶ教科書
    プログラミング入門
    ・・・
    というように、1タイトルごとに改行しています。大体930件ほど…

    ご教授お願いいたします。。。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください