PythonでJanomeを使って形態素解析した結果をファイルに保存する方法です。
「PythonでJanomeを使って形態素解析」のコメント欄で質問をもらったので、書いておきます。
実行環境は
$ python3 --version
Python 3.5.2
ソースコードです。
from janome.tokenizer import Tokenizer
tokenizer = Tokenizer()
with open("token.txt", "w") as fp:
for token in tokenizer.tokenize("すもももももももものうち"):
fp.write(str(token))
fp.write("\n")
実行結果
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
コメント失礼いたします。
初心者なものでして、質問させてください。
すもももももももものうち の部分をあらかじめ用意したtxtファイルで実行したい場合はどうすればよいですか?
txt内のデータは書籍タイトルが並んでいます。
例.
python参考書
pythonを学ぶ教科書
プログラミング入門
・・・
というように、1タイトルごとに改行しています。大体930件ほど…
ご教授お願いいたします。。。