Open4

Python から扱えるっぽい形態素解析ライブラリ

PlatPlat

MeCab になぜかいいイメージがないので他のライブラリを探してみる

PlatPlat

Janome

https://github.com/mocobeta/janome

https://mocobeta.github.io/janome/

依存ライブラリなしで簡単につかえるらしい

公式サイトよりサンプル引用

pip install janome
from janome.tokenizer import Tokenizer
t = Tokenizer()
for token in t.tokenize('すもももももももものうち'):
    print(token)

すもも 名詞,一般,,,,,すもも,スモモ,スモモ
も 助詞,係助詞,,,,,も,モ,モ
もも 名詞,一般,,,,,もも,モモ,モモ
も 助詞,係助詞,,,,,も,モ,モ
もも 名詞,一般,,,,,もも,モモ,モモ
の 助詞,連体化,,,,,の,ノ,ノ
うち 名詞,非自立,副詞可能,,,*,うち,ウチ,ウチ

Windows なら print のとこを

    print(str(token).decode('utf8'))

にしないといけないかもらしい

関連記事

https://zenn.dev/megane_otoko/articles/055_janome_user_dictionary

https://webs-studio.jp/ai/11386/