Open1

PythonのNLPライブラリではstanzaよりspaCyの方が圧倒的に速い

Lamron🪽Lamron🪽

補足:
ポルトガル語だと、spacyはlenmaを二語以上に変換することがある
dela(彼の)→de ele
恐らく最後部分だけ取り出せば大丈夫

lenmas = token.lemma_.split(" ")
lenma = lenmas[-1] if (len(lenmas) > 1) else lenmas[0]