🤕

【LangChain】HTMLHeaderTextSplitterで出たエラー

2024/02/13に公開

LangChainでHTMLテキストを分割して処理をするためにHTMLHeaderTextSplitterを使用した時に、下記エラーが出てしまいました。
ValueError: Input object has no document: lxml.etree._ElementTree

解決方法「lxmlライブラリのバージョン変更」

原因としては、lxmlのバージョンが低かったことで起きたエラーのようです。

pip install lxml==4.9.4

まとめ

エラー部分に関係するライブラリのバージョン確認が大事だと改めて認識しました。
Google Colaboratoryでは実行できて、ローカルPC上ではエラーが起きてしまっていたので、その差分を見つけられてよかった。。

Discussion