Open2

trafilaturaをLambdaで使用しようとした方の奮闘メモ

ayousanzayousanz

https://x.com/lemilemilemio/status/1705137896158831066?s=20
https://x.com/lemilemilemio/status/1705138354298441864?s=20
https://x.com/lemilemilemio/status/1705138765281562674?s=20

AWS Lambda上で記事の内容をスクレイピングして要約したい

trafilaturaというライブラリが文章だけを抜くのに良さそう

Lambdaのレイヤーに入れる

lxmlが無いよと言われる

どうやらCで書かれてるらしくAmazon LinuxでコンパイルされたやつじゃないとLambdaで動かないらしい

海外でLambdaで使えないというサイトをちらほら見る

GitHubにAmazon Linuxでコンパイルしたlxmlファイルを見つける

それに入れ替えて再度レイヤーにアップロード

lxmlが見つからないエラー

GitHubのやつがPython3.6用のやつっぽいのでPython3.6に全ての環境を変更したら行けるかもしれないが、LambdaはPython3.7からなのでお手上げ状態