👌

【bs4】beautifulsoupでパースするとhtml属性の順番が変わるトラブル

2022/12/18に公開約400字

beautifulsoupはhtmlを解析するライブラリですが、このライブラリをつかっていると困ったことがおきました。
https://amzn.to/3PQspY5
https://amzn.to/3PygfCU
bs4でパースをするとhtmlの属性の順番が変わってしまうのです
たとえば以下のようなhtmlがあるとしましょう。

<a title="samaple" href="sample.com">

上記をbs4でパースすると

<a href="sample.com" title="samaple">

勝手に順番が変わってしまうのです。こちらはbeautifulsoupの仕様だと思わますのでトラブルというよりは仕方のないことかと思います。bs4のオブジェクトは文字列ではありませんので文字列としてあつかう場合はstr()を使うなりして変換してやればいいと思います。

Discussion

ログインするとコメントできます