👌
【bs4】beautifulsoupでパースするとhtml属性の順番が変わるトラブル
beautifulsoupはhtmlを解析するライブラリですが、このライブラリをつかっていると困ったことがおきました。
bs4でパースをするとhtmlの属性の順番が変わってしまうのです
たとえば以下のようなhtmlがあるとしましょう。
<a title="samaple" href="sample.com">
上記をbs4でパースすると
<a href="sample.com" title="samaple">
勝手に順番が変わってしまうのです。こちらはbeautifulsoupの仕様だと思わますのでトラブルというよりは仕方のないことかと思います。bs4のオブジェクトは文字列ではありませんので文字列としてあつかう場合はstr()
を使うなりして変換してやればいいと思います。
Discussion