⛏️

pythonでのPDF編集ライブラリ選定 メタデータがどうなるか

に公開

実務で気づいたPDF編集ライブラリの違いについてまとめます。
各ライブラリの使い勝手などの詳細は他様々な記事で解説されてますので、ここでは実務で遭遇したポイントのみ触れていきます。
表には出ないPDFのメタデータがポイントでした。

必要な機能

・PDFを指定ページで分割する
・指定ページを削除する
です。複数PDFの結合までは求められてないです。

選定候補

・pymupdf
高機能で様々な事ができます。
ただし、商用ライセンス

・pypdf
上記の機能は問題なく使えますがメタデータの編集に難があるようで、フォント情報がなくなる事例に遭遇しました(ver5.4.0)。

・pikepdf
上記の機能は問題なく使えます。使い方もpypdfに似ています。
そして、pypdfのようなフォント情報の欠落などは発生しませんでした

結論

pikepdfを使用していくことになりました。

Discussion