Open3

PDFの音声読み上げの順番を決めている部分を特定したい

tez3998tez3998

PDFの生データを見る方法

問題

PDFをそのままの状態でテキストエディタで開いても、大部分が文字化けしてしまう。

解決方法

QPDFというコマンドラインツールでPDFを変換する。

QPDFがサポート対応しているOS

  • Linux
  • Windows
  • macOS

環境の準備

  1. QPDFの公式リポジトリのリリースからインストーラをダウンロードする
  2. ダウンロードしたインストーラを実行する
  3. binディレクトリまでのパスを通す

ファイルの変換

以下はoriginal.pdfという名前のPDFをoutput.pdfに変換した例。

qpdf --qdf input.pdf output.pdf

output.pdfをテキストエディタで開くと、大部分が文字化けせずに表示される。