Open3
PDFの音声読み上げの順番を決めている部分を特定したい
PDFの生データを見る方法
問題
PDFをそのままの状態でテキストエディタで開いても、大部分が文字化けしてしまう。
解決方法
QPDFというコマンドラインツールでPDFを変換する。
QPDFがサポート対応しているOS
- Linux
- Windows
- macOS
環境の準備
- QPDFの公式リポジトリのリリースからインストーラをダウンロードする
- ダウンロードしたインストーラを実行する
- binディレクトリまでのパスを通す
ファイルの変換
以下はoriginal.pdfという名前のPDFをoutput.pdfに変換した例。
qpdf --qdf input.pdf output.pdf
output.pdfをテキストエディタで開くと、大部分が文字化けせずに表示される。