PDFからExcel(エクセル)に変換する方法とソフト10選
元記事:https://www.octoparse.jp/blog/how-to-extract-pdf-into-excel/
Portable Document Format (ポータブル・ドキュメント・フォーマット、略称:PDF) はAdobeが開発および提唱する、電子上の文書に関するファイルフォーマットである。1993年に発売されたAdobe Acrobatで採用された。(ウィキペディアより)
PDFファイルは「電子ペーパー」のように、どんな環境のパソコンで開いても、同じように見ることができ、簡単に表示、保存、印刷できます。PDFが会社や学校で電子マニュアルや資料などのファイルを送る際はPDFファイルで送ることが多いです。
また、多くのWebサイトでは、Webページに埋め込むのではなく、データをPDFファイルとしてアップしてダウンロードしてもらうような形をとっています。これでWebスクレイピングを効果的に避けることができます。
しかし、PDFだと編集するためには特定のソフトが必要になってしまい、WordやExcelなどで再利用したり、編集したりすることは難しいです。ですから、本記事はPDFからExcelに変換する方法とソフト10選を紹介します。
1.コピペ
データ量が少ない場合はコピペが手っ取り早い方法です。ドキュメントを開き、すべてのテキストを選択して、Excelファイルにコピーして貼り付けます。でも、グラフやテーブルなどのデータなら、直接コピペしたら崩れやすいです。そのため、テーブルをコピーする必要があるときに、まずそれをWordファイルに貼り付け、次にWordからExcelにコピーして貼り付けて構造化テーブルを作成する必要があります。
ただ、量が多い場合、この方法では無理そうですね。自動化ツールを使ったほうがおすすめです。
2.PDFエクセル変換ソフト
PDFファイルをExcelに取り込んで再編集できるソフトやWebサービスなどがたくさんあります。操作が簡単で、瞬時でPDFファイルをExcelに変換できます。PDFファイルをドラッグして、変換ボタンをクリックしてExcelファイルをエクスポートします。変換されたファイルは、テキストと画像だけでなく、フォーマット、フォント、色もそのまま残られます。
以上の手順が完了したら、スプレッドシートを編集できます。多くのPDF変換ソフトでは、PDFファイルに保存されている画像、テキスト、ページを直接編集し、Excelスプレッドシートにエクスポートすることもできます。
PDFからExcelに変換するにオススメのソフトは次のとおりです。
Adobe Acrobat
1.もちろん、PDF形式の最初の開発者であるAdobe Acrobatには、変換機能が含まれています。すばやく簡単に、スマフォを含むあらゆるデバイスで行うことができます。Acrobatはファイルの変換だけでなく、共同作業中のドキュメントを作成、編集、エクスポート、署名、およびレビューできます。スキャンしたドキュメントを編集可能な検索可能なPDFに変換することもできます。
PDFelement
2.PDFelementはPDF編集、変換、結合、分割など、PDFについてのすべての機能を1つにまとめた オールインワンPDF編集ソフトです。使い方は簡単で、無料体験版もあります。このPDF変換ソフトを利用すると、一つのシートに一つのPDFの表をエクスポートするか、または単一のシートにすべてのPDFのデータを書き出せます。
Nitro Pro
3.PDF編集ソフトの用途として最も一般的なのは、もちろんPDFの作成と変換です。Nitro Proは、作成と変換の両方が秀逸です。300種類以上のファイル形式からPDFファイルを作成したり、PDFファイルをWord/Excel/PowerPointの各形式にエクスポートしたりできます。
cometdocs
4.cometdocs はWord / Excel などのオフィスファイルをPDF化したり、PDFから Word / Excel などへ変換したりできるソフトです。右クリックメニューから簡単に変換できます。ブラウザーアプリも用意されており、インストール不要で利用することも可能です。
iSkysoft PDF Converter Pro
5.iSkysoft PDF Converter Pro は、Word、Excel、PowerPoint、EPUB、HTMLやテキストにPDFを変換できるだけでなく、ワンクリックでPDFに変換することも簡単です。
smallpdf
6.smallpdf はPDFファイルの変換、圧縮、結合、分割、編集するできる便利なツールです。それに、ChromeにSmallpdfを追加することができ、オンラインでのPDF操作を可能にします。
Tabula
7.文章をPDFから抽出するのはそれほど難しくはないですが、表を表の形のまま、抽出するのはなかなか難しそうです。Tabula はPDFに含まれている表をテキストデータとして抜き出すことのできるツールです。インストール型なので最初は少し手間ですが、精度が高いです。
Hipdf
8.Hipdf は、PDFファイルをExcel・Word・PowerPointに変換できるツールです。それに、Excel・Word・PowerPointもPDFファイルへの逆変換もできるようになっています。操作方法は非常にシンプルで、PDFをExcelに変換する際に広告なし、登録不要というのもHipdfのメリットです。
ilovepdf
9.ilovepdf は完全無料のPDFの為のオンラインサービスです。使い方はとても簡単で、PDFの結合、分割、圧縮、officeファイルのPDF変換、PDFからJPGへの変換など他にも多くの機能があります!
cleverpdf
10.cleverpdf は16種言語に対応するPDF変換サイトで、変換、逆変換、結合・抽出、回転、パスワード設定等ができるオンラインサービスです。PDFからの逆変換サービスは、MicrosoftのOfficeソフトであるWord、Excel、PowerPointは勿論、iOSのOfficeソフトであるPages、Numbers、Keynoteにも対応しています。
まとめ
PDFからデータを抽出するための非常に多くのツールがあります。これらの自動化ツールを使用すると、PDFファイルからデータを取得する方法について頭を悩ます必要がなくなります。各ツールには長所と短所があるため、結果は異なる場合があります。最適なものを見つけてみてください!
関連記事:
画像を一括ダウンロードするのに超便利なツール5選
働き方改革 | 2021年注目の業務自動化ツール30選
2021年データ分析・データ可視化ツールおすすめの31選
Discussion