PDF仕様書読解 Part 1 : PDFとは
この記事について
PDF仕様書読解シリーズ
閲覧ありがとうございます!
このシリーズではPDFの公式仕様書の読解を通してPDFへの理解を深めていきます。
参考にするのはPDF 32000-1:2008です。
全文英語の756ページの仕様書なので、シリーズの更新頻度についてはあまり期待しないでください...。
動機
PDFについて詳しく知りたいと思ったのは、PDFのJavaScriptライブラリを探しても納得のいくものが見つからず、それなら自分で作ってみたいと思ったからです。
だからもちろん、このシリーズのゴールは実際にPDFのライブラリを作ることです。完成はいつになるかわかりませんが、納得のいくものが出来上がったらライブラリとして公開する予定です。
方針
基本的に仕様書の流れに沿って進んでいきます。
修正や追記によって不定期で更新されることがあります。あらかじめご容赦ください。
本文から取り除く際は取り消し線で対応します。
ご指摘について
情報の誤り、誤字・脱字等があればコメントにてお知らせください。
情報の訂正に関するご指摘であれば、情報源を明示していただ開けるととても助かります。
前書き
PDF仕様書読解シリーズの記念すべき第一弾のテーマは「PDFとは」です。
PDFの詳細に入っていく前にまずはPDFというものがなんなのか知っていこうと思います。
PDFの定義
仕様書の7ページ( p.ⅶ )、導入の部分で以下のように書かれています。
The goal of PDF is to enable users to exchange and view electronic documents easily and reliably, independent of the environment in which they were created or the environment in which they are viewed or printed.
PDFの目標は、それがどの環境で作成され、閲覧され、あるいは印刷されようと、容易かつ信頼性のある電子文書の交換と閲覧をユーザーに提供することです。(拙訳)
PDFの動機はこの文書に半分以上含まれていると言っていいでしょう。この方針はPDFという名前にも表れています。
PDFは英語で Portable Document Format(持ち運び可能な文書) です。
確かに物理的にも電子的にもどこにでも持っていけますね。
今となってはほとんど全てのOS、ブラウザ、モバイル端末、プリンターで閲覧・印刷が可能です。
さらにPDFとしての要件を以下のようにまとめています。
preservation of document fidelity independent of the device, platform, and software
デバイス、プラットフォーム、ソフトウェアに依存せしない文書の正確性の確保merging of device content from diverse sources - Web sites, word proccessing and spread sheet programs, scaned documents, photos, and graphics - into one self-contained document while maintaining the integrity of all original source documents
デバイス上の様々な資料(Webサイト、文書作成またはスプレッドシートプログラム、スキャンされた文書、写真、グラフィック)を単一のそれ自体で独立した文書にまとめつつ、元の資料との互換性を維持するcollaborative editing of documents from multiple locations or platforms
複数の場所やプラットフォーム上での共同編集digital signatures to certify authority
権威を保証するためのデジタル署名security and permissions to allow the creator to retain control of the document and associated rights
作成者が文書の編集権限を保持するためのセキュリティと認可accessibility of content to those with disabilities
ハンディキャップを持つ人たちへのアクセシビリティextracion and reuse of content for use with other file formats and applications
他のファイル形式やアプリケーションで利用するための抽出可能性と再利用性electronic forms o gather data and integrate it with business systems
データ収集とビジネスシステムとの統合のための電子形式
ばーっと書いていますが、要するに「どこでも、何にも使えるようにしよう!」ってことですよね。
あとは作る人の権利や誰が発行したのかを保証するためのセキュリティやデジタル署名なんかにも言及しています。社会人の人はPDFにパスワードかけて相手方に送る、みたいなことやったことある人多いんじゃないでしょうか。(あれ絶対やめた方がいいですよね...)
PDFの歴史
PDFは1993年に Adobe(当時は Adobe Systems)によって文書共有を目的に開発されました。(PDF1.0 と Acrobat1.0 のリリース)
PostScriptという言語をもとに開発されたそうです。
当時は Adobe Acrobat というアプリケーションでしか閲覧できませんでした。しかもダウンロードと表示が遅く、HTMLのようなハイパーリンクがなかったため、インターネットの強みを活かしきれず、あまり普及しませんでした。
しかし 1994年にAcrobat Reader(現 Adobe Reader)を無償配布するようになると急速に普及し始め、電子文書のデファクトスタンダードの地位を確立します。
日本では2004年にソースネクストが配布を始めた「いきなりPDF」シリーズが注目を集めましたが、Acrobat はすでに1996年から日本語対応しています。
2008年には国際標準化機構(ISO)によって ISO 3200:2008 として策定され、以降は専門家ボランティアのもとで開発が続けられています。
後方互換性
PDFは高い後方互換性を保ちながら開発・策定されています。
あるバージョンで採用された仕様(例えばPDF1.3など)はそれ以降のバージョンでも有効性があります。
PDFのどのバージョン(PDF1.0 ~ 7)も有効なPDFです。
仕様への準拠
PDFファイルそのものはもちろん、PDF閲覧・編集ソフトは PDF 32000-1:2008 の仕様にすべて準拠している必要があります。
ただし、具体的な実装方法やユーザーインターフェースについての強制はありません。
まとめ
PDF(Portable Document Format)はその名の通り、どんな環境でも利用でき、簡単に運ぶことができるファイルフォーマットです。
その可搬性の高さから、インターネットの普及とともに急速に発展しました。
そして私たちがPDFをどこでも閲覧できるのは、すべての主要なソフトがこの仕様書に準拠しているからです。
あとがき
今回はPDFの定義や歴史について学びました。
PDFがあのAdobeによって開発されたということを知らなかった人もいるのではないでしょうか。さすがは天下のAdobeですね。
次回はPDFの基礎文法について取り扱います。
Discussion