Archivematica AIPのREADMEファイルの日本語訳例
Archivematicaによって作成するAIPには、README.htmlファイルが含まれています。本ファイルをDeepLで翻訳(一部を人手で修正)しました。誤りも多く含まれているかと思いますが、参考になりましたら幸いです。
アーカイブマティカのAIP構造
このReadmeファイルでは、Archivematicaが生成するArchival Information Package(AIP)の基本的な構造について説明しています。
頭字語
AIP = アーカイバルインフォメーションパッケージ
METS = メタデータのエンコードと送信の標準規格
OAIS = Open Archival Information System(オープン・アーカイブ・インフォメーション・システム)
PDI = 保存記述情報(Preservation Description Information)
PREMIS = 保存メタデータ実装ストラテジー
UUID = ユニークユニバーサル識別子
はじめに
Archivematica は、多様なデジタルコンテンツを取り込み、長期保存のためのAIPを作成するために設計されたオープンソースのツール群です。一度作成されたAIPは、Archivematicaに依存することなく、標準的なファイルブラウザで開くことができます。AIPのコンセプトは、ISO 14721:2012 Reference Model for an Open Archival Information System (OAIS)
に由来し、「コンテンツ情報と関連する保存記述情報(PDI)からなり、OAIS内に保存される情報パッケージ」として定義されています。
コンテンツ情報
Archivematica AIPでは、コンテンツ情報は、主に最初に取り込まれたデジタルオブジェクトと、時間の経過とともにフォーマットが陳腐化するリスクを軽減するために作成されたオブジェクトの保存バージョンで構成されています。保存版は通常、元のオブジェクトと同じファイル名ですが、ファイル拡張子が異なり、ファイル名にUUIDが付加されています。たとえば、BBhelmet.ai
という名前の元のファイルに対して、保存版の名前はBBhelmet-e3a3988d-8149-49ea-adc5-c255fb68d4f9.pdf
である場合があります。
最初に取り込まれたデジタルオブジェクトと保存バージョンは、AIPのobjects
ディレクトリに配置されます。もしこれらのサブディレクトリがオリジナルの転送に含まれていたり、SIPの配置中に追加された場合は、objects
ディレクトリにネストしたサブディレクトリが存在します。objects
ディレクトリには、submissionDocumentation
フォルダーとmetadata
フォルダーも含まれます。submissionDocumentation
フォルダには、ドナー契約や譲渡書などの文書(AIPに含まれている場合)、およびAIPの作成元となった元の譲渡の内容を記録するMETSファイルが含まれます。metadata
フォルダには、オリジナルの転送ファイルに含まれるメタデータファイルや、処理中に生成されたOCRテキストファイルが保存されます。
保存説明情報(PDI)
Archivematica AIPのPDIは、METS XMLファイルに記録されています。METSは米国議会図書館によって管理されており、その定義は「World Wide Web ConsortiumのXMLスキーマ言語を使用して表現された、デジタルライブラリ内のオブジェクトに関する記述的、管理的、構造的メタデータをエンコードするための標準」です。Archivematica AIPでは、METSファイル名は、METSという名前にUUIDファイル拡張子とXMLファイル拡張子で構成されています。例えば、METS.0ad8cdab-dbbf-4863-8a4d-9a675c227216.xml
のようなファイル名です。METS ファイルは通常、以下の標準 METS セクションで構成されています。
mets:metsHdr (METSヘッダー):METSファイルに関する基本的な情報。
mets:dmdSec(記述的メタデータ・セクション):デジタル・オブジェクトについての記述的メタデータ。
mets:amdSec (管理メタデータセクション): デジタルオブジェクトに関する技術的および出所情報。
mets:fileSec (ファイルセクション): デジタルオブジェクトのリストとAIPにおける役割の表示(オリジナル、保存、メタデータ、提出書類、ライセンスなど)。
mets:structMap(構造マップ):デジタル・オブジェクトの物理的または論理的な順序付け。すべてのAIP METSファイルには、デフォルトの物理的structMapが含まれ、AIPの構造に応じて、物理的または論理的な追加のstructMapを含むことができます。
METS amdSecの技術的および出所情報は、PREMISメタデータとして記録されます。PREMISは米国議会図書館の規格でもあり、「デジタル・オブジェクトの保存を支援し、その長期的な有用性を確保するためのメタデータの国際標準」と説明されている。PREMISエンティティは、METSファイルの中で以下のようにラップされています。
--mets:techMD(技術的なメタデータ)
----premis:object 例:UUID、サイズ、チェックサム、フォーマット、元の名前、抽出された技術的なメタデータ
--mets:digiprovMD(デジタル実証用メタデータ)
----premis:event 例:取り込み、メッセージダイジェスト計算、ウィルススキャン、フォーマット識別、検証、正規化、フィキシティチェック
----premis:agent 各PREMISイベントには、組織、デジタル保存システム(例:Archivematica 1.x)、ログインユーザーの3つのAgentが関連付けられます。
--mets:rightsMD(ライツメタデータ)。
----premis:rights 保存されたデジタルオブジェクトの保存、複製、使用に関する権利(ユーザーがインジェストの前または最中に権利メタデータを追加した場合のみ含まれます)。
fileSecとstructMapは、identifier属性を用いてデジタル・オブジェクトをリンクする。例えば、fileSecのファイルエントリーがADMID="amdSec_1"
の属性を持つ場合、これは識別子amdSec_1
のamdSecにそのファイルの管理メタデータ(つまり、技術や出所)が含まれることを意味します。fileSecはまた、デジタルオブジェクト間の関係を示すために、グループ識別子属性を使用します。例えば、fileGrp "USE=original"
のファイルAとfileGrp "USE="preservation"
のファイルBが共にグループ識別子属性"Group-269b494d-01cb-451b-8d5e-590d57126d3d"
を持っていれば、ファイルBはファイルAから生成した保存版となる。
AIP構造
Archivematica AIPは、IETF TrustのBagIt File Packaging Format
に従ってバッグにパッケージされ、上記のセクションで説明されていないいくつかのコンテンツが含まれています。このツリー構造は、典型的なArchivematica AIPを表しています。
(1) AIP-name-e3a3988d-8149-49ea-adc5-c255fb68d4f9
(2) ├── bag-info.txt
(3) ├── bagit.txt
(4) ├── manifest-sha512.txt
(5) ├── tagmanifest-md5.txt
(6) └── data
(7) ├── logs
(8) ├── objects
(9) ├── thumbnails
(10) ├── METS.0ad8cdab-dbbf-4863-8a4d-9a675c227216.xml
(11) └── README.html
(1) UUIDを付加したAIPルートディレクトリ
(2)〜(5) BagIt仕様に基づき作成された標準パッケージングファイル。
(6) dataディレクトリ - これもBagIt仕様で規定された標準的なディレクトリです。dataディレクトリには、AIPコンテンツ情報、PDIが格納される。
(7) logsディレクトリ:ArchivematicaがAIPを生成する際に使用するいくつかのツールのログ出力が格納されています。
(8) objectsディレクトリ:オリジナルのデジタルオブジェクトと、正規化されたバージョンが格納されています。
(9) thumbnailsディレクトリ:オリジナルのオブジェクトから生成された、Archivematicaのユーザーインターフェースで使用するサムネイルが格納されています。
(10) Archivematica METSファイル。
(11) このREADMEファイル
Discussion