METSFlaskを試す
概要
以下のMETSFlaskを試します。
以下のように説明されています。
A web application for human-friendly exploration of Archivematica METS files
[機械翻訳] ArchivematicaのMETSファイルを人間に優しい方法で探索するためのウェブアプリケーション
使い方
以下のサイトで試すことができます。
METSファイルをアップロードした結果が以下です。今回は、1つのWordファイルのみが格納されていたため、1つのオリジナルファイルに関する情報が表示されます。
View
ボタンをクリックすると、詳細画面に遷移します。
PREMIS Eventsにおいて、METSファイルのmets:digiprovMD
セクションの内容が表示されていました。このセクションは、デジタルプロビナンス(デジタルオブジェクトの起源や履歴を追跡する情報)メタデータを扱うようです。
<mets:digiprovMD ID="digiprovMD_8">
<mets:mdWrap MDTYPE="PREMIS:EVENT">
<mets:xmlData>
<premis:event xmlns:premis="http://www.loc.gov/premis/v3" xsi:schemaLocation="http://www.loc.gov/premis/v3 http://www.loc.gov/standards/premis/v3/premis.xsd" version="3.0">
<premis:eventIdentifier>
<premis:eventIdentifierType>UUID</premis:eventIdentifierType>
<premis:eventIdentifierValue>24741142-467a-45da-936e-78e43ab68a6c</premis:eventIdentifierValue>
</premis:eventIdentifier>
<premis:eventType>ingestion</premis:eventType>
<premis:eventDateTime>2024-02-26T03:34:19.082563+00:00</premis:eventDateTime>
<premis:eventDetailInformation>
<premis:eventDetail/>
</premis:eventDetailInformation>
<premis:eventOutcomeInformation>
<premis:eventOutcome/>
<premis:eventOutcomeDetail>
<premis:eventOutcomeDetailNote/>
</premis:eventOutcomeDetail>
</premis:eventOutcomeInformation>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>preservation system</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>Archivematica-1.16</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>repository code</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>test</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>Archivematica user pk</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>1</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
</premis:event>
</mets:xmlData>
</mets:mdWrap>
</mets:digiprovMD>
mets:mdWrap
のChatGPT 4による説明は以下のとおりです。
mets:mdWrap
(Metadata Wrap)要素は、METs(Metadata Encoding and Transmission Standard)フレームワーク内で用いられるXML要素の一つです。METsは、デジタルオブジェクトの構造的、管理的、および記述的メタデータを記録するための標準です。このフレームワークは、デジタルライブラリ、アーカイブ、博物館などでデジタルコレクションを管理するために広く使用されています。
mets:mdWrap
要素は、特定の種類のメタデータ(例えば、記述的メタデータ、管理メタデータ、権利メタデータなど)を包含("wrap")し、それらをMETsドキュメント内でエンコードするために使われます。この要素は、メタデータが直接XML形式でエンコードされている場合(インライン方式)に使用されることが多いですが、外部参照やバイナリ形式のメタデータを指し示す場合にも使用されます。
mets:mdWrap
内部には、以下のような重要な属性や子要素が含まれることがあります:
-
MDTYPE
属性:包含されるメタデータのタイプを指定します。例えば、MODS
、DC
(ダブリンコア)、MARC
など、様々なメタデータ標準を指定することができます。 -
MIMETYPE
属性:メタデータのMIMEタイプを指定します(主に外部参照やバイナリデータの場合)。 -
LABEL
属性:メタデータセクションのラベルやタイトルを指定するために使用されます。 -
<xmlData>
要素:インラインでエンコードされたXML形式のメタデータを含みます。 -
<binData>
要素:バイナリエンコードされたメタデータを含みます(バイナリデータのインラインエンコード用)。
mets:mdWrap
を使うことで、METsドキュメントは様々な形式や表現のメタデータを柔軟に取り扱い、エンコードすることが可能になります。これは、デジタルオブジェクトの包括的な管理とアクセスをサポートするために不可欠です。
その他
先の可視化結果のFile detailsに記載がある項目は、以下のmets:amdSec
の内容が表示されています。
「amdSec」は、METsドキュメント内の「管理メタデータセクション(Administrative Metadata Section)」を指し、デジタルオブジェクトの著作権情報、プリザベーション(保存)メタデータ、その他の管理に関連する情報を含むセクションです。
<mets:amdSec ID="amdSec_2">
<mets:techMD ID="techMD_2">
<mets:mdWrap MDTYPE="PREMIS:OBJECT">
<mets:xmlData>
<premis:object xmlns:premis="http://www.loc.gov/premis/v3" xsi:type="premis:file" xsi:schemaLocation="http://www.loc.gov/premis/v3 http://www.loc.gov/standards/premis/v3/premis.xsd" version="3.0">
<premis:objectIdentifier>
<premis:objectIdentifierType>UUID</premis:objectIdentifierType>
<premis:objectIdentifierValue>f48c30f3-c1d1-4ffc-a6d8-8fd98b152d66</premis:objectIdentifierValue>
</premis:objectIdentifier>
<premis:objectCharacteristics>
<premis:compositionLevel>0</premis:compositionLevel>
<premis:fixity>
<premis:messageDigestAlgorithm>sha256</premis:messageDigestAlgorithm>
<premis:messageDigest>8e3c38e590e15f38b953011bcb3a379a857408520ed9547b3fac77fbb151aef2</premis:messageDigest>
</premis:fixity>
<premis:size>51332</premis:size>
<premis:format>
<premis:formatDesignation>
<premis:formatName>Microsoft Word </premis:formatName>
<premis:formatVersion>2007+</premis:formatVersion>
</premis:formatDesignation>
<premis:formatRegistry>
<premis:formatRegistryName>PRONOM</premis:formatRegistryName>
<premis:formatRegistryKey>fmt/412</premis:formatRegistryKey>
</premis:formatRegistry>
</premis:format>
<premis:creatingApplication>
<premis:dateCreatedByApplication>2024-02-26T03:34:17Z</premis:dateCreatedByApplication>
</premis:creatingApplication>
<premis:objectCharacteristicsExtension>
<fits xmlns="http://hul.harvard.edu/ois/xml/ns/fits/fits_output" xsi:schemaLocation="http://hul.harvard.edu/ois/xml/ns/fits/fits_output http://hul.harvard.edu/ois/xml/xsd/fits/fits_output.xsd" version="0.8.4" timestamp="2/26/24 3:34 AM">
<identification status="CONFLICT">
<identity format="Microsoft Word 2007+" mimetype="application/vnd.openxmlformats-officedocument.wordprocessingml.document" toolname="FITS" toolversion="0.8.4">
<tool toolname="file utility" toolversion="5.14"/>
</identity>
<identity format="OpenDocument Text" mimetype="application/vnd.oasis.opendocument.text" toolname="FITS" toolversion="0.8.4">
<tool toolname="Exiftool" toolversion="9.13"/>
<tool toolname="NLNZ Metadata Extractor" toolversion="3.4GA"/>
</identity>
<identity format="Office Open XML Document" mimetype="application/vnd.openxmlformats-officedocument.wordprocessingml.document" toolname="FITS" toolversion="0.8.4">
<tool toolname="Tika" toolversion="1.3"/>
</identity>
</identification>
<fileinfo>
<lastmodified toolname="Exiftool" toolversion="9.13" status="SINGLE_RESULT">2024:02:26 03:34:17+00:00</lastmodified>
<filepath toolname="OIS File Information" toolversion="0.2" status="SINGLE_RESULT">/var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects/yuusukeesukouboteiansho.docx</filepath>
<filename toolname="OIS File Information" toolversion="0.2" status="SINGLE_RESULT">yuusukeesukouboteiansho.docx</filename>
<size toolname="OIS File Information" toolversion="0.2" status="SINGLE_RESULT">51332</size>
<fslastmodified toolname="OIS File Information" toolversion="0.2" status="SINGLE_RESULT">1708918457000</fslastmodified>
</fileinfo>
<filestatus/>
<metadata/>
<toolOutput>
<tool name="file utility" version="5.14">
<fileUtilityOutput xmlns="">
<rawOutput>Microsoft Word 2007+ application/vnd.openxmlformats-officedocument.wordprocessingml.document; charset=binary</rawOutput>
<mimetype>application/vnd.openxmlformats-officedocument.wordprocessingml.document</mimetype>
<format>Microsoft Word 2007+</format>
</fileUtilityOutput>
</tool>
<tool name="Exiftool" version="9.13">
<exiftool xmlns="">
<rawOutput>ExifToolVersion 9.13 FileName yuusukeesukouboteiansho.docx Directory /var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects FileSize 50 kB FileModifyDate 2024:02:26 03:34:17+00:00 FileAccessDate 2024:02:26 03:34:22+00:00 FileInodeChangeDate 2024:02:26 03:34:20+00:00 FilePermissions rw-r----- Warning Install Archive::Zip to decode compressed ZIP information FileType ZIP MIMEType application/zip ZipRequiredVersion 20 ZipBitFlag 0x0006 ZipCompression Deflated ZipModifyDate 1980:01:01 00:00:00 ZipCRC 0x7ae6e476 ZipCompressedSize 409 ZipUncompressedSize 1969 ZipFileName [Content_Types].xml</rawOutput>
<ExifToolVersion>9.13</ExifToolVersion>
<FileName>yuusukeesukouboteiansho.docx</FileName>
<Directory>/var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects</Directory>
<FileSize>50 kB</FileSize>
<FileModifyDate>2024:02:26 03:34:17+00:00</FileModifyDate>
<FileAccessDate>2024:02:26 03:34:22+00:00</FileAccessDate>
<FileInodeChangeDate>2024:02:26 03:34:20+00:00</FileInodeChangeDate>
<FilePermissions>rw-r-----</FilePermissions>
<Warning>Install Archive::Zip to decode compressed ZIP information</Warning>
<FileType>ZIP</FileType>
<MIMEType>application/zip</MIMEType>
<ZipRequiredVersion>20</ZipRequiredVersion>
<ZipBitFlag>0x0006</ZipBitFlag>
<ZipCompression>Deflated</ZipCompression>
<ZipModifyDate>1980:01:01 00:00:00</ZipModifyDate>
<ZipCRC>0x7ae6e476</ZipCRC>
<ZipCompressedSize>409</ZipCompressedSize>
<ZipUncompressedSize>1969</ZipUncompressedSize>
<ZipFileName>[Content_Types].xml</ZipFileName>
</exiftool>
</tool>
<tool name="NLNZ Metadata Extractor" version="3.4GA">
<OPENOFFICE xmlns="">
<METADATA>
<FILENAME>yuusukeesukouboteiansho.docx</FILENAME>
<SEPARATOR>/</SEPARATOR>
<PARENT>/var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects</PARENT>
<CANONICALPATH>/var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects/yuusukeesukouboteiansho.docx</CANONICALPATH>
<ABSOLUTEPATH>/var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects/yuusukeesukouboteiansho.docx</ABSOLUTEPATH>
<PATH>/var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects/yuusukeesukouboteiansho.docx</PATH>
<FILE>true</FILE>
<DIRECTORY>false</DIRECTORY>
<FILELENGTH>51332</FILELENGTH>
<HIDDEN>false</HIDDEN>
<ABSOLUTE>true</ABSOLUTE>
<URL>file:/var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects/yuusukeesukouboteiansho.docx</URL>
<URI>file:/var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects/yuusukeesukouboteiansho.docx</URI>
<READ>true</READ>
<WRITE>true</WRITE>
<EXTENSION>docx</EXTENSION>
<MODIFIED>2024-02-26 03:34:17</MODIFIED>
<DATE>20240226</DATE>
<DATEPATTERN>yyyyMMdd</DATEPATTERN>
<TIME>033417000</TIME>
<TIMEPATTERN>HHmmssSSS</TIMEPATTERN>
<TYPE>application/open-office-1.x</TYPE>
<PID>null</PID>
<OID>null</OID>
<FID>null</FID>
<PROCESSOR>unknown</PROCESSOR>
</METADATA>
</OPENOFFICE>
</tool>
<tool name="OIS File Information" version="0.2">
<fits xsi:schemaLocation="http://hul.harvard.edu/ois/xml/ns/fits/fits_output http://hul.harvard.edu/ois/xml/xsd/fits/fits_output.xsd">
<fileinfo>
<filepath>/var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects/yuusukeesukouboteiansho.docx</filepath>
<filename>yuusukeesukouboteiansho.docx</filename>
<size>51332</size>
<fslastmodified>1708918457000</fslastmodified>
</fileinfo>
</fits>
</tool>
<tool name="ffident" version="0.2">
<ffidentOutput xmlns="">
<shortName>ZIP</shortName>
<longName>ZIP Format</longName>
<group>archive</group>
<mimetypes>
<mimetype>application/zip</mimetype>
</mimetypes>
<fileExtensions>
<extension>zip</extension>
</fileExtensions>
</ffidentOutput>
</tool>
<tool name="Tika" version="1.3">
<metadata xmlns="">
<field name="Content-Type">
<value>application/vnd.openxmlformats-officedocument.wordprocessingml.document</value>
</field>
</metadata>
</tool>
</toolOutput>
</fits>
</premis:objectCharacteristicsExtension>
</premis:objectCharacteristics>
<premis:originalName>%transferDirectory%objects/ユースケース公募提案書.docx</premis:originalName>
</premis:object>
</mets:xmlData>
</mets:mdWrap>
</mets:techMD>
</mets:amdSec>
まとめ
METSFlaskを用いて、ArchivematicaのMETSファイルを視覚化する一例について紹介しました。METSファイルとMETSFlaskの視覚化結果を見比べることで、METSファイルの内容が理解しやすくなるように思いました。
Discussion