📚

METSFlaskを試す

2024/02/27に公開

概要

以下のMETSFlaskを試します。

https://github.com/tw4l/METSFlask

以下のように説明されています。

A web application for human-friendly exploration of Archivematica METS files

[機械翻訳] ArchivematicaのMETSファイルを人間に優しい方法で探索するためのウェブアプリケーション

使い方

以下のサイトで試すことができます。

http://bitarchivist.pythonanywhere.com/

METSファイルをアップロードした結果が以下です。今回は、1つのWordファイルのみが格納されていたため、1つのオリジナルファイルに関する情報が表示されます。

Viewボタンをクリックすると、詳細画面に遷移します。

PREMIS Eventsにおいて、METSファイルのmets:digiprovMDセクションの内容が表示されていました。このセクションは、デジタルプロビナンス(デジタルオブジェクトの起源や履歴を追跡する情報)メタデータを扱うようです。

<mets:digiprovMD ID="digiprovMD_8">
<mets:mdWrap MDTYPE="PREMIS:EVENT">
<mets:xmlData>
<premis:event xmlns:premis="http://www.loc.gov/premis/v3" xsi:schemaLocation="http://www.loc.gov/premis/v3 http://www.loc.gov/standards/premis/v3/premis.xsd" version="3.0">
<premis:eventIdentifier>
<premis:eventIdentifierType>UUID</premis:eventIdentifierType>
<premis:eventIdentifierValue>24741142-467a-45da-936e-78e43ab68a6c</premis:eventIdentifierValue>
</premis:eventIdentifier>
<premis:eventType>ingestion</premis:eventType>
<premis:eventDateTime>2024-02-26T03:34:19.082563+00:00</premis:eventDateTime>
<premis:eventDetailInformation>
<premis:eventDetail/>
</premis:eventDetailInformation>
<premis:eventOutcomeInformation>
<premis:eventOutcome/>
<premis:eventOutcomeDetail>
<premis:eventOutcomeDetailNote/>
</premis:eventOutcomeDetail>
</premis:eventOutcomeInformation>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>preservation system</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>Archivematica-1.16</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>repository code</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>test</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>Archivematica user pk</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>1</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
</premis:event>
</mets:xmlData>
</mets:mdWrap>
</mets:digiprovMD>

mets:mdWrapのChatGPT 4による説明は以下のとおりです。


mets:mdWrap(Metadata Wrap)要素は、METs(Metadata Encoding and Transmission Standard)フレームワーク内で用いられるXML要素の一つです。METsは、デジタルオブジェクトの構造的、管理的、および記述的メタデータを記録するための標準です。このフレームワークは、デジタルライブラリ、アーカイブ、博物館などでデジタルコレクションを管理するために広く使用されています。

mets:mdWrap要素は、特定の種類のメタデータ(例えば、記述的メタデータ、管理メタデータ、権利メタデータなど)を包含("wrap")し、それらをMETsドキュメント内でエンコードするために使われます。この要素は、メタデータが直接XML形式でエンコードされている場合(インライン方式)に使用されることが多いですが、外部参照やバイナリ形式のメタデータを指し示す場合にも使用されます。

mets:mdWrap内部には、以下のような重要な属性や子要素が含まれることがあります:

  • MDTYPE属性:包含されるメタデータのタイプを指定します。例えば、MODSDC(ダブリンコア)、MARCなど、様々なメタデータ標準を指定することができます。
  • MIMETYPE属性:メタデータのMIMEタイプを指定します(主に外部参照やバイナリデータの場合)。
  • LABEL属性:メタデータセクションのラベルやタイトルを指定するために使用されます。
  • <xmlData>要素:インラインでエンコードされたXML形式のメタデータを含みます。
  • <binData>要素:バイナリエンコードされたメタデータを含みます(バイナリデータのインラインエンコード用)。

mets:mdWrapを使うことで、METsドキュメントは様々な形式や表現のメタデータを柔軟に取り扱い、エンコードすることが可能になります。これは、デジタルオブジェクトの包括的な管理とアクセスをサポートするために不可欠です。


その他

先の可視化結果のFile detailsに記載がある項目は、以下のmets:amdSecの内容が表示されています。

「amdSec」は、METsドキュメント内の「管理メタデータセクション(Administrative Metadata Section)」を指し、デジタルオブジェクトの著作権情報、プリザベーション(保存)メタデータ、その他の管理に関連する情報を含むセクションです。

<mets:amdSec ID="amdSec_2">
    <mets:techMD ID="techMD_2">
        <mets:mdWrap MDTYPE="PREMIS:OBJECT">
            <mets:xmlData>
                <premis:object xmlns:premis="http://www.loc.gov/premis/v3" xsi:type="premis:file" xsi:schemaLocation="http://www.loc.gov/premis/v3 http://www.loc.gov/standards/premis/v3/premis.xsd" version="3.0">
                    <premis:objectIdentifier>
                        <premis:objectIdentifierType>UUID</premis:objectIdentifierType>
                        <premis:objectIdentifierValue>f48c30f3-c1d1-4ffc-a6d8-8fd98b152d66</premis:objectIdentifierValue>
                    </premis:objectIdentifier>
                    <premis:objectCharacteristics>
                        <premis:compositionLevel>0</premis:compositionLevel>
                        <premis:fixity>
                            <premis:messageDigestAlgorithm>sha256</premis:messageDigestAlgorithm>
                            <premis:messageDigest>8e3c38e590e15f38b953011bcb3a379a857408520ed9547b3fac77fbb151aef2</premis:messageDigest>
                        </premis:fixity>
                        <premis:size>51332</premis:size>
                        <premis:format>
                            <premis:formatDesignation>
                                <premis:formatName>Microsoft Word </premis:formatName>
                                <premis:formatVersion>2007+</premis:formatVersion>
                            </premis:formatDesignation>
                            <premis:formatRegistry>
                                <premis:formatRegistryName>PRONOM</premis:formatRegistryName>
                                <premis:formatRegistryKey>fmt/412</premis:formatRegistryKey>
                            </premis:formatRegistry>
                        </premis:format>
                        <premis:creatingApplication>
                            <premis:dateCreatedByApplication>2024-02-26T03:34:17Z</premis:dateCreatedByApplication>
                        </premis:creatingApplication>
                        <premis:objectCharacteristicsExtension>
                            <fits xmlns="http://hul.harvard.edu/ois/xml/ns/fits/fits_output" xsi:schemaLocation="http://hul.harvard.edu/ois/xml/ns/fits/fits_output http://hul.harvard.edu/ois/xml/xsd/fits/fits_output.xsd" version="0.8.4" timestamp="2/26/24 3:34 AM">
                                <identification status="CONFLICT">
                                    <identity format="Microsoft Word 2007+" mimetype="application/vnd.openxmlformats-officedocument.wordprocessingml.document" toolname="FITS" toolversion="0.8.4">
                                        <tool toolname="file utility" toolversion="5.14"/>
                                    </identity>
                                    <identity format="OpenDocument Text" mimetype="application/vnd.oasis.opendocument.text" toolname="FITS" toolversion="0.8.4">
                                        <tool toolname="Exiftool" toolversion="9.13"/>
                                        <tool toolname="NLNZ Metadata Extractor" toolversion="3.4GA"/>
                                    </identity>
                                    <identity format="Office Open XML Document" mimetype="application/vnd.openxmlformats-officedocument.wordprocessingml.document" toolname="FITS" toolversion="0.8.4">
                                        <tool toolname="Tika" toolversion="1.3"/>
                                    </identity>
                                </identification>
                                <fileinfo>
                                    <lastmodified toolname="Exiftool" toolversion="9.13" status="SINGLE_RESULT">2024:02:26 03:34:17+00:00</lastmodified>
                                    <filepath toolname="OIS File Information" toolversion="0.2" status="SINGLE_RESULT">/var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects/yuusukeesukouboteiansho.docx</filepath>
                                    <filename toolname="OIS File Information" toolversion="0.2" status="SINGLE_RESULT">yuusukeesukouboteiansho.docx</filename>
                                    <size toolname="OIS File Information" toolversion="0.2" status="SINGLE_RESULT">51332</size>
                                    <fslastmodified toolname="OIS File Information" toolversion="0.2" status="SINGLE_RESULT">1708918457000</fslastmodified>
                                </fileinfo>
                                <filestatus/>
                                <metadata/>
                                <toolOutput>
                                    <tool name="file utility" version="5.14">
                                        <fileUtilityOutput xmlns="">
                                            <rawOutput>Microsoft Word 2007+ application/vnd.openxmlformats-officedocument.wordprocessingml.document; charset=binary</rawOutput>
                                            <mimetype>application/vnd.openxmlformats-officedocument.wordprocessingml.document</mimetype>
                                            <format>Microsoft Word 2007+</format>
                                        </fileUtilityOutput>
                                    </tool>
                                    <tool name="Exiftool" version="9.13">
                                        <exiftool xmlns="">
                                            <rawOutput>ExifToolVersion 9.13 FileName yuusukeesukouboteiansho.docx Directory /var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects FileSize 50 kB FileModifyDate 2024:02:26 03:34:17+00:00 FileAccessDate 2024:02:26 03:34:22+00:00 FileInodeChangeDate 2024:02:26 03:34:20+00:00 FilePermissions rw-r----- Warning Install Archive::Zip to decode compressed ZIP information FileType ZIP MIMEType application/zip ZipRequiredVersion 20 ZipBitFlag 0x0006 ZipCompression Deflated ZipModifyDate 1980:01:01 00:00:00 ZipCRC 0x7ae6e476 ZipCompressedSize 409 ZipUncompressedSize 1969 ZipFileName [Content_Types].xml</rawOutput>
                                            <ExifToolVersion>9.13</ExifToolVersion>
                                            <FileName>yuusukeesukouboteiansho.docx</FileName>
                                            <Directory>/var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects</Directory>
                                            <FileSize>50 kB</FileSize>
                                            <FileModifyDate>2024:02:26 03:34:17+00:00</FileModifyDate>
                                            <FileAccessDate>2024:02:26 03:34:22+00:00</FileAccessDate>
                                            <FileInodeChangeDate>2024:02:26 03:34:20+00:00</FileInodeChangeDate>
                                            <FilePermissions>rw-r-----</FilePermissions>
                                            <Warning>Install Archive::Zip to decode compressed ZIP information</Warning>
                                            <FileType>ZIP</FileType>
                                            <MIMEType>application/zip</MIMEType>
                                            <ZipRequiredVersion>20</ZipRequiredVersion>
                                            <ZipBitFlag>0x0006</ZipBitFlag>
                                            <ZipCompression>Deflated</ZipCompression>
                                            <ZipModifyDate>1980:01:01 00:00:00</ZipModifyDate>
                                            <ZipCRC>0x7ae6e476</ZipCRC>
                                            <ZipCompressedSize>409</ZipCompressedSize>
                                            <ZipUncompressedSize>1969</ZipUncompressedSize>
                                            <ZipFileName>[Content_Types].xml</ZipFileName>
                                        </exiftool>
                                    </tool>
                                    <tool name="NLNZ Metadata Extractor" version="3.4GA">
                                        <OPENOFFICE xmlns="">
                                            <METADATA>
                                                <FILENAME>yuusukeesukouboteiansho.docx</FILENAME>
                                                <SEPARATOR>/</SEPARATOR>
                                                <PARENT>/var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects</PARENT>
                                                <CANONICALPATH>/var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects/yuusukeesukouboteiansho.docx</CANONICALPATH>
                                                <ABSOLUTEPATH>/var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects/yuusukeesukouboteiansho.docx</ABSOLUTEPATH>
                                                <PATH>/var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects/yuusukeesukouboteiansho.docx</PATH>
                                                <FILE>true</FILE>
                                                <DIRECTORY>false</DIRECTORY>
                                                <FILELENGTH>51332</FILELENGTH>
                                                <HIDDEN>false</HIDDEN>
                                                <ABSOLUTE>true</ABSOLUTE>
                                                <URL>file:/var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects/yuusukeesukouboteiansho.docx</URL>
                                                <URI>file:/var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects/yuusukeesukouboteiansho.docx</URI>
                                                <READ>true</READ>
                                                <WRITE>true</WRITE>
                                                <EXTENSION>docx</EXTENSION>
                                                <MODIFIED>2024-02-26 03:34:17</MODIFIED>
                                                <DATE>20240226</DATE>
                                                <DATEPATTERN>yyyyMMdd</DATEPATTERN>
                                                <TIME>033417000</TIME>
                                                <TIMEPATTERN>HHmmssSSS</TIMEPATTERN>
                                                <TYPE>application/open-office-1.x</TYPE>
                                                <PID>null</PID>
                                                <OID>null</OID>
                                                <FID>null</FID>
                                                <PROCESSOR>unknown</PROCESSOR>
                                            </METADATA>
                                        </OPENOFFICE>
                                    </tool>
                                    <tool name="OIS File Information" version="0.2">
                                        <fits xsi:schemaLocation="http://hul.harvard.edu/ois/xml/ns/fits/fits_output http://hul.harvard.edu/ois/xml/xsd/fits/fits_output.xsd">
                                            <fileinfo>
                                                <filepath>/var/archivematica/sharedDirectory/watchedDirectories/workFlowDecisions/extractPackagesChoice/Japanse_Example-362af7c6-6f21-4e54-b3d9-58110e778895/objects/yuusukeesukouboteiansho.docx</filepath>
                                                <filename>yuusukeesukouboteiansho.docx</filename>
                                                <size>51332</size>
                                                <fslastmodified>1708918457000</fslastmodified>
                                            </fileinfo>
                                        </fits>
                                    </tool>
                                    <tool name="ffident" version="0.2">
                                        <ffidentOutput xmlns="">
                                            <shortName>ZIP</shortName>
                                            <longName>ZIP Format</longName>
                                            <group>archive</group>
                                            <mimetypes>
                                                <mimetype>application/zip</mimetype>
                                            </mimetypes>
                                            <fileExtensions>
                                                <extension>zip</extension>
                                            </fileExtensions>
                                        </ffidentOutput>
                                    </tool>
                                    <tool name="Tika" version="1.3">
                                        <metadata xmlns="">
                                            <field name="Content-Type">
                                                <value>application/vnd.openxmlformats-officedocument.wordprocessingml.document</value>
                                            </field>
                                        </metadata>
                                    </tool>
                                </toolOutput>
                            </fits>
                        </premis:objectCharacteristicsExtension>
                    </premis:objectCharacteristics>
                    <premis:originalName>%transferDirectory%objects/ユースケース公募提案書.docx</premis:originalName>
                </premis:object>
            </mets:xmlData>
        </mets:mdWrap>
    </mets:techMD>
</mets:amdSec>

まとめ

METSFlaskを用いて、ArchivematicaのMETSファイルを視覚化する一例について紹介しました。METSファイルとMETSFlaskの視覚化結果を見比べることで、METSファイルの内容が理解しやすくなるように思いました。

Discussion