🐈

校異源氏物語・本文テキストデータリポジトリで公開しているTEI/XMLを一部更新しました。

2024/06/28に公開

概要

以下のリポジトリで校異源氏物語のTEI/XMLファイルを公開しています。

https://github.com/kouigenjimonogatari

ここで公開しているTEI/XMLに対して、一部変更を加えましたので、備忘録です。

フォルダ構成

修正前のファイルは以下に格納しています。これまでから変更はありません。

https://github.com/kouigenjimonogatari/kouigenjimonogatari.github.io/tree/master/tei

更新したファイルは以下に格納しました。

https://github.com/kouigenjimonogatari/kouigenjimonogatari.github.io/tree/master/xml/lw

後述する修正を加えたXMLファイルが格納されています。

修正内容

スキーマの追加

以下のrngファイルを追加しました。

<?xml-model href="https://kouigenjimonogatari.github.io/lw/tei_genji.rng" type="application/xml" schematypens="http://relaxng.org/ns/structure/1.0"?>

このrngファイルは、使用するタグを限定し、かつ日本語訳を追加したものです。Romaで作成しており、rngファイルへの変換前のoddファイルもリポジトリに格納しています。

https://github.com/kouigenjimonogatari/kouigenjimonogatari.github.io/blob/master/lw/tei_genji.odd

Romaの使い方等については、以下を参考にしてください。

https://zenn.dev/nakamura196/articles/09ff9f6c2664e2

これにより、例えばOxygen XML EditorやLEAF Writerなどにおいて、候補として表示されるタグが限定され、一部日本語訳が表示されるようになります。

LEAF Writerでの表示例は以下をご確認ください。

https://leaf-writer.leaf-vre.org/edit?provider=github&owner=kouigenjimonogatari&ownerType=organization&repo=kouigenjimonogatari.github.io&path=xml%2Flw&filename=01.xml

CSSの追加

以下のcssファイルを追加しました。

<?xml-stylesheet type="text/css" href="https://kouigenjimonogatari.github.io/lw/tei_genji.css"?>

上記のスキーマの追加と同様、Oxygen XML EditorやLEAF Writerなどにおいて、追加したcssファイルに基づく表示に変更されました。

revisionDescの追加

revisionDesc要素を追加しました。今後の修正内容を記録していく予定です。

<revisionDesc status="published">
			<change when="2024-06-28" who="#snakamura">pb要素のfacs属性を修正しました。facsimile要素を修正しました。</change>
		</revisionDesc>

pb要素の変更

pb要素の記述方法を以下のように修正しました。

<pb corresp="#zone_0005" facs="https://dl.ndl.go.jp/api/iiif/3437686/R0000022/0,0,3445,4706/full/0/default.jpg" n="5"/>

facs属性に対して、画像のURLを与えることで、LEAF Writerなどにおいて、Image Viewerの利用が可能になりました。

facsimile要素の記述方法の変更

IIIFマニフェストやキャンバスとの対応付の方法について、以下のガイドラインを参考に、修正しました。

https://github.com/TEI-EAJ/jp_guidelines/wiki/IIIF画像とのリンク#2024-年度版

以下に、変更前と変更後を示します。

  • 変更前
   <facsimile>
      <surfaceGrp facs="https://dl.ndl.go.jp/api/iiif/3437686/manifest.json">
         <surface>
            <graphic n="https://dl.ndl.go.jp/api/iiif/3437686/canvas/22" url="https://dl.ndl.go.jp/api/iiif/3437686/R0000022/full/full/0/default.jpg" />
            <zone xml:id="zone_0005" lrx="3445" lry="4706" ulx="0" uly="0" />
         </surface>
  • 変更後
	<facsimile sameAs="https://dl.ndl.go.jp/api/iiif/3437686/manifest.json">
		<surface lrx="6890" lry="4706" sameAs="https://dl.ndl.go.jp/api/iiif/3437686/canvas/22" ulx="0" uly="0" xml:id="f001">
			<graphic height="4706px" sameAs="https://dl.ndl.go.jp/api/iiif/3437686/R0000022" url="https://dl.ndl.go.jp/api/iiif/3437686/R0000022/full/full/0/default.jpg" width="6890px"/>
			<zone lrx="3445" lry="4706" ulx="0" uly="0" xml:id="zone_0005"/>
		</surface>

IIIF Image APIの情報や画像のサイズに関する情報が追加され、より機械的に利用しやすい形になったかと思います。

まとめ

不完全な部分も多いかと思いますが、TEI/XMLの利用にあたり、参考になる部分がありましたら幸いです。

Discussion