Pythonを用いてTEI/XMLファイルをEPUBに変換する

2022/09/30に公開

概要

Pythonを用いてTEI/XMLファイルをEPUBに変換する機会がありましたので、その備忘録です。

TEI/XMLファイルをEPUBに変換する方法として、Oxygen XML Editorを使用する方法もありますが、今回は、Pythonのライブラリ「EbookLib」を使用します。以下の記事を参考にしました。

https://dev.classmethod.jp/articles/try-create-epub-by-python-ebooklib/

特に今回は、「校異源氏物語・本文テキストデータリポジトリ」で公開されているTEI/XMLファイルを対象として、縦書きのEPUBを作成することを目的とします。

変換方法

以下のノートブックにソースコードを記載しています。

https://colab.research.google.com/github/nakamura196/ndl_ocr/blob/main/Pythonを用いてTEI_XMLファイルをEPUBに変換する.ipynb

結果

以下のように、EPUBに対応したリーダーで、校異源氏物語のテキストを閲覧することができます。

HTMLとCSSに変更を加えることで、多様な表示を実現することができると思います。

TEI/XMLの活用にあたり、参考になりましたら幸いです。

Discussion