👋

Google Colabを用いたNDL"古典籍"OCRアプリのチュートリアルを作成しました。

2023/01/25に公開

概要

Google Colabを用いたNDL"古典籍"OCRアプリを作成しました。以下のURLからお試しいただけます。

https://colab.research.google.com/github/nakamura196/ndl_ocr/blob/main/NDL古典籍OCRの実行例.ipynb

NDL古典籍OCRの説明は以下です。

https://github.com/ndl-lab/ndlkotenocr_cli

また、ノートブックの作成にあたっては、@blue0620さんのノートブックを参考にしています。ありがとうございます!

https://twitter.com/blue0620/status/1617888733323485184

今回作成したノートブックでは、入力フォーマットの追加や、Googleドライブへの保存機能などを追加しています。

使い方

NDLOCRアプリの使い方とほぼ同様です。以下の動画を参考にしてください。

https://youtu.be/46p7ZZSul0o

工夫

工夫した点として、認識結果をIIIFマニフェストの形に変換し、Miradorビューアで閲覧できるようにしました。具体的には、以下のような出力が得られます。

後者のリンクをクリックすることで、以下のようなMiradorビューアが表示され、認識結果を確認することができます。

このIIIFマニフェストファイルも、Googleドライブに格納しています。

参考

NDLOCRのチュートリアルについては、以下を参考にしてください。

https://zenn.dev/nakamura196/articles/b6712981af3384

Discussion