💭

Google Colabを用いたNDL古典籍OCRチュートリアルの不具合の修正および機能追加を行いました。

2023/04/12に公開3

概要

以下の記事で紹介している、Google Colabを用いたNDL"古典籍"OCRアプリのチュートリアルを作成しています。

https://zenn.dev/nakamura196/articles/59fe1c9e76de65

今回、以下の更新を行いました。

  • 利用条件の追加
  • 不具合の修正
  • IIIF Presentation API v3のマニフェストファイルの入力への対応

更新したノートブックは、これまでと同じ以下のURLでアクセスいただけます。

https://colab.research.google.com/github/nakamura196/ndl_ocr/blob/main/NDL古典籍OCRの実行例.ipynb

利用条件の追加

ノートブック自体はCC0でご利用ください。ただし、「NDL古典籍OCRアプリケーション」は国立国会図書館がCC BY 4.0ライセンスで公開するものですので、クレジットの表示をお願いいたします。また、OCR適用対象の資料の利用条件などについても、それぞれご確認ください。

不具合の修正

OCR結果が出力されない不具合が発生していました。また、ライブラリのインストールにも長い時間がかかるようになっていました。これらの2点を修正しています。

IIIF Presentation API v3のマニフェストファイルの入力への対応

これまで、IIIF Presentation API v2のマニフェストファイルの入力のみに対応していました。

今回、v3への対応を行いました。この検証にあたり、以下の記事で紹介したIIIF Presentation API v3のマニフェストファイルを使用しました。

https://zenn.dev/nakamura196/articles/86b588965cf7d2

まとめ

この間、不具合が発生しており申し訳ありません。NDL古典籍OCRの活用に役立つことができれば幸いです。

Discussion

molyb9594molyb9594

こんにちは。いつも利用させていただいています。ありがとうございます。
NDL古典籍OCRの実行例のノートブックについて、先月には問題なくOCR結果が出力されていました。
しかし、一昨日~今日に使ったところ、
実行したアプリは正常に完了し、通常通り出力先へのリンクが表示されますが、
リンク先の出力フォルダには、opt.jsonと空のフォルダが作成されるだけで、
本来だと空のフォルダ内に出力されるはずのOCR結果が生成されません。
単一の画像ファイルをアップロードする場合と、複数の既にダウンロード済みの画像ファイルを対象にする場合を試しました。
可能でしたら、ご対応いただければ幸いです。

nakamura196nakamura196

お知らせいただきありがとうございます。また不具合申し訳ありません。
修正しましたので、ご確認いただけますと幸いです。

molyb9594molyb9594

問題解消し、正常に処理できております。迅速にご対応くださり、ありがとうございました。