🐡

Hugging Face Spaceを用いたNDL古典籍OCRのウェブアプリ

2023/03/27に公開

概要

Hugging Face Spaceを用いたNDL古典籍OCRのウェブアプリを作成しました。以下でお試しいただけます。画像アップロードして、1分程度すると、OCR結果のテキストとJSONデータが表示されます。

https://huggingface.co/spaces/nakamura196/ndl_kotenseki_ocr

本アプリの作成にあたっては、以下の記事を参考にさせていただきました。

https://qiita.com/relu/items/e882e23a9bd07243211b

使い分け

NDL古典籍OCRを試す環境として、Google Colabを用いたチュートリアルを別途用意しています。

https://zenn.dev/nakamura196/articles/59fe1c9e76de65

上記では無料でGPUを使用することができるため、高速なOCR処理が可能です。一方、ノートブックの初回起動時に、関連するライブラリやモデルのダウンロードを行うため、4分程度のセットアップ時間がかかってしまう点等に課題があります。

一方、今回Hugging Face Spaceを用いた作成したアプリケーションでは、72時間連続して使用されない(2023年2月時点)限り、OCR処理を即座に実行することが可能です。さらに、Web APIによる利用も可能といった点が挙げられます。(APIによる利用については後述します。)ただし、無料枠ではGPUが使用できないため、1画像あたり1分程度の処理時間がかかる点が課題です。(有料枠でGPUを使用することもできます。)

APIによる利用

APIによる利用例を試すことができるノートブックを用意しました。504 Gateway Time-outというエラーが発生してしまう場合もありますが、参考になりましたら幸いです。

https://colab.research.google.com/github/nakamura196/ndl_ocr/blob/main/GradioのAPIを用いたNDL古典籍OCRの例.ipynb

まとめ

NDL古典籍OCRの精度(≠速度)を試してみる場合など参考になりましたら幸いです。

Discussion