🐡
Hugging Face Spaceを用いたNDL古典籍OCRのウェブアプリ
概要
Hugging Face Spaceを用いたNDL古典籍OCRのウェブアプリを作成しました。以下でお試しいただけます。画像アップロードして、1分程度すると、OCR結果のテキストとJSONデータが表示されます。
本アプリの作成にあたっては、以下の記事を参考にさせていただきました。
使い分け
NDL古典籍OCRを試す環境として、Google Colabを用いたチュートリアルを別途用意しています。
上記では無料でGPUを使用することができるため、高速なOCR処理が可能です。一方、ノートブックの初回起動時に、関連するライブラリやモデルのダウンロードを行うため、4分程度のセットアップ時間がかかってしまう点等に課題があります。
一方、今回Hugging Face Spaceを用いた作成したアプリケーションでは、72時間連続して使用されない(2023年2月時点)限り、OCR処理を即座に実行することが可能です。さらに、Web APIによる利用も可能といった点が挙げられます。(APIによる利用については後述します。)ただし、無料枠ではGPUが使用できないため、1画像あたり1分程度の処理時間がかかる点が課題です。(有料枠でGPUを使用することもできます。)
APIによる利用
APIによる利用例を試すことができるノートブックを用意しました。504 Gateway Time-out
というエラーが発生してしまう場合もありますが、参考になりましたら幸いです。
まとめ
NDL古典籍OCRの精度(≠速度)を試してみる場合など参考になりましたら幸いです。
Discussion