🔥

NDL古典籍OCR-Lite(ndlkotenocr-lite)をMac OSで使用する

2024/11/27に公開

概要

2024年11月26日にNDLラボから、NDL古典籍OCR-Liteが公開されました。

https://lab.ndl.go.jp/news/2024/2024-11-26/

本記事ではMac OSでの使用方法について紹介します。

使用方法(動画)

https://www.youtube.com/watch?v=NYv93sJ6WLU

使用方法(テキスト)

以下にアクセスします。

https://github.com/ndl-lab/ndlkotenocr-lite/releases/tag/1.0.0

一覧からmacosを含むものを選びます。またチップについても、合致するものを選択します。

リンクをクリックすると、以下のように、「ndlkotenocr-lite_v1.0.0_macos_m1.tar.gz」がダウンロードされます。

ダブルクリック等で展開すると、macosというフォルダの中に、「NDLkotenOCR-Lite」というアプリケーションが展開されます。

「NDLkotenOCR-Lite」というアプリケーションをダブルクリックして起動します。

ただし、初回実行時は、以下のような警告と共に開くことができません。

「プライバシーとセキュリティ」に移動して、「このまま開く」を押すことで、アプリケーションを開くことができます。

結果、以下が起動します。

処理対象と出力先を選択して「OCR」ボタンを押すことで、以下のように認識されました。

ここでは『源氏物語』(東京大学総合図書館所蔵)を使用しています。

出力結果としては、txt, json, xmlファイルが生成されました。

まとめ

現時点ではNDL古典籍OCR ver.3と比較すると、読み取り精度が平均して約2%程度低下するとのことですが、GPUがなくとも軽量なOCR処理が可能となった点は大きなメリットだと思います。

開発者および公開に関わった方々に感謝いたします。

Discussion