日本語対応オープンソースOCRの比較
はじめに
日本語対応のオープンソースの各種OCRの精度と時間を調べました。
・Tesseract
・PaddleOCR
・EasyOCR
それぞれの実行ソースは、Colabノートブックにまとめていますので、ご確認ください。
前処理、オプション等はしていないので、結果は参考までに。
2023/04/28 追記
GPUでの測定を追加して表にまとめました。
EasyOCRのCPUはかなり遅いけど、GPUは爆速でした。
Sample 1 - 555x418
Implementation | device | Time |
---|---|---|
Tesseract | CPU | 0.85s |
PaddleOCR | CPU | 1.52s |
EasyOCR | CPU | 3.90s |
Tesseract | GPU | 0.65s |
PaddleOCR | GPU | 1.28s |
EasyOCR | GPU | 0.12s |
Sample 2 - 2132x1113
Implementation | device | Time |
---|---|---|
Tesseract | CPU | 7.42s |
PaddleOCR | CPU | 9.60s |
EasyOCR | CPU | 51.34s |
Tesseract | GPU | 5.55s |
PaddleOCR | GPU | 6.17s |
EasyOCR | GPU | 1.62s |
結果
処理時間
Tesseract(0.85s) > PaddleOCR(1.52s) > EasyOCR(3.90s)
精度(主観あり。。。)
PaddleOCR > EasyOCR > Tesseract
処理時間
Tesseract(7.42s) > PaddleOCR(9.60s) > EasyOCR(51.34s)
精度(主観あり。。。)
PaddleOCR > EasyOCR > Tesseract
参考 - Google Cloud Vision
ポイ捨て禁止!
NO LITTER
清潔できれいな港区を
港区 MINATO CITY
マル 得 松のや
サービス券
コロッケ
1個
無料!
有効期限:2023年4月30日15時まで
※メインメニュー1食につき綴りの1枚がご利用頂けます。
※ご希望のサービス品を切取り、店舗で従業員へ直接
お渡し下さい。 ※配布時のご利用は頂けません。次回
以降ご利用ください。 ※本券を換金する事は出来ません。
マル 得松のや
サービス券
トッピング
ポテサラ
有効期限: 2023年4月30日15時まで
※メインメニュー1食につき綴りの1枚がご利用頂けます。
1 ※ご希望のサービス品を切取り、店舗で従業員へ直接
お渡し下さい。 ※配布時のご利用は頂けません。次回
以降ご利用ください。 ※本券を換金する事は出来ません。
1
マル 得松のや
サービス券
ふりかけ
たまご
ふりかけ
※ふりかけの種類は
選べません。
or
さけ
ふりかけ
有効期限:2023年4月30日15時まで
※メインメニュー1食につき綴りの1枚がご利用頂けます。
※ご希望のサービス品を切取り、店舗で従業員へ直接
お渡し下さい。 ※配布時のご利用は頂けません。次回
以降ご利用ください。 ※本券を換金する事は出来ません。
まとめ
処理時間と精度的には、PaddleOCRがよいです。
でも、残念ながら速度も精度もGoogle Cloud Visionが圧倒的によいです。。。
Discussion