📝
iOSで利用できる機械学習系のText Recognitionフレームワークの調査
- iOS で画像から日本語の文字認識(OCR)をしたい
- Core MLは日本語に対応していない
- Google のフレームワークは最近リブランディングされたこともあり新しい情報と古い内容が混在していて探しづらい
- 結論は日本語を認識させるなら Firebase ML/Cloud Vision API を使うと良い
Core ML
- Vision
-
VNRecognizeTextRequest.recognitionLanguages
で言語指定できるようだが日本語には対応していない模様
ML Kit
- 公式
-
Use on-device machine learning
、オンデバイスで実行が可能 - ラテン文字のみ対応(日本語非対応)
- サンプルコード
- 新旧APIのマイグレーションについてはこちらのドキュメントを参照
Firebase ML/Cloud Vision API
- 公式
- クラウドAPI、内部的に GCP の Cloud Vision API を使用しているっぽい
- Text Recognition は日本語に対応
- サンプルコード
- 料金(有料)
- Blaze プランが必要(Sparkの無料プランでは使えない)
- Firebase の料金表 Firebase Pricing
- API の料金表 料金 | Cloud Vision API | Google Cloud
- 1000 ユニットまで無料、以降 $1.50/1000 ユニット
-
画像に対して適用される機能は、それぞれが請求対象となる「ユニット」です。たとえば、1 つの画像に対して顔検出とラベル検出を適用した場合、1 ユニットのラベル検出と 1 ユニットの顔検出に対して料金が請求されます。
まとめ
- 日本語を認識させるなら Firebase ML を使うとよい
Discussion