🌟
【Azure Document intelligence】- カスタム抽出モデルを作成する
執筆日
2024/11/5
やること
Azure Document intelligenceのカスタムモデルで抽出モデルを作成する。
前提
- Azure Document intelligenceのS0をデプロイ済みであること
- 学習用のドキュメントがMin5つあり、Blob storageのコンテナーに配置済みであること
プロジェクト作成する手順
1.Azure Document intelligenceから、Document intelligence Studioを開く
2. 「Custom extraction model」をクリックする
3. 「+ Create a project」をクリックする
4. Project名を入力し、Continueをクリックする
5. 該当のAzure Document intelligenceを選択し、Continueをクリックする
6. 学習用のドキュメントがあるBlobのコンテナーを選択し、Continueをクリックする
7. Create project をクリックする
8. Run layout をクリックする
学習→テスト
- 「+ Add a field」 をクリックする
- 4つから選択し、取得したい値を入力する
値について
Filed:文字の検出に使う。困ったらこれ。
Selection mark:チェックボックスの認識に使う。
Signature:署名があるかを認識するときに使う。
Table:ドキュメント内にテーブルがある際に使う。
※Selection mark以外は、Draw regionを使うのがおすすめです。
- 残り4つも同じように学習する
- 「Train」をクリックする
- ModelタブからモデルのStatusを確認し、succeededになっていることを確認する
※20~1時間ぐらいかかります - Testタブをクリックし、該当のモデルを選択する
- テストデータをアップロードする。
- 「Analyze options」をクリックし、テストを実施する
APIで使う方法
まとめ
Azure Document intelligenceのカスタムモデルの抽出モデルを作成しました。
それなりに高い精度ができるのでとても満足です。
学習方法も非エンジニアでもできるようなUIになっており、とてもいいなと思いました。
Discussion