🌟

【Azure Document intelligence】- カスタム抽出モデルを作成する

2024/11/05に公開

執筆日

2024/11/5

やること

Azure Document intelligenceのカスタムモデルで抽出モデルを作成する。

前提

  • Azure Document intelligenceのS0をデプロイ済みであること
  • 学習用のドキュメントがMin5つあり、Blob storageのコンテナーに配置済みであること

プロジェクト作成する手順

1.Azure Document intelligenceから、Document intelligence Studioを開く
2. 「Custom extraction model」をクリックする

3. 「+ Create a project」をクリックする

4. Project名を入力し、Continueをクリックする

5. 該当のAzure Document intelligenceを選択し、Continueをクリックする

6. 学習用のドキュメントがあるBlobのコンテナーを選択し、Continueをクリックする

7. Create project をクリックする

8. Run layout をクリックする

学習→テスト

  1. 「+ Add a field」 をクリックする
  2. 4つから選択し、取得したい値を入力する
値について

Filed:文字の検出に使う。困ったらこれ。
Selection mark:チェックボックスの認識に使う。
Signature:署名があるかを認識するときに使う。
Table:ドキュメント内にテーブルがある際に使う。
※Selection mark以外は、Draw regionを使うのがおすすめです。

  1. 残り4つも同じように学習する
  2. 「Train」をクリックする
  3. ModelタブからモデルのStatusを確認し、succeededになっていることを確認する
    ※20~1時間ぐらいかかります
  4. Testタブをクリックし、該当のモデルを選択する
  5. テストデータをアップロードする。
  6. 「Analyze options」をクリックし、テストを実施する

APIで使う方法

https://zenn.dev/headwaters/articles/e768f7d9a76bed

まとめ

Azure Document intelligenceのカスタムモデルの抽出モデルを作成しました。
それなりに高い精度ができるのでとても満足です。
学習方法も非エンジニアでもできるようなUIになっており、とてもいいなと思いました。

ヘッドウォータース

Discussion