💭
Azure AI Document IntelligenceでOCRしてみる【Azure portal】
Azure AI Document Intelligenceとは?
文書から情報を抽出、解析するためのサービスです。以前はAzure Form Recognizerと呼ばれていました。このサービスは、手動でのデータ入力や情報抽出の手間を大幅に軽減することを目的としています。以下は、Azure AI Document Intelligenceの主要な機能と特徴です。
主な機能
-
フォーム認識
フォームや請求書、領収書などの定型文書からフィールドデータを自動的に抽出します。
構造化データ(表やチェックボックスなど)も解析可能。 -
ドキュメントレイアウト解析
文書全体のレイアウトを解析し、テキスト、表、図表、見出しなどの要素を識別します。
文書の構造を理解し、情報を適切に分類。 -
エンティティ抽出
特定の情報(例えば、名前、日付、金額など)を文書から自動的に抽出します。
カスタマイズ可能なモデルを使用して、特定の業界や用途に特化したエンティティを抽出。 -
カスタムモデルのトレーニング
特定のフォーマットやレイアウトに合わせてカスタムモデルをトレーニングすることが可能。
自社の文書に特化したモデルを作成し、精度を向上。
Azure AI Document Intelligenceの構築
- Azure portalを開く
- 「Azure AI Services」を検索し、「Azure AI Services」をクリック
- 左タブの「Document intelligence」をクリック
- 「+作成」をクリック
- 必要なパラメータを選択し、「確認及び作成」をクリック
※今回はFreeを選択。
- 「作成」をクリック
- 作成されたことを確認
Document Intelligence Studio設定
- Document Intelligence Studio の「お試しください」をクリック
- Readの「Try it out」をクリック
- endpointとAPI Keyを入力し、「Continue」をクリック
※endpointとAPI Keyの取得方法
左タブの「キーとエンドポイント」をクリックし、エンドポイント,キー1を取得
- 「Finish」をクリック
参考資料
ドキュメントを読み取ってみる
- 以下の内容のPDFを作成
**ABC株式会社 社内規定**
**第1章 総則**
第1条(目的)
本規定は、ABC株式会社(以下、「会社」という)の業務運営および従業員の勤務に関する基本的事項を定め、全従業員が規律を守り、業務の効率化と職場環境の向上を図ることを目的とする。
第2条(適用範囲)
本規定は、会社に所属する全ての従業員に適用される。
**第2章 勤務**
第3条(勤務時間)
1. 会社の標準勤務時間は、午前9時から午後6時までとする。
2. 昼休みは午後12時から午後1時までの1時間とする。
3. 業務の都合により、上記の勤務時間を変更する場合がある。
第4条(休暇)
1. 年次有給休暇は、法定の基準に従い付与する。
2. その他の休暇(産前・産後休暇、育児休暇、介護休暇等)は、労働基準法および関連法令に基づき付与する。
**第3章 業務遂行**
第5条(職務遂行)
1. 従業員は、職務に対し誠実に取り組み、業務遂行にあたっては効率と品質を重視すること。
2. 会社の財産や機密情報を適切に管理し、不正利用を行わないこと。
第6条(報告義務)
従業員は、業務に関連する重要事項について速やかに上司に報告しなければならない。
**第4章 職場環境**
第7条(ハラスメント防止)
1. 会社は、職場におけるハラスメントを禁止し、全従業員が安心して働ける環境を提供する。
2. ハラスメントの疑いがある場合、従業員は速やかに上司または人事部に報告すること。
第8条(安全衛生)
1. 会社は、安全で健康的な職場環境を維持するために必要な措置を講じる。
2. 従業員は、安全衛生に関する規定を遵守し、事故防止に努めること。
**第5章 懲戒**
第9条(懲戒処分)
1. 従業員が本規定に違反した場合、会社はその行為の内容に応じて懲戒処分を行うことができる。
2. 懲戒処分の種類には、戒告、減給、停職、解雇などが含まれる。
**第6章 規定の改廃**
第10条(改廃手続)
本規定の改廃は、必要に応じて会社の経営会議の承認を経て行うものとする。
附則
本規定は、2024年5月18日より施行する。
---
以上がABC株式会社の基本的な社内規定となります。この規定は、従業員が業務を円滑に遂行し、健全な職場環境を維持するための指針として機能します。従業員は本規定を熟読し、遵守することが求められます。
- 「Browser for files」をクリックし、1で作成したPDFを上げる
- API versionを「2023-07-31」に変更
- 「Run analysis」をクリック
- 検出された箇所をバウンディングボックスで囲まれていることを確認
- Resultから詳細な情報をJSONで確認できる
まとめ
Azure AI Document IntelligenceでOCRをしてみました。
すごく簡単にできました。
Azure AI SearchとAzure AI Document IntelligenceでRAGシステムも作れるみたいなので、実装してみようかなと思います。
Discussion