Open4
ネタ
会社名
名前や会社名のような日本語の項目については、NLPモデルを使って識別の精度を向上させます。たとえば、BERTなどのモデルに事前学習済みの日本語データを使い、「氏名」や「会社名」としてふさわしい語彙を自動識別することが可能です。
目標
物体検出モデル: YOLO, Detectronなど
- テンプレートマッチング
テンプレートマッチングは、特定のレイアウト(テンプレート)を使って、書類内の項目位置を推定する方法です。基本の流れは以下の通りです:
基準となるテンプレートの準備
例えば、ある請求書のフォーマットが多く使われる場合、そのフォーマットに基づき「顧客名」や「金額」の位置情報をテンプレートとして用意します。
類似度の計算
新しい書類が与えられたとき、テンプレートの画像や文字レイアウトと比較し、どれだけ似ているかを計算します(OpenCVのテンプレートマッチング関数などが利用可能です)。
一致する位置を特定
テンプレートと一致した位置を見つけることで、新しい書類上でも「顧客名」や「金額」の位置を推定します。
テンプレートマッチングは、同じ書類フォーマットでの位置検出に有効ですが、異なるフォーマットの場合には適用が難しいため、複数のテンプレートを準備することが一般的です。