🌟
Pythonだけで帳票の手書き文字をOCRで読みとる~その1~
はじめに
手書き帳票の数字を、別のシステムに入力するために転記することはありませんか?
めちゃくちゃめんどくさいし、すごい工数がかかる作業ですよね~
そこで、Pythonを使って、手書きの帳票をスキャナで読みとり、該当箇所の数字を読み取る
プログラムを作成してみたので紹介します。
さっさとプログラムを見たい方は以下より↓
コード全文
GitHubに公開してます。
該当業務の要件としては以下になります。
現状の業務の要件
- 手書きの帳票が集まってくる
- その帳票をスキャナでPDFとして読み取る
- 手書きの数字(8桁)+YYYYMMDDをPDFのファイル名にリネームする
- さらに手書きの数字(8桁)でフォルダを作成し、その中に上記のファイルを保存する
Pythonでおこなう処理の要件定義
上記、現状の要件のうち、3.と4.についてPythonで実施する。
- OCRで読みとるためにPDFをimage画像に変換する
- 手書き数字が書いてある位置を認識する
- pythonで読みとるためになんやかんやの処理を行う(長くなるので端折ります。また別で紹介します)
- 読みとった結果を確認するため、UI画面に結果を表示する
- 読みとり結果に間違いがあれば、UI画面上で修正する
- 修正が終われば、元のPDFファイルを読み取った数字+YYYYMMDDにリネームし、読み取った数字でフォルダを作成し、配下に保存する
以上
次からは、コードの詳細な処理内容を解説していこうと思います。
Discussion