🌟

Pythonだけで帳票の手書き文字をOCRで読みとる~その1~

2024/02/07に公開

はじめに

手書き帳票の数字を、別のシステムに入力するために転記することはありませんか?
めちゃくちゃめんどくさいし、すごい工数がかかる作業ですよね~
そこで、Pythonを使って、手書きの帳票をスキャナで読みとり、該当箇所の数字を読み取る
プログラムを作成してみたので紹介します。
さっさとプログラムを見たい方は以下より↓

コード全文

GitHubに公開してます。

該当業務の要件としては以下になります。

現状の業務の要件

  1. 手書きの帳票が集まってくる
  2. その帳票をスキャナでPDFとして読み取る
  3. 手書きの数字(8桁)+YYYYMMDDをPDFのファイル名にリネームする
  4. さらに手書きの数字(8桁)でフォルダを作成し、その中に上記のファイルを保存する

Pythonでおこなう処理の要件定義

上記、現状の要件のうち、3.と4.についてPythonで実施する。

  1. OCRで読みとるためにPDFをimage画像に変換する
  2. 手書き数字が書いてある位置を認識する
  3. pythonで読みとるためになんやかんやの処理を行う(長くなるので端折ります。また別で紹介します)
  4. 読みとった結果を確認するため、UI画面に結果を表示する
  5. 読みとり結果に間違いがあれば、UI画面上で修正する
  6. 修正が終われば、元のPDFファイルを読み取った数字+YYYYMMDDにリネームし、読み取った数字でフォルダを作成し、配下に保存する

以上

次からは、コードの詳細な処理内容を解説していこうと思います。

かんたんPythonプログラミングの教科書

Discussion