Closed7

記事【GPTが人知れず既存の名刺管理アプリを抹殺していた話】で使われた技術の理解を深める

persimmonpersimmon

OCR

OCR(Optical Character Recognition/Reader、オーシーアール、光学的文字認識)

手書きや印刷された文字を、イメージスキャナやデジタルカメラによって読みとり、コンピュータが利用できるデジタルの文字コードに変換する技術。

persimmonpersimmon

OCRができるサービス

  • Google Cloud Vision API
    • Googleが提供している画像認識サービス
      • さまざまな画像認識系の機能が備わっていおり、その一つに手書き文字の検出(OCR)がある
    • Amazon Textract
      • AWSが提供している印刷されたテキスト、手書きの文字、レイアウト要素、データを、あらゆるドキュメントから自動的に抽出サービス
persimmonpersimmon

ChatGPTの活用

OCRで検出した文字を保存に適した構造、ここではJSONに変換する処理をChatGPTが担っている。

このスクラップは2024/03/05にクローズされました