Closed7
記事【GPTが人知れず既存の名刺管理アプリを抹殺していた話】で使われた技術の理解を深める
ピン留めされたアイテム
FastAPI
Pythonのwebフレームワーク
🔃 コードを書くとSwagger UIが自動生成される
✅ 型安全
💨 高速
OCR
OCR(Optical Character Recognition/Reader、オーシーアール、光学的文字認識)
手書きや印刷された文字を、イメージスキャナやデジタルカメラによって読みとり、コンピュータが利用できるデジタルの文字コードに変換する技術。
OCRができるサービス
- Google Cloud Vision API
- Googleが提供している画像認識サービス
- さまざまな画像認識系の機能が備わっていおり、その一つに手書き文字の検出(OCR)がある
- Amazon Textract
- AWSが提供している印刷されたテキスト、手書きの文字、レイアウト要素、データを、あらゆるドキュメントから自動的に抽出サービス
- Googleが提供している画像認識サービス
ChatGPTの活用
OCRで検出した文字を保存に適した構造、ここではJSONに変換する処理をChatGPTが担っている。
Whath Stein
GoogleSpreadSheetと連携することができるサービス。
スプシに対して、read writeすることが可能。
スプシちょっとしたDBとして活用することも可能。
参考記事 : https://qiita.com/masuraoProg/items/efaa6397d2d5409c968b
LINE Botの作成方法
どうやって、LINEに投稿された画像を取得できる?
- LINEが提供しているMessage APIで実現可能
- Webhook機能でメッセージが投稿されたタイミングでこっちが用意したサーバにPOSTを投げることが可能
このスクラップは2024/03/05にクローズされました