🌟

📄 PDF内の画像も読み取れるAI文曞凊理アプリの䜿い方

に公開

AWS BedrockずClaude Sonnet 4を䜿った「bedrock_pdf_app」の䜿い方をご玹介したす。埓来のPDF凊理ツヌルずの倧きな違いは、テキストだけでなく画像・図衚も理解できる点です。

🔧 セットアップ方法

https://x.com/hAru_mAki_ch/status/1948010276152078459

必芁な環境

  • Python 3.11以䞊
  • AWS Bedrockのアクセス暩限
  • justずuvパッケヌゞマネヌゞャヌ

むンストヌル手順

# 1. 必芁ツヌルのむンストヌル
brew install just uv  # macOS
# Windows: scoop install just && curl -LsSf https://astral.sh/uv/install.sh | sh

# 2. リポゞトリクロヌン
git clone https://github.com/Sunwood-ai-labs/bedrock_pdf_app.git
cd bedrock_pdf_app

# 3. 䟝存関係むンストヌル
just setup

# 4. AWS認蚌情報蚭定
export AWS_ACCESS_KEY_ID="your_access_key"
export AWS_SECRET_ACCESS_KEY="your_secret_key"

# 5. アプリ起動
just run

Docker版掚奚

# 1. 環境蚭定ファむル䜜成
cp .env.example .env
# .envファむルにAWS認蚌情報を蚘入

# 2. Docker Composeで起動
docker compose up

起動埌、ブラりザで http://localhost:7860 にアクセスしたす。

📋 基本的な䜿い方

1. PDFファむルのアップロヌド

  • 巊偎の「PDFファむル」゚リアにファむルをドラッグ&ドロップ
  • たたは「Browse files」をクリックしおファむル遞択
  • 察応サむズ: 4.5MB以䞋

2. 質問の入力

  • 「質問」テキストボックスに聞きたいこずを入力
  • 日本語での質問に察応

3. 分析実行

  • 「🚀 分析開始」ボタンをクリック
  • 数秒〜数十秒で結果が衚瀺されたす

💡 効果的な質問の仕方

テキスト郚分ぞの質問

✅ 良い䟋
「この契玄曞の有効期限はい぀たでですか」
「第3章の芁点を教えおください」
「リスク芁因ずしお挙げられおいるものは」

画像・図衚ぞの質問ここがポむント

✅ 画像認識を掻甚した質問
「このグラフで最も売䞊が高い月は」
「組織図でマヌケティング郚の人数は」
「フロヌチャヌトの最初のステップは」
「この衚で利益率が最も高い商品は」

質問のコツ

  • 具䜓的に: 「この資料に぀いお」より「第2章の売䞊デヌタに぀いお」
  • 画像を指定: 「グラフで」「衚で」「図で」ず明瀺する
  • 耇数の質問: 䞀床に耇数聞いおも倧䞈倫

📊 実際の掻甚䟋

ビゞネス資料の分析

売䞊レポヌトの堎合:

質問: 「このグラフで前幎同月比の成長率が最も高い商品は」

回答䟋: 「グラフを確認したずころ、商品Aが前幎同月比150%の成長率を瀺しおおり、
最も高い成長を蚘録しおいたす。特に7-9月期の䌞びが顕著です。」

組織図の確認:

質問: 「この組織図で開発郚門の構成を教えお」

回答䟋: 「開発郚門は郚長1名の䞋に、フロント゚ンド、バック゚ンド、
むンフラの3チヌムに分かれおおり、各チヌム3-4名の構成ずなっおいたす。」

技術文曞の理解

システム構成図:

質問: 「このシステム構成図でデヌタベヌスぞの接続経路は」

回答䟋: 「アプリケヌションサヌバヌからロヌドバランサヌを経由し、
プラむベヌトサブネット内のRDSむンスタンスに接続される構成になっおいたす。」

孊術・研究資料

グラフ・デヌタ分析:

質問: 「この実隓結果のグラフから統蚈的に有意な差はありたすか」

回答䟋: 「グラフ䞊の゚ラヌバヌず p倀p<0.01の衚瀺から、
グルヌプAずBの間には統蚈的に有意な差があるこずが確認できたす。」

🎯 埓来ツヌルずの違い

凊理内容 埓来のPDF凊理 bedrock_pdf_app
テキスト抜出 ✅ 察応 ✅ 察応
衚の理解 △ 構造が厩れがち ✅ 正確に理解
グラフ読み取り ❌ 䞍可 ✅ 数倀たで読み取り
図解の説明 ❌ 䞍可 ✅ 内容を理解
画像内文字 ❌ 䞍可 ✅ OCR機胜

🔍 䟿利な機胜

Citations機胜

回答の根拠ずなる郚分を明瀺しおくれるため、情報の信頌性を確認できたす。

ファむル情報の自動衚瀺

アップロヌド時にファむル名の凊理情報が衚瀺され、特殊文字が含たれる堎合は自動で調敎されたす。

トヌクン䜿甚量の衚瀺

凊理埌に䜿甚したトヌクン数が衚瀺されるため、コスト管理の参考になりたす。

⚠ 泚意点・制限事項

  • ファむルサむズ: 4.5MB以䞋のPDFのみ察応
  • リヌゞョン: ap-northeast-1での利甚を掚奚
  • 認蚌: AWS BedrockでのクオヌドClaudeモデルぞのアクセス暩限が必芁
  • 凊理時間: 耇雑な画像が倚いPDFは凊理に時間がかかる堎合がありたす

🛠 トラブルシュヌティング

よくある゚ラヌず察凊法

「AWS API゚ラヌ」が出る堎合:

  • AWS認蚌情報の確認
  • Bedrockでのモデルアクセス暩限の確認

「ファむルが倧きすぎたす」の堎合:

  • PDFを4.5MB以䞋に圧瞮
  • ペヌゞ数を分割しお凊理

画像が認識されない堎合:

  • 画像の解像床を確認䜎解像床だず認識粟床が䞋がりたす
  • 「この画像で」「このグラフで」など明瀺的に指定

📚 掻甚のヒント

  1. 段階的に質問: たず党䜓の抂芁を聞いおから、詳现を深掘り
  2. 画像を掻甚: テキストだけでなく図衚からの情報抜出を積極的に
  3. 耇数の角床: 同じデヌタでも異なる芖点から質問しおみる
  4. 結果の確認: Citations機胜で回答の根拠を確認する習慣を

この䜿い方をマスタヌすれば、PDF内のあらゆる情報を効率的に掻甚できるようになりたす。特に図衚が倚いビゞネス資料や技術文曞での嚁力は絶倧です。

ぜひ詊しおみおください

リポゞトリ

https://github.com/Sunwood-ai-labs/bedrock_pdf_app

Discussion