🙌

【Dify】- Difyで画像を活用する:問題とその解決策

に公開

執筆日

2025/4/25


つまずいた点

Difyのワークフローを作成している際に、LLMに画像を入力し、それを認識させる仕組みを試していました。

しかし、実行してみると「あれ?画像がLLMに渡っていないぞ...」という問題に直面しました。


解決策

画像をLLMで処理するには、事前にテキスト抽出を行う必要がありました。

以下のようにフローを組むことで、画像をLLMに渡して認識させることが可能になります:

  1. 画像を入力
  2. テキスト抽出処理を実行
  3. 抽出されたテキストをLLMに渡す



ヘッドウォータース

Discussion