🙂

Dify v0.10.0 マルチモーダル化ついに実現!

2024/10/22に公開

🙂はじめに

日本時間2024年10月21日夕方に、Dify v0.10.0が公開されました!
今回のファイルアップロードの強化、本当に待ちに待っていてロードマップでは9月リリースになっていたのですが延期となりようやくこのタイミングでリリースとなりました。
これまで、Difyのワークフローではアップロードしたファイルを変数を使って自由に処理できず、例えばアップロードしたファイルをAPIを使って通信ができませんでした。
この機能が追加されたことにより、生成AIアプリの開発でつくれるアプリの幅が大きく広がると考えています。
https://github.com/langgenius/dify/releases/tag/0.10.0
https://x.com/DifyJapan/status/1848328793112612934

🧙マルチモーダルサポートの強化

ファイルアップロード機能の強化

「はじめに」でも書きましたが、ファイル処理の高度化が実現しました!
Difyのワークフロー画面で利用できるノード「START」、「LLM」、「HTTP Request」、「IF-ELSE」などがタイプ「ファイル」をシームレスに管理できるようになり、ワークフロー内での様々なファイル形式の処理が簡素化されました。
具体的には、sys.fileシステム変数で参照できるようになりました。
これが、本当に嬉しい機能強化!!!
また、画像アップロード機能はファイルアップロード機能に統合されました。有効にすると、LLMノードのビジュアル変数セレクターでsys.fileを選択することで、チャットウィンドウで画像やその他のファイルを参照できます。下記リファレンスが参考になります!
https://docs.dify.ai/ja-jp/guides/workflow/file-upload

ドキュメント抽出ノードとリスト演算子ノード

ドキュメント抽出機能:
ドキュメントをテキストに簡単に変換し、データ抽出が容易になりました。
リスト演算子:
配列のフィルタリング、ソート、制限を行う操作が可能になり、データの制御と操作が強化されました。

AIポッドキャストアプリケーションの構築が可能に

ワークフローは様々なドキュメント形式、音声ファイル、動画ファイルをサポートするようになり、AIアプリケーション開発の可能性がさらに広がりました。下記Difyの公式Blogが参考になります!
https://dify.ai/blog/introducing-dify-workflow-file-upload-a-demo-on-ai-podcast

✉️メールによる登録とログインの強化

これまでDifyのSaaSで使えたGitHubやGmailに加えて、今後は全てのメールでサインアップやログインができるようになったそうです!

🫡さいごに

待ちに待ったDifyのアップデートがありました!
以前、「DifyとNotionで領収書をOCRして管理!」という記事を投稿しましたが、Notionへはアップロードした画像ファイルを連携することができませんでした。
今回のアップデートでそういったユースケースにも対応できるようになっています!
時間を見て、画像ファイルを扱うユースケースも試してみようと考えています!
もちろん、結果はZenn記事として投稿して、みなさんへシェアします!
https://zenn.dev/acntechjp/articles/a018d81a790895

Accenture Japan (有志)

Discussion