🖼️

画像生成AI DALL E3 vs Flux

2024/12/05に公開

この記事は株式会社ガラパゴス(有志) Advent Calendar 2024 の5日目です

今回は、画像生成AIの中で、API利用可能なDALL E3とFluxの品質比較をしたいと思います。

DALL E3とFluxの概要

DALL E3は、OpenAIが開発した最新の画像生成AIで、GPT-4との緊密な統合により、より正確で詳細な画像生成を実現しています。
Fluxは新進気鋭のAIスタートアップが開発した画像生成AIです。
両者ともに、API経由で画像を生成することが可能となっております。

比較

プロンプト(日本語)での比較

早速比較してみましょう。後ほど考察します。
※設定パラメタはデフォルト値としております
プロンプトはこちらです

この富士山の写真を再現するための主要な要素:
撮影設定:

日の出/日没時の光
湖畔からの構図
広角レンズ使用
長時間露光で水面の反射を強調

構図要素:

富士山を中心に配置
松の枝と桜による自然なフレーミング
水面の反射
夕焼け空と山の対比

色調:

ピンクがかったオレンジの空
青みがかった山と水面
シルエット化した松の木
水面に映る太陽の光跡

この写真は河口湖または山中湖から撮影されたもの

DALL E3

Flux Pro Ultra

プロンプト(英語)での比較

Key elements to recreate this photo of Mt. Fuji:
Shooting settings:

Sunrise/sunset light
Lakeside composition
Wide-angle lens used
Long exposure to emphasize reflections on the water

Compositional elements:

Mt. Fuji at the center
Natural framing with pine branches and cherry blossoms
Reflection on the water
Contrast between sunset sky and mountain

Color tones:

Pinkish-orange sky
Blueish mountain and water
Silhouetted pine tree
Sunlight trails on the water

This photo was taken from Lake Kawaguchi or Lake Yamanaka

DALL E3

Flux Pro Ultra

考察

  • Dall E3は、英語でも日本語でも、画像の精度は変わらない
  • Flux は、日本語はうまく動かない(動くけど、関係のないものを生成する)
  • Dall E3は、ファンタジーな画像を生成しがちで、ディテールの作り込みが甘い
  • Flux は、結構リアルに近い画像が生成される(水面に反射した富士山、桜・松の枝など、細かい部分で描写できる)

価格

DALL E3 / 1枚あたり

品質 解像度 金額
Standard 1024×1024 $0.040
Standard 1024×1792, 1792×1024 $0.080
HD 1024×1024 $0.080
HD 1024×1792, 1792×1024 $0.120

Flux / 1枚あたり

モデル 金額
flux-dev $0.025
flux-schnell $0.003
flux-pro $0.055
flux-1.1-pro $0.040
flux-1.1-pro-ultra $0.060
※replicateの金額です

まとめ

基本、Fluxを利用するのが良いかと思います。
どうしても、日本語での生成をしたければ、DALL E3を選択するしかないです。(Fluxは、日本語の読み取りがほぼできない。上記生成結果は、マシな方です😇)
今AI Sheetsという弊社プロダクトを使えば、翻訳から画像生成まで一気通貫して生成することが可能です。もしよかったら、こちらまでお問合せください。
※現在は法人向けサービスとして提供させていただいております。

+α : Flux の進化は早く、短期間で通常の画像生成以外の機能もリリースされてます。これから触る人は、ぜひFluxを試してみてください!

AI Sheets

株式会社ガラパゴス(有志)

Discussion