🖼️
画像生成AI DALL E3 vs Flux
この記事は株式会社ガラパゴス(有志) Advent Calendar 2024 の5日目です
今回は、画像生成AIの中で、API利用可能なDALL E3とFluxの品質比較をしたいと思います。
DALL E3とFluxの概要
DALL E3は、OpenAIが開発した最新の画像生成AIで、GPT-4との緊密な統合により、より正確で詳細な画像生成を実現しています。
Fluxは新進気鋭のAIスタートアップが開発した画像生成AIです。
両者ともに、API経由で画像を生成することが可能となっております。
比較
プロンプト(日本語)での比較
早速比較してみましょう。後ほど考察します。
※設定パラメタはデフォルト値としております
プロンプトはこちらです
この富士山の写真を再現するための主要な要素:
撮影設定:
日の出/日没時の光
湖畔からの構図
広角レンズ使用
長時間露光で水面の反射を強調
構図要素:
富士山を中心に配置
松の枝と桜による自然なフレーミング
水面の反射
夕焼け空と山の対比
色調:
ピンクがかったオレンジの空
青みがかった山と水面
シルエット化した松の木
水面に映る太陽の光跡
この写真は河口湖または山中湖から撮影されたもの
DALL E3
Flux Pro Ultra
プロンプト(英語)での比較
Key elements to recreate this photo of Mt. Fuji:
Shooting settings:
Sunrise/sunset light
Lakeside composition
Wide-angle lens used
Long exposure to emphasize reflections on the water
Compositional elements:
Mt. Fuji at the center
Natural framing with pine branches and cherry blossoms
Reflection on the water
Contrast between sunset sky and mountain
Color tones:
Pinkish-orange sky
Blueish mountain and water
Silhouetted pine tree
Sunlight trails on the water
This photo was taken from Lake Kawaguchi or Lake Yamanaka
DALL E3
Flux Pro Ultra
考察
- Dall E3は、英語でも日本語でも、画像の精度は変わらない
- Flux は、日本語はうまく動かない(動くけど、関係のないものを生成する)
- Dall E3は、ファンタジーな画像を生成しがちで、ディテールの作り込みが甘い
- Flux は、結構リアルに近い画像が生成される(水面に反射した富士山、桜・松の枝など、細かい部分で描写できる)
価格
DALL E3 / 1枚あたり
品質 | 解像度 | 金額 |
---|---|---|
Standard | 1024×1024 | $0.040 |
Standard | 1024×1792, 1792×1024 | $0.080 |
HD | 1024×1024 | $0.080 |
HD | 1024×1792, 1792×1024 | $0.120 |
Flux / 1枚あたり
モデル | 金額 |
---|---|
flux-dev | $0.025 |
flux-schnell | $0.003 |
flux-pro | $0.055 |
flux-1.1-pro | $0.040 |
flux-1.1-pro-ultra | $0.060 |
※replicateの金額です |
まとめ
基本、Fluxを利用するのが良いかと思います。
どうしても、日本語での生成をしたければ、DALL E3を選択するしかないです。(Fluxは、日本語の読み取りがほぼできない。上記生成結果は、マシな方です😇)
今AI Sheetsという弊社プロダクトを使えば、翻訳から画像生成まで一気通貫して生成することが可能です。もしよかったら、こちらまでお問合せください。
※現在は法人向けサービスとして提供させていただいております。
+α : Flux の進化は早く、短期間で通常の画像生成以外の機能もリリースされてます。これから触る人は、ぜひFluxを試してみてください!
Discussion