🎨

FLUX.1を使ってみた - 高品質画像生成AI!

2024/08/13に公開2

はじめに

生成AI、特に画像生成AI界隈でFLUX.1がすごいと話題になっていますね!
画像生成AIというとMidjourneyやStable Diffusionが有名ですが、凌駕する画像精度とも言われています。

FLUX.1とは

FLUX.1は、Stable Diffusionの開発者たちが設立したBlack Forest Labsが発表した最新の画像生成AIモデルです。FLUX.1は、120億ものパラメータを持ち、プロンプトに忠実に従う能力が高く評価されているそうです。特に、画像内に文字を正確に表示する能力が他のAIモデルと比べて優れており、デザインやマーケティングなどの分野で高品質なビジュアルコンテンツを作成するためのツールとして注目されています。

FLUX.1の特徴

プロンプトの忠実性:

FLUX.1は、プロンプトに対する応答性が高く、指示通りの画像を生成する能力があります。

高品質な画像生成:

人物の顔や手などの複雑なディテールを正確に描写する能力があり、写真と見間違うほどのリアリズムを実現します。

多様なモデルバリエーション:

FLUX.1は、用途に応じて3つのバリエーション(Pro、Dev、Schnell)を提供しており、それぞれが異なる特性を持っています。Proは商用利用向けの最高性能モデル、Devは非商用向けのオープンウェイトモデル、Schnellは個人利用に適した高速モデルです

他の画像生成AIとの比較

FLUX.1は、特にリアリズムやプロンプトの忠実性において優れており、オープンソースであるため自由度が高い点が特徴です。一方、Midjourneyは芸術的なスタイルと手軽さが魅力であり、用途に応じて使い分けることが推奨されます。FLUX.1は、今後の技術革新によりさらに高品質な画像生成が期待されるモデルです。

特徴 FLUX.1 Midjourney
自由度 オープンソースでカスタマイズ可能 規制が厳しく、特定テーマの制限あり
リアリズム 高いリアリズムとディテール描写 芸術的スタイルと高品質な出力
プロンプト忠実性 高いプロンプト追従性 意味理解と創造性重視
使用の難易度 技術的な知識が必要 手軽に使用可能

使ってみる

FLUX.1はWebサービスがあるのではなく、オープンソースで公開されているものです。いくつかのサイトで使用できるようで、この記事では「replicate」を使用しました。
https://replicate.com/black-forest-labs/flux-pro
試しに画像生成した画面が下記となります。生成速度が速かったです!

いくつかプロンプトと生成された画像を紹介します。

A Japanese woman sitting under cherry blossoms during hanami, enjoying a can of cola, traditional Japanese kimono, delicate cherry blossom petals falling, serene park setting, vibrant colors, warm afternoon sunlight, detailed facial expressions, relaxing atmosphere, calm and joyful mood, natural pose, photorealistic, masterpiece, best quality, ultra highres, original, extremely detailed, perfect lighting

A Japanese woman sitting under cherry blossoms during hanami, enjoying a can of cola, wearing a traditional Japanese kimono, realistic facial features, highly detailed skin and hair, photorealistic lighting and textures, serene park setting, soft and natural colors, warm afternoon sunlight, cherry blossom petals gently falling, relaxed and natural pose, calm and joyful expression, DSLR photography, shallow depth of field, masterpiece, best quality, ultra highres, original, extremely detailed, perfect lighting


いずれも、かなりの画質で出力されていますね!
これまで画像生成AIが苦手とされていた「指の描写」が正確になっていたのがかなり感動します!

さいごに

いかがでしたか。画像生成AIも進んできてますね!活用する場はたくさんあると思います。この記事が画像生成AIを触って活用するきっかけになると幸いです!

Accenture Japan (有志)

Discussion

幻燈舎 Gentosya幻燈舎 Gentosya

最近リリースされたxAIのGrok-2にはFLUX.1が統合されているようです。

Masanori YoshidaMasanori Yoshida

コメントありがとうございます!Grox-2も話題になっていますよね!私はまだ見れておらず、週末触ってみたい気持ちです!笑