画風をルール化する3ステップ
画風をルール化する3ステップ
画像生成AI(MidjourneyやStable Diffusionなど)で特定の画風を再現したいとき、真っ先に思いつくのが Describe 機能や Interrogate CLIP ではないでしょうか。
僕も最初はそうでした。好きな画像を投げて、返ってきたプロンプトをそのまま生成に使う。
でも、実際にやってみると「なんか違う」になりがちなんですよね。
構成要素(男性、帽子、青い背景)は合っているのに、筆のタッチや空気感が再現されず、まるで「フィルターをかけただけのコスプレ写真」のような出力になってしまう。
この記事では、ゴッホの自画像を題材に、画像の表面的な情報(タグ)ではなく、「描画のロジック」そのものを言語化し、全く新しい被写体に適用する手法を共有します。
※なお、本記事では著作権保護期間の満了したパブリックドメインの作品(ゴッホ)を題材としています。特定の現役作家の画風をLoRA等で無断複製することを推奨するものではありません。
なぜプロンプトの逆生成だけではうまくいかないのか
結論から言うと、Describe 機能が得意なのは「被写体の説明」であって、「画風の構造化」ではないからです。
AIに画像を分析させると、どうしても「男性がいる」「背景は渦を巻いている」といった名詞や形容詞の羅列になりがちです。
この記事では、これを便宜上「セマンティック・フィッティング(意味の適合)」と呼ぶことにしますが、単語が合っているだけでは、画風を拘束する力としては弱いんです。
必要なのは、その作家が筆を動かすときに無意識に行っていた「選択のルール(アルゴリズム)」を抽出すること。
「ひまわり」という単語ではなく、「なぜそこでその筆致を選んだのか」というロジックを言語化しない限り、再現性は高まりません。
ここからは、LLM(ChatGPTやGeminiなど)を壁打ち相手に使って、その「暗黙のルール」を抽出した3つのステップを紹介します。
Step 1:「何が描かれているか」ではなく「描かない制約」を探る
最初のステップは、AIへの問いかけを変えることです。
普通に分析させると「青い服を着た男」と返ってくるので、あえて「描画する際の不変の条件(制約)は何か」を聞き出します。
今回はゴッホの作品3枚をLLMにアップロードし、こんな風に聞いてみました。
プロンプト例:
「これらの図を生成する際には、どのような不変条件がありますか?」

AIの回答を見ると、「写実的な色(現実に見える色)ではなく」や「写真のような正確な比率よりも……形を歪める(デフォルメ)」といった記述が出てきました。
スタイルを成立させているのは、色や形を「あえて写真のようには描かない(写実性の放棄)」という強い制約であることがここから読み取れます。
▼ 実際のAIによる分析結果

Step 2:N=1ではなく「共通項」から法則を見つける
1枚の画像から得られる情報は、あくまでその絵固有の結果に過ぎません。それがスタイルの本質なのか、たまたまその絵だけそうだったのか、1枚だけでは判断できません。
そこで、「同じスタイルだけど、描かれている中身(被写体)が違う」画像を複数枚用意します。
今回は「自画像」「郵便配達人」「画家としての自画像」を横並びにして、共通するベクトルを探らせました。
プロンプト例:
「これらの図を生成する際には、どのような共通性がありますか?」

ここで面白かったのが、AIが筆致について「単なる塗りつぶし」ではなく「形のボリュームや『気の流れ』を説明するための動き」という解釈を出してきた点です。
表面的なテクスチャ(Texture)ではなく、エネルギーの方向性(Flow)というレベルで共通項が見つかれば、プロンプトの精度は一気に上がります。
▼ 視覚情報だけでなく「意図」まで抽出された様子

Step 3:構造化して「仕様書」に落とし込む
羅列したままではプロンプトとして使いにくいので、最後にこれを「画像生成AIが理解しやすい深層構造」に変換します。
具体的には、以下の4つのモジュールに分解して整理させました。
- 空間と構図
- 光と雰囲気
- 色彩と質感
- 制限とルール
プロンプト例:
「以上の内容を統合し、空間と構図、光と雰囲気、色彩と質感、制限とルールの4つのパートに分けて、スタイルをより的確に抽出するための仕様書を作成してください。」

出力を見て驚いたのが、単なるキーワードの羅列ではなく、「【禁止】純粋な黒の使用」「【必須】指向性のあるストローク」といった具体的なルールまで定義された点です。
こうすることで、「厚塗り(Impasto)」や「補色対比」といった言葉が、相互に関係し合う「スタイルの仕様書(アルゴリズム定義)」として構造化されたわけです。
▼ 生成されたスタイルの仕様書

最終結果:ロジックを現代に適用する
できあがった仕様書(プロンプトのロジック)を使って、全く新しい被写体を描かせてみます。
被写体は「現代的なスーツを着た男性」。でも、画風のOS(描画ロジック)はゴッホのものを適用します。
結果はこちら。

元の画像を Image to Image で変換したわけではありません。
それでも、筆のタッチ、色の対比、そして「まなざし」の強さなど、参照元のスタイルが巧みに継承されているのがわかると思います。
まとめ
AI画像生成において、意図通りに画風をコントロールするためには、以下の視点が役立ちます。
- Describeだけに頼らない: もちろんタグ出しには便利ですが、それだけで画風はコピーできません。
- 制約(何を描かないか)に着目する: 「何を描かないか」というルールが、その画風の個性を決定づけます。
- 構造化する: 空間・光・色・ルール。この4要素でロジックを固めると再現性が上がります。
特定の画像を複製するのではなく、この「ロジック」を抽出して再利用するという考え方は、他の作家や写真のスタイル分析にも応用できるはずです。
ぜひ皆さんも、手持ちの画像でこの3ステップを試してみてください。
Discussion