🐧

ChatGPTとStable Diffusionを利用してApp Storeに掲載するスクリーンショットの素材を作った話

2022/12/26に公開

はじめに

個人でiOSアプリ開発をしている水性ペンギンです。

最近マンガジャンキーというWebコミックの定期購読をサポートするアプリをリリースしました。
https://apps.apple.com/jp/app/id1643154011
https://app-liv.jp/5345804/

マンガジャンキーは漫画を扱うアプリなので、実際のアプリには現在連載中の漫画のサムネイルが並びます。そのためアプリの実際の動きをそのままストアのスクリーンショットとして利用してしまうと、アプリレビューでApp Store Review Guidelines 4.1 Copycatsに違反しているとみなされる可能性があります。

この問題を解決するために、スクリーンショットで利用する素材として架空の漫画を用意することにしました。

この記事では、今年大きな話題となったChatGPT[1]Stable Diffusion[2]を用いて架空の漫画のタイトルとサムネイルを生成し、スクリーンショットの素材として利用した事例について紹介します[3]

ChatGPTを利用した架空の漫画タイトルの生成

まず架空の漫画のタイトルをChatGPTを用いて生成します。ChatGPTなど使わずに己で考えた方が早いと思われるかもしれませんが、バラエティに富んだ十数個の架空の漫画のタイトルを考えるのは案外面倒です。

会話の一例を示します。「○○を考えて」のような会話は断る内容の返答をする場合があるので、根気よくRegenerate responseをします。

水性ペンギン:
漫画のタイトルを考えて

ChatGPT:
漫画のタイトルを考えるのは面白いですね。

いくつかのアイデアを提案します。

  1. "アイデア王子": 主人公が、新しいアイデアを次々と思いつく物語。
  2. "スクール・オブ・ライフ": 学校での学び方について、真剣に考える主人公たちの物語。
  3. "恋するデザイナー": 主人公がデザインの仕事をする中で、恋愛と仕事の両立を模索する物語。
  4. "旅する心": 主人公が旅をする中で、新しい場所や文化に出会い、自分自身を発見する物語。
  5. "未来を創るエンジニア": 主人公が、テクノロジーを活用して、未来を創造する物語。

この会話をさらに英語で回答してもらいます。英語で回答してもらう意図は大きく以下の2つです。

  • この後に利用するStable Diffusionの入力として英語のタイトルが欲しいため
  • DeepLなどの翻訳サービスでタイトル単体を翻訳するよりも、前後の文やコンテキストからよりネイティブな英文になることを期待して

水性ペンギン:
今の質問を英語で答えて

ChatGPT:
Sure! Here's my answer to your question in English:

"Can you think fo a title for a manga?"
Here are some ideas for manga titles:
(中略...)
5. "Creating the Future with Engineering": A story about a protagonist who uses technology to create the future.

These are just ideas, so you might also want to think of a title that suits you best.

お世辞にも売れそうなタイトルではありません(特にあらすじを読んでしまうと全く面白そうではありません)が、今回はスクリーンショットの素材なのでクオリティはこの程度で問題ないでしょう。

Stable Diffusionを利用した架空の漫画イラストの生成

次にStable Diffusionを用いて、先ほど生成したタイトルの漫画のイラストを生成します。ここでは、漫画のイラストを生成したいためアニメ調の画像に特化したAnything v3.0というファインチューニングモデルを使用します。

早速、入力文(以下プロンプト)と生成画像をいくつか紹介します。こちらもChatGPTと同様に気に入った結果になるまで再生成を繰り返す必要があります。

  1. 「未来を創るエンジニア」のイラスト

    プロンプト:
    {masterpiece}, {best quality}, {ultra-detailed}, {best illustration}, Thumbnail for a science fiction manga titled "Creating the Future with Engineering".

    ネガティブプロンプト:
    text, word, bad hands,bad body,bad proportions, error, missing fingers, missing arms, missing legs

  1. 「スーパーパワーズ」のイラスト

    プロンプト:
    {masterpiece}, {best quality}, {ultra-detailed}, {best illustration}, Thumbnail of a manga titled "Superpowers", in which a boy with super powers rises up to save the world.

    ネガティブプロンプト:
    text, word, bad hands,bad body,bad proportions, error, missing fingers,missing arms, missing legs

プロンプトとネガティブプロンプトに入力した文字列はそれぞれ元素法典という主に中国のコミュニティがまとめた資料を一部参考にしていますが、おおむね適当です。

大きな工夫をすることなく、かなり異なる絵柄の画像を生成できることが分かります。

スクリーンショットの作成

上記の手順で用意した素材を用いてスクリーンショットを作成します。完成したスクリーンショットは次のようになりました。

著作権を気にしてモザイクやプレースホルダーなどの長方形が並ぶよりも、かなり華やかになったのではないでしょうか。

まとめ

この記事では、ChatGPTやStable DiffusionなどのAI技術をツールとして用いてApp Storeに掲載するスクリーンショットに利用する素材を作成する流れを紹介しました。

今回はApp Store掲載時に利用する素材を作りましたが、AI技術の利用シーンは他にも多くあると思います。

ChatGPTやStable Diffusionなどの今年公開されたAI技術はただ触って楽しむだけのものではなく、実際のツールとして利用できるまでに進歩していると実感しました。皆さんもぜひAI技術を1つのツールとして自身のプロダクトに適用してみてください。

脚注
  1. OpenAIにより開発された対話型言語モデル。 ↩︎

  2. ミュンヘン大学の研究グループが開発したtext-to-imageモデル。 ↩︎

  3. この記事では、ChatGPTやStable Diffusionの導入方法は記事の本筋ではないため紹介しません。これらの導入方法は別途公式サイトなどを参照ください。 ↩︎

Discussion