Zenn
🐭

Grokの画像生成APIを試してみた

2025/03/21に公開

はじめまして、ふっきーです
いつからかわからないけど、Grokの画像生成APIきてたので試してみました。

料金

呼び出しレートの制限あり、1秒間に5回のリクエストまで可能。個人的には制限はないに等しいかな
API利用料金は、1画像あたり、0.7ドル。 無料クレジットを考えると安い!

サンプル

簡単に画像生成の処理が実装できる

import os

from openai import OpenAI

XAI_API_KEY = os.getenv("XAI_API_KEY")
client = OpenAI(base_url="https://api.x.ai/v1", api_key=XAI_API_KEY)

response = client.images.generate(
  model="grok-2-image",
  prompt="A cat in a tree"
)

print(response.data[0].url)

複数枚の画像生成もOK

response = client.images.generate(
  model="grok-2-image",
  prompt="A cat in a tree"
  n=4
)
for image in response.data:
  print(image.url)

実際に作ってみた

大量の柴犬


いいね!!かわいい

日本の観光名所


富士山ですね。違和感なし

ミッキー○ウス

あまりにもまんまな画像が生成されたので、載せれませんでした。

くまのプーさん

プーさんは著作権切れているので、OKです。
ミッ○ーと同じようなクオリティで生成できました。

細かい指定のプロンプト

Claudeに作ってもらったプロンプトです。

# 幻想的な洞窟内の光の祭典

巨大な地下洞窟の中心部。天井からは青く輝く水晶が無数に垂れ下がり、自然の星空のように輝いています。洞窟の床には透明度の高い浅い湖があり、天井の光が水面に反射して幻想的な光の模様を描いています。

湖の中央には古代文明の遺跡を思わせる石の祭壇があり、その周りを様々な色の提灯を持った人々が取り囲んでいます。彼らは伝統的な衣装を身につけ、湖の中を歩きながら祈りを捧げています。

すごい!
"さまざまな色の提灯"、"伝統的な衣装を身につけ"と"湖の中を歩きながら"は、画像から読み取れなかったですが、それ以外は指定した通りの画像が生成されている感じがします。

まとめ

全然違和感ない画像が、高解像度で出力されている印象があります。
細かいプロンプトでもいけましたね!

誰か来たようなので、紹介はここまでにしておきます。

Discussion

ログインするとコメントできます