🐭
Grokの画像生成APIを試してみた
はじめまして、ふっきーです
いつからかわからないけど、Grokの画像生成APIきてたので試してみました。
料金
呼び出しレートの制限あり、1秒間に5回のリクエストまで可能。個人的には制限はないに等しいかな
API利用料金は、1画像あたり、0.7ドル。 無料クレジットを考えると安い!
サンプル
簡単に画像生成の処理が実装できる
import os
from openai import OpenAI
XAI_API_KEY = os.getenv("XAI_API_KEY")
client = OpenAI(base_url="https://api.x.ai/v1", api_key=XAI_API_KEY)
response = client.images.generate(
model="grok-2-image",
prompt="A cat in a tree"
)
print(response.data[0].url)
複数枚の画像生成もOK
response = client.images.generate(
model="grok-2-image",
prompt="A cat in a tree"
n=4
)
for image in response.data:
print(image.url)
実際に作ってみた
大量の柴犬
いいね!!かわいい
日本の観光名所
富士山ですね。違和感なし
ミッキー○ウス
あまりにもまんまな画像が生成されたので、載せれませんでした。
くまのプーさん
プーさんは著作権切れているので、OKです。
ミッ○ーと同じようなクオリティで生成できました。
細かい指定のプロンプト
Claudeに作ってもらったプロンプトです。
# 幻想的な洞窟内の光の祭典
巨大な地下洞窟の中心部。天井からは青く輝く水晶が無数に垂れ下がり、自然の星空のように輝いています。洞窟の床には透明度の高い浅い湖があり、天井の光が水面に反射して幻想的な光の模様を描いています。
湖の中央には古代文明の遺跡を思わせる石の祭壇があり、その周りを様々な色の提灯を持った人々が取り囲んでいます。彼らは伝統的な衣装を身につけ、湖の中を歩きながら祈りを捧げています。
すごい!
"さまざまな色の提灯"、"伝統的な衣装を身につけ"と"湖の中を歩きながら"は、画像から読み取れなかったですが、それ以外は指定した通りの画像が生成されている感じがします。
まとめ
全然違和感ない画像が、高解像度で出力されている印象があります。
細かいプロンプトでもいけましたね!
誰か来たようなので、紹介はここまでにしておきます。
Discussion