Cloudflare Workers AI が無料でAPIトークン無しで動かせて良かった
概要
Cloudflare が提供している Workers AI というサービスを使ってみた。結構良かったのでその紹介。
対象読者
- Cloudflare Workers を使っている人
- 自分のアプリに LLM を無料で組み込みたい人
- 既にLLMを使っているけどAPIトークンとか管理するのが嫌だと思っている人
きっかけ
AIを使った新しいサイトを作りたいと思っていた。
最近はもっぱら Cloudflare Workers を使っていて、そう言えば Workers AI というのがあったなと思って使ってみることにした。
エッジで動くAIらしい。
基本はオープンウェイトのモデルが使える。
料金はモデルによって違う。
何が良かったか
無料枠
なんと Workers AI には無料枠がある。API 経由で LLM を動かすサービスなのにだ。
どのくらい無料で使えるかというと、一日あたり 10k ニューロンまで無料、ということらしい。
ニューロンというのは多分各モデルのトークンを抽象化するための単位だと思う。安いモデルであればその分無料枠も広いということだ。
参考までに、gpt-oss-120b を入力1.31k、出力462トークン使用した場合に、ニューロンは 73.09 となった。

これは今回のサイトの用途だと単発のリクエストであるため、1日あたり100回以上使っても無料枠の範囲内ということになる。
チャットUIがあって、ある程度無料で使える代わりに広告が表示される、みたいなサービスはあるが、API が無料で使えるというのは寛大だ。広告が無いので Cloudflare 側はこの分完全に赤字だ。もちろんそれをカバーできる売上を AI によって出せるという判断なのだろう。
これだけ使えれば、少なくとも開発中に AI のためにお金がかかるということは避けられるのではないか。デプロイしてユーザー検証している期間ですらもある程度耐えられそうである。
秘密情報なしで使える
普通は API 経由で AI を使う場合は API トークンが必要で、それらを漏洩しないように環境変数に入れたり、シークレットマネージャー的なクラウドのサービスを使って管理したりするはずだ。
これが結構面倒で、チームメンバーに共有するときに気を使ったり、手元の情報を紛失したときにクラウドから取り出すことができなくて作り直す必要があったり、色々とかったるい。
しかし Workers AI の場合は、同じ Cloudflare の Workers で動いているプログラムから呼び出す場合には API トークンが要らない。「バインディング」という設定で Workers AI と繋いでやればいいだけである。

設定ファイルで管理することも当然可能で、 wrangler.toml に以下のように書くだけ。
[ai]
binding = "AI"
なんだこれ簡単すぎる。クラウド各社は見習ってほしい。
Workers サーバーサイドからの呼び出しは下記のようにする。
const response = await env.AI.run('@cf/openai/gpt-oss-120b', {
input: prompt
});
色んなモデルを使える
詳しくは models を見ていただきたいが、色んなモデルが用意されている。
gpt-oss や llama はもちろん、中華系のモデルもあるが、最新のが揃ってるわけでは無さそうな印象。
TTS や txt2img、 img2txt などのテキスト生成以外のモデルも使えそうだ。
注意点: 無料枠を超えると多分割高
OpenRouter と gpt-oss-120b の料金を比較してみる。(2025年11月8日現在)

$0.04/M input tokens | $0.40/M output tokens
一方 Workers AI の場合、、、

$0.35 per M input tokens, $0.75 per M output tokens
あまりに値段が違いすぎてたまげた。
Cloudflare の場合はエッジ環境からレスポンスが来るから速いとか、Workers との統合とか、色々と付加価値があるという体なのだろうがそれにしても高い。
なので、サイトに需要があることが確認できたら現実的には OpenRouter とか別の API に切り替えることになってしまうのではないかと思う。となると Workers AI は完全にピコ手個人開発者に無料で遊ばれるだけのおもちゃになってしまいそうな予感がするのだが大丈夫なのだろうか。。
作ったもの
生年月日とか性別とか諸々を入力すると人生を映画化してくれる Web アプリ。
感想
今回は Workers AI に無料枠があってしかも結構使えるというのが画期的だったので記事を書いてみたが、比較のために OpenRouter について調べたらそっちにも無料のモデルが結構あったりして、そういえばそうだったなーとか思い出した。
でも OpenRouter のは無料モデルは制限があったり安定しなかったりした記憶。とはいえ OpenRouter は料金が安くてイイなと思った。
Workers AI も価格競争に飛び込んで安価にモデルを提供してほしい。
Discussion