Cloudflare Workers AIのモデルまとめ
最近、CloudflareでもAIが使えることを知ったのでチャレンジしてみました!
でもモデルが多くて何を使ったらいいのか全くわからなかったので調べてみました。
※ Cloudfalreのドキュメントでは多くのMODEL TYPEが絞り込めるようになっていますがモデルが存在していなかったものに関してはここでは触れません。
どれくらいの数があるのか
2025年1月10日現在、62のモデルがあるようです。
(Betaのバッジがついているモデルが多いです)
Cloudflare Docsにて、利用できるモデルの検索をするページがあります。
今回はこのページにあるモデルの数を参照しています。
こんな感じのページでモデルの用途だったり公開している組織で絞り込むことができます。
Summarization - 要約
要約は、bart-large-cnnというモデルだけが使えます。
BARTはテキスト要約に優れており、大規模なデータセットで事前学習されているようです。
BARTは、「Bidirectional and Auto-Regressive Transformers」の略。
Text Embeddings- テキスト埋め込み
「テキスト埋め込みってなんやねん」ってなりますよね。
埋め込み表現(Embedding)とは、テキスト、画像、音声などのデータを数値ベクトルとして表現する手法です。この技術は、機械学習モデルやセマンティック検索アルゴリズムで広く利用されています。
出典:株式会社Digeon「埋め込み表現(Embedding)」より
つまり、テキストの類似性を扱うのが得意なので、用途として、検索エンジンだったりQAシステムに使える代物のようです。
Workers AIからはBAAIが提供するBGEというモデルの、small/base/largeの3種類が見つかりました。
BAAI調べたところ、中国にあるAIの研究院でした。こんな組織もあるんですね〜。
Beijing Academy of Artificial Intelligence(北京人工知能研究院)
Beijing General Embedding
Text Generation - テキスト生成
このMODEL TYPEが一番モデルの数が多かったです。
唯一、BetaじゃないモデルでLlamaというモデルがあったのでピックアップします。
ラマって呼ぶみたいです。
Workers AIのLlamaにはたくさんのモデルがありました。
実際Meta社のページを確認しましたが最新のバージョンが3.3で多くのバージョンが存在しています。
Workers AIにもひとつだけ3.3の表記があるllama-3.3-70b-instruct-fp8-fastというモデがありました。
バージョンごとの性能の違いについてはここでは割愛します。
Lammaについて詳しく知りたい方のために公式のページのリンク貼っておきます。
まとめ
普段はCursorを利用して開発している私ですが、まさかこんなに世の中にはAIモデルがあるとは思いませんでした!
モデルの利用は無料プランでも利用できますし、実装のハードルもかなり低いので気になっている方にはぜひチャレンジしてもらいたいです!
また、「Text Classification」「Text-to-Image」「Image-to-Text」「Translation」「Image Classification」「Automatic Speech Recognition」についてはモデルがなかったので紹介しませんでしたが、今後いろんな用途のモデルが増えることでCloudflareで実現できる幅が広がりそうです!期待してます!
ありがとうございました!!
Discussion