Google Gemini:性能向上と価格引き下げで大幅アップデート
ブログのタイトルをプロンプトに入れてDall-E 3で作成
GoogleのGeminiモデル:大幅な更新と価格改定
Google Developers Blogにて、Geminiモデルに関する重要なアップデートが発表されました。この記事では、以下のURLで公開された情報をまとめています:
Updated production-ready Gemini models, reduced 1.5 Pro pricing, increased rate limits, and more
2024年9月24日、GoogleはGemini APIとGoogle AI Studioの上級プロダクトマネージャーであるLogan Kilpatrick氏とShrestha Basu Mallick氏の発表により、Geminiモデルの重要なアップデートを公開しました。このアップデートには、新しい本番用モデルのリリース、価格の大幅な引き下げ、パフォーマンスの向上など、多くの改善が含まれています。
主な更新内容
-
新しい本番用モデルのリリース
- Gemini-1.5-Pro-002
- Gemini-1.5-Flash-002
-
価格の大幅な引き下げ
- Gemini 1.5 Proの価格が50%以上引き下げ(128K未満のプロンプトの入力と出力の両方)
-
レート制限の引き上げ
- 1.5 Flashのレート制限が2倍に増加
- 1.5 Proのレート制限が約3倍に増加
-
パフォーマンスの向上
- 出力速度が2倍に向上
- レイテンシが3分の1に低減
-
デフォルトのフィルタ設定の更新
品質の向上
新しいGemini 1.5シリーズは、テキスト、コード、マルチモーダルタスクにおいて幅広い性能を発揮するよう設計されています。具体的には以下のような改善が見られました:
- MMLU-Pro(より難易度の高いMMULUベンチマーク)で約7%の向上
- MATHとHiddenMath(内部の競技数学問題ホールドアウトセット)ベンチマークで約20%の改善
- 視覚理解とPythonコード生成を測定する評価で2〜7%の向上
また、モデルの応答の全体的な有用性も向上し、コンテンツの安全性に関するポリシーと基準を維持しながら、より多くのトピックで有用な応答を提供できるようになりました。
Gemini 1.5 Proの価格改定
2024年10月1日より、Gemini 1.5 Proの価格が大幅に引き下げられます:
- 入力トークンの価格が64%引き下げ
- 出力トークンの価格が52%引き下げ
- 増分キャッシュトークンの価格が64%引き下げ
これらの価格改定は、128K未満のトークンを持つプロンプトに適用されます。
レート制限の増加
開発者がGeminiをより簡単に利用できるよう、有料プランのレート制限が以下のように増加されました:
- 1.5 Flash:2,000 RPM(従来の1,000 RPMから増加)
- 1.5 Pro:1,000 RPM(従来の360 RPMから増加)
今後数週間のうちに、さらなるレート制限の増加が予定されています。
出力速度の向上とレイテンシの削減
最新モデルの中核的な改善に加えて、過去数週間で1.5 Flashのレイテンシを大幅に削減し、1秒あたりの出力トークン数を大幅に増加させました。これにより、最も強力なモデルで新しいユースケースが可能になりました。具体的には以下の改善が見られます:
- 出力速度が2倍に向上
- レイテンシが3分の1に低減
実験的な新モデル
"Gemini-1.5-Flash-8B-Exp-0924"という名称の改良版実験モデルもリリースされました。このモデルは、テキストとマルチモーダルの両方のユースケースにおいて大幅な性能向上を含んでいます。
アクセス方法
これらの新しいGeminiモデルは、Google AI StudioとGemini APIを通じて無料で利用可能です。また、大規模な組織やGoogle Cloudの顧客向けには、Vertex AIでも利用可能です。
Googleは、これらの更新により、開発者がGeminiモデルを使用してより多くのイノベーションを生み出すことを期待しています。
Discussion