📖

Google Gemini:性能向上と価格引き下げで大幅アップデート

2024/09/25に公開


ブログのタイトルをプロンプトに入れてDall-E 3で作成

GoogleのGeminiモデル:大幅な更新と価格改定

Google Developers Blogにて、Geminiモデルに関する重要なアップデートが発表されました。この記事では、以下のURLで公開された情報をまとめています:

Updated production-ready Gemini models, reduced 1.5 Pro pricing, increased rate limits, and more

2024年9月24日、GoogleはGemini APIとGoogle AI Studioの上級プロダクトマネージャーであるLogan Kilpatrick氏とShrestha Basu Mallick氏の発表により、Geminiモデルの重要なアップデートを公開しました。このアップデートには、新しい本番用モデルのリリース、価格の大幅な引き下げ、パフォーマンスの向上など、多くの改善が含まれています。

主な更新内容

  1. 新しい本番用モデルのリリース

    • Gemini-1.5-Pro-002
    • Gemini-1.5-Flash-002
  2. 価格の大幅な引き下げ

    • Gemini 1.5 Proの価格が50%以上引き下げ(128K未満のプロンプトの入力と出力の両方)
  3. レート制限の引き上げ

    • 1.5 Flashのレート制限が2倍に増加
    • 1.5 Proのレート制限が約3倍に増加
  4. パフォーマンスの向上

    • 出力速度が2倍に向上
    • レイテンシが3分の1に低減
  5. デフォルトのフィルタ設定の更新

品質の向上

新しいGemini 1.5シリーズは、テキスト、コード、マルチモーダルタスクにおいて幅広い性能を発揮するよう設計されています。具体的には以下のような改善が見られました:

  • MMLU-Pro(より難易度の高いMMULUベンチマーク)で約7%の向上
  • MATHとHiddenMath(内部の競技数学問題ホールドアウトセット)ベンチマークで約20%の改善
  • 視覚理解とPythonコード生成を測定する評価で2〜7%の向上

また、モデルの応答の全体的な有用性も向上し、コンテンツの安全性に関するポリシーと基準を維持しながら、より多くのトピックで有用な応答を提供できるようになりました。

Gemini 1.5 Proの価格改定

2024年10月1日より、Gemini 1.5 Proの価格が大幅に引き下げられます:

  • 入力トークンの価格が64%引き下げ
  • 出力トークンの価格が52%引き下げ
  • 増分キャッシュトークンの価格が64%引き下げ

これらの価格改定は、128K未満のトークンを持つプロンプトに適用されます。

レート制限の増加

開発者がGeminiをより簡単に利用できるよう、有料プランのレート制限が以下のように増加されました:

  • 1.5 Flash:2,000 RPM(従来の1,000 RPMから増加)
  • 1.5 Pro:1,000 RPM(従来の360 RPMから増加)

今後数週間のうちに、さらなるレート制限の増加が予定されています。

出力速度の向上とレイテンシの削減

最新モデルの中核的な改善に加えて、過去数週間で1.5 Flashのレイテンシを大幅に削減し、1秒あたりの出力トークン数を大幅に増加させました。これにより、最も強力なモデルで新しいユースケースが可能になりました。具体的には以下の改善が見られます:

  • 出力速度が2倍に向上
  • レイテンシが3分の1に低減

実験的な新モデル

"Gemini-1.5-Flash-8B-Exp-0924"という名称の改良版実験モデルもリリースされました。このモデルは、テキストとマルチモーダルの両方のユースケースにおいて大幅な性能向上を含んでいます。

アクセス方法

これらの新しいGeminiモデルは、Google AI StudioとGemini APIを通じて無料で利用可能です。また、大規模な組織やGoogle Cloudの顧客向けには、Vertex AIでも利用可能です。

Googleは、これらの更新により、開発者がGeminiモデルを使用してより多くのイノベーションを生み出すことを期待しています。

Discussion