📖

Google Gemini：性能向上と価格引き下げで大幅アップデート

2024/09/25に公開

ブログのタイトルをプロンプトに入れてDall-E 3で作成

 GoogleのGeminiモデル：大幅な更新と価格改定Google Developers Blogにて、Geminiモデルに関する重要なアップデートが発表されました。この記事では、以下のURLで公開された情報をまとめています：
Updated production-ready Gemini models, reduced 1.5 Pro pricing, increased rate limits, and more
2024年9月24日、GoogleはGemini APIとGoogle AI Studioの上級プロダクトマネージャーであるLogan Kilpatrick氏とShrestha Basu Mallick氏の発表により、Geminiモデルの重要なアップデートを公開しました。このアップデートには、新しい本番用モデルのリリース、価格の大幅な引き下げ、パフォーマンスの向上など、多くの改善が含まれています。

 主な更新内容新しい本番用モデルのリリース
Gemini-1.5-Pro-002
Gemini-1.5-Flash-002
価格の大幅な引き下げ
Gemini 1.5 Proの価格が50%以上引き下げ（128K未満のプロンプトの入力と出力の両方）
レート制限の引き上げ
1.5 Flashのレート制限が2倍に増加
1.5 Proのレート制限が約3倍に増加
パフォーマンスの向上
出力速度が2倍に向上
レイテンシが3分の1に低減
デフォルトのフィルタ設定の更新

 品質の向上新しいGemini 1.5シリーズは、テキスト、コード、マルチモーダルタスクにおいて幅広い性能を発揮するよう設計されています。具体的には以下のような改善が見られました：
MMLU-Pro（より難易度の高いMMULUベンチマーク）で約7%の向上
MATHとHiddenMath（内部の競技数学問題ホールドアウトセット）ベンチマークで約20%の改善
視覚理解とPythonコード生成を測定する評価で2〜7%の向上
また、モデルの応答の全体的な有用性も向上し、コンテンツの安全性に関するポリシーと基準を維持しながら、より多くのトピックで有用な応答を提供できるようになりました。

 Gemini 1.5 Proの価格改定2024年10月1日より、Gemini 1.5 Proの価格が大幅に引き下げられます：
入力トークンの価格が64%引き下げ
出力トークンの価格が52%引き下げ
増分キャッシュトークンの価格が64%引き下げ
これらの価格改定は、128K未満のトークンを持つプロンプトに適用されます。

 レート制限の増加開発者がGeminiをより簡単に利用できるよう、有料プランのレート制限が以下のように増加されました：
1.5 Flash：2,000 RPM（従来の1,000 RPMから増加）
1.5 Pro：1,000 RPM（従来の360 RPMから増加）
今後数週間のうちに、さらなるレート制限の増加が予定されています。

 出力速度の向上とレイテンシの削減最新モデルの中核的な改善に加えて、過去数週間で1.5 Flashのレイテンシを大幅に削減し、1秒あたりの出力トークン数を大幅に増加させました。これにより、最も強力なモデルで新しいユースケースが可能になりました。具体的には以下の改善が見られます：
出力速度が2倍に向上
レイテンシが3分の1に低減

 実験的な新モデル"Gemini-1.5-Flash-8B-Exp-0924"という名称の改良版実験モデルもリリースされました。このモデルは、テキストとマルチモーダルの両方のユースケースにおいて大幅な性能向上を含んでいます。

 アクセス方法これらの新しいGeminiモデルは、Google AI StudioとGemini APIを通じて無料で利用可能です。また、大規模な組織やGoogle Cloudの顧客向けには、Vertex AIでも利用可能です。
Googleは、これらの更新により、開発者がGeminiモデルを使用してより多くのイノベーションを生み出すことを期待しています。

GoogleのGeminiモデル：大幅な更新と価格改定

主な更新内容

品質の向上

Gemini 1.5 Proの価格改定

レート制限の増加

出力速度の向上とレイテンシの削減

実験的な新モデル

アクセス方法

Discussion