Gemini 1.5 Pro/Flashが更新、コンテキストウインドウ2倍、価格値下げ
はじめに
日本時間2024年9月25日未明に、Gemini 1.5 ProとFlashが更新されると発表がありました。
Gemini 1.5 Pro 002
下記のようにGoogle AI Studioで既に使えるようになっています!
この新しいバージョンですが、コンテキストウィンドウがこれまで100万トークンだったのが、200万トークンと長くなり、動画理解や1,000ページのPDF処理などに対応できるようになりました。
100万トークンでもすごかったのですが、200万トークンとは。。。驚
さらに、有料枠のレート制限が、1,000 RPMに引き上げられたそうです。RPMとは、「Requests Per Minute」のことで1秒間に処理できるリクエスト数を指します。
また、2024年10月1日からGemini 1.5 Proが値下げするそうです。 これは、128Kトークン未満のプロンプトに対して、入力トークンで64%、出力トークンで52%、増分キャッシュトークンで64%の値下げとなるようです。全体的に半額ちょっと値下げされることになりそうですね!
Gemini 1.5 Flash 002
こちらもGoogle AI Studioで使えるようになっています!
有料枠のレート制限が、1,000 RPM から 2,000 RPM に引き上げられたそうです。
また、速度や品質も向上しているとのことです。
Gemini 1.5 Flash-8B Experimental
Gemini 1.5 Flash-8B Experimentalのアップデート版 (Gemini-1.5-Flash-8B-Exp-0924) がリリースされました。テキストおよびマルチモーダルユースケースで大幅なパフォーマンスの向上を実現されているそうです。
そもそも、これは何なのかですが、Gemini 1.5シリーズの小型モデルとして設計されているそうです。このモデルは、Gemini 1.5 Flashの8Bパラメーターバージョンでより軽量に動くLLMで現在実験的に公開されています。
生成AI界隈はLLMのフロンティア的な動きと、より軽量さを求めるSLMの動きがあります。
Flash-8Bは後者の動きを意識したものと考えられます。
さいごに
いかがでしたか。Geminiもますます便利になってきていますね!引き続き、生成AI界隈の動向を追っていけたらと思います!
Discussion