Open1

Gemini 1.5 Proの機能追加いろいろ(オーディオ、FC、JSON対応など)

JJJJ

https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html

  • オーディオ解釈: Gemini 1.5 Proは、オーディオ(音声)理解機能を備え、Google AI StudioとGemini APIの両方で利用可能に
  • File API: ファイルの取り扱いを容易にする新しいFile APIが導入
  • システム指示: モデルの出力を制御するためのシステム指示が、Google AI StudioとGemini APIで利用可能に
  • JSONモード: モデルにJSONオブジェクトのみを出力させるモード
  • Function Callingの改善: モデルの出力を制限するモードを選択できるようになり、信頼性が向上
  • テキスト埋め込みモデル: 新しいテキスト埋め込みモデル「text-embedding-004」が、MTEBベンチマークで既存のモデルを上回る性能を発揮