Open1

【Google Gemini 2.5】 Flash Preview TTS / Pro Preview TTS調査

ノーコール森本🤙AI電話SaaS CTOノーコール森本🤙AI電話SaaS CTO

Google AI Studioで生成

Flash Preview TTS

体感ほとんど人間と区別がつかない
https://x.com/1MoNo2Prod/status/1964537498027393387

Pro Preview TTS

Flashよりも1.2倍ほと生成速度が遅い
https://x.com/1MoNo2Prod/status/1964537842274873524

Gemini 2.5 Flash TTSのレスポンス速度のグラフ

10回試して4秒~9秒と分散が激しい。コンテキストキャッシュがあるのかと思ったが、同じコンテキストなのに時間が伸びたことがあったのでなさそう。

生成速度は実時間の2~3倍

  • 自然言語で表現を指定できる
  • 生成速度が低速
    から、流行りのTransformer系のTTSと予想