Open1

Generate speech (Gemini 2.5 Flash Preview TTS) 音声再生

knaka Tech-Blogknaka Tech-Blog

概要

  • Generate speech 試すメモです。

[ 公開 2025/05/21 ]


操作

  • Google AI studio を開く
  • 左メニュー: Generate Media 押す
  • Gemini speech generation おす。

  • mode (右枠)
  • Single-speaker audio, Multi-speaker audio の、選択あり (一人、複数人の会話 みたいです。)
  • 今回は、Single-speaker 使いました。

  • 音声生成
  • 中央の枠に、文章を入力。
  • 下の 青いRun ボタン押す。
  • しばらくすると、音声生成されて、再生される。


  • ダウンロードする場合。
  • 下の再生ボタン枠の、右リンクを押すと。ダウンロードのメニュー押す。

参考プロンプト

  • 下記の、2行目から。音声再生されました。
温かく歓迎的な声でユーザーに挨拶します: 
こんにちは。
午後も、元気に作業しましょう。

  • 補足
  • 適当な記事の文章を geminiで文章概要に変換。上記のSingle-speaker audioで音声作成
  • ダウンロード。
  • stand.fm にアップしました。

https://stand.fm/episodes/682d9dc7949eeb074d20b23a


  • stand.fmの埋込部品( iframe ) をコピー
  • 個人ブログ等に、貼り付けると。再生ボタン配置できました。