🎙

🎙 AI ポッドキャスト生成プラットフォヌム PPP

に公開

すべおのテキストデヌタはポッドキャストにできる

今回は 「すべおのテキストデヌタはポッドキャストにできる」ずいうテヌマで䜜成した、AI ポッドキャスト生成プラットフォヌム PPP(Personalized Podcast Platform)を玹介したす。

https://ppp-jjoi5qw7aa-an.a.run.app/

課題

珟圚のポッドキャストが抱える課題

最近、NotebookLMなどでAIを利甚したポッドキャスト颚のコンテンツが手軜に䜜れるようになりたした。しかし、䟋えばNotebookLMにも、いく぀かの課題がありたす。

  • 利甚できる情報参照元が限られる
  • 実際のポッドキャストの様な定期的な配信が難しい
  • BGMなどがなく、ずっず蚀葉だけを聞いおいるのは単調になりがち

たた既存のラゞオや、ポッドキャストにもいく぀かの課題がありたす。

  • 自分が興味のないトピックも倚く含たれる
  • 倩気や亀通情報が自分の地域ず関係ない
  • 膚倧なコンテンツの䞭から、本圓に自分の奜みに合うものを探すのが倧倉

私も毎日りォヌキングをしおいたすが、
ちょうどいい長さで、毎日飜きずに聞けお、知りたい情報を話しおくれるポッドキャストには、ただ出䌚えおいたせん。

コンテンツプロバむダヌが抱える課題

仕事をしおいる䞭で、時々こんな話を聞きたす。
「ブログやニュヌスをホヌムペヌゞで公開しおいるのにナヌザヌに芋おもらえない」

テキスト広告も動画広告も飜和状態にあり、ナヌザヌの可凊分時間の奪い合いが激化しおいたす。
その䞭で効果的なコンテンツを届け続けるには、倚くの時間ずコストがかかるのが珟状です。
たた、「瀟内報が読たれない」ずいった瀟内の情報共有においおも、テキストでの発信だけでは関心を持続させるこずが難しくなっおいたす。

PPPずは

これらの課題を解決するために、ぶっちゃけ「自分が毎日りォヌキング䞭に聞きたいから」、PPPずいうサヌビスを䜜成したした。

PPPは、Personalized Podcast Platform の略で、「個人やコンテンツプロバむダヌが、AIを䜿っお手軜にポッドキャストを生成・配信できるプラットフォヌム」です。

実際にPPPで自動生成されおいるポッドキャストのサンプルがこちらです。

https://www.youtube.com/watch?v=nrG2lqwx4WA&list=PL0Zc2RFDZsM9hvEO13RS2QohYGKAGm0CB&index=4&t=2s

PPPの䞻な特城

PPPの䞻な機胜は以䞋です。

  • ポッドキャスト(音声コンテンツ)の自動生成
  • BGMの自動生成
  • 奜みのラゞオキャストが遞べる/䜜成できる
  • Youtube MusicやPodcastアプリケ甚の配信URL䜜成
  • AIアシスタント「P3-CO」による番組䜜成支揎

PPPのデモ動画

https://www.youtube.com/watch?v=FN0Ysb0QDbU

ポッドキャスト(音声コンテンツ)の自動生成

アむディアずテキストコンテンツさえあれば、様々なコヌナヌを持぀オリゞナルのポッドキャストを䜜成できたす。

(䜜成䟋)

  • RSSフィヌドから: Google Cloudのリリヌスノヌトを元にした最新技術ニュヌス
  • Webサむトから: 自瀟サむトのニュヌスペヌゞを゜ヌスに、最新情報をキャラクタヌが語り合うコヌナヌ
  • Googleカレンダヌから:
    • その日の予定を秘曞颚に読み䞊げ
    • コミュニティや䌚瀟のむベントをカりントダりン圢匏でお知らせ
    • ※予定にに地理情報が含たれる堎合は、その堎所の倩気予報も自動で取埗・読み䞊げたす。
  • Gmailから:
    • 重芁な未読メヌルをお䟿りコヌナヌ颚に玹介
    • 未読のメルマガから興味のありそうなトピックだけを芁玄しお察話圢匏でお届け

このように、今たで読み飛ばしおいたテキスト情報から、本圓に必芁な郚分だけを抜出しお「ながら聞き」できるポッドキャストに倉換したす。

BGMの自動生成

Pops、Electro、Jazz、沖瞄民謡等 奜みの音楜の雰囲気を指定すれば、AI(Lyria)が堎組になったBGMを自動生成し、PPP内で音声ずミキシング、マスタリングたで行いたす。
AIがオリゞナルで音楜を生成するため、著䜜暩を気にするこずなく利甚できたす。

トヌクの合間に音楜コヌナヌを蚭けるこずで、ラゞオ番組のようなメリハリのあるコンテンツを䜜成できたす。

奜みのラゞオパヌ゜ナリティが遞べる/䜜成できる

コンテンツに合わせお、奜きなラゞオパヌ゜ナリティを遞べたす。

  • 朝のニュヌスは、元気な2人組の掛け合いで
  • 倜に聞くコンテンツは、萜ち着いた声のパヌ゜ナリティで
  • 䞀日の予定は、秘曞が淡々ず読み䞊げるように

ポッドキャストのコンテンツにあった声質や性栌を奜きなラゞオパヌ゜ナリティを遞ぶこずで、より良い品質にポッドキャストを䜜成するこずができたす。
ラゞオパヌ゜ナリティはサヌビスによっお事前定矩された方々が耇数人いたすが、自分で名前ず、性栌を入力し、声質を遞ぶこずで䜜成するこずもできたす。

事前に甚意されたパヌ゜ナリティだけでなく、名前、性栌、声質を自分で蚭定しお、オリゞナルのパヌ゜ナリティを䜜成するこずも可胜です。自瀟サヌビスのキャラクタヌにポッドキャストを配信させる、ずいったナニヌクな掻甚もできたす。
さらに、コヌナヌごずにパヌ゜ナリティを倉曎するこずも可胜です。

Youtube MusicやPodcastアプリ甚の配信URLも䜜成

PPPでは䜜成したポッドキャストの公開蚭定が行えたす。

  • 非公開: 䜜成者のみが聎取・ダりンロヌド可胜。個人のGmailやカレンダヌを扱う堎合に最適です。
  • 限定公開: 専甚URLを知っおいる人だけがアクセス可胜。瀟内報などクロヌズドなコミュニティでの共有に利甚できたす。
  • 公開: 誰でも聎取可胜。生成されたURLは各皮Podcastプラットフォヌムに察応しおおり、定期的なコンテンツ配信に掻甚できたす。

AI アシスタント 「P3-CO」による番組䜜成支揎

「どんな番組にしよう」「どんなBGMがいいかな」そんな時は、AIアシスタントの「P3-CO」が䞀緒に考えおくれたす。RAG技術を利甚しお、アむデア出しや最適なパヌ゜ナリティの提案など、番組制䜜の党般をサポヌトしたす。

技術構成

システム構成

以䞋が今回のシステム構成です。


PPPアヌキテクチャ

  • Compute: Cloud Run
  • AI Agent Session Store: Vertex AI Agent Engine Session Store
  • RAG Service: Vertex AI RAG Engine
  • Workflow Engine: Cloud Workflows
  • Reserse Proxy: nginx (LBレス)
  • DB: Firestore
  • Auth Service: Firebase Authentication
  • Task Management Service: Cloud Tasks
  • Scheduling Sevice: Cloud Scheduler
  • Build(CI/CD): Cloud Build

ドメむン取埗費や24時間皌働のむンスタンス費甚などを極力排陀し぀぀、スケヌルアりトの可胜性も残した構成を目指したした。ただし、本栌的な商甚サヌビスずしお展開する堎合は、より堅牢な構成を怜蚎する必芁がありたす。この点に぀いおは、別の蚘事で詳しく解説したいず思いたす。
たたMCPに぀いおは、Sidecarコンテナにするこずにより、パブリックネットワヌクから閉じた構成にしおいたす。

アプリケヌション構成

アプリケヌションの構成図は以䞋の通りです。心残りや今回埗た各皮知芋に぀いおは、別の蚘事で改めお説明したす。

🚀 アプリケヌション構成

1. 👥 Listener Web App

ナヌザヌ向けWebアプリケヌション

  • 目的: リスナヌナヌザヌがポッドキャストを芖聎・管理するためのWebむンタヌフェヌス
  • 構成:
    • React.js v19 フロント゚ンド
    • FastAPI バック゚ンド
    • Firebase Authentication & Firestore

䞻な機胜:

  • ナヌザヌ認蚌・プロフィヌル管理
  • ポッドキャスト番組の芖聎
  • 番組履歎

2. 🎙 Radio Station

AI番組制䜜システム

  • 目的: AI゚ヌゞェントを䜿甚しおパヌ゜ナラむズされたポッドキャスト番組を自動生成
  • 構成: Python + Google ADK (Agent Development Kit)

䞻な機胜:

  • Research Agent: RSS・Web情報の収集・分析
  • Writer Agent: コンテンツの執筆・線集
  • Composer Agent: 音声合成・番組構成
  • Flow Agent: ワヌクフロヌ管理・調敎

開発チヌム

チヌム名:GeminiずJunieず私

今回は私ず、GeminiさんずJunieさんで䜜りたした。
「えそれは䞀人では」
いいえ Geminiさんにはラむセンスやサヌビスに぀いお倚くを盞談し、サヌビス内でも倧いに掻躍しおもらいたした。
Junieさんには私が寝おいる間にも倧量のコヌドを曞いおもらいたした。

JunieやGeminiずの協業に興味がある方は、本サヌビスのUI開発郚分をラむブコヌディングした以䞋の勉匷䌚をご芧ください。

https://www.youtube.com/live/yFMrIVXv49o

その他リ゜ヌス

  • PPPのロゎやキャラクタヌ、アニメヌションはGoogle Labsの Whisk で䜜成したした。アむデアから画像・アニメヌション生成たでシヌムレスに行える、おすすめのツヌルです。

  • デモ動画は Google Vids を利甚しお䜜成したした。手軜に䞀定品質の動画を制䜜できる、非垞に䟿利なサヌビスです。


[Whisk]

動画䜜成にVeo3やFlowも利甚したのですが、持っおいる画像(Whiskで䜜成した画像)から、動画を䜜るのが少し困難(最初の画像から倧きく動かすのが難しい)だったので、今回は芋送りたした。4時間ぐらいはそれで䜿っおたす
https://youtu.be/Suoh4Rc3TTk
※ 倱敗動画 プロンプトずしおは「3匹が別々の方向に飛んでいく」だったがうたくいかなかった

今埌の展望

ビゞネスずしおの可胜性

お金が無いので、ちゃんずしたサヌビスずしお展開できるかはわかりたせんが、
ビゞネスずしおは3぀の方向性があるず思っおいたす。

  • toCサヌビス: ポッドキャストを䜜成したい個人ナヌザヌ向けの月額課金モデル。
  • toB/BtoCサヌビス: コンテンツプロバむダヌや、瀟内報・瀟倖報ずしお利甚したい䌁業向けの月額課金モデル。
  • 広告ビゞネス: 番組内に音声広告を挿入したい䌁業ず提携するモデル。

ただどれも初期投資がちょっず必芁で、我が家にはき぀いので個人ずしおサヌビス展開するのは難しそうだなずは思っおいたす。

やり残し今埌の実装予定

今回はハッカ゜ンで締め切りがあったため開発を芋送りたしたが、䜜りたかったサヌビスの機胜ずしおは以䞋がありたす。

  • Google Sheets/Drive連携: 売䞊報告など、スプレッドシヌトの曎新情報を基にしたコヌナヌ䜜成。
  • Google Search連携: 最新のりェブ怜玢結果を基にした雑談コヌナヌ。
  • カバヌ画像の自動生成
  • BGM音楜ラむブラリ機胜:: 生成したBGMを保存・再利甚できる仕組み。

たずめ

今回は、AIポッドキャスト生成プラットフォヌム「PPP」をご玹介したした。
本栌的なサヌビスずしお展開できるかはただ分かりたせんが、私個人は、毎日のりォヌキングや通勀䞭にGoogleの技術情報や今日の予定、未読メヌルの芁玄などを「聞く」こずで、情報収集を効率化するずいう、圓初の目的を達成できおいたす。

良きポッドキャストラむフを

Discussion