💬

NotebookLMでLispポッドキャスト生成

に公開

NotebookLMでLispポッドキャスト生成

半年位前からNotebookLMで論文をポッドキャストにして聴くのが面白いという話があったけれど、先日、日本語で音声概要を生成できるようになったので、Lispの技術文献をポッドキャストにするというのを試すことにした。

色々生成するうちに保存や管理が面倒になってきたのでYouTubeのチャンネルにまとめてみることにしてみた。

といっても数が増えてくると、ちゃんと整理するのも大変そう。

「Lisp周辺技術の論文紹介」の生成方法

現在のところ極力手間が掛からない範囲でそれなりにポッドキャストっぽいものができないか試行錯誤している。

手順としては、

  1. 論文をNotebookLMに読み込み。
  2. 「Lisp周辺技術の論文紹介」の台本として下記を「音声概要」の「カスタマイズ」に記述する。いうことを聞いてくれたりくれなかったりするけれど、開幕フレーズ等の指定などは大体従ってくれるらしい。
  3. wav形式のポッドキャストが生成されるのでダウンロードする。
  4. ffmpegでYouTubeにアップできる動画にする。

くらい。

試していてわかったことは、

  • 音声概要のカスタマイズをしないとデフォルトではディープダイブという番組名にするらしい。
  • デフォルトの台本としては、資料の概要をまとめて紹介した後に、最後に視聴者に問いを投げ掛けて締める様子。
  • 締め方も台本に指定すれば、指定内容でまとめてくれたりくれなかったりする。
  • カスタマイズで指定できる内容には文字数制限があるので、台本をソースとして作成し、カスタマイズの内容として、「台本はソースの台本に従ってください」としても上手く行くこともあるし、いかないこともある。
  • 漢字の読みがおかしいので、それを回避するように指定することもできたりできなかったりする。「今日の」を「きょうの」と読むことが多く、台頭を「だいとう」と読むことが多い。指定すると、「きょうの、こんにちの我々にとって」等、並べて読まれることが多い。
  • 台本を細かめに指定すると、何故か音声のピッチや声色が話題に応じて乱高下する。
  • 会話の文字数を指定するとポッドキャストの時間を大体指定できる。長くすることは難しいらしい。

あたり。確実に長文の台本が指定できる方法があると嬉しい。
資料からポッドキャストの台本を生成させることもできるので、標準の音声概要で試行錯誤するより、台本を生成させて読み上げアプリで読み上げさせた方が楽なのかもしれない。台本を指定するだけで生成できるゆっくり動画生成ツールみたいなものがあるなら試してみたい。

まとめ

皆がLisp論文ポッドキャストを作るようになったら自作しなくてもよくなるので嬉しい。


「カスタマイズ」内容

「今日の」は「こんにちの」と発音してください。

冒頭は、下記のように開始してください。

男: 皆さん、こんにちは
女: こんにちは
男: Lisp周辺技術の論文紹介、今回は、2020年の「Hygienic macro technology」(William D. Clinger, Mitchell Wand著)です。お届けするのは、
男: あぶらいナルオ、と
女: 山田カクコです。
男: では、早速内容を眺めていきましょう。

単語の読みは、
「Scheme」は「スキーム」と呼称します。
「cdr」は「クダー」と呼称します。
「clos」は「シーロス」と呼称します。
「mop」は「モップ」と呼称します。
「cons」は「コンス」と呼称します。
「clojure」は「クロウジャア」と呼称します。
「progn」は「プログエヌ」と呼称します。
「setq」は「セットキュー」と呼称します。
「flet」は「エフレット」と呼称します。
「aref」は「エーレフ」と呼称します。
「seq」は「シーク」と呼称します。
「subseq」は「サブシーク」と呼称します。
「capi」は「カピ」と呼称します。

wavをYouTubeの動画へ変換

ffmpeg  -loop 1  -r 30000/1001  -i サムネ画像 -i 音声.wav  -vcodec libx264  -acodec aac -strict experimental -ab 320k -ac 2 -ar 48000  -pix_fmt yuv420p  -shortest 動画.mp4

Discussion