ボイスジャーナリングでデバックとチューニング Notebook LM

に公開

ジャーナリングをやってみたいが紙とぺんが見当たらない、文字にすると文章として考えてしまい手が動かない・・・ペーパーレスの時代に・・・大体、字が汚くて読めない・・・時間も無い・・・

やらない理由を見つけるのが得意な言い訳の天才P3です!

ただのブログネタが、予想外の結果へ

今回はスマホのボイスメモとNotebookLMを利用したボイスジャーナリングです
始めたきっかけは「当ブログのネタ」探しとしてAIと組み合わせて検証したら面白そうでは?と思ったのが始まりでした、自己分析くらいと思っていたのが意外な結果に繋がっていくので読んでいただけると幸いです。

出来るだけ摩擦をゼロにしたい

継続して検証するにあたって出来るだけ「いつでも」「楽」「簡単」を考えてみました
スマホ(録音できるなら何でも)
Gemini(使い慣れたもので良いかと)
Notebook LM(データの格納と分析用、無料有料どちらでも)
Google AI studio(個人的に使いやすいのもで良いと思います)

       *ちなみにiPhone → MacであればiCloud転送の場合はさらに摩擦の軽減されます*

文字起こしの必要があるのか?というツッコミが入ると思うのですが

NotebookLMに格納できるソース数に限りがある!
1日1件毎日行った場合365件になります、無料版50件、最高クラスで600件
文字起こしをしてドキュメントに保存して1ヶ月1ファイルにすれば無料版でも4年はいけます!

Google One プラン NotebookLM ソース上限数 / 1ノート
無料版 50 ソース
Plus 100 ソース
Pro 300 ソース
Ultra 600 ソース

出典 Google one  NotebookLM 公式 2026年5月時点

毎日処理しない。文字起こしは「週次バッチ」で回す

継続のためのもう一つの工夫が、処理のタイミングです。
「録音 → 文字起こし」のフローを毎日行うのは、運用コスト(摩擦)が高く長続きしません。そこで、平日はスマホに音声ログを溜めるだけにとどめ、週末にGoogle AI Studioを使って1週間分を一括で文字起こしする「週次バッチ処理」を採用しています。

AIの出力を安定させる「防御的プロンプト」

Google AI Studioに1週間分の音声ファイルを複数投げ込み、文字起こしを実行させますが、ここで重要なのがプロンプトの設計です。

プロンプトなしでも大体の文字起こしはしてくれますが、生成AI特有の「出力の揺らぎ(エラー)」を防ぎ、確実性を担保するために、私は以下のプロンプトを固定で使用しています。

     日本語で内容を省略・要約はせずに文字起こしをして、時系列順に出力してください。

一見シンプルな一文ですが、これにはAIの挙動を制御するための3つの明確な意図(エラーハンドリング)が込められています。

日本語で(言語ハルシネーションの防止)
AIが勝手に気を利かせたり、音声のノイズを誤認して英語で出力してしまうエラーを未然に防ぎます。

省略・要約はせずに(Rawデータの欠損防止)

文字起こしの段階でAIに要約されてしまうと、深い分析に必要な「感情の揺れ」や「思考の飛躍」といった生データが失われてしまいます。要約や構造化は後段のNotebookLMで行うため、ここでは「一切加工しないこと」を強制しています。

時系列順に出力(ソートバグの回避)

1週間分の音声ファイルをまとめてアップロードすると、AIが処理を並列化する影響か、出力される日時の順序がぐちゃぐちゃになることがあります。時系列の正確性はログ分析において命なので、明示的にソート(並び替え)を指示しています。

確実なパイプラインのための「関心の分離」

このように、文字起こしフェーズでは「AIの推論能力をあえて制限し、忠実なテキスト変換装置としてのみ機能させる」ことで、後続のドキュメント化・NotebookLM格納というデータパイプラインの確実性を担保しています。

AI時代のデータ保護ポリシー

次に決めたいことはルール
AIを使用することで忘れてはいけないのが「学習に利用することがある」←してるよね?(確定で)
つまり・・・
話している内容で必ず守るものとして
・個人名は出さない。(自身の名前含む)
・お店や会社名も伏せる
・自分の気分、体調、作品の感想(映画や漫画など)

1人で話すことが「脳のキャッシュクリア」を引き起こすメカニズム

実際にメリットを語っていく上で、最近まで「なぜ効くのか」を理解しておらず、完全に 直感(野生の勘) だけで運用していました。

効果は体感しているものの、いざ「何で良いの?」と聞かれたときに「……なんか、宇宙と繋がるというか、とにかく最高なんだよね!POWER!」みたいなヤバい回答しかできないことに気づいたのです。

もし、この 「ソース探し」と「言語化」をサボってこの記事を公開していたら、間違いなく 『お気持ち強めな自己啓発ポエム』 としてZennの海に沈み、最悪の場合、職場で「アイツに壺とか買わされないかな…」と心配される人間になっていた自信があります。

ギリギリのところで踏みとどまり、なんとか皆様に納得いただけるロジックを見つけてきましたので解説します。

脳のメモリを圧迫する「バックグラウンド処理」

脳は、未解決のタスクやモヤモヤした感情を抱えていると、無意識のうちにそれをバックグラウンドで処理し続けようとします(心理学ではツァイガルニク効果と呼ばれます)。これが脳のワーキングメモリ(RAM)を圧迫し、「なんとなく疲れる」「集中できない」というパフォーマンス低下(メモリリーク)を引き起こします。
よくある、「続きはWEBで」「CMの後で」など中途半端に終わったのが気になってしまうのは、そういった心理効果があったのか・・・とYoutubeとかでも序盤にハイライトとして途中が気になるようなカットを入れてるのも、そういうことかと関心

なぜ「書く」のではなく「話す」のか?

「文字を書く」「テキストにタイピングする」という手法は、実は脳に負荷をかけます。なぜなら、文章を書こうとすると無意識に「てにをはを直そう」「論理的に構成しよう」という「編集プロセス」が同時に走ってしまい思考と編集のマルチタスクになり、脳のCPUを余計に消費します。

一方、「録音」という行為は、頭に浮かんだことをそのままストリーミング出力する作業なので入力遅延がほぼゼロであり、構造化や文章化は後でAIに丸投げ(関心の分離)できるため、脳に負荷をかけず最速でデータを出力できます。

メンタルのラバーダック・デバッグ

これはソース探しをしていて知ったのですが、アヒルのおもちゃにコードを説明するうちにバグに気づく「ラバーダック・デバッグ」というものがあるようですね、非エンジニアの自分からしたら「はっ?」となったんですが、似てるなと思える経験としては去年まで研修講師をしていて講義を重ねていくと資料や指導に違和感に気づいて修正をちょこちょこしていたなと・・・
スマホに向かって今の状況や感情を説明しているうちに、「あれ、浅いことで悩んでいたな」「本当の問題はここじゃないな」と、自分自身の認知のバグに自動的に気づくことができます、その時というよりは次の日とかにです。

こうして、考えていることや半端になっていることを 「話す」 ことで1つ1つタスクキルしていると言えば良いでしょうか?完全に終わらせられるわけではないですが、終わらせようという意識はなくなるので気にならなくなりました。

脳のキャッシュを常時クリアにし、システムを安定稼働させるこのボイスジャーナリング最大の利点は

1. 正常な判断プロセスの維持

考えることに対して余裕があるため、突発的なエラーやトラブルが起きてもパニックやフリーズしづらい。俯瞰的な視点で捉えることができるためバグった判断を避けられ、客観的で正常なトラブルシューティングが可能になります。
体感としては何かが起こっても心拍数が上がりづらくなるので冷静にいられるという感じです。

2. 意志力(ウィルパワー)の温存と「第2象限」へのリソース投資

常にバックグラウンド処理を綺麗にしておくことで、脳の「意思バッテリー」の無駄な消費を防ぎます。リソースに余力を持たせておくことで、日々の業務に忙殺されることなく、技術の学習やクリエイティブな趣味など「緊急ではないが重要なタスク(第2象限)」に体力を割り振れます。

3. ストレスに対する圧倒的な耐性

リソースに余裕があるため、理不尽なトラブルや人間関係のストレスといった高負荷がかかっても、システムがクラッシュしません 。
それどころか、余裕のある脳は、そうしたストレスすらも肯定的に処理するために頭が働きより高いパフォーマンスを引き出せている感じがあります。

蓄積したログをAIで解析する(プロンプトの「辛さ」調整)

さて、ここまでは仕組みやメカニズム的な話でしたがAIがある時代なので解析する楽しさがありますよね。(ストレス発散の目的であれば上記のみで問題はないです。)
ようやく、NotebookLMの出番ということになります。Geminiのチャット欄右側の「+」からNotebookLMのブックを知識として回答させることに自分自身を丸裸にしていきます。
実際に使用しているプロンプトですが

甘口

以下のジャーナリングログを読み込んでください。
まずは今日の私の頑張りや感情を徹底的に肯定し、共感してください。
その上で、明日少しだけ心が軽くなるような、
負担の少ない小さなアクションを1つだけ提案してください。 

始めたばかりのときや余力あまりないときや、イエスマンで良いですっていう人向け

中辛

以下のログを客観的・論理的に分析してください。
私が現在抱えている「ノイズ(無駄なストレス)」と「集中すべき課題」を分類し、
明日取り組むべきアクションプランを優先順位順に3つ箇条書きで出力してください。
感情論は排除し、淡々と事実ベースでまとめてください。

客観視とアクションプランが欲しい方向け

辛口

以下のログを読み込み、私の思考の「バグ(認知の歪み、思い込み、言い訳)」を
容赦なく指摘してください。
私が無意識に避けている根本的な問題は何か
忖度や慰めは一切不要で、最も耳が痛い客観的な事実を突きつけてください。

これは余裕があるときに!軽い気持ちで行うとかなり持っていかれるので 心身共に元気なときに 状態によってはオーバーキルもありえます。
ただ、慣れてくると辛口の方が丁度よかったりします。ある程度自分のことがわかっていると再認識ができる(苦手なものや無意識に避けていることなど)ので、甘口、中辛で全肯定してもらうのも大事ですが、「あっ、ヤッベ今 壺売りそうになってた」「最近の発言がポエムっぽい」「お気持ちが強くなてる」そんな時は辛口で是正してもらいましょう。

おわりに

「ブログのネタ探し」という不純な動機と、「文字を打つのがめんどくさい」という怠惰から始まったAIボイスジャーナリング。

しかし蓋を開けてみれば、脳のキャッシュクリアと、「NotebookLMを使ったログの客観的解析」という、最強の自己メンテナンスシステムが完成していました。

もしあなたが今、未解決のタスクや理不尽なエラー対応で「脳のメモリが圧迫されている」と感じているなら。騙されたと思って、帰り道にスマホに向かってブツブツと今日のモヤモヤを話してみてください。

採用情報

メディロムグループでは以下のようなサービスを展開しています。

全国300店舗以上のリラクゼーションスタジオ「Re.Ra.Ku」
世界初!充電不要の活動量計「MOTHER bracelet」
ヘルスケアコーチングアプリ「Lav」

ヘルスケア領域に興味があるエンジニア、PM、情シスを絶賛募集中です!
少しでも興味を持っていただけた方は、ぜひ以下のリンクからエントリーしてみてください。
一緒に新しいヘルスケアサービスをつくっていきましょう🌟
https://medirom.co.jp/recruit

メディロムグループ Tech Blog

Discussion