Personalized AI 元年に向けた日記AIエージェントによる合成訓練データ生成への取り組み 〜DiaryGraph〜
こんにちは、MLエンジニアのふるです。
最近AIエージェントが着目されつつあるため、その具体的な事例についてまとめていこうと思います。
1. はじめに:Personalized AI元年と日記の重要性
近年、個人の嗜好やニーズに最適化された 「Personalized AI」 への注目が高まっています。2025年は「AIエージェント元年」と呼ばれる可能性があり、AIエージェントが個人向けに強力な支援を提供する時代が加速的に到来すると期待されています。
汎用的な大規模言語モデル(LLM)は目覚ましい発展を遂げていますが、ユーザー個々の情報を深く理解し、それに基づいて最適な支援を行う事例はまだ多くありません。そこで本記事では、日記という個人的な情報を通じてユーザーの心情や感情に寄り添い、AIエージェントを活用する事例としてDiaryGraphを紹介します。
日記は自己理解や内省に役立つ強力なツールですが、「続けるのが大変」「何を書けば良いのかわからない」という課題も存在します。本記事では、日記を新たな価値あるツールへと進化させるAIの取り組みについて解説します。
2. なぜ日記AIエージェントなのか?
2.1 日記を書くことの課題
- 継続性の難しさ: 多忙な日常の中で、日記を毎日書き続けるのは難しい。
- 内容に迷う: 「今日は何を書けば良いんだろう?」という疑問から筆が進まない。
- 振り返りの困難: 書いた日記を後で分析・活用するには手間とノウハウが必要。
2.2 AIの可能性
これらの課題を解決する大きな可能性を持つのがAIエージェントです。
- 文章自動生成: ユーザーが簡単なキーワードや写真を入力すると、それを元に日記本文を提案。
- 重要ポイント抽出: 書かれた内容を要約・ハイライトし、振り返りを手助け。
- 質問による深堀り: ユーザーの思考・感情を引き出す質問を自動生成し、さらなる内省へ導く。
また、振り返りを支援する 「担当エージェント」自体がユーザーとのやりとりを通じて学習を深めていく ことこそが、Personalized AI の真髄です。そのための訓練データを自動的に構築することが今回の取り組みで最も重要なテーマとなっています。
DiaryGraph:日記AIエージェントアプリの紹介
3.DiaryGraphは、日記を書く上でのハードルを下げつつ、合成データを蓄積してLLMを賢くしていくための仕組みを備えたAIエージェントサービスです。ユーザーが入力するテキストや写真などの情報をもとに、AIが日記の内容を自動生成・編集し、さらに質問を投げかけユーザーの思考を深めるサポートを行います。
ポイント:
-
適切なLLM向けの合成訓練データを生成できる:
日記の内容とAIエージェントの質問・回答を組み合わせることで、さまざまなバリエーションの対話データが得られます。これを活用すれば、LLMをさらにパーソナライズできます。
3.2 DiaryGraphの主な機能
- 日記の自動生成: テキストや写真をもとにAIが文章を生成し、ユーザーが書く内容をサポート。
- 質問機能: 日記の内容に合わせて、感情を深堀りしたり、思考を整理するような質問を提示。
- 写真添付: 写真を併用することで、視覚的な情報も含めた思い出の整理が可能に。
- 日記の公開(共有): ユーザーが希望すれば、他者と共有しコミュニケーションを生み出せる。
- 日記の一覧表示: 過去の日記を簡単に振り返り、自己変化や成長を確認できる。
4. DiaryGraphが実現するパーソナライズドな体験
4.1 個人の思考や感情を深掘りする質問
日記の内容に応じてAIが以下のような質問を提示します。
- 「今日の出来事から何を学んだか?」
- 「そのとき、どんな感情だったか?」
これらの問いかけにユーザーが答えることで、自分の考えや感情を整理し、より深いレベルで自己を理解できるようになります。
4.2 写真とテキストで記憶を鮮明に
テキストだけでなく写真を添付することで、文章では表現しきれない状況や感情をより鮮明に思い出せます。特に、旅行やイベントなどを記録する際には強力な手段となります。
5. 合成データ生成における具体的アプローチ
5.1 エージェントフローと役割分担
DiaryGraphでは、日記の自動生成やサマリー作成、さらに質問生成などを複数のエージェントによる協調フローで実現しています。以下は、その一例です。
# DiaryGraph全体のエージェント構成とフローの一例
nodes:
writer:
# ユーザーのデータをもとに日記を「執筆」する担当
prompt: |
あなたはユーザー {user_profile} の日記を執筆する担当メンバーだよ。
...
model: gemini-2.0-flash-exp
alter_model: gemini-1.5-pro-002
agent_type: member
summary_writer:
# 執筆された日記や会話内容を「最終的にまとめる」担当
prompt: |
あなたはユーザ {user_profile} の日記をまとめる担当者だよ。
...
model: gemini-1.5-pro-002
agent_type: end_member
additional_question_generator:
# 日記をより深掘りするための「追加質問」を生成する担当
prompt: |
あなたはユーザ {user_profile} の日記生成をサポートする質問を行う役割だよ。
...
model: gemini-1.5-pro-002
agent_type: end_member
edges:
- from: START
to: writer
- from: writer
to: summary_writer
- from: summary_writer
to: additional_question_generator
- from: additional_question_generator
to: END
主なエージェントの役割:
-
writer:
- ユーザーが入力したテキストや写真を参考に、日記文を生成する。
- 「ユーザーの気持ちになって執筆する」など、感情面を意識したプロンプト設計。
-
summary_writer:
- writerが作成した日記を読み込み、タイトル・要約・本文などの最終アウトプットを整形。
- SNS投稿用の短い要約や、長めの本編など複数バリエーションを生成する。
-
additional_question_generator:
- 生成された日記を振り返り、不足や曖昧な点をユーザーに再確認するための追加質問を作成。
- ユーザーのモチベーションを下げないよう短く多様な質問を提示し、さらなる深い内省を促す。
上記のように、複数のエージェントが段階的に連携することで、ユーザーが自然な流れで日記を完成させ、なおかつ深い振り返りを行える仕組みになっています。
5.2 合成データの蓄積イメージ
この一連のフローによって得られるデータは、大きく分けて2種類あります。
-
日記本体のデータ:
- タイトル・本文・画像URLなど。
- ユーザーの感情や体験が具体的に書かれた文章。
-
Q&A(対話)ログデータ:
- 「追加質問」とその「ユーザーの回答」を含む。
- ユーザーの心理状態や思考のプロセスが、質問と回答の形で残される。
このように、日記の本文とQ&Aをセットで蓄積することで、ユーザーの思考や感情に紐づいた豊かな合成データが生成されます。
5.3 合成データ活用のポイント
-
パーソナライズの強化:
- 合成されたデータ(ユーザー独自の日記+Q&A)をもとにモデルを再学習することで、一人ひとりに最適化されたAIエージェントが作りやすくなる。
-
プライバシー配慮:
- 日記はプライベートな情報の宝庫であるため、匿名化や個人情報の削除など適切な処理が必須。
- 合成データとして扱う際も、実名や特定される要素の取り扱いには十分注意する。
-
汎用性の高い学習データ:
- 多様な話題や感情表現が含まれる日記データは、汎用的な自然言語処理モデルの強化素材としても活用が見込まれる。
- さらにユーザーへの追加質問など、インタラクティブな要素を含む対話ログは今後のLLM研究にとっても貴重なリソースとなる。
6. まとめ
Personalized AIの取り組みとして、日常の振り返りをサポートするだけでなく、ユーザーとの対話データを合成して学習データに取り込むという、日記AIエージェント「DiaryGraph」の事例を紹介しました。
- 複数のエージェントによる役割分担で自然なアウトプットが得られる
- Q&Aログを活用した合成データが、さらに高度なLLM学習の素材となる
今後も、AIエージェントがユーザーの思考・感情を深く理解し、ユーザーの人生に寄り添う形で使用する事例が増えていくことが期待されます。2025年以降、「Personalized AI元年」としてこのような技術が普及する未来に期待していこうと思います。
Discussion