🔥

【AI Agentハッカソン】読んだフリで終わらせない。プレゼンさせて記憶を固める鬼コーチAI「CEMENT」

に公開

0. 本記事の概要

本記事では、第 2回 AI Agent Hackathon with Google Cloud に向けて開発した、AI学習コーチ「CEMENT」の全貌を紹介します。AIが学習をサポートするだけでなく、学習者自身が知識を本当に自分のものにするための、新しい学習体験を提案します。

項目 説明
対象ユーザー 資格試験や新スキルの習得を目指すも、「本当に身についているか」という不安を抱える主体的な学習者
課題 AI時代において、単なる知識の記憶ではなく、知識を自分の言葉で説明できるレベルまで深く理解(自分ごと化)する必要性が増しているが、独学ではその達成度を測ることが困難。
ソリューション AIエージェントが学習プロセスに一貫して伴走。①教材の自動生成と質問応答でインプットを効率化し、②音声プレゼンテーションによるアウトプットを課すことで、知識の定着を強制的に促す。
特徴 ・学習科学に基づいた体験設計: 「生成効果」などを応用し、アウトプット中心の学習サイクルを実現。
・**マルチエージェントによる対話: 学習の各フェーズで最適なペルソナを持つAIが連携し、自然で豊かな学習体験を提供。
・内省を促すフィードバック: プレゼン後にAIからヒントを得ることで、自身の理解度の穴に自ら気づくことができる。

1. AI エージェント時代の学び

高性能な生成AIが、あらゆる問いに瞬時に答えてくれる現代。私たちは、学習という行為そのものが見直しを迫られている、歴史的な転換点にいると考えました。

情報が民主化されたこの時代において、知識を網羅的に知っていることの価値は、相対的に下がりつつあると思います。事実を知っているだけでは、AIの能力を代替するに過ぎません。無数の情報の中から得た知識を、どう解釈し、自身の経験と結びつけ、血肉に変え、自分の意見として昇GLISHさせることがますます重要視されるように思います。むしろそれを怠るとAI以下という印象すら与えてしまうかもしれません。

私たちは、AIエージェント時代の学びの核心は知識の自分ごと化にあると考えました。それは、単に情報を記憶するのではなく、自分の言葉で他者に語れるレベルまで深く落とし込み、知識を再生産できる状態になることです。

しかし、その自分ごと化の評価は独学では極めて困難でした。例えば私自身、参考書を読み込み、章末のテストで高得点を取ったにも関わらず、心のどこかで、これを自分の言葉で説明できるかと自問すると、自信を持ってイエスと答えられない、という原体験を何度もしてきました。テストの点数という指標だけでは、本質的な理解度は測れない。このジレンマこそが、私たちの開発の出発点でした。

2. ソリューションの仮説:科学的知見の応用

私たちは、知識の自分ごと化を達成するためのソリューションとして、既知の学習科学の知見を応用することから始めました。

  • 生成効果(Generation Effect)[1]: 情報を自分で産出する行為が記憶を強化するという原則。
  • リトリーバルプラクティス(Retrieval Practice)[2]: テストのように情報を想起する訓練が、再読よりも長期的な記憶保持に有効であるという知見。
  • プロダクション効果(Production Effect)[3]: 情報を声に出して発話することで、記憶の定着が促進されるという効果。

これらの確立された理論に基づき、私たちは以下の仮説を立てました。

AIエージェントが学習プロセス全体に伴走し、教材への質問(マイクロなアウトプット)から最終的なプレゼン(マクロなアウトプット)まで、あらゆるアウトプット体験をパーソナライズし、即時フィードバックのループを構築できれば、学習効果を最大化できるのではないか。

では、この壮大な仮説を、限られた開発期間でどう検証すべきか。私たちは、「知識の自分ごと化」が最も試される行為は、**「学んだ内容を、自分の言葉で他者に説明し、理解させること」**であると考えました。

どれだけテストの点数が良くても、他者に説明しようとすると言葉に詰まる、という経験は誰もが持っています。この「説明する」というアウトプット行為こそが、理解度を測る最も確かな試金石です。

この思考プロセスが、ユーザーに特定のテーマについて「プレゼンテーション」を課し、その内容の理解度をAIが評価・フィードバックするという、私たちの”鬼コーチAI”「CEMENT」の着想へと繋がりました。

3. 今回開発したプロダクトの概要

この着想に基づき、私たちは今回のハッカソンで、AIエージェント「CEMENT」のPoC(Proof of Concept)版を開発しました。

CEMENTは、ユーザーに特定のテーマについて学習させ、その理解度を音声プレゼンテーションによって測る、“鬼コーチAI”の第一形態です。プロダクト名のCEMENTは、記憶を強化し、トレーニングするためのコーチングエンジン(Coaching Engine for Memory ENhancement & Training)の頭文字から来ています。

PoC版CEMENTが実際にどのように動作するのか、こちらのデモ動画をご覧ください。

https://www.youtube.com/watch?v=9lJLjp9fe5g

4. プロダクトの詳細とPoCから得られた開発チームの所感

CEMENTの利用体験は極めてシンプルです。ユーザーはまず、学習したいキーワードをAIに伝えます。すると、CEMENTは即座にプレゼン練習用のスライド形式の教材を生成します。

私たちのこだわりは、このインプットのフェーズにあります。何を、どのように学ぶかという学習計画そのものが、独学の最初のハードルだからです。CEMENTは、単に教材を提示するだけでなく、ユーザーが教材に対して自由に質問できる対話の時間を設けています。この「質問する」という行為自体が、自分の理解度を確認し、知識の解像度を上げるための重要なアウトプット体験となります。

ユーザーはその教材で短時間インプットを行った後、マイクに向かって自分の言葉でプレゼンを開始します。AIはプレゼンが終わるまで聞き役に徹し、終了後に即座に内容を評価。理解度を深めるための着眼点や、表現を改善するためのヒントをフィードバックとして返却します。

私たち開発チーム自身がこのPoCを使ってみて、最も強く感じたのは、知識の曖昧な部分が強制的に実感されることでした。

例えば、実装を担当したエンジニアが、自身が今学習している著作権に関する法律についてプレゼンを試みたところ、流暢に説明できる部分と、言葉に詰まる部分が明確に分かれました。いざ口頭で説明しようとすると、その背景や繋がりを自分がどれだけ曖-昧に理解していたかを痛感させられたのです。

この自分で自分の理解度の穴に気づくという内省的な体験は、他の学習方法では得難い、強烈なものでした。

5. マルチエージェントによる対話設計

この一連の学習体験は、Google Cloudのプロダクトと各種ツールによって実現されています。

使用技術スタック

カテゴリ プロダクト/ツール名
フロントエンド Firebase Hosting
バックエンド Cloud Run
AI/LLM Gemini API
AIエージェント開発 Google ADK (Agent Development Kit)

システムアーキテクチャ

本システムの構成は、上記の図に示す通りです。ユーザーが操作するフロントエンドは、静的コンテンツの配信に優れたFirebase Hostingでホストされています。ユーザーからのリクエストは、バックエンドであるCloud Runに送信されます。

Cloud Run上では、コンテナ化されたアプリケーションとしてCEMENTのAIエージェント群が動作しています。サーバーレス実行環境であるCloud Runを採用したことで、インフラ管理の手間を最小限に抑えつつ、リクエストに応じて自動でスケールする効率的なシステムを迅速に構築できました。

中核となるAIの処理、例えば教材の生成やプレゼンの評価などは、Cloud RunからGemini APIを呼び出すことで実行されます。この一連の流れにより、ユーザーはシームレスな対話体験を得ることができます。

エージェントの連携によるユーザー体験の実現

CEMENTの対話は、ユーザー体験の各ステップに合わせて、最適なペルソナを持つエージェントがバトンを繋いでいくリレー形式で進行します。

1.  受付とヒアリング(topic_hearing_agent)
    最初にユーザーと対話するのは、受付係であるtopic_hearing_agentです。感じの良い挨拶でユーザーを迎え、何を学習したいかをヒアリングします。ユーザーからキーワードや画像を受け取ると、次のtopic_generator_agentに処理を依頼します。

2.  学習トピックの具体化(topic_generator_agent)
    このエージェントは、ユーザーの要望から具体的な学習トピックを生成するプランナーです。内部ではさらにtopic_keyword_agenttopic_sentence_agentという2体のエージェントが順次動作し、キーワード抽出、サブトピックへの分解、そして学習内容の要約文生成までを自動で行います。生成された3つのトピック案は、再びtopic_hearing_agentを通じてユーザーに提示され、合意形成を行います。

3.  教材生成と自習サポート(material_gen_and_teacher_agent, teacher_agent)
    ユーザーがトピックに合意すると、教材作成の専門家であるmaterial_generator_agentが、指定されたフォーマットで詳細なスライド形式の教材を生成します。その後、対話の主導権は、親身な先生ペルソナを持つteacher_agentに渡されます。ユーザーは学習中、このteacher_agentに自由に質問をして、理解を深めることができます。

4.  プレゼン試験への誘導(exam_listener_agent)
    ユーザーの学習が完了したことをteacher_agentが確認すると、試験監督であるexam_listener_agentを呼び出します。このエージェントは、アウトプットの重要性を説明し、ユーザーにプレゼンを促します。そして、プレゼンが始まると一切口を挟まず、聞き役に徹します。

5.  評価とフィードバック(exam_evaluator_agent)
    プレゼンが終了すると、最後の評価者であるexam_evaluator_agentにバトンが渡されます。このエージェントは、文字起こしされたプレゼン内容に基づき、改善のための具体的なヒントや、注目すべきポイントをフィードバックとして生成します。

このように、各局面で最適なペルソナを持つエージェントが入れ替わりながら対話を担当することで、一貫性がありながらも豊かなユーザー体験を生み出しています。

6. 終わりに:描く未来と、その第一歩

セクション1で述べたように、私たちはAIエージェント時代の学びの核心が「知識の自分ごと化」にあると考えました。では、それを実現する理想の学習パートナーは、具体的に何を備えるべきでしょうか。私たちは、以下の3つの要素が不可欠だと考えています。

1.  対話による思考の深掘り: 一方的なアウトプットだけでなく、AIが内容の矛盾を指摘したり、より深い問いを投げかけたりする対話性。
2.  学習負荷の最適化: ユーザーの習熟度に応じて、教材の難易度やフィードバックの厳しさが動的に変化する適応性。
3.  成長の可視化: 学習の成果や自身の成長を客観的に振り返り、モチベーションを維持するための仕組み。

今回のPoC版CEMENTは、この壮大なビジョンに向けた最初の、しかし最も重要な一歩です。私たちはまず、この体験の根幹である「強制アウトプット」が、学習者の内省を促す上で有効であるかを検証しました。その結果、主観的な評価ではありますが、知識の定着に繋がる確かな手応えを得ることができました。

CEMENTのPoCの成功は、ゴールではありません。理想の学習パートナーを実現するための、課題が明確になったスタートラインです。

私たちの次のステップは、この強力なコア体験を土台として、上記の3要素を実装していくことです。具体的には、ユーザーの理解度に応じてAIが動的に質問を変えるアダプティブ・ラーニング機能や、学習効果を可視化するダッシュボード機能を開発し、一方通行ではない、真に対話的な学習パートナーへとCEMENTを進化させていきます。

7. 参考文献

脚注
  1. The Generation Effect: Activating Broad Neural Circuits During Memory Encoding - PMC. https://pmc.ncbi.nlm.nih.gov/articles/PMC3556209/ ↩︎

  2. Retrieval Practice and Why It Works | Edmentum. https://www.edmentum.com/articles/retrieval-practice ↩︎

  3. Reading Out Loud Improves Memory – NeuroBehavioral Associates. https://nbatests.com/reading-out-loud-improves-memory/ ↩︎

Discussion