🤖
【Zenn初投稿】Google Cloud×Kaggle主催Capstoneに提出した「RAG × 自分専用Agent」Notebookの話
こんにちは。ぬっこす(@nuccoss)です。
この投稿は、Zennへの初投稿となります。
今回は、Google主催の「Gen AI Intensive Course Capstone 2025Q1」へ提出した自作Notebookについてまとめます。
Kaggle初挑戦の方や、RAG構成に興味のあるエンジニアの方にも参考になれば嬉しいです。
背景|なぜこのCapstoneに挑戦したのか
2025年3月末、Google主催の「GenAI 5日間集中講座」が公開され、生成AI技術の本格的な展開が進む中、私は個人開発者としての限界と可能性を感じていました。
「講座の理解度を証明する場」として、Capstoneコンペティションが用意されており、私は以下のようなチャレンジを設定しました:
- Kaggle Notebookによる提出形式に初挑戦
- RAG(Retrieval-Augmented Generation)を個人AIフレームワークに統合
- 実行環境に制限がある中で、構造と再現性を担保した提出を目指す
構成|Notebookで取り組んだこと
以下のような構造でNotebookを設計しました(実行コードはローカル/Colab専用で明示し、Markdown中心の構成です)。
1. Problem & Use Case
- 複数の構造化DBから知識抽出できる「Personal AI Framework」の検証
2. GenAI Capabilities Used
- Structured output(JSON構造)
- Few-shot prompting(最小例示による誘導)
- Embeddings(Vertex AIでのベクトル生成)
- FAISSによる近傍検索
- Retrieval-Augmented Generation(RAG構成)
- 自作関数によるGenAI Evaluation(出力評価)
3. Notebook構成(各セクション)
- 環境設定(API / Secrets)
- Embedding生成(Vertex AI)
- 類似チャンク検索(FAISS)
- プロンプト構築&Gemini API応答生成(RAG構造)
- 出力セキュリティ制御(構造化フィルタ)
- スキーマ評価関数の説明(
evaluate_gemini_output
)
解決策|実行不可な環境にどう対応したか?
Kaggle環境では、FAISSやGemini APIを使った実行が制限されています。
この制約を回避するため、以下のような戦略を採用しました:
- 実行コードはすべてMarkdown上に疑似実装として提示
- セキュリティフィルタや出力評価関数も論理的に解説
- 最終的に「Simulated Result(出力例)」を明示することで、動作のイメージを補完
このようにして、再現性の説明可能性と構造の妥当性を両立する構成を意識しました。
成果|どんな提出物になったのか
-
.ipynb
形式のNotebook(FAISS+GeminiによるRAG構造を分解) -
.pdf
形式で出力構成とセキュリティ制御を説明 -
.zip
形式でまとめてKaggleに提出(ただし評価システム未設定で最終Submitは不可)
Notebookは以下のセクションで構成され、審査向けに最適化された形で提出済みです。
振り返りと今後
- 制約のある中でも「構造で示す」という戦略は機能した
- Capstoneでの成果物は今後のAIポートフォリオや就職活動にも展開可能
- 次はColabかVertex環境での完全自走型RAGエージェント構築に挑戦したいと思います
最後に
Zenn初投稿ということもあり、読みづらい点などあればぜひご指摘ください。
もしこの記事が少しでも参考になったら、フォロー&「いいね」してもらえるととても励みになります。
今後も、生成AI・エージェント設計・自己最適化のテーマを中心に発信していきます。
ありがとうございました。
Kaggle公開リンク
CapstoneP. RAG MVP Agent for Personal AI Framework
Discussion